SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜
    • 网址提交

    视觉推理

    共 1 篇文章
    排序
    发布更新浏览点赞
    纯视觉推理新范式Visual Planning:通过纯视觉表征进行规划,无需依赖文本

    纯视觉推理新范式Visual Planning:通过纯视觉表征进行规划,无需依赖文本

    剑桥大学语言技术实验室、伦敦大学学院和谷歌的研究人员一种名为“Visual Planning(视觉规划)”的新范式,通过纯视觉表征进行规划,无需依赖文本。该范式受到认知科学中双重编码理论的启发,主张人...
    新技术# Visual Planning# 视觉推理
    8个月前
    02310
    没有了
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    人生 K 线

    人生 K 线

    人生 K 线(Life Destiny K-Line)是一个结合传统八字命理与现代大语言模型(LLM)的轻量级可视化工具。它将一个人从 1 岁到 100 岁的运势走势,以类似股票 K 线图的形式呈现,试图用数据可视化的方式“翻译”命理推演结果。
    YouMind

    YouMind

    YouMind 是一款重新构想的 AI 写作工具,帮助每个人轻松开启创作之旅。捕捉灵感、收集素材、撰写草稿,并将其转化为精炼的文章、播客、视频等丰富内容。
    Fast Note Sync For Obsidian

    Fast Note Sync For Obsidian

    Fast Note Sync 是一套专注于 Obsidian 用户的私有化笔记同步与备份解决方案,由客户端插件(Fast Note Sync for Obsidian)和服务端(Fast Note Sync Service)组成。它不依赖第三方云服务,支持 Mac、Windows、Android、iOS 全平台,提供实时同步、附件支持、配置同步与版本历史,且全部数据由用户自主掌控。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    豆包

    豆包

    豆包是字节跳动开发的一款 AI 聊天工具,通过自然语言交互帮助用户解决问题、提供灵感和辅助创作。它支持文本生成、图像生成、英语学习和写作助手等多种功能。豆包基于字节跳动自研的大模型(如 Doubao-1.5-pro),支持深度思考和多模态能力,成本低且性能与国际领先模型相当。用户可登录官网或移动端,选择不同 AI 角色进行对话,如写作或编程辅助。
    查看完整榜单