SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航

    3D场景

    共 6 篇文章
    排序
    发布更新浏览点赞
    3DTown框架:从单张俯视图像生成逼真且连贯的三维(3D)场景

    3DTown框架:从单张俯视图像生成逼真且连贯的三维(3D)场景

    加州大学圣克鲁兹分校、哥伦比亚大学和Cybever AI的研究人员推出 3DTown框架,从单张俯视图像生成逼真且连贯的三维(3D)场景。传统的详细3D场景获取方法通常需要昂贵的设备、多视角数据或人工...
    新技术# 3DTown# 3D场景
    2个月前
    0690
    PhysGen3D:从一张图片创造真实物理世界的交互式3D场景

    PhysGen3D:从一张图片创造真实物理世界的交互式3D场景

    清华大学、伊利诺伊大学厄巴纳香槟分校和哥伦比亚大学的研究人员携手推出了一项创新成果—PhysGen3D,将单一图像转化为非模态、以相机为中心的交互式 3D 场景。 项目主页:https://by-lu...
    新技术# 3D场景# PhysGen3D
    3个月前
    01500
    基于图像扩散先验的深度修复模型DepthLab:从单张图像中生成完整的3D场景

    基于图像扩散先验的深度修复模型DepthLab:从单张图像中生成完整的3D场景

    香港大学、香港科技大学、蚂蚁集团、阿尔托大学和通义实验室的研究人员推出DepthLab ,它是一个基于图像扩散先验的深度修复模型,用于从单张图像中生成完整的3D场景。DepthLab旨在解决深度数据中...
    新技术# 3D场景# DepthLab# 深度修复模型
    7个月前
    02190
    从单张图片生成3D场景的新型框架MIDI

    从单张图片生成3D场景的新型框架MIDI

    北京航空航天大学、VAST、清华大学和香港大学的研究人员推出新型框架MIDI(Multi-Instance Diffusion),它用于从单张图片生成3D场景。这项技术的核心在于将预训练的图像到3D对...
    新技术# 3D场景# MIDI
    7个月前
    02120
    实时交互式3D场景生成的创新框架WonderWorld:能够以低延迟的方式指定场景内容和布局,并实时查看创建的场景

    实时交互式3D场景生成的创新框架WonderWorld:能够以低延迟的方式指定场景内容和布局,并实时查看创建的场景

    MIT和斯坦福的研究人员联合推出了WonderWorld,这是一个用于交互式3D场景生成的创新框架。它使用户能够以低延迟的方式指定场景内容和布局,并实时查看创建的场景。WonderWorld的主要目标...
    新技术# 3D场景# WonderWorld
    7个月前
    01800
    新型视图合成技术InstantSplat:在极短的时间内(大约40秒)从稀疏的、没有相机姿态信息的图像中重建和渲染出新视角的3D场景

    新型视图合成技术InstantSplat:在极短的时间内(大约40秒)从稀疏的、没有相机姿态信息的图像中重建和渲染出新视角的3D场景

    来自德克萨斯大学奥斯汀分校、英伟达、厦门大学、佐治亚理工学院、斯坦福大学和南加州大学推出新型视图合成技术InstantSplat,它能够在极短的时间内(大约40秒)从稀疏的、没有相机姿态信息的图像中重...
    新技术# 3D场景# InstantSplat
    1年前
    07790
    没有了
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Open ASR 排行榜

    Open ASR 排行榜

    Open ASR 排行榜 对 Hugging Face Hub 上的语音识别模型进行排名和评估。我们报告平均 WER(字错误率)(⬇️ 越低越好)和 RTFx(实时因子)(⬆️ 越高越好),模型根据其平均 WER 从低到高进行排名。
    VideoTutor

    VideoTutor

    VideoTutor 是一款 AI 驱动的教育工具,专注于生成学习视频,它提供定制的 AI 解释视频和 24/7 AI 教师支持,覆盖数学、科学和语言等主题。它适合 K-12 学生自主学习,但具体效果可能因用户而异。
    TTSMaker

    TTSMaker

    TTSMaker是一款在线文本转语音工具,也称为AI语音生成器,它可以将文本转换为音频,并且可以播放或下载音频文件。
    BabelDOC

    BabelDOC

    BabelDOC 是新一代智能 PDF 翻译工具,采用先进的排版保持技术,为您提供专业级的双语对照翻译体验。无论是前沿学术论文,还是商业分析报告,BabelDOC 都能帮您轻松跨越语言藩篱,同时完美呈现原文档的精致排版。
    Poe

    Poe

    Poe 不仅仅是一个聊天应用,它是一个集成了多模型互动、自定义应用创建和多样化工具的综合性平台。无论是希望通过多种 AI 模型解决问题的用户,还是希望探索 AI 创造力的开发者,Poe 都提供了丰富的可能性。
    Higgsfield AI

    Higgsfield AI

    Higgsfield AI平台支持文生图和图生视频,近期对图生视频功能进行了全面升级,专为追求高质量、风格化内容创作并渴望真正电影级操控的创意人士打造——无论是MV导演、商业片制作人、AI创作者,还是社交媒体叙事者。
    查看完整榜单