Stability AI推出新型3D内容生成工具Stable Video 3D：基于单张图片，生成该物体的多视角视频和3D模型

554 0

Stability AI在3月18日推出了一个基于Stable Video Diffusion技术的生成模型Stable Video 3D（SV3D），首次将视频扩散模型应用到3D生成领域，只需要一张图片，Stable Video 3D就能生成高质量的多视角视频和3D模型。

模型细节

该模型经过训练，能够在给定相同大小的上下文帧时，生成分辨率为576x576的21帧视频。这一模型是在SVD Image-to-Video的基础上进行微调的。

项目主页

模型地址

该模型的两个版本：

SV3D_u：这个版本基于单个图像输入生成360度环绕视频，无需相机条件设置。

SV3D_p：这个版本扩展了SV3D_u的功能，它既能处理单个图像，也能处理轨道视图，允许用户沿着指定的相机路径创建3D视频。

主要功能与特点

论文中提出的SV3D（Stable Video 3D）模型是一个先进的AI系统，它能够从单张图片中生成高质量的三维物体。SV3D的主要功能和特点包括：

多视角图像生成：SV3D能够根据单张图片生成多个新视角的图像，这些图像在色彩、形状和姿态上保持一致性。

三维优化：通过结合新视角图像，SV3D能够创建出精细的三维网格模型，这些模型在细节上非常准确。

控制性：SV3D允许用户通过相机姿态控制来生成特定视角的图像，这意味着你可以指定从哪个角度查看物体。

泛化能力：SV3D在训练时使用了大量图像和视频数据，使其能够处理各种类型的物体，具有很强的泛化能力。

工作原理

SV3D的工作原理基于“潜在视频扩散模型”（latent video diffusion model），这是一种利用AI生成连贯视频的技术。SV3D首先将这种模型适应于从单张图片生成多个视角的图像，然后利用这些图像来优化和生成三维模型。

这个过程包括以下几个步骤：

新视角图像生成：SV3D使用潜在视频扩散模型来生成围绕物体的轨道视频，这些视频由多个视角的图像组成。

三维网格优化：通过迭代去噪和细化，SV3D将生成的多视角图像转化为三维网格模型。

细节增强：SV3D还设计了一种特殊的损失函数（如遮罩分数蒸馏采样损失，SDS loss），以增强模型在不可见区域的细节。

3D模型 # 3D模型 # Stability AI # Stable Video 3D

文章版权归作者所有，未经允许请勿转载。

3D 原语组装生成框架PrimitiveAnything：通过自回归变换器将复杂的 3D 形状分解为简单几何原语的组合

3D模型 # 3D # PrimitiveAnything

11个月前

03820

Stability AI 推出一种基于大规模 Transformer 架构的新型音频编码模型TAAE

新技术 # Stability AI # TAAE

1年前

03010

Hi3DGen：通过法线图作为中间表示，从二维图像生成高保真度的3D几何模型

3D模型 # 3D模型 # Hi3DGen

12个月前

04560

大型重建模型Real3D：利用单视图真实世界图像进行3D重建

新技术 # 3D模型 # Real3D

2年前

05970

暂无评论

暂无评论...

Stability AI推出新型3D内容生成工具Stable Video 3D：基于单张图片，生成该物体的多视角视频和3D模型

卷积重建模型CRM：将一张普通的2D图片转换成一个带有纹理的3D模型

3D内容生成模型Magic-Boost：将粗糙的3D模型转换成高质量的3D模型

相关文章

3D 原语组装生成框架PrimitiveAnything：通过自回归变换器将复杂的 3D 形状分解为简单几何原语的组合

Stability AI 推出一种基于大规模 Transformer 架构的新型音频编码模型TAAE

Hi3DGen：通过法线图作为中间表示，从二维图像生成高保真度的3D几何模型

大型重建模型Real3D：利用单视图真实世界图像进行3D重建

暂无评论

文章

ComfyUI 原生支持 Wan2.2 Fun：首尾帧控制与多模态视频生成全面集成

PaCo-RL：西安交大首创“一致性裁判”强化学习框架，让AI生成四张图也能保持角色与风格完美统

LMArena 最新排名出炉！阿里千问杀入全球前五，Qwen3.5-Max-Preview 力压豆包、Kimi 成国产最强

ComfyUI-NAG 插件正式上线：为扩散模型带来高效负向引导能力

限时免费体验一周！小米凌晨官宣三款大模型：MiMo-V2 系列正式亮相，1M 上下文比肩 Opus 4.6

紧急安全警报：LiteLLM 遭供应链攻击，v1.82.7/1.82.8 窃取凭证并植入后门

S.H.I.T

Alaya Code

OpenMAIC

抓虾吧

ITELLOU

Jellyfish AI短剧工厂

Stability AI推出新型3D内容生成工具Stable Video 3D：基于单张图片，生成该物体的多视角视频和3D模型

卷积重建模型CRM：将一张普通的2D图片转换成一个带有纹理的3D模型

3D内容生成模型Magic-Boost：将粗糙的3D模型转换成高质量的3D模型

相关文章

文章

标签云

网址

S.H.I.T

Alaya Code

OpenMAIC

抓虾吧

ITELLOU

Jellyfish AI短剧工厂