腾讯混元推出 混元3D-Part:让3D模型像乐高一样“可拆解”

3D模型2个月前发布 小马良
87 0

在AIGC推动内容创作变革的当下,3D生成正成为下一个关键战场。然而,一个长期被忽视的问题是:大多数AI生成的3D模型都是“一体成型”的黑盒结果——无法拆分、难以编辑、不便生产

腾讯混元推出 Hunyuan3D-Omni:统一框架实现多模态可控 3D 生成

为解决这一痛点,腾讯混元团队推出全新组件式生成技术——混元3D-PartHunyuan3D-Part),首次实现从整体模型到结构化部件的高精度自动分解,真正让AI生成的3D内容具备“可组装、可修改、可制造”的实用能力。

如果说此前发布的 混元3D-Omni 解决了“如何精准生成一个完整3D模型”,那么 混元3D-Part 则回答了下一个问题:

“生成之后,怎么用?”

腾讯混元推出 混元3D-Part:让3D模型像乐高一样“可拆解”

为什么需要“可拆解”的3D模型?

在真实应用场景中,静态的整体模型往往不够用:

  • 游戏开发:一辆车如果不能将轮子单独分离,就无法绑定旋转动画;
  • 工业设计:机械结构需按组件装配,整体模型无法用于工程仿真;
  • 3D打印:大型物件必须分件打印再拼接,否则易变形或失败;
  • AR/VR交互:用户希望点击门打开、转动方向盘,这就要求部件独立存在。

传统做法依赖人工建模拆分,耗时且专业门槛高。而现有AI生成方案大多输出单一网格(mesh),缺乏内在结构定义,导致后续处理困难。

混元3D-Part 的目标,就是打破这个瓶颈。

技术架构:两步走,从“识别”到“生成”

混元3D-Part 并非简单分割工具,而是一套完整的组件式生成流程,由两个核心模块组成:

1. P3-SAM:业界首个原生3D零件感知模型

全称 Part-aware 3D Segmentation and Mapping,是专为3D结构理解设计的分割模型。它接收由混元3D 2.5 或 3.0 生成的整体网格作为输入,自动完成三项任务:

  • 语义识别(如“车门”、“座椅”、“轮毂”)
  • 零件边界检测
  • 三维包围框定位

与基于图像的SAM不同,P3-SAM 直接在3D空间建模,避免投影误差,提升分割准确性。

2. X-Part:工业级组件生成引擎

在获得P3-SAM提供的结构信息后,X-Part 接管生成过程,将整体模型逐一分解为独立几何体。每个部件都满足:

  • 几何高保真:保留原始细节与曲面质量;
  • 结构一致性:部件之间无重叠、无缝隙;
  • 可编辑性强:支持导出为独立mesh,便于后续动画、渲染或加工。

整个流程无需人工标注,端到端自动化运行,支持一次性输出 50+个组件

腾讯混元推出 混元3D-Part:让3D模型像乐高一样“可拆解”

性能表现:多项基准测试领先

团队在多个公开与自建数据集上验证了混元3D-Part 的能力,在以下基准中均显著超越现有方法:

测试集主要指标表现
PartObj-Tiny分割准确率提升18.6%
PartObj-Tiny-WT(带纹理)组件完整性提升21.3%
PartNetE结构合理性得分SOTA(当前最优)

尤其在复杂拓扑结构(如铰链连接、嵌套组件)的处理上,混元3D-Part 展现出更强的语义理解和几何重建能力。

© 版权声明

相关文章

暂无评论

none
暂无评论...