谷歌正式为 Gemini 引入了一项突破性功能:生成交互式 3D 模型和动态模拟。这一更新将 AI 的回答从静态文本和图像,提升到了可操作、可探索的三维空间,让用户能够直观地理解复杂的空间关系和科学原理。
核心功能:从“看”到“玩”
以往,当你询问科学或工程问题时,AI 通常提供文字解释或静态图片。现在,Gemini 可以生成一个完全交互式的 3D 环境,你可以:
- 360 度旋转与缩放:全方位观察模型细节。
- 实时调整变量:通过滑块改变参数(如速度、质量、角度),即时看到模拟结果的变化。
- 控制模拟进程:暂停、播放或重置模拟,以便仔细分析特定时刻的状态。
- 自定义视图:隐藏或显示辅助线、标签或轨迹,专注于核心结构。

实测案例:月球绕地模拟
在测试中,用户请求“制作一个月球绕地球运行的模拟”,Gemini 不仅生成了地球和月球的 3D 模型,还提供了:
- 轨道速度滑块:加快或减慢月球公转,观察离心力与引力的平衡变化。
- 轨迹开关:一键隐藏轨道路径线,获得更纯净的视觉体验。
- 暂停按钮:在任意位置定格,查看相对位置。
竞品对比:可视化能力的军备竞赛
AI 巨头的竞争已从文本生成扩展到多模态交互领域:
| 厂商 | 模型 | 可视化能力特点 |
|---|---|---|
| Gemini | 交互式 3D 模型 + 物理模拟。支持参数调整、实时渲染,侧重科学原理和空间结构的动态演示。 | |
| Anthropic | Claude | 交互式图表与图示。擅长生成可点击、可筛选的数据可视化图表和流程图,侧重逻辑和数据呈现。 |
| OpenAI | ChatGPT | 科学概念可视化。通过代码解释器生成静态或动态图表,侧重数学公式和科学概念的图解。 |
Gemini 的这一举措使其在STEM(科学、技术、工程、数学)教育和工程设计辅助领域占据了独特优势。
如何使用?
该功能已向所有 Gemini 应用用户开放,操作步骤如下:
- 选择模型:在提示栏中选择 “Gemini Pro” 或更高阶模型(具体名称可能随地区版本略有不同,通常为高级模型)。
- 输入提示词:提出需要空间想象或动态演示的问题。
- “给我展示一个双摆的运动轨迹。”
- “帮我可视化多普勒效应,并允许我调整声源速度。”
- “生成一个内燃机活塞运动的 3D 模型。”
- 激活可视化:在 Gemini 的文字回复下方,点击 “显示可视化” (Show Visualization) 按钮。
- 互动探索:在生成的 3D 窗口中旋转、缩放、调整滑块,深入理解原理。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...















