今天,Odyssey 正式推出 Odyssey-2 Pro——目前最强大的通用世界模型——以及配套的 开发者 API。Odyssey表示,这标志着世界模型领域迎来了自己的 “GPT-2 时刻”:一个可供开发者广泛实验、构建原型并探索新应用场景的起点。
正如 GPT-2 与 OpenAI API 的开放催生了大量工具、研究和早期产品,从而推动了整个语言模型生态的发展,如今,交互式世界模拟也正进入可编程、可集成的新阶段。
什么是 Odyssey-2 Pro?
Odyssey-2 Pro 是 Odyssey-2(2025 年 10 月发布)的全面升级版本。它基于更大规模的视频与交互数据集训练,能够从像素级输入中学习物理规律、物体动力学与人类行为模式,并生成可交互、连续演化的模拟环境。

核心能力提升
- 更强的物理与行为建模:更准确地模拟重力、碰撞、运动轨迹及人类动作;
- 更高视觉质量:支持 720p 分辨率,以 22 FPS 实时流式输出;
- 低延迟交互:用户可在模拟过程中动态注入指令(如“出现一只猫”),模型实时响应;
- 长时间运行:当前支持数分钟级连续模拟,未来目标为小时乃至天级。
所有演示内容均为实时生成,未经后期处理。
Odyssey-2 Pro 验证了一个关键假设:通过大规模因果预测训练,世界模型可涌现出对现实世界的通用理解能力——这与语言模型通过下一词预测获得语言智能的路径高度相似。
Odyssey API:将世界模型集成到你的应用中
Odyssey-2 Pro 现通过三个核心 API 端点开放,支持实时交互与批量生成两种工作流:
1. simulate —— 批量生成模拟视频
适用于离线场景,如内容预生成、训练数据合成。
client.simulate({
prompt: "一个婴儿在草地上爬行",
actions: ["扔出一个球", "狗跑入画面"],
quality: "high",
duration: 60 // 秒
}, (result) => {
// 返回完整视频文件
});
2. startStream —— 启动交互式流
用于实时应用,如游戏、虚拟陪伴或培训系统。
const stream = await client.startStream("一个正在笑的婴儿");
await stream.interact("出现一只小猫"); // 动态改变模拟内容
3. connectToStream —— 多用户观看
允许多个客户端同步观看同一交互流,适用于直播、协作或教学场景。
client.connectToStream("stream_id"); // 被动观看,无控制权
SDK 支持:
- ✅ JavaScript / Python(已发布)
- 🚧 iOS / Android(即将推出)
开发者可在 5 分钟内完成集成,仅需不到十行代码即可嵌入交互式模拟。
应用场景展望
Odyssey-2 Pro 的开放为多个领域带来新可能:
- 游戏:动态生成剧情与环境;
- 教育:交互式科学实验或历史场景重现;
- 医疗培训:模拟患者反应与急救流程;
- 企业仿真:物流、工厂或零售环境测试;
- AI 陪伴:具有物理常识的虚拟角色;
- 研究:作为具身智能的低成本训练平台。
尽管模型仍处早期阶段,但其可编程性与实时交互能力已足以支撑实质性探索。
加速创新:Odyssey-2 Pro 黑客松
为推动生态发展,Odyssey 将于 2026 年 2 月 5 日 在 帕洛阿尔托 举办首届黑客松。
- 特邀评委:Soleio(Facebook 首位设计师,“点赞”按钮发明者)
- 奖项设置:
- 第 1 名:$25,000 现金 + $25,000 API 积分
- 第 2 名:$7,500 现金 + $7,500 API 积分
- 第 3 名:$2,500 现金 + $2,500 API 积分
- 荣誉提名(2 名):$1,000 API 积分
名额有限,申请通道现已开放。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...















