Odyssey 推出交互式世界模型Odyssey-2 Pro,支持实时模拟与多端集成

今天,Odyssey 正式推出 Odyssey-2 Pro——目前最强大的通用世界模型——以及配套的 开发者 API。Odyssey表示,这标志着世界模型领域迎来了自己的 “GPT-2 时刻”:一个可供开发者广泛实验、构建原型并探索新应用场景的起点。

正如 GPT-2 与 OpenAI API 的开放催生了大量工具、研究和早期产品,从而推动了整个语言模型生态的发展,如今,交互式世界模拟也正进入可编程、可集成的新阶段。

什么是 Odyssey-2 Pro?

Odyssey-2 Pro 是 Odyssey-2(2025 年 10 月发布)的全面升级版本。它基于更大规模的视频与交互数据集训练,能够从像素级输入中学习物理规律、物体动力学与人类行为模式,并生成可交互、连续演化的模拟环境

Odyssey 推出交互式世界模型Odyssey-2 Pro,支持实时模拟与多端集成

核心能力提升

  • 更强的物理与行为建模:更准确地模拟重力、碰撞、运动轨迹及人类动作;
  • 更高视觉质量:支持 720p 分辨率,以 22 FPS 实时流式输出;
  • 低延迟交互:用户可在模拟过程中动态注入指令(如“出现一只猫”),模型实时响应;
  • 长时间运行:当前支持数分钟级连续模拟,未来目标为小时乃至天级。

所有演示内容均为实时生成,未经后期处理。

Odyssey-2 Pro 验证了一个关键假设:通过大规模因果预测训练,世界模型可涌现出对现实世界的通用理解能力——这与语言模型通过下一词预测获得语言智能的路径高度相似。

Odyssey API:将世界模型集成到你的应用中

Odyssey-2 Pro 现通过三个核心 API 端点开放,支持实时交互与批量生成两种工作流:

1. simulate —— 批量生成模拟视频

适用于离线场景,如内容预生成、训练数据合成。

client.simulate({
  prompt: "一个婴儿在草地上爬行",
  actions: ["扔出一个球", "狗跑入画面"],
  quality: "high",
  duration: 60 // 秒
}, (result) => {
  // 返回完整视频文件
});

2. startStream —— 启动交互式流

用于实时应用,如游戏、虚拟陪伴或培训系统。

const stream = await client.startStream("一个正在笑的婴儿");
await stream.interact("出现一只小猫"); // 动态改变模拟内容

3. connectToStream —— 多用户观看

允许多个客户端同步观看同一交互流,适用于直播、协作或教学场景。

client.connectToStream("stream_id"); // 被动观看,无控制权

SDK 支持

  • ✅ JavaScript / Python(已发布)
  • 🚧 iOS / Android(即将推出)

开发者可在 5 分钟内完成集成,仅需不到十行代码即可嵌入交互式模拟。

应用场景展望

Odyssey-2 Pro 的开放为多个领域带来新可能:

  • 游戏:动态生成剧情与环境;
  • 教育:交互式科学实验或历史场景重现;
  • 医疗培训:模拟患者反应与急救流程;
  • 企业仿真:物流、工厂或零售环境测试;
  • AI 陪伴:具有物理常识的虚拟角色;
  • 研究:作为具身智能的低成本训练平台。

尽管模型仍处早期阶段,但其可编程性与实时交互能力已足以支撑实质性探索。

加速创新:Odyssey-2 Pro 黑客松

为推动生态发展,Odyssey 将于 2026 年 2 月 5 日 在 帕洛阿尔托 举办首届黑客松。

  • 特邀评委:Soleio(Facebook 首位设计师,“点赞”按钮发明者)
  • 奖项设置
    • 第 1 名:$25,000 现金 + $25,000 API 积分
    • 第 2 名:$7,500 现金 + $7,500 API 积分
    • 第 3 名:$2,500 现金 + $2,500 API 积分
    • 荣誉提名(2 名):$1,000 API 积分

名额有限,申请通道现已开放。

© 版权声明

相关文章

暂无评论

none
暂无评论...