Odyssey 推出交互式世界模型Odyssey-2 Pro，支持实时模拟与多端集成

118 0

今天，Odyssey 正式推出 Odyssey-2 Pro——目前最强大的通用世界模型——以及配套的 开发者 API。Odyssey表示，这标志着世界模型领域迎来了自己的 “GPT-2 时刻”：一个可供开发者广泛实验、构建原型并探索新应用场景的起点。

正如 GPT-2 与 OpenAI API 的开放催生了大量工具、研究和早期产品，从而推动了整个语言模型生态的发展，如今，交互式世界模拟也正进入可编程、可集成的新阶段。

Odyssey-2 Pro 是 Odyssey-2（2025 年 10 月发布）的全面升级版本。它基于更大规模的视频与交互数据集训练，能够从像素级输入中学习物理规律、物体动力学与人类行为模式，并生成可交互、连续演化的模拟环境。

所有演示内容均为实时生成，未经后期处理。

Odyssey-2 Pro 验证了一个关键假设：通过大规模因果预测训练，世界模型可涌现出对现实世界的通用理解能力——这与语言模型通过下一词预测获得语言智能的路径高度相似。

Odyssey-2 Pro 现通过三个核心 API 端点开放，支持实时交互与批量生成两种工作流：

适用于离线场景，如内容预生成、训练数据合成。

client.simulate({
  prompt: "一个婴儿在草地上爬行",
  actions: ["扔出一个球", "狗跑入画面"],
  quality: "high",
  duration: 60 // 秒
}, (result) => {
  // 返回完整视频文件
});

用于实时应用，如游戏、虚拟陪伴或培训系统。

const stream = await client.startStream("一个正在笑的婴儿");
await stream.interact("出现一只小猫"); // 动态改变模拟内容

允许多个客户端同步观看同一交互流，适用于直播、协作或教学场景。

client.connectToStream("stream_id"); // 被动观看，无控制权

SDK 支持：

开发者可在 5 分钟内完成集成，仅需不到十行代码即可嵌入交互式模拟。

Odyssey-2 Pro 的开放为多个领域带来新可能：

尽管模型仍处早期阶段，但其可编程性与实时交互能力已足以支撑实质性探索。

为推动生态发展，Odyssey 将于 2026 年 2 月 5 日 在 帕洛阿尔托 举办首届黑客松。

特邀评委：Soleio（Facebook 首位设计师，“点赞”按钮发明者）
奖项设置：
- 第 1 名：$25,000 现金 + $25,000 API 积分
- 第 2 名：$7,500 现金 + $7,500 API 积分
- 第 3 名：$2,500 现金 + $2,500 API 积分
- 荣誉提名（2 名）：$1,000 API 积分