可灵 AI 发布 O1 视频模型：统一架构支持多模态视频生成

47 0

可灵 AI正式推出 O1 视频模型，并同步上线新版创作界面。该模型采用统一的生成式架构，旨在解决当前 AI 视频工具中常见的“功能割裂”问题——即文生视频、图生视频、编辑、补全等任务需依赖多个独立模型或模块。（官方使用指南）

统一底座 + 多模态交互

O1 的核心设计是引入 MVL（多模态视觉语言）交互架构，将文本、图像、视频等输入统一编码至同一语义空间。用户可在单一输入框中混合使用文字描述、参考图、视频片段等，模型通过 Chain-of-Thought（思维链）机制进行多步推理，推演事件发展、空间关系与视觉一致性。

例如，输入“一只戴着红围巾的猫，在雨中的东京街头奔跑，镜头从侧面切换到俯拍”，系统需同时理解角色特征、环境氛围、镜头运动逻辑，并确保主体在视角切换中保持一致。

主体稳定性与多主体组合

可灵强调 O1 在主体一致性方面的改进：

支持从多个视角生成同一主体，确保在镜头流转中面部、服饰、姿态等关键特征不漂移；
允许用户自由组合多个主体（如“人物 + 宠物 + 车辆”），并维持各自的身份与交互逻辑。

这一能力对故事短片、广告脚本、游戏过场等需连续镜头的场景尤为重要。

创作界面：对话驱动，降低门槛

新界面以自然语言对话为核心交互方式。用户可上传素材后通过对话逐步调整细节，如“让背景更暗一点”“把猫换成狗”“镜头拉远”。系统实时响应，并保持已有主体与场景的连贯性。

技术定位与挑战

可灵称 O1 为“统一多模态视频模型”，其价值不在于单项指标超越竞品，而在于用一个模型覆盖多种视频生成任务，减少因模块切换导致的语义断层或风格跳跃。

然而，统一架构也带来更高训练复杂度与推理成本。目前模型在处理复杂物理交互（如液体、烟雾）或长时序逻辑（超过10秒的连贯叙事）时仍可能存在局限。官方未披露具体参数量或训练数据规模，技术细节有待进一步验证。

早报 # O1 视频模型 # 可灵 AI

文章版权归作者所有，未经允许请勿转载。

谷歌在 Gemini 中悄然测试“搜索”代理，升级AI 检索能力

早报 # Gemini # 搜索 # 谷歌

11个月前

02420

开源开发者反击 AI 爬虫，以巧妙且幽默的方式展开了反击

早报 # AI 爬虫

12个月前

02230

微软豪掷330亿美元租用“新云”算力，背后是AI基础设施的战略重构

早报 # 微软

6个月前

01030

Genspark 推出多智能体协同，让 AI 团队为你工作

早报 # Genspark # 多智能体协同

8个月前

02060

暂无评论

暂无评论...

可灵 AI 发布 O1 视频模型：统一架构支持多模态视频生成

统一底座 + 多模态交互

主体稳定性与多主体组合

创作界面：对话驱动，降低门槛

技术定位与挑战

Vidu Q2 上线：聚焦图像生成一致性与编辑实用性，开启限免一个月活动

DeepSeek V3.2正式发布：推理能力追平GPT-5，首个思考+工具调用开源模型

相关文章

谷歌在 Gemini 中悄然测试“搜索”代理，升级AI 检索能力

开源开发者反击 AI 爬虫，以巧妙且幽默的方式展开了反击

微软豪掷330亿美元租用“新云”算力，背后是AI基础设施的战略重构

Genspark 推出多智能体协同，让 AI 团队为你工作

暂无评论

文章

新限时免费体验一周！小米凌晨官宣三款大模型：MiMo-V2 系列正式亮相，1M 上下文比肩 Opus 4.6

Chrome 146 原生支持 WebMCP：Agent 操作网页的“去后端化”革命，却陷“鸡生蛋”困局

Kimi × OpenClaw 最新配置指南：原生支持Kimi K2.5，三步快速搭建智能体工作流

新日本乐天“自研”大模型翻车：Rakuten AI 3.0 被实锤为 DeepSeek V3“换皮”

新联想天禧 AI Claw 正式发布：告别“养龙虾”难题，打造零门槛、可信赖的 AI 队友

新MiniMax 发布 M2.7：首个实现“自我进化”的 Agent 模型，研发效率提升 50%

新OpenMAIC

新悟空

S.H.I.T

Meshy

CutCut

Joker of Academics（小丑学术期刊）

可灵 AI 发布 O1 视频模型：统一架构支持多模态视频生成

统一底座 + 多模态交互

主体稳定性与多主体组合

创作界面：对话驱动，降低门槛

技术定位与挑战

Vidu Q2 上线：聚焦图像生成一致性与编辑实用性，开启限免一个月活动

DeepSeek V3.2正式发布：推理能力追平GPT-5，首个思考+工具调用开源模型

相关文章

文章

标签云

网址

新OpenMAIC

新悟空

S.H.I.T

Meshy

CutCut

Joker of Academics（小丑学术期刊 ）

Joker of Academics（小丑学术期刊）