谷歌正式发布视频生成模型 Veo 3.1 ,并同步更新其面向创作者的 AI 工具 Flow。新版本在视觉真实感、音频支持和编辑能力上均有显著提升,目标是让 AI 生成的视频更接近专业影视水准。

目前,Veo 3.1 及配套功能已通过 Gemini API(付费预览)向开发者开放,并集成于 Gemini 应用 和 Flow 工具中。

核心更新亮点
1. 更真实的光照与阴影控制
Flow 用户现在可对 AI 生成的视频进行后期光照调整,包括:
- 添加或修改光源方向
- 生成符合场景的动态阴影
这一功能显著提升了画面的物理真实感,减少“AI 味”明显的视觉瑕疵。
2. 原生音频生成支持
Veo 3.1 首次支持同步生成视频与音频,包括:
- 自然对话语音
- 环境音效与背景音
- 音画同步的节奏控制
音频质量与视频内容高度匹配,适用于短片、广告或互动叙事场景。
3. 三种新视频生成模式
| 功能 | 说明 |
|---|---|
| Ingredients to Video | 提供最多 3 张参考图(如角色、道具、场景),AI 据此生成带音频的连贯视频,有助于保持角色或风格一致性。 |
| Frames to Video | 输入起始帧和结束帧图像,AI 自动生成中间过渡动画,并附带匹配音频。 |
| Scene Extension | 基于现有视频的最后一秒,扩展生成最长 1 分钟的新片段,自动延续画面与音频,适合延长镜头或构建连续叙事。 |
4. 视频内容移除(即将上线)
谷歌表示,Flow 将很快支持“移除视频中任意对象”功能。系统会智能重组背景与场景,使被移除物体“仿佛从未存在”,类似高级视频修复工具。
技术细节与可用性
- 模型版本:Veo 3.1 与轻量版 Veo 3.1 Fast
- 访问方式:通过 Google AI Studio 或 Vertex AI 的 Gemini API(需付费)
- 价格:与 Veo 3 保持一致,按使用量计费
- 集成平台:Gemini 应用、Flow、第三方开发工具(如 Promise Studios 的 MUSE 平台)
注:普通用户可通过 Flow(需登录 Google 账户)体验部分功能,但完整能力需开发者调用 API。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...















