谷歌升级 AI 视频生成模型Veo 3.1:支持光照编辑、音频生成与视频扩展

视频模型2个月前发布 小马良
50 0

谷歌正式发布视频生成模型 Veo 3.1 ,并同步更新其面向创作者的 AI 工具 Flow。新版本在视觉真实感、音频支持和编辑能力上均有显著提升,目标是让 AI 生成的视频更接近专业影视水准。

谷歌升级 AI 视频生成模型Veo 3.1:支持光照编辑、音频生成与视频扩展

目前,Veo 3.1 及配套功能已通过 Gemini API(付费预览)向开发者开放,并集成于 Gemini 应用 和 Flow 工具中。

谷歌升级 AI 视频生成模型Veo 3.1:支持光照编辑、音频生成与视频扩展

核心更新亮点

1. 更真实的光照与阴影控制

Flow 用户现在可对 AI 生成的视频进行后期光照调整,包括:

  • 添加或修改光源方向
  • 生成符合场景的动态阴影

这一功能显著提升了画面的物理真实感,减少“AI 味”明显的视觉瑕疵。

2. 原生音频生成支持

Veo 3.1 首次支持同步生成视频与音频,包括:

  • 自然对话语音
  • 环境音效与背景音
  • 音画同步的节奏控制

音频质量与视频内容高度匹配,适用于短片、广告或互动叙事场景。

3. 三种新视频生成模式

功能说明
Ingredients to Video提供最多 3 张参考图(如角色、道具、场景),AI 据此生成带音频的连贯视频,有助于保持角色或风格一致性。
Frames to Video输入起始帧和结束帧图像,AI 自动生成中间过渡动画,并附带匹配音频。
Scene Extension基于现有视频的最后一秒,扩展生成最长 1 分钟的新片段,自动延续画面与音频,适合延长镜头或构建连续叙事。

4. 视频内容移除(即将上线)

谷歌表示,Flow 将很快支持“移除视频中任意对象”功能。系统会智能重组背景与场景,使被移除物体“仿佛从未存在”,类似高级视频修复工具。

技术细节与可用性

  • 模型版本:Veo 3.1 与轻量版 Veo 3.1 Fast
  • 访问方式:通过 Google AI Studio 或 Vertex AI 的 Gemini API(需付费)
  • 价格:与 Veo 3 保持一致,按使用量计费
  • 集成平台Gemini 应用Flow、第三方开发工具(如 Promise Studios 的 MUSE 平台)

注:普通用户可通过 Flow(需登录 Google 账户)体验部分功能,但完整能力需开发者调用 API。

© 版权声明

相关文章

暂无评论

none
暂无评论...