谷歌升级 AI 视频生成模型Veo 3.1：支持光照编辑、音频生成与视频扩展

视频模型5个月前发布小马良

59 0

谷歌正式发布视频生成模型 Veo 3.1 ，并同步更新其面向创作者的 AI 工具 Flow。新版本在视觉真实感、音频支持和编辑能力上均有显著提升，目标是让 AI 生成的视频更接近专业影视水准。

谷歌升级 AI 视频生成模型Veo 3.1：支持光照编辑、音频生成与视频扩展

目前，Veo 3.1 及配套功能已通过 Gemini API（付费预览）向开发者开放，并集成于 Gemini 应用 和 Flow 工具中。

谷歌升级 AI 视频生成模型Veo 3.1：支持光照编辑、音频生成与视频扩展

核心更新亮点

1. 更真实的光照与阴影控制

Flow 用户现在可对 AI 生成的视频进行后期光照调整，包括：

添加或修改光源方向
生成符合场景的动态阴影

这一功能显著提升了画面的物理真实感，减少“AI 味”明显的视觉瑕疵。

2. 原生音频生成支持

Veo 3.1 首次支持同步生成视频与音频，包括：

自然对话语音
环境音效与背景音
音画同步的节奏控制

音频质量与视频内容高度匹配，适用于短片、广告或互动叙事场景。

3. 三种新视频生成模式

功能	说明
Ingredients to Video	提供最多 3 张参考图（如角色、道具、场景），AI 据此生成带音频的连贯视频，有助于保持角色或风格一致性。
Frames to Video	输入起始帧和结束帧图像，AI 自动生成中间过渡动画，并附带匹配音频。
Scene Extension	基于现有视频的最后一秒，扩展生成最长 1 分钟的新片段，自动延续画面与音频，适合延长镜头或构建连续叙事。

4. 视频内容移除（即将上线）

谷歌表示，Flow 将很快支持“移除视频中任意对象”功能。系统会智能重组背景与场景，使被移除物体“仿佛从未存在”，类似高级视频修复工具。

技术细节与可用性

模型版本：Veo 3.1 与轻量版 Veo 3.1 Fast
访问方式：通过 Google AI Studio 或 Vertex AI 的 Gemini API（需付费）
价格：与 Veo 3 保持一致，按使用量计费
集成平台：Gemini 应用、Flow、第三方开发工具（如 Promise Studios 的 MUSE 平台）

注：普通用户可通过 Flow（需登录 Google 账户）体验部分功能，但完整能力需开发者调用 API。

视频模型 # Veo 3.1 # 谷歌

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

谷歌推出 Gemini 2.5 Pro 预览版（I/O 版），编码能力显著提升

谷歌推出 Gemini 2.5 Pro 预览版（I/O 版），编码能力显著提升

早报 # Gemini 2.5 Pro # 谷歌

11个月前

03710

谷歌详解 Chrome 智能体安全架构：三层防护防止越权与数据泄露

谷歌详解 Chrome 智能体安全架构：三层防护防止越权与数据泄露

早报 # Chrome 智能体 # 谷歌

3个月前

0250

腾讯开源HunyuanVideo-1.5：83亿参数实现顶级画质，14G显存消费级显卡即可运行

腾讯开源HunyuanVideo-1.5：83亿参数实现顶级画质，14G显存消费级显卡即可运行

视频模型 # HunyuanVideo-1.5 # 腾讯

4个月前

01250

谷歌 Opal 重磅升级：Gemini 3 Flash 驱动“自主智能体”，一句话生成自动化工作流

谷歌 Opal 重磅升级：Gemini 3 Flash 驱动“自主智能体”，一句话生成自动化工作流

早报 # Opal # 谷歌

4周前

0350

暂无评论

none

暂无评论...