谷歌的Veo AI模型可以将图像和文本转换成高质量的高清视频

谷歌最近推出了其最新的生成式AI视频工具——Veo的私人预览版本。这一工具能够生成高清（1080p）视频，长度约为一分钟，并且所有生成的内容都将嵌入数字水印以防止版权侵犯。Veo是通过谷歌的Vertex AI平台向订阅了谷歌云服务的企业用户开放，标志着谷歌在文本到视频生成AI领域的重要进展。

Veo地址：https://deepmind.google/technologies/veo
Imagen 3地址：https://deepmind.google/technologies/imagen-3

Imagen 3 - 文本到图像生成器正式推出

与此同时，谷歌的Imagen 3文本到图像生成器已经结束了测试阶段，现在正通过Vertex AI向谷歌云订阅用户全面开放。Imagen 3不仅允许用户通过文本提示编辑照片，还可以让用户在生成的图像中加入自己的品牌元素、风格和标志，为企业提供了高度定制化的视觉内容创作能力。

山景城与OpenAI的竞争

谷歌位于山景城的总部在将Veo推向市场方面领先于竞争对手OpenAI，尽管后者在今年早些时候推出的Sora生成视频AI吸引了大量关注。从Google I/O开发者大会到如今不到六个月的时间里，谷歌迅速将Veo从概念转变为可用的产品，展示了其在AI领域的研发速度和技术实力。

Veo的功能特点

目前，Veo可以基于静态图片生成1080p分辨率的视频，用户可以通过文本提示来设定不同的电影效果和视觉元素。虽然谷歌尚未明确说明生成视频的具体时长，但在I/O大会上曾提到会“超过一分钟”。此外，用户可以选择使用由Imagen 3创建的图像作为Veo视频的基础，这使得Veo成为首个提供从图像到视频模型转换的大规模工具。

内容安全与版权保护

谷歌承诺，已采取措施确保Veo不会生成不当或侵权内容。为了进一步保障内容的安全性和原创性，所有通过Veo生成的视频都将嵌入谷歌的SynthID数字水印工具，从而为每一段视频提供独特的标识。

视频和图像质量

根据谷歌提供的样本，Veo和Imagen 3生成的视频和图像质量非常高，足以让大多数观众难以分辨真假。一个显著的特点是，所有创建的视频都是慢动作，这可能是为了避免某些技术限制，但即便如此，这些内容的质量仍然堪比我们迄今为止见过的一些最佳作品，例如OpenAI的Sora。

谷歌的Veo AI模型可以将图像和文本转换成高质量的高清视频

Imagen 3 - 文本到图像生成器正式推出

山景城与OpenAI的竞争

Veo的功能特点

内容安全与版权保护

视频和图像质量

评论0

升级VIP

全屏浏览

夜间模式

返回顶部