谷歌的Veo AI模型可以将图像和文本转换成高质量的高清视频

谷歌最近推出了其最新的生成式AI视频工具——Veo的私人预览版本。这一工具能够生成高清(1080p)视频,长度约为一分钟,并且所有生成的内容都将嵌入数字水印以防止版权侵犯。Veo是通过谷歌的Vertex AI平台向订阅了谷歌云服务的企业用户开放,标志着谷歌在文本到视频生成AI领域的重要进展。

Imagen 3 - 文本到图像生成器正式推出

与此同时,谷歌的Imagen 3文本到图像生成器已经结束了测试阶段,现在正通过Vertex AI向谷歌云订阅用户全面开放。Imagen 3不仅允许用户通过文本提示编辑照片,还可以让用户在生成的图像中加入自己的品牌元素、风格和标志,为企业提供了高度定制化的视觉内容创作能力。

山景城与OpenAI的竞争

谷歌位于山景城的总部在将Veo推向市场方面领先于竞争对手OpenAI,尽管后者在今年早些时候推出的Sora生成视频AI吸引了大量关注。从Google I/O开发者大会到如今不到六个月的时间里,谷歌迅速将Veo从概念转变为可用的产品,展示了其在AI领域的研发速度和技术实力。

Veo的功能特点

目前,Veo可以基于静态图片生成1080p分辨率的视频,用户可以通过文本提示来设定不同的电影效果和视觉元素。虽然谷歌尚未明确说明生成视频的具体时长,但在I/O大会上曾提到会“超过一分钟”。此外,用户可以选择使用由Imagen 3创建的图像作为Veo视频的基础,这使得Veo成为首个提供从图像到视频模型转换的大规模工具。

内容安全与版权保护

谷歌承诺,已采取措施确保Veo不会生成不当或侵权内容。为了进一步保障内容的安全性和原创性,所有通过Veo生成的视频都将嵌入谷歌的SynthID数字水印工具,从而为每一段视频提供独特的标识。

视频和图像质量

根据谷歌提供的样本,Veo和Imagen 3生成的视频和图像质量非常高,足以让大多数观众难以分辨真假。一个显著的特点是,所有创建的视频都是慢动作,这可能是为了避免某些技术限制,但即便如此,这些内容的质量仍然堪比我们迄今为止见过的一些最佳作品,例如OpenAI的Sora。

0

评论0

没有账号?注册  忘记密码?