Meta推出新型视频生成模型Movie Gen：不仅能制作高清视频，还能为视频配上声音

新技术2年前发布小马良

553 0

Meta宣布推出一款新AI视频生成器Movie Gen，这款工具不仅能制作高清视频，还能为视频配上声音。据Meta介绍，Movie Gen可通过简单的文字输入，自动生成全新的视频内容。此外，它还能编辑现有的视频或静态图片，为创作者提供更多元化的创作方式。值得注意的是，视频中的声音，包括环境噪音、音效和背景音乐，均由AI生成，无需人工配音。然而，Meta的首席产品官Chris Cox在Threads上表示，尽管Movie Gen功能强大，但公司“还不太准备将这个产品发布出来”，原因是其成本高昂，且生成时间较长。

项目主页：https://ai.meta.com/research/movie-gen

定制与修改视频

Movie Gen的定制功能同样令人瞩目。用户可以利用图片制作定制视频，或对现有视频进行修改，如改变视频中的元素、风格、过渡效果等。Meta分享了一个案例：一张静态的女性头像，通过Movie Gen的AI技术，被添加了一段她在南瓜地里坐着喝饮料的视频场景，效果栩栩如生。

此外，Movie Gen还能通过文字提示，对现有视频进行多样化编辑。例如，一个看似无害的插图跑步者视频，在Movie Gen的加持下，可以变成手持彩球的跑步者、沙漠背景中的跑步者，甚至穿上恐龙服装的跑步者，画面丰富多变。

主要功能：

文本到视频合成：就像你给编剧一个故事大纲，他们就能写出完整的剧本一样，Movie Gen可以从一个文本提示生成视频。
视频个性化：类似于根据演员的形象定制角色，Movie Gen能够根据用户提供的图片生成个性化视频。
视频编辑：就像剪辑师根据导演的指示修改电影一样，Movie Gen能够根据文本指令精确编辑视频。
文本到音频生成：就像音效师根据剧本创作声音效果和音乐一样，Movie Gen能够生成与文本提示同步的音频。

主要特点：

高质量视频：生成高达1080p高清视频。
同步音频：生成的视频配有同步的音频，就像电影中的对话和背景音乐一样。
个性化：能够根据一张图片生成具有特定人物特征的视频。
精确编辑：可以根据用户提供的文本指令进行精确的视频编辑。

工作原理：

Movie Gen模型使用了大量的数据进行训练，包括文本、图像、视频和音频，以便学会如何生成和编辑媒体内容。它们使用一种叫做"变换器"的人工智能架构，这种架构在处理语言和视觉数据方面非常有效。通过训练，这些模型学会了如何理解文本描述，并将其转化为相应的视觉和音频输出。

具体应用场景：

内容创作：视频博主和社交媒体影响者可以使用这些模型来快速生成视频内容。
广告制作：公司可以使用这些模型来创建吸引人的广告视频，而无需昂贵的制作团队。
电影和游戏开发：在制作电影或视频游戏时，这些模型可以帮助创建原型或预览场景。
教育和培训：通过生成特定的场景，可以帮助学生更好地理解复杂的概念。
虚拟现实和增强现实：在VR或AR应用中，这些模型可以用来创建动态的环境和背景。

新技术 # Meta # Movie Gen # 视频生成模型

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

针对图生图模型的machine unlearning（机器遗忘）框架

针对图生图模型的machine unlearning（机器遗忘）框架

新技术 # Machine Unlearning # 机器遗忘

2年前

05690

多模态大语言模型Groma：具备精细化和定位化的视觉感知能力

多模态大语言模型Groma：具备精细化和定位化的视觉感知能力

新技术 # Groma # 多模态大语言模型

2年前

06580

Meta 预测到 2035 年生成式 AI 营收将达 1.4 万亿美元

Meta 预测到 2035 年生成式 AI 营收将达 1.4 万亿美元

早报 # AI # Meta

11个月前

02030

多模态大语言模型Omni-RGPT：在统一图像和视频的区域级理解

多模态大语言模型Omni-RGPT：在统一图像和视频的区域级理解

新技术 # Omni-RGPT # 多模态大语言模型

1年前

02600

暂无评论

none

暂无评论...