腾讯混元 AI 视频

1年前发布 2,113 00

腾讯已经开源了两款重要的模型——文生视频和图生视频模型，这些工具不仅支持官网上的互动体验，还引入了对口型、动作驱动等创新玩法，并且能够生成背景音效及2K高质量视频。

所在地：

中国

收录时间：

2025-03-07

腾讯混元 AI 视频

腾讯混元AI视频基于其先进的混元视频模型，为用户提供了丰富的视频生成体验，用户不仅能够轻松生成高质量的视频内容，还能体验到对口型、动作驱动等创新功能。无论是创意视频制作还是个性化内容生成，混元 AI 视频都为用户提供了前所未有的便利和灵活性。

文生视频功能允许用户通过简单的文字描述生成视频内容。用户只需输入一段文字，即可生成支持中英文双语输入、多种视频尺寸和清晰度的视频。这一功能特别适合快速制作创意视频、广告、教育内容等。

2. 图生视频：图片驱动的视频生成

图生视频功能则进一步拓展了视频生成的可能性。用户只需上传一张图片，并简短描述希望画面如何运动、镜头如何调度，混元 AI 视频即可将静态图片转化为动态的 5 秒短视频，并自动配上背景音效。这一功能特别适合将静态图像转化为生动的视频内容，如社交媒体视频、动画短片等。

对口型：用户上传一张人物图片，并输入希望“对口型”的文字或音频，图片中的人物即可“说话”或“唱歌”。这一功能为创意视频制作提供了新的可能性，特别适合制作有趣的社交媒体内容。
动作驱动：用户上传一张人物图片，选择一个动作模板，即可一键生成同款跳舞视频。这一功能为视频创作增添了更多趣味性和互动性。

腾讯混元大模型宣布文生视频功能上线，用户可以通过简单的文字描述生成视频。此次开源的视频生成大模型参数量达到 130 亿，是当前最大的视频开源模型。在与国内外多个顶尖模型的评测对比中，混元视频生成模型在文本视频一致性、运动质量和画面质量等多个维度表现领先，尤其在人物、人造场所等场景下表现出色。

此次开源的图生视频模型是混元文生视频模型开源工作的延续，模型总参数量保持 130 亿。该模型适用于多种类型的角色和场景，包括写实视频制作、动漫角色甚至 CGI 角色制作的生成。开源内容包含权重、推理代码和 LoRA 训练代码，支持开发者基于混元训练专属 LoRA 等衍生模型。

目前，腾讯混元 AI 视频并未上线会员服务，用户每天生成视频的次数会受到限制：

这些限制确保了服务的公平性和稳定性，同时也为用户提供了足够的体验机会。

数据统计

暂无评论...