腾讯混元 AI 视频

4天前发布 17 0 0

腾讯已经开源了两款重要的模型——文生视频和图生视频模型,这些工具不仅支持官网上的互动体验,还引入了对口型、动作驱动等创新玩法,并且能够生成背景音效及2K高质量视频。

所在地:
中国
收录时间:
2025-03-07
腾讯混元 AI 视频腾讯混元 AI 视频
腾讯混元 AI 视频

腾讯混元AI视频基于其先进的混元视频模型,为用户提供了丰富的视频生成体验,用户不仅能够轻松生成高质量的视频内容,还能体验到对口型、动作驱动等创新功能。无论是创意视频制作还是个性化内容生成,混元 AI 视频都为用户提供了前所未有的便利和灵活性。

腾讯混元 AI 视频

核心功能与体验

1. 文生视频:文字驱动的视频生成

文生视频功能允许用户通过简单的文字描述生成视频内容。用户只需输入一段文字,即可生成支持中英文双语输入、多种视频尺寸和清晰度的视频。这一功能特别适合快速制作创意视频、广告、教育内容等。

腾讯混元 AI 视频

2. 图生视频:图片驱动的视频生成

图生视频功能则进一步拓展了视频生成的可能性。用户只需上传一张图片,并简短描述希望画面如何运动、镜头如何调度,混元 AI 视频即可将静态图片转化为动态的 5 秒短视频,并自动配上背景音效。这一功能特别适合将静态图像转化为生动的视频内容,如社交媒体视频、动画短片等。

腾讯混元 AI 视频

3. 对口型与动作驱动

  • 对口型:用户上传一张人物图片,并输入希望“对口型”的文字或音频,图片中的人物即可“说话”或“唱歌”。这一功能为创意视频制作提供了新的可能性,特别适合制作有趣的社交媒体内容。
  • 动作驱动:用户上传一张人物图片,选择一个动作模板,即可一键生成同款跳舞视频。这一功能为视频创作增添了更多趣味性和互动性。
腾讯混元 AI 视频

重要版本更新亮点

2024.12.3 开源混元文生视频模型

腾讯混元大模型宣布文生视频功能上线,用户可以通过简单的文字描述生成视频。此次开源的视频生成大模型参数量达到 130 亿,是当前最大的视频开源模型。在与国内外多个顶尖模型的评测对比中,混元视频生成模型在文本视频一致性、运动质量和画面质量等多个维度表现领先,尤其在人物、人造场所等场景下表现出色。

2025.3.6 开源还原图生视频模型

此次开源的图生视频模型是混元文生视频模型开源工作的延续,模型总参数量保持 130 亿。该模型适用于多种类型的角色和场景,包括写实视频制作、动漫角色甚至 CGI 角色制作的生成。开源内容包含权重、推理代码和 LoRA 训练代码,支持开发者基于混元训练专属 LoRA 等衍生模型。

使用限制

目前,腾讯混元 AI 视频并未上线会员服务,用户每天生成视频的次数会受到限制:

  • 文生/图生视频:每天可以生成 4 次标准视频、2 次高品质视频和 1 次 2K 视频
  • 对口型和动作驱动:各 4 次

这些限制确保了服务的公平性和稳定性,同时也为用户提供了足够的体验机会。

相关:

腾讯发布开源视频生成模型—混元文生视频模型HunyuanVideo

ComfyUI官方宣布现在可以在仅有8GB显存的显卡上运行HunyuanVideo模型

腾讯开源混元图生视频模型HunyuanVideo-I2V

数据统计

相关导航

暂无评论

none
暂无评论...