视频模型

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

用于音频驱动的多人对话视频生成的新框架 MultiTalk：根据多路音频输入和提示生成包含互动的视频，同时确保唇部动作与音频同步

中山大学深圳校区、美团和香港科技大学的研究人员推出用于音频驱动的多人对话视频生成的新框架 MultiTalk，该框架能够根据多路音频输入和提示生成包含互动的视频，同时确保唇部动作与音频同步。项目主页...

视频模型 # MultiTalk # 多人对话视频生成

8个月前

01820

DCM：双专家一致性模型，实现高效高质量视频生成

扩散模型在图像和视频合成任务中展现出卓越性能，但其依赖多步迭代去噪的过程，导致计算成本高昂。为解决这一问题，一致性模型（Consistency Models）在加速扩散模型方面取得了重要进展。然而...

视频模型 # DCM # 一致性模型

8个月前

03190

字节跳动推出全新视频生成框架 ATI：用“画轨迹”控制视频运动，对象、视角、局部变形一应俱全！

字节跳动 AI 实验室发布了一项令人眼前一亮的视频生成技术 —— ATI（Any Trajectory Instruction），它让普通人也能通过“画轨迹”的方式，精准控制视频中物体的运动、镜头的移...

视频模型 # ATI # ATI-Wan2.1 14B # 字节跳动

8个月前

03000

腾讯混元项目组推出数字人头像生成模型 HunyuanPortrait ：用于高度可控且逼真的肖像动画生成

腾讯混元项目组推出基于扩散模型的条件控制方法 HunyuanPortrait ，用于高度可控且逼真的肖像动画生成。该方法通过隐式表示来控制肖像动画，能够利用单张肖像图像作为外观参考和视频片段作为驱动模...

视频模型 # HunyuanPortrait # 腾讯混元

8个月前

01840

腾讯混元推出HunyuanVideo-Avatar：音频驱动、情感可控、支持多角色的虚拟人视频生成模型

近年来，音频驱动人物动画（Audio-driven Avatar Animation）取得了显著进展，但仍有几个关键挑战尚未完全解决：如何在保持角色一致性的前提下生成高度动态的视频；实现角色与音频...

视频模型 # HunyuanVideo-Avatar # 腾讯混元 # 视频生成模型

8个月前

03680

别让好模型消失，这个 WAN2.1 LoRA 合集值得收藏”

近日，CivitAI 在 Visa 和 Mastercard 的压力下进一步收紧内容政策，导致平台上大量模型被删除。这些模型中包含了许多创作者精心训练的作品，尤其是 NSFW类内容。地址：http...

视频模型 # WAN2.1 LoRA

8个月前

07780

视频生成模型的高效推理新方案Jenga：无需重新训练模型即可实现HunyuanVideo和Wan2.1显著提速

近年来，基于 DiT架构的视频生成模型在生成质量上取得了显著突破，但其高昂的计算成本却严重限制了实际部署与落地。为了解决这一瓶颈，来自香港中文大学、香港科技大学、快手科技和思谋科技的研究团队提出了 ...

视频模型 # HunyuanVideo # Jenga # Wan2.1

8个月前

04280

可控角色动画生成框架RealisDance-DiT：在处理稀有姿态、风格化角色、角色与物体的交互、复杂光照和动态场景等挑战性问题时表现出色

阿里巴巴达摩院、浙江大学、湖畔实验室、南方科技大学和深圳大学的研究人员推出可控角色动画生成框架RealisDance-DiT，其在处理稀有姿态、风格化角色、角色与物体的交互、复杂光照和动态场景等挑战性...

视频模型 # RealisDance-DiT # Wan 2.1 # 动画生成

8个月前

04270

视频人脸超分辨率的新型框架KEEP：解决视频中人脸图像的超分辨率问题，同时保持时间一致性

视频人脸超分辨率（VFSR）的目标是从低分辨率（LR）或严重退化的视频中重建出高分辨率（HR）的人脸图像。尽管人脸图像超分辨率（FSR）领域已经取得了显著进展，但视频人脸超分辨率仍然是一个相对较少被研...

视频模型 # KEEP # 视频人脸超分辨率

9个月前

01860

B站Index团队开源动漫视频生成模型 AniSora：一键生成多种风格的动漫视频片段

哔哩哔哩（B站）Index团队开源了一款名为 AniSora 的动漫视频生成模型。作为目前最强大的开源动漫视频生成工具，AniSora 能够一键生成多种风格的动漫视频片段，包括番剧剧集、国创动画、漫画...

视频模型 # AniSora # B站 # 动漫视频生成模型

9个月前

04410

阿里通义实验室 Wan 团队正式释出Wan2.1-VACE模型：支持视频生成与编辑的模型

阿里通义实验室Wan 团队正式释出了Wan2.1-VACE模型，这是一款支持视频生成与编辑的模型，单一模型可同时支持文生视频、图像参考视频生成、视频重绘、视频局部编辑、视频背景延展以及视频时长延展等全...

视频模型

9个月前

02330

新型视频法线估计模型 NormalCrafter ：能够从任意长度的开放世界视频中生成具有时间一致性和细粒度细节的法线序列

香港理工大学、腾讯 PCG ARC 实验室、香港城市大学和华中科技大学的研究人员推出新型视频法线估计模型 NormalCrafter ，它能够从任意长度的开放世界视频中生成具有时间一致性和细粒度细节的...

视频模型 # NormalCrafter # 视频法线估计模型

9个月前

03800

加载更多

用于音频驱动的多人对话视频生成的新框架 MultiTalk：根据多路音频输入和提示生成包含互动的视频，同时确保唇部动作与音频同步

DCM：双专家一致性模型，实现高效高质量视频生成

字节跳动推出全新视频生成框架 ATI：用“画轨迹”控制视频运动，对象、视角、局部变形一应俱全！

腾讯混元项目组推出数字人头像生成模型 HunyuanPortrait ：用于高度可控且逼真的肖像动画生成

腾讯混元推出HunyuanVideo-Avatar：音频驱动、情感可控、支持多角色的虚拟人视频生成模型

别让好模型消失，这个 WAN2.1 LoRA 合集值得收藏”

视频生成模型的高效推理新方案Jenga：无需重新训练模型即可实现HunyuanVideo和Wan2.1显著提速

可控角色动画生成框架RealisDance-DiT：在处理稀有姿态、风格化角色、角色与物体的交互、复杂光照和动态场景等挑战性问题时表现出色

视频人脸超分辨率的新型框架KEEP：解决视频中人脸图像的超分辨率问题，同时保持时间一致性

B站Index团队开源动漫视频生成模型 AniSora：一键生成多种风格的动漫视频片段

阿里通义实验室 Wan 团队正式释出Wan2.1-VACE模型：支持视频生成与编辑的模型

新型视频法线估计模型 NormalCrafter ：能够从任意长度的开放世界视频中生成具有时间一致性和细粒度细节的法线序列

Clawdbot/Moltbot

Situation Monitor

Higgsfield AI

新QoderWork

Fogsight (雾象)

ITELLOU

视频模型

网址

Clawdbot/Moltbot

Situation Monitor

Higgsfield AI

新QoderWork

Fogsight (雾象)

ITELLOU