视频模型

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

可控角色动画生成框架RealisDance-DiT：在处理稀有姿态、风格化角色、角色与物体的交互、复杂光照和动态场景等挑战性问题时表现出色

阿里巴巴达摩院、浙江大学、湖畔实验室、南方科技大学和深圳大学的研究人员推出可控角色动画生成框架RealisDance-DiT，其在处理稀有姿态、风格化角色、角色与物体的交互、复杂光照和动态场景等挑战性...

11个月前

05250

视频人脸超分辨率的新型框架KEEP：解决视频中人脸图像的超分辨率问题，同时保持时间一致性

视频人脸超分辨率（VFSR）的目标是从低分辨率（LR）或严重退化的视频中重建出高分辨率（HR）的人脸图像。尽管人脸图像超分辨率（FSR）领域已经取得了显著进展，但视频人脸超分辨率仍然是一个相对较少被研...

视频模型 # KEEP # 视频人脸超分辨率

11个月前

01930

B站Index团队开源动漫视频生成模型 AniSora：一键生成多种风格的动漫视频片段

哔哩哔哩（B站）Index团队开源了一款名为 AniSora 的动漫视频生成模型。作为目前最强大的开源动漫视频生成工具，AniSora 能够一键生成多种风格的动漫视频片段，包括番剧剧集、国创动画、漫画...

视频模型 # AniSora # B站 # 动漫视频生成模型

11个月前

05170

阿里通义实验室 Wan 团队正式释出Wan2.1-VACE模型：支持视频生成与编辑的模型

阿里通义实验室Wan 团队正式释出了Wan2.1-VACE模型，这是一款支持视频生成与编辑的模型，单一模型可同时支持文生视频、图像参考视频生成、视频重绘、视频局部编辑、视频背景延展以及视频时长延展等全...

视频模型

11个月前

02600

腾讯混元团队开源多模态定制化视频生成工具Hunyuan Custom：融合文本、图像、音频、视频等多模态输入生视频的能力

在内容创作领域，视频生成技术正不断进化，但如何让生成的视频既保持主体一致性，又能实现多样化的场景和动作变化，一直是创作者面临的难题。今天，腾讯混元团队正式推出并开源了一款全新的多模态定制化视频生成工具...

视频模型 # Hunyuan Custom # 多模态定制 # 腾讯

11个月前

04700

新型自回归视频扩散模型CausVid：解决传统双向扩散模型在交互式应用中的高延迟问题

麻省理工学院和Adobe的研究人员推出新型自回归视频扩散模型CausVid，旨在解决传统双向扩散模型在交互式应用中的高延迟问题。通过将双向扩散模型蒸馏为快速自回归生成器，CausVid 能够实现低延迟...

视频模型 # CausVid # 自回归视频扩散模型

11个月前

04520

腾讯推出新型图生视频框架FlexiAct：实现灵活的视频动作克隆

腾讯和清华大学的研究人员推出新型图生视频框架FlexiAct，实现灵活的动作控制，能够在异构场景（即具有不同空间结构、骨骼结构或视角的场景）中将参考视频中的动作迁移到任意目标图像上，同时保持动作动态和...

视频模型 # FlexiAct # 图生视频

11个月前

03760

Lightricks 推出全新开源视频生成模型 LTXV-13B

Lightricks之前推出的都是小尺寸模型，而在今天它宣布推出其最新且最先进的开源视频生成模型——LTXV-13B，这一模型不仅在质量、速度和可访问性方面实现了显著提升，还为创作者提供了强大的工具...

视频模型 # Lightricks # LTXV-13B # 视频生成模型

11个月前

04360

基于两阶段框架的唇部同步方法KeySync：能够生成高分辨率、时间连贯且与音频对齐的视频，同时有效减少表情泄漏并处理面部遮挡

唇部同步（Lip Synchronization）是指将视频中的唇部动作与新的输入音频对齐，使其在视觉上看起来自然且与音频同步。尽管这一领域与音频驱动的面部动画（Audio-driven Facial...

视频模型 # KeySync # 唇形同步 # 唇部同步

11个月前

04480

新型事件增强型网络 Ev-DeblurVSR：从低分辨率（LR）和模糊的输入视频中恢复出高分辨率（HR）的清晰视频

中国科学技术大学类脑智能感知与认知教育部重点实验室、合肥人工智能研究院和新加坡国立大学推出新型事件增强型网络 Ev-DeblurVSR ，旨在解决模糊视频超分辨率（BVSR）任务，即从低分辨率（LR...

视频模型 # Ev-DeblurVSR # 视频超分模型

11个月前

04370

Sand AI推出新型视频生成模型MAGI-1：通过自回归预测视频块序列来生成视频

MAGI-1是由Sand AI研究团队开发的一种新型视频生成模型。该模型通过自回归预测视频块序列来生成视频，每个视频块由固定长度的连续帧组成。MAGI-1的核心目标是实现高保真、实时、因果一致的视频生...

视频模型 # MAGI-1 # Sand AI # 自回归

12个月前

07670

昆仑万维推出SkyReels-V2：首个基于扩散强制框架的无限长度电影生成模型

近年来，视频生成领域取得了显著进展，主要得益于扩散模型和自回归框架的推动。然而，这一领域仍面临诸多关键挑战，例如提示一致性、视觉质量、动态效果和视频时长之间的权衡。为了追求更高的视觉质量，许多模型不得...

视频模型 # SkyReels-V2 # 昆仑万维 # 视频生成模型

12个月前

04480

加载更多

可控角色动画生成框架RealisDance-DiT：在处理稀有姿态、风格化角色、角色与物体的交互、复杂光照和动态场景等挑战性问题时表现出色

视频人脸超分辨率的新型框架KEEP：解决视频中人脸图像的超分辨率问题，同时保持时间一致性

B站Index团队开源动漫视频生成模型 AniSora：一键生成多种风格的动漫视频片段

阿里通义实验室 Wan 团队正式释出Wan2.1-VACE模型：支持视频生成与编辑的模型

腾讯混元团队开源多模态定制化视频生成工具Hunyuan Custom：融合文本、图像、音频、视频等多模态输入生视频的能力

新型自回归视频扩散模型CausVid：解决传统双向扩散模型在交互式应用中的高延迟问题

腾讯推出新型图生视频框架FlexiAct：实现灵活的视频动作克隆

Lightricks 推出全新开源视频生成模型 LTXV-13B

基于两阶段框架的唇部同步方法KeySync：能够生成高分辨率、时间连贯且与音频对齐的视频，同时有效减少表情泄漏并处理面部遮挡

新型事件增强型网络 Ev-DeblurVSR：从低分辨率（LR）和模糊的输入视频中恢复出高分辨率（HR）的清晰视频

Sand AI推出新型视频生成模型MAGI-1：通过自回归预测视频块序列来生成视频

昆仑万维推出SkyReels-V2：首个基于扩散强制框架的无限长度电影生成模型

OpenMAIC

新即梦 CLI

ITELLOU

S.H.I.T

Tripo

CC-Connect

视频模型

网址

OpenMAIC

新即梦 CLI

ITELLOU

S.H.I.T

Tripo

CC-Connect