视频模型

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

LTX-Video推出0.9.5版本：原生 ComfyUI 支持，关键帧与视频扩展增强可控性

时隔近3个月，LTX-Video再次引来更新，随着2025年3月5日发布的v0.9.5版本，LTX-Video带来了多项改进和新特性，进一步增强了用户体验。通过质量提升、功能增强和用户体验改进，LTX...

1年前

03500

视频抠像框架MatAnyone：实现高质量、高稳定性的视频抠像

南洋理工大学和商汤科技研究院的研究人员推出视频抠像（Video Matting）框架MatAnyone，可以实现高质量、高稳定性的视频抠像，即使在复杂的背景和多目标场景中也能保持出色的性能。MatAn...

视频模型 # MatAnyone # 视频抠像

1年前

04650

Wan2.1 GP：基于阿里视频生成模型Wan 2.1，8G显存即可生成视频

Wan2.1 GP是一个基于阿里视频生成模型Wan 2.1的优化模型，专为普通消费级显卡用户优化，降低资源需求，同时提供强大的视频生成能力。它支持多种生成任务，包括文生视频（T2V）、图生视频（I2V...

视频模型 # Wan 2.1 # Wan2.1 GP # 视频生成

1年前

02690

阿里巴巴通义实验室开源视频生成模型 Wan2.1

在AI技术的浪潮中，视频生成技术正逐渐成为新的热点。阿里巴巴集团通义实验室紧跟技术前沿，于2月21日宣布开源其先进的视频生成模型——WanX 2.1。然而，在发布过程中出现了一个小插曲，模型名称由Wa...

视频模型 # AI视频 # Wan2.1 # WanX 2.1

1年前

02530

昆仑万维开源首个面向 AI 短剧创作的视频生成模型 SkyReels-V1和表情动作可控算法 SkyReels-A1

昆仑万维近日开源了国内首个面向 AI 短剧创作的视频生成模型 SkyReels-V1，以及国内首个 SOTA 级别基于视频基座模型的表情动作可控算法 SkyReels-A1，这款模型已在昆仑万维海外A...

视频模型 # SkyReels-A1 # SkyReels-V1 # 昆仑万维

1年前

02490

阶跃星辰开源300 亿参数文生视频模型Step-Video-T2V：能够生成长达 204 帧的高质量视频

由前微软全球副总裁、微软亚洲互联网工程院首席科学家姜大昕创办的AI公司阶跃星辰，开源了一款强大的文生视频模型——Step-Video-T2V。该模型拥有 300 亿参数，能够生成长达 204 帧的高质...

视频模型 # Step-Video-T2V # Step-Video-T2V-Turbo # 文生视频模型

1年前

03020

新型视频生成技术Magic 1-For-1：通过优化内存消耗和推理延迟，快速生成高质量的视频内容

北京大学、Hedra和英伟达的研究人员推出新型视频生成技术Magic 1-For-1 ，通过将复杂的文本到视频（T2V）生成任务分解为两个更简单的子任务：文本到图像（T2I）生成和图像到视频（ I2V...

视频模型 # Magic 1-For-1 # 视频生成

1年前

02300

字节跳动推出基于修正流Transformer 架构的新型图像和视频生成模型家族Goku

香港大学和字节跳动的研究人员推出新型图像和视频生成模型家族Goku，它基于修正流Transformer 架构，实现了行业领先的图像和视频联合生成性能。Goku 的目标是通过高质量的视觉内容生成，推动媒...

视频模型 # Goku # 字节跳动 # 视频生成

1年前

05240

新型3D感知视频扩散模型Diffusion as Shader：通过3D控制信号实现多样化且精确的视频生成控制

香港科技大学、浙江大学、香港大学、南洋理工大学、武汉大学和德克萨斯A＆M大学的研究人员推出新型3D感知视频扩散模型Diffusion as Shader (DaS) ，旨在通过3D控制信号实现多样化且...

视频模型 # Diffusion as Shader # 视频生成控制

1年前

03360

肖像图像动画Hallo系列再次更新！Hallo3框架引入Cogvidex模型，生成的肖像动画动作更自然、画面更逼真

复旦大学、百度的研究人员对再次对Hallo 进行了更新，提出了 Hallo3框架，在通过预训练的基于变换器的视频生成模型（Cogvidex），解决现有肖像图像动画技术在处理非正面视角、渲染肖像周围动态...

视频模型 # Cogvidex模型 # Hallo3

1年前

02920

Adobe推出TransPixar：通过文本和图像生成透明背景的视频

香港科技大学(广州)和 Adobe 研究的研究人员推出一种先进的文本到视频生成方法 TransPixar，特别专注于生成包含透明度通道（Alpha Channel）的RGBA视频，也就是能够通过文...

视频模型 # TransPixar

1年前

02890

腾讯发布一种在 MM-DiT 架构下无需额外训练的多提示长视频生成方法DiTCtrl

随着视频生成模型的发展，基于DiT架构如 Sora 和 MM-DiT 在单提示视频生成任务中取得了显著进展。然而，这些模型在处理多个顺序提示时面临诸多挑战，难以生成连贯且自然过渡的场景。具体来说：严...

视频模型 # DiTCtrl

1年前

03250

加载更多