视频模型

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

清华大学推出SketchColour：基于扩散变换器的高效 2D 动画自动上色方案

清华大学的研究人员提出了一种全新的 2D 动画着色方法——SketchColour。该方法基于扩散变换器（DiT）架构，能够将黑白草图序列自动转换为连贯的彩色动画，显著提升动画制作效率。项目主页：h...

视频模型 # 2D 动画自动上色 # SketchColour

9个月前

01950

StreamDiT：实现实时流式文本到视频生成的新一代扩散模型

近年来，随着基于变换器（Transformer）的扩散模型向数十亿参数扩展，文本到视频（Text-to-Video, T2V）生成技术取得了显著进展。尽管当前模型已能生成高质量视频内容，但它们通常只能...

视频模型 # StreamDiT # 流式视频生成模型

9个月前

03760

LTX Studio为其开源视频生成模型 LTX Video 推出三款全新 LoRA控制模型，为开源视频模型带来前所未有的控制力

LTX Studio 为其开源视频生成模型 LTX Video 推出了三项全新的 LoRA 控制模块，让 AI 视频创作进入一个更具操控性与表现力的新阶段。 Depth Control: LTX-Vi...

视频模型 # LTX Studio # LTX Video

9个月前

01840

DLoRAL：一种兼顾细节与时间一致性的视频超分辨率新方法

在现实世界视频超分辨率（Real-VSR）任务中，如何从低质量（LQ）视频中恢复出既细节丰富又时间连贯的高质量（HQ）视频，是一个极具挑战性的问题。尤其是在使用预训练扩散模型（如 Stable Dif...

视频模型 # DLoRAL # 视频超分辨率

9个月前

04150

Character.AI 推出 TalkingMachines：音频驱动的实时视频生成模型，打造“FaceTime 风格”AI 视频交互

知名 AI 角色平台 Character.AI 发布了一项引人注目的研究成果——TalkingMachines，一个基于扩散模型的新型自回归视频生成系统。该系统仅需一张静态图像和一段语音输入，即可生成...

视频模型 # Character.AI # TalkingMachines

9个月前

01990

中科大 & 港科大联合推出 LongAnimation ：实现长动画自动上色的新框架

来自中国科学技术大学与香港科技大学的研究团队联合提出了一种名为 LongAnimation 的新型动画着色框架。该框架旨在实现长动画序列的自动化着色，并在整个动画过程中保持长期的颜色一致性。项目主页...

视频模型 # LongAnimation # 动画自动上色

9个月前

02240

UltraVideo 与 UltraWAN：首个支持原生 UHD 视频生成的开源数据集与模型

随着高质量视频内容需求的快速增长，如电影级超高清（UHD）制作、沉浸式媒体和短视频创作，对文本到视频（T2V）模型的能力提出了更高要求。然而，现有公开数据集在分辨率、图像质量及字幕细节方面存在明显不...

视频模型 # UltraVideo # UltraWAN # UltraWanComfy

10个月前

04410

EdgeTAM：Meta 与南洋理工等联合推出可在手机运行的视频分割模型，比 SAM 2 快 22 倍

由 Meta Reality 实验室、南洋理工大学和上海人工智能实验室联合提出的新模型 EdgeTAM 引起了广泛关注。该模型是对 Segment Anything Model 2（SAM 2...

视频模型 # EdgeTAM # SAM 2 # 视频分割模型

10个月前

02850

Midjourney 正式发布 V1 视频模型：从文本到视频，AI创作迈入新阶段

6月18日，Midjourney 宣布正式推出其首款视频生成模型 V1，标志着这家以图像生成闻名的 AI 公司，正式进军视频内容创作领域。这一更新不仅打通了原有的图文生成生态，还实现了从文本直接生成...

视频模型 # Midjourney

10个月前

01190

MiniMax正式发布Hailuo 02：全球首个能生成高复杂度体操动作的视频模型

MiniMax宣布推出全新视频生成模型——Hailuo 02，这是目前全球唯一一个能够高质量生成如“体操运动”这类高复杂度场景的AI视频模型。地址：https://hailuoai.com/crea...

视频模型 # Hailuo 02 # MiniMax

10个月前

03000

字节跳动提出MAGREF：支持多参考图像和文本提示的高质量视频生成框架

近年来，随着扩散模型等深度生成技术的发展，视频生成能力取得了显著进步。然而，在涉及多个参考主体的场景中，如何保证各主体之间的视觉一致性、身份一致性和生成稳定性，依然是一个重大挑战。为了解决这一问题...

视频模型 # MAGREF # 字节跳动 # 视频生成框架

10个月前

02530

浙大 & vivo 联合发布 MagicTryOn：首个基于扩散 Transformer 的视频虚拟试衣框架

在虚拟试衣技术持续发展的背景下，如何在视频中实现自然、真实、连贯的服装模拟，依然是一个极具挑战性的课题。浙江大学、vivo 和博维智慧科技的研究团队提出了一种全新的视频虚拟试衣（Video Virt...

视频模型 # MagicTryOn # Wan2.1 # 视频虚拟试衣

10个月前

05530

加载更多

清华大学推出SketchColour：基于扩散变换器的高效 2D 动画自动上色方案

StreamDiT：实现实时流式文本到视频生成的新一代扩散模型

LTX Studio为其开源视频生成模型 LTX Video 推出三款全新 LoRA控制模型，为开源视频模型带来前所未有的控制力

DLoRAL：一种兼顾细节与时间一致性的视频超分辨率新方法

Character.AI 推出 TalkingMachines：音频驱动的实时视频生成模型，打造“FaceTime 风格”AI 视频交互

中科大 & 港科大联合推出 LongAnimation ：实现长动画自动上色的新框架

UltraVideo 与 UltraWAN：首个支持原生 UHD 视频生成的开源数据集与模型

EdgeTAM：Meta 与南洋理工等联合推出可在手机运行的视频分割模型，比 SAM 2 快 22 倍

Midjourney 正式发布 V1 视频模型：从文本到视频，AI创作迈入新阶段

MiniMax正式发布Hailuo 02：全球首个能生成高复杂度体操动作的视频模型

字节跳动提出MAGREF：支持多参考图像和文本提示的高质量视频生成框架

浙大 & vivo 联合发布 MagicTryOn：首个基于扩散 Transformer 的视频虚拟试衣框架

OpenMAIC

ITELLOU

S.H.I.T

新即梦 CLI

CC-Connect

TapNow

视频模型

网址

OpenMAIC

ITELLOU

S.H.I.T

新即梦 CLI

CC-Connect

TapNow