视频模型

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

中科大 & 港科大联合推出 LongAnimation ：实现长动画自动上色的新框架

来自中国科学技术大学与香港科技大学的研究团队联合提出了一种名为 LongAnimation 的新型动画着色框架。该框架旨在实现长动画序列的自动化着色，并在整个动画过程中保持长期的颜色一致性。项目主页...

视频模型 # LongAnimation # 动画自动上色

7个月前

01950

UltraVideo 与 UltraWAN：首个支持原生 UHD 视频生成的开源数据集与模型

随着高质量视频内容需求的快速增长，如电影级超高清（UHD）制作、沉浸式媒体和短视频创作，对文本到视频（T2V）模型的能力提出了更高要求。然而，现有公开数据集在分辨率、图像质量及字幕细节方面存在明显不...

视频模型 # UltraVideo # UltraWAN # UltraWanComfy

7个月前

03830

EdgeTAM：Meta 与南洋理工等联合推出可在手机运行的视频分割模型，比 SAM 2 快 22 倍

由 Meta Reality 实验室、南洋理工大学和上海人工智能实验室联合提出的新模型 EdgeTAM 引起了广泛关注。该模型是对 Segment Anything Model 2（SAM 2...

视频模型 # EdgeTAM # SAM 2 # 视频分割模型

8个月前

02560

Midjourney 正式发布 V1 视频模型：从文本到视频，AI创作迈入新阶段

6月18日，Midjourney 宣布正式推出其首款视频生成模型 V1，标志着这家以图像生成闻名的 AI 公司，正式进军视频内容创作领域。这一更新不仅打通了原有的图文生成生态，还实现了从文本直接生成...

视频模型 # Midjourney

8个月前

01120

MiniMax正式发布Hailuo 02：全球首个能生成高复杂度体操动作的视频模型

MiniMax宣布推出全新视频生成模型——Hailuo 02，这是目前全球唯一一个能够高质量生成如“体操运动”这类高复杂度场景的AI视频模型。地址：https://hailuoai.com/crea...

视频模型 # Hailuo 02 # MiniMax

8个月前

02250

字节跳动提出MAGREF：支持多参考图像和文本提示的高质量视频生成框架

近年来，随着扩散模型等深度生成技术的发展，视频生成能力取得了显著进步。然而，在涉及多个参考主体的场景中，如何保证各主体之间的视觉一致性、身份一致性和生成稳定性，依然是一个重大挑战。为了解决这一问题...

视频模型 # MAGREF # 字节跳动 # 视频生成框架

8个月前

02350

浙大 & vivo 联合发布 MagicTryOn：首个基于扩散 Transformer 的视频虚拟试衣框架

在虚拟试衣技术持续发展的背景下，如何在视频中实现自然、真实、连贯的服装模拟，依然是一个极具挑战性的课题。浙江大学、vivo 和博维智慧科技的研究团队提出了一种全新的视频虚拟试衣（Video Virt...

视频模型 # MagicTryOn # Wan2.1 # 视频虚拟试衣

8个月前

04520

LoRA-Edit：首帧引导+掩膜控制，实现高质量视频编辑的新方法

在视频生成与编辑领域，如何在保持整体一致性的同时实现灵活可控的局部修改，一直是一个挑战。近日，来自香港中文大学与商汤研究院的研究团队提出了一种新型视频编辑方法——LoRA-Edit，该方法基于掩膜感知...

视频模型 # LoRA-Edit # 视频编辑

8个月前

02670

字节跳动发布 LatentSync 1.6：聚焦高分辨率视频生成，解决模糊问题

字节跳动发布了其对口型视频生成模型 LatentSync 的新版本 1.6，重点解决了此前版本中生成牙齿和嘴唇区域模糊的问题。模型：https://huggingface.co/ByteDance...

视频模型 # LatentSync 1.6 # 字节跳动

8个月前

03060

字节跳动发布Seaweed APT2：专为实时交互式场景设计的流式视频生成模型

字节跳动研究团队推出了Seaweed APT2，一款专为实时交互式场景设计的流式视频生成模型。该模型能够在单块H100 GPU上实现每秒24帧、分辨率高达736x416（等效640x480）的不间断视...

视频模型 # Seaweed APT2 # 字节跳动

8个月前

02410

字节跳动推出视频生成模型 Seedance 1.0，视频生成迈入“电影级”体验

字节跳动正式发布了其最新的视频生成模型 Seedance 1.0。该模型已集成在字节旗下 AI 创作平台“即梦”中，并以“视频生成3.0 Pro”版本面向用户开放（需会员权限使用）。目前，每生成一个5...

视频模型 # Seedance 1.0 # 字节跳动 # 视频生成模型

8个月前

02680

用于音频驱动的多人对话视频生成的新框架 MultiTalk：根据多路音频输入和提示生成包含互动的视频，同时确保唇部动作与音频同步

中山大学深圳校区、美团和香港科技大学的研究人员推出用于音频驱动的多人对话视频生成的新框架 MultiTalk，该框架能够根据多路音频输入和提示生成包含互动的视频，同时确保唇部动作与音频同步。项目主页...

视频模型 # MultiTalk # 多人对话视频生成

8个月前

01820

加载更多

中科大 & 港科大联合推出 LongAnimation ：实现长动画自动上色的新框架

UltraVideo 与 UltraWAN：首个支持原生 UHD 视频生成的开源数据集与模型

EdgeTAM：Meta 与南洋理工等联合推出可在手机运行的视频分割模型，比 SAM 2 快 22 倍

Midjourney 正式发布 V1 视频模型：从文本到视频，AI创作迈入新阶段

MiniMax正式发布Hailuo 02：全球首个能生成高复杂度体操动作的视频模型

字节跳动提出MAGREF：支持多参考图像和文本提示的高质量视频生成框架

浙大 & vivo 联合发布 MagicTryOn：首个基于扩散 Transformer 的视频虚拟试衣框架

LoRA-Edit：首帧引导+掩膜控制，实现高质量视频编辑的新方法

字节跳动发布 LatentSync 1.6：聚焦高分辨率视频生成，解决模糊问题

字节跳动发布Seaweed APT2：专为实时交互式场景设计的流式视频生成模型

字节跳动推出视频生成模型 Seedance 1.0，视频生成迈入“电影级”体验

用于音频驱动的多人对话视频生成的新框架 MultiTalk：根据多路音频输入和提示生成包含互动的视频，同时确保唇部动作与音频同步

新QoderWork

Clawdbot/Moltbot

Situation Monitor

Higgsfield AI

CutCut

ITELLOU

视频模型

网址

新QoderWork

Clawdbot/Moltbot

Situation Monitor

Higgsfield AI

CutCut

ITELLOU