视频模型

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

Wan-Alpha：支持透明通道的高质量文生视频模型

在视频编辑、虚拟合成、游戏特效和社交媒体创作中，带有透明背景（Alpha 通道）的视频素材具有不可替代的价值——它们可以无缝叠加到任意场景中，无需后期抠像或遮罩处理。然而，当前主流的文生视频（Tex...

视频模型 # Wan-Alpha # 文生视频模型

6个月前

03100

通义万相 Wan2.5-Preview 正式发布：原生支持音画同步的多模态视觉生成引擎

阿里通义实验室Wan项目组正式推出 Wan2.5-Preview——一个在架构层面实现革新、真正实现“音视频协同生成”的新一代视觉大模型。它不是简单的功能叠加，而是通过原生多模态统一架构，将文本、图...

视频模型 # Wan2.5-Preview

6个月前

01420

Lynx：字节跳动提出的单图驱动个性化视频生成方案，实现高保真身份保留

在内容创作、虚拟社交等场景中，“基于单张图像生成个性化视频”是重要需求——比如用一张自拍生成动态表情视频，或让历史人物照片“动起来”讲述故事。但这类任务长期面临核心挑战：如何在保证视频自然流畅的同时...

视频模型 # Lynx # 个性化视频生成 # 字节跳动

6个月前

02760

字节跳动提出OmniInsert：无需遮罩，任意对象都能自然插入视频

在影视后期、广告制作乃至虚拟内容创作中，“将一个新角色或物体自然地加入已有视频”是一项高频需求。传统方法依赖精确的遮罩标注、关键帧追踪和复杂的合成流程，成本高、耗时长。近期，基于扩散模型的技术为这一...

视频模型 # OmniInsert # 字节跳动 # 视频编辑

6个月前

01600

DecartAI推出 Lucy Edit Dev：全球首个开源、支持自由文本提示的指令引导视频编辑模型

DecartAI推出 Lucy Edit Dev ——全球首个开源、支持自由文本提示的指令引导视频编辑模型。它允许用户仅通过自然语言描述，即可完成复杂的视频修改任务，如更换服装、替换角色、插入物体或更...

视频模型 # Lucy Edit Dev # 视频编辑模型

7个月前

03920

Wan-Animate：阿里通义实验室推出的统一人物动画与替换框架

阿里巴巴通义实验室 HumanAIGC 团队近日将推出 Wan-Animate —— 一个基于 Wan 系列模型构建的统一人物动画与角色替换框架。项目主页：https://humanaigc.git...

视频模型 # Wan-Animate # 阿里通义实验室

7个月前

02470

清华大学 & 字节跳动联合推出 HuMo：一个以人为中心的多模态视频生成框架

一段文字描述 + 一张人物照片 + 一段语音音频，能否生成一个口型同步、动作自然、形象一致的高质量人物视频？现在，可以了。清华大学与字节跳动智能创作团队合作推出 HuMo（Human-Centri...

视频模型 # HuMo # 字节跳动

7个月前

0990

新型视频合成方法GenCompositor：实现轨迹可控的视频级前景融合

由北京大学经济与管理学院、腾讯PCG ARC实验室、大湾区大学与香港中文大学联合提出的新型视频合成方法 GenCompositor，为视频创作中的“前景-背景融合”问题提供了一种自动化解决方案。该方法...

视频模型 # GenCompositor # 视频合成

7个月前

01100

Pusa Wan2.2 V1.0：将开创性的 Pusa 范式扩展到先进的 Wan2.2-T2V-A14B 架构

Pusa Wan2.2 V1.0 将开创性的 Pusa 范式扩展到先进的 Wan2.2-T2V-A14B 架构，该架构采用 MoE DiT 设计，包含独立的噪声和高噪声模型。这种架构提供了增强的质量控...

视频模型 # Pusa Wan2.2 V1.0 # Wan2.2-T2V-A14B

7个月前

02400

腾讯发布混元世界模型 - Voyager：单图生成 3D 场景，实现长距离沉浸式探索

腾讯今天正式推出混元世界模型 - Voyager（HunyuanWorld-Voyager），这是一款创新的视频扩散框架。其核心能力在于：基于单张输入图像即可生成具备世界一致性的 3D 点云，支持用户...

视频模型 # HunyuanWorld-Voyager # 混元世界模型 - Voyager # 腾讯

7个月前

0770

字节跳动发布OmniHuman-1.5：模拟人类双重认知，生成语义连贯的高逼真角色动画

字节跳动近期推出新型视频角色生成框架 OmniHuman-1.5，核心突破在于模拟人类“系统1（快速直觉反应）+系统2（缓慢深思规划）”的双重认知过程，实现从“单一图像+语音轨道”到“物理逼真、语义连...

视频模型 # OmniHuman-1.5 # 字节跳动

7个月前

0780

腾讯开源混元视频音效生成模型HunyuanVideo-Foley：端到端TV2A模型，为创作者打造高保真音视频体验

腾讯今天正式开源 HunyuanVideo-Foley —— 一个端到端的文本-视频-音频（Text-Video-to-Audio, TV2A）生成模型，专注于为视频内容自动生成高保真、语义对齐的音效...

视频模型 # HunyuanVideo-Foley # 混元视频音效生成模型 # 腾讯

7个月前

0970

加载更多

Wan-Alpha：支持透明通道的高质量文生视频模型

通义万相 Wan2.5-Preview 正式发布：原生支持音画同步的多模态视觉生成引擎

Lynx：字节跳动提出的单图驱动个性化视频生成方案，实现高保真身份保留

字节跳动提出OmniInsert：无需遮罩，任意对象都能自然插入视频

DecartAI推出 Lucy Edit Dev：全球首个开源、支持自由文本提示的指令引导视频编辑模型

Wan-Animate：阿里通义实验室推出的统一人物动画与替换框架

清华大学 & 字节跳动联合推出 HuMo：一个以人为中心的多模态视频生成框架

新型视频合成方法GenCompositor：实现轨迹可控的视频级前景融合

Pusa Wan2.2 V1.0：将开创性的 Pusa 范式扩展到先进的 Wan2.2-T2V-A14B 架构

腾讯发布混元世界模型 - Voyager：单图生成 3D 场景，实现长距离沉浸式探索

字节跳动发布OmniHuman-1.5：模拟人类双重认知，生成语义连贯的高逼真角色动画

腾讯开源混元视频音效生成模型HunyuanVideo-Foley：端到端TV2A模型，为创作者打造高保真音视频体验

360龙虾卫士

S.H.I.T

ITELLOU

TapNow

OpenMAIC

CC-Connect

视频模型

网址

360龙虾卫士

S.H.I.T

ITELLOU

TapNow

OpenMAIC

CC-Connect