Pusa Wan2.2 V1.0：将开创性的 Pusa 范式扩展到先进的 Wan2.2-T2V-A14B 架构

234 0

Pusa Wan2.2 V1.0 将开创性的 Pusa 范式扩展到先进的 Wan2.2-T2V-A14B 架构，该架构采用 MoE DiT 设计，包含独立的噪声和高噪声模型。这种架构提供了增强的质量控制和生成能力，同时保持了革命性的矢量化时间步适应 (VTA) 方法。

GitHub：https://huggingface.co/RaphaelLiu/Pusa-Wan2.2-V1

一个模型支持各种任务，所有任务均支持 4 步推理，使用 LightX2V：图像到视频、起始-结束帧、视频补全、视频扩展、文本到视频、视频过渡等...

基于 Mochi 微调的开源视频模型Pusa：低成本、高性能的开源视频生成模型
PUSA V1.0：以500 美元成本超越 WAN-I2V-14B 的高效视频生成模型

示例 1：4 步图像到视频

Pusa Wan2.2 V1.0：将开创性的 Pusa 范式扩展到先进的 Wan2.2-T2V-A14B 架构

示例 2：4 步视频扩展

示例 3：4 步起始-结束帧

示例 4：4 步文本到视频

文章版权归作者所有，未经允许请勿转载。

腾讯发布开源视频生成模型—混元文生视频模型HunyuanVideo

视频模型 # HunyuanVideo # 混元文生视频模型 # 腾讯

1年前

04280

挚文集团推出HelloMeme：用于生成表情包视频

视频模型 # HelloMeme # 表情包视频

1年前

04450

浙大 & vivo 联合发布 MagicTryOn：首个基于扩散 Transformer 的视频虚拟试衣框架

视频模型 # MagicTryOn # Wan2.1 # 视频虚拟试衣

9个月前

05430

LightX2V：轻量级视频生成推理框架，统一支持多种模态输入

视频模型 # LightX2V # 视频生成

8个月前

02760

暂无评论

暂无评论...

Pusa Wan2.2 V1.0：将开创性的 Pusa 范式扩展到先进的 Wan2.2-T2V-A14B 架构

腾讯发布混元世界模型 - Voyager：单图生成 3D 场景，实现长距离沉浸式探索

新型视频合成方法GenCompositor：实现轨迹可控的视频级前景融合

相关文章

腾讯发布开源视频生成模型—混元文生视频模型HunyuanVideo

挚文集团推出HelloMeme：用于生成表情包视频

浙大 & vivo 联合发布 MagicTryOn：首个基于扩散 Transformer 的视频虚拟试衣框架

LightX2V：轻量级视频生成推理框架，统一支持多种模态输入

暂无评论

文章

新Anthropic 发布 Claude Code Channels：原生支持 Telegram/Discord，无需自建即可实现“随时随地”代码协作

LTX-2.3 提示词终极指南：从“抽卡”到“导演”，解锁原生视频生成的掌控力

新智谱 GLM-5-Turbo 闭源引发担忧？官方回应：别慌，GLM-5.1 即将开源

新小米 Xiaomi miclaw 封测扩容：新增小米 15/Ultra/MIX Flip2 等机型，国内首个手机端“龙虾”Agent 来了

Stable Diffusion 中的CFG Scale是什么？

英伟达 GDC 重磅更新：ComfyUI 新增“应用模式”与 RTX 超分，本地 AI 视频生成效率提升 2.5 倍

S.H.I.T

OpenMAIC

悟空

Tripo

OpenCut

CanIRun.ai

Pusa Wan2.2 V1.0：将开创性的 Pusa 范式扩展到先进的 Wan2.2-T2V-A14B 架构

腾讯发布混元世界模型 - Voyager：单图生成 3D 场景，实现长距离沉浸式探索

新型视频合成方法GenCompositor：实现轨迹可控的视频级前景融合

相关文章

文章

标签云

网址

S.H.I.T

OpenMAIC

悟空

Tripo

OpenCut

CanIRun.ai