AnimateDiff-Lightning

预计阅读时间1 分 407 views

AnimateDiff-Lightning是字节跳动基于AnimateDiff推出的一款极速的文本到视频生成模型,其视频生成速度比原版AnimateDiff快十倍以上。参考:字节跳动推出AnimateDiff-Lightning模型:根据文本描述生成视频,还可以视频转视频

AnimateDiff-Lightning

此模型是从AnimateDiff SD1.5 v2中提炼而来,字节推出了包含1步、2步、4步和8步等不同蒸馏步骤的模型,其中1步模型则主要是供研究之用,大家在本地可使用2步、4步和8步模型。字节还贴心的推出了ComfyUI工作流,让大家直接导入即可使用。

推荐配置

在使用AnimateDiff-Lightning时,结合风格化基础模型能够获得最佳效果。字节特别推荐以下基础模型:

写实动漫/卡通
epiCRealismToonYou
Realistic VisionIMP
DreamShaperMistoon Anime
AbsoluteRealityDynaVision
MajicMix RealisticRCNZ Cartoon 3d
MajicMix Reverie

此外,您可以根据自己的需求探索不同的设置。在实际应用中,在2步模型上使用3个推理步骤可以产生更出色的结果。同时,某些基础模型在使用CFG(配置)时会呈现出更好的效果。

AnimateDiff-Lightning

另外,字节还推荐大家使用Motion LoRAs,因为它们能产生更为强烈的动态效果。为避免生成视频中出现水印,建议将Motion LoRAs的强度设置在0.7至0.8之间。


如何在ComfyUI上使用AnimateDiff-Lightning?

文生视频

1、下载官方的工作流,直接拖入ComfyUI界面,此工作流主要使用两款插件,大家可以使用ComfyUI-Manager来安装插件,插件安装可参考:插件安装

2、下载AnimateDiff-Lightning模型,将其放入custom_nodes/ComfyUI-AnimateDiff-Evolved/models文件夹下

  • 确保加载与推理步数相对应的正确的Animatediff-Lightning模型
  • 您可以自由探索不同的基础模型
  • 确保使用与加载的模型相对应的正确的推理步数
  • 默认采样器是Euler,采用sgm_uniform调度器。
  • 默认CFG 1.0是最快的,并且会忽略负面提示。请随意探索其他CFG值。

AnimateDiff-Lightning

3、如果想要使用Motion LoRAs增加动态效果,只需在增加一个动态lora加载器即可

AnimateDiff-Lightning

视频转视频

1、下载官方的工作流,直接拖入ComfyUI界面,此工作流主要使用四款插件,大家可以使用ComfyUI-Manager来安装插件。

2、下载AnimateDiff-Lightning模型,将其放入custom_nodes/ComfyUI-AnimateDiff-Evolved/models文件夹下;下载ControlNet OpenPose 里的control_v11p_sd15_openpose.pth模型放到 /models/controlnet文件夹下

3、此工作流还需要使用两款模型dw-ll_ucoco.onnx和yolox_l.onnx,这两款模型需要放到ComfyUI\custom_nodes\comfyui_controlnet_aux\ckpts文件夹下,但具体位置还不太相同

  • dw-ll_ucoco.onnx需要放到ckpts\hr16\UnJIT-DWPose
  • yolox_l.onnx需要放到ckpts\yzd-v\DWPose

4、使用此工作流还有几个要点需要注意,那就是视频的尺寸与帧率

  • 视频不应该太长或分辨率太高,毕竟AnimateDiff-Lightning模型是基于SD1.5
  • 设置帧率以匹配您的输入视频,这样可以让音频与输出视频相匹配
  • DWPose将在其首次运行时自行下载模型
  • DWPose可能会在用户界面上卡住,但实际上仍在后台运行,请检查ComfyUI日志和您的输出文件夹

AnimateDiff-Lightning

以上所需模型,如果无法直接下载,可从本人网盘里下载:

暂无评论

none
暂无评论...
Google AI Studio

Google AI Studio

Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
Higgsfield AI

Higgsfield AI

Higgsfield AI平台支持文生图和图生视频,近期对图生视频功能进行了全面升级,专为追求高质量、风格化内容创作并渴望真正电影级操控的创意人士打造——无论是MV导演、商业片制作人、AI创作者,还是社交媒体叙事者。
朱雀大模型检测

朱雀大模型检测

腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
Open ASR 排行榜

Open ASR 排行榜

Open ASR 排行榜 对 Hugging Face Hub 上的语音识别模型进行排名和评估。我们报告平均 WER(字错误率)(⬇️ 越低越好)和 RTFx(实时因子)(⬆️ 越高越好),模型根据其平均 WER 从低到高进行排名。
Tripo

Tripo

Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
MiniMax-MCP

MiniMax-MCP

MiniMax 的 MCP 服务器为开发者提供了一个强大且灵活的工具,帮助您快速构建支持语音、视频和图像生成的智能应用。无论是个人创作者还是企业开发者,都可以通过简单的配置,将 MiniMax 的 AI 能力无缝集成到您的项目中。
查看完整榜单