随着SD3.5、Flux、HunyuanVideo等模型在开源社区的广泛支持,微调或训练Lora的需求愈发凸显。相较于早期的SD1.5和SDXL时代,如今已有更多工具支持这类训练任务。今天为大家梳理当前主流的模型训练工具,帮助大家根据个人需求挑选最适合的工具。
本地训练工具推荐
1. Kohya_ss
-
简介:Kohya_ss 是一款专为SD系列及FLUX模型设计的开源训练工具,它通过Gradio提供的图形用户界面(GUI)简化了sd-scripts的使用流程,使用户可以更直观地设置参数并启动训练,你也可以直接使用sd-scripts通过命令行来进行模型的微调和Lora训练。 -
链接:sd-scripts | Kohya_ss -
特点:跨平台兼容、用户友好、丰富的功能配置

2. AI Toolkit
-
简介:这款工具不仅适用于多种AI模型的训练与部署,还特别针对FLUX模型进行了优化。它可以帮助用户生成高质量的图像,通过微调SD系列和FLUX模型,用户可以根据自己的需求生成特定风格的图像。此外,AI Toolkit还集成了来自Azure AI Studio和Hugging Face的工具和模型,帮助开发者快速下载、微调、测试和部署AI模型 -
链接:AI Toolkit -
特点:灵活的模型选择、高效的资源管理、直观的操作界面

3. OneTrainer
-
简介:OneTrainer 是一个针对模型训练需求的一站式解决方案。它支持多种模型,如 FLUX、Stable Diffusion、SDXL 等,并提供了多种训练方法,包括完全微调、LoRA、嵌入等。OneTrainer 还具备自动数据增强、张量板集成、多提示训练等功能。 -
链接:OneTrainer -
特点:多模型支持、易于上手、优化的训练流程

4. FineTrainers
-
简介:FineTrainers 是一个专注于视频模型训练的开源工具,最初名为 cogvideox-factory,现已更名为 FineTrainers。该项目的主要目标是支持各种模型的 LoRA训练,尤其是与 Hugging Face 的 Diffusers 库兼容的模型,如LTX Video、CogVideoX、Mochih和Hunyuan Video。这是一款命令行工具,如果你想要一个用户界面,可以第三方基于此工具开发的finetrainers-ui -
链接:FineTrainers | finetrainers-ui -
特点:视频模型训练、支持多种模型、命令行与UI双模式

5. FluxGym
-
简介:由CocktailPeanut开发,FluxGym是一个为低显存环境定制的网页界面训练工具,适合在普通硬件上进行FLUX LoRA模型的训练,支持 12GB、16GB 和 20GB 的显存配置。 -
链接:FluxGym -
特点:简化的UI、低显存支持、强大的兼容性

6. diffusion-pipe
-
简介:一个实验性质的训练脚本,专注于Flux、LTX-Video 和 HunyuanVideo的LoRA模型训练,提供了流水线并行、完全微调支持等多项特性。 -
链接:diffusion-pipe -
特点:分布式计算、性能监控、扩展性强
7. ComfyUI-FluxTrainer
-
简介:ComfyUI-FluxTrainer让用户体验在熟悉的ComfyUI环境中进行LoRA模型训练的乐趣,同时保持与推理相同的模型和Python环境。 -
链接:ComfyUI-FluxTrainer -
特点:用户友好的界面、专注于LoRA训练、良好的兼容性

8. Musubi Tuner
-
简介:Musubi Tuner是专门用于训练HunyuanVideo LoRA模型的工具,尽管目前主要支持图像训练(利用图片来训练LoRA模型),但其内存高效的设计使其适合大显存环境。开发者TTPlanet已经基于此工具打造了一个带GUI的一键包,可惜的是没有发布在GitHub上,而是放在了百度网盘上。 -
链接:Musubi Tuner|一键包|Gui_for_musubi-tuner -
特点:内存高效、Windows兼容、未来扩展至视频训练
9.HunyuanVideo-Training
- 简介:HunyuanVideo-Training 并不是一个全面的多合一训练工具,而是一个基础框架,旨在支持简单的单文件训练脚本。它的设计灵感来源于 diffusers 示例中的训练脚本,目标是让代码易于阅读和修改,同时避免过多的抽象化阻碍开发者的理解。尽管如此,它仍然包含了一些必要的优化,使得开发者无需租用昂贵的云计算机即可运行。
- 链接:HunyuanVideo-Training
- 特点:低显存需求,显存使用量小于 16 GB;可以在 Windows 系统上原生运行,无需复杂的环境配置或依赖虚拟化技术
在线训练平台概览
对于没有高性能显卡的用户来说,在线训练平台是一个理想的选择。这些平台提供了不同程度的GPU资源租用服务,方便快捷,无需担心硬件问题。
-
Liblibai:国内最大的绘画模型共享网站,提供中文界面的Lora训练服务,附带免费额度,非常适合初学者。

-
Civitai:海外知名的绘画模型共享平台,同样提供Lora训练服务,对素材内容限制较少。

如何选择?
选择本地训练工具还是在线平台,取决于你的硬件条件和个人偏好。如果你拥有高性能显卡(如英伟达4090),那么AI Toolkit、OneTrainer、diffusion-pipe等本地工具会是不错的选择;而对于显卡性能有限的用户,FluxGym这样的工具则更为合适。至于在线平台的选择,则需要综合考虑成本和网络连接稳定性。此外,利用StabilityMatrix、Pinokio等一键安装工具可以简化安装过程,让你更快地上手模型训练。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...