黑森林实验室(Black Forest Labs, BFL)是一家成立于2024年的AI公司,总部位于德国弗莱堡。公司由Stable Diffusion的原始开发者之一Robin Rombach共同创立,核心团队成员大多来自Stability AI。凭借其在8月份推出的全新文生图模型Flux.1系列,BFL迅速崛起,成为AI绘画领域最出色的开源公司之一。Flux.1系列模型也取代了SD系列模型,成为开源社区中最热门的AI绘画模型。
由于受到开源社区的青睐,FLUX.1系列模型拥有众多变体和第三方扩展模型。这些扩展不仅丰富了模型的功能,还为开发者提供了更多选择和灵活性。今天就给大盘点一下目前已推出的FLUX.1系列模型、量化版本等,此盘点可能无法完全涵盖所有可用模型。如有新模型推出,会在第一时间分享给大家。(参考)
核心模型
- BFL Hugging Face: https://huggingface.co/black-forest-labs
*TFlux的Pro版本仅以API格式提供,因此没有可用的下载链接
模型 | 描述 | 许可证 |
---|---|---|
FLUX.1 [schnell] | 为 1-4 步高质量图像生成进行了速度优化。完全开源,遵循 Apache 许可证。 | apache-2.0 |
FLUX.1 [dev] | 提供的性能接近 Flux.1 [Pro],开放权重在封闭但宽松的许可下提供(不是开源的)。 | Non-Commercial License |
FLUX.1 [pro] | 标准分辨率,商业级输出 | |
FLUX1.1 [pro] | 更快的速度和更好的图像质量 | |
FLUX1.1 [pro] Ultra/Raw | Ultra 支持 4MP 分辨率;Raw 生成逼真的输出 |
FLUX Tools
结构引导模型
FLUX结构引导模型利用输入的边缘图或深度图来创建精确、结构感知的图像。
LoRA微调模型
LoRA(低秩适应)模型非常适合在资源受限的环境中进行个性化微调。
- Canny LoRA: 边缘引导,适合资源受限的环境
- Depth LoRA: 基于深度输入的高效微调
图像变体生成模型
这些模型允许用户创建输入图像的变体,实现灵活的创意工作流程。
- Redux [dev/pro]: 在保留原始结构的同时创建图像变体
- Redux Ultra: 可调整宽高比的超高分辨率变体
图像修复模型
这些模型旨在根据文本描述修复或扩展图像。
- Fill [dev/pro]: 专业精度用于修复或扩展图像
基于官方 Flux 的量化模型
BFL及其社区为低资源环境开发了FLUX模型的优化版本。这些包括GGUF和FP8格式、蒸馏模型和量化模型,为开发者提供更多灵活性。
模型 | 描述 | 下载 |
---|---|---|
GGUF (Dev/Schnell) GGUF | 低显存格式 | city96 |
FP8 (Dev/Schnell) FP8 | 针对速度/显存使用进行了优化 | Comfy Org / Kijai |
BNB NF4 (Dev) | 量化以加快推理速度 | lllyasviel |
Fill GGUF (Dev) | 低显存格式 | YarvixPA |
不同参数模型
模型 | 参数 | 描述 | 下载 |
---|---|---|---|
Lite Alpha | 8B | 为了效率而精炼,减少显存使用 | Freepik |
Heavy | 17B | 一个使用LLM风格层合并的 12B Flux.1-dev 的 17B 自合并版本 | city96 |
Flux-mini | 3.2B | 轻量级推理和减少资源使用而设计的 Flux 模型的一个迷你版本 | TencentARC |
由开源社区创建版本
模型 | 描述 | 下载 |
---|---|---|
flux-dev-de-distill | Flux.1-dev 的一个变体,它去除了简化的引导,转而使用完整的CFG以获得更好的灵活性。这可能会提高输出质量,但速度较慢,并且需要自定义脚本才能使用 | nyanko7/TheYuriLover/GGUF |
LibreFLUX | Apache 2.0 许可的 FLUX.1-schnell 版本。它支持完整的 T5 上下文长度,并移除了美学微调和 DPO 调整。该模型针对图像生成进行了优化,推荐的 CFG 比例为 2.0-5.0。它可以使用 Optimum-Quanto 进行量化,以减少 VRAM 需求,并支持使用 SimpleTuner 进行微调,使其适合 VRAM 需求较低的用户。 | jimmycarter |
OpenFLUX.1 | 开源模型基于 FLUX.1-schnell,它去除了蒸馏过程并支持无分类器指导(CFG),推荐的 CFG 值为 3.5。该模型可免费使用和微调,适合开发者创建自定义应用程序 | ostris |
FluxBooru v0.3 | 模型训练于 SFW booru 图片、美学照片和解剖学数据集。推荐设置:20-25 步,CFG 5-6(CFG 3.5 表现也很好),由 terminusresearch 和 ptx0 创建 | Civitai |
Shuttle 3.1 | 基于 Flux.1 Schnell 构建,仅用4到6个步骤从文本提示中创建详细且具有美感的图像。它在图像质量、排版、理解复杂提示以及资源效率方面提供了增强的性能 | shuttleai |
Qwen2vl-Flux | 跨模态图像生成模型将Qwen2VL的视觉语言理解能力与FLUX框架相结合,实现了更精确和上下文感知的图像生成 | Djrango |
微调版本
模型 | 描述 | 下载 |
---|---|---|
AWPortrait-FL | 基于FLUX.1-dev微调,在构图和细节处理上都有了显著提升,尤其是在皮肤质感的呈现上,更加细致入微、栩栩如生 | DynamicWang |
PixelWave | 基于FLUX.1-dev和Schnell的微调FLUX模型,非常适合艺术和摄影风格,黑色和深色图像输出更可靠,手部问题更少 | Civitai |
Mann-E FLUX[Dev] | 微调Flux Dev模型,在写实与电影风格表现较好 | mann-e |
Jib Mix Flux | 修正了人体结构审查和过度模糊的背景,并提升了 NSFW的能力 | Civitai |
AnimePRO FLUX | 基于 Flux.1 Shnell 的微调动漫模型,专为生成高质量的动漫图像而设计 | Civitai |
第三方扩展模型
官方推出的FLUX Tools其实就是Controlnet和ip adapter模型,而在官方之前开源社区就已经有非常多的开发者推出此类模型,大家根据对比生成效果来选择对应模型。
XLabs-AI
- flux-controlnet-collections:XLabs-AI推出了三款FLUX Controlnet模型:Canny、HED和Depth,目前都已发布了v3版本,它们还发布了相对应的ComfyUI节点。
- flux-ip-adapter-v2:基于FLUX.1-dev的IP-Adapter 模型,支持支持 512 和 1024 分辨率的风格迁移。使用该模型需要在ComfyUI安装x-flux-comfyui插件,需要注意的是此模型对于显存要求很高,至少16G显存才能运行该模型。
Jasper AI
- Flux.1-dev-Controlnet-Surface-Normals:用于表面法线贴图。
- Flux.1-dev-Controlnet-Depth:用于深度图引导的精确生成
- Flux.1-dev-Controlnet-Upscaler:用于将低分辨率图像图进行高清放大
阿里妈妈
- FLUX.1-dev-Controlnet-Inpainting-Beta:阿里妈妈旗下Creative团队推出FLUX-Controlnet-Inpainting模型,这是 FLUX-dev 下的重绘 Controlnet模型,能很好的将图像中的蒙版区域重绘并完美融入。
- FLUX.1-Turbo-Alpha:基于FLUX.1-dev模型的8步蒸馏版lora,该模型可以用于T2I、Inpainting controlnet和其他FLUX相关模型。
InstantX、Shakker Labs
- FLUX.1-dev-IP-Adapter :基于FLUX.1-dev模型的IP-Adapter,在 Black Forest Labs 发布了功能类似的 FLUX.1 Redux 后,InstantX就迅速公开了此模型。
- FLUX.1-dev-Controlnet-Union:这是一个Controlnet融合模型,支持7种控制模式,包括canny、tile、depth、blur、pose、gray、low quality
- FLUX.1-dev-Controlnet-Canny:基于边缘映射的结构化生成
- FLUX.1-dev-ControlNet-Depth:用于深度图引导的精确生成
评论0