由捏Ta实验室(Neta.art)训练的 Neta Lumina 是一款专注于二次元风格的高质量图像生成模型。此模型基于上海人工智能实验室 Alpha-VLLM 团队开源的 Lumina-Image-2.0,结合海量优质二次元图像和多语种标签数据,使模型具备出色的提示理解与画面生成能力,适用于插画、海报、分镜、角色设计等多种创作场景。
- 模型:https://huggingface.co/neta-art/Neta-Lumina
- Demo:https://huggingface.co/spaces/neta-art/NetaLumina_T2I_Playground

🔍 核心特性
- ✅ 多场景优化:涵盖 Furry、国风、宠物等多样化风格
- ✅ 丰富角色支持:覆盖热门与冷门设定
- ✅ 自然语言理解能力强:准确解析复杂提示词
- ✅ 原生多语言支持:推荐使用中文、英文、日文进行提示输入

🧠 模型版本说明
目前提供两个版本:
1. 基础模型(Base Model)
- 训练目标:通用知识学习 + 二次元风格优化
- 数据集规模:约 1300 万张高质量二次元图像
2. 美学微调模型(Aesthetic Model)
- 训练方式:在基础模型基础上进一步微调
- 数据集规模:精选数十万张高美学价值动漫图像
- 优化方向:提升画面美感、肢体结构准确性与细节表现力
⚙️ 使用指南(How to Use)
本模型基于 Diffusion Transformer 架构(Lumina2 框架),不同于 Stable Diffusion,请根据本文档配置使用环境。
✅ 支持平台
目前仅支持在 ComfyUI 平台运行:
- 安装最新版 ComfyUI
- 显存要求:至少 8 GB

📦 模型下载与安装步骤
1. 下载主模型文件
- 文件名:
Neta_Lumina-Beta.pth - 存放路径:
ComfyUI/models/unet/
2. 文本编码器(Gemma-2B)
- 文件名:
gemma_2_2b_fp16.safetensors(约 5.23 GB) - 存放路径:
ComfyUI/models/text_encoders/
3. VAE 模型(16通道 FLUX VAE)
- 文件名:
ae.safetensors(约 300 MB) - 存放路径:
ComfyUI/models/vae/
4. 工作流配置
- 推荐加载工作流文件:
lumina_workflow.json - 主要节点包括:
UNETLoader:加载主模型VAELoader:加载 VAE 模型CLIPLoader:加载文本编码器- 将 Text Encoder 输出连接至采样器的正负向条件端口
🧪 简易合并版(推荐新手使用)
- 文件名:
0624-beta - 可直接使用 ComfyUI 默认工作流启动
🎛️ 推荐参数设置
| 参数 | 推荐值 |
|---|---|
| 采样器 | res_multistep |
| 调度器 | linear_quadratic |
| 采样步数 | 30 |
| CFG(提示引导强度) | 4~5.5 |
| 分辨率建议 | 1024×1024、768×1532 或 968×1322 |
📝 提示词指南(Prompt Book)
如需了解如何构建高效提示词,请参考我们的《Neta Anime Lumina 绘图模型提示词指南》,帮助你更好地控制画面风格、角色特征与构图布局。
🚀 开发路线图(Roadmap)
我们将持续优化模型性能与用户体验,未来重点方向包括:
模型层面优化
- 持续训练基础模型,提升理解和生成能力
- 迭代美学数据集,增强肢体结构、背景细节与整体画面美观度
- 开发更智能的打标工具,降低用户创作门槛
生态建设规划
- 提供 LoRA 训练教程及相关组件
- 鼓励用户基于开源代码自行微调
- 开发精细化控制功能(如 Omni Control),实现形象与风格一致化
欢迎开发者参与共建!
📜 许可证与使用声明(License & Disclaimer)
Neta Lumina 遵循 Fair AI Public License 1.0-SD 协议。
如您对模型进行修改、合并或二次开发,请确保将衍生模型开源。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...















