Neta Lumina 发布:专为二次元创作打造的高品质图像生成模型

图像模型5个月前发布 小马良
765 0

由捏Ta实验室(Neta.art)训练的 Neta Lumina 是一款专注于二次元风格的高质量图像生成模型。此模型基于上海人工智能实验室 Alpha-VLLM 团队开源的 Lumina-Image-2.0,结合海量优质二次元图像和多语种标签数据,使模型具备出色的提示理解与画面生成能力,适用于插画、海报、分镜、角色设计等多种创作场景。

🔍 核心特性

  •  多场景优化:涵盖 Furry、国风、宠物等多样化风格
  •  丰富角色支持:覆盖热门与冷门设定
  •  自然语言理解能力强:准确解析复杂提示词
  •  原生多语言支持:推荐使用中文、英文、日文进行提示输入

🧠 模型版本说明

目前提供两个版本:

1. 基础模型(Base Model)

  • 训练目标:通用知识学习 + 二次元风格优化
  • 数据集规模:约 1300 万张高质量二次元图像

2. 美学微调模型(Aesthetic Model)

  • 训练方式:在基础模型基础上进一步微调
  • 数据集规模:精选数十万张高美学价值动漫图像
  • 优化方向:提升画面美感、肢体结构准确性与细节表现力

⚙️ 使用指南(How to Use)

本模型基于 Diffusion Transformer 架构(Lumina2 框架),不同于 Stable Diffusion,请根据本文档配置使用环境。

✅ 支持平台

目前仅支持在 ComfyUI 平台运行:

  • 安装最新版 ComfyUI
  • 显存要求:至少 8 GB

📦 模型下载与安装步骤

1. 下载主模型文件

  • 文件名:Neta_Lumina-Beta.pth
  • 存放路径:ComfyUI/models/unet/

2. 文本编码器(Gemma-2B)

  • 文件名:gemma_2_2b_fp16.safetensors(约 5.23 GB)
  • 存放路径:ComfyUI/models/text_encoders/

3. VAE 模型(16通道 FLUX VAE)

  • 文件名:ae.safetensors(约 300 MB)
  • 存放路径:ComfyUI/models/vae/

4. 工作流配置

  • 推荐加载工作流文件:lumina_workflow.json
  • 主要节点包括:
    • UNETLoader:加载主模型
    • VAELoader:加载 VAE 模型
    • CLIPLoader:加载文本编码器
    • 将 Text Encoder 输出连接至采样器的正负向条件端口

🧪 简易合并版(推荐新手使用)

  • 文件名:0624-beta
  • 可直接使用 ComfyUI 默认工作流启动

🎛️ 推荐参数设置

参数推荐值
采样器res_multistep
调度器linear_quadratic
采样步数30
CFG(提示引导强度)4~5.5
分辨率建议1024×1024、768×1532 或 968×1322

📝 提示词指南(Prompt Book)

如需了解如何构建高效提示词,请参考我们的《Neta Anime Lumina 绘图模型提示词指南》,帮助你更好地控制画面风格、角色特征与构图布局。

🚀 开发路线图(Roadmap)

我们将持续优化模型性能与用户体验,未来重点方向包括:

模型层面优化

  • 持续训练基础模型,提升理解和生成能力
  • 迭代美学数据集,增强肢体结构、背景细节与整体画面美观度
  • 开发更智能的打标工具,降低用户创作门槛

生态建设规划

  • 提供 LoRA 训练教程及相关组件
  • 鼓励用户基于开源代码自行微调
  • 开发精细化控制功能(如 Omni Control),实现形象与风格一致化

欢迎开发者参与共建!

📜 许可证与使用声明(License & Disclaimer)

Neta Lumina 遵循 Fair AI Public License 1.0-SD 协议。

如您对模型进行修改、合并或二次开发,请确保将衍生模型开源。

© 版权声明

相关文章

暂无评论

none
暂无评论...