模型 | 第15页 | SD百科导航

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

nano-banana正式版！谷歌发布全新图像模型Gemini 2.5 Flash Image，更精准的 AI 图像编辑

谷歌正在为其 Gemini 聊天机器人引入一项重要升级：全新的 AI 图像模型 Gemini 2.5 Flash Image。该模型不仅提升了图像生成质量，更在编辑精度、角色一致性与多图融合方面实现了...

5个月前

05080

视觉语言模型SmolDocling：以高效的方式实现端到端的多模态文档转换

在数字化时代，文档处理和理解是许多行业和研究领域的核心需求。从学术论文到商业报告，从技术手册到专利文件，文档的高效转换和理解对于信息提取、知识管理和自动化流程至关重要。然而，传统的文档处理方法往往依赖...

多模态模型 # SmolDocling # 文档转换 # 视觉语言模型

11个月前

05080

Amateur Photography：基于Flux Dev的Instagram写实风格LoRA

Amateur Photography [Flux Dev]是一款基于FLUX.1-dev的Instagram写实风格LoRA模型，目前已经推出到v5-final版，此模型更适合生成欧美人物。模型地...

Flux衍生 # Amateur Photography # Flux Dev # Instagram写实风

12个月前

05070

B站推出IndexTTS2：自回归 TTS 模型的持续时间控制与情感表达新突破

在大规模文本转语音（TTS）模型的发展中，自回归与非自回归系统各有优劣。自回归模型虽然在语音自然度方面表现优异，但其逐标记生成机制难以实现对语音持续时间的精确控制。这一缺陷在视频配音等需要严格音画同步...

语音模型 # B站 # IndexTTS2

5个月前

05030

小米推出音频推理模型R1-AQA：强化学习助力机器“听懂”声音背后的逻辑

在大模型时代，人们对机器的期望已经不再局限于简单的语音识别或声音分类，而是希望机器能够具备复杂的推理能力。例如，通过汽车座舱的录音判断车辆是否存在潜在故障，从交响乐中推测作曲家的情绪，或者在地铁站的嘈...

语音模型 # R1-AQA # 小米 # 音频推理模型

11个月前

05030

SameFace Fix：专注于修复Flux模型在生成图像时人物脸型同质化

SameFace Fix是一个基于Flux模型的Lora，专注于修复Flux模型在生成图像时人物脸型同质化的问题。此Lora专为多样化女性外观而设计，文件大小仅4MB，需要注意的是应用此Lora时强度...

Flux衍生 # FLUX模型 # SameFace Fix

12个月前

05020

Moondream 团队推出 Moondream 3 预览版本：轻量架构下的高性能视觉推理模型

Moondream 团队正式推出 Moondream 3 的预览版本——一款基于 9B 参数稀疏混合专家（MoE）架构的新模型，实际激活参数仅为 2B。它在保持极快推理速度和低运行成本的同时，实现了接...

多模态模型 # Moondream 3 # 视觉推理模型

4个月前

05010

Momo XL：基于SDXL的动漫风格模型

Momo XL 是一个基于 Stable Diffusion XL (SDXL) 的动漫风格模型，经过微调后，能够生成具有详细和生动美学的优质动漫风格图像。这款模型专为艺术家和动漫爱好者设计，提供了多...

图像模型 # Momo XL # SDXL # 动漫风格

12个月前

04980

基于 GenAI 的视觉内容创作控制框架ZenCtrl：利用单张主体图像生成多视角、多样化场景的高分辨率图像，无需额外微调

ZenCtrl 是一款基于 GenAI 的视觉内容创作控制框架，专注于利用单张主体图像生成多视角、多样化场景的高分辨率图像，无需额外微调。它通过精细的控制能力和模块化设计，为创作者提供了一个强大且灵活...

图像模型 # OminiControl # ZenCtrl # 图像控制框架

9个月前

04950

Lumiere Alpha：基于 FLUX.1 [dev] 模型打造的微调模型，专注于提高生成图像的现实感

Lumiere Alpha 是由 AIXON Lab 基于 FLUX.1 [dev] 模型打造的一款微调模型。该模型专注于提高生成图像的现实感，同时保持提示的连贯性和原始 FLUX.1-Dev 模型的...

Flux衍生 # FLUX.1-dev # Lumiere Alpha # 微调模型

12个月前

04950

Qwen3Guard发布：阿里通义实验室推出首款安全护栏模型

阿里通义实验室 Qwen 项目组正式推出 Qwen3Guard —— Qwen 家族中首款专为内容安全设计的护栏模型（Safety Guardrail Model）。该模型基于强大的 Qwen3 架...

大语言模型 # Qwen3Guard # 安全护栏模型

4个月前

04940

Jib Mix Flux：微调Flux Dev模型，提升了NSFW能力

Jib Mix Flux是基于开发者的SDXL 数据集，训练的微调Flux Dev模型，此模型合并了Lora，修正了人体结构审查和过度模糊的背景。目前已经推出了V4版本，拥有更好的细节和更出色的艺术风...

Flux衍生 # Flux Dev模型 # Jib Mix Flux

12个月前

04940

加载更多

模型

nano-banana正式版！谷歌发布全新图像模型Gemini 2.5 Flash Image，更精准的 AI 图像编辑

视觉语言模型SmolDocling：以高效的方式实现端到端的多模态文档转换

Amateur Photography：基于Flux Dev的Instagram写实风格LoRA

B站推出IndexTTS2：自回归 TTS 模型的持续时间控制与情感表达新突破

小米推出音频推理模型R1-AQA：强化学习助力机器“听懂”声音背后的逻辑

SameFace Fix：专注于修复Flux模型在生成图像时人物脸型同质化

Moondream 团队推出 Moondream 3 预览版本：轻量架构下的高性能视觉推理模型

Momo XL：基于SDXL的动漫风格模型

基于 GenAI 的视觉内容创作控制框架ZenCtrl：利用单张主体图像生成多视角、多样化场景的高分辨率图像，无需额外微调

Lumiere Alpha：基于 FLUX.1 [dev] 模型打造的微调模型，专注于提高生成图像的现实感

Qwen3Guard发布：阿里通义实验室推出首款安全护栏模型

Jib Mix Flux：微调Flux Dev模型，提升了NSFW能力

新QoderWork

Clawdbot/Moltbot

Situation Monitor

中国科技云数据胶囊

ITELLOU

CutCut

模型

网址

新QoderWork

Clawdbot/Moltbot

Situation Monitor

中国科技云数据胶囊

ITELLOU

CutCut