模型 | 第9页 | SD百科导航

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

字节跳动推出基于Flux的通用框架UNO：支持虚拟试穿、风格化生成、产品设计等功能

字节跳动近日推出了UNO，这是一个强大的通用框架，能够从单一主体到多主体进行定制化演进。UNO不仅展示了出色的泛化能力，还能将多样化的任务统一在一个模型之下，为图像生成领域带来了新的突破。项目主页...

10个月前

06420

Llasa：基于LLaMA语言模型的先进文本转语音（TTS）系统

文本转语音（TTS）技术正成为人机交互领域的重要工具。随着娱乐、无障碍服务、客户服务和教育等行业对语音合成的需求不断增加，市场对逼真、情感丰富且支持多种语言的语音合成技术的需求也在迅速增长。然而，传统...

语音模型 # Llasa # TTS

12个月前

06420

Stable Diffusion 原班人马新公司Black Forest Labs推出全新文生图模型Flux.1系列

今年，随着Stability AI经历了一系列动荡，包括多位主要开发者离职及创始人退出，开源社区对其推出的Stable Diffusion 3 Medium模型也表示不满。在此背景下，Stable D...

Flux衍生 # Flux.1 # Flux.1系列 # Stable Diffusion

12个月前

06410

IDAdapter：根据单张面部照片和文本提示，生成多种风格、角度和表情的个性化图像，而无需在推理阶段进行任何微调

来自北京大学、InsightFace和格灵深瞳推出IDAdapter，它能够根据单张面部照片和文本提示，生成多种风格、角度和表情的个性化图像，而无需在推理阶段进行任何微调。论文 IDAdapter通...

图像模型 # IDAdapter # 个性化图像

12个月前

06410

Fal.ai平台推出新DiT模型AuraFlow：支持文字，百分百开源

Stability AI因为Stable Diffusion 3 Medium模型的许可证问题备受诟病，虽然后来更改了许可证，但此模型在人物尤其是躺倒后人物的糟糕表现还是不受开源社区待见。不少人开始转...

图像模型 # AuraFlow # DiT模型 # Fal.ai

12个月前

06400

字节跳动推出AnimateDiff-Lightning模型：根据文本描述生成视频，还可以视频转视频

字节跳动推出了AnimateDiff-Lightning模型，能够更快地根据文本描述生成视频，比起原来的AnimateDiff模型，速度提升十倍以上。模型地址：https://huggingface...

视频模型 # AnimateDiff-Lightning # 字节跳动

12个月前

06380

蓝莓真身！Black Forest Labs推出FLUX1.1 [pro]和BFL API，生成质量更高速度更快

由Stable Diffusion 原班人马组成的新公司Black Forest Labs于8月份推出全新文生图模型Flux.1系列后，就迅速取代Stability AI成为AI绘画领域最出色的开源公...

Flux衍生 # Black Forest Labs # FLUX1.1 [pro]

12个月前

06260

新型图像抠图方法SEMat：能够在复杂的自然场景中实现更精确的前景对象抠图

近年来，交互式分割模型（如 SAM）在图像分割任务中取得了显著进展。然而，这些模型在应用于交互式抠图任务时面临挑战，尤其是在处理复杂和遮挡场景时。现有的方法通常在合成数据上训练模型，但这些模型难以泛化...

图像模型 # SEMat # 图像抠图

12个月前

06220

线性注意力 + 恒定内存 KV 缓存！SANA-Video：高效生成分钟级高清视频的新一代文生视频模型

在文本到视频（T2V）生成领域，高分辨率、长时长与低延迟三者往往难以兼得。现有大模型虽能生成高质量视频，但动辄数千秒的推理时间与高昂的训练成本严重限制了其落地应用。为此，由英伟达、香港大学、麻省理工...

视频模型 # SANA-Video # 文生视频模型

4个月前

06170

欧美漫画及插画风格SDXL模型：CHEYENNE

_CHEYENNE_是一款专门针对欧美漫画及插画风格生成的SDXL模型。不论你是专业插画家、漫画家，还是热衷于视觉艺术表达的爱好者，CHEYENNE都将为你的创意世界打开全新维度！模型下载地址 CH...

图像模型 # CHEYENNE # SDXL模型 # 插画

12个月前

06160

告别旧版，迎接进化！阿里Qwen团队发布Qwen3-235B-A22B-Instruct-2507

在与社区深入交流并综合反馈后，阿里Qwen团队做出一项重要决策：停止使用混合“思维模式”（Thinking Mode）的训练方式，转而采用 Instruct 与 Thinking 模型分离训练的新策...

大语言模型 # Qwen3-235B-A22B-Instruct-2507

6个月前

06140

AnimePRO FLUX：基于 Flux.1 Shnell 的微调动漫模型

AnimePRO FLUX 是一款基于 Flux.1 Shnell 的微调动漫模型，专为生成高质量的动漫图像而设计。如果你希望使用 Flux 生成动漫艺术但不想受 DEV 版本的许可限制，AnimeP...

Flux衍生 # AnimePRO FLUX # Flux.1 Shnell # 动漫模型

12个月前

06120

加载更多

模型

字节跳动推出基于Flux的通用框架UNO：支持虚拟试穿、风格化生成、产品设计等功能

Llasa：基于LLaMA语言模型的先进文本转语音（TTS）系统

Stable Diffusion 原班人马新公司Black Forest Labs推出全新文生图模型Flux.1系列

IDAdapter：根据单张面部照片和文本提示，生成多种风格、角度和表情的个性化图像，而无需在推理阶段进行任何微调

Fal.ai平台推出新DiT模型AuraFlow：支持文字，百分百开源

字节跳动推出AnimateDiff-Lightning模型：根据文本描述生成视频，还可以视频转视频

蓝莓真身！Black Forest Labs推出FLUX1.1 [pro]和BFL API，生成质量更高速度更快

新型图像抠图方法SEMat：能够在复杂的自然场景中实现更精确的前景对象抠图

线性注意力 + 恒定内存 KV 缓存！SANA-Video：高效生成分钟级高清视频的新一代文生视频模型

欧美漫画及插画风格SDXL模型：CHEYENNE

告别旧版，迎接进化！阿里Qwen团队发布Qwen3-235B-A22B-Instruct-2507

AnimePRO FLUX：基于 Flux.1 Shnell 的微调动漫模型

Clawdbot/Moltbot

Situation Monitor

Higgsfield AI

新QoderWork

Fogsight (雾象)

ITELLOU

模型

网址

Clawdbot/Moltbot

Situation Monitor

Higgsfield AI

新QoderWork

Fogsight (雾象)

ITELLOU