模型 | 第82页 | SD百科导航

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型

排序

发布更新浏览点赞

Yamato-e style：基于FLUX.1-dev的日本浮世绘风格LoRA

Yamato-e style是一款基于FLUX.1-dev的日本浮世绘风格LoRA，适合生成风景图，当你描述角色和背景场景时，它效果最好。模型：https://civitai.com/models...

Flux衍生 # FLUX.1-dev # Lora # Yamato-e style

11个月前

04690

SameFace Fix：专注于修复Flux模型在生成图像时人物脸型同质化

SameFace Fix是一个基于Flux模型的Lora，专注于修复Flux模型在生成图像时人物脸型同质化的问题。此Lora专为多样化女性外观而设计，文件大小仅4MB，需要注意的是应用此Lora时强度...

Flux衍生 # FLUX模型 # SameFace Fix

11个月前

04980

智谱AI推出图像生成模型 CogView3 以及 CogView-3Plus

清华和智谱 AI的研究团队开源了图像生成模型 CogView3 以及CogView-3-Plus ，CogView3 是一个基于级联扩散的文本生成图像系统，采用了接力扩散（relay diffusio...

图像模型 # CogView-3Plus # CogView3 # 图像生成

11个月前

05860

Retro Comic Flux：基于FLUX.1-dev的美式复古漫画风格LoRA

Retro Comic Flux是一款基于FLUX.1-dev的美式复古漫画风格LoRA模型，主要擅长处理人物形象，当你描述角色和背景场景时，它效果最好。模型下载（Civitai）：https...

Flux衍生 # Lora # Retro Comic Flux # 复古漫画

11个月前

05540

Amateur Photography：基于Flux Dev的Instagram写实风格LoRA

Amateur Photography [Flux Dev]是一款基于FLUX.1-dev的Instagram写实风格LoRA模型，目前已经推出到v5-final版，此模型更适合生成欧美人物。模型地...

Flux衍生 # Amateur Photography # Flux Dev # Instagram写实风

11个月前

05070

智源研究院推出全新多模态系列模型Emu3

智源研究院推出Emu3，这是一个全新的多模态系列模型，它仅使用下一个词元（Token）预测这一建模范式进行训练，达到了最先进的水平。Emu3 通过一个 Transformer 模型在视频、图像和文本令...

多模态模型 # Emu3 # 多模态模型 # 智源研究院

11个月前

04210

Meta发布 Llama 3.2 模型：从轻量级纯文本模型（1B 和 3B）到中小型多模态模型（11B 和 90B）

Meta于9月25日正式推出了Llama 3.2模型，这款新模型以其开放性和可定制性为特点，旨在满足开发者在边缘人工智能和视觉处理领域的多样化需求。Llama 3.2 结合了多模态视觉能力和轻量化设计...

多模态模型 # Llama 3.2 # Meta

11个月前

04150

新型多模态模型家族Molmo：专门设计用于理解和处理图像和文本数据

华盛顿大学和艾伦人工智能研究所的研究人员推出新型多模态模型家族Molmo，这些模型专门设计用于理解和处理图像和文本数据。Molmo的目标是提供一个最先进的、开放的多模态模型，Molmo的关键创新是一个...

多模态模型 # Molmo # 多模态模型

11个月前

04480

多模态大语言模型Qwen2-VL-7B-Captioner-Relaxed：经过指令调整的Qwen2-VL-7B-Instruct版本

Qwen2-VL-7B-Captioner-Relaxed 是 Qwen2-VL-7B-Instruct 的一个经过指令调整的版本，它是一个多模态大语言模型。这个经过精细调整的版本是基于一个为文生图模...

多模态模型 # Qwen2-VL-7B-Captioner-Relaxed # 多模态大语言模型

11个月前

05580

Simple Vector Flux：基于FLUX.1-dev的矢量动画LoRA 模型

Simple Vector Flux是一款基于FLUX.1-dev的LoRA 模型，它在一组精选的约50张经典矢量风格的合成图像上训练的。触发关键词：v3ct0r、vector 推荐强度：0.6 ...

Flux衍生 # FLUX.1-dev # LoRA 模型 # Simple Vector Flux

11个月前

04680

GOT-OCR-2.0模型：专为识别和处理各种字符而设计的OCR模型

GOT-OCR 模型是一个参数量达 580M 的OCR系统，专为识别和处理各种字符而设计。该模型配备了高压缩编码器和长上下文解码器，能够精准处理各种场景和文档风格的图像。它支持多页和动态分辨率的 OC...

多模态模型 # GOT-OCR-2.0 # OCR模型

11个月前

04590

阿里妈妈旗下Creative团队推出重绘 Controlnet模型FLUX-Controlnet-Inpainting

阿里妈妈旗下Creative团队推出FLUX-Controlnet-Inpainting模型，这是 FLUX-dev 下的重绘 Controlnet模型，能很好的将图像中的蒙版区域重绘并完美融入。 G...

Flux衍生 # FLUX-Controlnet-Inpainting # 阿里妈妈

11个月前

04290

加载更多

模型

Yamato-e style：基于FLUX.1-dev的日本浮世绘风格LoRA

SameFace Fix：专注于修复Flux模型在生成图像时人物脸型同质化

智谱AI推出图像生成模型 CogView3 以及 CogView-3Plus

Retro Comic Flux：基于FLUX.1-dev的美式复古漫画风格LoRA

Amateur Photography：基于Flux Dev的Instagram写实风格LoRA

智源研究院推出全新多模态系列模型Emu3

Meta发布 Llama 3.2 模型：从轻量级纯文本模型（1B 和 3B）到中小型多模态模型（11B 和 90B）

新型多模态模型家族Molmo：专门设计用于理解和处理图像和文本数据

多模态大语言模型Qwen2-VL-7B-Captioner-Relaxed：经过指令调整的Qwen2-VL-7B-Instruct版本

Simple Vector Flux：基于FLUX.1-dev的矢量动画LoRA 模型

GOT-OCR-2.0模型：专为识别和处理各种字符而设计的OCR模型

阿里妈妈旗下Creative团队推出重绘 Controlnet模型FLUX-Controlnet-Inpainting

CutCut

Fogsight (雾象)

NotebookLM

Higgsfield AI

Zoom Earth

Tripo

模型

网址

CutCut

Fogsight (雾象)

NotebookLM

Higgsfield AI

Zoom Earth

Tripo