SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    模型

    共 1055 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型
    排序
    发布更新浏览点赞
    Yamato-e style:基于FLUX.1-dev的日本浮世绘风格LoRA

    Yamato-e style:基于FLUX.1-dev的日本浮世绘风格LoRA

    Yamato-e style是一款基于FLUX.1-dev的日本浮世绘风格LoRA,适合生成风景图,当你描述角色和背景场景时,它效果最好。 模型:https://civitai.com/models...
    Flux衍生# FLUX.1-dev# Lora# Yamato-e style
    11个月前
    04690
    SameFace Fix:专注于修复Flux模型在生成图像时人物脸型同质化

    SameFace Fix:专注于修复Flux模型在生成图像时人物脸型同质化

    SameFace Fix是一个基于Flux模型的Lora,专注于修复Flux模型在生成图像时人物脸型同质化的问题。此Lora专为多样化女性外观而设计,文件大小仅4MB,需要注意的是应用此Lora时强度...
    Flux衍生# FLUX模型# SameFace Fix
    11个月前
    04980
    智谱AI推出图像生成模型 CogView3 以及  CogView-3Plus

    智谱AI推出图像生成模型 CogView3 以及  CogView-3Plus

    清华和智谱 AI的研究团队开源了图像生成模型 CogView3 以及CogView-3-Plus ,CogView3 是一个基于级联扩散的文本生成图像系统,采用了接力扩散(relay diffusio...
    图像模型# CogView-3Plus# CogView3# 图像生成
    11个月前
    05860
    Retro Comic Flux:基于FLUX.1-dev的美式复古漫画风格LoRA

    Retro Comic Flux:基于FLUX.1-dev的美式复古漫画风格LoRA

    Retro Comic Flux是一款基于FLUX.1-dev的美式复古漫画风格LoRA模型,主要擅长处理人物形象,当你描述角色和背景场景时,它效果最好。 模型下载(Civitai):https...
    Flux衍生# Lora# Retro Comic Flux# 复古漫画
    11个月前
    05540
    Amateur Photography:基于Flux Dev的Instagram写实风格LoRA

    Amateur Photography:基于Flux Dev的Instagram写实风格LoRA

    Amateur Photography [Flux Dev]是一款基于FLUX.1-dev的Instagram写实风格LoRA模型,目前已经推出到v5-final版,此模型更适合生成欧美人物。 模型地...
    Flux衍生# Amateur Photography# Flux Dev# Instagram写实风
    11个月前
    05070
    智源研究院推出全新多模态系列模型Emu3

    智源研究院推出全新多模态系列模型Emu3

    智源研究院推出Emu3,这是一个全新的多模态系列模型,它仅使用下一个词元(Token)预测这一建模范式进行训练,达到了最先进的水平。Emu3 通过一个 Transformer 模型在视频、图像和文本令...
    多模态模型# Emu3# 多模态模型# 智源研究院
    11个月前
    04210
    Meta发布 Llama 3.2 模型:从 轻量级纯文本模型(1B 和 3B)到 中小型多模态模型(11B 和 90B)

    Meta发布 Llama 3.2 模型:从 轻量级纯文本模型(1B 和 3B)到 中小型多模态模型(11B 和 90B)

    Meta于9月25日正式推出了Llama 3.2模型,这款新模型以其开放性和可定制性为特点,旨在满足开发者在边缘人工智能和视觉处理领域的多样化需求。Llama 3.2 结合了多模态视觉能力和轻量化设计...
    多模态模型# Llama 3.2# Meta
    11个月前
    04150
    新型多模态模型家族Molmo:专门设计用于理解和处理图像和文本数据

    新型多模态模型家族Molmo:专门设计用于理解和处理图像和文本数据

    华盛顿大学和艾伦人工智能研究所的研究人员推出新型多模态模型家族Molmo,这些模型专门设计用于理解和处理图像和文本数据。Molmo的目标是提供一个最先进的、开放的多模态模型,Molmo的关键创新是一个...
    多模态模型# Molmo# 多模态模型
    11个月前
    04480
    多模态大语言模型Qwen2-VL-7B-Captioner-Relaxed:经过指令调整的Qwen2-VL-7B-Instruct版本

    多模态大语言模型Qwen2-VL-7B-Captioner-Relaxed:经过指令调整的Qwen2-VL-7B-Instruct版本

    Qwen2-VL-7B-Captioner-Relaxed 是 Qwen2-VL-7B-Instruct 的一个经过指令调整的版本,它是一个多模态大语言模型。这个经过精细调整的版本是基于一个为文生图模...
    多模态模型# Qwen2-VL-7B-Captioner-Relaxed# 多模态大语言模型
    11个月前
    05580
    Simple Vector Flux:基于FLUX.1-dev的矢量动画LoRA 模型

    Simple Vector Flux:基于FLUX.1-dev的矢量动画LoRA 模型

    Simple Vector Flux是一款基于FLUX.1-dev的LoRA 模型,它在一组精选的约50张经典矢量风格的合成图像上训练的。 触发关键词:v3ct0r、vector 推荐强度:0.6 ...
    Flux衍生# FLUX.1-dev# LoRA 模型# Simple Vector Flux
    11个月前
    04680
    GOT-OCR-2.0模型:专为识别和处理各种字符而设计的OCR模型

    GOT-OCR-2.0模型:专为识别和处理各种字符而设计的OCR模型

    GOT-OCR 模型是一个参数量达 580M 的OCR系统,专为识别和处理各种字符而设计。该模型配备了高压缩编码器和长上下文解码器,能够精准处理各种场景和文档风格的图像。它支持多页和动态分辨率的 OC...
    多模态模型# GOT-OCR-2.0# OCR模型
    11个月前
    04590
    阿里妈妈旗下Creative团队推出重绘 Controlnet模型FLUX-Controlnet-Inpainting

    阿里妈妈旗下Creative团队推出重绘 Controlnet模型FLUX-Controlnet-Inpainting

    阿里妈妈旗下Creative团队推出FLUX-Controlnet-Inpainting模型,这是 FLUX-dev 下的重绘 Controlnet模型,能很好的将图像中的蒙版区域重绘并完美融入。 G...
    Flux衍生# FLUX-Controlnet-Inpainting# 阿里妈妈
    11个月前
    04290
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
     CutCut

     CutCut

    CutCut是一个视频下载与剪辑工具,支持从 YouTube、Bilibili 等主流平台直接按章节或自定义时间范围下载片段,无需先下完整视频再剪辑。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    NotebookLM

    NotebookLM

    NotebookLM是谷歌推出的一款个性化AI协作工具,旨在帮助用户更高效地进行信息整理和笔记记录。利用强大的语言模型帮助用户更快地从各种文本、图像以及网页中提取主要信息。
    Higgsfield AI

    Higgsfield AI

    Higgsfield AI平台支持文生图和图生视频,近期对图生视频功能进行了全面升级,专为追求高质量、风格化内容创作并渴望真正电影级操控的创意人士打造——无论是MV导演、商业片制作人、AI创作者,还是社交媒体叙事者。
    Zoom Earth

    Zoom Earth

    ZoomEarth是交互式世界天气图。通过雨量,风力,温度,压力等的交互式地图探索当前天气并查看您所在位置的天气预报。通过ZoomEarth,您可以跟踪台风和风暴的发展、监测野火和烟雾,并通过查看近乎实时更新的卫星图像来了解最新情况。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    查看完整榜单