SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
  • 百科工具
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航
    • 百科工具

    模型

    共 995 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型
    排序
    发布更新浏览点赞
    Stability AI释出Stable Diffusion 3 Medium模型,8G显存显卡即可使用

    Stability AI释出Stable Diffusion 3 Medium模型,8G显存显卡即可使用

    Stability AI终于在6月12日释出了万众期待的Stable Diffusion 3模型,不过此次释出的仅是 20 亿个参数的Stable Diffusion 3 Medium 模型,该型号尺...
    图像模型# SD3模型# Stability AI# Stable Diffusion 3 Medium
    10个月前
    05,0120
    文本转语音模型Kokoro-82M:8200万参数,支持多语言和多声音选项

    文本转语音模型Kokoro-82M:8200万参数,支持多语言和多声音选项

    Kokoro是一款先进的文本转语音(TTS)模型,以其精简的参数量和卓越的性能在众多竞争对手中脱颖而出。拥有8200万参数的Kokoro,其模型大小不超过300M,却能生成高质量的音频输出。特别值得一...
    语音模型# Kokoro-82M# TTS
    10个月前
    03,4780
    Illustrious XL v2.0正式发布,支持1024x1536原生分辨率生成

    Illustrious XL v2.0正式发布,支持1024x1536原生分辨率生成

    在开源AI绘画模型领域,Flux模型是众多衍生开发的基础。然而,在二次元领域,尤其是日式风格方面,情况有所不同。目前,大量用户依然以SDXL模型为基础进行衍生开发。在开源社区中,Pony、Illust...
    图像模型# Illustrious XL v2.0# SDXL# 二次元
    9个月前
    02,2840
    Nari Labs开源TTS模型Dia-1.6B:生成自然对话与非语言表达,支持声音克隆

    Nari Labs开源TTS模型Dia-1.6B:生成自然对话与非语言表达,支持声音克隆

    Nari Labs在今天开源了一个拥有16亿参数的文本转语音模型Dia-1.6B。这个模型的最大亮点在于它能够生成高度逼真的对话,并且加入了自然人声元素,比如笑声、咳嗽、清喉咙等,让语音合成更加生动自...
    语音模型# Dia-1.6B# Nari Labs# TTS模型
    8个月前
    02,1930
    AWPortraitCN:专门针对中国人长相特征及审美进行了优化的FLUX LoRA模型

    AWPortraitCN:专门针对中国人长相特征及审美进行了优化的FLUX LoRA模型

    AWPortraitCN 是由 DynamicWang 基于FLUX.1-dev模型开发的一款LoRA模型,专门针对中国人长相特征及审美进行了优化。该模型使用了包含室内、室外人像、时尚、棚拍写真等多类...
    Flux衍生# AWPortraitCN# LoRA模型
    10个月前
    01,2520
    FLUX.1-dev-ControlNet-Union-Pro-2.0:Shakker Labs发布的新一代ControlNet,功能升级,性能优化!

    FLUX.1-dev-ControlNet-Union-Pro-2.0:Shakker Labs发布的新一代ControlNet,功能升级,性能优化!

    Shakker Labs近期发布了FLUX.1-dev-ControlNet-Union-Pro-2.0,这是FLUX.1-dev模型的升级版统一ControlNet。该版本在功能和性能上都进行了显著...
    Flux衍生# controlnet# FLUX.1-dev-ControlNet-Union-Pro-2.0# Shakker Labs
    8个月前
    01,2060
    高级插图模型Illustrious:专门针对插画和动画任务进行了优化,主要用于生成动漫风格的图像

    高级插图模型Illustrious:专门针对插画和动画任务进行了优化,主要用于生成动漫风格的图像

    OnomaAI 研究小组推出一个高级插图模型Illustrious,它主要用于生成动漫风格的图像。Illustrious XL是一个基于SDXL的模型,专门针对插画和动画任务进行了优化。它是基于 Ko...
    图像模型# Illustrious# Illustrious XL# 插图模型
    10个月前
    01,1880
    单目深度估算模型Depth Anything V2:通过分析单张图片来预测物体距离

    单目深度估算模型Depth Anything V2:通过分析单张图片来预测物体距离

    来自香港大学和TikTok的研究人员推出单目深度估算模型Depth Anything的升级版Depth Anything V2,让计算机通过分析单张图片来预测物体距离的技术,这在自动驾驶、3D建模和虚...
    图像模型# Depth Anything V2# 单目深度估算模型
    10个月前
    01,1780
    字节跳动推出新型蒸馏模型Hyper-SD:基于SD1.5和SDXL1.0基础模型提炼

    字节跳动推出新型蒸馏模型Hyper-SD:基于SD1.5和SDXL1.0基础模型提炼

    字节跳动在推出文生图模型SDXL-Lightning后,又推出了新的蒸馏模型Hyper-SD,它有效地结合了ODE轨迹保留和重构的优点,同时在步骤压缩过程中保持了接近无损的性能。与SDXL-Light...
    图像模型# Hyper-SD# 字节跳动# 蒸馏模型
    10个月前
    01,1730
    全新开源背景移除模型ormbg:专门针对含有人物的图像进行了优化

    全新开源背景移除模型ormbg:专门针对含有人物的图像进行了优化

    ormbg是一个基于基于高度准确的二分类图像分割(DIS)的全新开源背景移除模型,它专门针对含有人物的图像进行了优化,此模型类似于 RMBG-1.4,但提供了开放的训练数据和流程,且商业使用免费。它提...
    图像模型# DIS# ormbg# 背景移除模型
    10个月前
    01,1100
    虚拟服装试穿Magic Clothing:根据特定的服装和文本提示来生成穿着这些服装的定制化角色图像

    虚拟服装试穿Magic Clothing:根据特定的服装和文本提示来生成穿着这些服装的定制化角色图像

    小i研究院发布了OOTDiffusion的分支版本Magic Clothing,它能够根据特定的服装和文本提示来生成穿着这些服装的定制化角色图像。这项技术的核心在于高度的图像可控性,即在生成的图像中保...
    图像模型# Magic Clothing# 虚拟服装试穿
    10个月前
    01,0620
    小红书 hi lab 推出 dots.ocr:一个更高效、更统一的文档解析方案

    小红书 hi lab 推出 dots.ocr:一个更高效、更统一的文档解析方案

    小红书 hi lab 团队近期发布了一款名为 dots.ocr 的多语言文档解析模型。它不是传统OCR工具的简单升级,而是一次架构层面的重构——将布局检测与内容识别统一在一个视觉-语言模型(VLM)中...
    多模态模型# dots.ocr# 小红书
    4个月前
    01,0510
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Next AI Draw.io

    Next AI Draw.io

    Next AI Draw.io 是一个基于 Next.js 的 Web 应用,将大语言模型(LLM)与 draw.io 的强大图表能力深度集成。用户可通过自然语言指令创建、修改和增强专业图表,无需手动拖拽。
    MuMuAINovel

    MuMuAINovel

    MuMuAINovel 是一款开源的 AI 小说创作辅助工具,专为写作者设计。它不替代你的创意,而是帮你把想法快速转化为结构完整、设定一致、可扩展的长篇故事。
    OiiOii AI

    OiiOii AI

    OiiOii.ai 是一个基于多智能体架构的动画生成平台,其核心目标是将动画制作从线性协作流程,转变为端到端的自动化生成。用户只需上传一张图片或输入一段文字描述,系统即可自动完成剧本生成、分镜设计、角色建模、镜头调度、配乐合成与最终渲染,输出一段完整动画视频。
     Hitem3D 

     Hitem3D 

    Hitem3D由Math Magic开发,是一款基于专有高分辨率AI模型Sparc3D的3D生成工具。只需上传一张参考图像,即可即时生成行业领先品质的工作室级3D资产,极大降低了3D创作的门槛。这一突破性解决方案赋能游戏开发者、设计师和3D艺术家高效释放创意,加速从概念到部署的创作流程。
    AI 智能盲人眼镜系统

    AI 智能盲人眼镜系统

    AI 智能盲人眼镜系统是一个面向视障用户的智能辅助工具原型,整合了盲道导航、过马路辅助、物品识别和语音交互等核心功能。通过视频、音频、IMU(惯性测量单元)等多模态输入,系统可提供实时语音引导与环境感知能力,帮助用户更安全地感知周围环境。
    查看完整榜单