SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    模型

    共 1055 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型
    排序
    发布更新浏览点赞
    IC-Light推出基于Flux模型的新版本IC-Light V2:为图像进行重新打光

    IC-Light推出基于Flux模型的新版本IC-Light V2:为图像进行重新打光

    IC-Light是Controlnet、Fooocus、Stable Diffusion WebUI Forge的开发者lllyasviel推出的一款控制图像照明效果的模型,之前是基于SD1.5,目前...
    Flux衍生# FLUX模型# IC-Light V2
    11个月前
    08820
    PixelWave Flux.1-Dev:基于FLUX.1-dev的微调FLUX模型,适合艺术和摄影风格

    PixelWave Flux.1-Dev:基于FLUX.1-dev的微调FLUX模型,适合艺术和摄影风格

    PixelWave Flux.1-Dev是一个基于FLUX.1-dev的微调FLUX模型,非常适合艺术和摄影风格,黑色和深色图像输出更可靠,手部问题更少。目前已经推出了第三版,开发者推出了多个版本(S...
    Flux衍生# FLUX.1-dev# PixelWave Flux.1-Dev
    11个月前
    01,0060
    Freepik发布蒸馏模型Flux.1 Lite 8B:保持同样精度,减少显存占用

    Freepik发布蒸馏模型Flux.1 Lite 8B:保持同样精度,减少显存占用

    Freepik是国外一家老牌素材库,旗下拥有Flaticon、Slidesgo和Videvo等知名素材库,之前它们也收购了AI图像放大技术公司Magnific AI,推出了AI图片生成服务。近期他们推...
    Flux衍生# Flux.1 Lite 8B# Freepik
    11个月前
    04310
    RealAestheticSpectrum:基于 FLUX.1-dev 的美学实验性LoRA

    RealAestheticSpectrum:基于 FLUX.1-dev 的美学实验性LoRA

    RealAestheticSpectrum 是一个基于 FLUX.1-dev 的实验性 LoRA(Low-Rank Adaptation),旨在捕捉广泛风格中的美学。它通过增强阴影、光线、反射和对比度...
    Flux衍生# FLUX.1-dev# Lora# RealAestheticSpectrum
    11个月前
    04190
    Genmo推出开源视频生成模型天花板Mochi 1,型需 4 块英伟达H100 显卡才可运行

    Genmo推出开源视频生成模型天花板Mochi 1,型需 4 块英伟达H100 显卡才可运行

    Genmo是一家专注于视频生成的AI初创公司,之前都是默默无闻,其官方视频生成产品也是半死不活,但他们在昨天突然放大招开源了一款视频生成模型Mochi 1,号称其性能可与领先的闭源/专有竞争对手(如R...
    视频模型# Genmo# Mochi 1# 视频生成模型
    11个月前
    05160
    LibreFLUX:基于FLUX.1 [schnell]的免费、开源、去蒸馏FLUX 模型

    LibreFLUX:基于FLUX.1 [schnell]的免费、开源、去蒸馏FLUX 模型

    LibreFLUX是基于FLUX.1 [schnell] 的去蒸馏版本,旨在提供完整的 T5 上下文长度支持,使用注意力掩码,恢复无分类器指导,并移除了大部分 FLUX 美学微调/DPO。这些改动使得...
    Flux衍生# FLUX 模型# FLUX.1 [schnell]# LibreFLUX
    11个月前
    06580
    高效、可扩展框架CtrLoRA:结合了基础 ControlNet 和条件特定 LoRAs 的可控图像生成框架

    高效、可扩展框架CtrLoRA:结合了基础 ControlNet 和条件特定 LoRAs 的可控图像生成框架

    来自中国科学院计算技术研究所和中国科学院大学的研究人员推出一种用于可控图像生成的高效、可扩展框架CtrLoRA,这是一个结合了基础 ControlNet 和条件特定 LoRAs 的可控图像生成框架。简...
    图像模型# ControlNe# CtrLoRA# LoRAs
    11个月前
    03830
    Useful开源自动语音识别 (ASR) 模型Moonshine:专门针对实时转录和语音命令处理进行了优化

    Useful开源自动语音识别 (ASR) 模型Moonshine:专门针对实时转录和语音命令处理进行了优化

    Useful开源了一款名为 Moonshine 的全新语音转文本模型。这款模型不仅在速度和效率上超越了目前最领先的 OpenAI 的 Whisper 模型,而且在准确率方面也达到了同等水平甚至更优。M...
    语音模型# Moonshine# 语音识别模型
    11个月前
    06600
    Rhymes AI开源视频生成模型Allegro:从简单的文本提示生成高质量的 6 秒视频

    Rhymes AI开源视频生成模型Allegro:从简单的文本提示生成高质量的 6 秒视频

    Rhymes AI在推出多模态原生模型Aria后,又在昨天开源了视频生成模型Allegro,Allegro 使用户能够从简单的文本提示生成高质量的 6 秒视频,帧率为 15 帧每秒,分辨率为 720P...
    视频模型# Allegro# Rhymes AI# 视频生成模型
    11个月前
    04380
    Stability AI推出其最新的图像生成模型系列Stable Diffusion 3.5(SD3.5):更具可定制性和多功能性,同时在性能上也有所提升

    Stability AI推出其最新的图像生成模型系列Stable Diffusion 3.5(SD3.5):更具可定制性和多功能性,同时在性能上也有所提升

    在经历了一系列由技术故障和许可变更引发的争议后,Stability AI宣布了其最新的图像生成模型系列—Stable Diffusion 3.5(SD3.5),新的Stable Diffusion 3...
    图像模型# SD3.5# Stability AI# Stable Diffusion 3.5
    11个月前
    04630
    混合自回归变换器HART:高效生成高分辨率图像

    混合自回归变换器HART:高效生成高分辨率图像

    现有的自回归(AR)视觉生成模型在生成高分辨率图像时面临两大挑战:离散分词器的图像重建质量较差,以及生成1024px图像的训练成本过高。为了解决这些问题,麻省理工学院、英伟达和清华大学的研究人员提出了...
    图像模型# HART# 混合自回归变换器
    11个月前
    03900
    肖像图像动画Hallo2:用于制作高分辨率、长时间的人像动画

    肖像图像动画Hallo2:用于制作高分辨率、长时间的人像动画

    基于潜在扩散的生成模型在肖像图像动画方面取得了显著进展,特别是在短时视频合成方面。例如,Hallo 模型已经展示了令人印象深刻的结果。然而,这些模型在生成长时间视频时面临外观漂移和时间伪影等问题。为了...
    视频模型# Hallo2# 肖像图像
    11个月前
    04230
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
     CutCut

     CutCut

    CutCut是一个视频下载与剪辑工具,支持从 YouTube、Bilibili 等主流平台直接按章节或自定义时间范围下载片段,无需先下完整视频再剪辑。
    alphaXiv

    alphaXiv

    作为 arxiv labs 的官方产品,alphaXiv 不仅整合了 arXiv 的论文内容和开放的评论系统,还引入了先进的 AI 功能。用户不仅可以针对某篇论文进行问答,还可以通过 @ 引用其他论文的章节,类似于 AI 代码编辑器 Cursor 中 @ 引用其他代码文件或方法,这种创新的交互方式极大地丰富了学术讨论的形式。
    NotebookLM

    NotebookLM

    NotebookLM是谷歌推出的一款个性化AI协作工具,旨在帮助用户更高效地进行信息整理和笔记记录。利用强大的语言模型帮助用户更快地从各种文本、图像以及网页中提取主要信息。
    DiffRhythm(谛韵)

    DiffRhythm(谛韵)

    DiffRhythm(中文名“谛韵”)是由西北工业大学音频、语音与语言处理研究组(ASLP Lab)和香港中文大学(深圳)深圳大数据研究院联合开发的新型端到端全长度歌曲生成模型。基于潜扩散(Latent Diffusion)技术,DiffRhythm 能够快速生成包含人声和伴奏的完整歌曲,解决了现有音乐生成方法的诸多局限性。
    ComfyOnline

    ComfyOnline

    ComfyOnline 是一个云端平台,专为运行 ComfyUI 工作流设计,提供了更友好、性价比更高的使用体验。使用 ComfyOnline,您只需为实际工作流的运行时间付费,避免了闲置 GPU 的费用或忘记关闭导致的意外账单。
    查看完整榜单