模型 | 第79页 | SD百科导航

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型

排序

发布更新浏览点赞

IC-Light推出基于Flux模型的新版本IC-Light V2：为图像进行重新打光

IC-Light是Controlnet、Fooocus、Stable Diffusion WebUI Forge的开发者lllyasviel推出的一款控制图像照明效果的模型，之前是基于SD1.5，目前...

Flux衍生 # FLUX模型 # IC-Light V2

11个月前

08820

PixelWave Flux.1-Dev：基于FLUX.1-dev的微调FLUX模型，适合艺术和摄影风格

PixelWave Flux.1-Dev是一个基于FLUX.1-dev的微调FLUX模型，非常适合艺术和摄影风格，黑色和深色图像输出更可靠，手部问题更少。目前已经推出了第三版，开发者推出了多个版本（S...

Flux衍生 # FLUX.1-dev # PixelWave Flux.1-Dev

11个月前

01,0060

Freepik发布蒸馏模型Flux.1 Lite 8B：保持同样精度，减少显存占用

Freepik是国外一家老牌素材库，旗下拥有Flaticon、Slidesgo和Videvo等知名素材库，之前它们也收购了AI图像放大技术公司Magnific AI，推出了AI图片生成服务。近期他们推...

Flux衍生 # Flux.1 Lite 8B # Freepik

11个月前

04310

RealAestheticSpectrum：基于 FLUX.1-dev 的美学实验性LoRA

RealAestheticSpectrum 是一个基于 FLUX.1-dev 的实验性 LoRA（Low-Rank Adaptation），旨在捕捉广泛风格中的美学。它通过增强阴影、光线、反射和对比度...

Flux衍生 # FLUX.1-dev # Lora # RealAestheticSpectrum

11个月前

04190

Genmo推出开源视频生成模型天花板Mochi 1，型需 4 块英伟达H100 显卡才可运行

Genmo是一家专注于视频生成的AI初创公司，之前都是默默无闻，其官方视频生成产品也是半死不活，但他们在昨天突然放大招开源了一款视频生成模型Mochi 1，号称其性能可与领先的闭源/专有竞争对手（如R...

视频模型 # Genmo # Mochi 1 # 视频生成模型

11个月前

05160

LibreFLUX：基于FLUX.1 [schnell]的免费、开源、去蒸馏FLUX 模型

LibreFLUX是基于FLUX.1 [schnell] 的去蒸馏版本，旨在提供完整的 T5 上下文长度支持，使用注意力掩码，恢复无分类器指导，并移除了大部分 FLUX 美学微调/DPO。这些改动使得...

Flux衍生 # FLUX 模型 # FLUX.1 [schnell]# LibreFLUX

11个月前

06580

高效、可扩展框架CtrLoRA：结合了基础 ControlNet 和条件特定 LoRAs 的可控图像生成框架

来自中国科学院计算技术研究所和中国科学院大学的研究人员推出一种用于可控图像生成的高效、可扩展框架CtrLoRA，这是一个结合了基础 ControlNet 和条件特定 LoRAs 的可控图像生成框架。简...

图像模型 # ControlNe # CtrLoRA # LoRAs

11个月前

03830

Useful开源自动语音识别 (ASR) 模型Moonshine：专门针对实时转录和语音命令处理进行了优化

Useful开源了一款名为 Moonshine 的全新语音转文本模型。这款模型不仅在速度和效率上超越了目前最领先的 OpenAI 的 Whisper 模型，而且在准确率方面也达到了同等水平甚至更优。M...

语音模型 # Moonshine # 语音识别模型

11个月前

06600

Rhymes AI开源视频生成模型Allegro：从简单的文本提示生成高质量的 6 秒视频

Rhymes AI在推出多模态原生模型Aria后，又在昨天开源了视频生成模型Allegro，Allegro 使用户能够从简单的文本提示生成高质量的 6 秒视频，帧率为 15 帧每秒，分辨率为 720P...

视频模型 # Allegro # Rhymes AI # 视频生成模型

11个月前

04380

Stability AI推出其最新的图像生成模型系列Stable Diffusion 3.5（SD3.5）：更具可定制性和多功能性，同时在性能上也有所提升

在经历了一系列由技术故障和许可变更引发的争议后，Stability AI宣布了其最新的图像生成模型系列—Stable Diffusion 3.5（SD3.5），新的Stable Diffusion 3...

图像模型 # SD3.5 # Stability AI # Stable Diffusion 3.5

11个月前

04630

混合自回归变换器HART：高效生成高分辨率图像

现有的自回归（AR）视觉生成模型在生成高分辨率图像时面临两大挑战：离散分词器的图像重建质量较差，以及生成1024px图像的训练成本过高。为了解决这些问题，麻省理工学院、英伟达和清华大学的研究人员提出了...

图像模型 # HART # 混合自回归变换器

11个月前

03900

肖像图像动画Hallo2：用于制作高分辨率、长时间的人像动画

基于潜在扩散的生成模型在肖像图像动画方面取得了显著进展，特别是在短时视频合成方面。例如，Hallo 模型已经展示了令人印象深刻的结果。然而，这些模型在生成长时间视频时面临外观漂移和时间伪影等问题。为了...

视频模型 # Hallo2 # 肖像图像

11个月前

04230

加载更多

模型

IC-Light推出基于Flux模型的新版本IC-Light V2：为图像进行重新打光

PixelWave Flux.1-Dev：基于FLUX.1-dev的微调FLUX模型，适合艺术和摄影风格

Freepik发布蒸馏模型Flux.1 Lite 8B：保持同样精度，减少显存占用

RealAestheticSpectrum：基于 FLUX.1-dev 的美学实验性LoRA

Genmo推出开源视频生成模型天花板Mochi 1，型需 4 块英伟达H100 显卡才可运行

LibreFLUX：基于FLUX.1 [schnell]的免费、开源、去蒸馏FLUX 模型

高效、可扩展框架CtrLoRA：结合了基础 ControlNet 和条件特定 LoRAs 的可控图像生成框架

Useful开源自动语音识别 (ASR) 模型Moonshine：专门针对实时转录和语音命令处理进行了优化

Rhymes AI开源视频生成模型Allegro：从简单的文本提示生成高质量的 6 秒视频

Stability AI推出其最新的图像生成模型系列Stable Diffusion 3.5（SD3.5）：更具可定制性和多功能性，同时在性能上也有所提升

混合自回归变换器HART：高效生成高分辨率图像

肖像图像动画Hallo2：用于制作高分辨率、长时间的人像动画

Fogsight (雾象)

CutCut

alphaXiv

NotebookLM

DiffRhythm（谛韵）

ComfyOnline

模型

网址

Fogsight (雾象)

CutCut

alphaXiv

NotebookLM

DiffRhythm（谛韵）

ComfyOnline