IC-Light推出基于Flux模型的新版本IC-Light V2:为图像进行重新打光IC-Light是Controlnet、Fooocus、Stable Diffusion WebUI Forge的开发者lllyasviel推出的一款控制图像照明效果的模型,之前是基于SD1.5,目前...Flux衍生# FLUX模型# IC-Light V211个月前08820
PixelWave Flux.1-Dev:基于FLUX.1-dev的微调FLUX模型,适合艺术和摄影风格PixelWave Flux.1-Dev是一个基于FLUX.1-dev的微调FLUX模型,非常适合艺术和摄影风格,黑色和深色图像输出更可靠,手部问题更少。目前已经推出了第三版,开发者推出了多个版本(S...Flux衍生# FLUX.1-dev# PixelWave Flux.1-Dev11个月前01,0060
Freepik发布蒸馏模型Flux.1 Lite 8B:保持同样精度,减少显存占用Freepik是国外一家老牌素材库,旗下拥有Flaticon、Slidesgo和Videvo等知名素材库,之前它们也收购了AI图像放大技术公司Magnific AI,推出了AI图片生成服务。近期他们推...Flux衍生# Flux.1 Lite 8B# Freepik11个月前04310
RealAestheticSpectrum:基于 FLUX.1-dev 的美学实验性LoRARealAestheticSpectrum 是一个基于 FLUX.1-dev 的实验性 LoRA(Low-Rank Adaptation),旨在捕捉广泛风格中的美学。它通过增强阴影、光线、反射和对比度...Flux衍生# FLUX.1-dev# Lora# RealAestheticSpectrum11个月前04190
Genmo推出开源视频生成模型天花板Mochi 1,型需 4 块英伟达H100 显卡才可运行Genmo是一家专注于视频生成的AI初创公司,之前都是默默无闻,其官方视频生成产品也是半死不活,但他们在昨天突然放大招开源了一款视频生成模型Mochi 1,号称其性能可与领先的闭源/专有竞争对手(如R...视频模型# Genmo# Mochi 1# 视频生成模型11个月前05160
LibreFLUX:基于FLUX.1 [schnell]的免费、开源、去蒸馏FLUX 模型LibreFLUX是基于FLUX.1 [schnell] 的去蒸馏版本,旨在提供完整的 T5 上下文长度支持,使用注意力掩码,恢复无分类器指导,并移除了大部分 FLUX 美学微调/DPO。这些改动使得...Flux衍生# FLUX 模型# FLUX.1 [schnell]# LibreFLUX11个月前06580
高效、可扩展框架CtrLoRA:结合了基础 ControlNet 和条件特定 LoRAs 的可控图像生成框架来自中国科学院计算技术研究所和中国科学院大学的研究人员推出一种用于可控图像生成的高效、可扩展框架CtrLoRA,这是一个结合了基础 ControlNet 和条件特定 LoRAs 的可控图像生成框架。简...图像模型# ControlNe# CtrLoRA# LoRAs11个月前03830
Useful开源自动语音识别 (ASR) 模型Moonshine:专门针对实时转录和语音命令处理进行了优化Useful开源了一款名为 Moonshine 的全新语音转文本模型。这款模型不仅在速度和效率上超越了目前最领先的 OpenAI 的 Whisper 模型,而且在准确率方面也达到了同等水平甚至更优。M...语音模型# Moonshine# 语音识别模型11个月前06600
Rhymes AI开源视频生成模型Allegro:从简单的文本提示生成高质量的 6 秒视频Rhymes AI在推出多模态原生模型Aria后,又在昨天开源了视频生成模型Allegro,Allegro 使用户能够从简单的文本提示生成高质量的 6 秒视频,帧率为 15 帧每秒,分辨率为 720P...视频模型# Allegro# Rhymes AI# 视频生成模型11个月前04380
Stability AI推出其最新的图像生成模型系列Stable Diffusion 3.5(SD3.5):更具可定制性和多功能性,同时在性能上也有所提升在经历了一系列由技术故障和许可变更引发的争议后,Stability AI宣布了其最新的图像生成模型系列—Stable Diffusion 3.5(SD3.5),新的Stable Diffusion 3...图像模型# SD3.5# Stability AI# Stable Diffusion 3.511个月前04630
混合自回归变换器HART:高效生成高分辨率图像现有的自回归(AR)视觉生成模型在生成高分辨率图像时面临两大挑战:离散分词器的图像重建质量较差,以及生成1024px图像的训练成本过高。为了解决这些问题,麻省理工学院、英伟达和清华大学的研究人员提出了...图像模型# HART# 混合自回归变换器11个月前03900
肖像图像动画Hallo2:用于制作高分辨率、长时间的人像动画基于潜在扩散的生成模型在肖像图像动画方面取得了显著进展,特别是在短时视频合成方面。例如,Hallo 模型已经展示了令人印象深刻的结果。然而,这些模型在生成长时间视频时面临外观漂移和时间伪影等问题。为了...视频模型# Hallo2# 肖像图像11个月前04230