图像模型

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

跨模态图像生成模型Qwen2vl-Flux：将Qwen2VL的视觉语言理解能力与FLUX框架相结合，实现了更精确和上下文感知的图像生成

Qwen2vl-Flux 是一种先进的跨模态图像生成模型，它将Qwen2VL的视觉语言理解能力与FLUX框架相结合，实现了更精确和上下文感知的图像生成。该模型在文本提示和视觉参考的基础上生成高质量图像...

图像模型 # Qwen2vl-Flux # 视觉语言模型

1年前

03310

SD3.5M-Booster ：专门为 SD3.5 Medium 模型设计的增强 LoRA

SD3.5M-Booster 是一个专门为 SD3.5 Medium 模型设计的增强 LoRA，旨在将模型的性能提升到最高水平。通过增强细节、颜色和对比度，SD3.5M-Booster 能够显著改善生...

图像模型 # SD3.5 Medium # SD3.5M-Booster

1年前

04090

ITF SkinDiffDDS v1：专为处理 DDS 压缩后皮肤漫反射纹理的质量问题而设计的模型

ITF SkinDiffDDS v1 是一款专为处理 DDS 压缩后皮肤漫反射纹理的质量问题而设计的模型。这款模型的主要目标是去除压缩过程中产生的条带、块状、抖动、走样、噪点和颜色偏移等瑕疵，从而提升...

图像模型 # ITF SkinDiffDDS v1 # 皮肤

1年前

03920

基于扩散的肖像动画生成新方法JoyVASA：用于生成音频驱动的面部动画，包括面部动态和头部运动

音频驱动的肖像动画在基于扩散模型的推动下取得了显著进展，提高了视频质量和唇同步的准确性。然而，这些模型的复杂性增加导致了训练和推理的低效，以及对视频长度和帧间连续性的限制。为了解决这些问题，京东健康国...

图像模型 # JoyVASA # 肖像动画

1年前

06100

背景移除模型BEN：自动从图像中移除背景，生成二值掩码和前景图像

BEN（Background Erasure Network）是由Prama LLC推出的一款深度学习模型，旨在自动从图像中移除背景，生成二值掩码和前景图像。模型：https://huggingfa...

图像模型 # BEN # 背景移除模型

1年前

05240

BRIA AI推出最新开源背景移除模型RMBG v2.0

RMBG v2.0 是由 BRIA AI 最新研发的先进背景移除模型，能够在各种类别和图像类型中有效地将前景与背景分离。该模型经过精心挑选的数据集训练，包括通用库存图片、电子商务、游戏和广告内容，使其...

图像模型 # BRIA AI # RMBG v2.0 # 背景移除模型

1年前

04170

Collov Labs推出非自回归掩码图像建模的文本到图像合成模型Monetico

Collov Labs 最近在8块H100 GPU上训练了一周时间，推出了新的非自回归掩码图像建模的文本到图像合成模型——Monetico。这款模型能够生成高分辨率图像，并且被设计为在消费级显卡上高效...

图像模型 # Monetico # 文生图模型

1年前

04800

基于扩散模型（SDXL）的新型图像恢复方法InstantIR

盲图像恢复（Blind Image Restoration, BIR）的主要挑战之一是处理测试时未知的退化，这需要模型具备高泛化能力。北京大学、InstantX团队和香港中文大学的研究人员提出了一种新...

图像模型 # InstantIR # 即时参考图像恢复 # 高清修复

1年前

08140

高容量真实世界图像恢复模型DreamClear：结合隐私安全的数据处理流程（GenIR）和DiT技术，以实现对低质量图像的高质量恢复

现实世界中的图像恢复（IR）面临着显著的挑战，主要是缺乏高容量模型和全面的数据集。为了解决这些问题，中国科学院自动化研究所、中国科学院大学人工智能学院、字节跳动公司和中国科学技术大学的研究人员提出了一...

图像模型 # DreamClear # 图像恢复模型

1年前

04800

高效、可扩展框架CtrLoRA：结合了基础 ControlNet 和条件特定 LoRAs 的可控图像生成框架

来自中国科学院计算技术研究所和中国科学院大学的研究人员推出一种用于可控图像生成的高效、可扩展框架CtrLoRA，这是一个结合了基础 ControlNet 和条件特定 LoRAs 的可控图像生成框架。简...

图像模型 # ControlNe # CtrLoRA # LoRAs

1年前

04130

Stability AI推出其最新的图像生成模型系列Stable Diffusion 3.5（SD3.5）：更具可定制性和多功能性，同时在性能上也有所提升

在经历了一系列由技术故障和许可变更引发的争议后，Stability AI宣布了其最新的图像生成模型系列—Stable Diffusion 3.5（SD3.5），新的Stable Diffusion 3...

图像模型 # SD3.5 # Stability AI # Stable Diffusion 3.5

1年前

04640

混合自回归变换器HART：高效生成高分辨率图像

现有的自回归（AR）视觉生成模型在生成高分辨率图像时面临两大挑战：离散分词器的图像重建质量较差，以及生成1024px图像的训练成本过高。为了解决这些问题，麻省理工学院、英伟达和清华大学的研究人员提出了...

图像模型 # HART # 混合自回归变换器

1年前

03950

加载更多