多功能大规模扩散模型OneDiffusion:能够无缝支持双向图像合成和理解,跨越多种不同的任务 AI2、加州大学欧文分校和华盛顿大学的研究人员介绍了一种名为OneDiffusion的多功能、大规模扩散模型。OneDiffusion能够无缝支持在多样化任务中进行双向图像合成和理解,涵盖从文本、深度... 图像模型# OneDiffusion# 扩散模型 2周前01270
跨模态图像生成模型Qwen2vl-Flux:将Qwen2VL的视觉语言理解能力与FLUX框架相结合,实现了更精确和上下文感知的图像生成 Qwen2vl-Flux 是一种先进的跨模态图像生成模型,它将Qwen2VL的视觉语言理解能力与FLUX框架相结合,实现了更精确和上下文感知的图像生成。该模型在文本提示和视觉参考的基础上生成高质量图像... 图像模型# Qwen2vl-Flux# 视觉语言模型 2周前01380
适用于FLUX模型的新型框架OminiControl:通过整合图像条件,使得DiT模型能够处理各种图像生成任务 新加坡国立大学的研究团队提出了一种名为OminiControl的新型框架,它旨在为预训练的DiT模型(FLUX模型)提供最小化和通用的控制。OminiControl通过整合图像条件,使得DiT模型能够... Flux衍生# FLUX模型# OminiControl# 图像生成 2周前01270
与FLUX.1 Redux竞争?InstantX Team开源基于FLUX.1-dev的IP-Adapter模型 FLUX.1-dev-IP-Adapter 是由 InstantX Team 发布的一个 IP-Adapter,最初在 Shakker 平台 上独占。然而,在 Black Forest Labs 发布... Flux衍生# FLUX.1-dev-IP-Adapter# InstantX Team 2周前01710
CogVideoX-Fun-V1.1-Reward-LoRAs:通过奖励反向传播技术训练Lora,以优化CogVideoX-Fun-V1.1生成的视频 CogVideoX-Fun-V1.1-Reward-LoRAs是通过奖励反向传播技术训练Lora,以优化CogVideoX-Fun-V1.1生成的视频,使其更好地与人类偏好保持一致。 地址:https... 视频模型# CogVideoX-Fun-V1.1# CogVideoX-Fun-V1.1-Reward-LoRAs 2周前01460
SD3.5M-Booster :专门为 SD3.5 Medium 模型设计的增强 LoRA SD3.5M-Booster 是一个专门为 SD3.5 Medium 模型设计的增强 LoRA,旨在将模型的性能提升到最高水平。通过增强细节、颜色和对比度,SD3.5M-Booster 能够显著改善生... 图像模型# SD3.5 Medium# SD3.5M-Booster 2周前01500
Jina CLIP v2:用于文本和图像的多语言多模态嵌入 在互联互通的世界中,跨多种语言和媒介的有效沟通变得越来越重要。多模态AI在结合图像和文本以实现不同语言的无缝检索和理解方面面临着诸多挑战。现有的模型在英语中表现良好,但在其他语言中则表现不佳。此外,同... 多模态模型# Jina CLIP v2# 多语言多模态嵌入 2周前01270
Black Forest Labs发布FLUX.1 Tools系列开源模型:增强FLUX.1模型的控制与可操纵性 Black Forest Labs发布了FLUX.1 Tools系列开源模型,这是一套旨在为FLUX.1模型增加控制和可操纵性的模型组合,使修改和重建真实及生成的图像成为可能。在发布时,FLUX.1 ... Flux衍生# Black Forest Labs# FLUX.1 Canny# FLUX.1 Depth 2周前02590
ITF SkinDiffDDS v1:专为处理 DDS 压缩后皮肤漫反射纹理的质量问题而设计的模型 ITF SkinDiffDDS v1 是一款专为处理 DDS 压缩后皮肤漫反射纹理的质量问题而设计的模型。这款模型的主要目标是去除压缩过程中产生的条带、块状、抖动、走样、噪点和颜色偏移等瑕疵,从而提升... 图像模型# ITF SkinDiffDDS v1# 皮肤 2周前01780
Lumiere Alpha:基于 FLUX.1 [dev] 模型打造的微调模型,专注于提高生成图像的现实感 Lumiere Alpha 是由 AIXON Lab 基于 FLUX.1 [dev] 模型打造的一款微调模型。该模型专注于提高生成图像的现实感,同时保持提示的连贯性和原始 FLUX.1-Dev 模型的... Flux衍生# FLUX.1-dev# Lumiere Alpha# 微调模型 2周前02260
4款用于现实主义(增强人物、现实物品或者场景)的 Flux LoRa模型对比 Reddit网友Raine_Mi对比了4款用于现实主义(增强人物、现实物品或者场景)的 Flux LoRa模型,使用相同的相同的种子、提示等,以及 LoRa推荐设置生成人物、动物,场景等,大家可以对比... Flux衍生# Flux LoRa 2周前01880
基于扩散的肖像动画生成新方法JoyVASA:用于生成音频驱动的面部动画,包括面部动态和头部运动 音频驱动的肖像动画在基于扩散模型的推动下取得了显著进展,提高了视频质量和唇同步的准确性。然而,这些模型的复杂性增加导致了训练和推理的低效,以及对视频长度和帧间连续性的限制。为了解决这些问题,京东健康国... 图像模型# JoyVASA# 肖像动画 2周前02060