图像模型

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

Jasper推出新型蒸馏方法Flash Diffusion：高效、快速、多用途且与LoRA兼容，旨在加速预训练扩散模型图像生成

Jasper推出了一种高效、快速、多用途且与LoRA兼容，旨在加速预训练扩散模型生成的蒸馏方法Flash Diffusion，该方法在COCO 2014和COCO 2017数据集上，针对少量步骤的图像...

1年前

08650

SDXL系列新模型SDXL Flash：高速且保证质量的SDXL模型

Stable Diffusion Community是一个非官方、非盈利性质的组织，它们主要目标是尽可能改进 SD 模型并让每个人都可以使用它们，近期它们推出了新的SDXL系列模型SDXL Flash...

图像模型 # SDXL Flash # sdxl-flash-mini # 高速模型

1年前

01,0340

全新开源背景移除模型ormbg：专门针对含有人物的图像进行了优化

ormbg是一个基于基于高度准确的二分类图像分割（DIS）的全新开源背景移除模型，它专门针对含有人物的图像进行了优化，此模型类似于 RMBG-1.4，但提供了开放的训练数据和流程，且商业使用免费。它提...

图像模型 # DIS # ormbg # 背景移除模型

1年前

01,1940

字节跳动推出新型蒸馏模型Hyper-SD：基于SD1.5和SDXL1.0基础模型提炼

字节跳动在推出文生图模型SDXL-Lightning后，又推出了新的蒸馏模型Hyper-SD，它有效地结合了ODE轨迹保留和重构的优点，同时在步骤压缩过程中保持了接近无损的性能。与SDXL-Light...

图像模型 # Hyper-SD # 字节跳动 # 蒸馏模型

1年前

01,1880

文生图模型新架构MoA：根据用户的个性化需求生成包含特定人物的图像，同时保持原有模型的风格和多样性

Snap推出新架构注意力混合（Mixture-of-Attention，简称MoA），即在个性化图像生成中实现主体与上下文解耦的注意力混合模型（MoA），用于个性化文本到图像的扩散模型。简单来说，Mo...

图像模型 # MoA # 文生图模型

1年前

09920

虚拟服装试穿Magic Clothing：根据特定的服装和文本提示来生成穿着这些服装的定制化角色图像

小i研究院发布了OOTDiffusion的分支版本Magic Clothing，它能够根据特定的服装和文本提示来生成穿着这些服装的定制化角色图像。这项技术的核心在于高度的图像可控性，即在生成的图像中保...

图像模型 # Magic Clothing # 虚拟服装试穿

1年前

01,1280

高效且多功能的框架Ctrl-Adapter：在各种图像和视频生成模型中加入丰富的控制功能

北卡罗来纳大学教堂山分校的研究人员推出高效且多功能的框架CTRL-Adapter，它能够为任何图像或视频扩散模型添加多样的空间控制功能。它支持多种实用的应用，如视频控制、多条件视频控制、稀疏帧条件下的...

图像模型 # Ctrl-Adapter # 空间控制 # 视频生成模型

1年前

08390

新型超分辨率技术APISR：专门针对动漫图像和视频的高质量增强

来自密歇根大学、耶鲁大学和浙江大学推出新型超分辨率技术APISR，专门针对动漫图像和视频的高质量增强。超分辨率技术（Super-Resolution, SR）是一种图像处理技术，旨在从低分辨率的图像中...

图像模型 # APISR # 动漫图像 # 超分辨率技术

1年前

08470

统一框架UniFL：通过统一的反馈学习来提升稳定扩散模型（Stable Diffusion）的性能

来自字节跳动和中山大学的研究人员推出利用反馈学习机制来全面增强扩散模型的统一框架UniFL，它通过统一的反馈学习来提升稳定扩散模型（Stable Diffusion）的性能。UniFL作为一种通用、高...

图像模型 # Stable Diffusion # UniFL

1年前

07530

新型文生图架构Diffusion-RWKV：基于RWKV模型，为改进图像生成任务而设计

昆仑万维推出新型文生图架构Diffusion-RWKV，它是为了改进图像生成任务而设计的。这个架构是基于RWKV模型，这是一种在自然语言处理（NLP）领域中使用的模型，但经过了特别的修改，使其更适合处...

图像模型 # Diffusion-RWKV # RWKV模型 # 文生图架构

1年前

04910

个性化视觉编辑框架SwapAnything：可以在保持上下文不变的情况下，用参考提供的个性化概念替换图像中的任何物体

来自加州大学圣克鲁斯分校和Adobe的研究人员推出个性化视觉编辑框架SwapAnything，它可以在保持上下文不变的情况下，用参考提供的个性化概念替换图像中的任何物体。与现有的个性化主体替换方法...

图像模型 # SwapAnything # 个性化视觉编辑

1年前

05200

新型框架Diffusion-KTO：用于调整文生图模型，使其生成的图像更符合人类的偏好

加州大学洛杉矶分校、松下人工智能研究中心和 Salesforce 人工智能研究中心的研究人员推出新型框架Diffusion-KTO，它专门用于调整文生图模型，使其生成的图像更符合人类的偏好。这个过程不...

图像模型 # Diffusion-KTO # 文生图模型

1年前

06510

加载更多