用于定制漫画生成的新框架DiffSensei:将多模态大语言模型和扩散模型结合起来,以实现对漫画角色形象和布局的精确控制 故事可视化,即将文本描述转化为视觉叙事的任务,近年来随着文本到图像生成模型的发展取得了显著进展。然而,现有的模型在处理多角色场景时,特别是在控制角色外观和互动方面,仍然存在局限性。具体来说,这些模型难... 图像模型# DiffSensei# 定制漫画 2周前01250
Leffa:通过参考图像生成人物图像,允许对人物的外观或姿势进行精确控制 可控人物图像生成的目标是根据参考图像生成高质量的人物图像,同时允许对人物的外观或姿势进行精确控制。尽管现有的方法在整体图像质量上取得了显著进展,但它们往往会在生成过程中扭曲参考图像中的细粒度纹理细节。... 图像模型# Leffa# 虚拟试穿 2周前01140
FLUX.1 Tools 系列模型FP8量化版本,适合小显存用户使用 黑森林实验室(Black Forest Labs)在上个月发布了 FLUX.1 Tools 系列开源模型,旨在为图像处理和生成任务提供强大的工具。该系列包括以下三个主要模型: FLUX.1 Fill:... 图像模型# FLUX.1 Canny# FLUX.1 Depth# FLUX.1 Fill 2周前01140
新型插件式适应方法EasyRef:允许扩散模型根据多个参考图像和文本提示进行条件生成 在个性化生成任务中,扩散模型(Diffusion Models)已经取得了显著的成就。传统的无需调优的方法通常通过平均多个参考图像的图像嵌入作为注入条件来编码,但这种与图像无关的操作无法在图像之间进行... 图像模型# EasyRef# 扩散模型 2周前01250
基于修复的指令引导图像编辑框架BrushEdit:通过自然语言指令进行无缝编辑,包括添加对象、移除元素或进行结构性更改等多样化编辑操作 图像编辑技术近年来在基于反演(inversion-based)和基于指令(instruction-based)的方法上取得了显著进步。然而,这些方法各自存在局限性: 基于反演的方法:在处理重大修改(如... 图像模型# BrushEdit# 图像编辑 2周前01380
三阶段扩散模型框架ColorFlow:专门用于解决黑白图像的自动着色问题 ColorFlow 是由清华大学和腾讯ARC实验室提出的一个创新性三阶段扩散模型框架,专门用于解决黑白图像序列的自动着色问题。该模型旨在确保角色和对象的身份(ID)在着色过程中得到一致保留,同时生成高... 图像模型# ColorFlow 2周前01140
lllyasviel推出交互式图像光照绘制新框架LuminaBrush ControlNet的作者lllyasviel继推出IC-Light系列之后,再次推出了一个全新的项目——LuminaBrush。这个项目旨在为用户提供一种简单而强大的方式,在图像上绘制和调整光照效果... 图像模型# LuminaBrush# 光照绘制 2周前01170
用文生图的新型规模感知变换器SWITTI:基于现有的下一代规模预测自回归(AR)模型 Yandex Research、俄罗斯国立研究型大学高等经济学院、莫斯科物理技术学院和Skoltech科大的研究人员推出新型规模感知变换器SWITTI,它用于文本到图像的合成。SWITTI基于现有的下... 图像模型# AR模型# SWITTI 2周前01430
新型文生图框架Ranni:利于大语言模型,更准确地理解和执行复杂的文本提示 阿里巴巴和蚂蚁集团推出新型文生图框架Ranni,Ranni的核心特点是它能够更准确地理解和执行复杂的文本提示,尤其是那些包含数量描述、对象属性绑定和多主题描述的提示。这使得Ranni在生成图像时能够更... 图像模型# Ranni# 文生图模型 2周前03380
新型图像生成模型MoMA:具有灵活的零样本能力,专注于主体驱动的个性化图像生成 来自字节跳动和罗格斯大学的研究人员推出新型图像生成模型MoMA(Multimodal LLM Adapter),这是一个开放词汇、无需训练的个性化图像模型,具有灵活的零样本能力,专注于主体驱动的个性化... 图像模型# MoMA# 个性化图像生成# 文生图模型 2周前06260
新型文生图模型YaART:利用人类反馈的强化学习与人类偏好进行对齐 来自俄罗斯Yandex、斯科尔科沃科学技术学院、莫斯科国立大学和高等经济学院的研究团队推出新型的、适用于生产环境的文本到图像级联扩散模型YaART(Yet Another Art Rendering ... 图像模型# YaART# 文生图模型 2周前03230
图像编辑框架ByteEdit:提升基于扩散模型的生成性图像编辑任务的性能 字节跳动推出图像编辑框架ByteEdit,这是一个精心设计的创新反馈学习框架,旨在增强生成图像编辑任务的效果、提升遵从度,并加速处理速度。它专门用于提升基于扩散模型的生成性图像编辑任务的性能。Byte... 图像模型# ByteEdit# 图像编辑框架 2周前05860