个性化图像生成和编辑方法SISO:适合在只有单张主题图像的情况下使用 巴伊兰大学和英伟达的研究人员推出一种无需训练的方法SISO,用于从单张主题图像进行个性化图像生成和编辑。SISO 是一种无需训练的方法,通过优化与输入主题图像的相似度分数来实现图像的个性化生成和编辑。... 图像模型# SISO# 图像生成# 图像编辑 4天前0260
xAI已推出图像生成API,每张图像的定价为0.07美元 埃隆·马斯克旗下AI公司xAI宣布为其API增加了图像生成功能,正式进军图像生成领域。xAI的图像生成API目前提供了一种名为“grok-2-image-1212”的模型。用户只需提供一个标题,该模型... 早报# xAI# 图像生成 1周前0270
新型图像生成框架DREAM ENGINE:结合多模态模型和扩散模型,实现复杂文本-图像交错控制的图像生成任务 北京大学、阿里巴巴集团、华盛顿大学、北京理工大学和百安斯实验室的研究人员推出新型图像生成框架 DREAM ENGINE,它通过两阶段训练方法,将 QwenVL 等多模态编码器与扩散模型集成在一起,从而... 图像模型# DREAM ENGINE# 图像生成# 多模态模型 4周前0620
通义实验室推出基于指令的图像生成和编辑框架ACE++:基于FLUX.1-dev模型,实现多种图像生成和编辑任务 阿里巴巴通义实验室推出基于指令的图像生成和编辑框架ACE++,这是之前介绍过的新型多模态生成模型ACE升级版,ACE++ 通过改进的长上下文条件单元(LCU++)和两阶段训练方案,能够高效地利用预训练... 图像模型# ACE# FLUX.1-dev# 图像生成 2个月前01210
FireFlow:用于快速反转和编辑图像语义内容,提高图像生成和编辑的效率和准确性 尽管带有蒸馏的校正流(ReFlows)为快速采样提供了一种有前景的方法,但其快速反演过程——即将图像转换回结构化噪声以进行恢复和后续编辑——仍然面临挑战。具体来说,传统的ReFlow方法在反演过程中可... 新技术# FireFlow# 图像生成 4个月前01560
解决图像生成与编辑任务的统一框架UniReal 图像生成和编辑任务在计算机视觉领域中具有广泛的应用,如图像合成、风格迁移、图像修复等。然而,现有的解决方案通常针对特定任务设计,缺乏一个统一的框架来处理多种图像级任务。香港大学和Adobe Resea... 新技术# UniReal# 图像生成# 图像编辑 4个月前01380
适用于FLUX模型的新型框架OminiControl:通过整合图像条件,使得DiT模型能够处理各种图像生成任务 新加坡国立大学的研究团队提出了一种名为OminiControl的新型框架,它旨在为预训练的DiT模型(FLUX模型)提供最小化和通用的控制。OminiControl通过整合图像条件,使得DiT模型能够... Flux衍生# FLUX模型# OminiControl# 图像生成 2个月前01610
英伟达推出图像生成模型家族Edify Image:能够生成高保真度的图像内容,并且具有像素级完美准确性 英伟达推出图像生成模型家族Edify Image,它们能够生成高保真度的图像内容,并且具有像素级完美准确性。Edify Image利用了一系列级联的像素空间扩散模型,这些模型通过一个新颖的拉普拉斯扩散... 新技术# Edify Image# 图像生成# 英伟达 5个月前03010
基于常加速度方程的普通微分方程(ODE)框架CAF:用于学习两个分布之间的映射,特别是在图像生成领域 高丽大学和韩国科学技术研究院的研究人员推出新型框架Constant Acceleration Flow(CAF),它是一种基于常加速度方程的普通微分方程(ODE)框架,用于学习两个分布之间的映射,特别... 新技术# CAF# 图像生成 5个月前02030
新型图像生成技术“集合自回归模型”(SAR):通过改变图像生成的顺序和方式,使得生成图像的速度和灵活性都得到了极大的提升 香港中文大学MMLab 、上海人工智能实验室和南京大学的研究人员推出一种新的图像生成技术“集合自回归模型”(Set AutoRegressive Modeling,简称SAR)。你可以把它想象成一个超... 新技术# SAR# 图像生成# 集合自回归模型 5个月前02330
新型端到端模型DnD-Transformer:提高了图像生成任务的质量和效率,为图像生成领域带来了新的可能 北京大学、阿里巴巴集团、威斯康星大学麦迪逊分校和北京理工大学的研究人员推出新型端到端模型DnD-Transformer,这是一种用于高效细粒度图像生成的二维自回归Transformer。简单来说,这个... 新技术# DnD-Transformer# 图像生成 6个月前02860
智谱AI推出图像生成模型 CogView3 以及 CogView-3Plus 清华和智谱 AI的研究团队开源了图像生成模型 CogView3 以及CogView-3-Plus ,CogView3 是一个基于级联扩散的文本生成图像系统,采用了接力扩散(relay diffusio... 图像模型# CogView-3Plus# CogView3# 图像生成 2个月前04280