图像生成

排序

发布更新浏览点赞

增强版多模态大语言模型ILLUME+ ：通过双视觉标记化和扩散解码器来提升深度语义理解和高保真图像生成的能力

近年来，多模态大语言模型（MLLMs）在图像理解、生成和编辑任务中取得了显著进展。然而，现有的统一模型在同时处理这三种任务时面临挑战。例如，早期的模型（如 Chameleon 和 EMU3）使用 VQ...

1年前

05700

OpenAI的图像生成器功能正式向所有用户开放，免费用户每天可生成三张图像

OpenAI的图像生成器功能正式向所有用户开放了！这一消息由OpenAI首席执行官萨姆·奥尔特曼在其X平台帖子中宣布。此前，该功能仅限于ChatGPT的付费用户使用，如今普通用户也能体验到这一强大的工...

早报 # OpenAI # 图像生成

1年前

02660

个性化图像生成和编辑方法SISO：适合在只有单张主题图像的情况下使用

巴伊兰大学和英伟达的研究人员推出一种无需训练的方法SISO，用于从单张主题图像进行个性化图像生成和编辑。SISO 是一种无需训练的方法，通过优化与输入主题图像的相似度分数来实现图像的个性化生成和编辑...

图像模型 # SISO # 图像生成 # 图像编辑

1年前

02060

xAI已推出图像生成API，每张图像的定价为0.07美元

埃隆·马斯克旗下AI公司xAI宣布为其API增加了图像生成功能，正式进军图像生成领域。xAI的图像生成API目前提供了一种名为“grok-2-image-1212”的模型。用户只需提供一个标题，该模型...

早报 # xAI # 图像生成

1年前

02890

新型图像生成框架DREAM ENGINE：结合多模态模型和扩散模型，实现复杂文本-图像交错控制的图像生成任务

北京大学、阿里巴巴集团、华盛顿大学、北京理工大学和百安斯实验室的研究人员推出新型图像生成框架 DREAM ENGINE，它通过两阶段训练方法，将 QwenVL 等多模态编码器与扩散模型集成在一起，从而...

图像模型 # DREAM ENGINE # 图像生成 # 多模态模型

1年前

03480

通义实验室推出基于指令的图像生成和编辑框架ACE++：基于FLUX.1-dev模型，实现多种图像生成和编辑任务

阿里巴巴通义实验室推出基于指令的图像生成和编辑框架ACE++，这是之前介绍过的新型多模态生成模型ACE升级版，ACE++ 通过改进的长上下文条件单元（LCU++）和两阶段训练方案，能够高效地利用预训练...

图像模型 # ACE # FLUX.1-dev # 图像生成

1年前

03520

智谱AI推出图像生成模型 CogView3 以及 CogView-3Plus

清华和智谱 AI的研究团队开源了图像生成模型 CogView3 以及CogView-3-Plus ，CogView3 是一个基于级联扩散的文本生成图像系统，采用了接力扩散（relay diffusio...

图像模型 # CogView-3Plus # CogView3 # 图像生成

1年前

06000

适用于FLUX模型的新型框架OminiControl：通过整合图像条件，使得DiT模型能够处理各种图像生成任务

新加坡国立大学的研究团队提出了一种名为OminiControl的新型框架，它旨在为预训练的DiT模型（FLUX模型）提供最小化和通用的控制。OminiControl通过整合图像条件，使得DiT模型能够...

Flux衍生 # FLUX模型 # OminiControl # 图像生成

1年前

04700

FireFlow：用于快速反转和编辑图像语义内容，提高图像生成和编辑的效率和准确性

尽管带有蒸馏的校正流（ReFlows）为快速采样提供了一种有前景的方法，但其快速反演过程——即将图像转换回结构化噪声以进行恢复和后续编辑——仍然面临挑战。具体来说，传统的ReFlow方法在反演过程中可...

新技术 # FireFlow # 图像生成

1年前

04020

解决图像生成与编辑任务的统一框架UniReal

图像生成和编辑任务在计算机视觉领域中具有广泛的应用，如图像合成、风格迁移、图像修复等。然而，现有的解决方案通常针对特定任务设计，缺乏一个统一的框架来处理多种图像级任务。香港大学和Adobe Resea...

新技术 # UniReal # 图像生成 # 图像编辑

1年前

03000

英伟达推出图像生成模型家族Edify Image：能够生成高保真度的图像内容，并且具有像素级完美准确性

英伟达推出图像生成模型家族Edify Image，它们能够生成高保真度的图像内容，并且具有像素级完美准确性。Edify Image利用了一系列级联的像素空间扩散模型，这些模型通过一个新颖的拉普拉斯扩散...

新技术 # Edify Image # 图像生成 # 英伟达

1年前

06450

基于常加速度方程的普通微分方程（ODE）框架CAF：用于学习两个分布之间的映射，特别是在图像生成领域

高丽大学和韩国科学技术研究院的研究人员推出新型框架Constant Acceleration Flow（CAF），它是一种基于常加速度方程的普通微分方程（ODE）框架，用于学习两个分布之间的映射，特别...

新技术 # CAF # 图像生成

1年前

04510

加载更多