图像生成

排序

发布更新浏览点赞

新型图像生成框架DREAM ENGINE：结合多模态模型和扩散模型，实现复杂文本-图像交错控制的图像生成任务

北京大学、阿里巴巴集团、华盛顿大学、北京理工大学和百安斯实验室的研究人员推出新型图像生成框架 DREAM ENGINE，它通过两阶段训练方法，将 QwenVL 等多模态编码器与扩散模型集成在一起，从而...

1年前

03480

基于 ComfyUI 平台构建的协作式 AI 系统ComfyMind：打造稳定、灵活、可扩展的通用生成平台

随着生成模型的飞速发展，“通用生成（General-Purpose Generation）”正成为 AI 领域的新焦点。它旨在通过一个统一系统，支持图像、视频、文本等多种模态任务的生成与编辑，为复杂创...

新技术 # ComfyMind # 图像生成 # 视频生成

10个月前

03410

解决图像生成与编辑任务的统一框架UniReal

图像生成和编辑任务在计算机视觉领域中具有广泛的应用，如图像合成、风格迁移、图像修复等。然而，现有的解决方案通常针对特定任务设计，缺乏一个统一的框架来处理多种图像级任务。香港大学和Adobe Resea...

新技术 # UniReal # 图像生成 # 图像编辑

1年前

03000

Meta AI 推出高效图像生成新方法Token-Shuffle：在 Transformer 中减少图像 Token

自回归（AR）模型在语言生成领域取得了巨大成功，但在高分辨率图像合成中的应用却面临严峻挑战。与文本不同，图像需要数千个 token 来表示，导致计算成本呈二次方增长。这使得大多数基于 AR 的多模态模...

新技术 # Meta AI # Token-Shuffle # 图像生成

11个月前

02910

xAI已推出图像生成API，每张图像的定价为0.07美元

埃隆·马斯克旗下AI公司xAI宣布为其API增加了图像生成功能，正式进军图像生成领域。xAI的图像生成API目前提供了一种名为“grok-2-image-1212”的模型。用户只需提供一个标题，该模型...

早报 # xAI # 图像生成

1年前

02890

OpenAI的图像生成器功能正式向所有用户开放，免费用户每天可生成三张图像

OpenAI的图像生成器功能正式向所有用户开放了！这一消息由OpenAI首席执行官萨姆·奥尔特曼在其X平台帖子中宣布。此前，该功能仅限于ChatGPT的付费用户使用，如今普通用户也能体验到这一强大的工...

早报 # OpenAI # 图像生成

1年前

02660

新型框架 EliGen：用于实现图像生成中的实体级控制

浙江大学控制科学与工程学院、阿里巴巴集团ModelScope团队和华东师范大学的研究人员推出新型框架 EliGen，用于实现图像生成中的实体级控制。EliGen 通过引入区域注意力（Regional ...

图像模型 # EliGen # 图像生成

1年前

02380

个性化图像生成和编辑方法SISO：适合在只有单张主题图像的情况下使用

巴伊兰大学和英伟达的研究人员推出一种无需训练的方法SISO，用于从单张主题图像进行个性化图像生成和编辑。SISO 是一种无需训练的方法，通过优化与输入主题图像的相似度分数来实现图像的个性化生成和编辑...

图像模型 # SISO # 图像生成 # 图像编辑

1年前

02060

DreamOmni2：支持图文指令的统一图像生成与编辑模型

香港中文大学、香港科技大学与字节跳动联合推出开源模型 DreamOmni2，旨在突破当前 AI 图像编辑与生成的两大瓶颈：纯文本指令表达力有限，以及现有模型难以处理抽象概念（如风格、纹理、妆容等）。 ...

图像模型 # DreamOmni2 # 图像生成

6个月前

01790

Ollama 新增图像生成功能！macOS 率先体验，双模型（Z-Image Turbo 与 FLUX.2 Klein）支持中英文本渲染 + 高精度创作

Ollama 正式上线图像生成实验性功能，目前已在 macOS 系统开放使用，Windows 和 Linux 版本也即将推出。该功能无需复杂配置，仅需一行终端命令就能调用文生图模型生成图像，支持直接在...

工具 # LUX.2 Klein # Ollama # Z-Image-Turbo

2个月前

0560

没有了