图像生成模型

排序

发布更新浏览点赞

新型图像生成模型Hourglass Diffusion Transformer（HDiT）

Stability AI、慕尼黑大学和Birchlabs的开发人员提出了一种名为Hourglass Diffusion Transformer（HDiT）的新型图像生成模型，该模型在保持高分辨率图像合...

2年前

01,0550

新型图像生成模型FiT:基于Transformer架构，可以生成无限制分辨率和长宽比的图像

FiT（Flexible Vision Transformer）是一款新型图像生成模型，基于Transformer架构，旨在生成具有无限制分辨率和长宽比的图像。 GitHub 论文模型传统的图像生...

新技术 # FiT # Transformer # 图像生成模型

2年前

08290

基于Transformer架构的新型图像生成模型DART：根据文本描述生成高质量的图像

苹果和香港中文大学的研究人员推出新型图像生成模型DART，这个模型的目标是让计算机能够根据文本描述生成高质量的图像。DART是一个基于Transformer架构的模型，它在非马尔可夫框架内统一了自回归...

新技术 # DART # Transformer架构 # 图像生成模型

1年前

06990

苹果推出新型图像生成模型Kaleido Diffusion：通过整合自回归的潜在先验来增强采样的图像多样性

苹果和弗吉尼亚理工大学的研究人员推出新型图像生成模型Kaleido Diffusion，此模型旨在通过自回归潜在模型（autoregressive latent modeling）提高扩散模型（dif...

新技术 # Kaleido Diffusion # 图像生成模型 # 苹果

2年前

05940

智象未来开源全新的170 亿参数图像生成基础模型HiDream-I1

北京智象未来科技开源了一款全新的图像生成基础模型HiDream-I1，其拥有 170 亿个参数，能够在几秒内实现顶尖的图像生成效果。这一模型提供了三种变体：Full、Dev 和 Fast，以满足不同用...

图像模型 # HiDream-I1 # 图像生成模型 # 智象未来

12个月前

05850

MiniMax 发布其首个文本到图像生成模型 Image-01

MiniMax 近日正式发布了其首个文本到图像生成模型 Image-01，标志着其在多模态视觉领域的重大突破。Image-01 不仅扩展了 MiniMax 的 AI 功能，还为全球用户带来了极具创意和...

早报 # Image-01 # MiniMax # 图像生成模型

1年前

05770

谷歌旗下最新图像生成模型Imagen2，已在Bard和ImageFX上线

无论是制作音乐、获取编程帮助还是创建图像，像Lyria、Codey和Imagen这样的基于任务的AI模型正在帮助人们将创意变为现实。自从去年推出以来，我们的Imagen技术已经帮助人们和企业仅使用几...

工具 # Bard # ImageFX # Imagen2

2年前

05630

阿里 Qwen 项目组发布 Qwen-Image：首个 20B 级 MMDiT 图像生成基础模型

阿里 Qwen 项目组正式推出 Qwen-Image，这是通义千问系列中首个专注于图像生成的基础大模型。基于 20B 参数的 MMDiT（Multimodal Diffusion Transforme...

图像模型 # Qwen-Image # 图像生成模型

8个月前

04780

北京人工智能研究院推出新型图像生成模型OmniGen

北京人工智能研究院推出新型图像生成模型OmniGen，与流行的扩散模型（例如，Stable Diffusion）不同，OmniGen不再需要额外的模块，如ControlNet或IP-Adapter来处...

新技术 # OmniGen # 图像生成模型

1年前

04560

字节跳动提出的新一代多主体可控图像生成模型XVerse

在文本到图像生成领域，如何实现对多个主体身份和语义属性（如姿势、风格、照明）的细粒度控制，同时保持高质量和一致性，一直是一个极具挑战性的问题。传统方法往往存在以下问题：在多主体场景中容易引入视觉伪...

图像模型 # XVerse # 图像生成模型

9个月前

04520

Luma AI推出新型生成模型框架IMM：实现仅 8 步内生成高质量图像

Luma AI和斯坦福大学的研究人员推出新型生成模型框架 Inductive Moment Matching (IMM) ，旨在解决扩散模型（Diffusion Models）和流匹配（Flow Ma...

新技术 # IMM # Luma AI # 图像生成模型

1年前

04390

Science-T2I框架：通过整合科学知识，提升图像合成模型生成图像的现实感和科学一致性

纽约大学、华盛顿大学、宾夕法尼亚大学和加州大学圣地亚哥分校介绍了一个名为 Science-T2I 的框架，旨在通过整合科学知识，提升图像合成模型生成图像的现实感和科学一致性。该研究的核心是解决现有图...

图像模型 # Science-T2I # 图像生成模型 # 科学

11个月前

03290

加载更多