文生图模型

排序

发布更新浏览点赞

韩国科学技术研究院推出专门针对文生图模型的新型数据投毒攻击方法Silent Branding Attack

韩国科学技术研究院和DeepAuto.ai的研究人员推出一种新型数据投毒攻击方法Silent Branding Attack ，专门针对文生图模型。该方法能够在文生图模型中隐秘地嵌入特定品牌标志或符号...

1年前

04790

结合了大语言模型与文生图模型的新框架SGEdit：用于基于场景图的精确和灵活的图像编辑

场景图提供了一种结构化、层次化的图像表示方式，其中节点和边分别代表图像中的对象及其相互关系。这种方式不仅能够帮助用户更直观地理解图像内容，还能作为图像编辑的有效接口，极大提升了编辑工作的准确性和灵活性...

新技术 # SGEdit # 图像编辑 # 大语言模型

1年前

04680

Fluid: 基于连续令牌和随机顺序生成的文生图模型

在视觉领域，自回归模型的扩展并没有像在大语言模型中那样取得显著的成功。为了探索这一问题，Google DeepMind 和麻省理工学院的研究人员进行了一项研究，重点探讨了两个关键因素：模型是使用离散还...

新技术 # Fluid:# 文生图模型

1年前

04670

半策略偏好优化方法SePPO：用于优化和微调文生图模型，使其更好地符合人类的审美和偏好

罗切斯特大学、普渡大学、延世大学、腾讯 AI 实验室和华盛顿大学的研究人员推出半策略偏好优化方法SePPO，用于优化和微调扩散模型（如用于生成图像的模型），使其更好地符合人类的审美和偏好，而无需依赖外...

新技术 # SePPO # 半策略偏好优化 # 文生图模型

1年前

04630

腾讯混元开源 HunyuanImage 2.1：支持 2K 分辨率的高效文生图模型

腾讯混元项目组正式开源HunyuanImage 2.1，一款支持 2048×2048 超高分辨率（2K）生成的文生图模型。该模型在语义对齐、细节控制与推理效率方面实现显著提升，具备电影级构图能力，并原...

图像模型 # HunyuanImage 2.1 # 文生图模型

7个月前

04610

文字处理能力出众！Playground推出最新文生图模型Playground v3

Playground 推出了Playground v3（PGv3），这是Playground最新的文本到图像模型，在多个测试基准上达到了最先进的（SoTA）性能，在图形设计能力上表现出色，并引入了新的...

图像模型 # Playground v3 # 文生图模型

1年前

04580

micro_diffusion ：一种低成本训练文生图模型的方法

索尼 AI和加州大学河滨分校的研究人员推出了一种低成本训练大规模文本到图像（Text-to-Image, T2I）扩散模型的方法micro_diffusion 。该方法通过创新的“延迟掩码”（defe...

新技术 # micro_diffusion # 文生图模型

1年前

04570

如何在保持计算效率的同时，将原始文生图模型的多样性和控制能力转移到高效的蒸馏模型中

美国东北大学的研究人员发布论文《Distilling Diversity and Control in Diffusion Models》，探讨了如何在保持计算效率的同时，将原始扩散模型的多样性和控制...

新技术 # 文生图模型 # 蒸馏模型

1年前

04480

新型文本到图像生成技术GrounDiT：利用DiT实现了无需训练的空间定位能力，实现更精细的用户控制

韩国科学技术研究院推出新型文本到图像生成技术GrounDiT（GROUNDIT），它通过利用DiT实现了无需训练的空间定位能力，用于在文本到图像生成中实现更精细的用户控制。这项技术特别关注于在图像生成...

新技术 # GrounDiT # 文生图模型

1年前

04140

英伟达提出 DC-Gen：用于加速扩散模型的后训练框架，生成速度快 53 倍

在文生图领域，高分辨率输出（如 4K）正成为标配。然而，随之而来的计算成本和推理延迟问题日益凸显——以当前领先的 FLUX.1-Krea-12B 模型为例，在英伟达H100 GPU 上生成一张 4K ...

图像模型 # DC-Gen # 文生图模型 # 英伟达

6个月前

03600

智谱开源首个支持汉字生成的开源文生图模型 CogView4

作为中国AI厂商中的开源先锋，智谱AI一直致力于推动技术开放与共享。这家清华系初创企业近年来通过与清华大学合作，开源了多个备受关注的AI模型系列，包括大语言模型GLM系列、文生图模型CogView系列...

图像模型 # CogView4 # 文生图模型 # 智谱

1年前

03600

SANA模型的升级版SANA 1.5：实现高质量的图像生成，同时显著降低了训练和推理成本

英伟达、麻省理工学院、清华大学、Playground和北京大学的研究团队推出了SANA模型的升级版SANA 1.5，这是一款高效的DiT架构模型，通过创新的训练和推理策略，实现文本到图像生成任务中的高...

图像模型 # DiT架构模型 # SANA 1.5 # 文生图模型

1年前

03430

加载更多