文生图模型

排序

发布更新浏览点赞

SliderSpace：自动分解文生图模型的视觉能力，将其转化为简单的滑块控件，使用户能够更直观地控制生成结果

扩散模型（Diffusion Models）在生成高质量图像方面表现出色，但其生成过程的黑箱性质限制了用户的控制能力。为了增强扩散模型的可控性和可解释性，来自美国东北大学和 Adobe Researc...

1年前

05700

文字处理能力出众！Playground推出最新文生图模型Playground v3

Playground 推出了Playground v3（PGv3），这是Playground最新的文本到图像模型，在多个测试基准上达到了最先进的（SoTA）性能，在图形设计能力上表现出色，并引入了新的...

图像模型 # Playground v3 # 文生图模型

1年前

04580

Collov Labs推出非自回归掩码图像建模的文本到图像合成模型Monetico

Collov Labs 最近在8块H100 GPU上训练了一周时间，推出了新的非自回归掩码图像建模的文本到图像合成模型——Monetico。这款模型能够生成高分辨率图像，并且被设计为在消费级显卡上高效...

图像模型 # Monetico # 文生图模型

1年前

04840

SWITTI：用于文本到图像合成的新型规模感知变换器模型

Yandex Research、HSE 大学、MIPT 和 Skoltech 的研究人员提出了 Switti，这是一个专门设计用于文本到图像（T2I）生成的尺度变换器。Switti 从现有的下一尺度预...

图像模型 # SWITTI # 文生图模型

1年前

03140

新型文生图框架Ranni：利于大语言模型，更准确地理解和执行复杂的文本提示

阿里巴巴和蚂蚁集团推出新型文生图框架Ranni，Ranni的核心特点是它能够更准确地理解和执行复杂的文本提示，尤其是那些包含数量描述、对象属性绑定和多主题描述的提示。这使得Ranni在生成图像时能够更...

图像模型 # Ranni # 文生图模型

1年前

08810

新型图像生成模型MoMA：具有灵活的零样本能力，专注于主体驱动的个性化图像生成

来自字节跳动和罗格斯大学的研究人员推出新型图像生成模型MoMA（Multimodal LLM Adapter），这是一个开放词汇、无需训练的个性化图像模型，具有灵活的零样本能力，专注于主体驱动的个性化...

图像模型 # MoMA # 个性化图像生成 # 文生图模型

1年前

09510

新型文生图模型YaART：利用人类反馈的强化学习与人类偏好进行对齐

来自俄罗斯Yandex、斯科尔科沃科学技术学院、莫斯科国立大学和高等经济学院的研究团队推出新型的、适用于生产环境的文本到图像级联扩散模型YaART（Yet Another Art Rendering ...

图像模型 # YaART # 文生图模型

1年前

05810

新型框架Diffusion-KTO：用于调整文生图模型，使其生成的图像更符合人类的偏好

加州大学洛杉矶分校、松下人工智能研究中心和 Salesforce 人工智能研究中心的研究人员推出新型框架Diffusion-KTO，它专门用于调整文生图模型，使其生成的图像更符合人类的偏好。这个过程不...

图像模型 # Diffusion-KTO # 文生图模型

1年前

06580