图像模型

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

MagicTailor框架：让用户对生成的图像中的特定视觉元素进行精确控制

近年来，文本到图像（T2I）扩散模型取得了显著进展，能够从简单的文本提示中生成高质量的图像。然而，这些模型在精确控制特定视觉概念生成方面仍然面临挑战。现有的方法可以通过参考图像学习复制给定的概念，但缺...

图像模型 # MagicTailor # 图像定制

1年前

05730

文字处理能力出众！Playground推出最新文生图模型Playground v3

Playground 推出了Playground v3（PGv3），这是Playground最新的文本到图像模型，在多个测试基准上达到了最先进的（SoTA）性能，在图形设计能力上表现出色，并引入了新的...

图像模型 # Playground v3 # 文生图模型

1年前

04510

非自回归 MIM 文生图合成模型Meissonic：生成高质量、高分辨率的图像

随着大语言模型（LLMs）在自然语言处理任务中的显著进步，研究人员开始探索类似的文本到图像合成方法。与此同时，扩散模型已经成为视觉生成的主流方法。然而，由于语言和视觉任务之间存在显著的操作差异，开发统...

图像模型 # Meissonic # 文生图合成模型

1年前

03900

新型图像抠图方法SEMat：能够在复杂的自然场景中实现更精确的前景对象抠图

近年来，交互式分割模型（如 SAM）在图像分割任务中取得了显著进展。然而，这些模型在应用于交互式抠图任务时面临挑战，尤其是在处理复杂和遮挡场景时。现有的方法通常在合成数据上训练模型，但这些模型难以泛化...

图像模型 # SEMat # 图像抠图

1年前

06610

新型文生图框架SANA：能够高效地生成高达4096×4096分辨率的高清晰度图像

英伟达、麻省理工学院和清华大学的研究人员推出新型文本到图像生成框架SANA，它能够高效地生成高达4096×4096分辨率的高清晰度图像。SANA的核心优势在于它不仅生成的图像质量高，而且与文本的匹配度...

图像模型 # SANA # 文生图框架

1年前

07800

用于长篇故事视觉化的迭代框架Story-Adapter：根据长篇故事的文字描述生成一系列既连贯又具有丰富细节的图像

加州大学圣克鲁斯分校、杭州电子科技大学和新加坡理工学院的研究人员推出一个用于长篇故事视觉化的迭代框架Story-Adapter，Story-Adapter能够根据长篇故事的文字描述生成一系列既连贯又具...

图像模型 # Story-Adapter # 长篇故事视觉化

1年前

09500

IterComp：为了解决文本到图像生成中的复杂和组合问题而设计的新框架

清华大学、北京大学、LibAI Lab、中国科学技术大学、牛津大学和普林斯顿大学的研究人员推出AI绘画新框架IterComp，它是为了解决文本到图像生成中的复杂和组合问题而设计的。简单来说，就是当你给...

图像模型 # IterComp # 文本到图像

1年前

06980

图像恢复算法PMRF：改善从损坏的图像中恢复出高质量、逼真图像

以色列理工学院的研究人员推出图像恢复算法PMRF（Posterior-Mean Rectified Flow，后验均值校正流），这个算法的目标是改善从损坏的图像中恢复出高质量、逼真图像的方法。具体来说...

图像模型 # PMRF # 图像恢复算法

1年前

06500

Momo XL：基于SDXL的动漫风格模型

Momo XL 是一个基于 Stable Diffusion XL (SDXL) 的动漫风格模型，经过微调后，能够生成具有详细和生动美学的优质动漫风格图像。这款模型专为艺术家和动漫爱好者设计，提供了多...

图像模型 # Momo XL # SDXL # 动漫风格

1年前

05010

高级插图模型Illustrious：专门针对插画和动画任务进行了优化，主要用于生成动漫风格的图像

OnomaAI 研究小组推出一个高级插图模型Illustrious，它主要用于生成动漫风格的图像。Illustrious XL是一个基于SDXL的模型，专门针对插画和动画任务进行了优化。它是基于 Ko...

图像模型 # Illustrious # Illustrious XL # 插图模型

1年前

01,2290

智谱AI推出图像生成模型 CogView3 以及 CogView-3Plus

清华和智谱 AI的研究团队开源了图像生成模型 CogView3 以及CogView-3-Plus ，CogView3 是一个基于级联扩散的文本生成图像系统，采用了接力扩散（relay diffusio...

图像模型 # CogView-3Plus # CogView3 # 图像生成

1年前

05920

小红书推出图像生成模型StoryMaker：不仅能保持面部一致性，还能保持服装、发型和身体的一致性，从而通过一系列图像促进故事的创作

小红书推出图像生成模型StoryMaker，它专门设计用于在文本到图像的生成过程中保持人物的一致性。这种一致性不仅限于人物的面部特征，还包括服装、发型和身体特征。通过这种方式，StoryMaker能够...

图像模型 # StoryMaker # 小红书

1年前

05180

加载更多