图像模型

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

创新图像生成框架BeyondScene：能够生成高分辨率（超过8K）、以人为中心的场景图像

来自韩国首尔国立大学的研究团队推出创新图像生成框架BeyondScene，它能够生成高分辨率（超过8K）、以人为中心的场景图像。这个框架特别擅长处理包含多个人物和复杂细节的场景，即使这些场景的描述超出...

1年前

06690

图像编辑框架ByteEdit：提升基于扩散模型的生成性图像编辑任务的性能

字节跳动推出图像编辑框架ByteEdit，这是一个精心设计的创新反馈学习框架，旨在增强生成图像编辑任务的效果、提升遵从度，并加速处理速度。它专门用于提升基于扩散模型的生成性图像编辑任务的性能。Byte...

图像模型 # ByteEdit # 图像编辑框架

1年前

01,1270

新型文生图模型YaART：利用人类反馈的强化学习与人类偏好进行对齐

来自俄罗斯Yandex、斯科尔科沃科学技术学院、莫斯科国立大学和高等经济学院的研究团队推出新型的、适用于生产环境的文本到图像级联扩散模型YaART（Yet Another Art Rendering ...

图像模型 # YaART # 文生图模型

1年前

05720

新型图像生成模型MoMA：具有灵活的零样本能力，专注于主体驱动的个性化图像生成

来自字节跳动和罗格斯大学的研究人员推出新型图像生成模型MoMA（Multimodal LLM Adapter），这是一个开放词汇、无需训练的个性化图像模型，具有灵活的零样本能力，专注于主体驱动的个性化...

图像模型 # MoMA # 个性化图像生成 # 文生图模型

1年前

09460

新型文生图框架Ranni：利于大语言模型，更准确地理解和执行复杂的文本提示

阿里巴巴和蚂蚁集团推出新型文生图框架Ranni，Ranni的核心特点是它能够更准确地理解和执行复杂的文本提示，尤其是那些包含数量描述、对象属性绑定和多主题描述的提示。这使得Ranni在生成图像时能够更...

图像模型 # Ranni # 文生图模型

1年前

08200

新型文生图模型CoMat：更好地理解和执行文本描述，提高了文本到图像生成的质量和准确性

来自香港中文大学、商汤科技和上海人工智能实验室的研究人员推出新型文生图模型CoMat，这是一种具有图像到文本概念匹配机制的端到端扩散模型微调策略。开发团队借助图像字幕模型来评估图像与文本的对齐程度，并...

图像模型 # CoMat # 文生图模型

1年前

01,1120

CosmicMan：专注于生成高保真人类图像的文生图基础模型

上海人工智能实验室推出CosmicMan，这是一款专注于生成高保真人类图像的文本到图像基础模型。CosmicMan能够生成外观精细、结构合理，并且与详细描述精确对齐的逼真人类图像。项目主页：http...

图像模型 # CosmicMan # 文生图模型

1年前

01,0570

图像修复模型BrushNet:使用分解的双分支扩散方法来进行图像内容的恢复和编辑

来自腾讯PCG ARC实验室和香港中文大学的研究团队推出新型图像修复（inpainting）模型BrushNet，它使用了分解的双分支扩散（diffusion）方法来进行图像内容的恢复和编辑。图像修复...

图像模型 # BrushNet # 图像修复

1年前

09480

IDAdapter：根据单张面部照片和文本提示，生成多种风格、角度和表情的个性化图像，而无需在推理阶段进行任何微调

来自北京大学、InsightFace和格灵深瞳推出IDAdapter，它能够根据单张面部照片和文本提示，生成多种风格、角度和表情的个性化图像，而无需在推理阶段进行任何微调。论文 IDAdapter通...

图像模型 # IDAdapter # 个性化图像

1年前

06470

SD3-Turbo模型：在四步无指导采样的情况下，生成与最先进的文本到图像生成器相匹配的图像质量

Stability AI还没发布Stable Diffusion 3，就已经发布了SD3-Turbo的技术论文，着重介绍了LADD技术，它是一种用于加速图像合成的新型蒸馏技术。论文地址 SD3-Tu...

图像模型 # SD3-Turbo # Stability AI # Stable Diffusion 3

1年前

09280

海贼王漫画风格LoRA模型：One Piece Manga Style

One Piece Manga Style是一款基于 PONYDIFFUSION XL训练的LoRA模型，此LoRA需要搭配Pony Diffusion模型才能出好图，在书写提示词的时候需要添加触发词...

图像模型 # LoRA模型 # 海贼王

1年前

07040

华为PixArt系列最新模型—PIXART-Σ：基于DiT，可直接生成4K分辨率的图像

来自华为诺亚方舟实验室、大连理工大学、香港大学的研究人员推出了最新的PixArt模型—PIXART-Σ，PixArt-Σ基于Diffusion Transformer架构 (DiT，与Sora、Sta...

图像模型 # DiT # PIXART-Σ # 文生图模型

1年前

01,0300

加载更多