图像模型

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

新型文生图架构Diffusion-RWKV：基于RWKV模型，为改进图像生成任务而设计

昆仑万维推出新型文生图架构Diffusion-RWKV，它是为了改进图像生成任务而设计的。这个架构是基于RWKV模型，这是一种在自然语言处理（NLP）领域中使用的模型，但经过了特别的修改，使其更适合处...

12个月前

04890

个性化视觉编辑框架SwapAnything：可以在保持上下文不变的情况下，用参考提供的个性化概念替换图像中的任何物体

来自加州大学圣克鲁斯分校和Adobe的研究人员推出个性化视觉编辑框架SwapAnything，它可以在保持上下文不变的情况下，用参考提供的个性化概念替换图像中的任何物体。与现有的个性化主体替换方法...

图像模型 # SwapAnything # 个性化视觉编辑

12个月前

05180

新型框架Diffusion-KTO：用于调整文生图模型，使其生成的图像更符合人类的偏好

加州大学洛杉矶分校、松下人工智能研究中心和 Salesforce 人工智能研究中心的研究人员推出新型框架Diffusion-KTO，它专门用于调整文生图模型，使其生成的图像更符合人类的偏好。这个过程不...

图像模型 # Diffusion-KTO # 文生图模型

12个月前

06480

创新图像生成框架BeyondScene：能够生成高分辨率（超过8K）、以人为中心的场景图像

来自韩国首尔国立大学的研究团队推出创新图像生成框架BeyondScene，它能够生成高分辨率（超过8K）、以人为中心的场景图像。这个框架特别擅长处理包含多个人物和复杂细节的场景，即使这些场景的描述超出...

图像模型 # BeyondScene # 图像生成框架 # 高分辨率

12个月前

06620

图像编辑框架ByteEdit：提升基于扩散模型的生成性图像编辑任务的性能

字节跳动推出图像编辑框架ByteEdit，这是一个精心设计的创新反馈学习框架，旨在增强生成图像编辑任务的效果、提升遵从度，并加速处理速度。它专门用于提升基于扩散模型的生成性图像编辑任务的性能。Byte...

图像模型 # ByteEdit # 图像编辑框架

12个月前

01,0790

新型文生图模型YaART：利用人类反馈的强化学习与人类偏好进行对齐

来自俄罗斯Yandex、斯科尔科沃科学技术学院、莫斯科国立大学和高等经济学院的研究团队推出新型的、适用于生产环境的文本到图像级联扩散模型YaART（Yet Another Art Rendering ...

图像模型 # YaART # 文生图模型

12个月前

05690

新型图像生成模型MoMA：具有灵活的零样本能力，专注于主体驱动的个性化图像生成

来自字节跳动和罗格斯大学的研究人员推出新型图像生成模型MoMA（Multimodal LLM Adapter），这是一个开放词汇、无需训练的个性化图像模型，具有灵活的零样本能力，专注于主体驱动的个性化...

图像模型 # MoMA # 个性化图像生成 # 文生图模型

12个月前

09440

新型文生图框架Ranni：利于大语言模型，更准确地理解和执行复杂的文本提示

阿里巴巴和蚂蚁集团推出新型文生图框架Ranni，Ranni的核心特点是它能够更准确地理解和执行复杂的文本提示，尤其是那些包含数量描述、对象属性绑定和多主题描述的提示。这使得Ranni在生成图像时能够更...

图像模型 # Ranni # 文生图模型

12个月前

07810

新型文生图模型CoMat：更好地理解和执行文本描述，提高了文本到图像生成的质量和准确性

来自香港中文大学、商汤科技和上海人工智能实验室的研究人员推出新型文生图模型CoMat，这是一种具有图像到文本概念匹配机制的端到端扩散模型微调策略。开发团队借助图像字幕模型来评估图像与文本的对齐程度，并...

图像模型 # CoMat # 文生图模型

12个月前

01,0660

CosmicMan：专注于生成高保真人类图像的文生图基础模型

上海人工智能实验室推出CosmicMan，这是一款专注于生成高保真人类图像的文本到图像基础模型。CosmicMan能够生成外观精细、结构合理，并且与详细描述精确对齐的逼真人类图像。项目主页：http...

图像模型 # CosmicMan # 文生图模型

12个月前

01,0080

图像修复模型BrushNet:使用分解的双分支扩散方法来进行图像内容的恢复和编辑

来自腾讯PCG ARC实验室和香港中文大学的研究团队推出新型图像修复（inpainting）模型BrushNet，它使用了分解的双分支扩散（diffusion）方法来进行图像内容的恢复和编辑。图像修复...

图像模型 # BrushNet # 图像修复

12个月前

09100

IDAdapter：根据单张面部照片和文本提示，生成多种风格、角度和表情的个性化图像，而无需在推理阶段进行任何微调

来自北京大学、InsightFace和格灵深瞳推出IDAdapter，它能够根据单张面部照片和文本提示，生成多种风格、角度和表情的个性化图像，而无需在推理阶段进行任何微调。论文 IDAdapter通...

图像模型 # IDAdapter # 个性化图像

12个月前

06410

加载更多

新型文生图架构Diffusion-RWKV：基于RWKV模型，为改进图像生成任务而设计

个性化视觉编辑框架SwapAnything：可以在保持上下文不变的情况下，用参考提供的个性化概念替换图像中的任何物体

新型框架Diffusion-KTO：用于调整文生图模型，使其生成的图像更符合人类的偏好

创新图像生成框架BeyondScene：能够生成高分辨率（超过8K）、以人为中心的场景图像

图像编辑框架ByteEdit：提升基于扩散模型的生成性图像编辑任务的性能

新型文生图模型YaART：利用人类反馈的强化学习与人类偏好进行对齐

新型图像生成模型MoMA：具有灵活的零样本能力，专注于主体驱动的个性化图像生成

新型文生图框架Ranni：利于大语言模型，更准确地理解和执行复杂的文本提示

新型文生图模型CoMat：更好地理解和执行文本描述，提高了文本到图像生成的质量和准确性

CosmicMan：专注于生成高保真人类图像的文生图基础模型

图像修复模型BrushNet:使用分解的双分支扩散方法来进行图像内容的恢复和编辑

IDAdapter：根据单张面部照片和文本提示，生成多种风格、角度和表情的个性化图像，而无需在推理阶段进行任何微调

新QoderWork

OpenClaw（Clawdbot/Moltbot）

新OpenClaw

Fogsight (雾象)

Lumine

Google AI Studio

图像模型

网址

新QoderWork

OpenClaw（Clawdbot/Moltbot）

新OpenClaw

Fogsight (雾象)

Lumine

Google AI Studio