图像模型

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

统一框架UniFL：通过统一的反馈学习来提升稳定扩散模型（Stable Diffusion）的性能

来自字节跳动和中山大学的研究人员推出利用反馈学习机制来全面增强扩散模型的统一框架UniFL，它通过统一的反馈学习来提升稳定扩散模型（Stable Diffusion）的性能。UniFL作为一种通用、高...

1年前

07640

新型文生图架构Diffusion-RWKV：基于RWKV模型，为改进图像生成任务而设计

昆仑万维推出新型文生图架构Diffusion-RWKV，它是为了改进图像生成任务而设计的。这个架构是基于RWKV模型，这是一种在自然语言处理（NLP）领域中使用的模型，但经过了特别的修改，使其更适合处...

图像模型 # Diffusion-RWKV # RWKV模型 # 文生图架构

1年前

04970

个性化视觉编辑框架SwapAnything：可以在保持上下文不变的情况下，用参考提供的个性化概念替换图像中的任何物体

来自加州大学圣克鲁斯分校和Adobe的研究人员推出个性化视觉编辑框架SwapAnything，它可以在保持上下文不变的情况下，用参考提供的个性化概念替换图像中的任何物体。与现有的个性化主体替换方法...

图像模型 # SwapAnything # 个性化视觉编辑

1年前

05260

新型框架Diffusion-KTO：用于调整文生图模型，使其生成的图像更符合人类的偏好

加州大学洛杉矶分校、松下人工智能研究中心和 Salesforce 人工智能研究中心的研究人员推出新型框架Diffusion-KTO，它专门用于调整文生图模型，使其生成的图像更符合人类的偏好。这个过程不...

图像模型 # Diffusion-KTO # 文生图模型

1年前

06590

创新图像生成框架BeyondScene：能够生成高分辨率（超过8K）、以人为中心的场景图像

来自韩国首尔国立大学的研究团队推出创新图像生成框架BeyondScene，它能够生成高分辨率（超过8K）、以人为中心的场景图像。这个框架特别擅长处理包含多个人物和复杂细节的场景，即使这些场景的描述超出...

图像模型 # BeyondScene # 图像生成框架 # 高分辨率

1年前

06850

图像编辑框架ByteEdit：提升基于扩散模型的生成性图像编辑任务的性能

字节跳动推出图像编辑框架ByteEdit，这是一个精心设计的创新反馈学习框架，旨在增强生成图像编辑任务的效果、提升遵从度，并加速处理速度。它专门用于提升基于扩散模型的生成性图像编辑任务的性能。Byte...

图像模型 # ByteEdit # 图像编辑框架

1年前

01,1730

新型文生图模型YaART：利用人类反馈的强化学习与人类偏好进行对齐

来自俄罗斯Yandex、斯科尔科沃科学技术学院、莫斯科国立大学和高等经济学院的研究团队推出新型的、适用于生产环境的文本到图像级联扩散模型YaART（Yet Another Art Rendering ...

图像模型 # YaART # 文生图模型

1年前

05850

新型图像生成模型MoMA：具有灵活的零样本能力，专注于主体驱动的个性化图像生成

来自字节跳动和罗格斯大学的研究人员推出新型图像生成模型MoMA（Multimodal LLM Adapter），这是一个开放词汇、无需训练的个性化图像模型，具有灵活的零样本能力，专注于主体驱动的个性化...

图像模型 # MoMA # 个性化图像生成 # 文生图模型

1年前

09530

新型文生图框架Ranni：利于大语言模型，更准确地理解和执行复杂的文本提示

阿里巴巴和蚂蚁集团推出新型文生图框架Ranni，Ranni的核心特点是它能够更准确地理解和执行复杂的文本提示，尤其是那些包含数量描述、对象属性绑定和多主题描述的提示。这使得Ranni在生成图像时能够更...

图像模型 # Ranni # 文生图模型

1年前

09020

新型文生图模型CoMat：更好地理解和执行文本描述，提高了文本到图像生成的质量和准确性

来自香港中文大学、商汤科技和上海人工智能实验室的研究人员推出新型文生图模型CoMat，这是一种具有图像到文本概念匹配机制的端到端扩散模型微调策略。开发团队借助图像字幕模型来评估图像与文本的对齐程度，并...

图像模型 # CoMat # 文生图模型

1年前

01,1520

CosmicMan：专注于生成高保真人类图像的文生图基础模型

上海人工智能实验室推出CosmicMan，这是一款专注于生成高保真人类图像的文本到图像基础模型。CosmicMan能够生成外观精细、结构合理，并且与详细描述精确对齐的逼真人类图像。项目主页：http...

图像模型 # CosmicMan # 文生图模型

1年前

01,1100

图像修复模型BrushNet:使用分解的双分支扩散方法来进行图像内容的恢复和编辑

来自腾讯PCG ARC实验室和香港中文大学的研究团队推出新型图像修复（inpainting）模型BrushNet，它使用了分解的双分支扩散（diffusion）方法来进行图像内容的恢复和编辑。图像修复...

图像模型 # BrushNet # 图像修复

1年前

01,0260

加载更多