统一视觉理解与生成框架UniWorld:支持 20+语义图片编辑任务北京大学深圳研究生院、鹏城实验室、兔展AI的研究人员推出统一视觉理解与生成框架UniWorld,它基于强大的视觉-语言模型和对比语义编码器,能够同时处理图像感知和图像操控任务。 GitHub:http...图像模型# UniWorld# 图像生成# 图像编辑6个月前03300
Black Forest Labs 推出新一代上下文感知图像生成模型FLUX.1 Kontext,支持图像生成及编辑继 FLUX.1 系列大获成功后,Black Forest Labs(黑森林实验室) 在今天正式发布其最新力作 —— FLUX.1 Kontext。 这是一套全新的上下文流匹配生成模型(Context...图像模型# Black Forest Labs# FLUX.1 Kontext# 黑森林实验室6个月前05270
OmniConsistency:解决图像风格化中“一致性”难题的通用插件,提升了图像风格化的一致性与美学质量在图像风格化领域,扩散模型已经取得了显著进展。然而,两个核心问题始终困扰着研究者与开发者: 如何在复杂场景下保持一致的风格化效果? 尤其是在身份、构图和细节上的保留。 如何防止图像到图像(I2I)流水...图像模型# OmniConsistency# 图像风格化6个月前03950
开源版GPT-4o!字节跳动开源新一代多模态模型 BAGEL:多模态理解、图像生成、图像编辑,还能“思考”字节跳动发布了一款名为 BAGEL 的开源多模态基础模型,该模型拥有 70 亿活跃参数(总规模为 140 亿),在大规模交错多模态数据上进行训练。BAGEL 不仅在标准多模态理解排行榜中超越了当前主流...图像模型# BAGEL# GPT-4o# 多模态模型7个月前07180
gen2seg:将生成模型(如Stable Diffusion和MAE)应用于实例分割任务加州大学戴维斯分校的研究人员推出GEN2SEG,将生成模型(如Stable Diffusion和MAE)应用于实例分割任务,特别是对于那些在预训练和微调阶段未见过的物体类型和风格。通过微调这些生成模型...图像模型# gen2seg# 实例分割# 生成模型7个月前03440
基于扩散模型的微调协议Marigold:用于各种图像分析任务,例如单目深度估计、表面法线预测和内在图像分解苏黎世联邦理工学院的研究人员推出一个基于扩散模型(diffusion-based models)的微调协议Marigold,用于各种图像分析任务,例如单目深度估计、表面法线预测和内在图像分解。Mari...图像模型# Marigold# 扩散模型7个月前03150
新型图像训练自由方法 IP-Composer:从多个视觉概念中合成图像特拉维夫大学和英伟达的研究人员介绍了一种名为 IP-Composer 的新型训练自由(training-free)方法,用于从多个视觉概念中合成图像。该方法通过自然语言描述从输入图像中提取特定概念,并...图像模型# IP-Composer7个月前03320
基于FLUX模型的图像定制框架DreamO:支持多种图像定制任务,同时实现多种条件(如身份、主体、风格、背景等)的无缝集成字节跳动和北京大学深圳研究生院的研究人员推出一个基于DiT模型的图像定制框架DreamO ,旨在支持多种图像定制任务,同时实现多种条件(如身份、主体、风格、背景等)的无缝集成。它通过引入特征路由约束和...图像模型# DreamO# 图像定制框架7个月前02700
基于Flux模型的图像编辑框架Insert Anything:通过用户指定的灵活控制,将参考图像中的对象无缝整合到目标场景中来自 浙江大学、哈佛大学 和 南洋理工大学 的研究人员提出了一种名为 Insert Anything 的创新框架,通过用户指定的灵活控制,将参考图像中的对象无缝整合到目标场景中。这一方法无需为每个任务...图像模型# Insert Anything# 图像编辑7个月前01610
专为漫画线稿上色设计的Cobra框架:能将黑白线稿转化为生动的插图在漫画生产行业中,基于参考图像的线稿上色是一项既复杂又关键的任务。一页漫画通常包含多样的人物、物体和背景,这不仅要求上色过程具备高准确性、上下文一致性,还需要灵活控制以满足不同场景需求。然而,传统的扩...图像模型# Cobra# 上色模型# 漫画线稿7个月前01750
基于 GenAI 的视觉内容创作控制框架ZenCtrl:利用单张主体图像生成多视角、多样化场景的高分辨率图像,无需额外微调ZenCtrl 是一款基于 GenAI 的视觉内容创作控制框架,专注于利用单张主体图像生成多视角、多样化场景的高分辨率图像,无需额外微调。它通过精细的控制能力和模块化设计,为创作者提供了一个强大且灵活...图像模型# OminiControl# ZenCtrl# 图像控制框架7个月前04350
字节跳动推出新型图像编辑方法 SuperEdit :通过改进监督信号来提升基于指令的图像编辑性能字节跳动和佛罗里达中央大学计算机视觉研究中心的研究人员推出新型图像编辑方法 SuperEdit ,通过改进监督信号来提升基于指令的图像编辑性能。 项目主页:https://liming-ai.gith...图像模型# SuperEdit# 图像编辑# 字节跳动7个月前02400