gen2seg:将生成模型(如Stable Diffusion和MAE)应用于实例分割任务加州大学戴维斯分校的研究人员推出GEN2SEG,将生成模型(如Stable Diffusion和MAE)应用于实例分割任务,特别是对于那些在预训练和微调阶段未见过的物体类型和风格。通过微调这些生成模型...图像模型# gen2seg# 实例分割# 生成模型9个月前04300
开源版GPT-4o!字节跳动开源新一代多模态模型 BAGEL:多模态理解、图像生成、图像编辑,还能“思考”字节跳动发布了一款名为 BAGEL 的开源多模态基础模型,该模型拥有 70 亿活跃参数(总规模为 140 亿),在大规模交错多模态数据上进行训练。BAGEL 不仅在标准多模态理解排行榜中超越了当前主流...图像模型# BAGEL# GPT-4o# 多模态模型9个月前08540
基于扩散模型的微调协议Marigold:用于各种图像分析任务,例如单目深度估计、表面法线预测和内在图像分解苏黎世联邦理工学院的研究人员推出一个基于扩散模型(diffusion-based models)的微调协议Marigold,用于各种图像分析任务,例如单目深度估计、表面法线预测和内在图像分解。Mari...图像模型# Marigold# 扩散模型9个月前04220
新型图像训练自由方法 IP-Composer:从多个视觉概念中合成图像特拉维夫大学和英伟达的研究人员介绍了一种名为 IP-Composer 的新型训练自由(training-free)方法,用于从多个视觉概念中合成图像。该方法通过自然语言描述从输入图像中提取特定概念,并...图像模型# IP-Composer9个月前04760
基于FLUX模型的图像定制框架DreamO:支持多种图像定制任务,同时实现多种条件(如身份、主体、风格、背景等)的无缝集成字节跳动和北京大学深圳研究生院的研究人员推出一个基于DiT模型的图像定制框架DreamO ,旨在支持多种图像定制任务,同时实现多种条件(如身份、主体、风格、背景等)的无缝集成。它通过引入特征路由约束和...图像模型# DreamO# 图像定制框架9个月前03270
基于Flux模型的图像编辑框架Insert Anything:通过用户指定的灵活控制,将参考图像中的对象无缝整合到目标场景中来自 浙江大学、哈佛大学 和 南洋理工大学 的研究人员提出了一种名为 Insert Anything 的创新框架,通过用户指定的灵活控制,将参考图像中的对象无缝整合到目标场景中。这一方法无需为每个任务...图像模型# Insert Anything# 图像编辑10个月前01640
专为漫画线稿上色设计的Cobra框架:能将黑白线稿转化为生动的插图在漫画生产行业中,基于参考图像的线稿上色是一项既复杂又关键的任务。一页漫画通常包含多样的人物、物体和背景,这不仅要求上色过程具备高准确性、上下文一致性,还需要灵活控制以满足不同场景需求。然而,传统的扩...图像模型# Cobra# 上色模型# 漫画线稿10个月前01900
字节跳动推出新型图像编辑方法 SuperEdit :通过改进监督信号来提升基于指令的图像编辑性能字节跳动和佛罗里达中央大学计算机视觉研究中心的研究人员推出新型图像编辑方法 SuperEdit ,通过改进监督信号来提升基于指令的图像编辑性能。 项目主页:https://liming-ai.gith...图像模型# SuperEdit# 图像编辑# 字节跳动10个月前02660
图像修复模型PixelHacker:基于潜在类别引导并结合扩散模型,显著提升图像修复质量图像修复(Image Inpainting)是计算机视觉领域的重要研究方向,旨在通过生成合理的图像内容填补缺失或损坏的部分。然而,现有方法在处理复杂结构(如纹理、形状和空间关系)以及语义一致性(如颜色...图像模型# PixelHacker# 图像修复模型10个月前04200
浙江大学与哈佛大学联合推出高效图像编辑框架In-Context Edit:用自然语言指令轻松实现图像修改浙江大学和哈佛大学的研究人员联合推出了ICEdit(In-Context Edit),这是一个高效且强大的基于指令的图像编辑框架。 与传统方法相比,ICEdit 仅需 1% 的可训练参数(2 亿)和 ...图像模型# FLUX# ICEdit# In-Context Edit10个月前05700
Freepik 推出基于商业授权图像训练的 AI 图像生成模型 F Lite在线图形设计平台 Freepik 于周二宣布推出一款新的开源图像生成模型——F Lite。这款模型完全基于商业授权的、“适合工作场所(SFW)”的图像进行训练,为用户提供安全、合法且高质量的图像生成服...图像模型# F Lite# Freepik# 图像生成模型10个月前02360
智象未来推出基于 HiDream-I1 的强大图像编辑模型HiDream-E1北京智象未来科技在开源了图像生成基础模型HiDream-I1后,又在今天推出专注于图像编辑的专用模型HiDream-E1,这是一款专为图像编辑任务设计的先进模型,建立在 HiDream-I1 的核心功...图像模型# HiDream-E1# HiDream-I1# 图像编辑模型10个月前03720