图像模型

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

统一视觉理解与生成框架UniWorld：支持 20+语义图片编辑任务

北京大学深圳研究生院、鹏城实验室、兔展AI的研究人员推出统一视觉理解与生成框架UniWorld，它基于强大的视觉-语言模型和对比语义编码器，能够同时处理图像感知和图像操控任务。 GitHub：http...

8个月前

03910

Black Forest Labs 推出新一代上下文感知图像生成模型FLUX.1 Kontext，支持图像生成及编辑

继 FLUX.1 系列大获成功后，Black Forest Labs（黑森林实验室）在今天正式发布其最新力作 —— FLUX.1 Kontext。这是一套全新的上下文流匹配生成模型（Context...

图像模型 # Black Forest Labs # FLUX.1 Kontext # 黑森林实验室

8个月前

06510

OmniConsistency：解决图像风格化中“一致性”难题的通用插件，提升了图像风格化的一致性与美学质量

在图像风格化领域，扩散模型已经取得了显著进展。然而，两个核心问题始终困扰着研究者与开发者：如何在复杂场景下保持一致的风格化效果？尤其是在身份、构图和细节上的保留。如何防止图像到图像（I2I）流水...

图像模型 # OmniConsistency # 图像风格化

8个月前

04130

gen2seg：将生成模型（如Stable Diffusion和MAE）应用于实例分割任务

加州大学戴维斯分校的研究人员推出GEN2SEG，将生成模型（如Stable Diffusion和MAE）应用于实例分割任务，特别是对于那些在预训练和微调阶段未见过的物体类型和风格。通过微调这些生成模型...

图像模型 # gen2seg # 实例分割 # 生成模型

8个月前

04100

开源版GPT-4o！字节跳动开源新一代多模态模型 BAGEL：多模态理解、图像生成、图像编辑，还能“思考”

字节跳动发布了一款名为 BAGEL 的开源多模态基础模型，该模型拥有 70 亿活跃参数（总规模为 140 亿），在大规模交错多模态数据上进行训练。BAGEL 不仅在标准多模态理解排行榜中超越了当前主流...

图像模型 # BAGEL # GPT-4o # 多模态模型

8个月前

07970

基于扩散模型的微调协议Marigold：用于各种图像分析任务，例如单目深度估计、表面法线预测和内在图像分解

苏黎世联邦理工学院的研究人员推出一个基于扩散模型（diffusion-based models）的微调协议Marigold，用于各种图像分析任务，例如单目深度估计、表面法线预测和内在图像分解。Mari...

图像模型 # Marigold # 扩散模型

9个月前

03910

新型图像训练自由方法 IP-Composer：从多个视觉概念中合成图像

特拉维夫大学和英伟达的研究人员介绍了一种名为 IP-Composer 的新型训练自由（training-free）方法，用于从多个视觉概念中合成图像。该方法通过自然语言描述从输入图像中提取特定概念，并...

图像模型 # IP-Composer

9个月前

04400

基于FLUX模型的图像定制框架DreamO：支持多种图像定制任务，同时实现多种条件（如身份、主体、风格、背景等）的无缝集成

字节跳动和北京大学深圳研究生院的研究人员推出一个基于DiT模型的图像定制框架DreamO ，旨在支持多种图像定制任务，同时实现多种条件（如身份、主体、风格、背景等）的无缝集成。它通过引入特征路由约束和...

图像模型 # DreamO # 图像定制框架

9个月前

02800

基于Flux模型的图像编辑框架Insert Anything：通过用户指定的灵活控制，将参考图像中的对象无缝整合到目标场景中

来自浙江大学、哈佛大学和南洋理工大学的研究人员提出了一种名为 Insert Anything 的创新框架，通过用户指定的灵活控制，将参考图像中的对象无缝整合到目标场景中。这一方法无需为每个任务...

图像模型 # Insert Anything # 图像编辑

9个月前

01620

专为漫画线稿上色设计的Cobra框架：能将黑白线稿转化为生动的插图

在漫画生产行业中，基于参考图像的线稿上色是一项既复杂又关键的任务。一页漫画通常包含多样的人物、物体和背景，这不仅要求上色过程具备高准确性、上下文一致性，还需要灵活控制以满足不同场景需求。然而，传统的扩...

图像模型 # Cobra # 上色模型 # 漫画线稿

9个月前

01860

字节跳动推出新型图像编辑方法 SuperEdit ：通过改进监督信号来提升基于指令的图像编辑性能

字节跳动和佛罗里达中央大学计算机视觉研究中心的研究人员推出新型图像编辑方法 SuperEdit ，通过改进监督信号来提升基于指令的图像编辑性能。项目主页：https://liming-ai.gith...

图像模型 # SuperEdit # 图像编辑 # 字节跳动

9个月前

02580

图像修复模型PixelHacker：基于潜在类别引导并结合扩散模型，显著提升图像修复质量

图像修复（Image Inpainting）是计算机视觉领域的重要研究方向，旨在通过生成合理的图像内容填补缺失或损坏的部分。然而，现有方法在处理复杂结构（如纹理、形状和空间关系）以及语义一致性（如颜色...

图像模型 # PixelHacker # 图像修复模型

9个月前

03920

加载更多

统一视觉理解与生成框架UniWorld：支持 20+语义图片编辑任务

Black Forest Labs 推出新一代上下文感知图像生成模型FLUX.1 Kontext，支持图像生成及编辑

OmniConsistency：解决图像风格化中“一致性”难题的通用插件，提升了图像风格化的一致性与美学质量

gen2seg：将生成模型（如Stable Diffusion和MAE）应用于实例分割任务

开源版GPT-4o！字节跳动开源新一代多模态模型 BAGEL：多模态理解、图像生成、图像编辑，还能“思考”

基于扩散模型的微调协议Marigold：用于各种图像分析任务，例如单目深度估计、表面法线预测和内在图像分解

新型图像训练自由方法 IP-Composer：从多个视觉概念中合成图像

基于FLUX模型的图像定制框架DreamO：支持多种图像定制任务，同时实现多种条件（如身份、主体、风格、背景等）的无缝集成

基于Flux模型的图像编辑框架Insert Anything：通过用户指定的灵活控制，将参考图像中的对象无缝整合到目标场景中

专为漫画线稿上色设计的Cobra框架：能将黑白线稿转化为生动的插图

字节跳动推出新型图像编辑方法 SuperEdit ：通过改进监督信号来提升基于指令的图像编辑性能

图像修复模型PixelHacker：基于潜在类别引导并结合扩散模型，显著提升图像修复质量

新QoderWork

Clawdbot/Moltbot

Situation Monitor

中国科技云数据胶囊

CutCut

Fogsight (雾象)

图像模型

网址

新QoderWork

Clawdbot/Moltbot

Situation Monitor

中国科技云数据胶囊

CutCut

Fogsight (雾象)