图像模型

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

gen2seg：将生成模型（如Stable Diffusion和MAE）应用于实例分割任务

加州大学戴维斯分校的研究人员推出GEN2SEG，将生成模型（如Stable Diffusion和MAE）应用于实例分割任务，特别是对于那些在预训练和微调阶段未见过的物体类型和风格。通过微调这些生成模型...

9个月前

04300

开源版GPT-4o！字节跳动开源新一代多模态模型 BAGEL：多模态理解、图像生成、图像编辑，还能“思考”

字节跳动发布了一款名为 BAGEL 的开源多模态基础模型，该模型拥有 70 亿活跃参数（总规模为 140 亿），在大规模交错多模态数据上进行训练。BAGEL 不仅在标准多模态理解排行榜中超越了当前主流...

图像模型 # BAGEL # GPT-4o # 多模态模型

9个月前

08540

基于扩散模型的微调协议Marigold：用于各种图像分析任务，例如单目深度估计、表面法线预测和内在图像分解

苏黎世联邦理工学院的研究人员推出一个基于扩散模型（diffusion-based models）的微调协议Marigold，用于各种图像分析任务，例如单目深度估计、表面法线预测和内在图像分解。Mari...

图像模型 # Marigold # 扩散模型

9个月前

04220

新型图像训练自由方法 IP-Composer：从多个视觉概念中合成图像

特拉维夫大学和英伟达的研究人员介绍了一种名为 IP-Composer 的新型训练自由（training-free）方法，用于从多个视觉概念中合成图像。该方法通过自然语言描述从输入图像中提取特定概念，并...

图像模型 # IP-Composer

9个月前

04760

基于FLUX模型的图像定制框架DreamO：支持多种图像定制任务，同时实现多种条件（如身份、主体、风格、背景等）的无缝集成

字节跳动和北京大学深圳研究生院的研究人员推出一个基于DiT模型的图像定制框架DreamO ，旨在支持多种图像定制任务，同时实现多种条件（如身份、主体、风格、背景等）的无缝集成。它通过引入特征路由约束和...

图像模型 # DreamO # 图像定制框架

9个月前

03270

基于Flux模型的图像编辑框架Insert Anything：通过用户指定的灵活控制，将参考图像中的对象无缝整合到目标场景中

来自浙江大学、哈佛大学和南洋理工大学的研究人员提出了一种名为 Insert Anything 的创新框架，通过用户指定的灵活控制，将参考图像中的对象无缝整合到目标场景中。这一方法无需为每个任务...

图像模型 # Insert Anything # 图像编辑

10个月前

01640

专为漫画线稿上色设计的Cobra框架：能将黑白线稿转化为生动的插图

在漫画生产行业中，基于参考图像的线稿上色是一项既复杂又关键的任务。一页漫画通常包含多样的人物、物体和背景，这不仅要求上色过程具备高准确性、上下文一致性，还需要灵活控制以满足不同场景需求。然而，传统的扩...

图像模型 # Cobra # 上色模型 # 漫画线稿

10个月前

01900

字节跳动推出新型图像编辑方法 SuperEdit ：通过改进监督信号来提升基于指令的图像编辑性能

字节跳动和佛罗里达中央大学计算机视觉研究中心的研究人员推出新型图像编辑方法 SuperEdit ，通过改进监督信号来提升基于指令的图像编辑性能。项目主页：https://liming-ai.gith...

图像模型 # SuperEdit # 图像编辑 # 字节跳动

10个月前

02660

图像修复模型PixelHacker：基于潜在类别引导并结合扩散模型，显著提升图像修复质量

图像修复（Image Inpainting）是计算机视觉领域的重要研究方向，旨在通过生成合理的图像内容填补缺失或损坏的部分。然而，现有方法在处理复杂结构（如纹理、形状和空间关系）以及语义一致性（如颜色...

图像模型 # PixelHacker # 图像修复模型

10个月前

04200

浙江大学与哈佛大学联合推出高效图像编辑框架In-Context Edit：用自然语言指令轻松实现图像修改

浙江大学和哈佛大学的研究人员联合推出了ICEdit（In-Context Edit），这是一个高效且强大的基于指令的图像编辑框架。与传统方法相比，ICEdit 仅需 1% 的可训练参数（2 亿）和 ...

图像模型 # FLUX # ICEdit # In-Context Edit

10个月前

05700

Freepik 推出基于商业授权图像训练的 AI 图像生成模型 F Lite

在线图形设计平台 Freepik 于周二宣布推出一款新的开源图像生成模型——F Lite。这款模型完全基于商业授权的、“适合工作场所（SFW）”的图像进行训练，为用户提供安全、合法且高质量的图像生成服...

图像模型 # F Lite # Freepik # 图像生成模型

10个月前

02360

智象未来推出基于 HiDream-I1 的强大图像编辑模型HiDream-E1

北京智象未来科技在开源了图像生成基础模型HiDream-I1后，又在今天推出专注于图像编辑的专用模型HiDream-E1，这是一款专为图像编辑任务设计的先进模型，建立在 HiDream-I1 的核心功...

图像模型 # HiDream-E1 # HiDream-I1 # 图像编辑模型

10个月前

03720

加载更多

gen2seg：将生成模型（如Stable Diffusion和MAE）应用于实例分割任务

开源版GPT-4o！字节跳动开源新一代多模态模型 BAGEL：多模态理解、图像生成、图像编辑，还能“思考”

基于扩散模型的微调协议Marigold：用于各种图像分析任务，例如单目深度估计、表面法线预测和内在图像分解

新型图像训练自由方法 IP-Composer：从多个视觉概念中合成图像

基于FLUX模型的图像定制框架DreamO：支持多种图像定制任务，同时实现多种条件（如身份、主体、风格、背景等）的无缝集成

基于Flux模型的图像编辑框架Insert Anything：通过用户指定的灵活控制，将参考图像中的对象无缝整合到目标场景中

专为漫画线稿上色设计的Cobra框架：能将黑白线稿转化为生动的插图

字节跳动推出新型图像编辑方法 SuperEdit ：通过改进监督信号来提升基于指令的图像编辑性能

图像修复模型PixelHacker：基于潜在类别引导并结合扩散模型，显著提升图像修复质量

浙江大学与哈佛大学联合推出高效图像编辑框架In-Context Edit：用自然语言指令轻松实现图像修改

Freepik 推出基于商业授权图像训练的 AI 图像生成模型 F Lite

智象未来推出基于 HiDream-I1 的强大图像编辑模型HiDream-E1

A股智能分析系统

YouMind

OpenClaw

OpenClaw（Clawdbot/Moltbot）

MimiClaw

Fogsight (雾象)

图像模型

网址

A股智能分析系统

YouMind

OpenClaw

OpenClaw（Clawdbot/Moltbot）

MimiClaw

Fogsight (雾象)