图像模型

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

Drawing2CAD：一键把二维工程图转成三维参数化 CAD 模型

在工业设计、机械工程、产品开发领域，有一个长期存在的“效率瓶颈”：设计师画好了二维工程图 → 工程师手动在 CAD 软件里重建三维模型 → 耗时、易错、难迭代。现在，这个问题有了一个自动化解法 ...

图像模型 # CAD 模型 # Drawing2CAD

5个月前

04470

文字处理能力出众！Playground推出最新文生图模型Playground v3

Playground 推出了Playground v3（PGv3），这是Playground最新的文本到图像模型，在多个测试基准上达到了最先进的（SoTA）性能，在图形设计能力上表现出色，并引入了新的...

图像模型 # Playground v3 # 文生图模型

12个月前

04410

新型图像训练自由方法 IP-Composer：从多个视觉概念中合成图像

特拉维夫大学和英伟达的研究人员介绍了一种名为 IP-Composer 的新型训练自由（training-free）方法，用于从多个视觉概念中合成图像。该方法通过自然语言描述从输入图像中提取特定概念，并...

图像模型 # IP-Composer

9个月前

04400

BRIA AI推出最新开源背景移除模型RMBG v2.0

RMBG v2.0 是由 BRIA AI 最新研发的先进背景移除模型，能够在各种类别和图像类型中有效地将前景与背景分离。该模型经过精心挑选的数据集训练，包括通用库存图片、电子商务、游戏和广告内容，使其...

图像模型 # BRIA AI # RMBG v2.0 # 背景移除模型

12个月前

04160

HSMR：用于从单张图像中重建具有生物力学准确骨架的三维人体模型

德克萨斯大学奥斯汀分校和浙江大学的研究人员推出HSMR，用于从单张图像中重建具有生物力学准确骨架的三维人体模型。该方法通过训练一个基于 Transformer 的网络，估计生物力学模型 SKEL 的参...

图像模型 # HSMR # 三维人体模型 # 骨架

10个月前

04150

OmniConsistency：解决图像风格化中“一致性”难题的通用插件，提升了图像风格化的一致性与美学质量

在图像风格化领域，扩散模型已经取得了显著进展。然而，两个核心问题始终困扰着研究者与开发者：如何在复杂场景下保持一致的风格化效果？尤其是在身份、构图和细节上的保留。如何防止图像到图像（I2I）流水...

图像模型 # OmniConsistency # 图像风格化

8个月前

04130

gen2seg：将生成模型（如Stable Diffusion和MAE）应用于实例分割任务

加州大学戴维斯分校的研究人员推出GEN2SEG，将生成模型（如Stable Diffusion和MAE）应用于实例分割任务，特别是对于那些在预训练和微调阶段未见过的物体类型和风格。通过微调这些生成模型...

图像模型 # gen2seg # 实例分割 # 生成模型

8个月前

04100

谷歌开源野生动物识别 AI 模型 SpeciesNet

谷歌本周宣布开源野生动物识别 AI 模型 SpeciesNet，帮助动物学家更高效地处理和分析大量野生动物监测影像。这一工具能够显著加快生物多样性监测和保育研究的进程。 SpeciesNet：AI 助...

图像模型 # SpeciesNet # 谷歌 # 野生动物

11个月前

04090

新单目深度估计模型Distill-Any-Depth：新型知识蒸馏框架的单目深度估计方法

单目深度估计（MDE）旨在从单一 RGB 图像中预测场景深度，是 3D 场景理解中的关键任务。近年来，零样本 MDE 的研究取得了显著进展，主要依赖归一化的深度表示和基于蒸馏的学习来提高模型在不同场景...

图像模型 # Distill-Any-Depth # 深度估计模型 # 知识蒸馏框架

11个月前

04050

SD3.5M-Booster ：专门为 SD3.5 Medium 模型设计的增强 LoRA

SD3.5M-Booster 是一个专门为 SD3.5 Medium 模型设计的增强 LoRA，旨在将模型的性能提升到最高水平。通过增强细节、颜色和对比度，SD3.5M-Booster 能够显著改善生...

图像模型 # SD3.5 Medium # SD3.5M-Booster

12个月前

04050

新型多模态生成模型UniDisc：基于离散扩散过程的统一生成模型，能够同时理解和生成文本和图像

卡内基梅隆大学的研究人员推出新型多模态生成模型 UniDisc（Unified Multimodal Discrete Diffusion），UniDisc 是一个基于离散扩散过程的统一生成模型，能够...

图像模型 # UniDisc # 多模态生成模型

10个月前

04030

Playground推出Playground v3：不仅在图形设计方面表现出色，还引入了一些新的能力，比如精确的RGB颜色控制和强大的多语言理解能力

Playground上线了Playground v3 beta版本，同时还发布了技术报告，与传统的依赖T5或CLIP文本编码器的预训练语言模型的文本到图像生成模型不同，Playground v3完全集...

图像模型 # Playground v3

12个月前

04030

加载更多

Drawing2CAD：一键把二维工程图转成三维参数化 CAD 模型

文字处理能力出众！Playground推出最新文生图模型Playground v3

新型图像训练自由方法 IP-Composer：从多个视觉概念中合成图像

BRIA AI推出最新开源背景移除模型RMBG v2.0

HSMR：用于从单张图像中重建具有生物力学准确骨架的三维人体模型

OmniConsistency：解决图像风格化中“一致性”难题的通用插件，提升了图像风格化的一致性与美学质量

gen2seg：将生成模型（如Stable Diffusion和MAE）应用于实例分割任务

谷歌开源野生动物识别 AI 模型 SpeciesNet

新单目深度估计模型Distill-Any-Depth：新型知识蒸馏框架的单目深度估计方法

SD3.5M-Booster ：专门为 SD3.5 Medium 模型设计的增强 LoRA

新型多模态生成模型UniDisc：基于离散扩散过程的统一生成模型，能够同时理解和生成文本和图像

Playground推出Playground v3：不仅在图形设计方面表现出色，还引入了一些新的能力，比如精确的RGB颜色控制和强大的多语言理解能力

新QoderWork

Clawdbot/Moltbot

Situation Monitor

中国科技云数据胶囊

CutCut

Fogsight (雾象)

图像模型

网址

新QoderWork

Clawdbot/Moltbot

Situation Monitor

中国科技云数据胶囊

CutCut

Fogsight (雾象)