图像模型

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

谷歌开源野生动物识别 AI 模型 SpeciesNet

谷歌本周宣布开源野生动物识别 AI 模型 SpeciesNet，帮助动物学家更高效地处理和分析大量野生动物监测影像。这一工具能够显著加快生物多样性监测和保育研究的进程。 SpeciesNet：AI 助...

图像模型 # SpeciesNet # 谷歌 # 野生动物

11个月前

04090

智谱开源首个支持汉字生成的开源文生图模型 CogView4

作为中国AI厂商中的开源先锋，智谱AI一直致力于推动技术开放与共享。这家清华系初创企业近年来通过与清华大学合作，开源了多个备受关注的AI模型系列，包括大语言模型GLM系列、文生图模型CogView系列...

图像模型 # CogView4 # 文生图模型 # 智谱

11个月前

03550

新型图像生成框架DREAM ENGINE：结合多模态模型和扩散模型，实现复杂文本-图像交错控制的图像生成任务

北京大学、阿里巴巴集团、华盛顿大学、北京理工大学和百安斯实验室的研究人员推出新型图像生成框架 DREAM ENGINE，它通过两阶段训练方法，将 QwenVL 等多模态编码器与扩散模型集成在一起，从而...

图像模型 # DREAM ENGINE # 图像生成 # 多模态模型

11个月前

03230

新型多层透明图像生成方法ART：通过全局文本提示和匿名区域布局直接生成具有多个透明图层的图像

微软亚洲研究院、清华大学、北京大学和中国科学技术大学的研究人员推出新型多层透明图像生成方法Anonymous Region Transformer (ART) ，通过全局文本提示和匿名区域布局直接生成...

图像模型 # ART # 透明图像

11个月前

02900

新单目深度估计模型Distill-Any-Depth：新型知识蒸馏框架的单目深度估计方法

单目深度估计（MDE）旨在从单一 RGB 图像中预测场景深度，是 3D 场景理解中的关键任务。近年来，零样本 MDE 的研究取得了显著进展，主要依赖归一化的深度表示和基于蒸馏的学习来提高模型在不同场景...

图像模型 # Distill-Any-Depth # 深度估计模型 # 知识蒸馏框架

11个月前

04050

SliderSpace：自动分解文生图模型的视觉能力，将其转化为简单的滑块控件，使用户能够更直观地控制生成结果

扩散模型（Diffusion Models）在生成高质量图像方面表现出色，但其生成过程的黑箱性质限制了用户的控制能力。为了增强扩散模型的可控性和可解释性，来自美国东北大学和 Adobe Researc...

图像模型 # Adobe Research # SliderSpace # 东北大学

11个月前

05120

基于DiT模型的多领域程序化序列生成框架MakeAnything：根据文本描述或图像生成分步骤的教程

新加坡国立大学的研究团队推出 MakeAnything，这是一个基于DiT模型的多领域程序化序列生成框架，能够根据文本描述或图像生成分步骤的教程，也就是生成一致性图片序列。 GitHub：https...

图像模型 # DiT模型 # MakeAnything

12个月前

02670

通义实验室推出基于指令的图像生成和编辑框架ACE++：基于FLUX.1-dev模型，实现多种图像生成和编辑任务

阿里巴巴通义实验室推出基于指令的图像生成和编辑框架ACE++，这是之前介绍过的新型多模态生成模型ACE升级版，ACE++ 通过改进的长上下文条件单元（LCU++）和两阶段训练方案，能够高效地利用预训练...

图像模型 # ACE # FLUX.1-dev # 图像生成

12个月前

03480

Stability AI释出Stable Diffusion 3 Medium模型，8G显存显卡即可使用

Stability AI终于在6月12日释出了万众期待的Stable Diffusion 3模型，不过此次释出的仅是 20 亿个参数的Stable Diffusion 3 Medium 模型，该型号尺...

图像模型 # SD3模型 # Stability AI # Stable Diffusion 3 Medium

12个月前

05,0500

单目深度估算模型Depth Anything V2：通过分析单张图片来预测物体距离

来自香港大学和TikTok的研究人员推出单目深度估算模型Depth Anything的升级版Depth Anything V2，让计算机通过分析单张图片来预测物体距离的技术，这在自动驾驶、3D建模和虚...

图像模型 # Depth Anything V2 # 单目深度估算模型

12个月前

01,2080

Fal.ai平台推出新DiT模型AuraFlow：支持文字，百分百开源

Stability AI因为Stable Diffusion 3 Medium模型的许可证问题备受诟病，虽然后来更改了许可证，但此模型在人物尤其是躺倒后人物的糟糕表现还是不受开源社区待见。不少人开始转...

图像模型 # AuraFlow # DiT模型 # Fal.ai

12个月前

06400

以Stable Cascade为基础！新型超高分辨率图像生成方法UltraPixel：生成从1K至6K多种分辨率的高品质图像

香港科技大学（广州）、华为诺亚方舟实验室、马克斯普朗克信息研究所和香港科技大学的研究人员推出一种新型超高分辨率图像生成方法UltraPixel，此方法是以Stability AI的模型Stable...

图像模型 # Stable Cascade # UltraPixel # 超高分辨率图像生成

12个月前

07150

加载更多

谷歌开源野生动物识别 AI 模型 SpeciesNet

智谱开源首个支持汉字生成的开源文生图模型 CogView4

新型图像生成框架DREAM ENGINE：结合多模态模型和扩散模型，实现复杂文本-图像交错控制的图像生成任务

新型多层透明图像生成方法ART：通过全局文本提示和匿名区域布局直接生成具有多个透明图层的图像

新单目深度估计模型Distill-Any-Depth：新型知识蒸馏框架的单目深度估计方法

SliderSpace：自动分解文生图模型的视觉能力，将其转化为简单的滑块控件，使用户能够更直观地控制生成结果

基于DiT模型的多领域程序化序列生成框架MakeAnything：根据文本描述或图像生成分步骤的教程

通义实验室推出基于指令的图像生成和编辑框架ACE++：基于FLUX.1-dev模型，实现多种图像生成和编辑任务

Stability AI释出Stable Diffusion 3 Medium模型，8G显存显卡即可使用

单目深度估算模型Depth Anything V2：通过分析单张图片来预测物体距离

Fal.ai平台推出新DiT模型AuraFlow：支持文字，百分百开源

以Stable Cascade为基础！新型超高分辨率图像生成方法UltraPixel：生成从1K至6K多种分辨率的高品质图像

新QoderWork

Clawdbot/Moltbot

Situation Monitor

中国科技云数据胶囊

ITELLOU

CutCut

图像模型

网址

新QoderWork

Clawdbot/Moltbot

Situation Monitor

中国科技云数据胶囊

ITELLOU

CutCut