微信 AI 模式识别中心推出视觉语言模型POINTS1.5系列,旨在提升对真实世界应用的处...
2024-12-13 76

Moondream 是一款高效的开源视觉语言模型(VLM),它将强大的图像理解能力与极小的...
2024-12-07 90

今年5月,谷歌推出了 PaliGemma,这是 Gemma 家族中的第一个视觉语言模型,旨在使...
2024-12-06 78

Qwen2vl-Flux 是一种先进的跨模态图像生成模型,它将Qwen2VL的视觉语言理解能力与F...
2024-11-26 94

Nexa AI 最新发布了 OmniVision-968M,这是一款专为边缘设备设计的视觉语言模型,...
2024-11-16 268

JoyCaption,一个从零开始构建的免费、开放且未经审查的视觉语言模型(VLM),旨在...
2024-09-23 314

韩国研究人员推出视觉语言模型CoLLaVO(Crayon Large Language and Vision mOdel...
2024-02-21 552

来自腾讯AI实验室、华中科技大学EIC学院的研究人员推出高效实时开放词汇对象检测...
2024-02-01 619
没有账号?注册  忘记密码?