Qwen2vl-Flux 是一种先进的跨模态图像生成模型,它将Qwen2VL的视觉语言理解能力与F...
1周前 44

Nexa AI 最新发布了 OmniVision-968M,这是一款专为边缘设备设计的视觉语言模型,...
3周前 196

JoyCaption,一个从零开始构建的免费、开放且未经审查的视觉语言模型(VLM),旨在...
2024-09-23 224

韩国研究人员推出视觉语言模型CoLLaVO(Crayon Large Language and Vision mOdel...
2024-02-21 508

来自腾讯AI实验室、华中科技大学EIC学院的研究人员推出高效实时开放词汇对象检测...
2024-02-01 573
没有账号?注册  忘记密码?