开发当代多模态大语言模型(MLLMs)的标准做法是将视觉编码器的特征输入到大型语言...
1周前 50

随着多模态大语言模型(MLLMs)的发展,扩展到单一领域之外的能力对于满足更通用和...
1周前 42

华为诺亚方舟实验室发布多模态大语言模型ILLUME,旨在无缝集成图像和文本的理解与...
2周前 44

InternVL 2.5 是由上海人工智能实验室、商汤科技研究院、清华大学、南京大学、复旦...
2周前 48

马里兰大学和微软研究院的研究团队共同提出了Florence-VL,这是一个全新的多模态大...
2周前 42

IDEA的研究人员推出多模态大语言模型ChatRex,它旨在提升对人类姿态的感知和理解能...
3周前 46

近年来,多模态基础模型在视觉-语言理解领域取得了显著进展,同时也开始探索多模态...
2024-10-24 172

 Ovis1.6-Gemma2-9B是阿里国际推出的一款多模态大语言模型,Ovis是一种新颖的多模...
2024-10-12 250

Qwen2-VL-7B-Captioner-Relaxed 是 Qwen2-VL-7B-Instruct 的一个经过指令调整的版...
2024-09-24 244

清华大学、腾讯和南洋理工大学 S-Lab的研究人员推出多模态大语言模型Oryx,它专门...
2024-09-20 296

厦门大学的研究人员推出新型多模态大语言模型INF-LLaVA,它专门设计用于处理高分辨...
2024-07-24 312

香港科技大学(广州)、腾讯、香港中文大学和香港科技大学的研究人员推出新型多模...
2024-07-14 636
没有账号?注册  忘记密码?