英伟达和延世大学的研究人员推出多模态大语言模型Omni-RGPT,旨在统一图像和视频的...
3周前 60

加州大学默塞德分校、字节跳动、武汉大学和北京大学的研究人员推出新型多模态大语...
4周前 78

上海人工智能实验室、浙江大学、中国科学技术大学、上海交通大学、中国科学院深圳...
2024-12-31 94

开发当代多模态大语言模型(MLLMs)的标准做法是将视觉编码器的特征输入到大型语言...
2024-12-14 100

随着多模态大语言模型(MLLMs)的发展,扩展到单一领域之外的能力对于满足更通用和...
2024-12-14 106

华为诺亚方舟实验室发布多模态大语言模型ILLUME,旨在无缝集成图像和文本的理解与...
2024-12-12 106

InternVL 2.5 是由上海人工智能实验室、商汤科技研究院、清华大学、南京大学、复旦...
2024-12-10 96

马里兰大学和微软研究院的研究团队共同提出了Florence-VL,这是一个全新的多模态大...
2024-12-06 96

IDEA的研究人员推出多模态大语言模型ChatRex,它旨在提升对人类姿态的感知和理解能...
2024-12-01 110

近年来,多模态基础模型在视觉-语言理解领域取得了显著进展,同时也开始探索多模态...
2024-10-24 230

 Ovis1.6-Gemma2-9B是阿里国际推出的一款多模态大语言模型,Ovis是一种新颖的多模...
2024-10-12 312

Qwen2-VL-7B-Captioner-Relaxed 是 Qwen2-VL-7B-Instruct 的一个经过指令调整的版...
2024-09-24 342
没有账号?注册  忘记密码?