英伟达和延世大学的研究人员推出多模态大语言模型Omni-RGPT,旨在统一图像和视频的...
4天前 38

加州大学默塞德分校、字节跳动、武汉大学和北京大学的研究人员推出新型多模态大语...
2周前 52

上海人工智能实验室、浙江大学、中国科学技术大学、上海交通大学、中国科学院深圳...
3周前 76

开发当代多模态大语言模型(MLLMs)的标准做法是将视觉编码器的特征输入到大型语言...
2024-12-14 88

随着多模态大语言模型(MLLMs)的发展,扩展到单一领域之外的能力对于满足更通用和...
2024-12-14 94

华为诺亚方舟实验室发布多模态大语言模型ILLUME,旨在无缝集成图像和文本的理解与...
2024-12-12 88

InternVL 2.5 是由上海人工智能实验室、商汤科技研究院、清华大学、南京大学、复旦...
2024-12-10 84

马里兰大学和微软研究院的研究团队共同提出了Florence-VL,这是一个全新的多模态大...
2024-12-06 78

IDEA的研究人员推出多模态大语言模型ChatRex,它旨在提升对人类姿态的感知和理解能...
2024-12-01 90

近年来,多模态基础模型在视觉-语言理解领域取得了显著进展,同时也开始探索多模态...
2024-10-24 212

 Ovis1.6-Gemma2-9B是阿里国际推出的一款多模态大语言模型,Ovis是一种新颖的多模...
2024-10-12 294

Qwen2-VL-7B-Captioner-Relaxed 是 Qwen2-VL-7B-Instruct 的一个经过指令调整的版...
2024-09-24 316
没有账号?注册  忘记密码?