尽管视频感知能力已经迅速集成到大型多模态模型(LMMs)中,但其驱动视频理解的基...
6天前 34

香港中文大学、英伟达、上海人工智能实验室、InnoHK和香港理工大学的研究人员推出...
1周前 48

复旦大学计算机学院、上海创新学院和华为诺亚方舟实验室的研究人员提出了Inst-IT,...
2周前 52

近年来,随着机器学习技术的飞速发展,视觉-语言模型(VLM)的需求不断增加。这些...
3周前 56

多模态AI模型是能够理解和生成视觉内容的强大工具。然而,现有方法通常使用单一视...
2024-10-18 370

Rhymes AI推出新型多模态原生模型Aria,这是一个开源的混合专家(MoE)模型,ARIA...
2024-10-11 222

字节跳动、南洋理工大学S-Lab和北京邮电大学的研究人员推出大型多模态模型LLaVA-Vi...
2024-10-05 240

字节跳动和马里兰大学帕克分校的研究人员推出新型开源大型多模态模型LLaVA-Critic...
2024-10-05 180

智源研究院推出Emu3,这是一个全新的多模态系列模型,它仅使用下一个词元(Token)...
2024-09-29 158

华盛顿大学和艾伦人工智能研究所的研究人员推出新型多模态模型家族Molmo,这些模型...
2024-09-27 156

Meta、Waymo和南加州大学的研究人员推出多模态模型Transfusion,它能够同时处理离...
2024-08-21 292

清华大学和阿里巴巴的研究人员推出新型大型多模态模型ConvLLaVA,它专门设计用于处...
2024-05-27 406
没有账号?注册  忘记密码?