尽管视频感知能力已经迅速集成到大型多模态模型(LMMs)中,但其驱动视频理解的基...
6天前 34
香港中文大学、英伟达、上海人工智能实验室、InnoHK和香港理工大学的研究人员推出...
1周前 48
复旦大学计算机学院、上海创新学院和华为诺亚方舟实验室的研究人员提出了Inst-IT,...
2周前 52
近年来,随着机器学习技术的飞速发展,视觉-语言模型(VLM)的需求不断增加。这些...
3周前 56
多模态AI模型是能够理解和生成视觉内容的强大工具。然而,现有方法通常使用单一视...
2024-10-18 370
Rhymes AI推出新型多模态原生模型Aria,这是一个开源的混合专家(MoE)模型,ARIA...
2024-10-11 222
字节跳动、南洋理工大学S-Lab和北京邮电大学的研究人员推出大型多模态模型LLaVA-Vi...
2024-10-05 240
字节跳动和马里兰大学帕克分校的研究人员推出新型开源大型多模态模型LLaVA-Critic...
2024-10-05 180
智源研究院推出Emu3,这是一个全新的多模态系列模型,它仅使用下一个词元(Token)...
2024-09-29 158
华盛顿大学和艾伦人工智能研究所的研究人员推出新型多模态模型家族Molmo,这些模型...
2024-09-27 156
Meta、Waymo和南加州大学的研究人员推出多模态模型Transfusion,它能够同时处理离...
2024-08-21 292
清华大学和阿里巴巴的研究人员推出新型大型多模态模型ConvLLaVA,它专门设计用于处...
2024-05-27 406