多模态大语言模型LITA:专门设计来处理视频中的时间定位问题 英伟达推出多模态大语言模型LITA(Language Instructed Temporal-Localization Assistant),它专门设计来处理视频中的时间定位问题。 GitHub 论文... 新技术# LITA# 多模态大语言模型 11个月前05110