视频编码器VideoPrism:能够处理多种视频理解任务,如分类、定位、检索、字幕生成和问答 来自谷歌的研究人员推出视频编码器VideoPrism,它是一个通用的视频理解模型,能够处理多种视频理解任务,如分类、定位、检索、字幕生成和问答(QA)。VideoPrism通过在一个单一的冻结模型上进... 新技术# VideoPrism# 视频编码器# 谷歌 1年前04820