视频分词器VidTok:用于将视频内容编码成紧凑的潜在标记 微软研究院、上海交通大学和北京大学的研究人员推出视频分词器VidTok,它是一个多功能且开源的工具,用于将视频内容编码成紧凑的潜在标记(latent tokens)。VidTok在连续和离散标记化方面... 新技术# VidTok# 视频分词器 2个月前01210