微软研究院、上海交通大学和北京大学的研究人员推出视频分词器VidTok,它是一个多...
3天前 22

近年来,大语言模型(LLMs)在图像理解和生成方面取得了显著进展,尤其是在将图像...
2周前 52

马里兰大学学院公园分校的研究人员提出了一种名为LARP(Latent Aggregation and Re...
2024-11-01 132
没有账号?注册  忘记密码?