建立在多模态大语言模型基础上的统一文本到图像生成和检索框架TIGeR 来自新加坡国立大学 NExT++ 实验室、南洋理工大学、香港理工大学和哈尔滨工业大学(深圳)的研究人员推出一个统一的文本到图像生成和检索框架TIGeR,这个框架建立在多模态大语言模型(MLLMs)的基... 新技术# TIGeR# 文生图 9个月前05350