场景图提供了一种结构化、层次化的图像表示方式,其中节点和边分别代表图像中的对...
6天前 50
香港大学及字节跳动的研究人员推出新型图像生成模型家族LlamaGen,将大语言模型(L...
2024-06-12 296
在《打造本地专属GPT!使用这些软件轻松运行开源大语言模型》这篇文章里,已经向大...
2024-05-05 708
这篇论文介绍了一个名为VSP-LLM(Visual Speech Processing incorporated with LL...
2024-02-27 314
谷歌推出开源模型Gemma,这是一款轻量级、先进的开源模型,供开发者和研究人员用...
2024-02-22 363
PaLM2-VAdapter模型的主要目的是更有效地连接视觉编码器和大语言模型,以提高它们...
2024-02-19 526
微软的研究人员于2021年推出LoRA(Low-Rank Adaptation of Large Language Models...
2024-02-07 269
StrokeNUWA是一种新型图像生成技术,用于仅通过大语言模型(LLM)生成矢量图形,...
2024-01-31 330
来自谷歌和MIT的研究人员提出一种新型视觉模型训练方法SynCLR,它完全从生成模型...
2024-01-31 257