蚂蚁集团和清华大学的研究人员提出了Mimir,这是一个端到端的训练框架,旨在解决当...
2周前 58
AnyChat是一款新工具,旨在通过将多个领先的大语言模型(LLMs)统一在一个界面下,...
2024-11-19 106
大型生成模型(如大语言模型LLMs和文本到图像扩散模型T2Is)的能力不断增强,但其...
2024-11-08 98
场景图提供了一种结构化、层次化的图像表示方式,其中节点和边分别代表图像中的对...
2024-10-23 138
香港大学及字节跳动的研究人员推出新型图像生成模型家族LlamaGen,将大语言模型(L...
2024-06-12 380
在《打造本地专属GPT!使用这些软件轻松运行开源大语言模型》这篇文章里,已经向大...
2024-05-05 800
这篇论文介绍了一个名为VSP-LLM(Visual Speech Processing incorporated with LL...
2024-02-27 392
谷歌推出开源模型Gemma,这是一款轻量级、先进的开源模型,供开发者和研究人员用...
2024-02-22 435
PaLM2-VAdapter模型的主要目的是更有效地连接视觉编码器和大语言模型,以提高它们...
2024-02-19 600
微软的研究人员于2021年推出LoRA(Low-Rank Adaptation of Large Language Models...
2024-02-07 331
StrokeNUWA是一种新型图像生成技术,用于仅通过大语言模型(LLM)生成矢量图形,...
2024-01-31 390
来自谷歌和MIT的研究人员提出一种新型视觉模型训练方法SynCLR,它完全从生成模型...
2024-01-31 325