视觉语言模型CoLLaVO:提高视觉语言模型在零样本视觉语言任务中的性能
韩国研究人员推出视觉语言模型CoLLaVO(Crayon Large Language and Vision mOdel...
神经网络扩散(Neural Network Diffusion):利用扩散模型来生成高性能的神经网络参数
来自新加坡国立大学、Meta AI和加州大学伯克利分校的研究人员提出了一种名为“神经...
新型神经网络渲染技术Joint-TensoRF:使用2D图像作为监督,实现相机姿态和场景几何的精细调整
来自中国台湾阳明交通大学的研究人员推出新型神经网络渲染技术Joint-TensoRF,提...
Binary Opacity Grids:从多视角图像重建三角网格,生成高质量的视图合成
来自的谷歌的研究人员推出名为“Binary Opacity Grids”的新方法,它用于从多视角图...
新型图像生成模型FiT:基于Transformer架构,可以生成无限制分辨率和长宽比的图像
FiT(Flexible Vision Transformer)是一款新型图像生成模型,基于Transformer架...