来自谷歌的研究人员推出视频编码器VideoPrism,它是一个通用的视频理解模型,能够...
2024-02-21 274

来自中国台湾阳明交通大学的研究人员推出新型神经网络渲染技术Joint-TensoRF,提...
2024-02-21 181

来自Roblox、卡内基梅隆大学、斯坦福大学的研究人员推出FlashTex技术,它能够快速...
2024-02-21 177

OOTDiffusion是一款开源虚拟服装试穿工具,它利用潜在扩散模型(latent diffusio...
2024-02-21 337

来自的谷歌的研究人员推出名为“Binary Opacity Grids”的新方法,它用于从多视角图...
2024-02-20 331

FiT(Flexible Vision Transformer)是一款新型图像生成模型,基于Transformer架...
2024-02-20 371

威斯康星大学麦迪逊分校、哥伦比亚大学和微软的研究人员推出的GLIGEN模型,用于将...
2024-02-20 279

来自加州大学圣地亚哥分校和Meta的研究人员推出AI视频编辑工具LAVE(LLM-Powered ...
2024-02-19 419

PaLM2-VAdapter模型的主要目的是更有效地连接视觉编码器和大语言模型,以提高它们...
2024-02-19 412

来自上海交大、华为、多伦多大学的研究人员推出GaussianObject框架,它能够仅用四...
2024-02-19 416

来自南洋理工大学、腾讯AI实验室、香港科技大学和克莱姆森大学的研究人员提出了一...
2024-02-19 428

我们之前介绍了谷歌旗下的最新图像生成模型Imagen2,其中提到了ImageFX。ImageFX...
2024-02-19 189
没有账号?注册  忘记密码?