RealCompo是一个全新的文生图框架,它旨在解决当前文生图模型在处理多对象组合生...
2024-02-21 466
来自西蒙弗雷泽大学和Meta Reality Labs的研究人员推出神经网络架构MVDiffusion++...
2024-02-21 349
来自北卡罗来纳大学教堂山分校和 Meta AI的研究人员推出视频字幕生成模型Video Re...
2024-02-21 248
来自谷歌的研究人员推出视频编码器VideoPrism,它是一个通用的视频理解模型,能够...
2024-02-21 386
来自中国台湾阳明交通大学的研究人员推出新型神经网络渲染技术Joint-TensoRF,提...
2024-02-21 289
来自Roblox、卡内基梅隆大学、斯坦福大学的研究人员推出FlashTex技术,它能够快速...
2024-02-21 283
OOTDiffusion是一款开源虚拟服装试穿工具,它利用潜在扩散模型(latent diffusio...
2024-02-21 459
来自的谷歌的研究人员推出名为“Binary Opacity Grids”的新方法,它用于从多视角图...
2024-02-20 445
FiT(Flexible Vision Transformer)是一款新型图像生成模型,基于Transformer架...
2024-02-20 511
威斯康星大学麦迪逊分校、哥伦比亚大学和微软的研究人员推出的GLIGEN模型,用于将...
2024-02-20 417
来自加州大学圣地亚哥分校和Meta的研究人员推出AI视频编辑工具LAVE(LLM-Powered ...
2024-02-19 583
PaLM2-VAdapter模型的主要目的是更有效地连接视觉编码器和大语言模型,以提高它们...
2024-02-19 564