RealCompo是一个全新的文生图框架,它旨在解决当前文生图模型在处理多对象组合生...
2024-02-21 466

来自西蒙弗雷泽大学和Meta Reality Labs的研究人员推出神经网络架构MVDiffusion++...
2024-02-21 349

来自北卡罗来纳大学教堂山分校和 Meta AI的研究人员推出视频字幕生成模型Video Re...
2024-02-21 248

来自谷歌的研究人员推出视频编码器VideoPrism,它是一个通用的视频理解模型,能够...
2024-02-21 386

来自中国台湾阳明交通大学的研究人员推出新型神经网络渲染技术Joint-TensoRF,提...
2024-02-21 289

来自Roblox、卡内基梅隆大学、斯坦福大学的研究人员推出FlashTex技术,它能够快速...
2024-02-21 283

OOTDiffusion是一款开源虚拟服装试穿工具,它利用潜在扩散模型(latent diffusio...
2024-02-21 459

来自的谷歌的研究人员推出名为“Binary Opacity Grids”的新方法,它用于从多视角图...
2024-02-20 445

FiT(Flexible Vision Transformer)是一款新型图像生成模型,基于Transformer架...
2024-02-20 511

威斯康星大学麦迪逊分校、哥伦比亚大学和微软的研究人员推出的GLIGEN模型,用于将...
2024-02-20 417

来自加州大学圣地亚哥分校和Meta的研究人员推出AI视频编辑工具LAVE(LLM-Powered ...
2024-02-19 583

PaLM2-VAdapter模型的主要目的是更有效地连接视觉编码器和大语言模型,以提高它们...
2024-02-19 564
没有账号?注册  忘记密码?