来自浙江大学、微软亚洲研究院、威廉玛丽学院和清华大学的研究人员提出一种新方法...
2024-02-22 218

韩国研究人员推出视觉语言模型CoLLaVO(Crayon Large Language and Vision mOdel...
2024-02-21 326

来自新加坡国立大学、Meta AI和加州大学伯克利分校的研究人员提出了一种名为“神经...
2024-02-21 405

RealCompo是一个全新的文生图框架,它旨在解决当前文生图模型在处理多对象组合生...
2024-02-21 340

来自西蒙弗雷泽大学和Meta Reality Labs的研究人员推出神经网络架构MVDiffusion++...
2024-02-21 253

来自北卡罗来纳大学教堂山分校和 Meta AI的研究人员推出视频字幕生成模型Video Re...
2024-02-21 168

来自谷歌的研究人员推出视频编码器VideoPrism,它是一个通用的视频理解模型,能够...
2024-02-21 274

来自中国台湾阳明交通大学的研究人员推出新型神经网络渲染技术Joint-TensoRF,提...
2024-02-21 181

来自Roblox、卡内基梅隆大学、斯坦福大学的研究人员推出FlashTex技术,它能够快速...
2024-02-21 177

OOTDiffusion是一款开源虚拟服装试穿工具,它利用潜在扩散模型(latent diffusio...
2024-02-21 337

来自的谷歌的研究人员推出名为“Binary Opacity Grids”的新方法,它用于从多视角图...
2024-02-20 331

FiT(Flexible Vision Transformer)是一款新型图像生成模型,基于Transformer架...
2024-02-20 371
没有账号?注册  忘记密码?