来自麻省理工学院、普林斯顿大学、Lepton AI 和 英伟达的研究人员推出DistriFusio...
2024-03-02 387

香港科技大学和腾讯 PCG ARC 实验室推出基于优化框架的跨模态视频-音频生成方法Se...
2024-02-28 393

来自印度信息技术研究所、Hugging Face、阳明交通大学、IBM 研究院的研究人员提出...
2024-02-28 437

阿里巴巴推出创新框架EMO,它是一个能够根据音频生成表情丰富的肖像视频的系统。...
2024-02-28 462

来自伊利诺伊大学香槟分校和微软公司的研究人员公开了多LoRA组合来生成图像的项目...
2024-02-27 540

在Stable Diffusion中,负面提示(Negative Prompts)作为一种图像生成的引导机制...
2024-02-27 502

这篇论文介绍了一个名为VSP-LLM(Visual Speech Processing incorporated with LL...
2024-02-27 394

来自加州大学伯克利分校、牛津大学、哈佛大学、卡耐基梅隆大学、香港大学、加州大...
2024-02-26 244

来自不列颠哥伦比亚大学和Google DeepMind研究人员提出创新人工智能系统Genie,...
2024-02-26 307

来自莫纳什大学、英伟达、威斯康星大学麦迪逊分校、加州理工学院的研究人员推出T-...
2024-02-24 436

来自清华大学和微软亚洲研究院的研究人员推出新型3D重建技术MVD2,它专门针对多视...
2024-02-24 340

来自香港科技大学与小冰AI的研究人员推出名为“子对象级图像标记化”(subobject-le...
2024-02-24 326
没有账号?注册  忘记密码?