微软亚洲研究院推出新框架VASA-1,它可以根据单张静态图像和语音音频片段,生成具...
2024-04-22 192

香港城市大学和莫纳什大学的研究人员推出AniClipart,它能够根据文本提示将静态的...
2024-04-21 272

来自香港科技大学和特拉维夫大学的研究人员推出Dynamic Typography(动态排版),...
2024-04-20 306

来自韩国Nota AI和三星电子的研究人员推出EdgeFusion,它能够在资源受限的移动设备...
2024-04-20 204

来自加州大学圣地亚哥分校和Adob​​e的研究人员推出大型3D重建模型MeshLRM,这是一...
2024-04-20 268

新加坡科技设计大学和密歇根大学的研究人员推出新型文本到音频生成模型Tango 2,它...
2024-04-17 274

加州大学圣克鲁斯分校的研究人员推出高质量数据集HQ-Edit,它专门用于基于指令的图...
2024-04-17 384

来自伊利诺伊大学厄巴纳-香槟分校、上海交通大学和康奈尔大学的研究人员推出Video2...
2024-04-17 302

字节跳动推出数据集COCONut,它是对现有的COCO数据集的现代化升级,专门针对图像分...
2024-04-15 328

来自加州大学圣克鲁斯分校和Google Deepmind的研究人员发布论文探讨如何有效地缩减...
2024-04-15 234

来自北京交通大学和西蒙菲莎大学的研究人员推出OpenTrans,它旨在提高开放词汇表分...
2024-04-12 262

中佛罗里达大学计算机视觉研究中心和字节跳动的研究人员推出ControlNet++,这是一...
2024-04-12 340
没有账号?注册  忘记密码?