微软亚洲研究院推出新框架VASA-1,它可以根据单张静态图像和语音音频片段,生成具...
2024-04-22 192
香港城市大学和莫纳什大学的研究人员推出AniClipart,它能够根据文本提示将静态的...
2024-04-21 272
来自香港科技大学和特拉维夫大学的研究人员推出Dynamic Typography(动态排版),...
2024-04-20 306
来自韩国Nota AI和三星电子的研究人员推出EdgeFusion,它能够在资源受限的移动设备...
2024-04-20 204
来自加州大学圣地亚哥分校和Adobe的研究人员推出大型3D重建模型MeshLRM,这是一...
2024-04-20 268
新加坡科技设计大学和密歇根大学的研究人员推出新型文本到音频生成模型Tango 2,它...
2024-04-17 274
加州大学圣克鲁斯分校的研究人员推出高质量数据集HQ-Edit,它专门用于基于指令的图...
2024-04-17 384
来自伊利诺伊大学厄巴纳-香槟分校、上海交通大学和康奈尔大学的研究人员推出Video2...
2024-04-17 302
字节跳动推出数据集COCONut,它是对现有的COCO数据集的现代化升级,专门针对图像分...
2024-04-15 328
来自加州大学圣克鲁斯分校和Google Deepmind的研究人员发布论文探讨如何有效地缩减...
2024-04-15 234
来自北京交通大学和西蒙菲莎大学的研究人员推出OpenTrans,它旨在提高开放词汇表分...
2024-04-12 262
中佛罗里达大学计算机视觉研究中心和字节跳动的研究人员推出ControlNet++,这是一...
2024-04-12 340