索尼推出音频-视觉生成模型Visual Echoes:根据一张图片生成与之相对应的音频,或者反过来,根据一段音频生成匹配的图片
索尼推出新型音频-视觉生成模型Visual Echoes,这个模型能够根据一张图片生成与之...
无需训练的个性化定制RectifID:根据用户提供的参考图像定制化地生成新图像,同时保留原始图像中的身份特征
来自北京大学、快手、电子科技大学和浙江大学的研究人员推出新型图像生成技术Recti...
基于图像条件的扩散模型Semantica:根据给定的条件图像(即输入图像)的语义信息生成新的图像
Google Deepmind推出新型图像生成模型Semantica,Semantica的核心特点是它能够在不...
改进图像生成技术DMD2:通过高效的一步生成模型来加速图像生成过程,同时保持或甚至超越原始模型的质量
麻省理工学院和 Adobe 研究中心的研究人员推出DMD2(Distribution Matching Dist...
Face-Adapter:专为预训练扩散模型设计的高效且有效的适配器,用于实现高精度和高保真的面部编辑
来自浙江大学、腾讯、 VIVO和南洋理工大学的研究人员推出Face-Adapter,这是一个专...
IDEA研究院推出先进开集目标检测模型系列Grounding DINO 1.5:推动开放集对象检测技术的边界
IDEA研究院(粤港澳大湾区数字经济研究院)推出先进模型系列Grounding DINO 1.5,...