音频-视觉生成模型

共 1 篇文章

排序

发布更新浏览点赞

索尼推出音频-视觉生成模型Visual Echoes：根据一张图片生成与之相对应的音频，或者反过来，根据一段音频生成匹配的图片

索尼推出音频-视觉生成模型Visual Echoes：根据一张图片生成与之相对应的音频，或者反过来，根据一段音频生成匹配的图片

索尼推出新型音频-视觉生成模型Visual Echoes，这个模型能够根据一张图片生成与之相对应的音频，或者反过来，根据一段音频生成匹配的图片。这种技术在多模态生成领域具有很大的潜力，因为它能够将视觉...

新技术 # Visual Echoes # 音频-视觉生成模型

2年前

01,1570