语音驱动人脸说话生成框架AVCT

语音驱动人脸说话生成框架AVCT

来自网易伏羲AI实验室、悉尼科技大学的研究人员推出了从单人音频生成单人说话脸部的框架Audio-Visual Correlation Transformer (AVCT),它能够从单个说话者的音频-视...
2年前
08230
英伟达GeForce RTX 4090 D

英伟达GeForce RTX 4090 D

对于AI绘画来说,其实最具“性价比”的显卡就是英伟达RTX 4090,作为英伟达民用顶级显卡,目前可运行绝大多数已开源的AI应用,以至于美国政府都对RTX 4090采取了限制措施,那就是无法出口到中国...
2年前
08190
独特视角SDXL Lora:Head POV

独特视角SDXL Lora:Head POV

Head POV是一个视角SDXL Lora,这一视角的独特之处在于,它是以动物的后脑勺为观察点。尽管初版模型训练数据相对较少,可能导致生成的图片并不完美,但作者已经计划扩充数据集,并对图像位置信息进...
2年前
08150