ElevenLabs发布了一个开源应用 X-to-Voice,该应用使用新的语音设计 API 构建,允...
2024-11-02 176

Anthropic在近期升级了Claude 3.5 Sonnet 和推出新模型 Claude 3.5 Haiku,不过最...
2024-11-02 209

稀疏自编码器(SAEs)已成为逆向工程大语言模型(LLMs)的核心组成部分。SAEs通过...
2024-11-02 122

现实世界中的图像恢复(IR)面临着显著的挑战,主要是缺乏高容量模型和全面的数据...
2024-11-01 130

韩国科学技术研究院推出新型文本到图像生成技术GrounDiT(GROUNDIT),它通过利用D...
2024-11-01 122

马里兰大学学院公园分校的研究人员提出了一种名为LARP(Latent Aggregation and Re...
2024-11-01 136

Meta AI与阿卜杜拉国王科技大学的研究人员推出了一种新型视频生成模型家族——MarDin...
2024-11-01 130

来自卡内基梅隆大学、伊利诺伊大学香槟分校和丰田研究所的研究者们共同提出了一种...
2024-11-01 124

人类拥有一个独特的学习系统,它既能从普遍的世界规律中缓慢学习,也能迅速地将新...
2024-11-01 116

之前给大家介绍了神秘图像生成模型“red_panda”,其在Artificial Analysis 图像模型...
2024-10-31 224

在音频驱动的视觉配音中,合成准确的口型同步同时保持和突出说话者的“个性”是一个...
2024-10-29 154

视频生成是当前 AI 领域的一个热点研究方向,特别是基于扩散模型的方法。然而,这...
2024-10-29 144
没有账号?注册  忘记密码?