
NoCode-bench
NoCode-bench 的结果或许让人失望,但也正是这种“真实感”使其成为推动技术发展的关键一步。当 AI 能稳定地将一句“增加导出功能”转化为正确、可测、可部署的代码时,那才是无代码开发真正成熟的时刻。在此之前,我们仍需脚踏实地,用像 NoCode-bench 这样的基准,一步步丈量差距,逼近目标。
Music Arena 是世界上第一个面向公众开放的音乐生成模型评测平台。在这里,AI 创作的旋律不再是黑箱输出,而是可以被真实听众直接比较、投票和评判的对象。我们相信,最好的评估方式不是参数规模或技术文档,而是人类的耳朵。
Music Arena 是世界上第一个面向公众开放的音乐生成模型评测平台。在这里,AI 创作的旋律不再是黑箱输出,而是可以被真实听众直接比较、投票和评判的对象。我们相信,最好的评估方式不是参数规模或技术文档,而是人类的耳朵。

通过 Music Arena,任何人都能参与推动 AI 音乐的发展,用每一次选择,塑造下一代音乐模型的方向。
近年来,AI 音乐模型迅速发展,但缺乏统一、透明的评估标准。不同模型发布的演示样本往往经过精心挑选,难以反映真实表现。
Music Arena 的目标很明确:
✅ 在相同条件下对比不同模型
✅ 让普通用户成为评审者
✅ 建立公开、可复现的评分体系
这不仅服务于研究人员和技术团队,也赋予创作者和听众更大的话语权。
整个过程简单直观,只需四步:
所有比较均基于真实用户数据,无算法操控,无厂商干预。
每一次投票都会被记录在公开榜单中,用于计算每个模型的 Elo 评分(类似国际象棋排名系统)。长期积累的数据可以帮助:
更重要的是,它让 AI 音乐的进步变得可见、可测、可参与。
Music Arena 目前支持多种主流开源与闭源音乐生成模型,并将持续接入新成员。平台本身也采用透明机制:
我们鼓励音乐人、开发者、听众共同加入,构建一个真正由社区驱动的评价生态。







