
NoCode-bench
NoCode-bench 的结果或许让人失望,但也正是这种“真实感”使其成为推动技术发展的关键一步。当 AI 能稳定地将一句“增加导出功能”转化为正确、可测、可部署的代码时,那才是无代码开发真正成熟的时刻。在此之前,我们仍需脚踏实地,用像 NoCode-bench 这样的基准,一步步丈量差距,逼近目标。
Together AI推出了一个全新的开源项目 —— CodeArena,这是一个开源、免费、可运行的平台,通过实际代码生成任务,对比不同开源大语言模型(LLMs)的编码能力,帮助开发者快速识别当前表现最佳的开源编程模型。

CodeArena 支持多个主流编码模型同台竞技,用户可以直观看到它们在相同任务下生成代码的过程与结果,并参与投票选出表现最优的模型。此外,平台还提供实时排行榜,展示各模型在不同任务中的综合表现。
在最新发布的 CodeArena v2 中,平台新增了对 Kimi K2 等新晋模型的支持,进一步丰富了模型间的对比维度。用户不仅可以:
整个平台完全开源,且无需付费,所有模型调用均通过 Together AI 提供的 API 实现。

CodeArena 基于现代前端与后端技术构建,主要使用以下技术栈:

如果你希望在本地部署并运行 CodeArena,只需按照以下步骤操作:
git clone https://github.com/Nutlope/codearena
创建 .env 文件,并添加你的 Together AI API 密钥:
TOGETHER_API_KEY=your_api_key_here
推荐使用 Neon 创建一个 Postgres 数据库,并将连接信息添加到 .env 文件中:
DATABASE_URL=your_database_connection_string
npm install
npm run dev
项目将在本地启动,访问浏览器即可体验 CodeArena。
CodeArena 团队表示,接下来将重点推进以下功能开发:







