
ARC Prize
由著名AI研究员弗朗索瓦·肖莱(François Chollet)共同创立的非营利组织Arc Prize基金会宣布,他们开发了一项名为ARC-AGI-2的新测试。这项测试旨在更准确地衡量领先AI模型的通用智能水平,然而,它却难倒了大多数现有的AI模型。
Together AI推出了一个全新的开源项目 —— CodeArena,这是一个开源、免费、可运行的平台,通过实际代码生成任务,对比不同开源大语言模型(LLMs)的编码能力,帮助开发者快速识别当前表现最佳的开源编程模型。

CodeArena 支持多个主流编码模型同台竞技,用户可以直观看到它们在相同任务下生成代码的过程与结果,并参与投票选出表现最优的模型。此外,平台还提供实时排行榜,展示各模型在不同任务中的综合表现。
在最新发布的 CodeArena v2 中,平台新增了对 Kimi K2 等新晋模型的支持,进一步丰富了模型间的对比维度。用户不仅可以:
整个平台完全开源,且无需付费,所有模型调用均通过 Together AI 提供的 API 实现。

CodeArena 基于现代前端与后端技术构建,主要使用以下技术栈:

如果你希望在本地部署并运行 CodeArena,只需按照以下步骤操作:
git clone https://github.com/Nutlope/codearena
创建 .env 文件,并添加你的 Together AI API 密钥:
TOGETHER_API_KEY=your_api_key_here
推荐使用 Neon 创建一个 Postgres 数据库,并将连接信息添加到 .env 文件中:
DATABASE_URL=your_database_connection_string
npm install
npm run dev
项目将在本地启动,访问浏览器即可体验 CodeArena。
CodeArena 团队表示,接下来将重点推进以下功能开发:







