WebDev Arena:用于评估AI在Web开发中能力的开源基准测试

WebDev Arena是由LMArena开发的用于评估AI在Web开发中能力的开源基准测试。目前Claude 3.5 Sonnet (20241022)排第一,而开源的Qwen2.5-Coder-32B-Instruct也有不错的排名。

0

评论0

没有账号?注册  忘记密码?