Meta原版Llama-4-Maverick模型在基准测试中大翻车本周,Meta因使用未经发布的实验版Llama 4 Maverick模型在众包基准测试平台LM Arena上获得高分而引发争议。这一事件不仅促使LM Arena的维护者公开道歉并调整政策,还让未经修改...早报# Llama 4 Maverick# Meta8个月前02340
Meta新旗舰 AI 模型 Llama 4 Maverick 测试成绩遭质疑,被指测试版与开源版并不一致Meta上周六发布了其新的旗舰AI模型之一——Llama 4 Maverick。在备受瞩目的LM Arena测试中,Maverick取得了第二名的成绩。这一测试由人类评分者对模型输出进行比较,并选择他...早报# Llama 4 Maverick# Meta8个月前02140