OpenAI o3模型基准测试结果引发争议,得分低于OpenAI最初暗示的水平OpenAI的o3 模型在基准测试中的表现引发了广泛关注和讨论。该公司最初声称的高分与实际测试结果之间的差异,引发了人们对公司透明度和模型测试实践的质疑。 OpenAI的初步声明与实际表现的差异 当O...早报# o3模型# OpenAI# 基准测试8个月前02090