OpenAI计划在未来几个月未开源一款推理大模型

386 0

OpenAI 计划在未来几个月内发布其首个“开放”语言模型，这是自 GPT-2 以来的又一重大举措。这一计划的披露基于该公司在其网站上发布的反馈表，邀请“开发者、研究人员和更广泛的社区成员”参与其中。反馈表中包含诸如“您希望在 OpenAI 的开放权重模型中看到什么？”以及“您过去使用过哪些开放模型？”等问题，显示出 OpenAI 对社区意见的重视。

OpenAI 在其网站上表示：“我们很高兴能与开发者、研究人员和更广泛的社区合作，收集意见，使这个模型尽可能有用。如果您有兴趣参加与 OpenAI 团队的反馈会议，请在下面的表格中告知我们。” 这表明 OpenAI 正在积极寻求社区的参与和支持，以确保新模型能够满足用户的需求。

开发者活动与社区互动

为了更好地收集反馈并展示模型原型，OpenAI 计划举办一系列开发者活动。第一次开发者活动将在几周内在旧金山举行，随后还将在欧洲和亚太地区举行会议。这些活动将为开发者提供一个平台，让他们能够直接与 OpenAI 团队交流，分享他们的想法和建议。

应对竞争压力

OpenAI 的这一新策略部分是为了应对来自竞争对手的压力。近年来，一些机构采取了“开放”方式推出模型，取得了显著的成功。例如，Meta 在三月初表示，其大力投资的 Llama 系列开放 AI 模型已累计超过 10 亿次下载。与此同时，中国的 AI 实验室 DeepSeek 也迅速积累了庞大的全球用户群，并吸引了众多投资者的关注。

这些“开放”竞争者将其模型提供给 AI 社区进行实验，有时甚至用于商业化，这与 OpenAI 之前的策略形成了鲜明对比。OpenAI 首席执行官萨姆·奥尔特曼在最近的 Reddit 问答中表示，他认为 OpenAI 在开源其技术方面一直站在历史的错误一边。他提到：“[我个人认为我们需要]找到一个不同的开源策略。并非 OpenAI 的每个人都认同这一观点，这也不是我们当前的最高优先级。我们将生产更好的模型[未来]，但我们的领先优势将比过去几年减少。”

开放模型的细节与展望

萨姆·奥尔特曼在周一下午的 X 帖子中进一步阐述了 OpenAI 的开放模型计划。他指出，即将推出的开放模型将具备类似于 OpenAI o3-mini 的“推理”能力。他还提到，在发布之前，OpenAI 将根据其准备框架评估这个模型，就像对待任何其他模型一样。此外，由于知道这个模型在发布后会被修改，OpenAI 将会做额外的工作。