OpenAI计划在未来几个月未开源一款推理大模型

早报3个月前发布 小马良
108 0

OpenAI 计划在未来几个月内发布其首个“开放”语言模型,这是自 GPT-2 以来的又一重大举措。这一计划的披露基于该公司在其网站上发布的反馈表,邀请“开发者、研究人员和更广泛的社区成员”参与其中。反馈表中包含诸如“您希望在 OpenAI 的开放权重模型中看到什么?”以及“您过去使用过哪些开放模型?”等问题,显示出 OpenAI 对社区意见的重视。

OpenAI计划在未来几个月未开源一款推理大模型

OpenAI 在其网站上表示:“我们很高兴能与开发者、研究人员和更广泛的社区合作,收集意见,使这个模型尽可能有用。如果您有兴趣参加与 OpenAI 团队的反馈会议,请在下面的表格中告知我们。” 这表明 OpenAI 正在积极寻求社区的参与和支持,以确保新模型能够满足用户的需求。

开发者活动与社区互动

为了更好地收集反馈并展示模型原型,OpenAI 计划举办一系列开发者活动。第一次开发者活动将在几周内在旧金山举行,随后还将在欧洲和亚太地区举行会议。这些活动将为开发者提供一个平台,让他们能够直接与 OpenAI 团队交流,分享他们的想法和建议。

应对竞争压力

OpenAI 的这一新策略部分是为了应对来自竞争对手的压力。近年来,一些机构采取了“开放”方式推出模型,取得了显著的成功。例如,Meta 在三月初表示,其大力投资的 Llama 系列开放 AI 模型已累计超过 10 亿次下载。与此同时,中国的 AI 实验室 DeepSeek 也迅速积累了庞大的全球用户群,并吸引了众多投资者的关注。

这些“开放”竞争者将其模型提供给 AI 社区进行实验,有时甚至用于商业化,这与 OpenAI 之前的策略形成了鲜明对比。OpenAI 首席执行官萨姆·奥尔特曼在最近的 Reddit 问答中表示,他认为 OpenAI 在开源其技术方面一直站在历史的错误一边。他提到:“[我个人认为我们需要]找到一个不同的开源策略。并非 OpenAI 的每个人都认同这一观点,这也不是我们当前的最高优先级。我们将生产更好的模型[未来],但我们的领先优势将比过去几年减少。”

开放模型的细节与展望

萨姆·奥尔特曼在周一下午的 X 帖子中进一步阐述了 OpenAI 的开放模型计划。他指出,即将推出的开放模型将具备类似于 OpenAI o3-mini 的“推理”能力。他还提到,在发布之前,OpenAI 将根据其准备框架评估这个模型,就像对待任何其他模型一样。此外,由于知道这个模型在发布后会被修改,OpenAI 将会做额外的工作。

OpenAI计划在未来几个月未开源一款推理大模型

萨姆·奥尔特曼表示:“[我们很期待看到开发者们会构建什么,以及大公司和政府如何在他们更喜欢自己运行模型的情况下使用它。]” 这表明 OpenAI 对开放模型的未来充满期待,同时也认识到社区和开发者将在模型的进一步发展和应用中发挥重要作用。

© 版权声明

相关文章

暂无评论

none
暂无评论...