OpenAI在北京时间9月13日正式推出全新模型OpenAI o1系列,o1 系列包含多个模型,其中 o1-preview 和 o1-mini 两个版本已通过 ChatGPT 和 OpenAI API 发布。o1-mini 是一个更小、更高效的模型,专注于代码生成。o1系列模型最大特点就是引入了“思维链(CoT)”,o1在回应之前深入思考问题,就像人类一样。通过训练,它们学会了优化思考过程,尝试不同的策略,并识别错误。因此它们能够处理复杂的任务,并在科学、编程和数学等领域解决比以往模型更具挑战性的问题。
PS:思维链是一种通过提示(prompting)来激发语言模型进行推理的方法。简单来说,就是让语言模型在回答问题时,先进行一系列的思考步骤,然后给出答案。
目前已经开发者通过开源模型推出了 OpenAI o1 模型的开源平替:
Llama3.1-Instruct-O1
AI云加速平台SambaNova基于Llama-3.1 405b模型,使用提示词来实现的CoT,已提供Demo。
g1
云加速平台Groq通过类似o1的思维链来提升大语言模型(LLM)的推理能力。这一早期原型让LLM能够“思考”并解决那些通常难以解决的逻辑问题。由Llama3.1-70b驱动的g1创建推理链,原则上是一种动态的思维链,它允许LLM“思考”并解决那些通常会难倒顶尖模型的一些逻辑问题。在每一步中,LLM可以选择继续进行另一个推理步骤,或者提供一个最终答案。每一步都有标题,并且对用户可见。系统提示还包括给LLM的提示。
评论0