OpenAI o1模型的开源平替方案大集合

642 0

OpenAI在北京时间9月13日正式推出全新模型OpenAI o1系列，o1 系列包含多个模型，其中 o1-preview 和 o1-mini 两个版本已通过 ChatGPT 和 OpenAI API 发布。o1-mini 是一个更小、更高效的模型，专注于代码生成。o1系列模型最大特点就是引入了“思维链（CoT）”，o1在回应之前深入思考问题，就像人类一样。通过训练，它们学会了优化思考过程，尝试不同的策略，并识别错误。因此它们能够处理复杂的任务，并在科学、编程和数学等领域解决比以往模型更具挑战性的问题。

官方介绍：https://openai.com/o1

PS：思维链是一种通过提示（prompting）来激发语言模型进行推理的方法。简单来说，就是让语言模型在回答问题时，先进行一系列的思考步骤，然后给出答案。

目前已经开发者通过开源模型推出了 OpenAI o1 模型的开源平替：

Llama3.1-Instruct-O1

AI云加速平台SambaNova基于Llama-3.1 405b模型，使用提示词来实现的CoT，已提供Demo。

Demo：https://huggingface.co/spaces/sambanovasystems/Llama3.1-Instruct-O1

g1

云加速平台Groq通过类似o1的思维链来提升大语言模型（LLM）的推理能力。这一早期原型让LLM能够“思考”并解决那些通常难以解决的逻辑问题。由Llama3.1-70b驱动的g1创建推理链，原则上是一种动态的思维链，它允许LLM“思考”并解决那些通常会难倒顶尖模型的一些逻辑问题。在每一步中，LLM可以选择继续进行另一个推理步骤，或者提供一个最终答案。每一步都有标题，并且对用户可见。系统提示还包括给LLM的提示。