MiMo-7B

在强化学习（RL）领域，大型基础模型一直是研究的主流方向。目前，许多成功的强化学习项目，尤其是那些专注于代码推理能力的项目，都依赖于庞大的模型，例如拥有 320 亿参数的模型。然而，要在小型模型中同时...

11个月前

02660