QwQ-32B

阿里云的Qwen团队最近宣布了一项重要进展，他们通过整合大规模强化学习（RL）技术来提升大语言模型的智能水平，并推出了新的推理模型QwQ-32B。这款拥有320亿参数的模型，在性能上能够与具有6710...

1年前

03320