Qwen3.5系列模型在基准测试中的对比

7小时前 小马良
6 0

主要结论:122B、35B模型,尤其是27B模型在很多方面仍保持着旗舰模型的性能水平,而2B和0.8B模型在长上下文理解和智能体任务上的表现则明显下滑较多。

Qwen3.5系列模型在基准测试中的对比
  • 来源:https://www.reddit.com/r/LocalLLaMA/comments/1ro7xve/qwen35_family_comparison_on_shared_benchmarks

暂无评论

none
暂无评论...