卷麻了!阿里在除夕夜推出超大规模的 MoE 模型 Qwen2.5-Max 过去,有一种观点认为,持续增加数据规模和模型参数可能是通向人工通用智能(AGI)的一条可行路径。然而,无论是对于稠密模型还是MoE(Mixture of Experts)模型而言,整个大模型社区在训练... 大语言模型# MoE# Qwen2.5-Max# 阿里 2周前0390