Qwen3

共 3 篇文章

排序

发布更新浏览点赞

阿里Qwen项目组推出新型强化学习算法GSPO：用于训练最新 Qwen3 模型

阿里Qwen项目组推出新型强化学习算法GSPO：用于训练最新 Qwen3 模型

阿里Qwen项目组推出新型强化学习算法 Group Sequence Policy Optimization (GSPO)，用于训练大型语言模型（LLMs）。与以往基于单个标记（token）重要性比率...

新技术 # GSPO # Qwen3

8个月前

03800

基于 Qwen3 的混合专家（MoE）模型Arcana Qwen3 2.4B A0.6B

基于 Qwen3 的混合专家（MoE）模型Arcana Qwen3 2.4B A0.6B

Arcana Qwen3 2.4B A0.6B 是一个基于 Qwen3 的混合专家（MoE）模型，总参数量为 24 亿，每个专家模型拥有 6 亿参数。该模型旨在提供更高的准确性、更高的效率和更低的内存...

大语言模型 # Arcana Qwen3 2.4B A0.6B # MoE模型 # Qwen3

11个月前

02670

阿里通义千问系列再添新成员，Qwen3 模型即将发布

阿里通义千问系列再添新成员，Qwen3 模型即将发布

阿里云通义千问开源负责人林俊旸在社交平台 X 上发文暗示，备受期待的Qwen3 系列模型有望于今日正式发布。尽管具体发布时间尚未完全确认，但种种迹象表明，这一全新系列模型将在本周内与公众见面。值得一...

早报 # Qwen3 # 通义千问

11个月前

03770