月之暗面发布Moonlight:使用 Muon 优化器训练的混合专家 (MoE) 模型月之暗面(Moonshot AI)和加州大学洛杉矶分校的研究团队联合发布了 Moonlight,这是一款基于 Muon 优化器训练的混合专家(MoE)模型。该模型包含两种配置:一种具有 30 亿激活参...大语言模型# Moonlight# Moonshot AI# Muon 优化器1年前02350
月之暗面发布多模态思考模型 Kimi k1.5 ,实现 SOTA 级多模态推理能力月之暗面宣布推出 Kimi 的全新模型——k1.5 多模态思考模型。这款模型在多模态推理和通用推理能力上达到了 state-of-the-art(SOTA) 级别,标志着 AI 领域的又一次重大进步...早报# Kimi k1.5# 月之暗面1年前04600