微软发布用于 AI 推理的新款高性能芯片Maia 200

3天前 小马良
31 0

微软宣布推出其最新芯片 Maia 200,该公司称其为专为扩展 AI 推理而设计的“硅劳模”。

继 2023 年发布的 Maia 100 之后,微软表示,新款 200 在技术上进行了升级,能够以更快的速度和更高的效率运行强大的 AI 模型。Maia 配备超过 1000 亿个晶体管,提供超过 10 petaflops 的 4 位精度性能和约 5 petaflops 的 8 位性能——相比前代产品有显著提升。

“推理”指的是运行模型的计算过程,与训练模型所需计算相对。随着 AI 公司日趋成熟,推理成本已成为其总体运营成本中日益重要的部分,这重新激发了业界对优化该过程的兴趣。

微软希望 Maia 200 能够成为这种优化的一部分,使 AI 业务运行干扰更少、功耗更低。“实际上,一个 Maia 200 节点可以轻松运行当今最大的模型,并且为未来更大的模型留有充足的性能余量,”该公司表示。

微软的新芯片也是科技巨头转向自研芯片这一日益增长趋势的一部分,目的是减少对 NVIDIA 的依赖。NVIDIA 的 尖端 GPU 对 AI 公司的成功已变得越来越关键。例如,谷歌拥有其 TPU,即张量处理单元——这些芯片不作为产品单独出售,而是 通过其云服务提供计算能力。此外还有亚马逊 Trainium,这家电商巨头自有的 AI 加速芯片,其最新版本 Trainium3 刚于去年 12 月发布。在每种情况下,TPU 都可用于分担原本分配给 NVIDIA GPU 的部分计算任务,从而降低总体硬件成本。

凭借 Maia,微软正将自己定位为与这些替代方案竞争。在周一的新闻稿中,微软指出,Maia 的 FP4 性能是亚马逊第三代 Trainium 芯片的 3 倍,FP8 性能则超过谷歌的第七代 TPU

微软表示,Maia 已经在全力支持其 超级智能团队 的 AI 模型。它还一直支持其聊天机器人 Copilot 的运营。截至周一,该公司表示已邀请多方——包括开发人员、学者和前沿 AI 实验室——在其工作负载中使用 Maia 200 软件开发套件。

暂无评论

none
暂无评论...