谷歌云发布第七代 TPU Ironwood 与新型 Axion Arm 实例

硬件4周前发布 小马良
19 0

2025 年 11 月 6 日,谷歌云正式推出其第七代张量处理单元TPU),并同步发布基于 Arm 架构的Axion 虚拟机与裸金属实例。这两项新产品面向 AI 实验室、SaaS 平台以及正从模型训练转向大规模推理的企业,旨在提供更高性能、更低延迟和更优性价比的基础设施。

谷歌云发布第七代 TPU Ironwood 与新型 Axion Arm 实例

Ironwood:专为前沿 AI 工作负载设计的 TPU

Ironwood 是谷歌迄今为止最强大的 TPU,专为以下场景优化:

  • 大规模模型训练
  • 复杂强化学习任务
  • 高吞吐、低延迟的推理服务

关键性能指标

  • 相比 TPU v5p峰值吞吐量提升达 10 倍
  • 相比 TPU v6e每芯片性能提升超 4 倍
  • 单个 Pod 可集成 9216 个芯片,通过 9.6 Tb/s 芯片间互连连接;
  • 共享 1.77 PB 高带宽内存(HBM);
  • 支持光学电路切换,可自动绕过故障节点重路由;
  • FP8 精度下,Pod 级别算力比竞品高出 118 倍(以 ExaFLOPS 计)。

这一性能飞跃使 Ironwood 成为当前支持超大规模模型服务(如万亿参数推理)的领先硬件平台。

软件协同优化

谷歌强调“软硬一体”设计,配套软件栈包括:

  • MaxText:新增监督微调(SFT)和 GRPO(通用强化策略优化)训练路径;
  • vLLM 支持:允许开发者在 GPU 与 TPU 之间切换,仅需微调配置;
  • GKE Inference Gateway:推理首 token 延迟降低 高达 96%,服务成本减少 最多 30%

早期用户反馈

  • Anthropic:计划接入最多 100 万个 TPU,用于训练下一代大模型;
  • Lightricks(创意 AI 公司):生成式媒体质量显著提升;
  • Rise:计算需求减少约 20%。

Axion:基于 Arm 的高性价比计算实例

Axion 是谷歌云首款 Arm 架构计算产品线,包含两类实例:

实例类型状态主要用途
Axion N4A(虚拟机)预览中通用计算、Web 服务、AI 推理
Axion C4A metal(裸金属)即将预览虚拟机监控器(VMM)、本地 Arm 开发、大规模测试集群

硬件规格与性能

  • N4A:最高 64 vCPU512 GB DDR5 内存、50 Gbps 网络带宽
  • 性能表现
    • Vimeo:视频转码性能提升 约 30%
    • ZoomInfo:性价比提升 约 60%
    • Rise:同等任务计算量减少 约 20%

Axion 的推出标志着谷歌云正式加入基于 Arm 的云基础设施竞争,目标直指能效与成本敏感型工作负载。

技术根基:十余年自研硅积累

谷歌的此次发布并非孤立事件,而是其十余年定制芯片战略的延续:

  • 第一代 TPU 于 2017 年推出,早于 Transformer 架构;
  • 后续推出 YouTube VCU、五代 Tensor 芯片;
  • 配套 钛存储架构千瓦级先进液冷系统
  • 自 2020 年以来,机队稳定运行时间达 99.999%

这些积累共同构成了谷歌所称的 “AI Hypercomputer” 堆栈,在成本、规模与可靠性上形成系统性优势。

可用性时间表

  • Ironwood TPU:未来几周内全面开放(General Availability);
  • Axion N4A现已开放预览
  • Axion C4A metal即将进入预览阶段
© 版权声明

相关文章

暂无评论

none
暂无评论...