谷歌云发布第七代 TPU Ironwood 与新型 Axion Arm 实例

硬件5个月前发布小马良

58 0

2025 年 11 月 6 日，谷歌云正式推出其第七代张量处理单元（TPU），并同步发布基于 Arm 架构的Axion 虚拟机与裸金属实例。这两项新产品面向 AI 实验室、SaaS 平台以及正从模型训练转向大规模推理的企业，旨在提供更高性能、更低延迟和更优性价比的基础设施。

谷歌云发布第七代 TPU Ironwood 与新型 Axion Arm 实例

Ironwood：专为前沿 AI 工作负载设计的 TPU

Ironwood 是谷歌迄今为止最强大的 TPU，专为以下场景优化：

大规模模型训练
复杂强化学习任务
高吞吐、低延迟的推理服务

关键性能指标

相比 TPU v5p，峰值吞吐量提升达 10 倍；
相比 TPU v6e，每芯片性能提升超 4 倍；
单个 Pod 可集成 9216 个芯片，通过 9.6 Tb/s 芯片间互连连接；
共享 1.77 PB 高带宽内存（HBM）；
支持光学电路切换，可自动绕过故障节点重路由；
FP8 精度下，Pod 级别算力比竞品高出 118 倍（以 ExaFLOPS 计）。

这一性能飞跃使 Ironwood 成为当前支持超大规模模型服务（如万亿参数推理）的领先硬件平台。

软件协同优化

谷歌强调“软硬一体”设计，配套软件栈包括：

MaxText：新增监督微调（SFT）和 GRPO（通用强化策略优化）训练路径；
vLLM 支持：允许开发者在 GPU 与 TPU 之间切换，仅需微调配置；
GKE Inference Gateway：推理首 token 延迟降低 高达 96%，服务成本减少 最多 30%。

早期用户反馈

Anthropic：计划接入最多 100 万个 TPU，用于训练下一代大模型；
Lightricks（创意 AI 公司）：生成式媒体质量显著提升；
Rise：计算需求减少约 20%。

Axion：基于 Arm 的高性价比计算实例

Axion 是谷歌云首款 Arm 架构计算产品线，包含两类实例：

实例类型	状态	主要用途
Axion N4A（虚拟机）	预览中	通用计算、Web 服务、AI 推理
Axion C4A metal（裸金属）	即将预览	虚拟机监控器（VMM）、本地 Arm 开发、大规模测试集群

硬件规格与性能

N4A：最高 64 vCPU、512 GB DDR5 内存、50 Gbps 网络带宽；
性能表现：
- Vimeo：视频转码性能提升 约 30%；
- ZoomInfo：性价比提升 约 60%；
- Rise：同等任务计算量减少 约 20%。

Axion 的推出标志着谷歌云正式加入基于 Arm 的云基础设施竞争，目标直指能效与成本敏感型工作负载。

技术根基：十余年自研硅积累

谷歌的此次发布并非孤立事件，而是其十余年定制芯片战略的延续：

第一代 TPU 于 2017 年推出，早于 Transformer 架构；
后续推出 YouTube VCU、五代 Tensor 芯片；
配套 钛存储架构、千瓦级先进液冷系统；
自 2020 年以来，机队稳定运行时间达 99.999%。

这些积累共同构成了谷歌所称的 “AI Hypercomputer” 堆栈，在成本、规模与可靠性上形成系统性优势。

可用性时间表

Ironwood TPU：未来几周内全面开放（General Availability）；
Axion N4A：现已开放预览；
Axion C4A metal：即将进入预览阶段。

硬件 # TPU # 谷歌云

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

Reachy Mini：面向 AI 开发者的开源机器人伴侣

Reachy Mini：面向 AI 开发者的开源机器人伴侣

硬件 # Reachy Mini # 机器人伴侣

9个月前

02700

三星与英伟达共建 AI 赋能半导体工厂，部署 5 万 GPU 优化制造全流程

三星与英伟达共建 AI 赋能半导体工厂，部署 5 万 GPU 优化制造全流程

硬件 # 三星 # 英伟达

5个月前

0290

Anthropic 扩大谷歌云合作，2026年将获超1GW TPU算力

Anthropic 扩大谷歌云合作，2026年将获超1GW TPU算力

早报 # Anthropic # 谷歌云

5个月前

0570

阿里玄铁C950刷新全球RISC-V性能纪录：5nm工艺、3.2GHz主频，专为AI Agent时代打造

阿里玄铁C950刷新全球RISC-V性能纪录：5nm工艺、3.2GHz主频，专为AI Agent时代打造

硬件 # 玄铁C950 # 阿里

1周前

060

暂无评论

none

暂无评论...