GPU Kill 是一款功能全面的命令行工具,主打跨厂商 GPU 全生命周期管理,可适配英伟达、AMD、英特尔及 Apple Silicon 系统,能轻松实现 GPU 监控、进程管控、安全防护等核心能力,是管理 GPU 基础设施的高效工具。

核心功能
GPU Kill 覆盖 GPU 管理全场景需求,从基础监控到安全防护、远程运维均有适配:
- 实时监控:精准查看 GPU 使用率、显存占用、核心温度,以及占用 GPU 的进程详情;
- 进程管控:优雅终止卡死、无响应的 GPU 进程,避免资源长期占用;
- 安全防护:智能检测加密货币挖矿程序、异常资源占用等可疑活动;
- 策略守护:支持守护模式,自定义执行资源使用策略,防止 GPU 滥用;
- 远程管理:可跨多台服务器统一管控 GPU 集群,降低运维成本;
- 多厂商兼容:全面支持英伟达、AMD、英特尔显卡及 Apple Silicon(M 系列)芯片;
- AI 集成:可对接 MCP 服务器,与 AI 助手联动实现智能化管理。

安装与运行要求
1. Windows 专属安装要求
需提前安装 Visual Studio Build Tools(编译依赖),OpenSSL 依赖由 vcpkg 自动配置,无需手动操作。
2. GPU 驱动适配要求
不同厂商 GPU 需匹配对应驱动/工具包:
- 英伟达:已安装官方英伟达驱动;
- AMD:已部署 ROCm 驱动;
- 英特尔:已安装 intel-gpu-tools 软件包;
- Apple Silicon:运行 macOS 系统的 M1/M2/M3/M4 芯片设备(无需额外驱动)。
3. 源码构建要求
- 操作系统:Linux、macOS 或 Windows;
- Rust 版本:1.70 及以上(仅从源码编译时需要)。
4. 运行基础要求
- 环境依赖:Node.js 18+ 及 npm 包管理工具;
- 服务依赖:GPU Kill 后端服务器需正常运行(提供 API 支撑)。
⚠️ 关键注意点
GPU Kill 仪表盘功能需满足双服务同时运行:
- 后端服务器:占用 8080 端口,提供核心数据与接口;
- 前端 UI:占用 3000 端口,展示可视化界面;
二者缺一不可,否则仪表盘无法正常工作。
仪表盘核心能力
可视化仪表盘进一步强化 GPU 集群管理效率,核心功能包括:
- 集群实时监控:全局查看所有 GPU 的运行状态(使用率、温度、进程等);
- 安全风险分析:内置威胁检测、风险评分,快速识别挖矿、异常占用等问题;
- 策略管理:自定义资源管控策略,自动执行限制规则;
- 集群洞察:提供 Magic Moment 资源争用分析,定位资源冲突问题;
- 交互式控制:可视化操作进程管理、GPU 启停等核心动作。