
人工智能先驱 Andrej Karpathy 近日开源了一个极具洞察力的研究工具——US Job Market Visualizer。这不是传统的经济报告,而是一个基于美国劳工统计局(BLS)《职业展望手册》数据的交互式探索平台。
该项目最引人注目的成果,是利用大语言模型(LLM)为美国经济的 342 种职业 逐一打分,量化评估了当前 AI 技术对每个职业的“数字化 AI 暴露度”(Digital AI Exposure),并通过直观的矩形树图(Treemap)呈现出来,让我们能一眼看清哪些职业正处于 AI 变革的风暴中心。

🌟 核心亮点:LLM 驱动的动态着色
与传统静态图表不同,该项目的核心创新在于“基于 LLM 的着色”机制:
- 数据抓取与清洗:自动爬取 BLS 关于 342 种职业的详细数据(职责、薪资、教育要求、增长预测等),并转化为结构化 Markdown。
- LLM 智能评分:通过自定义提示词(Prompt),让 LLM 阅读每个职业的描述,并根据特定标准(如“AI 影响程度”)给出 0-10 分 的评分及理由。
- 可视化映射:将评分结果映射到交互式矩形树图中。矩形面积代表就业人数,颜色深浅代表指标数值。
不仅仅是 AI 影响:虽然默认展示“AI 影响度”,但该架构极其灵活。用户可以修改提示词,重新运行流程,瞬间生成关于“人形机器人风险”、“离岸外包概率”或“气候变化影响”的全新可视化视图。
📊 关键发现:高分不等于失业
在默认的“AI 影响程度”视图中,一些结果颇具启发性:
- 软件开发人员 得分高达 9/10。
- 解读:这不意味着程序员会失业。相反,这意味着 AI 正在深刻重塑他们的工作方式。随着效率提升,对软件的需求可能激增,从而创造更多岗位。
- 高分含义:高暴露度代表“工作内容的剧烈变革”,而非单纯的“岗位消失”。许多高分职业将被 AI 增强(Augmented),而非被取代(Replaced)。
- 局限性声明:Karpathy 强调,这些分数是 LLM 的粗略估计,未考虑需求弹性、监管障碍或社会对人类服务的偏好,仅供参考而非严谨预测。
🛠️ 技术栈与数据流程
项目完全开源,代码结构清晰,适合开发者复现或二次开发:
- 抓取:使用
Playwright下载 BLS 原始 HTML。 - 解析:利用
BeautifulSoup清洗数据并转为 Markdown。 - 评分:调用 LLM(支持 OpenRouter API)进行批量评分,输出 JSON 结果。
- 可视化:前端采用交互式矩形树图,支持切换四个维度:BLS 增长前景、薪资中位数、教育要求、AI 影响度。
关键文件一览:
| 文件 | 描述 |
|---|---|
scores.json | 342 种职业的 AI 评分及详细理由(核心数据) |
prompt.md | 打包所有职业数据的提示词文件,可直接粘贴给任意 LLM 进行对话分析 |
score.py | 评分逻辑核心,可自定义评分标准 |
site/ | 生成的静态网站源码 |
🚀 快速上手
只需简单的几步,即可在本地复现这一可视化项目:
# 1. 同步环境
uv sync
# 2. 安装浏览器驱动
uv run playwright install chromium
# 3. 配置 API 密钥 (.env 文件)
# OPENROUTER_API_KEY=your_key_here
# 4. 执行全流程
uv run python scrape.py # 抓取数据
uv run python process.py # 解析 HTML
uv run python make_csv.py # 生成统计表
uv run python score.py # LLM 评分 (耗时最长)
uv run python build_site_data.py # 构建前端数据
# 5. 本地预览
cd site && python -m http.server 8000
💡 结语
US Job Market Visualizer 不仅是一个数据可视化工具,更是一个“假设分析”沙盒。它展示了如何利用 LLM 将非结构化的职业描述转化为可量化的洞察。对于政策制定者、教育工作者以及每一位关心未来的职场人来说,这是一个理解 AI 时代职业变迁的绝佳窗口。更重要的是,它开源的代码框架鼓励我们提出自己的问题:“下一个被重塑的行业是什么?”并亲手寻找答案。
数据统计
相关导航


Flux Kontext Dataset Generator

PromptSniffer

Nano-Banana Creation

FaceShapes

Nano Banana Browser

Banana prompts






