graphify

1天前发布 8 00

graphify是一个面向 AI 编码助手的技能。 在 Claude Code、Codex、OpenCode 或 OpenClaw 中输入 /graphify,它会读取你的文件、构建知识图谱,并把原本不明显的结构关系还给你。更快理解代码库,找到架构决策背后的“为什么”。

所在地:
中国
收录时间:
2026-04-08
graphifygraphify

Graphify 是一个专为 Claude CodeCodexOpenCode 和 OpenClaw 等 AI 编码助手设计的技能(Skill)。它通过读取项目文件,构建一个包含代码结构、文档语义和多模态内容的知识图谱,帮助开发者快速理解复杂代码库的架构决策背后的“为什么”,而不仅仅是“做了什么”。

告别 RAG 复杂堆栈?Karpathy 分享“LLM 知识库”新思路:让 AI 自主维护知识库

Graphify 的核心价值在于结构化压缩:它将散乱的代码、论文、截图和笔记转化为一张互联的图谱,使 AI 在回答架构问题时,Token 消耗可降低高达 71.5 倍,并提供可解释的推理路径。

核心亮点

1. 混合多模态图谱构建

  • 代码层(确定性):使用 tree-sitter 进行本地 AST 解析,提取类、函数、导入、调用图及注释中的设计动机(Rationale)。代码内容不上传云端,确保隐私。
  • 语义层(AI 驱动):并行调用 Claude Vision/Text 模型处理 PDF、Markdown、截图和白板照片,提取概念、关系和设计意图。
  • 融合:将确定的代码结构与推断的语义关系合并,形成统一的 NetworkX 图。

2. 基于拓扑的社区发现

  • 无 Embedding 依赖:不使用向量数据库,而是基于图的边密度,利用 Leiden 算法 进行社区聚类。
  • 语义即结构:AI 提取的语义相似边(semantically_similar_to)直接参与聚类,使得功能相关但物理隔离的代码模块能被正确归类。

3. 可解释性与置信度

每条关系都带有明确的来源标记:

  • EXTRACTED:直接在源码或文档中找到(置信度 1.0)。
  • INFERRED:模型合理推断(附带 0.0-1.0 置信度分数)。
  • AMBIGUOUS:存在歧需人工复核。
  • God Nodes:识别出度最高的核心概念节点。
  • 意外连接:发现代码与论文、或不同模块间非显而易见的强关联。

4. 极致 Token 效率

  • 压缩比:对于混合语料(如 Karpathy 的仓库 + 论文 + 图片),查询时的 Token 消耗比直接读取原始文件减少 71.5 倍
  • 增量更新:基于 SHA256 缓存,仅重新处理变更过的文件。
  • 持久化:生成的 graph.json 可跨会话保存,无需每次重新解析。

安装与配置

注意:PyPI 包名为 graphifyy(因 graphify 被占用),但 CLI 命令仍为 graphify

1. 安装 Skill

pip install graphifyy && graphify install

根据你使用的平台,选择对应的安装命令:

平台安装命令备注
Claude Codegraphify install支持 PreToolUse Hook
Codexgraphify install --platform codex需在 config.tom8 开启 multi_agent = true
OpenCodegraphify install --platform opencode-
OpenClawgraphify install --platform claw目前为顺序提取

2. 启用常驻模式(推荐)

让 AI 助手在每次回答前自动参考图谱,而非盲目 grep。

# Claude Code: 写入 CLAUDE.md 并安装 Hook
graphify claude install

# Codex / OpenCode / OpenClaw: 写入 AGENTS.md
graphify codex install
graphify opencode install
graphify claw install
  • 效果:当图谱存在时,AI 会先阅读 graphify-out/GRAPH_REPORT.md,了解 God Nodes 和社区结构,从而进行结构化导航。

使用指南

基础用法

# 对当前目录构建图谱
/graphify .

# 对指定目录构建
/graphify ./docs

# 深度模式:更激进地抽取推断关系
/graphify ./raw --mode deep

# 增量更新:只处理变更文件
/graphify ./raw --update

高级查询

一旦图谱构建完成,你可以使用以下命令进行精确导航:

# 自然语言查询
/graphify query "what connects attention to the optimizer?"

# 追踪具体路径 (DFS)
/graphify query "what connects attention to the optimizer?" --dfs

# 限制 Token 预算
/graphify query "..." --budget 1500

# 查找两个节点间的路径
/graphify path "DigestAuth" "Response"

# 解释特定概念
/graphify explain "SwinTransformer"

添加外部资源

Graphify 支持将外部链接纳入图谱:

# 添加 Arxiv 论文
/graphify add https://arxiv.org/abs/1706.03762

# 添加推文或网页
/graphify add https://x.com/karpathy/status/... --author "Andrej Karpathy"

自动化同步

  • Watch 模式/graphify ./raw --watch 后台监听文件变化,代码变动即时更新 AST,文档变动提示 LLM 更新。
  • Git Hooksgraphify hook install 在 post-commit 和 post-checkout 时自动重建图谱。

输出产物

运行后会在 graphify-out/ 目录生成:

  1. graph.html:可交互的可视化图谱,支持搜索、过滤和高亮。
  2. GRAPH_REPORT.md:人类可读审计报告,包含 God Nodes、意外连接和建议提问。
  3. graph.json:持久化的图谱数据,供 AI 后续查询。
  4. cache/:SHA256 缓存文件。
  5. (可选) wiki/:为每个社区生成的 Markdown 维基百科式文档。
  6. (可选) graph.svg / graph.graphml:用于 Gephi 或 yEd 的标准格式。

隐私与安全

  • 代码本地处理:所有代码文件的 AST 解析均在本地通过 tree-sitter 完成,源代码不会发送给任何 API
  • 语义提取上云:仅文档、PDF 和图片的内容会被发送至你所配置的平台 API(如 Anthropic, OpenAI)进行语义提取。
  • 无遥测:Graphify 本身不收集任何使用数据或遥测信息。

典型应用场景

  • 遗留代码重构:快速识别核心模块(God Nodes)和隐藏的耦合关系。
  • 新入职上手:通过图谱而非逐行阅读,快速建立对项目架构的心智模型。
  • 学术研究辅助:将代码实现与相关论文、笔记关联,追溯算法的理论源头。
  • AI 辅助开发:大幅降低 AI 理解大型项目的 Token 成本,提高回答的准确性和结构性。

数据统计

相关导航

暂无评论

none
暂无评论...