GraphRAG Workbench

6天前发布 12 00

GraphRAG Workbench是一个现代化、交互式的 Web 应用程序,用于使用微软的 GraphRAG 框架构建和可视化知识图谱。将您的文档转换为可探索的 3D 知识图谱,并具备先进的 AI 驱动分析和查询能力。

所在地:
美国
收录时间:
2025-12-09
其他站点:
GraphRAG WorkbenchGraphRAG Workbench

GraphRAG Workbench 是一个现代化的 Web 应用,旨在将微软 的 GraphRAG 框架能力以沉浸式 3D 可视化的方式呈现。你只需上传 PDF 文档,系统便会自动提取实体、关系与社区结构,生成一个可交互、可查询、可分析的知识图谱

GraphRAG Workbench

它不是简单的图数据库前端,而是一个端到端的 AI 知识发现平台——从文档摄入到 3D 探索,全程在本地或私有环境中完成(仅依赖 OpenAI API 进行文本处理)。

GraphRAG Workbench

核心能力

沉浸式 3D 可视化

  • 力导向布局 + 社区聚类:自动将相关实体聚集为“社区”,层级从 部门 → 系统 → 子系统 → 组件 → 元素 逐级展开
  • 动态视觉编码
    • 节点大小 = 实体中心性(越重要越大)
    • 连线粗细 = 关系强度
    • 颜色边界 = 社区分组
  • 交互控制:鼠标拖拽旋转、滚轮缩放、右键平移,支持辉光(Bloom)后处理增强视觉层次

智能文档处理

  • PDF 拖放上传:自动提取文本,支持批量处理
  • 实时索引进度:详细日志展示实体抽取、关系映射、社区检测各阶段状态
  • 版本存档:保存/恢复不同知识图谱快照,便于对比分析

AI 驱动的知识交互

  • 自然语言查询:通过聊天界面提问,如:

    “主要主题是什么?”
    “公司 A 和人物 B 之间有哪些关联?”

  • 多策略搜索:支持本地(local)、全局(global)、漂移(drift)等 GraphRAG 原生搜索模式
  • AI 社区报告:自动生成每个社区的摘要,快速把握核心内容

高级分析工具

  • 社区隔离器:聚焦特定社区层级,排除干扰
  • 实时筛选:按实体类型(人/组织/地点/事件)、社区级别、关系权重过滤
  • 搜索高亮:输入关键词,匹配节点立即高亮显示

技术架构

层级技术栈
前端Next.js 15 + React Three Fiber + Three.js + TailwindCSS
后端Next.js API Routes + GraphRAG(Python)
AI 引擎OpenAI(gpt-4o-mini + text-embedding-3-small
存储本地文件系统(文档 + 图谱 JSON)
部署单机运行,支持开发/生产模式

数据流
PDF 上传 → 文本提取 → GraphRAG 处理(实体/关系/社区) → JSON 转换 → 3D 可视化渲染 → 交互式查询

快速开始

前提

  • Node.js 18+
  • Python 3.10+
  • OpenAI API 密钥(用于 GraphRAG)

步骤

# 1. 克隆项目
git clone https://github.com/ChristopherLyon/graphrag-workbench.git
cd graphrag-workbench

# 2. 安装前端依赖
npm install

# 3. 配置 API 密钥
cp .env.example .env
# 编辑 .env,填入 OPENAI_API_KEY

# 4. 安装 GraphRAG
pip install graphrag

# 5. 启动
npm run dev
# 访问 http://localhost:3000

使用流程

  1. 上传 PDF(拖放或点击“Add PDFs”)
  2. 点击“Run Index”,等待 GraphRAG 完成处理(几分钟到几十分钟,取决于文档量)
  3. 探索 3D 图谱:旋转、搜索、点击节点、切换社区层级
  4. 使用聊天框进行自然语言问答

高度可配置

通过 settings.yaml 自定义处理逻辑:

models:
  default_chat_model:
    model: gpt-4o-mini
  default_embedding_model:
    model: text-embedding-3-small
extract_graph:
  entity_types: [organization, person, geo, event]  # 可增删
community_reports:
  max_length: 2000

支持调整:

  • 实体类型
  • LLM 和嵌入模型
  • 文本分块大小
  • 社区检测算法参数

系统要求与兼容性

  • 内存:8GB 最低,16GB 推荐(大文档需更多)
  • 显卡:需支持 WebGL 2.0(几乎所有现代 GPU 均满足)
  • 存储:SSD 显著提升 I/O 性能
  • 浏览器:Chrome / Edge / Firefox / Safari 最新版

注意:3D 性能与图谱规模相关。若卡顿,可:

  • 启用“社区隔离器”缩小范围
  • 禁用 Bloom 效果
  • 分批处理文档

适用场景

  • 研究者:快速梳理论文/报告中的知识脉络
  • 情报分析:从多份文档中发现隐藏关联
  • 企业知识管理:将内部文档转化为可查询知识库
  • 教育:可视化课程/教材中的概念网络
  • 开发者:学习 GraphRAG 实战应用范式

数据统计

相关导航

暂无评论

none
暂无评论...