HyperbookLM

6天前发布 23 00

HyperbookLM是一款基于 Next.js 15、React 19 和 Hyperbrowser 构建的强大研究助手。它允许用户聚合多种来源(网页 URL、PDF),并通过交互式 AI 工具获得深度见解。

所在地:
美国
收录时间:
2025-12-22
HyperbookLMHyperbookLM

HyperbookLM 是一个开源的 AI 研究工具,基于 Next.js 15 和 React 19 构建,旨在帮助用户从分散的信息源中快速提取、整合并生成结构化洞察。它不仅能读网页和 PDF,还能输出摘要、幻灯片、音频甚至交互式思维导图。

如果你经常需要:

  • 快速消化一篇技术博客或行业报告;
  • 将多份白皮书整合成可查询的知识库;
  • 从竞品官网提取信息并生成 SWOT 分析;
  • 把研究内容自动转为演示文稿或播客素材;

那么 HyperbookLM 或许是你值得尝试的新工具。

核心功能

1. 多源内容摄取

  • 网页抓取:通过集成 Hyperbrowser SDK,可一键提取任意网页正文内容(支持动态渲染页面);
  • PDF 解析:使用 unpdf 在客户端本地解析 PDF,无需上传文件,保障隐私。

所有原始内容均可作为后续 AI 分析的上下文来源。

2. 多模态 AI 输出

基于用户提供的资料,系统可并行生成多种格式的衍生内容:

输出类型说明依赖模型
AI 研究摘要提炼核心观点、关键数据与逻辑脉络OpenAI gpt-4o-mini
交互式思维导图用节点关系图展示概念关联,支持拖拽探索OpenAI + React Flow
演示文稿(PPT)自动生成结构化幻灯片,适配演讲场景Google Gemini gemini-3-pro-image-preview
音频概览合成播客风格语音摘要(英文/中文)ElevenLabs eleven_turbo_v2_5(可选)
交互式聊天针对资料内容提问,获得流式回答OpenAI gpt-5-nano

所有生成内容均基于同一知识源,确保信息一致性。

技术架构

  • 前端框架:Next.js 15(App Router) + React 19
  • UI 组件:Tailwind CSS + shadcn/ui + Framer Motion(流畅交互动效)
  • 数据摄取:Hyperbrowser(浏览器自动化抓取)
  • PDF 处理unpdf(纯前端解析,无服务器依赖)
  • AI 后端:多模型协同 — OpenAI(逻辑/文本)、Gemini(视觉/排版)、ElevenLabs(语音)
  • 可视化:React Flow(可交互的思维导图)

典型应用场景

▶ 内容再利用(Content Repurposing)

抓取一篇技术博客 → 自动生成:

  • LinkedIn 轮播图(PPT 格式)
  • 5 分钟播客音频
  • 核心观点思维导图

▶ 竞品分析(Competitor Intelligence)

输入竞品官网 URL → 输出:

  • 产品功能对比摘要
  • SWOT 分析图谱
  • 可交互的问答知识库

▶ 研究自动化(Research Automation)

上传 3 份 PDF 白皮书 + 2 个文档链接 → 构建:

  • 统一可查询的知识库
  • 跨文档主题聚类
  • 自动生成综述报告

快速开始

前提:获取 API 密钥

  • Hyperbrowser(必选,用于网页抓取)
  • OpenAI(必选,用于摘要、聊天、思维导图)
  • Google Gemini(必选,用于生成幻灯片)
  • ElevenLabs(可选,用于音频)

部署步骤

git clone https://github.com/hyperbrowserai/hyperbooklm.git
cd hyperbooklm
yarn
cp .env.local.example .env.local
# 编辑 .env.local,填入你的 API 密钥
yarn dev

启动后访问 http://localhost:3000 即可使用。

所有 PDF 解析在浏览器完成,敏感文档无需担心泄露。

注意事项

  • 多模型依赖:需同时配置多个服务商密钥,初期设置略复杂;
  • Gemini 幻灯片为图像格式:当前输出为 PNG/PDF 式幻灯片,非可编辑 PPT;
  • 音频为可选模块:若无需语音,可跳过 ElevenLabs 配置;
  • 开源免费:项目采用 MIT 协议,可商用、可修改。

数据统计

相关导航

暂无评论

none
暂无评论...