SurfSense 是一款高度可定制的 AI 研究助手,不仅具备类似 NotebookLM 和 Perplexity 的强大研究能力,还通过与个人知识库的深度集成,进一步提升了实用性。它支持将您的笔记、文档、图片等保存到个人知识库中,并允许定制外部数据源(如搜索引擎 Tavily、LinkUp、Slack、Linear、Notion、YouTube 和 GitHub),从而为用户提供了一个完整的知识管理与研究解决方案。

核心功能
1. 个人知识库集成
- 多种文件格式支持
支持上传 27 种文件格式(包括文档、图片等),并将内容保存到您的个人知识库中。 - 强大的搜索功能
快速查找和研究您保存的内容,无论是笔记、文档还是图片,都能轻松定位。 - 自然语言互动
以自然语言提问,获得带引用的回答,类似于 Perplexity 的体验。

2. 外部数据源连接
SurfSense 可连接多种外部资源,扩展研究范围:
- 搜索引擎(Tavily、LinkUp)
- 项目管理工具(Slack、Linear)
- 笔记与文档管理(Notion)
- 视频平台(YouTube)
- 开发工具(GitHub)

3. 高级 RAG 技术
- 支持 150+ 种 LLM
兼容多种语言模型,满足不同任务需求。 - 支持 6000+ 嵌入模型
提供丰富的嵌入选项,优化语义搜索效果。 - 层次索引(双层 RAG 设置)
提升检索效率和精度。 - 混合搜索
结合语义搜索和全文搜索,利用倒数秩融合(RRF)技术提供最佳结果。

4. 本地部署与隐私保护
- 无缝支持 Ollama 本地 LLM
可在本地运行大语言模型,确保数据隐私。 - 开源且易于部署
提供 Docker 安装和手动安装两种方式,适合不同用户需求。

5. 播客生成
- 快速生成播客
在 20 秒内生成 3 分钟的播客内容。 - 聊天对话转音频
将研究内容或聊天记录转换为引人入胜的音频内容。 - 多 TTS 支持
支持 OpenAI、Azure 和 Google Vertex AI 等多种语音合成服务。
主要特点
- 高度可定制:SurfSense 是一个高度可定制的研究代理,用户可以根据需求调整功能模块和外部数据源。
- 实用的浏览器扩展:使用 SurfSense 扩展,您可以保存任何网页,甚至包括需要身份验证的受保护页面。
- 流畅的用户体验:支持自然语言交互,提供带引用的答案,帮助用户验证信息来源,避免错误或幻觉问题。
- 强大的技术支持:基于现代技术栈构建,包括 FastAPI、PostgreSQL、LangChain 和 Next.js 等,确保高性能和易扩展性。
如何开始?
安装选项
SurfSense 提供两种安装方式:
- Docker 安装
- 最简单的方式,所有依赖项均已容器化,开箱即用。
- 包含 pgAdmin,通过 Web 界面管理数据库。
- 支持通过
.env 文件自定义环境变量。 - Docker 设置指南
- 手动安装(推荐)
- 适合希望更精细控制设置或需要自定义部署的用户。
- 提供针对 Windows、macOS 和 Linux 的详细操作系统特定说明。
前提条件
在安装之前,请完成以下设置步骤:
- PGVector 设置
- Google OAuth 配置
- Unstructured.io API 密钥
- 其他必需的 API 密钥
未来展望
SurfSense 目前仍在积极开发中,未来计划包括:
- 添加更多连接器(如其他数据源和服务)。
- 修复小问题并优化性能。
- 实现画布功能,增强可视化能力。
- 支持文件上传问答功能(已完成)。
- 跨浏览器扩展支持(已完成)。
- 保存聊天记录和基本关键字搜索(已完成)。