
你可能从未想过,一台搜索引擎会运行在洗衣房里,伴随着洗衣机的转动提供搜索结果。但这正是开发者 Ryan Pearce 正在做的事情——他没有选择云平台或数据中心,而是用两台二手服务器,在自家实用室中构建了一个能与 Google 竞争的自托管搜索引擎:Searcha Page 和其隐私导向版本 Seek Ninja。

这个项目不仅是技术实验,更是一次对现代搜索引擎架构的重新思考。
从零开始:为什么造一个自己的搜索引擎?
Ryan Pearce 曾在企业和游戏开发领域工作,出于好奇——“如果我想自己做一个搜索引擎,需要什么?”——他开始了这项工程。据《Fast Company》报道,他的目标不是复制 Google,而是探索在有限资源下,能否通过更智能的设计实现高质量的搜索体验。

如今,他的搜索引擎已爬取并索引了超过 20 亿个网页。虽然这还不到 Google 超过 4000 亿页面索引的 0.5%,但考虑到这是一个人独立维护的系统,这一规模已相当可观。他预计在未来六个月内将索引量翻倍。
硬件配置:用五年老芯片挑战科技巨头
与多数自托管项目使用树莓派或低功耗迷你主机不同,Pearce 选择了性能更强的路线:
- CPU:二手 AMD EPYC 7532(32 核 64 线程),2020 年发布时属于顶级工作站处理器;
- 成本:每块芯片不到 200 美元,性价比极高;
- 部署位置:最初放在卧室,因散热问题被迫迁至洗衣房。
由于该处理器功耗较高,长时间运行会产生大量热量。他曾尝试用风扇降温,但最终不得不在墙上钻孔布设网线,并加装临时通风口,以确保设备不会过热。
“热量不算灾难性的,但如果门关太久,就会成问题。” Pearce 坦言。
尽管有更新、线程更多的 CPU 可选,但他权衡后认为那会带来更大的散热和电力负担,反而不利于长期稳定运行。
技术核心:AI 的另类用法
Searcha Page 并不像 Bing 或 Google 那样依赖大型语言模型(LLM)来生成摘要或回答问题。它的“AI”体现在后台的机器学习算法上,主要用于:
- 查询扩展:自动识别用户输入关键词的同义词、相关术语;
- 上下文理解:分析搜索意图,提升结果的相关性;
- 排序优化:基于语义相似度而非单纯链接权重排列结果。
这种轻量级 AI 方法让他能在远少于 Google 的计算资源下,仍提供准确且有意义的结果。
更重要的是,Pearce 正在逐步减少系统对 LLM 的依赖。他已经编写了约 15 万行生产代码,但经历了超过 50 万行代码的迭代,大部分修改都是为了剥离不必要的 AI 组件,转而建立可预测、可调试的核心模块。
他的理念很明确:先用 AI 辅助构建复杂逻辑,再将其替换为确定性规则,从而获得一个高效、可控的系统。
使用方式:你可以亲自试用
Searcha Page 和 Seek Ninja 目前均已上线,公众可以免费访问:
- Searcha Page:注重功能性和结果质量;
- Seek Ninja:强调隐私保护,不追踪用户行为,适合对数据敏感的查询。
两者都支持常规网页搜索,界面简洁,响应迅速。虽然在覆盖范围和速度上尚无法与 Google 全面对抗,但对于特定场景下的精准检索,表现令人印象深刻。
未来规划:走出洗衣房
随着索引增长和流量上升,Pearce 意识到家庭环境终将遇到瓶颈。他正考虑将服务器迁移到本地小型数据中心,以便更好地管理电力、散热和网络连接。
不过,他明确表示不喜欢主流云服务(如 AWS、Google Cloud),因为缺乏物理访问权限。“我希望能在需要时走进去,插拔线缆、检查硬件。”他说。
目前,他正通过附属广告收入为迁移计划积累资金,目标是实现完全自主运营。
数据统计
相关导航


Ecosia

zdoc

GenAI Processors

Nano Banana Pro提示词

Mogul

Stax






