
LangExtract
LangExtract 不是一个通用的文本分析工具,而是专注于“从非结构化文本中提取结构化信息”的垂直解决方案。它将大语言模型的强大理解力与工程化设计结合,强调准确性、可追溯性和实用性,为专业领域的文本处理提供了新的可能性。
你是否希望有一个“数字哨兵”,能持续搜索网络,在找到你关心的内容时自动通知你?比如:
Open Scouts 是一个开源、可自托管的 AI 监控平台,让你创建名为“侦察员”(Scouts)的自动化任务,7×24 小时不间断工作,并在发现目标时通过邮件告警。

“侦察附近最近一周开业的咖啡馆”
“监控 Hugging Face 上新发布的文本生成模型”

| 组件 | 技术栈 | 说明 |
|---|---|---|
| 前端 | Next.js 16 + React 19 + Tailwind CSS v4 | 响应式界面,实时更新 |
| 数据库 | Supabase PostgreSQL | 含 pg_cron(调度)、pg_net(HTTP)、vector(嵌入) |
| 认证 | Supabase Auth | 支持邮箱/密码 + Google OAuth |
| AI 代理 | OpenAI GPT-4 | 通过函数调用调用 Firecrawl |
| 网页抓取 | Firecrawl SDK | 支持标准 API 或合作伙伴集成(每用户独立密钥) |
| 边缘函数 | Supabase Edge Functions(Deno) | 隔离执行每个侦察员任务 |
| 邮件 | Resend | 用于通知发送 |
每分钟
↓
pg_cron → dispatch_due_scouts() → HTTP POST → Edge Function(独立隔离)
↓
执行 AI 代理 + Firecrawl 抓取
↓
生成摘要 + 发送邮件
user_preferences(服务端),不暴露给前端pg_cron、pg_net、vector 扩展)git clone https://github.com/leonardogrig/open-scout
cd open-scout
bun install
# 配置 .env
bun run setup:db # 自动建表、设 RLS、同步密钥
bunx supabase functions deploy scout-cron
bun run dev
首次运行
setup:db会自动将 API 密钥写入 Supabase Vault,并配置 cron 作业。







