每天打开几十个 RSS 源、几十个订阅号、几十个新闻站,却在大量重复、低质、情绪化的内容中疲惫不堪?你不是信息太少,而是噪音太多。
iFeed 就是为解决这个问题而设计的——它不是一个又一个的信息聚合器,而是一副“视觉降噪眼镜”:所有内容先经过 AI 评估,只有高质量、高相关性的文章,才会主动出现在你面前。其余的,静默处理,绝不打扰。
它如何工作?——AI 驱动的三层过滤机制
iFeed 的核心不是“聚合更多”,而是“筛选更准”。其处理流程分为四个阶段:
1. 内容摄入
- 支持标准 RSS 订阅
- 可扩展网页抓取器(未来支持更多数据源)
- 自动提取正文、去除广告与噪音
2. AI 理解
- 调用 OpenAI 模型对每篇文章进行一次性深度分析:
- 自动生成分类(如“技术”“国际”“产品”)
- 提取标签(如“LLM”“欧盟”“API”)
- 生成摘要
- (可选)识别实体与主题
3. 质量评级
- 由 Ranker 模型评估文章质量,输出 A/B/C/D 四级评分
- 仅 A/B 级内容进入推荐主流程,C/D 级进入冷存池(仅用于搜索兜底)
4. 智能分发
系统提供两种获取方式,适配不同场景:
▸ 用户主动获取(Pull)——个性化信息流
- 基于你的阅读行为(点击、跳过、收藏)构建兴趣画像
- 采用混合召回策略:
- 主路:向量相似度召回(OpenAI Embedding + pgvector)
- 兜底:TF-IDF 关键词匹配
- 补充:新内容、热点事件
- 最终排序融合:质量分 + 相似度 + 新鲜度 + 多样性
▸ 系统主动推送(Push)——重要事件即时通知
- 当某篇文章:
- 属于你关注的分类/标签
- 质量评分 ≥ 阈值
- 包含关键词或关键实体
- iFeed 会主动触发 Webhook,推送至:
- 即时通讯(如 Discord、飞书机器人)
- 邮件
- 自定义 BI 或搜索系统
- 可选经 LLM 生成精炼概要,附带原文链接
你可以把它想象成一个“24 小时值班的 AI 编辑”,只在真正值得你注意时敲你一下。
🛠️ 技术架构:现代、可扩展、开源
- 后端:Spring Boot 3.x(Java 17+)
- 前端:Vue 3 + Vite,响应式界面
- 数据库:
- PostgreSQL(主库)+ pgvector 插件(向量存储)
- MongoDB(缓存与非结构化数据)
- AI 服务:OpenAI Chat 与 Embedding API(可替换为本地模型)
- 检索算法:TF-IDF + 向量相似度 + 时间衰减(新鲜度)加权融合
- 部署:支持 Docker Compose 一键启动
向量表结构示例:
CREATE TABLE article_embeddings (
id BIGSERIAL PRIMARY KEY,
content TEXT,
metadata JSONB,
embedding vector(1024)
);
CREATE INDEX ON article_embeddings USING ivfflat (embedding vector_cosine_ops);
快速体验
git clone https://github.com/weekend-project-space/ifeed.git
cd ifeed
# 参考 deployment.md 配置 API 密钥与数据库
docker-compose up -d
启动后,访问前端界面,添加你的 RSS 源,系统将自动开始清洗、分析、筛选,并逐步学习你的偏好。
未来方向
- 支持 RAG 增强:将文章纳入个人知识库,支持问答式检索
- 扩展 数据源采集器(如 Substack、Newsletter、X/Twitter)
- 完善 多用户系统,支持团队共享订阅与规则
- 探索 本地 LLM 替代 OpenAI,进一步提升隐私性
适合谁用?
- 重度信息消费者:研究者、产品经理、技术决策者
- 内容筛选者:编辑、分析师、风险监测人员
- 隐私敏感用户:希望掌控数据流向,拒绝被算法绑架
- 开发者:可基于 iFeed 构建垂直领域监控系统(如竞品动态、漏洞通告)