
全球大学计算机科学公开课
精选全球顶尖大学的计算机科学及相关学科公开课视频资源,按学校分类,涵盖编程基础、人工智能、数据结构、操作系统等主题。
这个 RAG 学习资源库的目标非常明确:降低 RAG 学习门槛,提升理解深度。无论你是学生、研究人员还是工程师,都能在这里找到适合自己水平的实践材料。通过亲手实现每一个 RAG 技术,你将更深刻地理解其工作原理,并能灵活应用于实际项目中。
检索增强生成(Retrieval-Augmented Generation, RAG)是当前大模型应用中最具实用价值的技术之一。它通过将外部知识库引入生成流程,显著提升了模型回答准确性与上下文相关性。

本项目提供了一套完整的 RAG 技术学习资源库,涵盖从基础实现到高级技巧共 20+ 种方法,每种技术都配有独立的 Jupyter Notebook 文件,包含详细代码示例和讲解,适合从零入门到深入理解 RAG 的原理与应用。
openai、numpy、matplotlib)构建。| 模块 | 描述 |
|---|---|
| 1. 简单 RAG | 入门级实现,掌握基本流程与架构 |
| 2. 语义分块 | 基于语义相似度划分文本,提高检索精度 |
| 3. 分块大小选择器 | 探索不同分块粒度对性能的影响 |
| 4. 上下文增强 RAG | 利用相邻文本块提供更多背景信息 |
| 5. 上下文分块标题 | 在嵌入前为文本块添加描述性标题 |
| 6. 文档增强 RAG | 从文本生成问题以辅助检索过程 |
| 7. 查询转换 | 使用 Step-back Prompting 和子查询分解优化查询 |
| 8. 重排序器 | 利用 LLM 对检索结果重新排序 |
| 9. 相关片段提取 | 提取连续文本片段,保持语义完整性 |
| 10. 上下文压缩 | 过滤冗余信息,压缩检索结果 |
| 11. 反馈循环 RAG | 引入用户反馈机制,实现系统自我优化 |
| 12. 自适应 RAG | 动态选择最优检索策略 |
| 13. 自监督 RAG (Self-RAG) | 自动判断是否需要检索及如何检索 |
| 14. 命题分块 | 将文档拆解为原子事实陈述,提升检索精准度 |
| 15. 多模态 RAG | 结合图像与文本进行联合检索 |
| 16. 融合 RAG | 同时使用向量搜索与关键词匹配 |
| 17. 图 RAG | 构建图结构表示知识,支持关系推理 |
| 18. 层次化 RAG | 使用摘要与详细分块结合,提升检索效率 |
| 19. HyDE RAG | 利用假设文档嵌入提升语义匹配质量 |
| 20. 校正 RAG | 动态评估检索质量并补充网络搜索 |
| 21. 强化学习 RAG | 利用强化学习机制优化 RAG 效果 |
| 最佳 RAG 查找器 | 综合使用多种策略寻找最适合当前查询的 RAG 方法 |
| 22. 知识图谱处理大数据 | 使用图结构管理大规模数据集 |
如果你是 RAG 新手,推荐按如下顺序学习:
随着理解加深,你可以尝试:
本项目采用模块化设计,每个 .ipynb 文件专注于一种 RAG 技术,结构统一:







