RAG专题综述
RAG 的核心不是“把文档丢给模型”,而是让模型在回答前拿到正确、足够、可追溯的证据。
主题流程图
主题边界
- 知识稳定且可以直接写进 Prompt 时,不必上 RAG。
- 资料多、更新快、权限复杂或需要引用时,应考虑 RAG。
- RAG 不能替代事实校验;它只提高可追溯性和召回概率。
知识树
- 知识源:文档、网页、表格、FAQ、代码、数据库。
- 处理:清洗、切片、metadata、Embedding、索引。
- 检索:关键词、向量、混合检索、过滤、重排。
- 生成:上下文拼装、冲突处理、引用展示。
- 评测:Recall@K、Faithfulness、Answer Correctness、Latency、Cost。
阅读顺序
- 先读 RAG 流程图,明确文档侧和问题侧两条链路。
- 再读切片、Embedding、Rerank、引用和评测。
- 最后用业务资料做 20 条问答集验证,而不是只看 demo。
常见误区
- 切片太小导致片段失去语义;切片太大导致召回噪声。
- 只用向量检索,漏掉产品名、编号、人名等精确词。
- 没有 metadata 和权限过滤,用户可能看到不该看的资料。
- 没有引用,无法判断答案来自资料还是模型编造。
实战任务
- 选 20 个真实问题,标注应该命中的资料片段。
- 对比 BM25、向量和混合检索的召回差异。
- 设计一版回答模板:结论、依据、引用、无法确定项。
必读资料
- 4.2 BERT系列模型
- AI 原生应用架构简介
- AI 核心技术
- Agentic RAG资料
- 云端可信推理
- 动手搭建Agentic RAG工作流
- 可信性与评测
- 向量数据库选型
- 文档处理
- 最佳实践
- 框架实践
- 概述
- 概述
- 概述
- 概述
后置阅读
- GraphRAG、Agentic RAG 适合在基础检索评测稳定后再读。