RAG精读笔记

本页汇总「RAG」主题下的 18 篇精读卡，适合按编号顺序阅读，也可以通过左侧搜索直达具体主题。

4.2 BERT系列模型4.2 BERT系列模型 BERT(Bidirectional Encoder Representations from Transformers)是2018年由Google提出的... AI 原生应用架构简介AI 原生应用架构简介提示 AI 原生应用（AI‑Native Applications）是一类以大语言模型（LLM）为认知与推理核心，并与云原生工程协同构建的智能系统。与传统嵌... AI 核心技术AI 核心技术 [同步引用内容已省略] 机器学习 <table <colgroup <col/ <col/ </colgroup <tbody <tr <td 机器学习入门</td... Agentic RAG资料Agentic RAG资料提示传统 RAG 只会“检索 + 生成”，Agentic RAG 则让系统主动决策、自动优化检索流程，是智能化检索的关键进化。 Agentic RAG... 云端可信推理云端可信推理云端可信推理：下一代 AI 安全与隐私基础设施云端可信推理的本质是重建信任边界，而非仅仅阻止攻击。只有全栈可验证、可隔离，AI 安全才能真正落地。 AI 安全基础设... 动手搭建Agentic RAG工作流动手搭建Agentic RAG工作流一、基于Agentic上下文工程（ACE） ACE（Agentic Context Engineering）框架能够实现可扩展且高效的上下... 可信性与评测可信性与评测输出控制、可信性与评测体系只有可评估、可控的输出，才能让 AI 真正走进生产环境。本文聚焦输出可信性与评测体系的落地实践。评估方法与指标体系在构建了上下文检索（... 向量数据库选型向量数据库选型 [图示已省略] 提示向量数据库在 RAG（Retrieval Augmented Generation, 检索增强生成）系统中承担了向量化后的文本、图像、代码等数... 文档处理文档处理想让 AI 真正“懂”你的知识？关键在于如何把杂乱无章的文档变成结构化、可检索的智能资产。让模型"读懂"海量文本的关键在于将非结构化文档转化为易于检索的向量形式。具体流... 最佳实践最佳实践 RAG 的工程价值远超“拼装检索+LLM”，只有系统化治理才能真正提升效果。 RAG（Retrieval Augmented Generation，检索增强生成）不是简单... 框架实践框架实践 LangChain 和 LlamaIndex 不只是工具，更是 RAG 智能问答系统开发范式的变革者。选对框架，事半功倍。构建 RAG 系统的流程涉及多个步骤和组件，幸... 概述概述上下文工程简介上下文工程决定了大语言模型（LLM, Large Language Model）能否真正理解世界、持续进化，是智能系统架构的核心突破口。 Session ≠ ... 概述概述智能体核心概念与生态提示智能体不是万能助手，而是工程化的“团队成员”。选型与落地，关键在于可控、可审计与可扩展。核心概念与生态在智能体的实际应用中，理解其基本组成和生... 概述概述提示 RAG 让大模型不再死记硬背，而是像工程师一样“查资料”，随时拥有最新知识。 RAG 是什么？检索增强生成（RAG, Retrieval Augmented Gene... 概述概述 AI 原生基础设施概览 AI 原生基础设施正推动云原生与智能化深度融合，成为新一代应用创新的坚实基石。理解其架构与趋势，是每位云原生开发者迈向 AI 时代的关键一步。 AI ... 生态系统生态系统 [图示已省略] 提示 MCP（Model Context Protocol）生态的快速发展，标志着 AI 应用层的标准化阶段已经到来。该协议不仅是一种通信机制，更是一个能... 问题与挑战问题与挑战常见问题与挑战提示在实际开发和部署 LangChain 智能体过程中，常会遇到 token 限制、链路复杂度、AI 幻觉、资源消耗、环境差异等问题。本文系统梳理这些... 降低幻觉降低幻觉提示本文系统梳理了 RAG 与 Agent 应用中降低幻觉、提升可靠性与可追溯性的工程实践，涵盖来源归因、声明校验、检索回退、输出约束、可观测性、在线评测与运行时保护等...