RAG精读笔记

本页汇总「RAG」主题下的 18 篇精读卡,适合按编号顺序阅读,也可以通过左侧搜索直达具体主题。

4.2 BERT系列模型4.2 BERT系列模型 BERT(Bidirectional Encoder Representations from Transformers)是2018年由Google提出的... AI 原生应用架构简介AI 原生应用架构简介 提示 AI 原生应用(AI‑Native Applications)是一类以大语言模型(LLM)为认知与推理核心,并与云原生工程协同构建的智能系统。与传统嵌... AI 核心技术AI 核心技术 [同步引用内容已省略] 机器学习 <table <colgroup <col/ <col/ </colgroup <tbody <tr <td 机器学习入门</td... Agentic RAG资料Agentic RAG资料 提示 传统 RAG 只会“检索 + 生成”,Agentic RAG 则让系统主动决策、自动优化检索流程,是智能化检索的关键进化。 Agentic RAG... 云端可信推理云端可信推理 云端可信推理:下一代 AI 安全与隐私基础设施 云端可信推理的本质是重建信任边界,而非仅仅阻止攻击。只有全栈可验证、可隔离,AI 安全才能真正落地。 AI 安全基础设... 动手搭建Agentic RAG工作流动手搭建Agentic RAG工作流 一、基于Agentic上下文工程(ACE) ACE(Agentic Context Engineering) 框架能够实现 可扩展且高效的上下... 可信性与评测可信性与评测 输出控制、可信性与评测体系 只有可评估、可控的输出,才能让 AI 真正走进生产环境。本文聚焦输出可信性与评测体系的落地实践。 评估方法与指标体系 在构建了上下文检索(... 向量数据库选型向量数据库选型 [图示已省略] 提示 向量数据库在 RAG(Retrieval Augmented Generation, 检索增强生成)系统中承担了向量化后的文本、图像、代码等数... 文档处理文档处理 想让 AI 真正“懂”你的知识?关键在于如何把杂乱无章的文档变成结构化、可检索的智能资产。 让模型"读懂"海量文本的关键在于将非结构化文档转化为易于检索的向量形式。具体流... 最佳实践最佳实践 RAG 的工程价值远超“拼装检索+LLM”,只有系统化治理才能真正提升效果。 RAG(Retrieval Augmented Generation,检索增强生成)不是简单... 框架实践框架实践 LangChain 和 LlamaIndex 不只是工具,更是 RAG 智能问答系统开发范式的变革者。选对框架,事半功倍。 构建 RAG 系统的流程涉及多个步骤和组件,幸... 概述概述 上下文工程简介 上下文工程决定了大语言模型(LLM, Large Language Model)能否真正理解世界、持续进化,是智能系统架构的核心突破口。 Session ≠ ... 概述概述 智能体核心概念与生态 提示 智能体不是万能助手,而是工程化的“团队成员”。选型与落地,关键在于可控、可审计与可扩展。 核心概念与生态 在智能体的实际应用中,理解其基本组成和生... 概述概述 提示 RAG 让大模型不再死记硬背,而是像工程师一样“查资料”,随时拥有最新知识。 RAG 是什么? 检索增强生成(RAG, Retrieval Augmented Gene... 概述概述 AI 原生基础设施概览 AI 原生基础设施正推动云原生与智能化深度融合,成为新一代应用创新的坚实基石。理解其架构与趋势,是每位云原生开发者迈向 AI 时代的关键一步。 AI ... 生态系统生态系统 [图示已省略] 提示 MCP(Model Context Protocol)生态的快速发展,标志着 AI 应用层的标准化阶段已经到来。该协议不仅是一种通信机制,更是一个能... 问题与挑战问题与挑战 常见问题与挑战 提示 在实际开发和部署 LangChain 智能体过程中,常会遇到 token 限制、链路复杂度、AI 幻觉、资源消耗、环境差异等问题。本文系统梳理这些... 降低幻觉降低幻觉 提示 本文系统梳理了 RAG 与 Agent 应用中降低幻觉、提升可靠性与可追溯性的工程实践,涵盖来源归因、声明校验、检索回退、输出约束、可观测性、在线评测与运行时保护等...