AI黑话词典

这里先放 80 条以上高频术语。读法不是背定义，而是知道它会影响什么决策、什么任务、什么风险。

术语	人话解释	真正影响	继续阅读
Token	AI 读写文本的最小计量单位，可以粗略理解成字、词或标点的切片。	决定上下文容量、输出长度、速度和成本。	L0-开窍.md
Tokenizer	把文字切成 Token 的规则。不同模型的切法可能不同。	同一句话在不同模型里成本可能不一样。	Token-上下文-请求结构.md
上下文窗口	模型这一次请求最多能看到的 Token 总量。	材料太多会被截断或压缩，重点会丢。	Token-上下文-请求结构.md
Long Context	更长的上下文窗口。	能放更多材料，但不等于模型会自动抓住重点。	专题综述/上下文工程专题综述.md
Context Compression	把历史对话或资料压缩成更短摘要。	压缩会丢细节，关键事实要单独保留。	专题综述/上下文工程专题综述.md
Prompt	你给 AI 的任务说明。	好的 Prompt 要说清目标、背景、材料、限制和输出格式。	Prompt盒.md
System Prompt	系统层规则，优先级通常高于用户消息。	用于定义角色边界、安全规则和输出约束。	Prompt-RAG-上下文与MCP.md
Developer Message	开发者层指令，常用于产品或应用里的固定规则。	比普通用户输入更稳定，适合写业务约束。	Prompt-RAG-上下文与MCP.md
User Message	用户本轮输入的任务和材料。	用户上传资料不应覆盖系统规则。	Token-上下文-请求结构.md
Temperature	控制生成随机性的参数。	越高越发散，越低越稳定，但不保证正确。	Prompt盒.md
Top-p	控制候选词采样范围的参数。	影响多样性，普通用户不用频繁调。	Prompt盒.md
Max Tokens	限制本次最多输出多少 Token。	太小会截断答案，太大可能浪费成本。	Token-上下文-请求结构.md
Stream	边生成边返回。	适合聊天和长输出，用户等待感更低。	工程化与Runtime.md
Latency	从发起请求到拿到结果的耗时。	直接影响产品体验。	工程化与Runtime.md
Throughput	单位时间系统能处理多少请求。	团队或产品上线时要关心。	工程化与Runtime.md
幻觉	模型说得像真的，但事实不成立。	需要引用、工具查询、规则校验或人工复核。	AI基础认知.md
Knowledge Cutoff	模型训练数据的时间边界。	近期事实要用搜索或可靠资料核对。	AI基础认知.md
RAG	检索增强生成：先查资料，再让模型基于资料回答。	适合知识库问答、制度查询、产品文档助手。	专题综述/RAG资料专题综述.md
Embedding	把文本变成向量，用来做相似度检索。	RAG 召回质量高度依赖它。	专题综述/RAG资料专题综述.md
向量数据库	存储和检索向量的数据库。	常用于语义搜索和知识库问答。	专题综述/RAG资料专题综述.md
Chunk	知识库切片后的片段。	太短丢语义，太长噪声大。	流程图/RAG知识问答流程.md
Hybrid Search	关键词检索和向量检索结合。	适合产品名、编号、人名和语义问题混合的场景。	专题综述/RAG资料专题综述.md
Rerank	把召回片段重新排序。	能提高最终进入上下文的资料质量。	专题综述/RAG资料专题综述.md
Citation	回答里标注依据来自哪里。	用于降低幻觉和方便人工核查。	专题综述/RAG资料专题综述.md
Function Calling	让模型按结构调用函数或工具。	适合查询、写入、生成结构化参数。	专题综述/MCP资料专题综述.md
Tool Use	模型调用外部工具完成搜索、计算、读写文件等动作。	要有权限、参数校验和错误处理。	专题综述/MCP资料专题综述.md
MCP	Model Context Protocol，把工具和上下文标准化接入模型应用。	适合多工具、多客户端、多 Agent 复用。	专题综述/MCP资料专题综述.md
Agent	围绕目标持续规划、调用工具、观察结果并交付的系统。	不是聊天机器人，也不是单次 Prompt。	专题综述/Agent资料专题综述.md
Workflow	按固定步骤编排任务。	流程稳定时优先用 Workflow，不必都做成 Agent。	L2-用熟.md
ReAct	让模型交替进行思考和行动的 Agent 模式。	适合工具调用场景，但要控制循环和停止条件。	专题综述/Agent资料专题综述.md
Plan-and-Execute	先规划，再执行的 Agent 模式。	适合多步骤任务，计划要能被检查。	专题综述/Agent资料专题综述.md
Memory	系统保存的历史信息或偏好。	记忆不等于上下文，必须有更新和删除规则。	专题综述/上下文工程专题综述.md
短期记忆	当前任务里的临时状态。	用于跟踪进度、已完成步骤和未决问题。	专题综述/上下文工程专题综述.md
长期记忆	跨会话保存的偏好、事实或业务状态。	涉及隐私和过期策略，不能无限保存。	专题综述/上下文工程专题综述.md
Runtime	让 AI 任务稳定运行的执行层。	管理状态、工具、权限、日志、回放和成本。	专题综述/Runtime资料专题综述.md
Trace	记录一次任务从输入到输出的完整轨迹。	排查 Agent 或 RAG 问题时很关键。	专题综述/Runtime资料专题综述.md
Replay	把历史任务按记录重新跑一遍。	用于定位错误和验证改动是否有效。	专题综述/Runtime资料专题综述.md
Sandbox	隔离运行环境。	用于限制代码、文件或工具的风险。	专题综述/Runtime资料专题综述.md
Human-in-the-loop	关键步骤让人确认或接管。	高风险写入、发送、支付、删除类动作必须考虑。	专题综述/Agent资料专题综述.md
Eval	评测。用样例和标准判断输出质量。	没有评测就只能凭感觉迭代。	模板/评测清单.md
Benchmark	公开或内部基准测试。	只能代表特定任务，不等于你的产品效果。	模板/评测清单.md
SWE-Bench	用于评估模型修复真实代码问题的基准之一。	适合了解编程模型能力，但不能替代项目测试。	专题综述/Codex-Claude-Figma工作流专题综述.md
MMLU	覆盖多学科知识的模型评测基准之一。	看综合知识，不代表真实工作流。	专题综述/LLM资料专题综述.md
A/B Test	把不同方案给不同用户组对比效果。	适合验证产品改动，不适合小样本拍脑袋。	AI产品经理工作流.md
PromptOps	Prompt 的版本、测试、发布和回滚管理。	团队共用 Prompt 时很重要。	专题综述/Prompt资料专题综述.md
Fine-tuning	用特定数据继续训练模型。	不是第一选择，通常先用 Prompt、RAG、工具解决。	专题综述/LLM资料专题综述.md
RLHF	用人类反馈训练模型的方式。	普通产品设计知道概念即可。	专题综述/LLM资料专题综述.md
RLAIF	用 AI 反馈辅助训练模型的方式。	用于理解模型对齐，不是日常必学。	专题综述/LLM资料专题综述.md
Reasoning Model	更擅长多步推理的模型类型。	适合复杂分析，但通常更慢或更贵。	专题综述/LLM资料专题综述.md
Multimodal	能处理文本、图片、音频、视频等多种输入或输出。	适合截图理解、图片分析、语音总结。	工具盒.md
OCR	从图片或扫描件中识别文字。	表格、合同、票据场景常用。	工具盒.md
ASR	语音转文字。	会议纪要、访谈整理、课堂笔记常用。	工具盒.md
TTS	文字转语音。	播报、配音、无障碍场景常用。	工具盒.md
Vision Model	能理解图片或截图的模型。	适合看图、读表、找界面问题。	工具盒.md
Diffusion Model	常见的图像生成模型路线。	适合理解图片生成，不必先学公式。	专题综述/AI基础专题综述.md
Canvas/Artifacts	在对话旁生成可编辑文档、代码或可视化的工作区。	适合写稿、改代码、做图表和交互原型。	工具盒.md
Connectors	把 AI 接到邮箱、网盘、日历、项目管理等系统。	提升上下文获取能力，也带来权限风险。	工具盒.md
API Key	调用模型或工具服务的凭证。	不要写进公开代码或发给不可信的人。	专题综述/Runtime资料专题综述.md
SDK	软件开发工具包。	开发者用它更方便地调用模型和工具。	工程化与Runtime.md
Webhook	一个系统把事件主动通知另一个系统。	常用于自动化工作流触发。	L2-用熟.md
n8n	常见的工作流自动化工具。	适合把表单、表格、邮件、模型调用串起来。	工具盒.md
Dify	常见的 LLM 应用构建平台。	适合做知识库问答、工作流和应用原型。	工具盒.md
Coze	常见的智能体/机器人搭建平台。	适合快速搭建对话式应用和工具编排。	工具盒.md
LangChain	常见的 LLM 应用开发框架。	适合工程化编排，不适合拿来替代产品设计。	专题综述/Agent资料专题综述.md
LangGraph	常见的状态图式 Agent 框架。	适合复杂状态、多步骤任务和可控流程。	专题综述/Agent资料专题综述.md
LlamaIndex	常见的数据连接和 RAG 框架。	适合知识库、文档检索和数据索引。	专题综述/RAG资料专题综述.md
AutoGen	常见的多 Agent 协作框架。	适合探索多角色协作，但要防止复杂度过高。	专题综述/Agent资料专题综述.md
CrewAI	常见的多 Agent 任务编排框架。	适合角色分工清晰的自动化任务。	专题综述/Agent资料专题综述.md
JSON Schema	描述 JSON 字段结构和类型的规则。	能让模型输出更容易被程序消费。	Prompt盒.md
Structured Output	结构化输出，如 JSON、表格或固定字段。	适合进入系统流程和后续自动处理。	Prompt盒.md
Guardrail	护栏规则，用来限制输出、工具和行为边界。	减少越权、误导和不合规输出。	专题综述/Runtime资料专题综述.md
Red Team	故意设计攻击样例测试系统弱点。	用于发现注入、泄露、越权和误导风险。	模板/评测清单.md
PII	个人可识别信息。	进入模型或日志前要做权限和脱敏判断。	专题综述/Runtime资料专题综述.md
Data Leakage	数据泄露。	常由权限、日志、提示词或工具调用设计不当导致。	专题综述/Runtime资料专题综述.md
Prompt Injection	把恶意指令藏在网页、文档或用户输入里。	系统不能把外部资料当高优先级指令。	专题综述/上下文工程专题综述.md
Model Routing	按任务选择不同模型。	用快模型处理简单事，用强模型处理复杂事。	工具盒.md
Caching	缓存重复结果或中间计算。	能降成本和提速度，但要处理过期。	工程化与Runtime.md
Cost Budget	给一次任务或一个用户设置成本上限。	防止长任务失控。	工程化与Runtime.md
Rate Limit	接口调用频率限制。	产品上线前要设计排队、降级和提示。	工程化与Runtime.md
KV Cache	模型推理时复用历史 Key/Value 的缓存机制。	影响长上下文和推理效率。	专题综述/LLM资料专题综述.md
Evaluation Set	用于评测的一组固定样例。	每次改 Prompt、资料或模型都要复测。	模板/评测清单.md
Golden Answer	评测样例中的理想答案或关键要点。	用来判断模型输出是否达标。	模板/评测清单.md
Bad Case	失败样例。	是迭代 Prompt、RAG 和产品边界的最好材料。	AI产品经理工作流.md

使用方法

L0 阶段只需要掌握 Token、上下文、Prompt、幻觉、工具、RAG、Agent、评测。
L1 阶段把术语和工具任务对应起来：搜索、写作、读文件、做图、写代码、做数据。
L2 阶段开始关注工作流：结构化输出、工具调用、权限、Trace、Bad Case。
做 AI 产品时，不要用术语堆方案；每个术语都要落到用户任务、输入输出、指标和风险。