AI黑话词典

这里先放 80 条以上高频术语。读法不是背定义,而是知道它会影响什么决策、什么任务、什么风险。

术语 人话解释 真正影响 继续阅读
Token AI 读写文本的最小计量单位,可以粗略理解成字、词或标点的切片。 决定上下文容量、输出长度、速度和成本。 L0-开窍.md
Tokenizer 把文字切成 Token 的规则。不同模型的切法可能不同。 同一句话在不同模型里成本可能不一样。 Token-上下文-请求结构.md
上下文窗口 模型这一次请求最多能看到的 Token 总量。 材料太多会被截断或压缩,重点会丢。 Token-上下文-请求结构.md
Long Context 更长的上下文窗口。 能放更多材料,但不等于模型会自动抓住重点。 专题综述/上下文工程专题综述.md
Context Compression 把历史对话或资料压缩成更短摘要。 压缩会丢细节,关键事实要单独保留。 专题综述/上下文工程专题综述.md
Prompt 你给 AI 的任务说明。 好的 Prompt 要说清目标、背景、材料、限制和输出格式。 Prompt盒.md
System Prompt 系统层规则,优先级通常高于用户消息。 用于定义角色边界、安全规则和输出约束。 Prompt-RAG-上下文与MCP.md
Developer Message 开发者层指令,常用于产品或应用里的固定规则。 比普通用户输入更稳定,适合写业务约束。 Prompt-RAG-上下文与MCP.md
User Message 用户本轮输入的任务和材料。 用户上传资料不应覆盖系统规则。 Token-上下文-请求结构.md
Temperature 控制生成随机性的参数。 越高越发散,越低越稳定,但不保证正确。 Prompt盒.md
Top-p 控制候选词采样范围的参数。 影响多样性,普通用户不用频繁调。 Prompt盒.md
Max Tokens 限制本次最多输出多少 Token。 太小会截断答案,太大可能浪费成本。 Token-上下文-请求结构.md
Stream 边生成边返回。 适合聊天和长输出,用户等待感更低。 工程化与Runtime.md
Latency 从发起请求到拿到结果的耗时。 直接影响产品体验。 工程化与Runtime.md
Throughput 单位时间系统能处理多少请求。 团队或产品上线时要关心。 工程化与Runtime.md
幻觉 模型说得像真的,但事实不成立。 需要引用、工具查询、规则校验或人工复核。 AI基础认知.md
Knowledge Cutoff 模型训练数据的时间边界。 近期事实要用搜索或可靠资料核对。 AI基础认知.md
RAG 检索增强生成:先查资料,再让模型基于资料回答。 适合知识库问答、制度查询、产品文档助手。 专题综述/RAG资料专题综述.md
Embedding 把文本变成向量,用来做相似度检索。 RAG 召回质量高度依赖它。 专题综述/RAG资料专题综述.md
向量数据库 存储和检索向量的数据库。 常用于语义搜索和知识库问答。 专题综述/RAG资料专题综述.md
Chunk 知识库切片后的片段。 太短丢语义,太长噪声大。 流程图/RAG知识问答流程.md
Hybrid Search 关键词检索和向量检索结合。 适合产品名、编号、人名和语义问题混合的场景。 专题综述/RAG资料专题综述.md
Rerank 把召回片段重新排序。 能提高最终进入上下文的资料质量。 专题综述/RAG资料专题综述.md
Citation 回答里标注依据来自哪里。 用于降低幻觉和方便人工核查。 专题综述/RAG资料专题综述.md
Function Calling 让模型按结构调用函数或工具。 适合查询、写入、生成结构化参数。 专题综述/MCP资料专题综述.md
Tool Use 模型调用外部工具完成搜索、计算、读写文件等动作。 要有权限、参数校验和错误处理。 专题综述/MCP资料专题综述.md
MCP Model Context Protocol,把工具和上下文标准化接入模型应用。 适合多工具、多客户端、多 Agent 复用。 专题综述/MCP资料专题综述.md
Agent 围绕目标持续规划、调用工具、观察结果并交付的系统。 不是聊天机器人,也不是单次 Prompt。 专题综述/Agent资料专题综述.md
Workflow 按固定步骤编排任务。 流程稳定时优先用 Workflow,不必都做成 Agent。 L2-用熟.md
ReAct 让模型交替进行思考和行动的 Agent 模式。 适合工具调用场景,但要控制循环和停止条件。 专题综述/Agent资料专题综述.md
Plan-and-Execute 先规划,再执行的 Agent 模式。 适合多步骤任务,计划要能被检查。 专题综述/Agent资料专题综述.md
Memory 系统保存的历史信息或偏好。 记忆不等于上下文,必须有更新和删除规则。 专题综述/上下文工程专题综述.md
短期记忆 当前任务里的临时状态。 用于跟踪进度、已完成步骤和未决问题。 专题综述/上下文工程专题综述.md
长期记忆 跨会话保存的偏好、事实或业务状态。 涉及隐私和过期策略,不能无限保存。 专题综述/上下文工程专题综述.md
Runtime 让 AI 任务稳定运行的执行层。 管理状态、工具、权限、日志、回放和成本。 专题综述/Runtime资料专题综述.md
Trace 记录一次任务从输入到输出的完整轨迹。 排查 Agent 或 RAG 问题时很关键。 专题综述/Runtime资料专题综述.md
Replay 把历史任务按记录重新跑一遍。 用于定位错误和验证改动是否有效。 专题综述/Runtime资料专题综述.md
Sandbox 隔离运行环境。 用于限制代码、文件或工具的风险。 专题综述/Runtime资料专题综述.md
Human-in-the-loop 关键步骤让人确认或接管。 高风险写入、发送、支付、删除类动作必须考虑。 专题综述/Agent资料专题综述.md
Eval 评测。用样例和标准判断输出质量。 没有评测就只能凭感觉迭代。 模板/评测清单.md
Benchmark 公开或内部基准测试。 只能代表特定任务,不等于你的产品效果。 模板/评测清单.md
SWE-Bench 用于评估模型修复真实代码问题的基准之一。 适合了解编程模型能力,但不能替代项目测试。 专题综述/Codex-Claude-Figma工作流专题综述.md
MMLU 覆盖多学科知识的模型评测基准之一。 看综合知识,不代表真实工作流。 专题综述/LLM资料专题综述.md
A/B Test 把不同方案给不同用户组对比效果。 适合验证产品改动,不适合小样本拍脑袋。 AI产品经理工作流.md
PromptOps Prompt 的版本、测试、发布和回滚管理。 团队共用 Prompt 时很重要。 专题综述/Prompt资料专题综述.md
Fine-tuning 用特定数据继续训练模型。 不是第一选择,通常先用 Prompt、RAG、工具解决。 专题综述/LLM资料专题综述.md
RLHF 用人类反馈训练模型的方式。 普通产品设计知道概念即可。 专题综述/LLM资料专题综述.md
RLAIF 用 AI 反馈辅助训练模型的方式。 用于理解模型对齐,不是日常必学。 专题综述/LLM资料专题综述.md
Reasoning Model 更擅长多步推理的模型类型。 适合复杂分析,但通常更慢或更贵。 专题综述/LLM资料专题综述.md
Multimodal 能处理文本、图片、音频、视频等多种输入或输出。 适合截图理解、图片分析、语音总结。 工具盒.md
OCR 从图片或扫描件中识别文字。 表格、合同、票据场景常用。 工具盒.md
ASR 语音转文字。 会议纪要、访谈整理、课堂笔记常用。 工具盒.md
TTS 文字转语音。 播报、配音、无障碍场景常用。 工具盒.md
Vision Model 能理解图片或截图的模型。 适合看图、读表、找界面问题。 工具盒.md
Diffusion Model 常见的图像生成模型路线。 适合理解图片生成,不必先学公式。 专题综述/AI基础专题综述.md
Canvas/Artifacts 在对话旁生成可编辑文档、代码或可视化的工作区。 适合写稿、改代码、做图表和交互原型。 工具盒.md
Connectors 把 AI 接到邮箱、网盘、日历、项目管理等系统。 提升上下文获取能力,也带来权限风险。 工具盒.md
API Key 调用模型或工具服务的凭证。 不要写进公开代码或发给不可信的人。 专题综述/Runtime资料专题综述.md
SDK 软件开发工具包。 开发者用它更方便地调用模型和工具。 工程化与Runtime.md
Webhook 一个系统把事件主动通知另一个系统。 常用于自动化工作流触发。 L2-用熟.md
n8n 常见的工作流自动化工具。 适合把表单、表格、邮件、模型调用串起来。 工具盒.md
Dify 常见的 LLM 应用构建平台。 适合做知识库问答、工作流和应用原型。 工具盒.md
Coze 常见的智能体/机器人搭建平台。 适合快速搭建对话式应用和工具编排。 工具盒.md
LangChain 常见的 LLM 应用开发框架。 适合工程化编排,不适合拿来替代产品设计。 专题综述/Agent资料专题综述.md
LangGraph 常见的状态图式 Agent 框架。 适合复杂状态、多步骤任务和可控流程。 专题综述/Agent资料专题综述.md
LlamaIndex 常见的数据连接和 RAG 框架。 适合知识库、文档检索和数据索引。 专题综述/RAG资料专题综述.md
AutoGen 常见的多 Agent 协作框架。 适合探索多角色协作,但要防止复杂度过高。 专题综述/Agent资料专题综述.md
CrewAI 常见的多 Agent 任务编排框架。 适合角色分工清晰的自动化任务。 专题综述/Agent资料专题综述.md
JSON Schema 描述 JSON 字段结构和类型的规则。 能让模型输出更容易被程序消费。 Prompt盒.md
Structured Output 结构化输出,如 JSON、表格或固定字段。 适合进入系统流程和后续自动处理。 Prompt盒.md
Guardrail 护栏规则,用来限制输出、工具和行为边界。 减少越权、误导和不合规输出。 专题综述/Runtime资料专题综述.md
Red Team 故意设计攻击样例测试系统弱点。 用于发现注入、泄露、越权和误导风险。 模板/评测清单.md
PII 个人可识别信息。 进入模型或日志前要做权限和脱敏判断。 专题综述/Runtime资料专题综述.md
Data Leakage 数据泄露。 常由权限、日志、提示词或工具调用设计不当导致。 专题综述/Runtime资料专题综述.md
Prompt Injection 把恶意指令藏在网页、文档或用户输入里。 系统不能把外部资料当高优先级指令。 专题综述/上下文工程专题综述.md
Model Routing 按任务选择不同模型。 用快模型处理简单事,用强模型处理复杂事。 工具盒.md
Caching 缓存重复结果或中间计算。 能降成本和提速度,但要处理过期。 工程化与Runtime.md
Cost Budget 给一次任务或一个用户设置成本上限。 防止长任务失控。 工程化与Runtime.md
Rate Limit 接口调用频率限制。 产品上线前要设计排队、降级和提示。 工程化与Runtime.md
KV Cache 模型推理时复用历史 Key/Value 的缓存机制。 影响长上下文和推理效率。 专题综述/LLM资料专题综述.md
Evaluation Set 用于评测的一组固定样例。 每次改 Prompt、资料或模型都要复测。 模板/评测清单.md
Golden Answer 评测样例中的理想答案或关键要点。 用来判断模型输出是否达标。 模板/评测清单.md
Bad Case 失败样例。 是迭代 Prompt、RAG 和产品边界的最好材料。 AI产品经理工作流.md

使用方法

  1. L0 阶段只需要掌握 Token、上下文、Prompt、幻觉、工具、RAG、Agent、评测。
  2. L1 阶段把术语和工具任务对应起来:搜索、写作、读文件、做图、写代码、做数据。
  3. L2 阶段开始关注工作流:结构化输出、工具调用、权限、Trace、Bad Case。
  4. 做 AI 产品时,不要用术语堆方案;每个术语都要落到用户任务、输入输出、指标和风险。