AI黑话词典
这里先放 80 条以上高频术语。读法不是背定义,而是知道它会影响什么决策、什么任务、什么风险。
| 术语 | 人话解释 | 真正影响 | 继续阅读 |
|---|---|---|---|
| Token | AI 读写文本的最小计量单位,可以粗略理解成字、词或标点的切片。 | 决定上下文容量、输出长度、速度和成本。 | L0-开窍.md |
| Tokenizer | 把文字切成 Token 的规则。不同模型的切法可能不同。 | 同一句话在不同模型里成本可能不一样。 | Token-上下文-请求结构.md |
| 上下文窗口 | 模型这一次请求最多能看到的 Token 总量。 | 材料太多会被截断或压缩,重点会丢。 | Token-上下文-请求结构.md |
| Long Context | 更长的上下文窗口。 | 能放更多材料,但不等于模型会自动抓住重点。 | 专题综述/上下文工程专题综述.md |
| Context Compression | 把历史对话或资料压缩成更短摘要。 | 压缩会丢细节,关键事实要单独保留。 | 专题综述/上下文工程专题综述.md |
| Prompt | 你给 AI 的任务说明。 | 好的 Prompt 要说清目标、背景、材料、限制和输出格式。 | Prompt盒.md |
| System Prompt | 系统层规则,优先级通常高于用户消息。 | 用于定义角色边界、安全规则和输出约束。 | Prompt-RAG-上下文与MCP.md |
| Developer Message | 开发者层指令,常用于产品或应用里的固定规则。 | 比普通用户输入更稳定,适合写业务约束。 | Prompt-RAG-上下文与MCP.md |
| User Message | 用户本轮输入的任务和材料。 | 用户上传资料不应覆盖系统规则。 | Token-上下文-请求结构.md |
| Temperature | 控制生成随机性的参数。 | 越高越发散,越低越稳定,但不保证正确。 | Prompt盒.md |
| Top-p | 控制候选词采样范围的参数。 | 影响多样性,普通用户不用频繁调。 | Prompt盒.md |
| Max Tokens | 限制本次最多输出多少 Token。 | 太小会截断答案,太大可能浪费成本。 | Token-上下文-请求结构.md |
| Stream | 边生成边返回。 | 适合聊天和长输出,用户等待感更低。 | 工程化与Runtime.md |
| Latency | 从发起请求到拿到结果的耗时。 | 直接影响产品体验。 | 工程化与Runtime.md |
| Throughput | 单位时间系统能处理多少请求。 | 团队或产品上线时要关心。 | 工程化与Runtime.md |
| 幻觉 | 模型说得像真的,但事实不成立。 | 需要引用、工具查询、规则校验或人工复核。 | AI基础认知.md |
| Knowledge Cutoff | 模型训练数据的时间边界。 | 近期事实要用搜索或可靠资料核对。 | AI基础认知.md |
| RAG | 检索增强生成:先查资料,再让模型基于资料回答。 | 适合知识库问答、制度查询、产品文档助手。 | 专题综述/RAG资料专题综述.md |
| Embedding | 把文本变成向量,用来做相似度检索。 | RAG 召回质量高度依赖它。 | 专题综述/RAG资料专题综述.md |
| 向量数据库 | 存储和检索向量的数据库。 | 常用于语义搜索和知识库问答。 | 专题综述/RAG资料专题综述.md |
| Chunk | 知识库切片后的片段。 | 太短丢语义,太长噪声大。 | 流程图/RAG知识问答流程.md |
| Hybrid Search | 关键词检索和向量检索结合。 | 适合产品名、编号、人名和语义问题混合的场景。 | 专题综述/RAG资料专题综述.md |
| Rerank | 把召回片段重新排序。 | 能提高最终进入上下文的资料质量。 | 专题综述/RAG资料专题综述.md |
| Citation | 回答里标注依据来自哪里。 | 用于降低幻觉和方便人工核查。 | 专题综述/RAG资料专题综述.md |
| Function Calling | 让模型按结构调用函数或工具。 | 适合查询、写入、生成结构化参数。 | 专题综述/MCP资料专题综述.md |
| Tool Use | 模型调用外部工具完成搜索、计算、读写文件等动作。 | 要有权限、参数校验和错误处理。 | 专题综述/MCP资料专题综述.md |
| MCP | Model Context Protocol,把工具和上下文标准化接入模型应用。 | 适合多工具、多客户端、多 Agent 复用。 | 专题综述/MCP资料专题综述.md |
| Agent | 围绕目标持续规划、调用工具、观察结果并交付的系统。 | 不是聊天机器人,也不是单次 Prompt。 | 专题综述/Agent资料专题综述.md |
| Workflow | 按固定步骤编排任务。 | 流程稳定时优先用 Workflow,不必都做成 Agent。 | L2-用熟.md |
| ReAct | 让模型交替进行思考和行动的 Agent 模式。 | 适合工具调用场景,但要控制循环和停止条件。 | 专题综述/Agent资料专题综述.md |
| Plan-and-Execute | 先规划,再执行的 Agent 模式。 | 适合多步骤任务,计划要能被检查。 | 专题综述/Agent资料专题综述.md |
| Memory | 系统保存的历史信息或偏好。 | 记忆不等于上下文,必须有更新和删除规则。 | 专题综述/上下文工程专题综述.md |
| 短期记忆 | 当前任务里的临时状态。 | 用于跟踪进度、已完成步骤和未决问题。 | 专题综述/上下文工程专题综述.md |
| 长期记忆 | 跨会话保存的偏好、事实或业务状态。 | 涉及隐私和过期策略,不能无限保存。 | 专题综述/上下文工程专题综述.md |
| Runtime | 让 AI 任务稳定运行的执行层。 | 管理状态、工具、权限、日志、回放和成本。 | 专题综述/Runtime资料专题综述.md |
| Trace | 记录一次任务从输入到输出的完整轨迹。 | 排查 Agent 或 RAG 问题时很关键。 | 专题综述/Runtime资料专题综述.md |
| Replay | 把历史任务按记录重新跑一遍。 | 用于定位错误和验证改动是否有效。 | 专题综述/Runtime资料专题综述.md |
| Sandbox | 隔离运行环境。 | 用于限制代码、文件或工具的风险。 | 专题综述/Runtime资料专题综述.md |
| Human-in-the-loop | 关键步骤让人确认或接管。 | 高风险写入、发送、支付、删除类动作必须考虑。 | 专题综述/Agent资料专题综述.md |
| Eval | 评测。用样例和标准判断输出质量。 | 没有评测就只能凭感觉迭代。 | 模板/评测清单.md |
| Benchmark | 公开或内部基准测试。 | 只能代表特定任务,不等于你的产品效果。 | 模板/评测清单.md |
| SWE-Bench | 用于评估模型修复真实代码问题的基准之一。 | 适合了解编程模型能力,但不能替代项目测试。 | 专题综述/Codex-Claude-Figma工作流专题综述.md |
| MMLU | 覆盖多学科知识的模型评测基准之一。 | 看综合知识,不代表真实工作流。 | 专题综述/LLM资料专题综述.md |
| A/B Test | 把不同方案给不同用户组对比效果。 | 适合验证产品改动,不适合小样本拍脑袋。 | AI产品经理工作流.md |
| PromptOps | Prompt 的版本、测试、发布和回滚管理。 | 团队共用 Prompt 时很重要。 | 专题综述/Prompt资料专题综述.md |
| Fine-tuning | 用特定数据继续训练模型。 | 不是第一选择,通常先用 Prompt、RAG、工具解决。 | 专题综述/LLM资料专题综述.md |
| RLHF | 用人类反馈训练模型的方式。 | 普通产品设计知道概念即可。 | 专题综述/LLM资料专题综述.md |
| RLAIF | 用 AI 反馈辅助训练模型的方式。 | 用于理解模型对齐,不是日常必学。 | 专题综述/LLM资料专题综述.md |
| Reasoning Model | 更擅长多步推理的模型类型。 | 适合复杂分析,但通常更慢或更贵。 | 专题综述/LLM资料专题综述.md |
| Multimodal | 能处理文本、图片、音频、视频等多种输入或输出。 | 适合截图理解、图片分析、语音总结。 | 工具盒.md |
| OCR | 从图片或扫描件中识别文字。 | 表格、合同、票据场景常用。 | 工具盒.md |
| ASR | 语音转文字。 | 会议纪要、访谈整理、课堂笔记常用。 | 工具盒.md |
| TTS | 文字转语音。 | 播报、配音、无障碍场景常用。 | 工具盒.md |
| Vision Model | 能理解图片或截图的模型。 | 适合看图、读表、找界面问题。 | 工具盒.md |
| Diffusion Model | 常见的图像生成模型路线。 | 适合理解图片生成,不必先学公式。 | 专题综述/AI基础专题综述.md |
| Canvas/Artifacts | 在对话旁生成可编辑文档、代码或可视化的工作区。 | 适合写稿、改代码、做图表和交互原型。 | 工具盒.md |
| Connectors | 把 AI 接到邮箱、网盘、日历、项目管理等系统。 | 提升上下文获取能力,也带来权限风险。 | 工具盒.md |
| API Key | 调用模型或工具服务的凭证。 | 不要写进公开代码或发给不可信的人。 | 专题综述/Runtime资料专题综述.md |
| SDK | 软件开发工具包。 | 开发者用它更方便地调用模型和工具。 | 工程化与Runtime.md |
| Webhook | 一个系统把事件主动通知另一个系统。 | 常用于自动化工作流触发。 | L2-用熟.md |
| n8n | 常见的工作流自动化工具。 | 适合把表单、表格、邮件、模型调用串起来。 | 工具盒.md |
| Dify | 常见的 LLM 应用构建平台。 | 适合做知识库问答、工作流和应用原型。 | 工具盒.md |
| Coze | 常见的智能体/机器人搭建平台。 | 适合快速搭建对话式应用和工具编排。 | 工具盒.md |
| LangChain | 常见的 LLM 应用开发框架。 | 适合工程化编排,不适合拿来替代产品设计。 | 专题综述/Agent资料专题综述.md |
| LangGraph | 常见的状态图式 Agent 框架。 | 适合复杂状态、多步骤任务和可控流程。 | 专题综述/Agent资料专题综述.md |
| LlamaIndex | 常见的数据连接和 RAG 框架。 | 适合知识库、文档检索和数据索引。 | 专题综述/RAG资料专题综述.md |
| AutoGen | 常见的多 Agent 协作框架。 | 适合探索多角色协作,但要防止复杂度过高。 | 专题综述/Agent资料专题综述.md |
| CrewAI | 常见的多 Agent 任务编排框架。 | 适合角色分工清晰的自动化任务。 | 专题综述/Agent资料专题综述.md |
| JSON Schema | 描述 JSON 字段结构和类型的规则。 | 能让模型输出更容易被程序消费。 | Prompt盒.md |
| Structured Output | 结构化输出,如 JSON、表格或固定字段。 | 适合进入系统流程和后续自动处理。 | Prompt盒.md |
| Guardrail | 护栏规则,用来限制输出、工具和行为边界。 | 减少越权、误导和不合规输出。 | 专题综述/Runtime资料专题综述.md |
| Red Team | 故意设计攻击样例测试系统弱点。 | 用于发现注入、泄露、越权和误导风险。 | 模板/评测清单.md |
| PII | 个人可识别信息。 | 进入模型或日志前要做权限和脱敏判断。 | 专题综述/Runtime资料专题综述.md |
| Data Leakage | 数据泄露。 | 常由权限、日志、提示词或工具调用设计不当导致。 | 专题综述/Runtime资料专题综述.md |
| Prompt Injection | 把恶意指令藏在网页、文档或用户输入里。 | 系统不能把外部资料当高优先级指令。 | 专题综述/上下文工程专题综述.md |
| Model Routing | 按任务选择不同模型。 | 用快模型处理简单事,用强模型处理复杂事。 | 工具盒.md |
| Caching | 缓存重复结果或中间计算。 | 能降成本和提速度,但要处理过期。 | 工程化与Runtime.md |
| Cost Budget | 给一次任务或一个用户设置成本上限。 | 防止长任务失控。 | 工程化与Runtime.md |
| Rate Limit | 接口调用频率限制。 | 产品上线前要设计排队、降级和提示。 | 工程化与Runtime.md |
| KV Cache | 模型推理时复用历史 Key/Value 的缓存机制。 | 影响长上下文和推理效率。 | 专题综述/LLM资料专题综述.md |
| Evaluation Set | 用于评测的一组固定样例。 | 每次改 Prompt、资料或模型都要复测。 | 模板/评测清单.md |
| Golden Answer | 评测样例中的理想答案或关键要点。 | 用来判断模型输出是否达标。 | 模板/评测清单.md |
| Bad Case | 失败样例。 | 是迭代 Prompt、RAG 和产品边界的最好材料。 | AI产品经理工作流.md |
使用方法
- L0 阶段只需要掌握 Token、上下文、Prompt、幻觉、工具、RAG、Agent、评测。
- L1 阶段把术语和工具任务对应起来:搜索、写作、读文件、做图、写代码、做数据。
- L2 阶段开始关注工作流:结构化输出、工具调用、权限、Trace、Bad Case。
- 做 AI 产品时,不要用术语堆方案;每个术语都要落到用户任务、输入输出、指标和风险。