AI 基础认知
前置阅读:建议先做 先动手 的 3 个练习,再读这一篇。"用过"再看定义更容易理解。 预期收获:读完你能解释 AI 能力类型、Token、上下文、一次请求的结构,并写出一个结构清晰的 prompt。
这篇是给第一次系统熟悉 AI 的人看的。先理解 AI 能做什么、为什么能做、一次请求里发生了什么,再进入具体工具和专题。
先把 AI 分成几类
| 类型 | 典型用途 | 适合的问题 |
|---|---|---|
| 通用聊天助手 | 问答、写作、总结、计划、解释概念 | 我想快速理解、起草、比较、改写 |
| 搜索研究助手 | 联网检索、资料整理、事实初筛 | 我想知道最近发生了什么、有哪些资料 |
| 办公协作助手 | 邮件、会议、文档、表格、演示、企业知识 | 我想减少日常办公里的重复处理 |
| 编程助手 | 代码生成、解释、测试、重构、排错 | 我想更快理解和修改代码 |
| 设计和内容工具 | 图片、视频、原型、素材、脚本 | 我想快速产生多个创意版本 |
| 知识库问答 | 私有文档检索、客服、制度问答 | 我想让 AI 基于自己的资料回答 |
| Agent 和自动化 | 多步骤任务、工具调用、持续执行 | 我想让 AI 按目标完成一串动作 |
AI 的主要优势
- 信息压缩:把长文、会议、资料和文件变成摘要、表格、待办、问题清单。
- 初稿生成:快速得到文案、PRD、代码、脚本、报告、方案的第一版。
- 多版本探索:同一目标生成多个角度,帮助人更快比较。
- 跨格式转换:把文字转成表格、清单、流程、邮件、演示稿、代码注释。
- 重复步骤自动化:把固定流程拆成可复用指令或 Agent。
- 低门槛专业辅助:让非专业用户能先做出可讨论的草稿。
AI 的常见限制
- 它不等于事实数据库,重要事实要交叉确认。
- 它只能基于当前上下文回答,看不到你没有提供的信息。
- 它可能误解目标,所以复杂任务要分步骤。
- 它对模糊约束很敏感,输入越含混,输出越不稳定。
- 它不天然知道你的业务标准、品牌风格、权限边界和验收方式。
Token 是什么
Token 可以理解为模型读写文本时使用的“片段单位”。中文、英文、标点、数字都会被切成 token。
你需要知道:
- 输入和输出都会消耗 token。
- 上下文窗口用 token 计算,窗口越大,能放进去的内容越多。
- 长文件、长对话、长提示词都会占上下文空间。
- 输出越长,等待时间和成本通常越高。
- 同样一段话,不同模型的 token 切分可能略有差异。
- 工具定义、RAG 片段、JSON 字段、图片/文件描述也可能占 token。
- 有些模型还会区分输入 token、输出 token、推理 token、缓存 token。
实践判断:
- 简单问题不要塞很多背景。
- 长文处理要先摘要、分段、提纲化。
- 需要稳定输出时,把格式要求写清楚,减少模型自由发挥。
- API 或 Agent 场景要给 token 预算,不要让长上下文和工具循环失控。
上下文是什么
上下文就是模型这一次回答时能看到的全部信息。
它通常包括:
- 系统规则:工具、风格、安全边界、角色约束。
- 用户输入:你当前提出的问题。
- 历史对话:前面几轮对话中仍被保留的内容。
- 文件和图片:你上传或系统传入的材料。
- 检索结果:RAG 或联网搜索返回的信息。
- 工具结果:代码执行、数据库查询、网页读取等外部动作结果。
关键理解:
- 模型不是一直“记得全部”,它只处理当前窗口里的上下文。
- 上下文太少会答偏;上下文太多会稀释重点。
- 好的 AI 使用者会主动组织上下文,而不是把所有材料一次性扔进去。
- “记忆”是产品层长期保存的信息,不等于本次请求一定可见。
- 检索结果、网页内容、用户上传资料不能覆盖系统规则和安全边界。
一次请求是什么结构
一次请求可以理解为:
系统规则 + 用户任务 + 相关上下文 + 可用工具 + 输出要求
-> 模型推理
-> 文本回答或工具调用
-> 工具结果再进入下一次上下文
更细一点:
| 部分 | 作用 | 例子 |
|---|---|---|
| 角色和目标 | 告诉 AI 现在要完成什么 | 你是产品经理,帮我拆 PRD |
| 背景信息 | 告诉 AI 为什么做这件事 | 目标用户、业务场景、已有资料 |
| 输入材料 | 给 AI 可处理的内容 | 文档、表格、代码、截图、会议记录 |
| 约束条件 | 限制输出边界 | 不编造数据、保持中文、不要超 500 字 |
| 输出格式 | 规定结果形态 | 表格、JSON、清单、邮件、流程图 |
| 可用工具 | 允许 AI 执行外部动作 | 搜索、读文件、跑代码、查数据库 |
| 验收标准 | 判断结果是否可用 | 覆盖 5 类用户、列出风险、给出下一步 |
如果你要从产品或工程角度继续深入,读 Token、上下文与一次请求结构。那篇会把 API 字段、工具调用、RAG 片段、结构化输出、成本和截断讲细。
好请求的基本模板
我的目标是:……
背景是:……
你可以使用的材料是:……
请你输出:……
限制条件:……
判断好坏的标准:……
如果信息不够,先问我最关键的 1-3 个问题。
为什么很多回答不稳定
常见原因:
- 目标没说清:只说“帮我优化”,没有说优化成什么。
- 背景缺失:模型不知道用户、场景、限制和判断标准。
- 输出格式不明确:模型不知道要清单、表格、文案还是代码。
- 一次要求太多:摘要、分析、生成、评估、改写全塞进一个请求。
- 没有示例:对风格、结构、颗粒度的预期没有样本。
改法:
- 先让 AI 复述任务和假设。
- 把复杂任务拆成“理解 -> 提纲 -> 初稿 -> 评估 -> 修改”。
- 给一个你喜欢的示例。
- 让 AI 列出不确定信息。
从基础到进阶的概念顺序
- Token、上下文、一次请求结构。
- Prompt、示例、约束、输出格式。
- 文件、图片、搜索、数据分析等工具能力。
- RAG:把自己的资料接入 AI。
- Agent:让 AI 围绕目标连续执行多步任务。
- 评测:判断输出是否稳定、准确、可上线。
- Runtime:把 AI 能力放进产品或业务系统里稳定运行。
读完自测
读完这页,你应该能回答下面这些问题(别只在脑子里答,写下来或讲给一个不懂的人听):
- [ ] 用 30 秒解释什么是 Token,以及为什么它会影响你的成本和回答质量。
- [ ] 同一个问题,AI 两次回答完全不同,可能是哪几种原因?
- [ ] 把"帮我优化一下这个文案"改写成一个结构完整的 prompt(包含目标、背景、材料、约束、输出格式、判断标准)。
- [ ] 列出 3 种 AI 不能信任的事实场景,以及对应的校验方式。
如果第 3 条做不出来,回头看 核心概念卡 → Prompt。
下一站
| 你接下来想… | 去这里 |
|---|---|
| 知道有哪些 AI 工具、怎么选 | AI 工具与能力地图 |
| 看主流 AI 工具的具体差异 | 主流 AI 工具能力差异 |
| 深入 Token、上下文和请求结构 | Token、上下文与一次请求结构 |
| 学怎么让 AI 用你的资料回答 | Prompt-RAG-上下文与 MCP |
| 学怎么让 AI 自动完成多步任务 | Agent 核心概念 |
| 做 AI 产品 / 写 PRD | AI 产品经理工作流 |
| 按身份选学习路径 | 角色导航 |