AI 基础认知

前置阅读:建议先做 先动手 的 3 个练习,再读这一篇。"用过"再看定义更容易理解。 预期收获:读完你能解释 AI 能力类型、Token、上下文、一次请求的结构,并写出一个结构清晰的 prompt。

这篇是给第一次系统熟悉 AI 的人看的。先理解 AI 能做什么、为什么能做、一次请求里发生了什么,再进入具体工具和专题。

先把 AI 分成几类

类型 典型用途 适合的问题
通用聊天助手 问答、写作、总结、计划、解释概念 我想快速理解、起草、比较、改写
搜索研究助手 联网检索、资料整理、事实初筛 我想知道最近发生了什么、有哪些资料
办公协作助手 邮件、会议、文档、表格、演示、企业知识 我想减少日常办公里的重复处理
编程助手 代码生成、解释、测试、重构、排错 我想更快理解和修改代码
设计和内容工具 图片、视频、原型、素材、脚本 我想快速产生多个创意版本
知识库问答 私有文档检索、客服、制度问答 我想让 AI 基于自己的资料回答
Agent 和自动化 多步骤任务、工具调用、持续执行 我想让 AI 按目标完成一串动作

AI 的主要优势

  • 信息压缩:把长文、会议、资料和文件变成摘要、表格、待办、问题清单。
  • 初稿生成:快速得到文案、PRD、代码、脚本、报告、方案的第一版。
  • 多版本探索:同一目标生成多个角度,帮助人更快比较。
  • 跨格式转换:把文字转成表格、清单、流程、邮件、演示稿、代码注释。
  • 重复步骤自动化:把固定流程拆成可复用指令或 Agent。
  • 低门槛专业辅助:让非专业用户能先做出可讨论的草稿。

AI 的常见限制

  • 它不等于事实数据库,重要事实要交叉确认。
  • 它只能基于当前上下文回答,看不到你没有提供的信息。
  • 它可能误解目标,所以复杂任务要分步骤。
  • 它对模糊约束很敏感,输入越含混,输出越不稳定。
  • 它不天然知道你的业务标准、品牌风格、权限边界和验收方式。

Token 是什么

Token 可以理解为模型读写文本时使用的“片段单位”。中文、英文、标点、数字都会被切成 token。

你需要知道:

  • 输入和输出都会消耗 token。
  • 上下文窗口用 token 计算,窗口越大,能放进去的内容越多。
  • 长文件、长对话、长提示词都会占上下文空间。
  • 输出越长,等待时间和成本通常越高。
  • 同样一段话,不同模型的 token 切分可能略有差异。
  • 工具定义、RAG 片段、JSON 字段、图片/文件描述也可能占 token。
  • 有些模型还会区分输入 token、输出 token、推理 token、缓存 token。

实践判断:

  • 简单问题不要塞很多背景。
  • 长文处理要先摘要、分段、提纲化。
  • 需要稳定输出时,把格式要求写清楚,减少模型自由发挥。
  • API 或 Agent 场景要给 token 预算,不要让长上下文和工具循环失控。

上下文是什么

上下文就是模型这一次回答时能看到的全部信息。

它通常包括:

  • 系统规则:工具、风格、安全边界、角色约束。
  • 用户输入:你当前提出的问题。
  • 历史对话:前面几轮对话中仍被保留的内容。
  • 文件和图片:你上传或系统传入的材料。
  • 检索结果:RAG 或联网搜索返回的信息。
  • 工具结果:代码执行、数据库查询、网页读取等外部动作结果。

关键理解:

  • 模型不是一直“记得全部”,它只处理当前窗口里的上下文。
  • 上下文太少会答偏;上下文太多会稀释重点。
  • 好的 AI 使用者会主动组织上下文,而不是把所有材料一次性扔进去。
  • “记忆”是产品层长期保存的信息,不等于本次请求一定可见。
  • 检索结果、网页内容、用户上传资料不能覆盖系统规则和安全边界。

一次请求是什么结构

一次请求可以理解为:

系统规则 + 用户任务 + 相关上下文 + 可用工具 + 输出要求
        -> 模型推理
        -> 文本回答或工具调用
        -> 工具结果再进入下一次上下文

更细一点:

部分 作用 例子
角色和目标 告诉 AI 现在要完成什么 你是产品经理,帮我拆 PRD
背景信息 告诉 AI 为什么做这件事 目标用户、业务场景、已有资料
输入材料 给 AI 可处理的内容 文档、表格、代码、截图、会议记录
约束条件 限制输出边界 不编造数据、保持中文、不要超 500 字
输出格式 规定结果形态 表格、JSON、清单、邮件、流程图
可用工具 允许 AI 执行外部动作 搜索、读文件、跑代码、查数据库
验收标准 判断结果是否可用 覆盖 5 类用户、列出风险、给出下一步

如果你要从产品或工程角度继续深入,读 Token、上下文与一次请求结构。那篇会把 API 字段、工具调用、RAG 片段、结构化输出、成本和截断讲细。

好请求的基本模板

我的目标是:……
背景是:……
你可以使用的材料是:……
请你输出:……
限制条件:……
判断好坏的标准:……
如果信息不够,先问我最关键的 1-3 个问题。

为什么很多回答不稳定

常见原因:

  • 目标没说清:只说“帮我优化”,没有说优化成什么。
  • 背景缺失:模型不知道用户、场景、限制和判断标准。
  • 输出格式不明确:模型不知道要清单、表格、文案还是代码。
  • 一次要求太多:摘要、分析、生成、评估、改写全塞进一个请求。
  • 没有示例:对风格、结构、颗粒度的预期没有样本。

改法:

  • 先让 AI 复述任务和假设。
  • 把复杂任务拆成“理解 -> 提纲 -> 初稿 -> 评估 -> 修改”。
  • 给一个你喜欢的示例。
  • 让 AI 列出不确定信息。

从基础到进阶的概念顺序

  1. Token、上下文、一次请求结构。
  2. Prompt、示例、约束、输出格式。
  3. 文件、图片、搜索、数据分析等工具能力。
  4. RAG:把自己的资料接入 AI。
  5. Agent:让 AI 围绕目标连续执行多步任务。
  6. 评测:判断输出是否稳定、准确、可上线。
  7. Runtime:把 AI 能力放进产品或业务系统里稳定运行。

读完自测

读完这页,你应该能回答下面这些问题(别只在脑子里答,写下来或讲给一个不懂的人听):

  • [ ] 用 30 秒解释什么是 Token,以及为什么它会影响你的成本和回答质量。
  • [ ] 同一个问题,AI 两次回答完全不同,可能是哪几种原因?
  • [ ] 把"帮我优化一下这个文案"改写成一个结构完整的 prompt(包含目标、背景、材料、约束、输出格式、判断标准)。
  • [ ] 列出 3 种 AI 不能信任的事实场景,以及对应的校验方式。

如果第 3 条做不出来,回头看 核心概念卡 → Prompt

下一站

你接下来想… 去这里
知道有哪些 AI 工具、怎么选 AI 工具与能力地图
看主流 AI 工具的具体差异 主流 AI 工具能力差异
深入 Token、上下文和请求结构 Token、上下文与一次请求结构
学怎么让 AI 用你的资料回答 Prompt-RAG-上下文与 MCP
学怎么让 AI 自动完成多步任务 Agent 核心概念
做 AI 产品 / 写 PRD AI 产品经理工作流
按身份选学习路径 角色导航