AI 产品 PRD 模板
1. 背景与目标
| 项 |
内容 |
| 业务背景 |
当前流程、用户痛点、为什么现在要做 |
| 目标用户 |
谁使用、频率、使用环境、决策权限 |
| 核心目标 |
提效、降本、增收、质量提升、规模化服务中的哪一种 |
| 成功标准 |
上线后 2-4 周内要看到什么变化 |
2. 用户任务
3. AI 能力边界
| 能力 |
本期是否做 |
说明 |
| 对话/问答 |
|
|
| 文件理解 |
|
|
| 联网搜索 |
|
|
| RAG 知识库 |
|
|
| 工具调用 |
|
|
| 自动执行动作 |
|
|
| 结构化输出 |
|
|
| 图片/音频/视频 |
|
|
4. 输入、输出与上下文
| 类别 |
内容 |
来源 |
更新频率 |
权限 |
| 用户输入 |
|
|
|
|
| 历史上下文 |
|
|
|
|
| 业务资料 |
|
|
|
|
| 工具结果 |
|
|
|
|
| 输出格式 |
文本 / 表格 / JSON / 文件 / 工单 |
|
|
|
5. 功能范围与非目标
本期范围
明确不做
必须人工确认
- 涉及对外发送、数据写入、资金、权限、用户权益、法律/医疗/金融建议的动作。
6. 核心流程
用户输入 -> 上下文装配 -> 模型判断 -> 检索/工具调用 -> 生成结果 -> 校验 -> 展示/执行 -> 记录反馈
| 步骤 |
系统动作 |
模型动作 |
工具动作 |
失败处理 |
| 1 |
|
|
|
|
| 2 |
|
|
|
|
| 3 |
|
|
|
|
7. 评测用例
| 类型 |
输入样例 |
期望输出 |
评分规则 |
是否阻断上线 |
| 正常路径 |
|
|
|
是 |
| 边界路径 |
|
|
|
是 |
| 无资料 |
|
应说明无法确定 |
|
是 |
| 诱导/越权 |
|
应拒绝或转人工 |
|
是 |
| 工具失败 |
|
应降级并提示 |
|
是 |
8. 指标与埋点
| 指标 |
口径 |
目标 |
| 任务完成率 |
用户是否得到可用结果 |
|
| 人工接管率 |
转人工次数 / 总任务数 |
|
| 正确率 |
人工抽检通过数 / 抽检数 |
|
| 平均时延 |
从提交到首个可用输出 |
|
| 单次成本 |
模型 + 工具 + 存储成本 |
|
| Bad case 率 |
失败样例 / 总样例 |
|
9. 风险与兜底
| 风险 |
触发条件 |
兜底策略 |
| 幻觉 |
找不到证据仍给结论 |
要求引用 / 无证据则说明不确定 |
| 权限越界 |
用户请求敏感资料或写操作 |
权限校验 / 人工确认 |
| 成本失控 |
长上下文、循环调用、重复重试 |
token 预算 / 超时 / 限流 |
| 数据过期 |
知识库未更新 |
展示更新时间 / 定期重建索引 |
| 输出不可解析 |
JSON/表格结构错误 |
schema 校验 / 自动重试 / 降级文本 |
10. 交付阶段
| 阶段 |
交付物 |
验收标准 |
| 原型 |
流程、Prompt、样例输出 |
关键路径跑通 |
| 小流量试点 |
埋点、评测、人工复核 |
指标达到试点目标 |
| 上线 |
权限、日志、告警、回滚 |
可监控、可回放、可接管 |