AI 工具与能力地图
前置阅读:AI 基础认知(如果你还分不清 Token、上下文、Prompt)。 预期收获:读完你能按任务而不是按品牌挑工具,并能用一份选型清单评估任何新出的 AI 产品。
这页不做工具排行榜,而是帮你理解"市面上的 AI 大概解决哪些问题"。工具变化很快,真正稳定的是能力分类和选型方法。
如果你需要看 ChatGPT、Claude、Gemini、Copilot、Perplexity、Codex、Claude Code、GitHub Copilot、Figma AI 等工具的差异,直接看 主流 AI 工具能力差异。本页先讲选型方法。
先按任务选,不要先按品牌选
| 你要完成的事 | 优先看的 AI 类型 | 关注点 |
|---|---|---|
| 问概念、写文案、改表达 | 通用聊天助手 | 对话质量、上下文长度、文件能力、风格控制 |
| 查资料、追踪新信息 | 搜索研究助手 | 是否联网、是否给出处、是否能比较多资料 |
| 做文档、表格、邮件、会议纪要 | 办公协作助手 | 是否接入日常办公环境、权限是否可控 |
| 写代码、读代码、修问题 | 编程助手 | 是否能读项目、运行命令、改文件、写测试 |
| 做图、视频、原型、物料 | 多媒体和设计工具 | 画面质量、可编辑性、风格一致性、版权风险 |
| 基于内部资料回答 | 知识库/RAG 工具 | 文档处理、检索准确率、权限、引用和评测 |
| 自动完成多步骤任务 | Agent 工具 | 工具调用、权限确认、日志、失败恢复 |
工具选型的三条线
| 线索 | 要问的问题 | 决定什么 |
|---|---|---|
| 输入 | 文本、文件、图片、表格、网页、代码、数据库? | 需要通用助手、多模态、数据分析、RAG 还是编程 Agent |
| 输出 | 要自然语言、表格、JSON、图片、代码、PR、工单? | 是否需要结构化输出、工具执行和人工确认 |
| 风险 | 错了会影响个人判断、客户权益、资金、合规还是生产系统? | 是否需要引用、日志、评测、权限和回放 |
先用这三条线排除工具,再比较具体产品。否则容易被产品宣传带着走。
通用聊天助手
代表能力:
- 多轮对话。
- 长文总结和改写。
- 文件分析。
- 图片理解。
- 数据分析。
- 生成图片或辅助创作。
- 个性化记忆和自定义指令。
常见代表:
- ChatGPT。
- Claude。
- Gemini。
- Microsoft Copilot。
适合:
- 日常问答、写作、学习、方案初稿、文件总结。
不适合直接用于:
- 无校验的事实判断。
- 高风险决策。
- 需要稳定执行复杂流程的任务。
搜索研究助手
代表能力:
- 联网检索。
- 多资料归纳。
- 对比不同观点。
- 生成研究摘要。
- 帮你找到下一步该读什么。
常见代表:
- Perplexity。
- ChatGPT 搜索能力。
- Gemini 联网能力。
- Copilot 搜索能力。
适合:
- 快速了解行业、竞品、政策、技术趋势。
- 为报告、方案、选型做资料初筛。
注意:
- 搜索摘要不是最终事实。
- 关键数字、日期、引用要回到原文确认。
- 深度研究类工具适合多来源综合,但不适合直接替代专业判断。
办公协作助手
代表能力:
- 邮件总结和草拟。
- 会议纪要。
- 文档问答。
- 表格分析。
- 企业知识检索。
- 自动生成演示稿或汇报结构。
常见代表:
- Microsoft 365 Copilot。
- Notion AI。
- Google Workspace / Gemini 相关能力。
适合:
- 团队协作、知识沉淀、会议复盘、周报和管理汇报。
注意:
- 企业数据权限要先定义。
- 输出要符合团队模板和审批流程。
编程助手
代表能力:
- 解释陌生代码。
- 生成代码和测试。
- 修复错误。
- 重构局部模块。
- 生成命令和脚本。
- 在项目里连续修改多个文件。
常见代表:
- Codex。
- Claude Code。
- Cursor。
- GitHub Copilot。
适合:
- 原型开发、代码阅读、测试补齐、重复改造、问题定位。
注意:
- 不要跳过代码审查。
- 要让 AI 跑测试或给出验证方式。
- 权限和文件改动范围要清楚。
- 后台异步 Agent 适合明确 issue;本地 IDE Agent 适合开发者同步审查。
设计、图片和视频工具
代表能力:
- 生成图片。
- 修改图片。
- 生成短视频。
- 设计原型。
- 把代码或提示词转成界面。
- 把设计稿转成可实现方案。
常见代表:
- Figma AI。
- Midjourney。
- Runway。
- ChatGPT 图像能力。
- Claude / Codex / Figma 工作流。
适合:
- 快速探索风格。
- 生成低成本草稿。
- 做运营素材、产品原型、演示视觉。
注意:
- 真正上线前仍要检查版权、品牌一致性和可编辑性。
- 设计稿不能只看好不好看,还要看能不能实现、能不能复用。
知识库和 RAG 工具
代表能力:
- 文档切片。
- 向量检索。
- 混合检索。
- 重排。
- 引用。
- 知识更新。
- 权限过滤。
适合:
- 客服问答。
- 内部制度问答。
- 产品资料问答。
- 销售和售前资料助手。
- 研发知识库。
注意:
- RAG 的关键不是“能搜”,而是“搜得准、拼得好、答得稳、能追溯”。
- 需要建立评测集,不然很难判断效果有没有变好。
Agent 和自动化工具
代表能力:
- 目标拆解。
- 多步骤计划。
- 工具调用。
- 观察结果。
- 失败重试。
- 人工确认。
- 日志和回放。
适合:
- 数据分析流程。
- 客服工单处理。
- 代码修改和验证。
- 内容生产流水线。
- 运营检查和周期任务。
注意:
- Agent 不是越自主越好。
- 涉及数据修改、外部发送、资金、权限、用户影响的动作必须有人确认。
选型问题清单
- 这个任务更像问答、生成、检索、分析、设计,还是自动执行?
- 输入材料是什么:文本、文件、图片、表格、网页、代码、数据库?
- 输出需要什么格式:自然语言、表格、JSON、图片、代码、流程图?
- 是否需要最新信息?
- 是否需要接入内部资料?
- 是否需要调用外部工具?
- 错了会有什么后果?
- 是否需要日志、版本、评测和人工复核?
- 是否需要在团队内复用,还是只是个人一次性任务?
读完自测
- [ ] 同事说"我们用 AI 做客户问答吧",你能问出 3 个用于选型的问题。
- [ ] 给一个具体场景(如"周会纪要自动生成"),你能说出它该用通用聊天助手、办公助手还是 Agent,并说出理由。
- [ ] 你能区分"通用聊天助手" vs "知识库 RAG 工具"两者的核心差异。
- [ ] 用一句话解释:为什么"模型越强 = 产品越好"是错的。
下一站
| 你接下来想… | 去这里 |
|---|---|
| 学一份能给同事用的 AI 工作流模板 | AI 产品经理工作流 |
| 看主流工具具体差异 | 主流 AI 工具能力差异 |
| 把 AI 接入自己的资料 | Prompt-RAG-上下文与 MCP → RAG |
| 给具体任务找练习 | 实战任务地图 |
| 看真实行业怎么用 | 案例与资源索引 → 案例卡片 |