AI 工具与能力地图

前置阅读：AI 基础认知（如果你还分不清 Token、上下文、Prompt）。 预期收获：读完你能按任务而不是按品牌挑工具，并能用一份选型清单评估任何新出的 AI 产品。

这页不做工具排行榜，而是帮你理解"市面上的 AI 大概解决哪些问题"。工具变化很快，真正稳定的是能力分类和选型方法。

如果你需要看 ChatGPT、Claude、Gemini、Copilot、Perplexity、Codex、Claude Code、GitHub Copilot、Figma AI 等工具的差异，直接看主流 AI 工具能力差异。本页先讲选型方法。

先按任务选，不要先按品牌选

你要完成的事	优先看的 AI 类型	关注点
问概念、写文案、改表达	通用聊天助手	对话质量、上下文长度、文件能力、风格控制
查资料、追踪新信息	搜索研究助手	是否联网、是否给出处、是否能比较多资料
做文档、表格、邮件、会议纪要	办公协作助手	是否接入日常办公环境、权限是否可控
写代码、读代码、修问题	编程助手	是否能读项目、运行命令、改文件、写测试
做图、视频、原型、物料	多媒体和设计工具	画面质量、可编辑性、风格一致性、版权风险
基于内部资料回答	知识库/RAG 工具	文档处理、检索准确率、权限、引用和评测
自动完成多步骤任务	Agent 工具	工具调用、权限确认、日志、失败恢复

工具选型的三条线

线索	要问的问题	决定什么
输入	文本、文件、图片、表格、网页、代码、数据库？	需要通用助手、多模态、数据分析、RAG 还是编程 Agent
输出	要自然语言、表格、JSON、图片、代码、PR、工单？	是否需要结构化输出、工具执行和人工确认
风险	错了会影响个人判断、客户权益、资金、合规还是生产系统？	是否需要引用、日志、评测、权限和回放

先用这三条线排除工具，再比较具体产品。否则容易被产品宣传带着走。

通用聊天助手

代表能力：

多轮对话。
长文总结和改写。
文件分析。
图片理解。
数据分析。
生成图片或辅助创作。
个性化记忆和自定义指令。

常见代表：

ChatGPT。
Claude。
Gemini。
Microsoft Copilot。

适合：

日常问答、写作、学习、方案初稿、文件总结。

不适合直接用于：

无校验的事实判断。
高风险决策。
需要稳定执行复杂流程的任务。

搜索研究助手

代表能力：

联网检索。
多资料归纳。
对比不同观点。
生成研究摘要。
帮你找到下一步该读什么。

常见代表：

Perplexity。
ChatGPT 搜索能力。
Gemini 联网能力。
Copilot 搜索能力。

适合：

快速了解行业、竞品、政策、技术趋势。
为报告、方案、选型做资料初筛。

注意：

搜索摘要不是最终事实。
关键数字、日期、引用要回到原文确认。
深度研究类工具适合多来源综合，但不适合直接替代专业判断。

办公协作助手

代表能力：

邮件总结和草拟。
会议纪要。
文档问答。
表格分析。
企业知识检索。
自动生成演示稿或汇报结构。

常见代表：

Microsoft 365 Copilot。
Notion AI。
Google Workspace / Gemini 相关能力。

适合：

团队协作、知识沉淀、会议复盘、周报和管理汇报。

注意：

企业数据权限要先定义。
输出要符合团队模板和审批流程。

编程助手

代表能力：

解释陌生代码。
生成代码和测试。
修复错误。
重构局部模块。
生成命令和脚本。
在项目里连续修改多个文件。

常见代表：

Codex。
Claude Code。
Cursor。
GitHub Copilot。

适合：

原型开发、代码阅读、测试补齐、重复改造、问题定位。

注意：

不要跳过代码审查。
要让 AI 跑测试或给出验证方式。
权限和文件改动范围要清楚。
后台异步 Agent 适合明确 issue；本地 IDE Agent 适合开发者同步审查。

设计、图片和视频工具

代表能力：

生成图片。
修改图片。
生成短视频。
设计原型。
把代码或提示词转成界面。
把设计稿转成可实现方案。

常见代表：

Figma AI。
Midjourney。
Runway。
ChatGPT 图像能力。
Claude / Codex / Figma 工作流。

适合：

快速探索风格。
生成低成本草稿。
做运营素材、产品原型、演示视觉。

注意：

真正上线前仍要检查版权、品牌一致性和可编辑性。
设计稿不能只看好不好看，还要看能不能实现、能不能复用。

知识库和 RAG 工具

代表能力：

文档切片。
向量检索。
混合检索。
重排。
引用。
知识更新。
权限过滤。

适合：

客服问答。
内部制度问答。
产品资料问答。
销售和售前资料助手。
研发知识库。

注意：

RAG 的关键不是“能搜”，而是“搜得准、拼得好、答得稳、能追溯”。
需要建立评测集，不然很难判断效果有没有变好。

Agent 和自动化工具

代表能力：

目标拆解。
多步骤计划。
工具调用。
观察结果。
失败重试。
人工确认。
日志和回放。

适合：

数据分析流程。
客服工单处理。
代码修改和验证。
内容生产流水线。
运营检查和周期任务。

注意：

Agent 不是越自主越好。
涉及数据修改、外部发送、资金、权限、用户影响的动作必须有人确认。

选型问题清单

这个任务更像问答、生成、检索、分析、设计，还是自动执行？
输入材料是什么：文本、文件、图片、表格、网页、代码、数据库？
输出需要什么格式：自然语言、表格、JSON、图片、代码、流程图？
是否需要最新信息？
是否需要接入内部资料？
是否需要调用外部工具？
错了会有什么后果？
是否需要日志、版本、评测和人工复核？
是否需要在团队内复用，还是只是个人一次性任务？

读完自测

[ ] 同事说"我们用 AI 做客户问答吧"，你能问出 3 个用于选型的问题。
[ ] 给一个具体场景（如"周会纪要自动生成"），你能说出它该用通用聊天助手、办公助手还是 Agent，并说出理由。
[ ] 你能区分"通用聊天助手" vs "知识库 RAG 工具"两者的核心差异。
[ ] 用一句话解释：为什么"模型越强 = 产品越好"是错的。

下一站

你接下来想…	去这里
学一份能给同事用的 AI 工作流模板	AI 产品经理工作流
看主流工具具体差异	主流 AI 工具能力差异
把 AI 接入自己的资料	Prompt-RAG-上下文与 MCP → RAG
给具体任务找练习	实战任务地图
看真实行业怎么用	案例与资源索引 → 案例卡片