主流 AI 工具能力差异

工具变化很快，不建议把学习路径建立在“某个产品按钮在哪里”。更稳定的方法是按任务选工具：输入是什么、输出要什么、是否要最新信息、是否接内部资料、是否能执行动作、错了会有什么后果。

先看能力，不先看品牌

工具类型	解决什么问题	典型输入	典型输出	适合谁
通用多模态助手	问答、写作、总结、解释、文件分析	文本、图片、PDF、表格	文字、表格、图片、代码、分析结论	普通人、产品、运营、学习者
搜索/深度研究	查最新资料、多来源综合、生成报告	问题、网页、文件、内部连接器	带引用的研究结论、报告、对比表	调研、竞品、战略、研究
办公协作助手	邮件、会议、文档、表格、企业知识	企业文档、邮件、日程、会议记录	摘要、待办、草稿、分析	职场用户、管理者
编程 Agent	读代码、改文件、跑测试、开 PR	仓库、issue、错误日志、需求	代码 diff、测试、PR、解释	工程师、技术 PM
设计/图像/视频工具	生成视觉、修改图片、原型、视频	文本、草图、参考图、设计稿	图片、视频、原型、设计建议	设计、运营、产品
知识库/RAG 工具	基于私有资料问答	文档、网页、FAQ、表格、数据库	带依据的回答、资料摘要	客服、售前、内部知识库
Agent/工作流平台	多步骤自动化和工具调用	目标、工具、数据、权限	工单、报告、更新记录、任务结果	产品、运营、工程、自动化负责人
语音/会议/实时工具	实时对话、会议摘要、音频学习	音频、会议、语音对话	转写、纪要、语音回答	会议、培训、客服

通用助手对比

工具	更突出的能力	适合任务	使用提醒
ChatGPT	多模态对话、文件分析、搜索、Deep Research、数据分析、图像生成、Projects、Connectors	日常问答、资料整理、报告、表格分析、图像草稿、长期项目	不同套餐能力差异大；事实类问题要看引用和日期
Claude	长上下文、写作、代码协作、Artifacts、Projects、Research、工具使用	长文阅读、方案写作、代码解释、复杂资料综合	长上下文不是越塞越好，仍要组织材料
Gemini	Google 搜索和 Workspace 生态、Deep Research、Canvas、文件/图片/视频相关能力	联网研究、Google 生态办公、学习资料整理	连接 Gmail/Drive 等资料时要注意权限和来源选择
Microsoft Copilot	Microsoft 365 生态、Word/Excel/PowerPoint/Teams、企业知识	企业办公、会议、文档、表格、管理汇报	价值依赖组织权限、文件质量和管理规范

搜索和研究工具

工具	核心差异	适合任务	风险
ChatGPT Search / Deep Research	搜索、综合多个来源、生成结构化研究输出	策略、报告、文献/行业调研	引用不等于正确，重要数字要回原文
Claude Research	多轮搜索和分析，可结合内部上下文	复杂问题、方案研究、资料综合	Research 会消耗更多额度和时间
Gemini Deep Research	默认包含 Google Search，可选择 Gmail/Drive 等来源，可生成报告	需要 Google 生态资料的研究	资料来源要手动检查，内部资料不能随便混用
Perplexity	搜索问答、Research/Labs 类报告和可视化产物	快速查资料、生成研究草稿	搜索摘要容易受网页质量影响

编程和软件工程 Agent

工具	典型能力	更适合	使用底线
Codex	读项目、改文件、跑命令、测试、长任务协作、自动化	本地项目改造、代码审查、文档站点、自动化任务	明确文件范围，必须跑测试和审查 diff
Claude Code	终端协作、代码理解、MCP、Subagents、长上下文工程任务	大型代码库理解、分工实现、工具链集成	高风险命令和写操作要审批
GitHub Copilot cloud agent	在 GitHub 后台研究仓库、计划、改分支、可开 PR	issue 驱动的代码修改、修 bug、补测试、文档更新	所有结果必须走 PR review
Cursor	IDE 内 Agent、代码补全、背景任务	日常开发、快速原型、局部重构	适合开发者同步审查，不适合无人值守上线

设计、图像和视频工具

工具	更突出的能力	适合任务	风险
Figma AI	设计文件内辅助、原型/文案/界面探索	产品原型、设计协作、界面草稿	仍要符合组件库和交互规范
ChatGPT 图像能力	文生图、改图、视觉草稿	插图、封面、概念图、运营素材初稿	细节和文字可能需要二次修正
Midjourney	风格化视觉、概念探索	海报、风格板、视觉灵感	可编辑性和商业版权要核查
Runway	视频生成和编辑	短视频、动效草稿、视觉实验	连贯性、版权和素材授权要检查
Adobe Firefly	Adobe 创意工作流内的生成能力	品牌素材、设计师工作流	上线前仍需品牌和版权审核

知识库、RAG 和资料问答

工具/方向	适合任务	关键判断
NotebookLM	基于用户上传资料学习、总结、音频概览、思维导图	资料是否完整、是否只基于指定来源回答
ChatGPT Projects / Connectors	长期项目、文件和外部资料连接	连接器权限、资料更新时间、引用可见性
Claude Projects	长文、项目资料、写作和分析	项目说明是否清楚，资料是否过多
Dify Knowledge	搭建知识库问答和应用	切片、检索、Rerank、引用和评测
LlamaIndex / LangGraph / LangChain 生态	自定义 RAG 和 Agent 工程	是否需要代码级可控、日志和评测

选型清单

选择任何 AI 工具前，先回答这 10 个问题：

任务是问答、生成、搜索、分析、设计、代码，还是自动执行？
输入是什么：文本、网页、PDF、表格、图片、音频、代码、数据库？
输出是什么：自然语言、表格、JSON、图片、视频、代码、PR？
是否需要最新信息？
是否必须基于内部资料？
是否需要调用外部工具或写入系统？
错了会影响什么：个人效率、团队判断、客户权益、资金、合规？
是否需要引用、日志、版本和回放？
是否能建立评测样例？
成本、时延、权限和维护责任由谁负责？

普通人的 7 天熟悉路线

天数	任务	练到的能力
第 1 天	让 AI 改写一封邮件和一段说明	目标、语气、约束
第 2 天	上传一篇长文，让 AI 输出行动清单	文件理解、结构化输出
第 3 天	用搜索型 AI 查一个新概念，并回到原文核查	联网搜索、来源校验
第 4 天	上传一张表格，让 AI 找异常和趋势	数据分析
第 5 天	让 AI 生成 3 个视觉/文案方向	多版本探索
第 6 天	用资料问答工具搭一个个人小知识库	RAG 思维
第 7 天	把一项固定任务写成可复用 Prompt	模板化和复盘

适合团队的工具分层

层级	管理方式
个人工具	给使用规范、隐私边界和推荐任务
团队模板	统一 Prompt、PRD、报告、复盘格式
业务系统	做权限、日志、评测、人工确认、回滚
自动化 Agent	分级授权、Trace、成本预算、审批、回放

更新校验入口

这些工具功能变化很快。做选型或培训前，优先看官方帮助中心和开发者文档：

下一站

想继续学	去这里
搞懂基础概念	Token、上下文与一次请求结构
按身份选择学习内容	角色导航
用工具完成具体任务	实战任务地图
做 AI 产品方案	AI 产品经理工作流