AI基础专题综述
AI 基础专题用于建立最低限度的机器学习、深度学习和模型训练常识。目标不是成为算法工程师,而是能看懂 AI 系统里的关键取舍。
主题边界
- 普通人先懂任务类型和局限;产品经理懂指标、数据和误差;工程师再深入模型训练和部署。
- 算法名词很多,不必全部背,优先理解输入、输出、训练目标和失败模式。
知识树
- 机器学习:监督/无监督、回归、分类、聚类、特征。
- 深度学习:神经网络、损失函数、优化器、过拟合、正则化。
- 模型评估:训练集/验证集/测试集、准确率、召回率、AUC、混淆矩阵。
- 生成模型:扩散模型、语言模型、多模态。
阅读顺序
- 先读回归、分类、评估指标。
- 再读神经网络、注意力、Transformer。
- 最后读具体项目案例,理解数据和指标如何落地。
常见误区
- 把训练集表现当线上效果。
- 只看准确率,不看召回、误报和业务成本。
- 忽略数据质量和标注口径。
实战任务
- 用一个表格任务判断它是分类、回归还是排序。
- 为一个客服意图识别任务设计混淆矩阵。
- 把一个模型指标翻译成业务影响。
必读资料
- 0.PyTorch 入门
- 01回归算法(15个)
- 02分类算法(12个)
- 03集成算法(12个)
- 04概率分布(13个)
- 05特征选择方法(10个)
- 06优化算法(13个)
- 07聚类算法(10个)
- 09数据预处理(12个)
- 1.深度学习入门基础
- 10损失函数(10个)
- 11正则化方法(2个)
- 12机器学习模型评估方法(9个)
- 17种常用激活函数汇总
- 2.卷积神经网络
后置阅读
- 算法公式推导和框架训练代码可按项目需要再补。