动手学深度学习

[同步引用内容已省略]

斯坦福 NLP CS224N NLP 深度学习

官方英文网站:https://web.stanford.edu/class/cs224n/

GIthub仓库:https://github.com/SmartFlowAI/CS224N-CN/blob/main/README.md

  1. 注意事项:千万不能抄袭,图片copy需要标注引用来源~
  2. 可认领暂无负责人的任务。点击对应任务的“领取地址”并完成问卷填写即表示完成任务领取

自然语言处理 (NLP) 是人工智能 (AI) 的重要组成部分,它模拟了人们如何共享信息。近年来,深度学习方法在许多 NLP 任务上取得了非常高的性能。在本课程中,学生将全面了解用于 NLP 的尖端神经网络。

内容

这门课程是关于什么的?

自然语言处理 (NLP) 或计算语言学是信息时代最重要的技术之一。NLP 的应用无处不在,因为人们几乎用语言交流所有事物:网络搜索、广告、电子邮件、客户服务、语言翻译、虚拟代理、医疗报告、政治等。在 2010 年代,深度学习(或神经网络)方法在许多不同的 NLP 任务中获得了非常高的性能,使用不需要传统任务特定特征工程的单一端到端神经模型。在 2020 年代,通过扩展大型语言模型(例如 ChatGPT),取得了惊人的进一步进展。在本课程中,学生将全面了解 NLP 深度学习的基础知识以及大型语言模型 (LLM) 的最新前沿研究。通过讲座、作业和最终项目,学生将学习使用 Pytorch 框架设计、实施和理解自己的神经网络模型的必要技能

“拿去吧。CS221 教我算法。CS229 教我数学。CS224N 教我如何编写机器学习模型。” ——Carta 上的一名 CS224N 学生

先决条件

  • 精通 Python
  • 所有课程作业都将以 Python 形式完成(使用NumPyPyTorch)。如果您需要重温 Python,或者对 NumPy 不太熟悉,您可以参加第一周的 Python 复习课程(在时间表中列出。如果您有丰富的编程经验,但使用不同的语言(例如 C/C++/Matlab/Java/Javascript),那么您可能会没问题。
  • 大学微积分、线性代数(例如 MATH 51、CME 100)
  • 您应该能够轻松地获取(多变量)导数并理解矩阵/向量符号和运算。
  • 基础概率与统计学(如 CS 109 或同等课程)
  • 您应该了解概率、高斯分布、平均值、标准差等的基础知识。
  • 机器学习基础(例如 CS221、CS229、CS230 或 CS124)
  • 我们将制定成本函数,求导数并使用梯度下降进行优化。如果您已经具备基本的机器学习和/或深度学习知识,那么本课程将更容易;但是,即使没有这些知识,也可以参加 CS224n。有很多关于 ML 的介绍,包括网页、书籍和视频形式。一个平易近人的介绍是 Hal Daumé 正在编写的《机器学习课程》。阅读该书的前 5 章将是一个很好的背景知识。了解前 7 章就更好了!

参考文献

以下文章很有用,但都不是必需的。它们都可以在线免费阅读。

如果你没有神经网络背景,但仍想参加该课程,你可能会发现以下其中一本书可以为你提供更多背景知识:

日程

[已移除:营销/导流内容]