动手学深度学习
[同步引用内容已省略]
斯坦福 NLP CS224N NLP 深度学习
官方英文网站:https://web.stanford.edu/class/cs224n/
GIthub仓库:https://github.com/SmartFlowAI/CS224N-CN/blob/main/README.md
- 注意事项:千万不能抄袭,图片copy需要标注引用来源~
- 可认领暂无负责人的任务。点击对应任务的“领取地址”并完成问卷填写即表示完成任务领取
自然语言处理 (NLP) 是人工智能 (AI) 的重要组成部分,它模拟了人们如何共享信息。近年来,深度学习方法在许多 NLP 任务上取得了非常高的性能。在本课程中,学生将全面了解用于 NLP 的尖端神经网络。
内容
这门课程是关于什么的?
自然语言处理 (NLP) 或计算语言学是信息时代最重要的技术之一。NLP 的应用无处不在,因为人们几乎用语言交流所有事物:网络搜索、广告、电子邮件、客户服务、语言翻译、虚拟代理、医疗报告、政治等。在 2010 年代,深度学习(或神经网络)方法在许多不同的 NLP 任务中获得了非常高的性能,使用不需要传统任务特定特征工程的单一端到端神经模型。在 2020 年代,通过扩展大型语言模型(例如 ChatGPT),取得了惊人的进一步进展。在本课程中,学生将全面了解 NLP 深度学习的基础知识以及大型语言模型 (LLM) 的最新前沿研究。通过讲座、作业和最终项目,学生将学习使用 Pytorch 框架设计、实施和理解自己的神经网络模型的必要技能。
“拿去吧。CS221 教我算法。CS229 教我数学。CS224N 教我如何编写机器学习模型。” ——Carta 上的一名 CS224N 学生
先决条件
- 精通 Python
- 所有课程作业都将以 Python 形式完成(使用NumPy和PyTorch)。如果您需要重温 Python,或者对 NumPy 不太熟悉,您可以参加第一周的 Python 复习课程(在时间表中列出)。如果您有丰富的编程经验,但使用不同的语言(例如 C/C++/Matlab/Java/Javascript),那么您可能会没问题。
- 大学微积分、线性代数(例如 MATH 51、CME 100)
- 您应该能够轻松地获取(多变量)导数并理解矩阵/向量符号和运算。
- 基础概率与统计学(如 CS 109 或同等课程)
- 您应该了解概率、高斯分布、平均值、标准差等的基础知识。
- 机器学习基础(例如 CS221、CS229、CS230 或 CS124)
- 我们将制定成本函数,求导数并使用梯度下降进行优化。如果您已经具备基本的机器学习和/或深度学习知识,那么本课程将更容易;但是,即使没有这些知识,也可以参加 CS224n。有很多关于 ML 的介绍,包括网页、书籍和视频形式。一个平易近人的介绍是 Hal Daumé 正在编写的《机器学习课程》。阅读该书的前 5 章将是一个很好的背景知识。了解前 7 章就更好了!
参考文献
以下文章很有用,但都不是必需的。它们都可以在线免费阅读。
- Dan Jurafsky 和 James H. Martin。语音和语言处理(2024 年预发行)
- Jacob Eisenstein。自然语言处理
- Yoav Goldberg。自然语言处理神经网络模型入门
- Ian Goodfellow、Yoshua Bengio 和 Aaron Courville。深度学习
- Delip Rao 和 Brian McMahan。使用 PyTorch 进行自然语言处理(需要斯坦福登录)。
- Lewis Tunstall、Leandro von Werra 和 Thomas Wolf。使用 Transformers 进行自然语言处理
如果你没有神经网络背景,但仍想参加该课程,你可能会发现以下其中一本书可以为你提供更多背景知识:
日程
[已移除:营销/导流内容]