LLM101n-CN(共建中)

[同步引用内容已省略]

章节任务ID任务状态小节描述算力奖励
ngram101N0101S3: 已完成ngram Python 核心代码解读深度解读 EurekaLabsAI/ngram 库下的核心代码:https://github.com/EurekaLabsAI/ngram/blob/master/ngram.py300-1000
101N0102S3: 已完成ngram C 核心代码解读深度解读 EurekaLabsAI/ngram 库下的核心代码:https://github.com/EurekaLabsAI/ngram/blob/master/ngram.c300-1000
101N0103S3: 已完成ngram README 翻译翻译:https://github.com/EurekaLabsAI/ngram/blob/master/README.md50
micrograd101N0201S3:已完成Micrograd Python 核心代码解读深度解读 EurekaLabsAI/micrograd库下的核心代码:https://github.com/EurekaLabsAI/micrograd/blob/master/micrograd.py300-1000
101N0202S3:已完成Micrograd C 代码自发实现自行用C语言复现Micrograd python核心代码,并确保输出内容一致。(micrograd python核心代码:https://github.com/EurekaLabsAI/micrograd/blob/master/micrograd.py300-1000
101N0203SQ: 已废弃
(与 0201类似,没有解读必要)
Micrograd Pytorch 核心代码解读深度解读 EurekaLabsAI/micrograd库下的核心代码:https://github.com/EurekaLabsAI/micrograd/blob/master/micrograd_pytorch.py
mlp101N0301S3: 已完成MLP Python 核心代码(pytorch版)解读深度解读 urekaLabsAI/mlp 库下的核心代码:https://github.com/EurekaLabsAI/mlp/blob/master/mlp_pytorch.py300-1000
101N0302S3:已完成MLP Python 核心代码(numpy版)解读深度解读 urekaLabsAI/mlp 库下的核心代码:https://github.com/EurekaLabsAI/mlp/blob/master/mlp_numpy.py300-1000
tensor101N0401S1: 未领取Tensor README 翻译翻译:https://github.com/EurekaLabsAI/tensor/blob/master/README.md50
101N0402S0: 出题中Tensor Python 代码深度解读解读:https://github.com/EurekaLabsAI/tensor/blob/master/tensor1d.py300-1000
101N0403S0: 出题中Tensor C 代码深度解读解读:https://github.com/EurekaLabsAI/tensor/blob/master/tensor1d.c300-1000

作者介绍

LLM101n:让我们构建一个Storyteller

在本课程中,我们将建立一个讲故事的人工智能大型语言模型(LLM)。携手并进,你将能够用AI创建,完善和说明小故事。我们将使用Python、C和CUDA从头开始构建一个类似于ChatGPT的web应用程序,从基础到功能俱全,只需要最低限度的计算机科学先决条件。最后,你应该对AI, llm和深度学习有一个相对深入的了解。

Syllabus 教学大纲

  • Chapter 01 Bigram Language Model (language modeling)第01章Bigram语言模型(语言建模)
  • Chapter 02 Micrograd 机器学习,反向传播
  • Chapter 03 N-gram模型(多层感知机、matmul、gelu)
  • Chapter 04 注意力机制(注意力机制、softmax、位置编码器)
  • Chapter 05 Transformer (Transformer,残差,layernorm, GPT-2)
  • Chapter 06 Tokenization (minBPE,字节对编码)
  • Chapter 07 Optimization (initialization, optimization, AdamW)
  • Chapter 08 提速 (设备、CPU、GPU……)
  • Chapter 09 Need for Speed II: Precision (mixed precision training, fp16, bf16, fp8, ...)
  • Chapter 10 Need for Speed III: Distributed (distributed optimization, DDP, ZeRO)
  • Chapter 11 数据集(数据集、数据加载、合成数据生成)
  • Chapter 12 模型推理一:kv-cache (kv-cache)
  • Chapter 13 模型推理二:量化(量化)
  • Chapter 14 Finetuning I: SFT (supervised finetuning SFT, PEFT, LoRA, chat)第14章微调I: SFT (supervised Finetuning SFT, PEFT, LoRA, chat)
  • Chapter 15 Finetuning II: RL (reinforcement learning, RLHF, PPO, DPO)第15章微调II: RL(强化学习,RLHF, PPO, DPO)
  • Chapter 16 Deployment (API, web app)
  • Chapter 17 Multimodal (VQVAE, diffusion transformer)

Appendix 附录

Further topics to work into the progression above:在上述进展中需要进一步研究的主题:

  • Programming languages: Assembly, C, Python编程语言:汇编、C、Python
  • Data types: Integer, Float, String (ASCII, Unicode, UTF-8)数据类型:整数、浮点数、字符串(ASCII、Unicode、UTF-8)
  • Tensor: shapes, views, strides, contiguous, ...张量:形状,视图,步长,连续,…
  • Deep Learning frameowrks: PyTorch, JAX深度学习框架:PyTorch, JAX
  • Neural Net Architecture: GPT (1,2,3,4), Llama (RoPE, RMSNorm, GQA), MoE, ...神经网络架构:GPT (1,2,3,4), Llama (RoPE, RMSNorm, GQA), MoE,…
  • Multimodal: Images, Audio, Video, VQVAE, VQGAN, diffusion多模态:图像,音频,视频,VQVAE, VQGAN,扩散

Update June 25. To clarify, the course will take some time to build. There is no specific timeline. Thank you for your interest, but please do not submit Issues/PRs.

6月25日更新。为了澄清,课程将需要一些时间来建立。没有具体的时间表。谢谢您的兴趣,但请不要提交问题/ pr。