List of topics
Biểu thức chính quy - Regular Expressions
Chi tiết các thuật toán tách từ
Chuẩn hóa văn bản
[Bổ trợ] Học máy là gì
[Bổ trợ] Đại số tuyến tính
Ôn tập Toán + học máy, học sâu và các khái niệm liên quan
[Bổ trợ] Các thuật toán Training
Vector Semantics và Embeddings
SkipGram, Glove, FastText và Softmax đa tầng
Mô hình ngôn ngữ
RNN và LSTM
Chữa bài tập + Ôn tập lập trình mô hình
Bài toán dịch máy
Mô hình Transfomer (3 buổi)
Mô hình Bert và ứng dụng
Thực hành Bert và ứng dụng với bài toán NER và POS Tag
GPT + Đào tạo phân tán
Bài toán truy xuất thông tin - Information Retrieval
Vector Database and RAG
Transformer nâng cao
Dự án cuối khóa - 2 tuần
Đọc thêm - Model hỏi đáp (QA)
Paper Reading - LLAMA 3.1

GPT + Đào tạo phân tán

  • Đọc các nghiên cứu của GPT-1, GPT-2, GPT-3 và GPT 3.5

  • Đào tạo mô hình phân tán song song dữ liệu và song song mô hình

1. Nội dung

1.1. Slide về GPT

1.2. Slide đào tạo phân tán

1.3. Code thực hành

Code load dữ liệu:

https://drive.google.com/file/d/1t4glTDgRBd08SeChSOXlplGpnIJvUh0S/view?usp=drive_link

Code đào tạo:

https://drive.google.com/file/d/1p2AsCWHA9HWKjAmzE0kQtp8z8Gr5E4fZ/view?usp=drive_link

Script training:

python -m torch.distributed.launch --nproc_per_node 1 train.py

2. Video

2.1. [NLP 01] Video

2.2. [NLP 02] Zoom

2.3. [NLP 03] Zoom Buổi 1 - Đọc paper GPT 1, 2, 3

1. Nội dung
1.1. Slide về GPT
1.2. Slide đào tạo phân tán
1.3. Code thực hành
2. Video
2.1. [NLP 01] Video
2.2. [NLP 02] Zoom
2.3. [NLP 03] Zoom Buổi 1 - Đọc paper GPT 1, 2, 3