List of topics
Khai giảng lớp học NLP 04
Biểu thức chính quy - Regular Expressions
Chi tiết các thuật toán tách token
Chuẩn hóa văn bản
[Zoom 4-12-2024] Ôn tập đại số tuyến tính
[Zoom 9-12-2024 và 11-12-204] Ôn tập học máy, học sâu và các khái niệm liên quan
[Zoom 16-12-2024] Ôn tập quá trình training
[Bổ trợ] Các thuật toán Training
[Zoom 18-12-2024] Vector Semantics và Embeddings
[Zoom 23-12-2024] SkipGram, Glove và FastText
[Zoom 25-12-2024] Mô hình ngôn ngữ
[Zoom 30-12-2024] RNN và LSTM
[Zoom 06-01-2025] Bài toán dịch máy
[Zoom [8-13-16-20]-1-2025] Mô hình Transfomer (3 buổi)
[Zoom 05-02-2025] Mô hình Bert và ứng dụng
[Zoom 05-02-2025] Thực hành Bert và ứng dụng với bài toán NER và POS Tag
[Zoom 10-2-2025] GPT + Đào tạo phân tán
[Zoom 12-02-2025] Bài toán truy xuất thông tin - Information Retrieval
[Zoom 17-2-2025] Vector Database and RAG
[Zoom 19-2-2025] Transformer nâng cao
Dự án cuối khóa - 2 tuần
Workshop cuối khóa
[Zoom 10-2-2025] GPT + Đào tạo phân tán
Đọc các nghiên cứu của GPT-1, GPT-2, GPT-3 và GPT 3.5
Đào tạo mô hình phân tán song song dữ liệu và song song mô hình
1. Nội dung
1.1. Slide về GPT
1.2. Slide đào tạo phân tán
1.3. Code thực hành
Data: https://drive.google.com/drive/folders/1hIN7zSwHg1rKc_R4-J5BEhJyy5tSITQt
Code load dữ liệu:
https://drive.google.com/file/d/1t4glTDgRBd08SeChSOXlplGpnIJvUh0S/view?usp=drive_link
Code đào tạo:
https://drive.google.com/file/d/1p2AsCWHA9HWKjAmzE0kQtp8z8Gr5E4fZ/view?usp=drive_link
Script training:
python -m torch.distributed.launch --nproc_per_node 1 train.py
2. Video
2.1. [NLP 01] Video
2.2. [NLP 02] Zoom
2.3. [NLP 03] Zoom Buổi 1 - Đọc paper GPT 1, 2, 3
2.4. [NLP 04 Zoom 10-2-2025] Đọc nghiên cứu GPT và đào tạo phân tán
1. Nội dung
1.1. Slide về GPT
1.2. Slide đào tạo phân tán
1.3. Code thực hành
2. Video
2.1. [NLP 01] Video
2.2. [NLP 02] Zoom
2.3. [NLP 03] Zoom Buổi 1 - Đọc paper GPT 1, 2, 3
2.4. [NLP 04 Zoom 10-2-2025] Đọc nghiên cứu GPT và đào tạo phân tán