List of topics
Khai giảng lớp học NLP 04
Biểu thức chính quy - Regular Expressions
Chi tiết các thuật toán tách token
Chuẩn hóa văn bản
[Zoom 4-12-2024] Ôn tập đại số tuyến tính
[Zoom 9-12-2024 và 11-12-204] Ôn tập học máy, học sâu và các khái niệm liên quan
[Zoom 16-12-2024] Ôn tập quá trình training
[Bổ trợ] Các thuật toán Training
[Zoom 18-12-2024] Vector Semantics và Embeddings
[Zoom 23-12-2024] SkipGram, Glove và FastText
[Zoom 25-12-2024] Mô hình ngôn ngữ
[Zoom 30-12-2024] RNN và LSTM
[Zoom 06-01-2025] Bài toán dịch máy
[Zoom [8-13-16-20]-1-2025] Mô hình Transfomer (3 buổi)
[Zoom 05-02-2025] Mô hình Bert và ứng dụng
[Zoom 05-02-2025] Thực hành Bert và ứng dụng với bài toán NER và POS Tag
[Zoom 10-2-2025] GPT + Đào tạo phân tán
[Zoom 12-02-2025] Bài toán truy xuất thông tin - Information Retrieval
[Zoom 17-2-2025] Vector Database and RAG
[Zoom 19-2-2025] Transformer nâng cao
Dự án cuối khóa - 2 tuần
Workshop cuối khóa

[Zoom [8-13-16-20]-1-2025] Mô hình Transfomer (3 buổi)

  • Transformer Encoder

    • Positional encoding

    • Cơ chế Attention

    • Multiheaded Attention

  • Transformer Decoder

  • Lập trình mô hình Transformer từ đầu

1. Transformer Encoder

1.1. Transformer-Encoder.pdf

1.2. Code Thực hành

Click to view more

1.3. Transformer Encoder

1.4. Video trên lớp

1.5. Tài liệu đọc thêm

2. Transformer Decoder

2.1. Transformer-Decoder.pdf

2.2. Transformer Decoder

2.3. Code thực hành

Thực hành Decoder

https://github.com/bangoc123/transformer/blob/master/transformer/layers/decoder.py

- Hướng dẫn thực hành lập trình HuggingFace.

- Hướng dẫn Build Dataset

Xây dựng GPT-2 trên tiếng Việt:

https://colab.research.google.com/drive/1HL2xPfzAhmANZLPDeTeL1jpQVUOGucPv?usp=sharing

3. Thực hành HuggingFace

3.1. Cách load dữ liệu

Các cách load dữ liệu văn bản với HuggingFace

  • Load từ HuggingFace Hub

  • Load từ CSV

  • Load từ Txt file

  • Load từ SQL Database

  • Load dữ liệu từ Arrow File

Chi tiết notebook được đăng tải tại đây: https://colab.research.google.com/drive/1-SnvvwPjyjQlJ0Ua-Qx3QXluIXDZJ52r?usp=sharing

3.2. Cách xử lý dữ liệu

Click to view more

4. Video NLP 01

4.1. [NLP 01] Zoom - Video trên lớp

Video Transformer Decoder trên lớp và cách sử dụng HuggingFace.

5. Video NLP 02

5.1. [NLP 02] Zoom 22-8-2023

5.2. [NLP 02] Zoom 28-8-2023

5.3. [NLP 02] Zoom 4-9-2024

6. Video NLP 03

6.1. [Zoom NLP 03] 29-10-2024 - Buổi 1 - Cơ chế Attention

6.2. [Zoom NLP 03] 2-11-2024 - Buổi 2 - Multiheaded Attention

6.3. [Zoom NLP 03] 5-11-2024 - Buổi 3 - Thực hành Transformer Encoder

6.4. [Zoom NLP 03] 09-11-2024 - Buổi 4 - Transformer Decoder và thực hành

7. Video NLP 04

7.1. [Zoom NLP 04] 8-1-2024 Buổi 1 - Cơ chế Attention

7.2. [Zoom NLP 04] 13-1-2024 Buổi 2 - Multi-headed Attention

7.3. [Zoom NLP 04] 16-1-2024 - Thực hành lập trình Encoder phần 1

7.4. [Zoom NLP 04] 16-1-2024 - Thực hành lập trình Encoder phần 2

7.5. [Zoom NLP 05] 20-1-2025 - Buổi 4 - Decoder và thực hành

1. Transformer Encoder
1.1. Transformer-Encoder.pdf
1.2. Code Thực hành
1.3. Transformer Encoder
1.4. Video trên lớp
1.5. Tài liệu đọc thêm
2. Transformer Decoder
2.1. Transformer-Decoder.pdf
2.2. Transformer Decoder
2.3. Code thực hành
3. Thực hành HuggingFace
3.1. Cách load dữ liệu
3.2. Cách xử lý dữ liệu
4. Video NLP 01
4.1. [NLP 01] Zoom - Video trên lớp
5. Video NLP 02
5.1. [NLP 02] Zoom 22-8-2023
5.2. [NLP 02] Zoom 28-8-2023
5.3. [NLP 02] Zoom 4-9-2024
6. Video NLP 03
6.1. [Zoom NLP 03] 29-10-2024 - Buổi 1 - Cơ chế Attention
6.2. [Zoom NLP 03] 2-11-2024 - Buổi 2 - Multiheaded Attention
6.3. [Zoom NLP 03] 5-11-2024 - Buổi 3 - Thực hành Transformer Encoder
6.4. [Zoom NLP 03] 09-11-2024 - Buổi 4 - Transformer Decoder và thực hành
7. Video NLP 04
7.1. [Zoom NLP 04] 8-1-2024 Buổi 1 - Cơ chế Attention
7.2. [Zoom NLP 04] 13-1-2024 Buổi 2 - Multi-headed Attention
7.3. [Zoom NLP 04] 16-1-2024 - Thực hành lập trình Encoder phần 1
7.4. [Zoom NLP 04] 16-1-2024 - Thực hành lập trình Encoder phần 2
7.5. [Zoom NLP 05] 20-1-2025 - Buổi 4 - Decoder và thực hành