List of topics
Các thông tin quan trọng của lớp
Biểu thức chính quy - Regular Expressions
Chi tiết các thuật toán tách token
Chuẩn hóa văn bản
Ôn tập đại số tuyến tính
Ôn tập học máy, học sâu và các khái niệm liên quan
Ôn tập quá trình training
Ôn tập softmax + mạng nơ ron
[Bổ trợ] Các thuật toán Training
Vector Semantics và Embeddings
SkipGram, Glove và FastText
Mô hình ngôn ngữ
RNN và LSTM
Bài toán dịch máy
Mô hình Transfomer (4 buổi)
Mô hình Bert và ứng dụng
Thực hành Bert và ứng dụng với bài toán NER và POS Tag
GPT + Đào tạo phân tán
Bài toán truy xuất thông tin - Information Retrieval
Vector Database and RAG
Transformer Nâng cao

Mô hình Transfomer (4 buổi)

  • Transformer Encoder

    • Positional encoding

    • Cơ chế Attention

    • Multiheaded Attention

  • Transformer Decoder

  • Lập trình mô hình Transformer từ đầu

1. Transformer Encoder

1.1. Transformer-Encoder.pdf

1.2. Code Thực hành

Click to view more

1.3. Transformer Encoder

1.4. Video trên lớp

1.5. Tài liệu đọc thêm

1.6. Batch Norm + Dropout

2. Transformer Decoder

2.1. Transformer-Decoder.pdf

2.2. Transformer Decoder

2.3. [NLP 01] Zoom - Video trên lớp

Video Transformer Decoder trên lớp và cách sử dụng HuggingFace.

2.4. Code thực hành

Thực hành Decoder

https://github.com/bangoc123/transformer/blob/master/transformer/layers/decoder.py

- Hướng dẫn thực hành lập trình HuggingFace.

- Hướng dẫn Build Dataset

Xây dựng GPT-2 trên tiếng Việt:

https://colab.research.google.com/drive/1HL2xPfzAhmANZLPDeTeL1jpQVUOGucPv?usp=sharing

3. Thực hành HuggingFace

3.1. Cách load dữ liệu

Các cách load dữ liệu văn bản với HuggingFace

  • Load từ HuggingFace Hub

  • Load từ CSV

  • Load từ Txt file

  • Load từ SQL Database

  • Load dữ liệu từ Arrow File

Chi tiết notebook được đăng tải tại đây: https://colab.research.google.com/drive/1-SnvvwPjyjQlJ0Ua-Qx3QXluIXDZJ52r?usp=sharing

3.2. Cách xử lý dữ liệu

Click to view more

4. Video NLP 04

4.1. [Zoom NLP 04] 8-1-2024 Buổi 1 - Cơ chế Attention

4.2. [Zoom NLP 04] 13-1-2024 Buổi 2 - Multi-headed Attention

4.3. [Zoom NLP 04] 16-1-2024 - Thực hành lập trình Encoder phần 1

4.4. [Zoom NLP 04] 16-1-2024 - Thực hành lập trình Encoder phần 2

5. Video NLP 06

5.1. [Zoom NLP 06] 25-06-2025 Buổi 1 - Cơ chế Attention + Multiheaded Attention

5.2. [Zoom NLP 06] 30-06-2025 Buổi 2 - Lập trình cơ chế Attention + Positional Embedding

5.3. [Zoom NLP 06] Transformer Decoder + GPT

1. Transformer Encoder
1.1. Transformer-Encoder.pdf
1.2. Code Thực hành
1.3. Transformer Encoder
1.4. Video trên lớp
1.5. Tài liệu đọc thêm
1.6. Batch Norm + Dropout
2. Transformer Decoder
2.1. Transformer-Decoder.pdf
2.2. Transformer Decoder
2.3. [NLP 01] Zoom - Video trên lớp
2.4. Code thực hành
3. Thực hành HuggingFace
3.1. Cách load dữ liệu
3.2. Cách xử lý dữ liệu
4. Video NLP 04
4.1. [Zoom NLP 04] 8-1-2024 Buổi 1 - Cơ chế Attention
4.2. [Zoom NLP 04] 13-1-2024 Buổi 2 - Multi-headed Attention
4.3. [Zoom NLP 04] 16-1-2024 - Thực hành lập trình Encoder phần 1
4.4. [Zoom NLP 04] 16-1-2024 - Thực hành lập trình Encoder phần 2
5. Video NLP 06
5.1. [Zoom NLP 06] 25-06-2025 Buổi 1 - Cơ chế Attention + Multiheaded Attention
5.2. [Zoom NLP 06] 30-06-2025 Buổi 2 - Lập trình cơ chế Attention + Positional Embedding
5.3. [Zoom NLP 06] Transformer Decoder + GPT