#Topic
1

[Zoom 24-02-2025] Khai giảng lớp học NLP 05

No content
2

[Zoom 26-02-2025] Biểu thức chính quy - Regular Expressions

  • Luyện tập thuần thục viết Regular Expressions

    • Các toán tử thông thường

    • Các toán tử nâng cao

  • Thực hiện tiền xử lý trên văn bản tiếng Việt

3

[Zoom 03-03-2025] Chi tiết các thuật toán tách token

  • Thuật toán BPE

  • Thuật toán WordPiece

  • Sử dụng thư viện SentencePiece

  • Sử dụng thư viện Spacy

  • Sử dụng thư viện Underthesea cho Tiếng Việt

4

[Zoom 05-03-2025] Chuẩn hóa văn bản

Các quy trình của chuẩn hóa văn bản

  • Tách văn bản thành nhiều câu (Segmenting sentence)

  • Tách (phân đoạn) từ - Tokenizing (segmenting) words

  • Chuẩn hóa từ

5

[Zoom 10-03-2025] Ôn tập đại số tuyến tính

No content
6

[Zoom 12-03-2025] Ôn tập học máy, học sâu và các khái niệm liên quan

  • Ôn tập học máy,

  • Ôn tập học sâu

  • Khái niệm Overfitting/Underfitting

7

[Zoom 24-03-2025] Ôn tập quá trình training

No content
8

[Bổ trợ] Các thuật toán Training

  • Tối ưu lồi

  • Vấn đề của SGD

  • SGD với quán tính

  • AdaGrad

  • AdaDelta và RMSProp

9

[Zoom 26-03-2025] Vector Semantics và Embeddings

No content
10

[Zoom 31-03-2025] SkipGram, Glove và FastText

  • Chi tiết mô hình SkipGram

  • Negative Sampling

  • Softmax đa tầng

11

[Zoom 02-04-2025] Mô hình ngôn ngữ

No content
12

[Zoom 07-04-2025] RNN và LSTM

No content
13

[Zoom 14-04-2025] Bài toán dịch máy

  • Bài toán dịch máy

  • Mô hình Seq2Seq

  • Vấn đề BottleNeck của Seq2Seq

  • Mô hình Seq2Seq và cơ chế Attention

  • BLEU Score

  • Thuật toán Greedy/Beam Search

14

[Zoom 09-04-2025] Mô hình Transfomer (4 buổi)

  • Transformer Encoder

    • Positional encoding

    • Cơ chế Attention

    • Multiheaded Attention

  • Transformer Decoder

  • Lập trình mô hình Transformer từ đầu

15

[Zoom 28-04-2025] Mô hình Bert và ứng dụng

  • Mô hình Bert và ứng dụng

  • Bert nguyên bản

  • Các phiên bản Bert nâng cấp: Roberta, PhoBert

16

[Zoom 28-4-2025] Thực hành Bert và ứng dụng với bài toán NER và POS Tag

  • Bài toán NER + Pos Tagging

  • Ứng dụng Bert để xử lý hai bài toán này

17

[Zoom 29-4-2025] Bài toán truy xuất thông tin - Information Retrieval

  • Thuật toán tìm kiếm theo từ khóa TF-IDF và BM25

  • Thuật toán tìm kiếm theo Vector

  • Thư viện FAISS để tìm kiếm vector nhanh chóng

    • Các thuật toán quan trọng của FAISS

18

[Zoom 05-05-2025] Vector Database and RAG

Vector Database and RAG

  • Điểm qua Vector Database

  • Chi tiết về RAG

  • Thiết kế một RAG Pipeline

19

[Zoom 20-05-2025] Transformer Nâng cao

Transformer Nâng cao

20

Dự án cuối khóa - 2 tuần

No content
21

GPT + Đào tạo phân tán

  • Đọc các nghiên cứu của GPT-1, GPT-2, GPT-3 và GPT 3.5

  • Đào tạo mô hình phân tán song song dữ liệu và song song mô hình