List of topics
Khai giảng lớp học NLP 04
Biểu thức chính quy - Regular Expressions
Chi tiết các thuật toán tách token
Chuẩn hóa văn bản
[Zoom 4-12-2024] Ôn tập đại số tuyến tính
[Zoom 9-12-2024 và 11-12-204] Ôn tập học máy, học sâu và các khái niệm liên quan
[Zoom 16-12-2024] Ôn tập quá trình training
[Bổ trợ] Các thuật toán Training
[Zoom 18-12-2024] Vector Semantics và Embeddings
[Zoom 23-12-2024] SkipGram, Glove và FastText
[Zoom 25-12-2024] Mô hình ngôn ngữ
[Zoom 30-12-2024] RNN và LSTM
[Zoom 06-01-2025] Bài toán dịch máy
[Zoom [8-13-16-20]-1-2025] Mô hình Transfomer (3 buổi)
[Zoom 05-02-2025] Mô hình Bert và ứng dụng
[Zoom 05-02-2025] Thực hành Bert và ứng dụng với bài toán NER và POS Tag
[Zoom 10-2-2025] GPT + Đào tạo phân tán
[Zoom 12-02-2025] Bài toán truy xuất thông tin - Information Retrieval
[Zoom 17-2-2025] Vector Database and RAG
[Zoom 19-2-2025] Transformer nâng cao
Dự án cuối khóa - 2 tuần
Workshop cuối khóa
Chi tiết các thuật toán tách token
Thuật toán BPE
Thuật toán WordPiece
Sử dụng thư viện SentencePiece
Sử dụng thư viện Spacy
Sử dụng thư viện Underthesea cho Tiếng Việt
1. Giới thiệu Tách token
1.1. Slide
1.2. Thực hành tách từ với các thư viện khác nhau
Python thuần: https://colab.research.google.com/drive/1l3_wOM7cA5KLnJcv3jcgcb1g03SVAN05?usp=sharing
Thư viện Pytorch: https://drive.google.com/file/d/1jwJQ0iYBMHAce0FQBApEwu75il5Ugi2A/view?usp=sharing
Thư viện Tensorflow: https://drive.google.com/file/d/1MTBQwgqd1jBwK_yNGNNIQ4lkKrkaG36z/view?usp=sharing
Thư viện tiktoken: https://github.com/openai/tiktoken
High Speed with HuggingFace Dataset:
https://colab.research.google.com/drive/1HNLSiDVbgzPzk0Wu1xiPZvgvxcgs_ax8?usp=sharing
1.3. Lập trình tách Ngrams
Click to view more
1.4. [Thú vị] Tool hiển thị các thuật toán tách tokens
2. Thuật toán tách token BPE + WordPiece
2.1. Thực hành dùng WordPiece với HuggingFace
2.2. BPE Demo
3. Video Zoom NLP 01
3.1. Video Zoom 01
3.2. Video Zoom 02
3.3. Zoom NLP 03 - 24-09-2024
3.4. Zoom NLP 04 - 27-11-2024 [phần 1]
3.5. Zoom NLP 04 - 27-11-2024 [phần 2]
1. Giới thiệu Tách token
1.1. Slide
1.2. Thực hành tách từ với các thư viện khác nhau
1.3. Lập trình tách Ngrams
1.4. [Thú vị] Tool hiển thị các thuật toán tách tokens
2. Thuật toán tách token BPE + WordPiece
2.1. Thực hành dùng WordPiece với HuggingFace
2.2. BPE Demo
3. Video Zoom NLP 01
3.1. Video Zoom 01
3.2. Video Zoom 02
3.3. Zoom NLP 03 - 24-09-2024
3.4. Zoom NLP 04 - 27-11-2024 [phần 1]
3.5. Zoom NLP 04 - 27-11-2024 [phần 2]