List of topics
[Zoom 24-02-2025] Khai giảng lớp học NLP 05
[Zoom 26-02-2025] Biểu thức chính quy - Regular Expressions
[Zoom 03-03-2025] Chi tiết các thuật toán tách token
[Zoom 05-03-2025] Chuẩn hóa văn bản
[Zoom 10-03-2025] Ôn tập đại số tuyến tính
[Zoom 12-03-2025] Ôn tập học máy, học sâu và các khái niệm liên quan
[Zoom 24-03-2025] Ôn tập quá trình training
[Bổ trợ] Các thuật toán Training
[Zoom 26-03-2025] Vector Semantics và Embeddings
[Zoom 31-03-2025] SkipGram, Glove và FastText
[Zoom 02-04-2025] Mô hình ngôn ngữ
[Zoom 07-04-2025] RNN và LSTM
[Zoom 14-04-2025] Bài toán dịch máy
[Zoom 09-04-2025] Mô hình Transfomer (4 buổi)
[Zoom 28-04-2025] Mô hình Bert và ứng dụng
[Zoom 28-4-2025] Thực hành Bert và ứng dụng với bài toán NER và POS Tag
[Zoom 29-4-2025] Bài toán truy xuất thông tin - Information Retrieval
[Zoom 05-05-2025] Vector Database and RAG
[Zoom 20-05-2025] Transformer Nâng cao
Dự án cuối khóa - 2 tuần
GPT + Đào tạo phân tán
[Zoom 26-03-2025] Vector Semantics và Embeddings
No content
1. Slide
1.1. Slide
1.2. Sự tương đồng của ngữ nghĩa
1.3. Mô phỏng từ/văn bản thành vector thưa (Sparse vector)
Mô phỏng văn bản thông qua số lượng các từ trong từ điển
Bài thơ thứ 1 chứa 2 từ em và 1 từ anh nên vector của bài thơ này sẽ là [2, 1]
Bài thơ thứ 2 chứa 1 từ em và 1 từ anh nên vector của bài thơ này sẽ là [1, 1]
Bài thơ thứ 3 chứa 2 từ em và 0 từ anh nên vector của bài thơ này sẽ là [2, 0]
Mô phỏng một từ dựa vào vector số lượng từ đó xuất hiện bên trong các văn bản.
Từ em xuất hiện bên trong bài thơ 1: 2 lần, bài thớ 2: 1 lần và bài thơ 3: 2 lần nên vector của từ em sẽ là [2, 1, 2]
Tương tự vector của từ anh sẽ là [1, 1, 0]
1.4. Mô phỏng từ/văn bản thành vector dày (Dense Vector)
Sử dụng Word Embeddings để mô phỏng từ. Từ sẽ được mô phỏng dưới dạng vector dày.
2. Code thực hành
2.1. Cbow Training
2.2. Hiển thị Embedding
3. Nâng cao
3.1. Embedding cả ảnh và văn bản
Tài liệu: https://openai.com/research/clip
4. Quiz ôn tập
4.1. What is Word2vec?
Click to view more
4.2. Word2vec Parameter: Window Size
Click to view more
4.3. Word2vec's Applicability to New Words or Corpus
Click to view more
5. Video
5.1. Video NLP 01
5.2. Video NLP 02
Giới thiệu Semantic
Cách đào tạo Embeddings
CBOW và Skip Gram
5.3. [Video NLP 03] Zoom 08-10-2024
5.4. [Video NLP 04] Zoom 18-12-2024
5.5. [Video NLP 05] Zoom 26-03-2025
1. Slide
1.1. Slide
1.2. Sự tương đồng của ngữ nghĩa
1.3. Mô phỏng từ/văn bản thành vector thưa (Sparse vector)
1.4. Mô phỏng từ/văn bản thành vector dày (Dense Vector)
2. Code thực hành
2.1. Cbow Training
2.2. Hiển thị Embedding
3. Nâng cao
3.1. Embedding cả ảnh và văn bản
4. Quiz ôn tập
4.1. What is Word2vec?
4.2. Word2vec Parameter: Window Size
4.3. Word2vec's Applicability to New Words or Corpus
5. Video
5.1. Video NLP 01
5.2. Video NLP 02
5.3. [Video NLP 03] Zoom 08-10-2024
5.4. [Video NLP 04] Zoom 18-12-2024
5.5. [Video NLP 05] Zoom 26-03-2025