List of topics
Biểu thức chính quy - Regular Expressions
Chi tiết các thuật toán tách từ
Chuẩn hóa văn bản
[Bổ trợ học máy] Mô hình hồi quy tuyến tính
[Bổ trợ học máy] Các thuật toán Training
Vector Semantics và Embeddings
SkipGram, Glove và FastText
Mô hình ngôn ngữ
RNN và LSTM
Bài toán dịch máy
Mô hình Transfomer
Mô hình Bert và ứng dụng
Thực hành Bert và ứng dụng với bài toán NER và POS Tag
GPT + Đào tạo phân tán
Bài toán truy xuất thông tin - Information Retrieval
Vector Database and RAG
Transformer nâng cao
Prompt Engineering
Dự án cuối khóa
Chi tiết các thuật toán tách từ
Thuật toán BPE
Thuật toán WordPiece
Sử dụng thư viện SentencePiece
Sử dụng thư viện Spacy
Sử dụng thư viện Underthesea cho Tiếng Việt
1. Giới thiệu Tách token
1.1. Slide
1.2. Thực hành tách từ với các thư viện khác nhau
Python thuần: https://colab.research.google.com/drive/1l3_wOM7cA5KLnJcv3jcgcb1g03SVAN05?usp=sharing
Thư viện Pytorch: https://drive.google.com/file/d/1jwJQ0iYBMHAce0FQBApEwu75il5Ugi2A/view?usp=sharing
Thư viện Tensorflow: https://drive.google.com/file/d/1MTBQwgqd1jBwK_yNGNNIQ4lkKrkaG36z/view?usp=sharing
1.3. Lập trình tách Ngrams
Click to view more
2. Thuật toán tách token BPE + WordPiece
2.1. Thực hành dùng WordPiece với HuggingFace
2.2. BPE Demo
3. Video Zoom NLP 01
3.1. Video
4. Video Zoom NLP 02
4.1. Video Zoom 02
1. Giới thiệu Tách token
1.1. Slide
1.2. Thực hành tách từ với các thư viện khác nhau
1.3. Lập trình tách Ngrams
2. Thuật toán tách token BPE + WordPiece
2.1. Thực hành dùng WordPiece với HuggingFace
2.2. BPE Demo
3. Video Zoom NLP 01
3.1. Video
4. Video Zoom NLP 02
4.1. Video Zoom 02