List of topics
Biểu thức chính quy - Regular Expressions
[31-1-2024] Chi tiết các thuật toán tách từ
Chuẩn hóa văn bản
Vector Semantics và Embeddings
SkipGram, Glove và FastText
Mô hình ngôn ngữ
RNN và LSTM
Bài toán dịch máy
Mô hình Transfomer
Mô hình Bert và ứng dụng
Thực hành Bert và ứng dụng với bài toán NER và POS Tag
GPT và ứng dụng
Bài toán tìm kiếm và hỏi đáp - Question Answering
Vector Database and RAG
Prompt Engineering
Semantic Cache
Nâng cao - Mô hình Wave2Vec cho bài toán nhận diện giọng nói
Dự án cuối khóa

[31-1-2024] Chi tiết các thuật toán tách từ

  • Thuật toán BPE

  • Thuật toán WordPiece

  • Sử dụng thư viện SentencePiece

  • Sử dụng thư viện Spacy

  • Sử dụng thư viện Underthesea cho Tiếng Việt

1. Giới thiệu Tách token

1.1. Slide

1.3. Lập trình tách Ngrams

Click to view more

3. Video Zoom

3.1. Video

Click to view more

3.2. Video

1. Giới thiệu Tách token
1.1. Slide
1.2. Thực hành tách từ với các thư viện khác nhau
1.3. Lập trình tách Ngrams
2. Thuật toán tách token BPE + WordPiece
2.1. Thực hành dùng WordPiece với HuggingFace
2.2. BPE Demo
3. Video Zoom
3.1. Video
3.2. Video