List of topics
Ôn tập Học máy
Khai giảng
Mô hình hồi quy tuyến tính
Ôn tập mô hình
Giới thiệu xác suất - Đếm
Xác suất + Định lý Bayes
Xác suất và ứng dụng AI
Biến ngẫu nhiên + Phân phối rời rạc
Phân phối liên tục
Phân phối chuẩn
Kỹ thuật lấy mẫu con (Subsampling) (Nguyên tắc 1)
Tensorflow + HuggingFace
MongoDB + Training bằng Pytorch
Các kỹ thuật training hiệu quả 1 (Nguyên tắc 2)
Cloud Storage + Hoàn thiện pipeline training
Giảm chiều dữ liệu
PCA - Principal Component Analysis
MLOPs - các khái niệm liên quan
CPUs
CPUs trên Google Cloud + AWS + Digital Ocean
RAM và cơ chế cache của CPUs
GPUs
TPUs - Số thực dấu phẩy động
Học máy chính xác thấp
ONNX và một số phương pháp tối ưu khác
Deploy AI Model bằng Docker
Docker + Cloud
Chắt lọc tri thức + TensorRT
Triton Inference Server
Đào tạo phân tán
Cùng nhau làm Project
Demo quy trình làm MLOPs
Xây dựng Crawler Web và xây dựng Text Dataset

Học máy chính xác thấp

  • Lượng tử hóa mô hình
  • ONNX

1. Slide

1.1. Quantization - v2.pdf

1.2. ONNX.pdf

1.3. Các bài báo quan trọng

Click to view more

1.4. Ánh xạ lượng tử (Quantization Mapping) và chứng minh công thức

Click to view more

1.5. Chi tiết hóa công thức lượng tử trên ma trận

Click to view more

2. Quizz

2.1. [MLEs] Lượng tử theo cấu trúc dữ liệu nào cho tốc độ model nhanh nhất?

Click to view more

2.2. [MLEs] Lượng tử nào chạy trên GPU?

Click to view more

3. Video

3.1. Lý thuyết lượng tử hóa

Click to view more

3.2. Thực hành lượng tử hóa

Click to view more
1. Slide
1.1. Quantization - v2.pdf
1.2. ONNX.pdf
1.3. Các bài báo quan trọng
1.4. Ánh xạ lượng tử (Quantization Mapping) và chứng minh công thức
1.5. Chi tiết hóa công thức lượng tử trên ma trận
2. Quizz
2.1. [MLEs] Lượng tử theo cấu trúc dữ liệu nào cho tốc độ model nhanh nhất?
2.2. [MLEs] Lượng tử nào chạy trên GPU?
3. Video
3.1. Lý thuyết lượng tử hóa
3.2. Thực hành lượng tử hóa