List of topics
Giới thiệu học máy/học sâu
Mô hình hồi quy tuyến tính
Khai giảng
MLOps
Pytorch + Tensorflow + HuggingFace
MongoDB + Crawl dữ liệu
CPUs
GPUs
TPUs - Số thực dấu phẩy động
Học máy chính xác thấp
Chắt lọc tri thức + TensorRT
Docker + Cloud
Triton Inference Server - Phần 1
Triton Inference Server - Phần 2
Machine Learning CI/CD
Project - Thực hành chắt lọc tri thức
Đào tạo phân tán
Deploy mô hình trên Jetson Nano
Dự án cuối khóa
Học máy chính xác thấp
Lượng tử hóa mô hình
ONNX
1. Slide
1.1. Quantization - v2.pdf
1.2. ONNX.pdf
1.3. Các bài báo quan trọng
Click to view more
1.4. Ánh xạ lượng tử (Quantization Mapping) và chứng minh công thức
Click to view more
1.5. Chi tiết hóa công thức lượng tử trên ma trận
Click to view more
1.6. Chi tiết code các loại quantization với Pytorch
Click to view more
1.7. Lượng tử hóa với Tensorflow Lite
Click to view more
2. Code
2.1. Export ONNX
2.2. Quantization Demo
2.3. ONNX Quantization
2.4. Hugging Face Export ONNX
3. Quizz
3.1. [MLEs] Lượng tử theo cấu trúc dữ liệu nào cho tốc độ model nhanh nhất?
Click to view more
3.2. [MLEs] Lượng tử nào chạy trên GPU?
Click to view more
4. Video
4.1. Video
Click to view more
1. Slide
1.1. Quantization - v2.pdf
1.2. ONNX.pdf
1.3. Các bài báo quan trọng
1.4. Ánh xạ lượng tử (Quantization Mapping) và chứng minh công thức
1.5. Chi tiết hóa công thức lượng tử trên ma trận
1.6. Chi tiết code các loại quantization với Pytorch
1.7. Lượng tử hóa với Tensorflow Lite
2. Code
2.1. Export ONNX
2.2. Quantization Demo
2.3. ONNX Quantization
2.4. Hugging Face Export ONNX
3. Quizz
3.1. [MLEs] Lượng tử theo cấu trúc dữ liệu nào cho tốc độ model nhanh nhất?
3.2. [MLEs] Lượng tử nào chạy trên GPU?
4. Video
4.1. Video