#Topic
1

Ôn tập Học máy

  • Hướng dẫn làm quen với hệ thống.
  • Học máy là gì.
2

Khai giảng

  • Giới thiệu về lớp học
3

Mô hình hồi quy tuyến tính

  • Giới thiệu bài toán Grab
  • Quá trình xây dựng một mô hình
  • Mô hình hồi quy tuyến tính
  • Thuật toán Gradient Descent
  • Lập trình hồi quy tuyến tính một biến
4

Ôn tập mô hình

No content
5

Giới thiệu xác suất - Đếm

  • Đếm
  • Quy tắc cộng
  • Quy tắc nhân
  • Nguyên lý bù trừ
  • Chỉnh hợp
  • Tổ hợp
  • Hoán vị
6

Xác suất + Định lý Bayes

No content
7

Xác suất và ứng dụng AI

No content
8

Biến ngẫu nhiên + Phân phối rời rạc

No content
9

Phân phối liên tục

  • Hàm mật độ xác suất
  • Ôn tập tích phân, một số tích phân đơn giản
  • Ứng dụng tích phân giải bài biến ngẫu nhiên liên tục
  • Phân phối đều
10

Phân phối chuẩn

  • Hàm mật độ xác suất
  • Hàm phân phối tích lũy
  • Phân phối chuẩn đơn vị
  • Kỹ thuật tính xác suất
11

Kỹ thuật lấy mẫu con (Subsampling) (Nguyên tắc 1)

  • Concentration inequalities
  • Bất đẳng thức Markov
  • Bất đẳng thức Chebyshev
  • Luật số lớn yếu (Weak Law of Large Numbers)
  • Luật số lớn mạnh (Strong Law of Large Numbers)
  • Định luật giới hạn trung tâm (Central Limit Theorem - CLT)
  • Một số bất đẳng thức khác
  • Áp dụng lấy mẫu để tính toán tối ưu cho chi phí rủi ro thực nghiệm (Empirical Risk Minimization)
12

Tensorflow + HuggingFace

  • Thư viện Tensorflow với bài toán phân loại hình ảnh
  • Thư viện HuggingFace với bài toán phân loại văn bản
13

MongoDB + Training bằng Pytorch

  • Giới thiệu MongoDB
  • Pytorch
14

Các kỹ thuật training hiệu quả 1 (Nguyên tắc 2)

  • Sử dụng các thuật toán training.
  • Cài đặt các tham số khởi tạo
15

Cloud Storage + Hoàn thiện pipeline training

  • Giới thiệu Cloud Storage
  • Thực hành lưu trữ dữ liệu trên Google Cloud Storage
  • Hoàn thiện pipeline
16

Giảm chiều dữ liệu

Thuật toán giảm chiều SVD

17

PCA - Principal Component Analysis

PCA

18

MLOPs - các khái niệm liên quan

  • Định nghĩa MLOps
  • Các thành tố chính
  • Liên hệ tới thực tế
19

CPUs

  • Giới thiệu CPU
    • Tính toán song song trên CPUs
    • Nhiều lệnh song song (ILP)
    • Một lệnh trên nhiều luồng dữ liệu (SIMD)
    • Đa luồng (Multi-thread parallelism)
    • Phân tán (Distributed Compute)
  • Bài tập: Lập trình multi threading.
20

CPUs trên Google Cloud + AWS + Digital Ocean

Cài đặt CPUs trên một số Cloud nổi tiếng

  • Google Cloud
  • AWS
  • Digital Ocean
21

RAM và cơ chế cache của CPUs

  • RAM và cơ chế cache
  • Đánh giá hiệu năng truy cập dữ liệu
22

GPUs

GPUs và TPUs

  • Sự khác biệt giữa CPUs và GPUs (tối ưu cho độ trễ và tối ưu cho băng thông)
  • Chi tiết kiến trúc của GPU
  • Giới thiệu CUDA
  • Lập trình CUDA với C++
  • Song song trên GPUs
  • Thư viện Numba
23

TPUs - Số thực dấu phẩy động

  • Bàn về các phiên bản của TPUs
  • Tham số đo quan trọng đo lường tốc độ phần cứng
  • TPUs
24

Học máy chính xác thấp

  • Lượng tử hóa mô hình
  • ONNX
25

ONNX và một số phương pháp tối ưu khác

ONNX và một số phương pháp tối ưu khác

26

Deploy AI Model bằng Docker

  • Docker là gì?
  • Phân biệt image và container
  • Cài đặt Docker
  • Xây dựng Docker Image và chạy docker Container
  • Docker container
27

Docker + Cloud

Triển khai Docker trên Cloud

  • Google Cloud
  • AWS
28

Chắt lọc tri thức + TensorRT

  • Chắt lọc tri thức
  • TensorRT
29

Triton Inference Server

  • Tại sao cần dùng Intriton Inference Server?

  • Cách Deploy mô hình ONNX

  • Cách Deploy mô hình Pytorch

  • Cách Deploy mô hình Tensorflow

  • Concurrent Model Execution

  • Instance group

  • Dynamic Batching

  • Stateful vs Stateless Model

  • Migrate từ Flask sang Triton Server

30

Đào tạo phân tán

  • Phân tán song song dữ liệu (DDP)
  • Phân tán mô hình (MP)
  • Phân tán các thành phần gây tốn RAM (ZeRO)
31

Cùng nhau làm Project

No content
32

Demo quy trình làm MLOPs

Demo quy trình làm MLOPs

33

Xây dựng Crawler Web và xây dựng Text Dataset

  • Chi tiết về HTML/CSS
  • Xử lý text từ website
  • Build Text Dataset