List of topics
Tổng quan xây dựng mô hình ngôn ngữ lớn + Xây dựng LLMs đầu tiên
Ôn tập Tokenizer + Thực hành HuggingFace
Ôn tập học máy + học sâu và chi tiết mô hình ngôn ngữ
Ôn tập Transformer
[Xem thêm] Mô hình Bert
Demo Day Pretrained + Finetune LLMs
Họ model GPT - Fintune LLMs cho đa nhiệm bài toán
Chuẩn bị dữ liệu pre-trained cho mô hình ngôn ngữ
Kỹ thuật training ưu tiên - RLHF
Kỹ thuật training ưu tiên - DPO
Đánh giá chất lượng mô hình + Các kỹ thuật finetune tham số tối ưu - PEFT + Chữa bài tập
Chữa bài tập + Chuyên lượng tử hóa mô hình + Định dạng cho mô hình ngôn ngữ
Họ model LLAMA
Mô hình hóa đào tạo chuỗi tới chuỗi (Text - to - text models)
Họ mô hình DeepSeek
Multimodal
Dự án cuối khóa - 3 buổi
Agents và các bài toán liên quan
Các kỹ thuật Deployment mô hình ngôn ngữ
Họ mô hình DeepSeek
Giải thích chi tiết tất cả các phiên bản của DeepSeek
Mixture of Experts của DeepSeek
Multi-Head Latent Attention
1. Nội dung
1.1. Slide Deep Seek
Deep Seek và tất cả các kỹ thuật quan trọng
1.2. Đọc thêm
Đọc thêm các công thức của DeepSeek: https://aman.ai/primers/ai/deepseek-R1/
1.3. Thực hành
DeepSeekMoE mixture of experts
https://colab.research.google.com/drive/1-W_ejzGClmx4GcJ2sKihgBExaSFgrsgg?usp=drive_link
Multi-Head Latent Attention
https://colab.research.google.com/drive/1nFpCNsErIDeqBH4WbFFICqWKDnk3n3co?usp=sharing
Group Relative Policy Optimization (GRPO)
https://colab.research.google.com/drive/13rioDDL-F2dd6POGcsu3tpyjTSgIyq0K?usp=drive_link
2. Video
2.1. [LLMs 01] Zoom 11-04-2025
2.2. [LLMs 01] Zoom 18-04-2025
1. Nội dung
1.1. Slide Deep Seek
1.2. Đọc thêm
1.3. Thực hành
2. Video
2.1. [LLMs 01] Zoom 11-04-2025
2.2. [LLMs 01] Zoom 18-04-2025