List of topics
Tổng quan xây dựng mô hình ngôn ngữ lớn + Xây dựng LLMs đầu tiên
Ôn tập Tokenizer + Thực hành HuggingFace
Ôn tập học máy + học sâu và chi tiết mô hình ngôn ngữ
Ôn tập Transformer
[Xem thêm] Mô hình Bert
Demo Day Pretrained + Finetune LLMs
Họ model GPT - Fintune LLMs cho đa nhiệm bài toán
Chuẩn bị dữ liệu pre-trained cho mô hình ngôn ngữ
Chuẩn bị dữ liệu pre-trained cho mô hình ngôn ngữ
Kỹ thuật training ưu tiên - RLHF
Kỹ thuật training ưu tiên - DPO
Đánh giá chất lượng mô hình + Các kỹ thuật finetune tham số tối ưu - PEFT + Chữa bài tập
Họ model LLAMA
Họ mô hình Qwen
Họ Model GPT OSS
Họ model Kimi
Họ mô hình DeepSeek
Multimodal
Ứng dụng mô hình ngôn ngữ trong mô hìn Vision Language Model
Kỹ thuật training ưu tiên - RLHF
Kỹ thuật RLHF
Kỹ thuật DPO
1. Các kỹ thuật training
1.1. Slide Instruction Finetune + DPO + RLHF
1.2. Thực hành
[Thực hành trên lớp] Sinh kết quả ưu tiên Tiếng Việt
https://colab.research.google.com/drive/1hOqehF7cDLDXN-6jwU8Mj2b3ML07j-u4#scrollTo=h-JyC3r8WZWq
[Thực hành trên lớp] DPO trên Tiếng Việt:
https://colab.research.google.com/drive/1G8jKgme1Flp9v0Vex6iH-xUhAn_vlU86?usp=sharing
[Đọc thêm]
RLHF:
https://github.com/HumanSignal/RLHF/blob/master/tutorials/RLHF_with_Custom_Datasets.ipynb
2. Video
2.1. [LLMs-01] Zoom 21-2-2025 - RLHF - Phần 1
2.2. [LLMs-01] Zoom 21-2-2025 - RLHF - Phần 2
1. Các kỹ thuật training
1.1. Slide Instruction Finetune + DPO + RLHF
1.2. Thực hành
2. Video
2.1. [LLMs-01] Zoom 21-2-2025 - RLHF - Phần 1
2.2. [LLMs-01] Zoom 21-2-2025 - RLHF - Phần 2