
Xử lý ngôn ngữ tự nhiên nâng cao - Mô hình ngôn ngữ lớn 02
Lớp học mang đến một hành trình từ căn bản đến chuyên sâu trong việc xây dựng và ứng dụng các mô hình ngôn ngữ lớn (LLMs). Bắt đầu với nền tảng học máy và học sâu, khóa học sẽ giúp bạn khám phá các thư viện và công cụ tiên tiến như Pytorch và HuggingFace. Bạn sẽ hiểu rõ hơn về mô hình hóa dữ liệu chuỗi, từ phân loại văn bản, đánh nhãn token đến nhận diện thực thể có tên. Học viên sẽ được đào tạo về kỹ thuật Transformer, từ cơ chế Attention cho đến kiến trúc của Encoder và Decoder. Ngoài ra, khóa học còn cung cấp kiến thức về việc tinh chỉnh đa nhiệm cho các bài toán từ hỏi đáp, sinh mã, tóm tắt cho đến dịch máy. Bạn sẽ được tìm hiểu về kỹ thuật debug, tối ưu hóa, và các phương pháp hiện đại trong quá trình đào tạo và triển khai mô hình trên nhiều GPUs. Kết thúc lớp học, học viên sẽ được định hướng về xu hướng phát triển của LLMs và cách các mô hình này trở thành nền tảng trong việc giải quyết các bài toán phức tạp đa ngôn ngữ và reasoning.

Danh sách các chủ đề trong lớp học:
Tổng quan xây dựng mô hình ngôn ngữ lớn
Ôn tập học máy + học sâu
Các thư viện đào tạo mô hình AI
Mô hình hóa đào tạo chuỗi (Sequence Modeling)
Ôn tập Transformer
Finetune LLMs cho đa nhiệm bài toán - LLMs Multitasks FineTuning
Debug mô hình ngôn ngữ
Chuẩn bị dữ liệu cho mô hình ngôn ngữ
Họ model GPT
Các kỹ thuật training hiện đại: DPO/RLHF
Họ model LLAMA
Họ model Qwen
Họ model GPT-OSS
Họ model Deep Seek
Ứng dụng mô hình ngôn ngữ trong các model Vision Language Model
Multimodal và các model nổi tiếng
Agents và các bài toán liên quan
Hình thức học:
Qua Zoom chiều thứ bảy mỗi tuần
Câu chuyện truyền cảm hứng về xây dựng sản phẩm NLP:
Từ tháng 7/2025 Team ProtonX phát triển thư viện ProtonX với mong muốn đem lại những mô hình AI cũng như các kỹ thuật xây dựng Chatbot tốt nhất trên Tiếng Việt.
Mô hình biểu diễn văn bản |
|---|
|
Mô hình sửa Tiếng Việt |
|
Hệ thống đánh giá Chatbot |
|
Thông tin giảng viên. Xem chi tiết


