Lớp học chuyên lập trình Chatbot

Lớp học lập trình chuyên Chatbot

Database

Online Language Model

Document Processing

OCR Type

Vision Language Model Type

Local LLMs

Local LLMs Engine

Embeddings Libraries

Lớp học chuyên ứng dụng công nghệ RAG (Retrieval-Augmented Generation) giúp học viên nắm vững cách kết hợp mô hình ngôn ngữ lớn với truy vấn dữ liệu để tạo ra các câu trả lời chính xác và phù hợp ngữ cảnh hơn trong nhiều lĩnh vực khác nhau.

Ngoài việc cung cấp kiến thức lý thuyết nền tảng, khoá học còn tập trung vào thực hành xây dựng pipeline RAG, xử lý dữ liệu, tinh chỉnh mô hình, và áp dụng các kỹ thuật đánh giá chất lượng đầu ra, nhằm giúp học viên phát triển kỹ năng ứng dụng thực tế trong các dự án về chatbot, tìm kiếm thông minh hoặc phân tích tài liệu chuyên sâu.

Các công nghệ trong lớp học

Tặng miễn phí 3 tháng lớp học N8N cho học viên lớp Chatbot.

Nội dung chi tiết của khoá học

Xem chi tiết tại đây

Tuần	Chủ đề chính	Những gì bạn sẽ làm được sau buổi học
1	Giới thiệu lớp học	Nắm rõ lộ trình học Hiểu rõ công cụ sẽ sử dụng Biết cách học hiệu quả qua từng tuần
2	Sử dụng API liên quan tới văn bản	Thành thạo gọi RESTful API có xác thực Gọi GPT-3.5 Turbo / GPT-4 / GPT-4o API Gọi Gemini API từ Google Gọi API của các mô hình Open Source qua Together AI
3	Lập trình giao diện chatbot nhanh chóng	Tạo giao diện chatbot trong 15 phút bằng Streamlit Tùy biến trạng thái hội thoại, xử lý tệp và hiển thị ảnh/video
4	RAG và hệ thống Chatbot hiện đại	Hiểu rõ kiến trúc RAG cơ bản Các khái niệm: Embedding, Vector DB, Similarity Lập trình truy xuất văn bản từ Vector DB
5	Docker + Cloud (Bổ trợ)	Cài đặt Docker, phân biệt image và container Tạo Docker Image & chạy Docker Container
6	MongoDB + Crawl dữ liệu (Bổ trợ)	Crawl dữ liệu từ website Lưu trữ dữ liệu vào MongoDB
7	Lập trình RAG với nhiều Vector DB	Viết pipeline RAG đầy đủ trên MongoDB, Qdrant, ChromaDB, Supabase So sánh hiệu suất và độ chính xác
8	RAG nâng cao: Semantic Router + Reflection + Hyde	Dùng Semantic Router để giảm nhiễu Áp dụng Reflection để tự-kiểm chứng Tăng recall bằng HyDE Search
9	Chunking nâng cao	Phân tích các kỹ thuật chunking: character, recursive, semantic Lựa chọn chunking phù hợp để tối ưu retrieval
10	Học LangChain + Xây dựng hệ thống với Ollama	Dùng LangChain để lắp ráp các bước Retriever → Router → LLM Chạy mô hình local bằng Ollama để tiết kiệm chi phí
11	Ứng dụng LangGraph + LangGraph Studio	Xây dựng flow nhiều nhánh Theo dõi và debug real-time bằng LangGraph Studio
12	RAG có ReRank	Thêm bước ReRank vào pipeline RAG So sánh hiệu quả giữa RAG thường và RAG+ReRank Hiểu các mô hình reranker như Cohere, BGE, Cross-Encoder
13	RAG Keyword Search + ReRank	Dùng Elasticsearch hoặc BM25 thay vector DB Áp dụng rerank để tăng độ chính xác Phù hợp cho hệ thống chưa có embedding
14	Graph RAG	Tạo Knowledge Graph từ dữ liệu phi cấu trúc Truy vấn bằng Cypher trên Neo4j Tạo Graph Embeddings bằng GCN
15	Hybrid RAG	Kết hợp RAG cơ bản và RAG đồ thị Thiết kế hệ thống hybrid phù hợp tình huống
16	Agentic RAG	Hiểu vòng đời LLM Agent Áp dụng paper ReAct, Prompt Engineering nâng cao Xây dựng pipeline Agentic RAG
17	Multimodal RAG	Truy vấn & xử lý thông tin đa phương thức (ảnh + văn bản) Dùng Gemini hoặc GPT-4o cho các tác vụ đa phương thức
18	Đánh giá chất lượng hệ thống RAG	Hiểu sâu các chỉ số đánh giá RAG: LLM-judged & Rule-based Sử dụng Ragas và các công cụ từ Google Cloud để đánh giá
19	Thực hành đào tạo mô hình riêng	Fine-tune GPT hoặc LLAMA theo dữ liệu riêng Triển khai mô hình đã đào tạo
20	Dự án cuối khóa	Xây dựng ứng dụng chatbot hoàn chỉnh có RAG Trình bày kết quả & kiến trúc hệ thống
21	Tổng quan RAG nâng cao	Ôn tập toàn bộ kiến thức: Vector Search, ReRank, Graph RAG, Agentic RAG So sánh ưu nhược điểm từng phương pháp Chuẩn bị cho bài tập thực hành lớn
22	Thực hành triển khai lên Cloud	Đóng gói ứng dụng bằng Docker Triển khai lên các nền tảng như Render, Railway, hoặc VPS riêng
23	Thực hành đào tạo mô hình riêng	Tự fine-tune mô hình GPT hoặc LLAMA theo dữ liệu của bạn Huấn luyện và đánh giá mô hình Triển khai inference
24	[Nâng cao] Xử lý dữ liệu bảng	Trích xuất và hiểu cấu trúc bảng từ tài liệu PDF/HTML Xử lý bảng bằng LLM hoặc công cụ chuyên dụng như DeepDoc, PaddleOCR, Mistral-7B-OCR Ứng dụng trong hệ thống RAG có dữ liệu dạng bảng

Sản phẩm cuối khoá

1 bản demo Chatbot RAG: giao diện Streamlit, backend LangChain, tùy chọn Vector DB.
1 báo cáo kỹ thuật (Markdown/Notion): kiến trúc, quyết định thiết kế, benchmark.
1 video pitching 3 phút: trình bày giải pháp trước giảng viên & cố vấn kỹ thuật.

Phương pháp giảng dạy

Video: Học viên xem video và hoàn thành các câu hỏi liên quan tới bài giảng
Project-based: mỗi chủ đề gắn liền một mini-project, cộng dồn thành dự án lớn cuối khoá.
Phản hồi 1-1: Chat với giảng viên trực tiếp qua Discord về các nội dung của lớp học

Đối tượng phù hợp

Kinh nghiệm	Yêu cầu tối thiểu	Bạn sẽ đạt được
Người mới biết lập trình	Biết lập trình Python. Lớp học miễn phí.	Biết cách thiết kế server-client side để tạo chatbot chạy trên server và host trên Cloud
Backend / Full-stack dev biết Python hoặc JS	- Đã gọi thử OpenAI API - Biết Docker cơ bản	— Kỹ năng dựng Chatbot RAG production-ready — Hiểu, chỉnh, và benchmark nhiều Vector DB
Data / ML engineer	- Đã dùng Pandas, SQL - Biết khái niệm embedding	— Chuyển pipeline NLP cũ sang RAG — Tích hợp knowledge-graph & reasoning
AI product / tech-lead	- Hiểu kiến trúc micro-service	— Đưa RAG vào roadmap, ước lượng chi phí, tối ưu latency

Thông tin tổ chức

Hình thức: Qua xem video + Chat trực tiếp với giảng viên
Giảng viên chính: Bá Ngọc - Founder @ ProtonX. Người Việt đầu tiên được Google công nhận là chuyên gia học máy.

Cam kết đầu ra

Ứng dụng ngay: Bạn có thể phát triển ứng dụng RAG trực tiếp trên cơ sở dữ liệu của bạn
Chi phí rõ ràng: hướng dẫn chọn model / vector DB tối ưu USD/token và lưu trữ.
Cập nhật xu hướng: khóa học liên tục update slide & mã với model/middleware mới (OpenAI Agent SDK, Gemini 2.5 Flash, Llama-4, vv)