
Lớp học chuyên lập trình Chatbot
Lớp học lập trình chuyên Chatbot
Lớp học chuyên ứng dụng công nghệ RAG (Retrieval-Augmented Generation) giúp học viên nắm vững cách kết hợp mô hình ngôn ngữ lớn với truy vấn dữ liệu để tạo ra các câu trả lời chính xác và phù hợp ngữ cảnh hơn trong nhiều lĩnh vực khác nhau.
Ngoài việc cung cấp kiến thức lý thuyết nền tảng, khoá học còn tập trung vào thực hành xây dựng pipeline RAG, xử lý dữ liệu, tinh chỉnh mô hình, và áp dụng các kỹ thuật đánh giá chất lượng đầu ra, nhằm giúp học viên phát triển kỹ năng ứng dụng thực tế trong các dự án về chatbot, tìm kiếm thông minh hoặc phân tích tài liệu chuyên sâu.
Nội dung chi tiết của khoá học
Xem chi tiết tại đây
Tuần | Chủ đề chính | Những gì bạn sẽ làm được sau buổi học |
---|---|---|
1 | Giới thiệu lớp học | Nắm rõ lộ trình học, công cụ sử dụng, và cách học hiệu quả |
2 | Sử dụng API liên quan tới văn bản | - Thành thạo gọi RESTful API có xác thực- Gọi GPT-3.5 Turbo / GPT-4 / GPT-4o API- Gọi Gemini API từ Google- Gọi API của các mô hình Open Source qua Together AI |
3 | Lập trình giao diện chatbot nhanh chóng | - Tạo giao diện chatbot trong 15 phút bằng Streamlit- Tùy biến trạng thái hội thoại, xử lý tệp và hiển thị ảnh/video |
4 | RAG và hệ thống Chatbot hiện đại | - Hiểu rõ kiến trúc RAG cơ bản- Các khái niệm: Embedding, Vector DB, Similarity- Lập trình truy xuất văn bản từ Vector DB |
5 | Docker + Cloud (Bổ trợ) | - Cài đặt Docker, phân biệt image và container- Tạo Docker Image & chạy Docker Container |
6 | MongoDB + Crawl dữ liệu (Bổ trợ) | - Crawl dữ liệu từ website- Lưu trữ dữ liệu vào MongoDB |
7 | Lập trình RAG với nhiều Vector DB | - Viết pipeline RAG đầy đủ trên MongoDB, Qdrant, ChromaDB, Supabase- So sánh hiệu suất và độ chính xác |
8 | RAG nâng cao: Semantic Router + Reflection + Hyde | - Dùng Semantic Router để giảm nhiễu- Áp dụng Reflection để tự-kiểm chứng- Tăng recall bằng HyDE Search |
9 | Chunking nâng cao | - Phân tích các kỹ thuật chunking: character, recursive, semantic- Lựa chọn chunking phù hợp để tối ưu retrieval |
10 | Học LangChain + Xây dựng hệ thống với Ollama | - Dùng LangChain để lắp ráp các bước Retriever → Router → LLM- Chạy mô hình local bằng Ollama để tiết kiệm chi phí |
11 | Ứng dụng LangGraph + LangGraph Studio | - Xây dựng flow nhiều nhánh- Theo dõi và debug real-time bằng LangGraph Studio |
12 | RAG có ReRank | - Thêm bước ReRank vào pipeline RAG- So sánh hiệu quả giữa RAG thường và RAG+ReRank- Hiểu các mô hình reranker như Cohere, BGE, Cross-Encoder |
13 | RAG Keyword Search + ReRank | - Dùng Elasticsearch hoặc BM25 thay vector DB- Áp dụng rerank để tăng độ chính xác- Phù hợp cho hệ thống chưa có embedding |
14 | Graph RAG | - Tạo Knowledge Graph từ dữ liệu phi cấu trúc- Truy vấn bằng Cypher trên Neo4j- Tạo Graph Embeddings bằng GCN |
15 | Hybrid RAG | - Kết hợp RAG cơ bản và RAG đồ thị- Thiết kế hệ thống hybrid phù hợp tình huống |
16 | Agentic RAG | - Hiểu vòng đời LLM Agent- Áp dụng paper ReAct, Prompt Engineering nâng cao- Xây dựng pipeline Agentic RAG |
17 | Multimodal RAG | - Truy vấn & xử lý thông tin đa phương thức (ảnh + văn bản)- Dùng Gemini hoặc GPT-4o cho các tác vụ đa phương thức |
18 | Đánh giá chất lượng hệ thống RAG | - Hiểu sâu các chỉ số đánh giá RAG: LLM-judged & Rule-based- Sử dụng Ragas và các công cụ từ Google Cloud để đánh giá |
19 | Thực hành đào tạo mô hình riêng | - Fine-tune GPT hoặc LLAMA theo dữ liệu riêng- Triển khai mô hình đã đào tạo |
20 | Dự án cuối khóa | - Xây dựng ứng dụng chatbot hoàn chỉnh có RAG- Trình bày kết quả & kiến trúc hệ thống |
Sản phẩm cuối khoá
1 bản demo Chatbot RAG: giao diện Streamlit, backend LangChain, tùy chọn Vector DB.
1 báo cáo kỹ thuật (Markdown/Notion): kiến trúc, quyết định thiết kế, benchmark.
1 video pitching 3 phút: trình bày giải pháp trước giảng viên & cố vấn kỹ thuật.
Phương pháp giảng dạy
Video: Học viên xem video và hoàn thành các câu hỏi liên quan tới bài giảng
Project-based: mỗi chủ đề gắn liền một mini-project, cộng dồn thành dự án lớn cuối khoá.
Phản hồi 1-1: Chat với giảng viên trực tiếp qua Discord về các nội dung của lớp học
Đối tượng phù hợp
Kinh nghiệm | Yêu cầu tối thiểu | Bạn sẽ đạt được |
---|---|---|
Backend / Full-stack dev biết Python hoặc JS | - Đã gọi thử OpenAI API - Biết Docker cơ bản | — Kỹ năng dựng Chatbot RAG production-ready — Hiểu, chỉnh, và benchmark nhiều Vector DB |
Data / ML engineer | - Đã dùng Pandas, SQL - Biết khái niệm embedding | — Chuyển pipeline NLP cũ sang RAG — Tích hợp knowledge-graph & reasoning |
AI product / tech-lead | - Hiểu kiến trúc micro-service | — Đưa RAG vào roadmap, ước lượng chi phí, tối ưu latency |
Thông tin tổ chức
Hình thức: Qua xem video + Chat trực tiếp với giảng viên
Giảng viên chính: Bá Ngọc - Founder @ ProtonX. Người Việt đầu tiên được Google công nhận là chuyên gia học máy.
Cam kết đầu ra
Ứng dụng ngay: Bạn có thể phát triển ứng dụng RAG trực tiếp trên cơ sở dữ liệu của bạn
Chi phí rõ ràng: hướng dẫn chọn model / vector DB tối ưu USD/token và lưu trữ.
Cập nhật xu hướng: khóa học liên tục update slide & mã với model/middleware mới (OpenAI Agent SDK, Gemini 2.5 Flash, Llama-4, vv)