Avatar

Lớp học chuyên lập trình Chatbot

Share

Lớp học lập trình chuyên Chatbot


Lớp học chuyên ứng dụng công nghệ RAG (Retrieval-Augmented Generation) giúp học viên nắm vững cách kết hợp mô hình ngôn ngữ lớn với truy vấn dữ liệu để tạo ra các câu trả lời chính xác và phù hợp ngữ cảnh hơn trong nhiều lĩnh vực khác nhau.

Ngoài việc cung cấp kiến thức lý thuyết nền tảng, khoá học còn tập trung vào thực hành xây dựng pipeline RAG, xử lý dữ liệu, tinh chỉnh mô hình, và áp dụng các kỹ thuật đánh giá chất lượng đầu ra, nhằm giúp học viên phát triển kỹ năng ứng dụng thực tế trong các dự án về chatbot, tìm kiếm thông minh hoặc phân tích tài liệu chuyên sâu.

Nội dung chi tiết của khoá học

Xem chi tiết tại đây

Tuần

Chủ đề chính

Những gì bạn sẽ làm được sau buổi học

1

Giới thiệu lớp học

Nắm rõ lộ trình học, công cụ sử dụng, và cách học hiệu quả

2

Sử dụng API liên quan tới văn bản

- Thành thạo gọi RESTful API có xác thực- Gọi GPT-3.5 Turbo / GPT-4 / GPT-4o API- Gọi Gemini API từ Google- Gọi API của các mô hình Open Source qua Together AI

3

Lập trình giao diện chatbot nhanh chóng

- Tạo giao diện chatbot trong 15 phút bằng Streamlit- Tùy biến trạng thái hội thoại, xử lý tệp và hiển thị ảnh/video

4

RAG và hệ thống Chatbot hiện đại

- Hiểu rõ kiến trúc RAG cơ bản- Các khái niệm: Embedding, Vector DB, Similarity- Lập trình truy xuất văn bản từ Vector DB

5

Docker + Cloud (Bổ trợ)

- Cài đặt Docker, phân biệt image và container- Tạo Docker Image & chạy Docker Container

6

MongoDB + Crawl dữ liệu (Bổ trợ)

- Crawl dữ liệu từ website- Lưu trữ dữ liệu vào MongoDB

7

Lập trình RAG với nhiều Vector DB

- Viết pipeline RAG đầy đủ trên MongoDB, Qdrant, ChromaDB, Supabase- So sánh hiệu suất và độ chính xác

8

RAG nâng cao: Semantic Router + Reflection + Hyde

- Dùng Semantic Router để giảm nhiễu- Áp dụng Reflection để tự-kiểm chứng- Tăng recall bằng HyDE Search

9

Chunking nâng cao

- Phân tích các kỹ thuật chunking: character, recursive, semantic- Lựa chọn chunking phù hợp để tối ưu retrieval

10

Học LangChain + Xây dựng hệ thống với Ollama

- Dùng LangChain để lắp ráp các bước Retriever → Router → LLM- Chạy mô hình local bằng Ollama để tiết kiệm chi phí

11

Ứng dụng LangGraph + LangGraph Studio

- Xây dựng flow nhiều nhánh- Theo dõi và debug real-time bằng LangGraph Studio

12

RAG có ReRank

- Thêm bước ReRank vào pipeline RAG- So sánh hiệu quả giữa RAG thường và RAG+ReRank- Hiểu các mô hình reranker như Cohere, BGE, Cross-Encoder

13

RAG Keyword Search + ReRank

- Dùng Elasticsearch hoặc BM25 thay vector DB- Áp dụng rerank để tăng độ chính xác- Phù hợp cho hệ thống chưa có embedding

14

Graph RAG

- Tạo Knowledge Graph từ dữ liệu phi cấu trúc- Truy vấn bằng Cypher trên Neo4j- Tạo Graph Embeddings bằng GCN

15

Hybrid RAG

- Kết hợp RAG cơ bản và RAG đồ thị- Thiết kế hệ thống hybrid phù hợp tình huống

16

Agentic RAG

- Hiểu vòng đời LLM Agent- Áp dụng paper ReAct, Prompt Engineering nâng cao- Xây dựng pipeline Agentic RAG

17

Multimodal RAG

- Truy vấn & xử lý thông tin đa phương thức (ảnh + văn bản)- Dùng Gemini hoặc GPT-4o cho các tác vụ đa phương thức

18

Đánh giá chất lượng hệ thống RAG

- Hiểu sâu các chỉ số đánh giá RAG: LLM-judged & Rule-based- Sử dụng Ragas và các công cụ từ Google Cloud để đánh giá

19

Thực hành đào tạo mô hình riêng

- Fine-tune GPT hoặc LLAMA theo dữ liệu riêng- Triển khai mô hình đã đào tạo

20

Dự án cuối khóa

- Xây dựng ứng dụng chatbot hoàn chỉnh có RAG- Trình bày kết quả & kiến trúc hệ thống


Sản phẩm cuối khoá

  • 1 bản demo Chatbot RAG: giao diện Streamlit, backend LangChain, tùy chọn Vector DB.

  • 1 báo cáo kỹ thuật (Markdown/Notion): kiến trúc, quyết định thiết kế, benchmark.

  • 1 video pitching 3 phút: trình bày giải pháp trước giảng viên & cố vấn kỹ thuật.

Phương pháp giảng dạy

  • Video: Học viên xem video và hoàn thành các câu hỏi liên quan tới bài giảng

  • Project-based: mỗi chủ đề gắn liền một mini-project, cộng dồn thành dự án lớn cuối khoá.

  • Phản hồi 1-1: Chat với giảng viên trực tiếp qua Discord về các nội dung của lớp học

Đối tượng phù hợp

Kinh nghiệm

Yêu cầu tối thiểu

Bạn sẽ đạt được

Backend / Full-stack dev biết Python hoặc JS

- Đã gọi thử OpenAI API - Biết Docker cơ bản

— Kỹ năng dựng Chatbot RAG production-ready — Hiểu, chỉnh, và benchmark nhiều Vector DB

Data / ML engineer

- Đã dùng Pandas, SQL - Biết khái niệm embedding

— Chuyển pipeline NLP cũ sang RAG — Tích hợp knowledge-graph & reasoning

AI product / tech-lead

- Hiểu kiến trúc micro-service

— Đưa RAG vào roadmap, ước lượng chi phí, tối ưu latency

Thông tin tổ chức

  • Hình thức: Qua xem video + Chat trực tiếp với giảng viên

  • Giảng viên chính: Bá Ngọc - Founder @ ProtonX. Người Việt đầu tiên được Google công nhận là chuyên gia học máy.


Cam kết đầu ra

  1. Ứng dụng ngay: Bạn có thể phát triển ứng dụng RAG trực tiếp trên cơ sở dữ liệu của bạn

  2. Chi phí rõ ràng: hướng dẫn chọn model / vector DB tối ưu USD/token và lưu trữ.

  3. Cập nhật xu hướng: khóa học liên tục update slide & mã với model/middleware mới (OpenAI Agent SDK, Gemini 2.5 Flash, Llama-4, vv)


Học viên đã triển khai RAG trong công ty