Avatar

Lớp học chuyên lập trình Chatbot

Share

Lớp học lập trình chuyên Chatbot


Database

Online Language Model

Document Processing

OCR Type

Vision Language Model Type

Local LLMs

Local LLMs Engine

Embeddings Libraries

Lớp học chuyên ứng dụng công nghệ RAG (Retrieval-Augmented Generation) giúp học viên nắm vững cách kết hợp mô hình ngôn ngữ lớn với truy vấn dữ liệu để tạo ra các câu trả lời chính xác và phù hợp ngữ cảnh hơn trong nhiều lĩnh vực khác nhau.

Ngoài việc cung cấp kiến thức lý thuyết nền tảng, khoá học còn tập trung vào thực hành xây dựng pipeline RAG, xử lý dữ liệu, tinh chỉnh mô hình, và áp dụng các kỹ thuật đánh giá chất lượng đầu ra, nhằm giúp học viên phát triển kỹ năng ứng dụng thực tế trong các dự án về chatbot, tìm kiếm thông minh hoặc phân tích tài liệu chuyên sâu.

Các công nghệ trong lớp học

Nội dung chi tiết của khoá học

Xem chi tiết tại đây

Tuần

Chủ đề chính

Những gì bạn sẽ làm được sau buổi học

1

Giới thiệu lớp học

Nắm rõ lộ trình học
Hiểu rõ công cụ sẽ sử dụng
Biết cách học hiệu quả qua từng tuần

2

Sử dụng API liên quan tới văn bản

Thành thạo gọi RESTful API có xác thực
Gọi GPT-3.5 Turbo / GPT-4 / GPT-4o API
Gọi Gemini API từ Google
Gọi API của các mô hình Open Source qua Together AI

3

Lập trình giao diện chatbot nhanh chóng

Tạo giao diện chatbot trong 15 phút bằng Streamlit
Tùy biến trạng thái hội thoại, xử lý tệp và hiển thị ảnh/video

4

RAG và hệ thống Chatbot hiện đại

Hiểu rõ kiến trúc RAG cơ bản
Các khái niệm: Embedding, Vector DB, Similarity
Lập trình truy xuất văn bản từ Vector DB

5

Docker + Cloud (Bổ trợ)

Cài đặt Docker, phân biệt image và container
Tạo Docker Image & chạy Docker Container

6

MongoDB + Crawl dữ liệu (Bổ trợ)

Crawl dữ liệu từ website
Lưu trữ dữ liệu vào MongoDB

7

Lập trình RAG với nhiều Vector DB

Viết pipeline RAG đầy đủ trên MongoDB, Qdrant, ChromaDB, Supabase
So sánh hiệu suất và độ chính xác

8

RAG nâng cao: Semantic Router + Reflection + Hyde

Dùng Semantic Router để giảm nhiễu
Áp dụng Reflection để tự-kiểm chứng
Tăng recall bằng HyDE Search

9

Chunking nâng cao

Phân tích các kỹ thuật chunking: character, recursive, semantic
Lựa chọn chunking phù hợp để tối ưu retrieval

10

Học LangChain + Xây dựng hệ thống với Ollama

Dùng LangChain để lắp ráp các bước Retriever → Router → LLM
Chạy mô hình local bằng Ollama để tiết kiệm chi phí

11

Ứng dụng LangGraph + LangGraph Studio

Xây dựng flow nhiều nhánh
Theo dõi và debug real-time bằng LangGraph Studio

12

RAG có ReRank

Thêm bước ReRank vào pipeline RAG
So sánh hiệu quả giữa RAG thường và RAG+ReRank
Hiểu các mô hình reranker như Cohere, BGE, Cross-Encoder

13

RAG Keyword Search + ReRank

Dùng Elasticsearch hoặc BM25 thay vector DB
Áp dụng rerank để tăng độ chính xác
Phù hợp cho hệ thống chưa có embedding

14

Graph RAG

Tạo Knowledge Graph từ dữ liệu phi cấu trúc
Truy vấn bằng Cypher trên Neo4j
Tạo Graph Embeddings bằng GCN

15

Hybrid RAG

Kết hợp RAG cơ bản và RAG đồ thị
Thiết kế hệ thống hybrid phù hợp tình huống

16

Agentic RAG

Hiểu vòng đời LLM Agent
Áp dụng paper ReAct, Prompt Engineering nâng cao
Xây dựng pipeline Agentic RAG

17

Multimodal RAG

Truy vấn & xử lý thông tin đa phương thức (ảnh + văn bản)
Dùng Gemini hoặc GPT-4o cho các tác vụ đa phương thức

18

Đánh giá chất lượng hệ thống RAG

Hiểu sâu các chỉ số đánh giá RAG: LLM-judged & Rule-based
Sử dụng Ragas và các công cụ từ Google Cloud để đánh giá

19

Thực hành đào tạo mô hình riêng

Fine-tune GPT hoặc LLAMA theo dữ liệu riêng
Triển khai mô hình đã đào tạo

20

Dự án cuối khóa

Xây dựng ứng dụng chatbot hoàn chỉnh có RAG
Trình bày kết quả & kiến trúc hệ thống

21

Tổng quan RAG nâng cao

Ôn tập toàn bộ kiến thức: Vector Search, ReRank, Graph RAG, Agentic RAG
So sánh ưu nhược điểm từng phương pháp
Chuẩn bị cho bài tập thực hành lớn

22

Thực hành triển khai lên Cloud

Đóng gói ứng dụng bằng Docker
Triển khai lên các nền tảng như Render, Railway, hoặc VPS riêng

23

Thực hành đào tạo mô hình riêng

Tự fine-tune mô hình GPT hoặc LLAMA theo dữ liệu của bạn
Huấn luyện và đánh giá mô hình
Triển khai inference

24

[Nâng cao] Xử lý dữ liệu bảng

Trích xuất và hiểu cấu trúc bảng từ tài liệu PDF/HTML
Xử lý bảng bằng LLM hoặc công cụ chuyên dụng như DeepDoc, PaddleOCR, Mistral-7B-OCR
Ứng dụng trong hệ thống RAG có dữ liệu dạng bảng


Sản phẩm cuối khoá

  • 1 bản demo Chatbot RAG: giao diện Streamlit, backend LangChain, tùy chọn Vector DB.

  • 1 báo cáo kỹ thuật (Markdown/Notion): kiến trúc, quyết định thiết kế, benchmark.

  • 1 video pitching 3 phút: trình bày giải pháp trước giảng viên & cố vấn kỹ thuật.

Phương pháp giảng dạy

  • Video: Học viên xem video và hoàn thành các câu hỏi liên quan tới bài giảng

  • Project-based: mỗi chủ đề gắn liền một mini-project, cộng dồn thành dự án lớn cuối khoá.

  • Phản hồi 1-1: Chat với giảng viên trực tiếp qua Discord về các nội dung của lớp học

Đối tượng phù hợp

Kinh nghiệm

Yêu cầu tối thiểu

Bạn sẽ đạt được

Người mới biết lập trình

Biết lập trình Python. Lớp học miễn phí.

Biết cách thiết kế server-client side để tạo chatbot chạy trên server và host trên Cloud

Backend / Full-stack dev biết Python hoặc JS

- Đã gọi thử OpenAI API - Biết Docker cơ bản

— Kỹ năng dựng Chatbot RAG production-ready — Hiểu, chỉnh, và benchmark nhiều Vector DB

Data / ML engineer

- Đã dùng Pandas, SQL - Biết khái niệm embedding

— Chuyển pipeline NLP cũ sang RAG — Tích hợp knowledge-graph & reasoning

AI product / tech-lead

- Hiểu kiến trúc micro-service

— Đưa RAG vào roadmap, ước lượng chi phí, tối ưu latency

Thông tin tổ chức

  • Hình thức: Qua xem video + Chat trực tiếp với giảng viên

  • Giảng viên chính: Bá Ngọc - Founder @ ProtonX. Người Việt đầu tiên được Google công nhận là chuyên gia học máy.


Cam kết đầu ra

  1. Ứng dụng ngay: Bạn có thể phát triển ứng dụng RAG trực tiếp trên cơ sở dữ liệu của bạn

  2. Chi phí rõ ràng: hướng dẫn chọn model / vector DB tối ưu USD/token và lưu trữ.

  3. Cập nhật xu hướng: khóa học liên tục update slide & mã với model/middleware mới (OpenAI Agent SDK, Gemini 2.5 Flash, Llama-4, vv)


Học viên đã triển khai RAG trong công ty

Feedback học viên ở Mỹ:

Giảng viên hỗ trợ nhanh chóng trực tiếp qua Discord