List of topics
Giới thiệu Vision Language Model
Kiến trúc của Modern VLM
Nền tảng OCR
Mô hình OCR bằng Transformer
Document OCR
OCR thế hệ mới với VLM
OCR tập trung vào văn bản Tiếng Việt
OCR trong hệ thống Chatbot
Dự án cuối khóa - Xây dựng OCR mã nguồn mở cho Tiếng Việt
Kiến trúc của Modern VLM
Nội dung
Vision Transformer (ViT)
Patch Embedding
Cross Attention
Q-Former
Projector
Mô hình
LLaVA
Qwen2.5-VL