List of topics
Biểu thức chính quy - Regular Expressions
[31-1-2024] Chi tiết các thuật toán tách từ
Chuẩn hóa văn bản
Vector Semantics và Embeddings
SkipGram, Glove và FastText
Mô hình ngôn ngữ
RNN và LSTM
Bài toán dịch máy
Mô hình Transfomer
Mô hình Bert và ứng dụng
Thực hành Bert và ứng dụng với bài toán NER và POS Tag
GPT và ứng dụng
Bài toán tìm kiếm và hỏi đáp - Question Answering
Vector Database and RAG
Prompt Engineering
Semantic Cache
Nâng cao - Mô hình Wave2Vec cho bài toán nhận diện giọng nói
Dự án cuối khóa

Semantic Cache

Sử dụng kỹ thuật cache ngữ nghĩa ( Semantic Cache ) để tối ưu tốc độ truy vấn

1. Giới thiệu về Semantic Search

1.1. Tại sao phải dùng kỹ thuật này?

Tại sao phải sử dụng Semantic Cache (Cache ngữ nghĩa)

Việc sử dụng LLMs là một việc rất tốn kém tài nguyên vì vậy trong trường hợp nguồn lực hạn chế, ta có thể lưu trữ lại những truy vấn và kết quả từ đó tạo ra một cơ sở dữ liệu. Với những truy vấn dữ liệu mới, trước khi sử dụng LLMs chúng ta sẽ tìm kiếm ngữ nghĩa (semantic search) giữa truy vấn hiện tại và các truy vấn đã lưu trong quá khứ, nếu truy vấn mới tương đồng với truy vấn trong cơ sở dữ liệu thì ta sẽ trả về kết quả đã lưu thay vì sử dụng LLMs.

Kiến trúc của Semantic Cache

1) Lưu trữ kết quả truy vấn vào Cache

2) Tìm trong cache với truy vấn mới

1.2. Slide

1.3. Một số thư viện Semantic Cache

1. Giới thiệu về Semantic Search
1.1. Tại sao phải dùng kỹ thuật này?
1.2. Slide
1.3. Một số thư viện Semantic Cache