Thực hành Langchain + LLAMA Index
Thực hành Langchain + LLAMA Index
Xây dựng hệ thống RAG hoàn toàn Open Source
Các công cụ xây dựng:
Ollama để chạy mô hình
Langchain để xây quy trình truy xuất thông tin
1. Tài liệu
1.1. Xử lý các văn bản đầu vào
Vấn đề dính chữ trên PDF:
https://colab.research.google.com/drive/1t3gWtliERTfESwqfZ_wU479j7gMNfKUr?usp=sharing
1.2. Thực hành LangChain
Giải thích Syntax của LangChain:
https://colab.research.google.com/drive/1URNvoCEFA9eAX3kokYrZ32DpVPfPL4LE?usp=sharing
Chatbot lưu Sessions của người dùng:
Code back end: https://colab.research.google.com/drive/1XIZikuY3KtZzfnDG3wEcBBIHJhhdKgU-?usp=sharing.
Code Front End: https://github.com/bangoc123/protonx-ai-app-UI/blob/main/src/app/%5Blocale%5D/ai/chat/lang-chain-chat/client.tsx
RAG thuần local không sử dụng API ngoài:
https://colab.research.google.com/drive/1yL8M_IMR091xk_OZAPj19XPEsTUBsPCn?usp=sharing
Sâu về Chunking:
Chunking với RAG: https://colab.research.google.com/drive/1zSuyh42haB6St2g8jByAScsg7dpoUvjf?usp=sharing
Các loại Splitter của LangChain: https://colab.research.google.com/drive/1oBC35J3gyaBNCIdP8hl5PWZ_d_rv-tQ1?usp=sharing
LangChain + RAG + Crawl Tiếng Việt chuẩn hơn
https://colab.research.google.com/drive/1VGWsGXXw0V6gRl6s3Nm3tiBDA9wM0-VZ?usp=sharing