[Live] Sử dụng API liên quan tới văn bản
Chi tiết về RestFul API
Sử dụng thành thục các API của ChatGPT
GPT 3.5 Turbo
GPT-4 and GPT-4 Turbo
GPT-4o
Sử dụng thành thục các API AI của Google
API Gemini
API các mô hình Open Source
API LLAMA thông qua Together AI
1. Giới thiệu về API
1.1. Restful API
1.2. Flask + OpenAI API
1.3. Các LLMs API nổi tiếng
GPT sử dụng qua: https://platform.openai.com/
Qwen + LLAMA 3 sử dụng qua: https://www.together.ai/
Mistral sử dụng qua: https://mistral.ai/
Claude sử dụng qua: https://claude.ai/
Gemini sử dụng qua: https://ai.google.dev/aistudio?hl=vi
1.4. Cách chạy client + testing API qua Isomnia
2. Demo của lớp học
2.1. Code bổ sung
Demo ứng dụng
Flask: https://drive.google.com/file/d/13Ho28-OW8WJAse4ydZG75imMjd4tCSgW/view?usp=drive_link
FastAPI: https://drive.google.com/file/d/1Tg4mfdzj-H8VJrkrCDGDl32PkGRvlmPa/view?usp=drive_link
Flask Restful API
https://drive.google.com/file/d/1DRlcAzyFUpAMJ_VTc3v7VZ26T04big3t/view?usp=drive_link
2.2. OpenAI simple chat
2.3. Demo PlayGround team ProtonX phát triển
Demo PlayGround team ProtonX phát triển:
3. Video
3.1. Phần 1 - Giới thiệu về lớp học
3.2. Phần 2 - Hướng dẫn sử dụng API văn bản
4. Tương tác với các model open source mạnh
4.1. Giới thiệu Together API
4.2. Thực hành Together API
4.3. Sử dụng API của Kimi 2 và Deep Seek
Kimi 2 có Bench mark rất tốt: https://moonshotai.github.io/Kimi-K2/
4.4. Nhận đinh về mô hình GPT OSS
Nhận xét tổng quan về mô hình GPT-OSS
Tổng quan chung đây là model open source.
Điểm benchmarks của model này tương đương với mô hình o3 ở nhiều khía cạnh.
I. Khả năng suy luận + gọi tools. Thích hợp làm những ứng dụng Agent
Mô hình tập trung khả năng suy luận + gọi tools. Thích hợp để bạn triển khai những ứng dụng liên quan tới Agent.
Benchmarks khả năng gọi tool của model.Khả năng lập trình của mô hình 120b gần như tiệm cận với o4-mini.
Tuy nhiên những mô hình suy luận có thể yếu trong nhiệm vụ liên quan tới retrieval vì có thể gây khả năng ảo tưởng cao. Dưới dây là benchmarks team đã thực hiện gần đây khi so sánh các phiên bản của DeepSeek.
Phiên bản Deep Seek cấu hình mạnh nhất lại cho kết quả trả lời RAG ảo giác (Hallucinations) nhất.
II. Mô hình chạy được trên các phần cứng thấp
Mô hình gpt-oss-20b có thể chạy trên máy tính có RAM khoảng 16 GB.
Team sẽ thử nghiệm mô hình này ngay sau đấy và công bố benchmarks trên open source của team: https://github.com/bangoc123/retrieval-backend-with-rag