Đọc nghiên cứu trí tuệ nhân tạo mới nhất

Tại sao InstructionGPT ra đời?

Các bước để xây dựng InstructionGPT?

Đọc paper InstructionGPT

Bước 1 - Supervised fine-tuning (SFT)

Bước 2 - Reward Model (RM)

Toàn bộ quá trình training

Chi tiết các bước xây dựng mô hình

- InstructionGPT
- ChatGPT
- Học tăng cường khi đào tạo InstructionGPT
- Các khái niệm liên quan tới mô hình trao thưởng (Reward Model) và cách fine-tuning mô hình ngôn ngữ dựa trên mô hình trao thưởng này.

InstructionGPT và ChatGPT

<p>Hướng dẫn đọc AI paper bất kỳ</p>

Hướng dẫn đọc AI paper bất kỳ

Thay vì sử dụng mạng CNN và Transformer chúng ta liệu rằng có thể chỉ đơn thuần sử dụng Mạng Nơ ron (Hay có tên gọi là Multi-layer Perceptrons) cho các bài toán thị giác máy tính không?

MLP-Mixer

Đây chính là mô hình xương sống cho những mô hình Deep Learning trong xử lý ngôn ngữ tự nhiên hiện tại.

Transformer

Cùng tìm hiểu cách sử dụng mô hình Transformer cho bài toán phân loại hình ảnh.


An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale

Đọc nghiên cứu GPT-1, GPT-2 và GPT-3

Video và bộ dữ liệu sẽ được công bố vào 20:00 26-05-2023

InstructionGPT và ChatGPT

1. Đọc paper InstructionGPT

1.1. Tại sao InstructionGPT ra đời?

1.2. Các bước để xây dựng InstructionGPT?

2. Chi tiết các bước xây dựng mô hình

2.1. Bước 1 - Supervised fine-tuning (SFT)

2.2. Bước 2 - Reward Model (RM)

2.3. Toàn bộ quá trình training