Ba
Hướng dẫn lập trình chi tiết Multi Headed Attention
Cùng ôn tập và lập trình Multi headed Attention cùng team nhé.
Chia nhỏ chiều cuối cùng của Q,K,V thành các head và attention giữa các head này và nối kết quả, sau đó đưa qua ma trận về chiều input ban đầu là cách thức hoạt động của cơ chế này.
Ý nghĩa chi tiết nằm trong Slide.
Slide: https://drive.google.com/file/d/1y8YxaJwjjnhdpYeLWOTq27PIEInoOLHj/view?usp=drive_link
Code: https://colab.research.google.com/drive/1bwIunv5iHRHxuk3DxnhWo9tjaIfI-X4C?usp=sharing
Video Attention: https://youtu.be/GTda3VKWUe8