List of topics
MLOps
Chi tiết vị trí kỹ sư MLOps
Nền tảng cần cho lớp học
Dự án mẫu
Development - Thu thập dữ liệu
Development - Xử lý dữ liệu
Development - Pytorch nền tảng
Deployment - Model Optimization
Deployment - ML Run
Deployment - MLFlow
Model Operations

Chi tiết vị trí kỹ sư MLOps

  • ML Ops Engineer (Kỹ sư ML Ops)

  • Data Science (Khoa học dữ liệu)

  • Data Engineer (Kỹ sư dữ liệu)

  • Business (Kinh doanh)

  • App Design / Dev (Thiết kế / Phát triển Ứng dụng)

  • DevOps

  • IT Ops (Vận hành CNTT)

1. MLOPs Engineer khác các vị trí khác thế nào?

1.1. Thực chất kỹ sư MLOps là làm gì?

MLOps Engineer khác những vị trí khác như thế nào?

Một kỹ sư ML Ops là người có đủ kiến thức về các mô hình học máy để hiểu cách triển khai chúng, đồng thời có đủ hiểu biết về các hệ thống vận hành để biết cách tích hợp, mở rộng và giám sát các mô hình.

  • Kỹ sư dữ liệu (data engineer) làm việc với các cơ sở dữ liệu để đảm bảo rằng tất cả các nguồn dữ liệu đều sẵn có và cung cấp các bộ dữ liệu đã được chọn lọc (curated datasets) cho các thành viên còn lại trong nhóm phân tích (analytics team).

  • Các nhà khoa học dữ liệu (data scientists) khám phá dữ liệu, huấn luyện và xây dựng mô hình dự đoán (predictive model).

  • Sau đó, các nhà khoa học dữ liệu làm việc với kỹ sư ML Ops để kiểm thử mô hình đã huấn luyện trên dữ liệu thực tế trong môi trường phát triển hoặc môi trường “sandbox”, sau đó kỹ sư sẽ triển khai mô hình đó vào môi trường sản xuất (production environments).

  • Data Science → Test / Monitor → ML Ops Engineer

    • Test: Kiểm thử (Xác thực và Đánh giá mô hình)

      • Các nhà khoa học dữ liệu (Data Scientists) phát triển các mô hình học máy và phải kiểm thử hiệu suất của chúng trên các bộ dữ liệu khác nhau.

        Trước khi triển khai, các mô hình này được bàn giao cho kỹ sư ML Ops để xác thực trong môi trường thực tế hoặc môi trường gần giống với sản xuất (production-like environments).

        Quy trình kiểm thử bao gồm:

        • Đánh giá độ chính xác (accuracy), độ chính xác theo từng lớp (precision) và khả năng thu hồi (recall)

        • Kiểm thử sức chịu tải với các khối lượng dữ liệu khác nhau

        • Kiểm tra tính công bằng và thiên lệch (fairness and bias)

        • Kiểm thử khả năng xử lý các trường hợp biên (edge cases)

    • Monitor: Giám sát (Hành vi trong môi trường sản xuất)

      • Sau khi triển khai, các kỹ sư ML Ops liên tục giám sát:

        • Model drift (sự thay đổi độ chính xác của mô hình theo thời gian)

        • Chất lượng dữ liệu (ví dụ: dữ liệu bị thiếu, lỗi định dạng)

        • Mức sử dụng tài nguyên (ví dụ: bộ nhớ, CPU, độ trễ)

        • Hành vi bất thường hoặc lỗi hệ thống

  • Các nhà khoa học dữ liệu và kỹ sư ML Ops đều tích hợp các yêu cầu và thay đổi từ người dùng doanh nghiệp (business users) để hiểu rõ mục đích dự đoán của mô hình và các ràng buộc pháp lý liên quan. Những người dùng này cung cấp hướng dẫn về việc mô hình nên dự đoán điều gì, cách mô hình được sử dụng ra sao, liệu các đặc trưng (features) mà data scientists tạo ra có hợp lý về mặt kinh doanh và được phép sử dụng hay không, cũng như các đặc trưng bổ sung nào có thể được thêm vào mô hình.

  • Nhà thiết kế ứng dụng (application designer) làm việc với các data scientists để quyết định nên sử dụng hoặc xây dựng mô hình nào và cách tích hợp mô hình một cách tốt nhất để mô hình đó hữu ích đối với người dùng doanh nghiệp, còn lập trình viên ứng dụng (application developer) sẽ viết mã để kết nối các phần này lại với nhau.

  • ML Ops Engineer → Integrate → App Design/Dev

    • ML Ops Engineer – Model Deployment & API Wrapping

      • Kỹ sư ML Ops tiếp nhận các mô hình học máy đã được huấn luyện và kiểm thử từ nhóm Data Science, sau đó đóng gói chúng thành các dịch vụ sẵn sàng cho môi trường sản xuất, thường dưới dạng:

        • RESTful APIs

        • gRPC endpoints

        • Pipelines cho suy luận mô hình (model inference)

      • Kỹ sư ML Ops đảm bảo rằng mô hình:

        • Có khả năng mở rộng (scalable)

        • An toàn (secure)

        • Được giám sát (monitored)

        • Có độ trễ thấp (low-latency)

    • Tích hợp – Cầu nối giữa ML và ứng dụng

      • Quá trình tích hợp nhằm đưa các dự đoán của mô hình đến được với hệ thống frontend hoặc backend. Điều này có thể bao gồm:

        • Mở các endpoint API

        • Viết SDK hoặc thư viện client

        • Gắn logic vào các cloud functions, microservices hoặc containers

        • Ghi log và lưu phiên bản kết quả đầu ra để phục vụ kiểm toán (auditability)

    • Thiết kế / Phát triển ứng dụng – Tính năng hướng đến người dùng

      • Cá nhân hóa nội dung (ví dụ: gợi ý nội dung phù hợp)

      • Tự động hóa các tác vụ (ví dụ: phân loại hình ảnh)

      • Cải thiện trải nghiệm người dùng (UX) (ví dụ: chatbot, phân tích cảm xúc)

      • Thêm tính năng thông minh (ví dụ: gợi ý từ khi gõ, cảnh báo gian lận)

1. MLOPs Engineer khác các vị trí khác thế nào?
1.1. Thực chất kỹ sư MLOps là làm gì?