Avatar

Thị giác máy tính nền tảng

Opening Day: 12:00 22/5/2024
Share

Thị giác máy tính là khả năng của máy tính giải quyết các tác vụ liên quan đến hình ảnh và video. Thị giác máy tính có thể được áp dụng trong nhiều lĩnh vực khác nhau như nhận dạng khuôn mặt, phát hiện chuyển động, hay phân loại ảnh.

Sau thời gian dài chuẩn bị, ProtonX chính thức ra mắt lớp học thị giác máy tính giúp học viên nắm chắc các kiến thức cần thiết để trở thành một kỹ sư thị giác máy tính thực thụ. Học viên sẽ được đào tạo bởi đội ngũ giáo viên giàu kinh nghiệm và có kiến thức chuyên sâu về lĩnh vực thị giác máy tính, đồng thời được trải nghiệm các dự án thực tế để phát triển kỹ năng và nâng cao khả năng ứng dụng vào công việc hiệu quả.

Chi tiết nội dung của lớp học.

Lịch học sẽ diễn ra như sau:

  • Thứ 2: 19:00-21:00

  • Thứ 5: 19:00-21:00

Ngày khai giảng: 22/05/2023

Các chủ đề chính:

Các mô hình nhận diện hình ảnh


  • Faster R-CNN sử dụng Region Proposal Network (RPN) nhận đầu vào là ảnh với kích thước bất kì và cho đầu ra là region proposal bao gồm vị trí các hình chữ nhật chứa vật thể cùng với xác suất chứa vật thể của hình chữ nhật tương ứng. Region Proposal Network (RPN) cải thiện tốc độ của thuật toán Selective search, rất tốn tài nguyên tính toán.

  • YOLO (You Only Look Once): Đây là bước đột phá trong phát hiện và nhận diện vật thể thời gian thực. YOLO có thể nhận diện các vật thể trong hình ảnh và video một cách cực kỳ nhanh chóng, làm cho nó trở thành công nghệ lý tưởng cho các ứng dụng cần tính toán tức thời như hệ thống lái xe tự động hay hệ thống an ninh.

  • RetinaNet - Nổi tiếng với hiệu quả trong việc phát hiện các vật thể nhỏ với độ chính xác cao, RetinaNet giải quyết một trong những vấn đề khó khăn nhất trong thị giác máy tính: cân bằng tốc độ với độ chính xác. Nó sử dụng Focal Lossđể tập trung hơn vào các vật thể khó phát hiện, làm cho nó trở thành công cụ mạnh mẽ cho phân tích hình ảnh chi tiết.

Các mô hình sinh ảnh


  • Điều gì khiến GANs trở nên thú vị? Hãy tưởng tượng hai thuật toán AI thi đấu với nhau trong một trận chiến nghệ thuật. Một thuật toán là họa sĩ, tạo ra các hình ảnh mới từ con số không, trong khi thuật toán kia đóng vai trò phê bình nghệ thuật khó tính, cố gắng phát hiện bất kỳ hình ảnh giả mạo nào. Kết quả? Những hình ảnh, âm nhạc, hoặc thậm chí là thế giới ảo cực kỳ chân thực có thể đánh lừa thị giác con người. Giống như việc có Picasso và một giáo sư nghệ thuật nghiêm khắc trong một cuộc đấu sáng tạo!

  • Stable Diffusion - một kỳ quan của thế giới AI cho phép bạn tạo ra những hình ảnh tuyệt đẹp từ các mô tả đơn giản bằng văn bản.

Các ứng dụng trong lớp học:

A) Ứng dụng phân đoạn thời trang


Phân đoạn hình ảnh, đặc biệt là tách quần áo khỏi ảnh, là một ứng dụng rất quan trọng trong lĩnh vực công nghệ và thương mại điện tử. Để hiểu sâu hơn về cách thức hoạt động của công nghệ này, một trong những công cụ được sử dụng rộng rãi chính là mạng UNet, một loại mạng nơ-ron tích chập được thiết kế đặc biệt cho các bài toán về xử lý hình ảnh y tế nhưng giờ đây lại được áp dụng một cách hiệu quả trong ngành thời trang và bán lẻ.

Lớp học CV 01 sinh động hơn với Kaggle

Kaggle là nền tảng cho phép bạn có thể thử nghiệm đào tạo các mô hình và thi đấu với người khác trong những bài toán khác nhau. Kaggle không chỉ là một nơi để bạn thu thập kinh nghiệm thực tế trong lĩnh vực khoa học dữ liệu mà còn là một cầu nối những cá nhân tài năng với các tổ chức cần các giải pháp dựa trên dữ liệu.

Team rất vui mừng thông báo rằng lớp học của chúng ta sẽ tổ chức một cuộc thi trên Kaggle cho bài toán phân loại hình ảnh. Cuộc thi này được thiết kế để thách thức các học viên áp dụng kiến thức và kỹ năng về thị giác máy tính của để giải quyết một vấn đề thực tế. Học viên sẽ được cung cấp một bộ dữ liệu và nhiệm vụ phát triển một mô hình có thể phân loại dựa trên dữ liệu hình ảnh một cách chính xác.

Cuộc thi nhằm mục đích thúc đẩy sự hiểu biết sâu sắc hơn về các kỹ thuật xử lý ảnh, mạng nơ-ron và các thuật toán máy học được tùy chỉnh cho dữ liệu trực quan. Đây là cơ hội tuyệt vời để các học viên thể hiện các phương pháp sáng tạo và kỹ năng kỹ thuật của mình.

Hãy chờ đón thêm thông tin chi tiết về ngày bắt đầu cuộc thi, thông tin về bộ dữ liệu và cấu trúc giải thưởng nhé.