SỞ KHOA HỌC VÀ CÔNG NGHỆ THÀNH PHỐ CẦN THƠ

Khoa học, công nghệ và Đổi mới sáng tạo - Khơi dậy khát vọng kiến tạo tương lai

Nghiên cứu thuật toán thị giác máy tính để theo dõi việc thực hiện các quy định về phòng ngừa Covid-19 sử dụng kỹ thuật học sâu

[28/11/2022 15:50]

Bài báo này được thực hiện nhằm nghiên cứu phát hiện và kiểm tra việc tuân thủ các quy định về đeo khẩu trang, giữ khoảng cách xã hội ở các địa điểm đông đúc.

Mô hình YOLO được sử dụng để xây dựng thuật toán phát hiện đeo khẩu trang đúng hay không đúng quy định, đồng thời kiểm tra việc giữ khoảng cách xã hội bằng việc sử dụng thuật toán tính khoảng cách Euclid giữa các khung bao quanh người được phát hiện trong hình ảnh, kết hợp thuật toán chuyển đổi Bird’s-eye view. Tập dữ liệu được sử dụng bao gồm 40 hình ảnh với hai đối tượng người được phân loại thực tế theo khoảng cách đứng với nhau: lớn hơn hoặc bằng 2 m và nhỏ hơn 2 m. Đồng thời, mỗi đối tượng người trong hình ảnh được phân loại thành ba lớp: đeo khẩu trang đúng hay không đúng và không đeo khẩu trang. Kết quả thử nghiệm khoảng cách đối tượng đạt 90% và nhận diện đối tượng đeo khẩu trang có kết quả như sau: 86,67% đeo khẩu trang đúng, 76,67% không đeo khẩu trang và 65% đeo khẩu trang sai.

Thị giác máy tính là tập hợp con của trí tuệ nhân tạo sử dụng sức mạnh của máy tính để trích xuất thông tin có ý nghĩa từ các tập dữ liệu được cung cấp, các tập dữ liệu đó có thể là hình ảnh, video... Đại dịch Covid-19 đã tác động rất lớn đến các lĩnh vực kinh tế - xã hội ở Việt Nam nói riêng và thế giới nói chung. Mặc dù đã có những tiến bộ trong việc điều trị, nhiều loại vaccine đã ra đời, việc tiêm chủng đã được đẩy mạnh, tuy nhiên tình hình dịch bệnh vẫn còn tiếp diễn do khả năng tiến hóa và lây lan mạnh của virus. Vì vậy, việc thích nghi, kết hợp tuân thủ các biện pháp phòng, chống dịch theo hướng dẫn của Bộ Y tế, cụ thể là thực hiện tốt thông điệp 5K - khẩu trang, khử khuẩn, khoảng cách, không tụ tập và khai báo y tế là hết sức cần thiết, góp phần phòng, chống, không làm tái phát nguồn lây lan của dịch bệnh.

Để đảm bảo an toàn, tiết kiệm về thời gian, công sức các tổ chức xã hội cũng như doanh nghiệp đang hướng đến việc tự động hóa việc phát hiện vi phạm quy định phòng chống dịch Covid-19, đặc biệt là quy định về đeo khẩu trang và giữ khoảng cách xã hội (Kumar & Shetty, 2021), việc ứng dụng thị giác máy tính trong phát hiện đeo khẩu trang, phát hiện người làm cơ sở để tính khoảng cách xã hội là hết sức cần thiết. Một vài giải pháp đã được đề xuất và nghiên cứu, ứng dụng phát hiện khẩu trang, phát hiện vi phạm khoảng cách xã hội sử dụng mạng CNN (Convolutional Neural Networks) như xây dựng mạng CNN dựa trên keras để phát hiện khẩu trang, mô hình YOLOv3 huấn luyện sẵn để phát hiện người và tính khoảng cách bằng công thức Eculid (Kumar & Shetty, 2021); phát hiện khuôn mặt đeo khẩu trang theo thời gian thực, so sánh hiệu suất giữa mô hình MTCNN + ResNet18 và YOLOv5 trên tập dữ liệu là video (Ding et al., 2021); theo dõi khoảng cách xã hội sử dụng mô hình YOLOv5 nhận diện đối tượng người trong video, sử dụng công thức Eculid để tính khoảng cách (Shukla et al., 2021). Tuy nhiên, hiện tại chưa có một nghiên cứu hay báo cáo về việc sử dụng đồng thời thuật toán YOLOv5 trong việc nhận diện đeo khẩu trang và phát hiện người, áp dụng chuyển đổi Bird’s-eye view trong tính khoảng cách Eculid. Trong các thuật toán được sử dụng để phát hiện đối tượng trong hình ảnh, YOLO nổi bật hơn nhờ tốc độ xử lý nhanh, độ chính xác cao, YOLOv5 duy trì được tốc độ 52 FPS trên video thử nghiệm, trong khi MTCNN + ResNet18 chỉ đạt 6 FPS, YOLO có khả năng phát hiện ổn định hơn, do học cách phát hiện trực tiếp “khuôn mặt với khẩu trang được đeo đúng cách” và “khuôn mặt với khẩu trang đeo không đúng cách” thay cho việc phát hiện khuôn mặt đầu tiên sau đó phân loại xem khuôn mặt có đeo khẩu trang hay không như ở MTCNN + ResNet18. Nghiên cứu này được thực hiện nhằm phát hiện việc đeo khẩu trang đúng quy định hay không thông qua việc huấn luyện mô hình YOLOv5 trên tập dữ liệu tùy chỉnh, đồng thời sử dụng các mô hình đã được huấn luyện sẵn để phát hiện và theo dõi đối tượng người trong ảnh, trích xuất tọa độ điểm cơ bản kết hợp sử dụng chuyển đổi Bird’s-eye view, thuật toán Eculid làm cơ sở để tính khoảng cách giữa các đối tượng, khoảng cách xã hội cần tuân thủ là 2 m theo thông điệp 5K của Bộ Y tế về giữ khoảng cách khi tiếp xúc với người khác.

nqhuy

Tạp chí Khoa học Trường Đại học Cần Thơ, Tập 58, Số 5A (2022): 1-13
Bản quyền @ 2017 thuộc về Sở Khoa học và Công nghệ thành phố Cần Thơ
Địa chỉ: Số 02, Lý Thường kiệt, phường Tân An, quận Ninh Kiều, thành phố Cần Thơ
Điện thoại: 0292.3820674, Fax: 0292.3821471; Email: sokhcn@cantho.gov.vn
Trưởng Ban biên tập: Ông Trần Đông Phương An - Phó Giám đốc Sở Khoa học và Công nghệ thành phố Cần Thơ