SỞ KHOA HỌC VÀ CÔNG NGHỆ THÀNH PHỐ CẦN THƠ

Khoa học, công nghệ và Đổi mới sáng tạo - Khơi dậy khát vọng kiến tạo tương lai

Phát hiện bất thường: Dự đoán khung hình tương lai kết hợp SOTA OPTICAL-FLOW MODEL và cải tiến hàm lỗi dựa trên FENCEGAN

[28/11/2022 14:51]

Phát hiện bất thường là một bài toán được quan tâm nhiều trong những năm gần đây với nhiều phương pháp ra đời có độ chính xác cao. Future Frame Prediction là phương pháp tiếp cận mới lạ đối với bài toán phát hiện bất thường trong video.

Phương pháp này có ý tưởng chính là sử dụng các video chỉ chứa khung hình bình thường để huấn luyện mô hình. Giai đoạn kiểm tra, mô hình có thể nhận đầu vào là video có chứa khung hình bất thường, việc phát hiện bất thường dựa trên sự khác biệt giữa khung hình được tái tạo từ dữ liệu bình thường và khung hình thực tế có chứa bất thường trong video kiểm tra. Trong bài báo này, mô hình được cải thiện bằng cách thay đổi thành phần ước lượng optical-flow trong mô hình Future Frame Prediction và sửa đổi hàm lỗi dựa trên công trình FenceGAN nhằm tăng hiệu suất phát hiện bất thường. Kết quả sau khi tinh chỉnh, mô hình cải thiện độ chính xác trung bình 0,5% trên các bộ dữ liệu chuẩn như UCSD Ped1, UCSD Ped2, Avenue.

Một số công trình trước đây từng đề cập đến khái niệm bất thường như Chandola et al. (2009), Chalapathy et al. (2019), Zhu et al. (2020), Ramachandra et al. (2020)… Trong đó, định nghĩa về bất thường của Ramachandra et al. (2020) không chỉ bao quát các định nghĩa trước mà còn bổ sung thêm thông tin ngữ nghĩa về không gian và thời gian khi xác định sự kiện bất thường. Cụ thể, Ramachandra và các cộng sự đã cho rằng bất thường trong video có thể được coi là sự xuất hiện của đối tượng bất thường, thuộc tính chuyển động bất thường hoặc sự xuất hiện của đối tượng có thuộc tính hoặc chuyển động không thường gặp ở các địa điểm hoặc thời điểm xác định. Với định nghĩa này, trong công trình cũng đã nêu ra những khó khăn và thách thức đến từ dữ liệu của bài toán. Cụ thể, bản chất khái niệm bất thường không cố định và không nhất quán ở những ngữ cảnh hoặc những thời điểm khác nhau.

Khi nói về sự không nhất quán của bất thường theo không gian, nghĩa là khi thay đổi ngữ cảnh video nhận định về bất thường có thể không còn đúng nữa. Giả sử video ghi hình tại một công viên hoặc một địa điểm công cộng có cảnh xung đột, bạo lực, đánh nhau,… ngữ cảnh này chính là cảnh bất thường. Mặt khác, nếu video được ghi hình tại một giải đấu võ, boxing,… thì hành động xung đột, đánh nhau không hẳn là một cảnh bất thường. Tóm lại, khi ngữ cảnh video bị thay đổi, định nghĩa bất thường cũng không còn đúng với ngữ cảnh mới. Nói cách khác, bất thường trong một hoặc một số ngữ cảnh không hẳn sẽ là bất thường ở tất cả các ngữ cảnh khác và ngược lại.

Đối với việc không nhất quán bất thường theo thời gian, giả sử một trung tâm mua sắm hoạt động từ 8h – 23h mỗi ngày trừ các ngày cuối tuần, trung tâm này có camera an ninh ghi hình tại quầy thu ngân. Việc khách hàng ra vào quầy thu ngân trong giờ làm việc là sự kiện bình thường (không phải bất thường). Tuy nhiên, ngoài giờ làm việc hoặc ở thời điểm mà trung tâm mua sắm đóng cửa, việc ghi lại cảnh có người ra vào quầy thu ngân lại là sự kiện bất thường. Tóm lại, cùng một ngữ cảnh, nếu thời gian thay đổi thì khái niệm bất thường cũng không còn chính xác tuyệt đối nữa. Nói cách khác, để xác định đúng sự kiện bất thường cần chú ý đến không chỉ là ngữ cảnh trên video mà còn cần đặc biệt lưu ý đến thời điểm diễn ra bất thường để tránh nhầm lẫn cho việc phát hiện bất thường từ đó tránh sai sót cho các kiến trúc mô hình được xây dựng cho bài toán này.

nqhuy

Tạp chí Khoa học Trường Đại học Cần Thơ, Tập 58, Số 5A (2022): 60-68
Bản quyền @ 2017 thuộc về Sở Khoa học và Công nghệ thành phố Cần Thơ
Địa chỉ: Số 02, Lý Thường kiệt, phường Tân An, quận Ninh Kiều, thành phố Cần Thơ
Điện thoại: 0292.3820674, Fax: 0292.3821471; Email: sokhcn@cantho.gov.vn
Trưởng Ban biên tập: Ông Trần Đông Phương An - Phó Giám đốc Sở Khoa học và Công nghệ thành phố Cần Thơ