SỞ KHOA HỌC VÀ CÔNG NGHỆ THÀNH PHỐ CẦN THƠ

Khoa học, công nghệ và Đổi mới sáng tạo - Khơi dậy khát vọng kiến tạo tương lai

Thực nghiệm đánh giá double-head cho bài toán phát hiện phương tiện giao thông từ không ảnh

[01/10/2022 16:43]

Phát hiện phương tiện giao thông từ không ảnh đặt ra nhiều thách thức và nhận được sự quan tâm từ cộng đồng nghiên cứu. Đối tượng trong không ảnh nhỏ hơn rất nhiều so với ảnh chụp từ camera mặt đất, đây là thách thức rất lớn.

Với các đối tượng nhỏ, sự sai khác của các vùng đề xuất sẽ làm ảnh hưởng lớn đến kết quả phát hiện đối tượng. Trong nghiên cứu này, phương pháp Double-Head được đánh giá dựa trên bộ dữ liệu AERIAU – một bộ dữ liệu không ảnh có áp dụng các kỹ thuật tăng cường dữ liệu. Double-Head đạt kết quả 37,09% mAP trên bộ dữ liệu AERIAU. So sánh với mô hình đạt kết quả cao nhất được công bố trước đó trên bộ dữ liệu AERIAU là YOLOv3, Double-Head cao hơn 2,01%. Double-Head đạt kết quả cao trên lớp đối tượng xe ô tô, xe buýt, xe tải, từ đó đưa ra đề xuất phát hiện xe loại nhỏ. Đây là tiền đề cho các nghiên cứu tiếp theo, cơ sở để phát triển các hệ thống giám sát giao thông thông minh.

Việt Nam là một trong những nước có tình hình giao thông phức tạp nhất trên toàn thế giới với số lượng phương tiện giao thông lưu thông trên đường hằng ngày đạt con số rất lớn. Theo số liệu của Cục Cảnh sát giao thông, tháng 7/2020 (Tổng cục Đường bộ Việt Nam, 2021), thành phố Hồ Chí Minh có 8.94 triệu phương tiện cá nhân, tăng gần 7% so với cùng kỳ năm 2018. Trong đó, có hơn 825.000 ô tô (tăng gần 16%) và 8,12 triệu xe máy (tăng hơn 6%). Chỉ trong khoảng 10 năm (từ năm 2010 đến nay), phương tiện giao thông đã tăng thêm hơn 4 triệu. Theo thống kê, bình quân mỗi tháng có 30.000 phương tiện giao thông đăng ký mới, đồng nghĩa với mỗi ngày có 1.000 phương tiện đăng ký mới. Điều đó tạo áp lực cho các hệ thống giám sát cũng như kiểm soát giao thông. Phát hiện phương tiện giao thông là một bài toán không còn xa lạ thuộc nhóm các bài toán phát hiện đối tượng và có nhiều ứng dụng trên thực tế, là tiền đề giúp phát triển hệ thống giám sát giao thông thông minh. Bài toán này nhận được sự quan tâm của các nhà khoa học, các hãng sản xuất công nghiệp lớn nhằm phát triển các hệ thống tự động và điều tiết giao thông. Việc tìm được vị trí các đối tượng giao thông từ không ảnh giúp phát hiện các bất thường, quản lý hoạt động của các nút giao thông một cách hiệu quả, toàn diện hơn. Quản lý giao thông thông minh là chìa khóa cho một thành phố thông minh.

Hình ảnh chụp từ thiết bị bay không người lái (flycam, drone) hay còn được gọi là không ảnh được sử dụng rộng rãi trong những năm gần đây. Cụ thể là trong lĩnh vực thị giác máy tính, tuy giám sát giao thông là hoạt động thường xuyên, cần dựa vào các hệ thống camera giám sát được thiết lập cố định nhưng vì không ảnh có độ phân giải cao, tầm nhìn bao quát nên các phương tiện giao thông dễ dàng được phát hiện. Tuy nhiên, do tầm nhìn và quy mô của không ảnh là khá lớn nên việc phát hiện các phương tiện giao thông còn gặp cản trở bởi nhiều đối tượng gây nhiễu như tòa nhà, cầu, cây xanh, thùng rác, ... Điều này tạo nhiều khó khăn cho việc phát hiện đối tượng quan tâm một cách chính xác. Đặc biệt, đa số các đối tượng trong không ảnh chiếm tỷ lệ nhỏ, cụ thể là đối tượng xe mô tô, đây là thách thức lớn trong cộng đồng thị giác máy tính hiện nay.

Phát hiện phương tiện giao thông là chủ đề không quá xa lạ trong cộng đồng thị giác máy tính, các nghiên cứu về chủ đề này được công bố nhiều trong nước cũng như quốc tế (Ho et al., 2020; Liu et al., 2020). Trên cơ sở kế thừa những công trình nghiên cứu khoa học trước đó, nghiên cứu này hướng đến việc phân loại phương tiện giao thông trong không ảnh dựa trên bộ dữ liệu AERIAU (Chung et al., 2020), các lớp đối tượng được xem xét trong phạm vi nghiên cứu là xe ô tô (car), xe tải (truck), xe buýt (bus) và xe mô tô (motor). Các phương tiện có hình dạng và kích thước khác nhau, các vùng đề xuất tìm được sẽ có sự đa dạng về kích thước, phù hợp cho mục tiêu nghiên cứu. Ở Hình 1, các phương tiện được xác định như xe mô tô có kích thước nhỏ, to hơn là ô tô, xe buýt, xe tải. Khi thay đổi tầm nhìn, bài toán trở nên khó hơn, dễ nhận nhầm giữa các đối tượng và khó phát hiện đối tượng nhỏ.

nqhuy

Tạp chí Khoa học Trường Đại học Cần Thơ, Tập 58, Số 4A (2022): 17-25
Bản quyền @ 2017 thuộc về Sở Khoa học và Công nghệ thành phố Cần Thơ
Địa chỉ: Số 02, Lý Thường kiệt, phường Tân An, quận Ninh Kiều, thành phố Cần Thơ
Điện thoại: 0292.3820674, Fax: 0292.3821471; Email: sokhcn@cantho.gov.vn
Trưởng Ban biên tập: Ông Trần Đông Phương An - Phó Giám đốc Sở Khoa học và Công nghệ thành phố Cần Thơ