SỞ KHOA HỌC VÀ CÔNG NGHỆ THÀNH PHỐ CẦN THƠ

Đột phá phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia

Điều khiển robot pioneer p3-dx bám sát đối tượng dựa trên kết hợp máy học và camshift

[02/03/2026 08:32]

Bài báo trình bày phương pháp tích hợp các thuật toán máy học vào robot di động Pioneer P3-DX nhằm điều khiển hành vi, chuyển động và khả năng bám sát đối tượng theo thời gian thực. Hệ thống đề xuất sử dụng đặc trưng Haar-Like kết hợp bộ phân tầng Cascades of Boosted Classifiers và thuật toán AdaBoost để phát hiện và nhận dạng đối tượng. Sau khi đối tượng được xác định, thuật toán CamShift được áp dụng để theo dõi liên tục trên mặt phẳng ảnh. Dựa trên vị trí và kích thước đối tượng trong khung hình, hệ thống tính toán khoảng cách và điều chỉnh vận tốc để điều khiển robot di chuyển tương ứng. Kết quả thực nghiệm cho thấy robot đáp ứng tốt yêu cầu đặt ra, duy trì khả năng bám sát ổn định trong nhiều điều kiện môi trường khác nhau.

1. Giới thiệu

Trong lĩnh vực robot di động, bài toán theo dõi và bám sát đối tượng có ý nghĩa quan trọng trong nhiều ứng dụng thực tiễn như robot hỗ trợ cá nhân, robot vận chuyển, robot dịch vụ và robot công nghiệp. Để robot có thể hoạt động thông minh, cần có sự kết hợp giữa phần cứng cơ điện tử và các thuật toán xử lý ảnh, máy học đóng vai trò như “bộ não” của hệ thống.

Các hướng tiếp cận phổ biến trong bài toán bám sát bao gồm bộ lọc Kalman, MeanShift, CamShift, Multiple Hypothesis Tracking và các phương pháp dựa trên bộ lọc hạt. Trong nghiên cứu này, phương pháp kết hợp phát hiện đối tượng bằng đặc trưng Haar-Like và theo dõi bằng CamShift được lựa chọn nhằm đảm bảo tính chính xác và khả năng xử lý thời gian thực.

2. Robot di động Pioneer P3-DX

Robot Pioneer P3-DX là một nền tảng robot di động được sử dụng rộng rãi trong nghiên cứu. Robot có cấu trúc ba bánh, trong đó hai bánh chủ động phía trước và một bánh tự do phía sau. Hệ thống được trang bị 16 cảm biến siêu âm sonar (8 phía trước và 8 phía sau) để phát hiện vật cản.

Robot có khả năng đạt vận tốc tối đa 1,2 m/s và tải trọng lên đến 23 kg. Nhờ bộ SDK hỗ trợ, người dùng có thể lập trình và điều khiển robot linh hoạt thông qua các thư viện như ARIA. Đây là nền tảng phù hợp để triển khai các thuật toán thị giác máy tính và điều khiển thông minh.

3. Phương pháp điều khiển robot bám sát đối tượng

3.1 Kiến trúc hệ thống

Hệ thống bao gồm ba khối chính: thu nhận ảnh, phát hiện và theo dõi đối tượng, và điều khiển chuyển động. Camera được gắn trên robot để thu nhận khung hình liên tục. Mỗi khung hình được xử lý qua hai giai đoạn: phát hiện đối tượng và bám sát.

3.2 Phát hiện và nhận dạng đối tượng

3.2.1 Đặc trưng Haar-Like và Cascades of Boosted Classifiers

Đặc trưng Haar-Like cho phép biểu diễn mối quan hệ sáng – tối giữa các vùng ảnh. Việc sử dụng ảnh tích phân giúp tính toán đặc trưng nhanh chóng. Các đặc trưng được đưa vào bộ phân tầng nhiều giai đoạn nhằm loại bỏ nhanh các vùng không chứa đối tượng.

3.2.2 Thuật toán AdaBoost

AdaBoost được sử dụng để kết hợp các bộ phân lớp yếu thành một bộ phân lớp mạnh. Trọng số của các mẫu bị phân loại sai được tăng lên qua mỗi vòng lặp huấn luyện, giúp nâng cao độ chính xác tổng thể của mô hình. Trong nghiên cứu này, mô hình được huấn luyện với 1600 ảnh dương và 4200 ảnh âm, đạt độ chính xác xấp xỉ 97–98%.

3.3 Bám sát đối tượng bằng CamShift

CamShift (Continuously Adaptive MeanShift) là phiên bản mở rộng của MeanShift, cho phép thay đổi kích thước cửa sổ tìm kiếm theo kích thước đối tượng. Thuật toán xác định trọng tâm dựa trên moment ảnh và cập nhật vị trí liên tục theo từng frame.

Quá trình gồm các bước: khởi tạo cửa sổ tìm kiếm, tính phân bố xác suất màu sắc, áp dụng MeanShift để tìm trọng tâm mới, cập nhật kích thước cửa sổ và lặp lại cho đến khi hội tụ.

3.4 Tính toán khoảng cách và điều khiển vận tốc

Khoảng cách từ đối tượng đến camera được ước lượng dựa trên mô hình hình học phối cảnh, sử dụng tiêu cự camera và kích thước thực của vật thể. Từ đó, hệ thống điều chỉnh vận tốc robot theo khoảng cách:

Tiến khi khoảng cách lớn hơn ngưỡng an toàn

Lùi khi đối tượng quá gần

Rẽ trái hoặc phải dựa trên vị trí đối tượng so với tâm ảnh

Robot chỉ di chuyển khi kích thước đối tượng nằm trong giới hạn cho phép nhằm tránh nhiễu do các vùng màu tương tự.

4. Kết quả thực nghiệm

Hệ thống được triển khai trên máy tính sử dụng Ubuntu 12.04, thư viện OpenCV 2.4.2 và SDK ARIA 2.7.2. Tốc độ xử lý đạt 20 khung hình/giây.

Kết quả huấn luyện cho thấy độ chính xác nhận dạng đạt khoảng 97,4–98%. Robot có thể thực hiện các hành vi: tiến, lùi, rẽ trái và rẽ phải tương ứng với vị trí của quả bóng trên mặt phẳng ảnh.

Thời gian bắt bám đối tượng dao động trong khoảng 25–30 ms. Hệ thống hạn chế được hiện tượng mất bám nhờ cơ chế phát hiện lại khi CamShift thất bại.

5. Kết luận và hướng phát triển

Nghiên cứu đã xây dựng thành công hệ thống điều khiển robot Pioneer P3-DX bám sát đối tượng theo thời gian thực bằng cách kết hợp phát hiện đối tượng dựa trên Haar-Like và AdaBoost với thuật toán CamShift.

Robot hoạt động ổn định trong nhiều môi trường thử nghiệm, kiểm soát được vận tốc và khoảng cách theo yêu cầu. Trong tương lai, có thể tích hợp thêm bộ lọc Kalman để dự đoán chuyển động, kết hợp bản đồ môi trường nhằm nâng cao khả năng tránh vật cản và mở rộng ứng dụng trong các bài toán thực tế như robot hỗ trợ người khuyết tật, robot vận chuyển thông minh và robot dịch vụ tự động.

Tạp chí Khoa học Trường Đại học Cần Thơ, Số chuyên đề Công nghệ Thông tin, 2013 (nhahuy)
Bản quyền @ 2017 thuộc về Sở Khoa học và Công nghệ thành phố Cần Thơ
Địa chỉ: Số 02, Lý Thường kiệt, phường Ninh Kiều, thành phố Cần Thơ
Điện thoại: 0292.3820674, Fax: 0292.3821471; Email: sokhcn@cantho.gov.vn
Trưởng Ban biên tập: Ông Trần Đông Phương An - Phó Giám đốc Sở Khoa học và Công nghệ thành phố Cần Thơ