SỞ KHOA HỌC VÀ CÔNG NGHỆ THÀNH PHỐ CẦN THƠ

Đột phá phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia

Hệ thống AI học cách ngăn chặn tình trạng tắc nghẽn giao thông do robot trong kho gây ra, giúp tăng năng suất lên 25%

[28/03/2026 14:53]

Bên trong một nhà kho tự động khổng lồ, hàng trăm robot di chuyển nhanh nhẹn dọc các lối đi để thu thập và phân phối hàng hóa, đáp ứng nhu cầu đặt hàng liên tục của khách hàng. Trong môi trường bận rộn này, ngay cả những tắc nghẽn nhỏ hay va chạm nhẹ cũng có thể dẫn đến sự chậm trễ nghiêm trọng. Để tránh tình trạng kém hiệu quả trầm trọng như vậy, các nhà nghiên cứu từ MIT và công ty công nghệ Symbotic đã phát triển một phương pháp mới giúp tự động duy trì sự vận hành trơn tru của đội robot.

Phương pháp của họ học cách xác định robot nào nên được ưu tiên di chuyển trước tại mỗi thời điểm, dựa trên mức độ tắc nghẽn đang hình thành, và thích ứng để ưu tiên những robot sắp bị kẹt. Bằng cách này, hệ thống có thể định tuyến lại các robot trước để tránh tắc nghẽn.

Nguồn ảnh: Pixabay/CC0 Public Domain

Hệ thống lai này sử dụng học tăng cường sâu, một phương pháp trí tuệ nhân tạo mạnh mẽ để giải quyết các vấn đề phức tạp, nhằm xác định robot nào cần được ưu tiên. Sau đó, một thuật toán lập kế hoạch nhanh chóng và đáng tin cậy sẽ cung cấp hướng dẫn cho các robot, cho phép chúng phản ứng nhanh chóng trong điều kiện thay đổi liên tục.

Trong các mô phỏng dựa trên bố cục kho hàng thương mại điện tử thực tế, phương pháp mới này đã đạt được hiệu suất cao hơn khoảng 25% so với các phương pháp khác. Quan trọng hơn, hệ thống có thể nhanh chóng thích ứng với môi trường mới với số lượng robot khác nhau hoặc bố cục kho hàng đa dạng.

"Trong lĩnh vực sản xuất và hậu cần, có rất nhiều vấn đề về ra quyết định mà các công ty dựa vào các thuật toán do chuyên gia con người thiết kế. Nhưng chúng tôi đã chứng minh rằng, với sức mạnh của học tăng cường sâu, chúng ta có thể đạt được hiệu suất vượt trội so với con người. Đây là một phương pháp rất hứa hẹn, bởi vì trong các kho hàng khổng lồ này, ngay cả việc tăng năng suất 2% hoặc 3% cũng có thể tạo ra tác động rất lớn", Han Zheng, nghiên cứu sinh tại Phòng thí nghiệm Hệ thống Thông tin và Quyết định (LIDS) thuộc MIT và là tác giả chính của bài báo về phương pháp mới này, cho biết.

Zheng hợp tác cùng Yining Ma, nghiên cứu sinh sau tiến sĩ tại LIDS; Brandon Araki và Jingkai Chen của Symbotic; và tác giả chính Cathy Wu, Phó Giáo sư Phát triển Sự nghiệp Khóa 1954 thuộc Khoa Kỹ thuật Xây dựng và Môi trường (CEE) và Viện Dữ liệu, Hệ thống và Xã hội (IDSS) tại MIT, đồng thời là thành viên của LIDS. Nghiên cứu được công bố trên Tạp chí Nghiên cứu Trí tuệ Nhân tạo (Journal of Artificial Intelligence Research ).

Robot định tuyến lại

Điều phối đồng thời hàng trăm robot trong một kho hàng thương mại điện tử không phải là nhiệm vụ dễ dàng. Vấn đề càng phức tạp hơn vì kho hàng là một môi trường năng động, và các robot liên tục nhận nhiệm vụ mới sau khi hoàn thành mục tiêu của mình. Chúng cần được điều hướng nhanh chóng khi rời khỏi và đi vào khu vực kho.

Các công ty thường sử dụng thuật toán do chuyên gia con người viết ra để xác định vị trí và thời điểm robot nên di chuyển nhằm tối đa hóa số lượng kiện hàng mà chúng có thể xử lý.

Nhưng nếu xảy ra tắc nghẽn hoặc va chạm, một công ty có thể không còn lựa chọn nào khác ngoài việc đóng cửa toàn bộ kho hàng trong nhiều giờ để giải quyết vấn đề bằng tay.

"Trong bối cảnh này, chúng ta không thể dự đoán chính xác tương lai. Chúng ta chỉ biết tương lai có thể sẽ như thế nào, xét về các kiện hàng sẽ đến hoặc việc phân phối các đơn đặt hàng trong tương lai. Hệ thống lập kế hoạch cần phải thích ứng với những thay đổi này khi hoạt động kho hàng diễn ra", Zheng nói.

Các nhà nghiên cứu tại MIT đã đạt được khả năng thích ứng này bằng cách sử dụng học máy. Họ bắt đầu bằng cách thiết kế một mô hình mạng nơ-ron để quan sát môi trường nhà kho và quyết định thứ tự ưu tiên cho các robot. Họ huấn luyện mô hình này bằng học tăng cường sâu, một phương pháp thử và sai trong đó mô hình học cách điều khiển robot trong các mô phỏng bắt chước các nhà kho thực tế. Mô hình được thưởng khi đưa ra các quyết định giúp tăng năng suất tổng thể đồng thời tránh xung đột.

Theo thời gian, mạng nơ-ron sẽ học cách phối hợp nhiều robot một cách hiệu quả.

"Bằng cách tương tác với các mô phỏng lấy cảm hứng từ bố cục nhà kho thực tế, hệ thống của chúng tôi nhận được phản hồi mà chúng tôi sử dụng để đưa ra quyết định thông minh hơn. Mạng nơ-ron đã được huấn luyện sau đó có thể thích ứng với các nhà kho có bố cục khác nhau," Zheng giải thích.

Mô hình được thiết kế để nắm bắt các ràng buộc và trở ngại dài hạn trên đường đi của mỗi robot, đồng thời xem xét cả sự tương tác động giữa các robot khi chúng di chuyển trong kho. Bằng cách dự đoán các tương tác hiện tại và tương lai của robot, mô hình lập kế hoạch để tránh tắc nghẽn trước khi nó xảy ra.

Sau khi mạng nơ-ron quyết định robot nào nên được ưu tiên, hệ thống sẽ sử dụng thuật toán lập kế hoạch đã được kiểm chứng để hướng dẫn từng robot di chuyển từ điểm này đến điểm khác. Thuật toán hiệu quả này giúp các robot phản ứng nhanh chóng trong môi trường nhà kho luôn thay đổi.

Sự kết hợp các phương pháp này là chìa khóa.

" Cách tiếp cận kết hợp này dựa trên công trình nghiên cứu của nhóm tôi về cách đạt được những ưu điểm tốt nhất của cả học máy và các phương pháp tối ưu hóa cổ điển. Các phương pháp học máy thuần túy vẫn gặp khó khăn trong việc giải quyết các bài toán tối ưu hóa phức tạp, trong khi đó việc thiết kế các phương pháp hiệu quả lại tốn rất nhiều thời gian và công sức của các chuyên gia. Nhưng khi kết hợp cả hai, việc sử dụng các phương pháp do chuyên gia thiết kế một cách đúng đắn có thể đơn giản hóa đáng kể nhiệm vụ học máy," Wu cho biết.

Vượt qua sự phức tạp

Sau khi huấn luyện mạng nơ-ron, các nhà nghiên cứu đã thử nghiệm hệ thống trong các nhà kho mô phỏng khác với những nhà kho mà mạng đã được sử dụng trong quá trình huấn luyện. Vì các mô phỏng công nghiệp quá kém hiệu quả đối với vấn đề phức tạp này, các nhà nghiên cứu đã thiết kế môi trường riêng của họ để mô phỏng những gì xảy ra trong các nhà kho thực tế.

Trung bình, phương pháp kết hợp dựa trên học máy của họ đạt được hiệu suất cao hơn 25% so với các thuật toán truyền thống cũng như phương pháp tìm kiếm ngẫu nhiên, xét về số lượng gói hàng được giao trên mỗi robot. Phương pháp này cũng có thể tạo ra các kế hoạch đường đi khả thi cho robot, khắc phục được tình trạng tắc nghẽn do các phương pháp truyền thống gây ra.

"Đặc biệt khi mật độ robot trong kho tăng lên, độ phức tạp tăng theo cấp số nhân, và các phương pháp truyền thống nhanh chóng bắt đầu gặp trục trặc. Trong những môi trường này, phương pháp của chúng tôi hiệu quả hơn nhiều," Zheng nói.

Mặc dù hệ thống của họ vẫn còn khá xa so với việc triển khai thực tế, nhưng những cuộc trình diễn này đã làm nổi bật tính khả thi và lợi ích của việc sử dụng phương pháp hướng dẫn bằng máy học trong tự động hóa kho hàng.

Trong tương lai, các nhà nghiên cứu muốn đưa việc phân công nhiệm vụ vào quá trình xác định bài toán, vì việc xác định robot nào sẽ hoàn thành nhiệm vụ nào sẽ ảnh hưởng đến tình trạng tắc nghẽn. Họ cũng có kế hoạch mở rộng hệ thống của mình lên các kho hàng lớn hơn với hàng nghìn robot.

https://techxplore.com/news/2026-03-ai-warehouse-robot-traffic-boosting.html (ctngoc)

Bản quyền @ 2017 thuộc về Sở Khoa học và Công nghệ thành phố Cần Thơ
Địa chỉ: Số 02, Lý Thường kiệt, phường Ninh Kiều, thành phố Cần Thơ
Điện thoại: 0292.3820674, Fax: 0292.3821471; Email: sokhcn@cantho.gov.vn
Trưởng Ban biên tập: Ông Trần Đông Phương An - Phó Giám đốc Sở Khoa học và Công nghệ thành phố Cần Thơ