Chú chó robot tự học cách đi chỉ trong một tiếng đồng hồ
Các nhà nghiên cứu tại Viện Hệ thống Thông minh Max Planck (MPI-IS) ở Stuttgart đã chế tạo một robot bốn chân để tìm hiểu cách động vật học cách đi lại và học hỏi từ việc vấp ngã.
Nguồn ảnh: MPI-IS
Một con hươu cao cổ hoặc ngựa con mới sinh phải học cách đi bằng hai chân càng nhanh càng tốt để tránh những kẻ săn mồi.
Tuy nhiên, việc học để điều khiển phối hợp cơ và gân chân cần một thời gian. Ban đầu, động vật con chủ yếu dựa vào phản xạ bản năng của tủy sống, giúp con vật tránh bị ngã trong những lần tập đi đầu tiên. Sau đó, nó phải thực hành kiểm soát cơ bắp chính xác và nâng cao hơn, cho đến khi hệ thống thần kinh thích nghi tốt với cơ và gân chân của con vật non. Cuối cùng nó sẽ không còn bị vấp ngã mất kiểm soát nữa - con vật non giờ đây có thể theo kịp con trưởng thành.
Felix Ruppert, thành viên nhóm nghiên cứu Dynamic Locomotion tại MPI-IS, cho biết: "Với tư cách là kỹ sư và nhà chế tạo robot, chúng tôi đã tìm kiếm câu trả lời bằng cách chế tạo một robot có tính năng phản xạ giống như động vật và học hỏi từ những sai lầm."
Sau khi học cách đi bộ chỉ trong một giờ, robot của nhóm Ruppert đã sử dụng rất tốt cơ cấu chân phức tạp của nó. Một thuật toán tối ưu hóa - Bayes - hướng dẫn việc học: thông tin cảm biến chân đo được khớp với dữ liệu mục tiêu từ tủy sống ảo được mô hình hóa, tất cả chạy dưới dạng một chương trình trong máy tính của robot. Robot học cách đi bộ bằng cách liên tục so sánh thông tin cảm biến đã thực hiện và thông tin dự kiến, chạy các vòng lặp phản xạ và tự điều chỉnh cách điều khiển động cơ của nó.
Ngoài ra, các nhà nghiên cứu còn sử dụng thuật toán học điều chỉnh các tham số như Bộ tạo mẫu trung tâm (CPG). Ở động vật và người, CPG là mạng lưới các tế bào thần kinh trong tủy sống tạo ra các cơn co cơ theo chu kỳ mà không cần đầu vào từ não, tạo ra các tác vụ nhịp nhàng như đi bộ, chớp mắt hoặc tiêu hóa. Hơn nữa, phản xạ là các hành động kiểm soát vận động không tự nguyện được kích hoạt bởi các đường dẫn thần kinh được mã hóa cứng kết nối các cảm biến ở chân với tủy sống.
Miễn là con vật còn nhỏ đi trên một bề mặt hoàn toàn bằng phẳng, CPG có thể đủ để kiểm soát các tín hiệu chuyển động từ tủy sống. Ở động vật sơ sinh, CPG ban đầu chưa được điều chỉnh đủ tốt và con vật vấp ngã, cả trên địa hình bằng phẳng hoặc không bằng phẳng. Nhưng con vật sẽ nhanh chóng học cách kiểm soát cơ và gân chân.
Điều này cũng đúng với chú chó robot của nhóm nghiên cứu, có kích thước như một con Labrador, và tên là Morti. Thậm chí, robot này còn tối ưu hóa các kiểu chuyển động của nó nhanh hơn động vật, trong khoảng một giờ. CPG của Morti được mô phỏng trên một máy tính nhỏ và nhẹ. Tủy sống ảo này được đặt trên lưng của robot. Trong một giờ để robot đi lại trơn tru, dữ liệu cảm biến từ chân của robot liên tục được so sánh với thời gian chạm xuống dự kiến mà CPG của robot dự đoán. Nếu robot bị vấp ngã, thuật toán học tập sẽ thay đổi khoảng cách chân xoay tới lui, tốc độ xoay của chân và độ dài của chân trên mặt đất.
Chuyển động được điều chỉnh cũng ảnh hưởng đến cách robot có thể sử dụng cơ chế chân tuân thủ của nó. Trong quá trình học tập, CPG gửi các tín hiệu vận động đã điều chỉnh để robot từ đó ít vấp ngã hơn và tối ưu hóa bước đi của nó.
"Robot của chúng tôi được 'sinh ra' mà không hề biết gì về giải phẫu chân của chính nó hoặc cách chúng hoạt động", Ruppert giải thích.
"CPG giống như một trí thông minh tự động được tích hợp sẵn, bẩm sinh, và chúng tôi đã cho robot bộ phận này. Máy tính tạo ra tín hiệu điều khiển động cơ ở chân, và robot bắt đầu đi bộ và vấp ngã. Sau đó dữ liệu chảy ngược lại từ các cảm biến trên chân robot đến tủy sống ảo. Tại tủy sống ảo, dữ liệu cảm biến gửi về và dữ liệu CPG tạo ra được so sánh. Nếu dữ liệu cảm biến không khớp với dữ liệu mong đợi, thuật toán học tập sẽ thay đổi hành vi đi bộ cho đến khi robot đi lại tốt và không vấp ngã."
Nghiên cứu của nhóm được xuất bản ngày 18 tháng 7 năm 2022 trên tạp chí Nature Machine Intelligence.
Công Nhất