AI di động, không xâm lấn, đọc được suy nghĩ, biến suy nghĩ thành văn bản
Lần đầu tiên trên thế giới, các nhà nghiên cứu từ Trung tâm trí tuệ nhân tạo lấy con người làm trung tâm GrapheneX-UTS tại Đại học Công nghệ Sydney (UTS) đã phát triển một hệ thống di động, không xâm lấn, có thể giải mã những suy nghĩ thầm lặng và biến chúng thành văn bản.
Công nghệ này có thể hỗ trợ giao tiếp cho những người không thể nói do bệnh tật hoặc chấn thương, bao gồm cả đột quỵ hoặc liệt. Nó cũng có thể cho phép giao tiếp liền mạch giữa người và máy móc, chẳng hạn như hoạt động của cánh tay sinh học hoặc robot.
Nghiên cứu được báo cáo tại hội nghị NeurIPS thường niên giới thiệu nghiên cứu hàng đầu thế giới về trí tuệ nhân tạo và học máy, được tổ chức tại New Orleans.
Trong nghiên cứu, những người tham gia đọc thầm các đoạn văn bản trong khi đội một chiếc mũ ghi lại hoạt động điện não qua da đầu bằng cách sử dụng điện não đồ (EEG).
Sóng EEG được phân thành các đơn vị riêng biệt để nắm bắt các đặc điểm và kiểu mẫu cụ thể từ não người. Điều này được thực hiện bởi một mô hình AI có tên DeWave do các nhà nghiên cứu phát triển. DeWave dịch tín hiệu EEG thành từ và câu bằng cách học từ số lượng lớn dữ liệu EEG.
Công nghệ trước đây để dịch tín hiệu não sang ngôn ngữ cần phải phẫu thuật để cấy các điện cực vào não, hoặc quét bằng máy MRI, loại máy lớn, đắt tiền và khó sử dụng trong cuộc sống hàng ngày.
Các phương pháp này cũng gặp khó khăn trong việc chuyển đổi tín hiệu não thành các phân đoạn cấp độ từ mà không có sự hỗ trợ bổ sung như theo dõi bằng mắt, điều này hạn chế ứng dụng thực tế của các hệ thống này. Công nghệ mới có thể được sử dụng có hoặc không có tính năng theo dõi bằng mắt.
Nghiên cứu của UTS được thực hiện với 29 người tham gia. Điều này có nghĩa là nó có khả năng mạnh mẽ và dễ thích ứng hơn so với công nghệ giải mã trước đây chỉ được thử nghiệm trên một hoặc hai cá nhân, vì sóng EEG khác nhau giữa các cá nhân.
Điểm chính xác của bản dịch là khoảng 40% trên BLEU-1. Điểm BLEU là một số từ 0 đến 1 để đo lường mức độ tương tự của văn bản được dịch bằng máy với một tập hợp các bản dịch tham chiếu chất lượng cao. Các nhà nghiên cứu hy vọng sẽ thấy điều này được cải thiện đến mức có thể so sánh với các chương trình dịch ngôn ngữ hoặc nhận dạng giọng nói truyền thống, đạt gần 90%.