AI có thể giải mã chính xác lời nói từ hoạt động của não
Các nhà nghiên cứu đã phát hiện trí tuệ nhân tạo có thể giải mã các từ và câu từ hoạt động của não với độ chính xác đáng ngạc nhiên. Chỉ sử dụng dữ liệu hoạt động của não trong vài giây, AI có thể đoán những gì một người đã nghe.
AI có thể được sử dụng để giúp hàng nghìn người trên khắp thế giới không thể giao tiếp thông qua lời nói, đánh máy hoặc cử chỉ, bao gồm bệnh nhân có tình trạng ý thức thực vật.
Hầu hết các công nghệ hiện có giúp bệnh nhân giao tiếp đều yêu cầu phải phẫu thuật não, bệnh nhân gặp rất nhiều rủi ro trong việc cấy ghép điện cực. Các nhà khoa học cho biết, phương pháp mới này có thể giúp bệnh nhân bị khiếm khuyết về giao tiếp không cần sử dụng các phương pháp xâm lấn.
Các nhà khoa học đã đào tạo một công cụ máy tính để phát hiện các từ và câu trên 56.000 giờ ghi âm giọng nói từ 53 ngôn ngữ. Công cụ này, còn được gọi là mô hình ngôn ngữ, đã học cách nhận biết các đặc điểm cụ thể của ngôn ngữ ở cả cấp độ chi tiết. Ví dụ như chữ cái hoặc âm tiết và ở cấp độ rộng hơn, chẳng hạn như một từ hoặc câu.
Nhóm đã áp dụng AI với mô hình ngôn ngữ vào cơ sở dữ liệu từ hoạt động não của 169 tình nguyện viên. Trong các cơ sở dữ liệu này, những người tham gia đã nghe nhiều câu chuyện khác nhau trong khi não của những người này được quét bằng điện não. Kỹ thuật đo thành phần từ tính hoặc điện của tín hiệu não.
Với sự trợ giúp của phương pháp tính toán giúp giải thích sự khác biệt về thể chất giữa bộ não thực tế, nhóm nghiên cứu đã cố gắng giải mã những gì người tham gia đã nghe bằng cách sử dụng dữ liệu hoạt động não chỉ trong ba giây của mỗi người. Nhóm đã hướng dẫn AI căn chỉnh âm thanh lời nói từ bản ghi câu chuyện với các mô hình hoạt động của não mà AI tính toán tương ứng với những gì mọi người đang nghe. Sau đó, Al đưa ra dự đoán về những gì người đó có thể đã nghe trong thời gian ngắn đó, với hơn 1.000 khả năng.
Các nhà nghiên cứu nhận thấy, sử dụng phương pháp ghi điện não đồ, hay MEG, câu trả lời đúng nằm trong 10 dự đoán hàng đầu của AI, trong khoảng 73% thời gian. Với điện não đồ, giá trị đó giảm xuống không quá 30% thời gian.
Các nhà khoa học tại Đại học Michigan ở Ann Arbor, cho biết việc hiểu “giải mã” thực sự có ý nghĩa gì trong nghiên cứu này cũng rất quan trọng. Từ này thường được sử dụng để mô tả quá trình giải mã thông tin trực tiếp từ một nguồn. Trong trường hợp này là lời nói từ hoạt động của não. Nhưng AI có thể làm được điều này chỉ vì nó được cung cấp một danh sách hữu hạn các câu trả lời đúng có thể có để đưa ra dự đoán.