Nghiên cứu giải mã tín hiệu lời nói trong não thành văn bản
Facebook đang tài trợ việc nghiên cứu giải mã tín hiệu lời nói trong não thành văn bản nhằm cải thiện giao tiếp với bệnh nhân bị liệt. Bước đầu, phần mềm có thể xác định gần như ngay lập tức, chỉ bằng tín hiệu não, câu hỏi mà bệnh nhân đã nghe và câu trả lời họ đưa ra, với độ chính xác lần lượt là 76% và 61%.
Nghiên cứu ghi lại và chuyển thành văn bản những tín hiệu não được gửi đi để kích hoạt chuyển động của cơ quan môi, lưỡi, hàm và thanh quản.
Stephen Hawking, nhà vũ trụ học mắc ALS, mỗi khi muốn giao tiếp đã phải cử động cơ má để điều khiển con trỏ chọn lần lượt các chữ cái trên màn hình trước mặt để tạo thành các từ.
Quá trình miệt mài mà Hawking đã phải sử dụng có thể sẽ sớm trở nên lỗi thời. Với cách tiếp cận mới hoàn toàn, các bác sĩ đã tìm ra cách trích xuất lời nói của một người trực tiếp từ tín hiệu não của họ.
Đây là lần đầu tiên một nghiên cứu cho thấy ý định nói những từ cụ thể có thể được lượm lặt từ tín hiệu não và biến thành văn bản, quá trình này thậm chí có thể diễn ra với tốc độ đủ nhanh để theo kịp các cuộc trò chuyện tự nhiên.
Ở dạng hiện tại, phần mềm đọc não chỉ hoạt động đối với một kho các câu mà nó đã được đào tạo để đọc, nhưng các nhà khoa học tin rằng đây là bước đệm hướng tới một hệ thống mạnh hơn có thể giải mã theo thời gian thực những lời mà một người dự định nói.
Các bác sĩ tại Đại học California ở San Francisco đã thực hiện thử thách này với hy vọng tạo ra một sản phẩm cho phép những người bị liệt giao tiếp trôi chảy hơn so với việc sử dụng các thiết bị hiện có - nhận chuyển động mắt và co giật cơ để điều khiển bàn phím ảo.
"Cho đến nay không có hệ thống nói nhân tạo nào cho phép người dùng tương tác ở tốc độ của cuộc trò chuyện tự nhiên giữa con người", Edward Chang, một bác sĩ phẫu thuật thần kinh và là nhà nghiên cứu chính của nghiên cứu được công bố trên tạp chí Nature Communications nói.
Nghiên cứu, được tài trợ bởi Facebook, thực hiện trên ba bệnh nhân động kinh sắp phẫu thuật thần kinh. Trước khi các phẫu thuật của họ được tiến hành, cả ba được đặt một miếng điện cực trực tiếp lên não trong ít nhất một tuần để lập bản đồ nguồn gốc của các cơn động kinh của họ.
Trong thời gian nằm viện, các bệnh nhân, tất cả đều có thể nói chuyện bình thường, đã đồng ý tham gia vào nghiên cứu của Chang. Ông đã sử dụng các điện cực để ghi lại hoạt động của não trong khi mỗi bệnh nhân được hỏi 9 câu hỏi và được yêu cầu đọc danh sách 24 câu trả lời tiềm năng.
Với các bản ghi trong tay, Chang và nhóm của ông đã xây dựng các mô hình máy tính để khớp các mô hình hoạt động não cụ thể với các câu hỏi mà bệnh nhân nghe và câu trả lời họ nói. Sau khi được đào tạo, phần mềm có thể xác định gần như ngay lập tức, chỉ bằng tín hiệu não, câu hỏi mà bệnh nhân đã nghe và câu trả lời họ đưa ra, với độ chính xác lần lượt là 76% và 61%.
Đây là lần đầu tiên phương pháp này được sử dụng để xác định các từ và cụm từ được nói, ông David Moses, thành viên nhóm nghiên cứu, cho biết. "Chúng tôi đã đạt được điều này bằng cách sử dụng vốn từ rất hạn chế, nhưng trong các nghiên cứu trong tương lai, chúng tôi hy vọng sẽ tăng tính linh hoạt cũng như tính chính xác của những gì chúng tôi có thể dịch".
Mặc dù thô sơ, hệ thống cho phép bệnh nhân trả lời các câu hỏi về âm nhạc họ thích, họ cảm thấy thế nào, phòng của họ quá nóng hay lạnh, quá sáng hay tối và khi họ muốn được bác sĩ kiểm tra lại.
Đột phá này vẫn có những rào cản phía trước. Một thách thức là cải thiện phần mềm để có thể chuyển tín hiệu não thành lời nói đa dạng hơn một cách nhanh chóng. Điều này sẽ yêu cầu các thuật toán được đào tạo trên một lượng lớn ngôn ngữ nói và dữ liệu tín hiệu não tương ứng, loại dữ liệu có thể thay đổi tùy theo từng bệnh nhân.
Một mục tiêu khác là đọc "lời nói tưởng tượng", hoặc những câu được nói trong tâm trí. Hiện tại, hệ thống phát hiện các tín hiệu não được gửi để di chuyển môi, lưỡi, hàm và thanh quản - nói cách khác, bộ máy của lời nói. Nhưng đối với một số bệnh nhân, những tín hiệu này có thể không đủ, và sẽ cần các cách đọc phức tạp hơn trong não.
Trong khi nghiên cứu vẫn còn ở giai đoạn sơ khai, Winston Chiong, nhà thần kinh học tại UCSF, người không tham gia vào nghiên cứu, cho biết điều quan trọng là phải tranh luận về các vấn đề đạo đức mà các hệ thống có thể đặt ra trong tương lai. Chẳng hạn, có thể một những suy nghĩ riêng tư vô tình bị tiết lộ?
Chang nói rằng việc giải mã những gì ai đó đang cố nói đã là rất khó và việc trích xuất suy nghĩ bên trong của họ là gần như không thể. Thiết bị của anh chỉ đọc những tín hiệu để thúc đẩy các cơ liên quan đến hoạt động nói.
"Tôi không có hứng thú với việc phát triển một công nghệ để tìm hiểu mọi người đang nghĩ gì, ngay cả khi điều đó là có thể", anh nói. "Tuy nhiên, nếu ai đó muốn giao tiếp và đang không thể giao tiếp, tôi nghĩ chúng ta, các nhà khoa học và bác sĩ lâm sàng, có trách nhiệm khôi phục khả năng cơ bản nhất này của con người".
Bảo Ngọc