SỞ KHOA HỌC VÀ CÔNG NGHỆ THÀNH PHỐ CẦN THƠ

Khoa học, công nghệ và Đổi mới sáng tạo - Khơi dậy khát vọng kiến tạo tương lai

Dự án mở rộng công nghệ ngôn ngữ

[31/01/2023 16:45]

Chỉ một phần nhỏ trong số 7.000 đến 8.000 ngôn ngữ được sử dụng trên khắp thế giới được hưởng lợi từ các công nghệ ngôn ngữ hiện đại như chuyển giọng nói thành văn bản, phụ đề tự động, dịch tức thời và nhận dạng giọng nói. Các nhà nghiên cứu của Đại học Arnegie Mellon, Mỹ muốn mở rộng số lượng ngôn ngữ bằng công nghệ autom.

Nhóm nghiên cứu đơn giản hóa các yêu cầu dữ liệu mà ngôn ngữ cần để tạo mô hình nhận dạng giọng nói cho khoảng 2.000 ngôn ngữ không có âm thanh" tại Interspeech 2022 ở Hàn Quốc.

Hầu hết các mô hình nhận dạng giọng nói yêu cầu hai bộ dữ liệu: văn bản và âm thanh. Dữ liệu văn bản tồn tại cho hàng ngàn ngôn ngữ. Dữ liệu âm thanh thì không. Nhóm hy vọng sẽ loại bỏ nhu cầu về dữ liệu âm thanh bằng cách tập trung vào các yếu tố ngôn ngữ phổ biến trên nhiều ngôn ngữ.

Trước đây, các công nghệ nhận dạng giọng nói tập trung vào âm của ngôn ngữ. Những âm riêng biệt này giúp phân biệt từ này với từ khác -- như âm "d" phân biệt từ "dog" với "log" và "cog" là duy nhất đối với mỗi ngôn ngữ. Nhưng các ngôn ngữ cũng có điện thoại, mô tả âm thanh của một từ. Nhiều điện thoại có thể tương ứng với một âm. Vì vậy, mặc dù các ngôn ngữ riêng biệt có thể có các âm khác nhau, nhưng các điện thoại cơ bản của chúng có thể giống nhau.

Nhóm nghiên cứu đang phát triển một mô hình nhận dạng giọng nói không sử dụng các âm và thay vào đó dựa vào thông tin về cách điện thoại được chia sẻ giữa các ngôn ngữ, do đó giảm nỗ lực xây dựng các mô hình riêng biệt cho từng ngôn ngữ. Cụ thể, nghiên cứu ghép nối mô hình với một cây phát sinh loài -- một sơ đồ ánh xạ các mối quan hệ giữa các ngôn ngữ để trợ giúp cho các quy tắc phát âm. Thông qua mô hình và cấu trúc cây, nhóm có thể ước lượng mô hình giọng nói cho hàng nghìn ngôn ngữ mà không cần dữ liệu âm thanh.

Ở giai đoạn đầu, nghiên cứu đã cải thiện các công cụ ngôn ngữ hiện có ở mức khiêm tốn 5%, nhưng nhóm hy vọng nó sẽ là nguồn cảm hứng không chỉ cho công việc trong tương lai của họ mà còn cho các nhà nghiên cứu khác.

Đối với nhóm nghiên cứu, công việc có ý nghĩa nhiều hơn là cung cấp công nghệ ngôn ngữ cho tất cả mọi người. Đó là về bảo tồn văn hóa.

www.sciencedaily.com
Bản quyền @ 2017 thuộc về Sở Khoa học và Công nghệ thành phố Cần Thơ
Địa chỉ: Số 02, Lý Thường kiệt, phường Tân An, quận Ninh Kiều, thành phố Cần Thơ
Điện thoại: 0292.3820674, Fax: 0292.3821471; Email: sokhcn@cantho.gov.vn
Trưởng Ban biên tập: Ông Trần Đông Phương An - Phó Giám đốc Sở Khoa học và Công nghệ thành phố Cần Thơ