SỞ KHOA HỌC VÀ CÔNG NGHỆ THÀNH PHỐ CẦN THƠ

Đột phá phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia

Tương lai của Ngôn ngữ học tính toán (Computational Linguistics)

[21/04/2025 10:38]

Ngôn ngữ học tính toán (Computational Linguistics - NNHTT) được xác định là một lĩnh vực liên ngành, kết hợp giữa ngôn ngữ học, khoa học máy tính và các ngành liên quan như tâm lý học, logic học. Bài viết khám phá những lợi ích, thách thức và khuyến nghị phát triển NNHTT trong bối cảnh mới.

Mục tiêu trọng yếu của NNHTT là xây dựng các hệ thống có khả năng xử lý, phân tích và tạo sinh ngôn ngữ tự nhiên bằng máy tính. Trong bối cảnh chuyển đổi số mạnh mẽ hiện nay, NNHTT đóng vai trò ngày càng quan trọng trong việc nâng cao hiệu quả của cả nghiên cứu ngôn ngữ lẫn ứng dụng công nghệ trong giáo dục.

Theo phân tích của Eman M. Muslim (2007), một trong những ưu điểm nổi bật của NNHTT là khả năng xử lý ngôn ngữ với tốc độ nhanh và độ chính xác cao. Nhờ vào các mô hình ngôn ngữ, các hệ thống máy tính có thể phân tích cú pháp, gán nhãn ngữ nghĩa, chuyển đổi văn bản thành giọng nói (text-to-speech), hoặc thực hiện dịch tự động. Các tiến bộ trong lĩnh vực này đã thúc đẩy sự phát triển của nhiều ứng dụng như máy dịch, trợ lý ảo, và hệ thống tìm kiếm thông minh – những công cụ hiện đang được tích hợp rộng rãi trong đời sống học thuật và xã hội.

Trong lĩnh vực giáo dục ngôn ngữ, NNHTT được ứng dụng vào việc thiết kế các phần mềm học tập thông minh, các công cụ kiểm tra - đánh giá tự động và những nền tảng học ngoại ngữ dựa trên AI. Các hệ thống như vậy hỗ trợ cá nhân hóa trải nghiệm học tập, đồng thời giảm tải khối lượng công việc cho giáo viên thông qua tự động hóa các quy trình chấm điểm và phản hồi. Điều này đặc biệt có ý nghĩa trong các môi trường dạy học quy mô lớn hoặc dạy học từ xa.

Tuy nhiên, NNHTT cũng đối mặt với một số thách thức mang tính nền tảng. Việc phát triển các hệ thống ngôn ngữ đòi hỏi sự phối hợp chặt chẽ giữa các chuyên gia công nghệ và ngôn ngữ học, trong khi đó sự khác biệt về phương pháp luận và cách tiếp cận giữa hai lĩnh vực này vẫn còn khá lớn. Hơn nữa, những khía cạnh sâu hơn của ngôn ngữ – như ngữ dụng, ẩn dụ, hay hàm ý văn hóa – hiện vẫn là thách thức lớn đối với các hệ thống xử lý ngôn ngữ tự động. Các mô hình hiện nay chủ yếu xử lý ngôn ngữ theo hướng thống kê hoặc học sâu, tuy hiệu quả nhưng vẫn còn hạn chế trong việc nắm bắt toàn diện ngữ nghĩa theo cách con người hiểu.

Một vấn đề đáng lưu ý khác là sự thiếu hụt dữ liệu và tài nguyên ngôn ngữ cho nhiều ngôn ngữ không phổ biến, bao gồm cả tiếng Việt. Nguồn dữ liệu huấn luyện không đầy đủ hoặc không được chuẩn hóa có thể dẫn đến sai lệch trong phân tích, ảnh hưởng đến độ tin cậy của các hệ thống NNHTT. Điều này đặt ra yêu cầu cấp thiết về việc đầu tư phát triển kho ngữ liệu chất lượng cao cũng như xây dựng các mô hình ngôn ngữ mang tính bản địa.

Trên cơ sở đó, bài viết của Eman M. Muslim đưa ra những kiến nghị thiết thực nhằm thúc đẩy phát triển lĩnh vực này, đặc biệt là trong môi trường giáo dục. Việc thiết lập các chương trình đào tạo liên ngành, kết hợp giữa công nghệ thông tin và ngôn ngữ học được xem là giải pháp dài hạn để chuẩn bị đội ngũ nhân lực đáp ứng nhu cầu phát triển công nghệ ngôn ngữ. Đồng thời, các nghiên cứu ứng dụng NHTT trong giảng dạy cũng cần được mở rộng, hướng tới xây dựng các công cụ phù hợp với từng ngữ cảnh văn hóa – xã hội cụ thể.

Tổng thể, NNHTT không chỉ hữu ích trong xử lý ngôn ngữ tự nhiên, mà còn góp phần định hình lại phương thức tiếp cận ngôn ngữ trong giảng dạy, học tập và nghiên cứu. Việc phát triển lĩnh vực này một cách bài bản, có định hướng rõ ràng, sẽ đóng vai trò quan trọng trong chiến lược hiện đại hóa giáo dục và hội nhập khoa học - công nghệ toàn cầu

htquyen

Theo https://www.frontiersin.org/journals/artificial-intelligence/articles/10.3389/frai.2021.625341/full
Bản quyền @ 2017 thuộc về Sở Khoa học và Công nghệ thành phố Cần Thơ
Địa chỉ: Số 02, Lý Thường kiệt, phường Tân An, quận Ninh Kiều, thành phố Cần Thơ
Điện thoại: 0292.3820674, Fax: 0292.3821471; Email: sokhcn@cantho.gov.vn
Trưởng Ban biên tập: Ông Trần Đông Phương An - Phó Giám đốc Sở Khoa học và Công nghệ thành phố Cần Thơ