Nữ chuyên gia trong lĩnh vực Nhận dạng và công nghệ tri thức ở Việt Nam
Hơn 30 năm hoạt động nghiên cứu khoa học, PGS.TS Lương Chi Mai – nguyên Phó Viện trưởng Viện Công nghệ thông tin (Viện Hàn lâm khoa học và công nghệ Việt Nam) đã có không ít đóng góp, nhất là lĩnh vực Nhận dạng và công nghệ tri thức (ND và CNTT) ở Việt Nam. Cũng chính vì vậy, chị đã vinh dự được nhận Giải thưởng Kovalevskaya và các giải thưởng cao quý khác.
Đồng
nghiệp Viện HLKH và CNVN chúc mừng PGS. Lương Chi Mai (đứng giữa) nhận Giải
thưởng Kovalevskaya.
Đến năm 2014 này, PGS.TS Lương Chi
Mai, Chủ tịch Hội đồng khoa học Viện công nghệ thông tin (CNTT) đã có khoảng 50
công trình khoa học được công bố trong và ngoài nước, trong đó có hơn 20 công
trình được đăng tải trên các tạp chí chuyên ngành quốc tế có uy tín, ấy là chưa
kể chị còn xuất bản ba đầu sách là những tài liệu tham khảo có giá trị cho đối
tượng là sinh viên đại học và học viên cao học trong lĩnh vực CNTT.
Vốn được đào tạo từ ngành toán ứng
dụng tại trường Đại học Tổng hợp Kishinev (Liên Xô cũ), đầu những năm 80 của
thế kỷ trước, Lương Chi Mai về làm việc tại Viện tính toán và điều khiển (sau
này là Viện CNTT) thuộc Viện Hàn lâm khoa học và công nghệ Việt Nam (VAST). Chị
chia sẻ: “Ngần ấy năm gắn bó với chuyên ngành ND và CNTT, tôi tập trung nghiên cứu
các vấn đề như cách tiếp cận phân loại dữ liệu không gian và nhận dạng ảnh;
nhận dạng ký tự quang học phục vụ nhận dạng ký tự Việt; nhận dạng tiếng nói và
xử lý ngôn ngữ tự nhiên tiếng Việt”… Từ những kiến thức thu thập được trong đợt
thực tập sinh khi tuổi đời còn khá trẻ cách đây gần 30 năm tại CHDC Đức, trên
cơ sở ứng dụng ảnh viễn thám từ vệ tinh LANDSAT4 vùng đồng bằng Nam Bộ, PGS.
Lương Chi Mai tìm cách cải tiến làm tăng tốc độ các thuật toán nhận dạng ảnh
theo phương pháp Bayes dựa vào tính đồng nhất của các pixel trên cùng miền.
Cũng từ những kinh nghiệm trong thời
gian làm cộng tác viên tại Phòng thí nghiệm quốc tế về trí tuệ nhân tạo thuộc
Viện điều khiển học (Viện Hàn lâm khoa học Slovakia) cuối thập niên 80, chị đã
tiến hành song song hóa các thủ tục tính toán của một số thuật toán nhận dạng;
chẳng hạn như thuật toán phân loại Bayes và quy trình phân lớp K–means trong
môi trường tính toán song song kiểu SIMD.
Phát triển hướng nghiên cứu về các
dạng ảnh đường nét, tập trung vào các thuật toán biểu diễn cô đọng và chính xác
đường biên của vùng ảnh, PGS Lương Chi Mai và nhóm nghiên cứu đi sâu vào các
thuật toán véc-tơ hóa ảnh đường nét trên bản đồ; đồng thời phát triển phần mềm
Mapscan nhằm mục đích nhập bản đồ tự động thay cho việc dùng bộ số hóa thông thường.
Điều phấn khởi là phần mềm này đã được cơ quan thống kê Liên hợp quốc sử dụng
cho dự án “Phần mềm máy tính trợ giúp cho các hoạt động dân số INT92/P23” cùng
với hệ thống Popmap (hệ thống cơ sở dữ liệu về địa lý, dân số), phần mềm
Mapscan đã được ứng dụng cho hoạt động thống kê dân số ở hơn 100 quốc gia đang
phát triển.
Trong bối cảnh bước đầu phát triển
công nghệ thông tin vào giữa những năm 90 của thế kỷ trước, nhu cầu ứng dụng
các thành tựu của lĩnh vực này không ngừng tăng lên. Nắm bắt đòi hỏi của đời
sống xã hội, PGS. Lương Chi Mai cùng nhóm cộng sự đã thiết kế và phát triển
phần mềm nhận dạng chữ Việt in với tên gọi VnDOCR. Do chữ Việt có những đặc thù
như nhiều chữ cái hơn so với các ngôn ngữ khác, lại có năm dấu thanh tổ hợp với
các nguyên âm… bởi vậy, cần tìm ra công nghệ và giải pháp thích hợp. Với phương
pháp tiếp cận tổ hợp và chứng minh được hiệu quả trong chất lượng của phần mềm
của nhóm nghiên cứu do PGS. Mai chủ trì, lần đầu tiên ở Việt Nam việc máy
đọc được các văn bản chữ Việt in đã được triển khai ứng dụng. Phần mềm VnDOCR
không ngừng được hoàn thiện (hiện nay đã nâng lên VnDOCR 4.0) phục vụ hữu ích
cho hàng nghìn cơ quan, đơn vị ở 60 tỉnh, thành phố trong cả nước.
Theo một cán bộ Viện CNTT, đến nay đã
có khoảng 45 nghìn bản VnDOCR được thương mại hóa kèm theo các máy quét của
Hewlet Parkard tại Việt Nam.
Chẳng thế mà sản phẩm phần mềm VnDOCR đã vinh dự đoạt giải nhất Giải thưởng
VIFOTEC năm 1999, và giành Huy chương vàng phần mềm đạt doanh số cao năm 2000
và 2001, do Tạp chí thế giới vi tính bình chọn.
Song, gây được dấu ấn trong sự nghiệp
nghiên cứu khoa học của PGS. Lương Chi Mai, phải kể đến công trình “Nhận dạng
tiếng nói và xử lý ngôn ngữ tự nhiên tiếng Việt”, đây là một vấn đề mới, phức
tạp, và còn hiếm người nghiên cứu. Trên cơ sở việc phân tích đặc thù về mặt ngữ
âm, thanh điệu trong tiếng Việt, PGS. Lương Chi Mai vận dụng mô hình hóa thanh điệu
và ngữ điệu tiếng nói Fujisaki (Nhật Bản) vào mô hình hóa thanh điệu tiếng
Việt. Mặt khác, chị cũng áp dụng thành công phương pháp tổng hợp dựa trên mô
hình Markov ẩn (từ dữ liệu tham số), dễ dàng thay đổi đặc điểm giọng nói, đồng
thời tạo thuận lợi trong việc áp dụng cho các ngôn ngữ khác nhau.
Trên cương vị là thành viên Tổ chức
các nhà khoa học nữ của thế giới thứ ba (TWOWS), PGS. Mai có điều kiện tham gia
các đề tài, dự án nghiên cứu quốc tế. Chị là “thủ lĩnh” trong nhóm nghiên cứu
của Việt Nam
thực hiện dự án A-STAR (gồm tám nước châu Á) nghiên cứu, xây dựng các hệ thống
dịch tiếng nói sang tiếng nói thông qua mạng máy tính trong khu vực châu Á từ
những năm 2008 – 2009.
Dưới sự chủ trì của Viện nghiên cứu
thông tin và truyền thông Kyoto (Nhật Bản), PGS Mai cùng tập thể nghiên cứu
phòng ND và CNTT, Viện CNTT (VAST) hơn bốn năm qua vẫn tiếp tục kiên trì các
nghiên cứu về nhận dạng tiếng Việt liên tục, tổng hợp tiếng Việt, và dịch tự
động Anh – Việt, Việt – Anh, phục vụ cho hoạt động của ngành du lịch. Cũng từ
đây, hệ thống tiếng Việt được tích hợp vào hệ thống dịch tiếng nói sang tiếng nói
giữa các ngôn ngữ Anh, Trung Quốc, Hàn Quốc, Nhật Bản, Thái Lan, Indonesia,
Malaysia…
Với niềm say mê trong nghiên cứu (lại
được những người thân trong gia đình ủng hộ, tạo điều kiện), nỗ lực hoạt động
khoa học và công nghệ của PGS. Lương Chi Mai đã được đền đáp. Không ít phần
thưởng đã đến với chị, như Bằng khen của Thủ tướng Chính phủ, Giải thưởng Cán
bộ nữ xuất sắc trong lĩnh vực CNTT, Bằng khen của Tổng Liên đoàn lao động Việt
Nam… Và vinh dự lớn lao là năm 2010, chị được trao tặng Giải thưởng Kovalevskaya
vì những đóng góp khoa học xuất sắc trong lĩnh vực khoa học tự nhiên, đặc biệt
là về công nghệ nhận dạng chữ viết và tiếng nói.
Được hỏi, đâu là điều tâm đắc nhất
trong quãng đời nghiên cứu khoa học?, PGS. Lương Chi Mai tâm sự: “Hơn 30 năm
hoạt động nghiên cứu, tôi chỉ đam mê và kiên trì đi theo một mạch là Nhận dạng
chữ viết và tiếng nói của ngôn ngữ Việt. Điều phấn khởi là các nghiên cứu của
mình không bị “đắp chiếu” mà được đưa ra ứng dụng một cách thiết thực cho thực
tế cuộc sống”. Vâng, bởi thế, giờ đây tuy đã thôi cương vị Phó Viện trưởng Viện
CNTT (VAST) nhưng chị - nữ chuyên gia đi tiên phong trong lĩnh vực Nhận dạng và
CNTT ở Việt Nam vẫn đang tiếp tục chủ trì hoặc tham gia một số đề tài các cấp.
Chị cũng đang dồn sức phấn đấu trong năm 2014 này hoàn thành nghiệm thu đề tài
cấp Nhà nước “Nghiên cứu phát triển hệ thống dịch tiếng nói hai chiều Việt –
Anh, Anh – Việt có định hướng lĩnh vực”, và xuất bản cuốn sách “Các kỹ thuật
học máy và ứng dụng” phục vụ cho đối tượng học viên sau đại học ngành CNTT…