Sử dụng AI để dự báo chất lượng không khí
Tương tự như dự báo thời tiết, có những mô hình để dự đoán mức độ ô nhiễm không khí và chất lượng không khí. Trí tuệ nhân tạo (AI) đang được tận dụng để tăng tốc độ và cải thiện độ chính xác của các mô hình này.

Một lớp sương mù dày bao phủ đường chân trời Hà Nội khi mặt trời lặn vào ngày 27 tháng 9 năm 2019. Ảnh: GettyImage
Các đợt ô nhiễm không khí vào mùa đông năm ngoái đã khiến nhiều người suy nghĩ về chất lượng không khí và tự hỏi điều gì sẽ xảy ra trong những ngày tới. Khi chất lượng không khí suy giảm, các khí và hạt PM trong không khí có thể xâm nhập vào mũi, họng, phổi, và thậm chí đi vào máu, gây ra hen suyễn và làm nặng thêm các bệnh tim mạch, hô hấp. Theo báo cáo, số bệnh nhân đến khám các bệnh về hô hấp ở Bệnh viện Phổi Trung ương trong đợt ô nhiễm năm ngoái đã tăng 20%, trong khi ở Bệnh viện Bạch Mai cũng xảy ra tình trạng tương tự.
Ở hầu hết các đô thị lớn như Hà Nội và TP.HCM, người dân dễ dàng tra cứu chỉ số chất lượng không khí (AQI) hàng ngày trên các trang web công khai để biết khi nào không khí trở nên kém hoặc thậm chí nguy hại. Tuy nhiên, không ai biết liệu tình trạng này có kéo dài hay thay đổi trong những ngày tiếp theo.
Một nhóm các nhà nghiên cứu ở Trường Đại học Công nghệ (ĐHQGHN) do PGS.TS. Nguyễn Thị Nhật Thanh dẫn đầu đã sử dụng các mô hình trí tuệ nhân tạo (AI) để học mối liên hệ phi tuyến giữa mức độ ô nhiễm không khí trong lịch sử và các yếu tố khác nhau (như khí tượng, thời tiết, nguồn thải, phân bố dân cư, đất đai v.v), từ đó đưa ra dự báo về chất lượng không khí trong vòng 1-7 ngày tiếp theo. Đây là một trong những mô hình dự báo chất lượng không khí đầu tiên của Việt Nam.
Các cách dự đoán chất lượng không khí
Để dự đoán chất lượng không khí trong vài ngày tới, các nhà khoa học trên thế giới thường sử dụng một trong ba phương pháp chính: mô hình số trị, mô hình thống kê hoặc mô hình học máy/AI. Mỗi phương pháp tạo ra kết quả theo cách hoàn toàn khác nhau.
Mô hình số trị dựa trên các phương trình vật lý-hóa học để tính toán sự hình thành, lan truyền và biến đổi của các chất ô nhiễm trong không khí. Chúng sử dụng dữ liệu từ các bảng kê phát thải do các cơ quan địa phương báo cáo, liệt kê các chất ô nhiễm từ nguồn đã biết như đốt rơm rạ, giao thông, công nghiệp; cùng với dữ liệu khí tượng cung cấp thông tin về các yếu tố khí quyển như gió, mưa, nhiệt độ và bức xạ mặt trời.
Tuy nhiên, các mô phỏng của chúng liên quan đến nhiều biến số với độ không chắc chắn cao. Ví dụ, mây che chắn có thể thay đổi bức xạ mặt trời và do đó ảnh hưởng đến quá trình quang hóa, làm biến đổi các chất ô nhiễm như NOx, VOCs thành các chất ô nhiễm thứ cấp như Ozone. Điều này có thể làm cho kết quả trở nên kém chính xác hơn. Hơn nữa, mô hình số trị cũng đòi hỏi hiệu suất tính toán cao, do đó cần các máy tính mạnh và thời gian lâu hơn để ra kết quả. Trung bình, để dự đoán ô nhiễm không khí cho miền Bắc cho ba ngày liên tiếp, mô hình số trị cần phải chạy mất tới một ngày.
Trong khi đó, mô hình thống kê và mô hình học máy đều sử dụng dữ liệu để học mối quan hệ giữa mức độ ô nhiễm không khí và các yếu tố khác từ dữ liệu lịch sử. Mô hình thống kê sử dụng các hàm hồi quy đơn giản, hoặc các hàm phi tuyến và có thể lý giải được kết quả đưa ra, trong khi mô hình học máy hoàn toàn dựa vào cơ chế học của máy để tự xác định các quy luật ô nhiễm từ dữ liệu, sau đó áp dụng những kiến thức này vào điều kiện hiện tại để dự đoán tương lai.
Chính vì đặc điểm này mà mô hình thống kê sẽ bị hạn chế khi xử lý các chuỗi dữ liệu không đầy đủ hoặc các dữ liệu ngoại lai, dữ liệu phức tạp, đa chiều; trong khi mô hình học máy có thể xử lý dữ liệu lớn tốt hơn.

PGS.TS. Nguyễn Thị Nhật Thanh và mô hình dự báo chất lượng không khí GEOI cho phép nắm bắt thông tin ô nhiễm không khí trong vòng 1-7 ngày tiếp theo. Ảnh: Ngô Hà
Nhược điểm của các mô hình học máy là chúng không xem xét các cơ chế hóa học và vật lý, vì vậy kết quả của chúng thường khó giải thích hơn (blackbox) so với các mô hình khác. Tuy nhiên, bù lại, chúng có khả năng cải thiện theo thời gian khi được cung cấp nhiều dữ liệu chất lượng hơn. Một hạn chế khác là độ chính xác của các dự báo học máy có thể bị sai lệch trong các điều kiện khắc nghiệt, như đợt nắng nóng hay các đám cháy, nếu mô hình chưa được huấn luyện với dữ liệu tương ứng. Thêm vào đó, mô hình học máy yêu cầu dữ liệu chất lượng cao và hiệu suất tính toán mạnh mẽ hơn so với mô hình thống kê (nhưng vẫn thấp hơn so với mô hình số trị), do đó, thời gian chạy một mô hình dự báo học máy có thể kéo dài từ vài phút đến vài giờ.
Mô hình mà PGS.TS. Nguyễn Thị Nhật Thanh đang phát triển là một dạng mô hình học máy, sử dụng dữ liệu nguồn mở về Việt Nam từ các tổ chức quốc tế và thông tin từ hơn 130 trạm quan trắc trên cả nước. Nhờ vào nguồn dữ liệu phong phú này, mô hình có thể phản ánh mối liên hệ đặc thù giữa mức độ ô nhiễm không khí tại Việt Nam và các yếu tố khác, giúp nâng cao độ chính xác.
Hiện tại, hệ số tương quan giữa dự báo của mô hình và số liệu thực tế đạt từ 0.79 đến 0.83, có nghĩa là mô hình có thể đoán được khá chính xác sự thay đổi của ô nhiễm không khí. Kết quả này có tính cạnh tranh so với các mô hình dự báo ô nhiễm không khí tiên tiến trên thế giới như Mỹ, Hong Kong, Trung Quốc, dù điều kiện dữ liệu và thời gian đánh giá có sự khác biệt.
Cách nào tốt hơn?
Các nhà khoa học khẳng định rằng không có mô hình nào là chính xác tuyệt đối, mà nên có nhiều mô hình để đối chiếu kết quả với nhau. Ngay tại Trung tâm Dự báo Khí tượng Thủy văn Quốc gia, để đưa ra một dự báo thời tiết vào lúc 6h, họ phải chạy nhiều mô hình khác nhau, sau đó so sánh kết quả, và trong những trường hợp nghiêm trọng, cần phải thảo luận kỹ lưỡng. Ngành y tế cũng có cách làm tương tự, khi các bác sĩ hội chẩn xem xét kết quả từ nhiều phương pháp khác nhau rồi mới đưa ra quyết định cuối cùng.
Do đó, việc phát triển nhiều mô hình dự báo chất lượng không khí với các định hướng và cách tiếp cận khác nhau là điều cần thiết. Mỗi mô hình sẽ có ưu, nhược điểm riêng, và khi kết hợp lại, chúng sẽ giống như có nhiều nguồn thông tin để tham khảo.
“Chúng ta đã nói nhiều về ô nhiễm không khí, về nguồn thải, về các biện pháp giảm thiểu. Nhưng vấn đề nằm ở chỗ chúng ta không có đủ công cụ để hỗ trợ quá trình cải thiện này. Chẳng hạn như về dữ liệu, chúng ta vẫn đang dựa chủ yếu vào các trạm, nhưng số lượng trạm thì khá ít, phân bổ không đều, lúc có lúc không, nên không vẽ ra một bức tranh tổng quát. Do vậy, chúng ta cần các mô hình”. PGS.TS. Nguyễn Thị Nhật Thanh chia sẻ.
Mô hình dự báo bằng học máy của PGS.TS. Nguyễn Thị Nhật Thanh cung cấp những mảnh ghép đầu tiên về một bức tranh tổng quát về dự báo ô nhiễm không khí trên cả nước trong ngắn hạn. Trước đó, chị đã phát triển các bản đồ trực quan về thực trạng ô nhiễm không khí ở Việt Nam theo từng ngày từ năm 2012 - 2024.

Giao diện app dự báo ô nhiễm không khí cho Hà Nội trong vòng 7 ngày tiếp theo, tính từ ngày chụp 2/1/2025. Ảnh: geoi.com.vn
“Các công cụ trực quan như vậy hỗ trợ cho quản lý rất tốt”, PGS.TS. Nguyễn Thị Nhật Thanh chia sẻ. Vào giữa năm ngoái, theo đề nghị không chính thức từ cơ quan quản lý môi trường Hà Nội, nhóm của chị đã thử nghiệm một phiên bản ứng dụng riêng cho Hà Nội (https://geoi.com.vn/hanoiair#). Ứng dụng này giúp người dùng theo dõi tình hình, dự báo và đánh giá mức độ ô nhiễm không khí ở 30 quận, huyện khác nhau.
Ngoài ra, nhóm nghiên cứu cũng phát triển một website với các công cụ quản lý phức tạp hơn, giúp thành phố có thể cảnh báo sớm hoặc chuẩn bị đối phó với các tình huống ô nhiễm có thể xảy ra. Những phản hồi ban đầu cho thấy chúng giúp các cán bộ kỹ thuật tại cơ quan “nắm bắt tình hình nhanh hơn” và “đưa ra thông tin, giải pháp kịp thời và hiệu quả hơn.”
PGS.TS. Nguyễn Thị Nhật Thanh tiết lộ, chi phí để thiết lập và duy trì hệ thống dự báo chất lượng không khí của họ là khá thấp so với lợi ích mà người dân được hưởng (chưa tới 100 đồng/người/năm). Tuy nhiên, để hiện thực hóa điều này, cần phải có sự đặt hàng nghiêm túc của các cơ quan nhà nước.
“Đó không chỉ là cơ chế tài chính để duy trì hoạt động của các mô hình dự báo và đội ngũ chuyên gia phụ trách, mà còn là việc cho phép mô hình được kết nối vào các nguồn dữ liệu địa phương tin cậy hơn để nâng cao độ chính xác, đặc biệt là trong các sự kiện không thể đoán trước”, chị nhấn mạnh.
Bài đăng KH&PT số 1336 (số 12/2025)
Ngô Hà
https://khoahocphattrien.vn (nthang)