Ứng dụng giải thuật trí tuệ nhân tạo phân loại và dự báo sự phân bố lớp phủ thực vật sử dụng ảnh landsat – vùng nghiên cứu tại đới ven bờ của tỉnh Bà Rịa Vũng Tàu
Nghiên cứu do tác giả Lê Minh Ngọc - Trường Đại học Bách Khoa Thành phố Hồ Chí Minh, tác giả Nguyễn Hoàng Anh - Đại học Quốc Gia Thành phố Hồ Chí Minh thực hiện nhằm ứng dụng giải thuật trí tuệ nhân tạo phân loại và dự báo sự phân bố lớp phủ thực vật sử dụng ảnh landsat – vùng nghiên cứu tại đới ven bờ của tỉnh Bà Rịa Vũng Tàu.

Biểu đồ phần trăm diện tích lớp phủ giai đoạn 1988 – 2024
Một trong những kỹ thuật giám sát lớp phủ thực vật và sử dụng đất hiệu quả là công nghệ viễn thám. Các thuật toán và phương pháp học máy cũng được áp dụng vào phân tích dữ liệu vệ tinh để phục vụ mục đích theo dõi liên tục và tự động các diễn biến phân bố lớp phủ mặt đất. Từ đó, nhà quản lí có thể xác định các giải pháp quản lí, sử dụng hợp lý tài nguyên đất một cách bền vững.
Bà Rịa - Vũng Tàu (BRVT) là một tỉnh ven biển, trải qua quá trình công nghiệp hóa và sự gia tăng về dân số nên tỉnh có sự biến động về sử dụng đất nhanh chóng đặc biệt ở vùng đới bờ. Sự thay đổi một cách nhanh chóng và thiếu kiểm soát về lớp phủ thực vật có thể gây ra những hệ lụy tiêu cực, đặc biệt là những ảnh hưởng tiêu cực đến môi trường và tài nguyên. Việc cập nhật tự động và liên tục cùng với dự báo sự thay đổi lớp phủ thực vật là tiền đề quan trọng giúp tỉnh BRVT xác định các giải pháp quy hoạch, quản lý sử dụng hợp lý tài nguyên, duy trì hệ sinh thái song song với việc phát triển kinh tế - xã hội của tỉnh.
Nghiên cứu ứng dụng các kỹ thuật công nghệ tiên tiến trong theo dõi sự thay đổi sử dụng đất sử dụng tư liệu viễn thám đã và đang phát triển mạnh mẽ trên Thế giới và ở Việt Nam. Một số nghiên cứu điển hình như ứng dụng viễn thám đánh giá diễn biến sử dụng đất (Tieng et al., 2019) sử dụng giải thuật phân loại rừng ngẫu nhiên (Random Forest - RF) để lập bản đồ độ che phủ rừng ngập mặn cho toàn bộ Campuchia với độ chính xác lên đến hơn 95%. RF là một giải thuật của trí tuệ nhân tạo và đã được áp dụng rộng rãi trong các nghiên cứu phân tích dữ liệu và giải đoán thông tin từ dữ liệu. Trong lĩnh vực viễn thám, RF đã được áp dụng trong nhiều nghiên cứu và cho thấy tính hiệu quả cao trong phân loại ảnh viễn thám thể hiện qua mức độ chính xác có thể lên đến 99% như nghiên cứu về rừng ngập mặn ở khu vực Quần đảo Andaman (Kolli et al., 2022). Tại Việt Nam, nghiên cứu của Nguyen and Doan (2018) đã sử dụng phương pháp Random Forest để xây dựng bản đồ thảm phủ/sử dụng đất (LULC) khu vực tỉnh Đắk Lắk dựa vào ảnh vệ tinh đa phổ Landsat 8. Kết quả phân loại đạt độ chính xác tổng thể là 90,36% với hệ số Kappa là 0,8873. Xét về khả năng phân loại, nghiên cứu của Tran et al. (2023) đã thực hiện so sánh và nhận xét rằng trong số ba phương pháp phân loại ảnh gồm rừng ngẫu nhiên (RF), hỗ trợ máy véc tơ (SVM) và gradient boosting (Gboost) thì RF là phương pháp cho độ chính xác cao nhất và phương pháp này được chọn để xây dựng bản đồ lớp phủ bề mặt của tỉnh Cà Mau. RF còn cho thấy khả năng phân loại chi tiết theo từng loài thực vật như trong nghiên cứu tại Cà Mau (Pham et al., 2019). Thực vật của rừng ngập mặn được phân loại theo từng loài với độ chính xác khá cao.
Thế mạnh của việc ứng dụng các giải thuật của trí tuệ nhân tạo không chỉ ở việc có thể trích xuất và giải đoán tự động các đối tượng trên bề mặt đất từ ảnh viễn thám, các giải thuật của AI còn được ứng dụng trong việc dự báo khuynh hướng phân bố trong tương lai của các đối tượng này trên cơ sở cung cấp thông tin đã biết trước từ dữ liệu. Điều này có thể được thực hiện bằng cách sử dụng chuỗi Markov và mạng nơ ron nhân tạo (Artificial Neural Network – ANN) để dự báo thay đổi sử dụng đất trong tương lai cho thành phố đến năm 2052 dựa trên kết quả sử dụng đất phân tích từ ảnh viễn thám của năm 2018 (Satya et al., 2020). Ngoài việc sử dụng Markov – ANN để mô phỏng, các nghiên cứu còn tích hợp thêm giải thuật CA (Cellular Automata) để cải thiện tính chính xác, cụ thể như mô hình dự báo biến động sử dụng đất (Lukas et al., 2023) có độ chính xác tổng thể là 86,53% khi dự báo sử dụng đất tại lưu vực thượng lưu sông Omo–Gibe, Ethiopia cho các năm 2037, 2052 và 2067. Một sự kết hợp khác là mô hình PLUS và mô hình CA trong nghiên cứu dự báo việc mở rộng đô thị ở khu vực đô thị Hàng Châu (Xu et al., 2022). Việt Nam cũng đã có các nghiên cứu dự báo lớp phủ mặt đất ứng dụng các thuật toán cải tiến. Chuỗi Markov - CA đã được ứng dụng để dự báo các đối tượng mặt đất trong tương lai, điển hình có nghiên cứu của Dao and Nguyen (2019) đã thực hiện dự báo xu hướng biến động lớp phủ trên địa bàn tỉnh Phú Thọ đến năm 2025. Ngoài ra, một nghiên cứu khác của Phan and Ngo (2021) tại thành phố Quy Nhơn hoặc bài nghiên cứu dự báo lớp phủ mặt đất huyện Vĩnh Cửu, tỉnh Đồng Nai về ứng dụng công nghệ GIS, viễn thám và mô hình phân cấp thứ bậc (AHP) kết hợp mô hình CA-ANN (Huynh et al., 2023) đã chứng minh việc tích hợp thêm ANN vào mô hình Markov – CA giúp bổ sung thêm phương pháp luận trong nghiên cứu về dự báo thay đổi lớp phủ sử dụng đất.
Ở nghiên cứu này, giải thuật RF được áp dụng để trích xuất tự động các đối tượng thực phủ một cách liên tục trong một chuỗi các năm từ 1988 đến 2024 và sau đó thực hiện áp dụng tích hợp mô hình Markov ẩn với mạng Bayes để dự báo khuynh hướng phân bố thực vật trong tương lai đến năm 2030. Mô hình Markov ẩn (HMM) là một thuật toán thống kê dùng để dự đoán thông tin theo thời gian. Phân tích Markov là một kỹ thuật ước tính xác suất các sự kiện xảy ra trong tương lai bằng việc phân tích xác suất đã biết trong hiện tại. Mô hình HMM được biểu diễn bởi mạng Bayes (BN) sẽ giúp thực thi việc tính toán. Một số tác giả đã áp dụng kết hợpHMM với mạng Bayes để phân loại và dự báo các đối tượng mặt đất, ví dụ, Salberg và Trier (Salberg & Trier, 2011) đã áp dụng HMM với hai trạng thái để mô hình hóa chuỗi thời gian của từng pixel, mỗi trạng thái trong mô hình tương ứng với loại “rừng” hoặc “không phải rừng”, và sau đó phát hiện thay đổi rừng từ các ước lượng trạng thái tiếp theo. Mithal et al. (2013) đã huấn luyện một HMM cho các chuỗi nhãn lớp phủ đất và sử dụng mô hình này để gán lại nhãn cho các pixel bị phân loại sai.
Đối tượng nghiên cứu của đề tài là các nhóm thực vật đặc trưng tại khu vực đới bờ tỉnh Bà Rịa – Vũng Tàu. Kết quả của nghiên cứu này giúp hỗ trợ về công cụ và phương pháp phù hợp phục vụ giám sát và quản lí lớp phủ và phân tích biến động lớp phủ, hỗ trợ ra quyết định trong việc lập kế hoạch cho các hoạt động phục hồi hệ sinh thái rừng.
Nghiên cứu này đã thực hiện phân loại tự động các lớp phủ thực vật khác nhau sử dụng ảnh viễn thám Landsat giai đoạn từ 1988 đến 2024 tại đới bờ tỉnh Bà Rịa – Vũng Tàu. Giải thuật Rừng ngẫu nhiên (Random Forest - RF) trên nền tảng Google Earth Engine (GEE) đã được áp dụng để phân loại các đối tượng thực phủ. Tiếp đến, mô hình Markov ẩn (Hidden Markov Model - HMM) và mạng Bayes (Bayesian network) được sử dụng để dự báo sự phân bố lớp phủ thực vật trong tương lai (đến 2030). Kết quả phân loại và dự báo lớp phủ thực vật với độ chính xác cao (trên 87%) đã cho thấy tính ưu việt của việc ứng dụng trí tuệ nhân tạo (AI) trong trích xuất tự động các đối tượng thực phủ, hỗ trợ công tác theo dõi và ra quyết định lập kế hoạch cho các hoạt động quản lí tài nguyên và hệ sinh thái.
Tạp chí Khoa học Đại học Cần Thơ Tập 61, Số 2A (2025) (nthang)