SỞ KHOA HỌC VÀ CÔNG NGHỆ THÀNH PHỐ CẦN THƠ

Khoa học, công nghệ và Đổi mới sáng tạo - Khơi dậy khát vọng kiến tạo tương lai

Ứng dụng phương pháp học máy - cây quyết định trong đánh giá biến động rừng ngập mặn khu vực xã Đất Mũi

[25/02/2022 22:41]

Nghiên tiến hành thử nghiệm một thuật toán của phương pháp học máy (Machine Learning) - cây quyết định trong phân loại các đối tượng sử dụng đất đặc biệt là rừng ngập mặn trên ảnh vệ tinh LANDSAT với khu vực thử nghiệm là xã Đất Mũi thuộc huyện Ngọc Hiển, tỉnh Cà Mau.

Từ trướ́c đế́n nay, để chiế́t tách các thông tin ảnh viễn thám, việc ứng dụng các thuậ̣t toán có kiểm định như K-Nearest Neighbors (KNN) đã trở nên phổ biến. K-Nearest Neighbors phương pháp để phân lớp các đối tượng dựa vào khoảng cách gần nhất giữa đối tượng cần xếp lớp (Query point) và tất cả các đối tượng trong các bộ mẫu (Training Data). Tuy nhiên phương pháp này còn có 3 hạn chế là độ phức tạp tính toán do việc sử dụng tất cả các mẫu để phân loại, hiệu suất hoàn toàn phụ thuộc vào bộ mẫu giải đoán và không đánh giá được mức độ quan trọng giữa các mẫu. Vậ̣y nên cần thiế́t phải xây dựng được một phương pháp phân loại mớ́i, khắc phục được những hạn chế́ trên của các phương pháp cũ.

Hiện nay, các nhà nghiên cứu đã và đang phát triển nhiều thuật toán mớ́i, phức tạp, mạnh mẽ và hiệu quả hơn. Một trong số đó là phương pháp học máy - cây quyết định. Phân loại cây quyế́t định như là phương pháp phân loại có giám sát khai thác dữ liệu không gian, phá vỡ các vấn đề và quy tắc phân loại trướ́c đây cũng như luôn tậ̣n dụng được kiế́n thức sinh thái và viễn thám có tính chắc chắn và kế́t quả luôn liên quan chặt chẽ vớ́i kinh nghiệm và kiế́n thức chuyên môn. Nó có được các quy tắc phân loại bằng quy trình nghiên cứu quyế́t định và không cần phải thỏa mãn phân phối chuẩn. Nó có thể sử dụng kiế́n thức về Trái Đất trong cơ sở dữ liệu GIS để giúp phân loại và cải thiện độ chính xác của việc phân loại Phương pháp nghiên cứu cây quyế́t định là một trong những phương pháp khai phá dữ liệu để tìm ra các bài toán phân loại trong ứng dụng thực tế́. Nó có thể phân loại các quy tắc của hình thức biểu thức cây quyế́t định. Ưu điểm tuyệt vời của cây quyế́t định là quá trình nghiên cứu không cần người dùng biế́t nhiều kiế́n thức nền tảng. Miễn là các ví dụ dữ liệu đầu vào có thể được thể hiện bằng “thuộc tính - kế́t quả” và sử dụng thuật toán này để học. Phân loại dữ liệu thu được bởi cây quyế́t định rất dễ thể hiện và áp dụng. Hiện nay, các học giả nướ́c ngoài đã sử dụng cây quyế́t định để thu thập kiế́n thức và áp dụng trong quá trình nghiên cứu và phân tích không gian.

Thuật toán này cho phép con người xác định chính xác các thông tin phân loại và thống kê dựa vào các tập dữ liệu khổng lồ. Trong phạm vi nghiên cứu này, nhóm nghiên cứu tiế́n hành thử nghiệm một thuậ̣t toán của phương pháp học máy (Machine Learning) - cây quyế́t định dùng ảnh vệ tinh Landsat có khả năng thành lậ̣p được các loại bản đồ biế́n động mục đích sử dụng đất tại từng thời điểm cụ thể; đảm bảo tính khách quan; tuy nhiên độ chính xác phụ thuộc vào nhiều yế́u tố như chất lượng dữ liệu; kỹ năng sử dụng phần mềm; chọn mẫu.

Khu vực nghiên cứu: Vườn quốc gia Mũi Cà Mau là một vườn quốc gia tại xã Đất Mũi, huyện Ngọc Hiển, tỉnh Cà Mau. Vị trí địa lý vườn quốc gia này có vị trí tại mũi đất cực Nam của lãnh thổ̉ Việt Nam. Tọa độ từ 8032’ đế́n 8049’ vĩ Bắc và từ 104040’ đế́n 104055’ kinh Đông. Tổng diện tích tự nhiên 41.862 ha, trong đó diện tích đất liền 15.262 ha. Diện tích phần ven biển 26.600 ha. Vùng đệm của Vườn quốc gia Mũi Cà Mau có tổng diện tích 8.194 ha, nằm trên địa bàn các xã: Đất Mũi, Viên An và Đất Mớ́i thuộc huyện Ngọc Hiển, tỉnh Cà Mau.

Kế́t quả nghiên cứu đã phân loại thành công được các lớp sử dụng đất cho khu vực vườn quốc gia Mũi Cà Mau và đều vớ́i độ chính xác cao, độ chính xác tổng đạt được tới 89%. Bài báo đã đưa ra kế́t quả sư thay đổi diện tích các loại rừng nói riêng và các loại đất sử dụng nói chung tại khu vực vườn Quốc gia Cà Mau. Cho thấy được tại khu vực nghiên cứu rừng được bảo tồn và trồng mới rất tốt trong giai đoạn 1995 - 2020 dưới tác động của biế́n đổ̉i khí hậu. Sử dụng phương pháp học máy - cây quyế́t định đã giúp cải thiện được kế́t quả phân loại khá tốt. Điều đó cho thấy, việc sử dụng ảnh viễn thám Landsat và công nghệ AI trong đánh giá biế́n động diện tích rừng mang lại kế́t quả đáng tin cậy.

Kết quả phân loại ảnh Landsat năm 1995 và 2020

Kế́t quả thực hiện của nghiên cứu đã đạt được 2 điểm mới đó là: Ứng dụng thành công phương pháp học máy - cây quyế́t định trong phân loại ảnh viễn thám và khả năng của phương pháp phân loại được chi tiế́t theo loài thực vật của rừng ngập mặn tại khu vực thực nghiệm. Nghiên cứu được thực hiện và đã đạt được những kế́t quả nhất định, tuy nhiên nhóm nghiên cứu có một số kiế́n nghị cần nghiên cứu tiế́p để có những kế́t quả có độ chính xác cao hơn. Đó là: 1) Sử dụng ảnh RADAR để có thể phản ảnh cấu trúc đứng của rừng ngập mặn; 2) Sử dụng các yế́u tố kiế́n trúc ảnh (image texture) và các chỉ số hình dạng (shape index) trong phân loại kiểu rừng; 3) Thiế́t kế́ các điểm khảo sát, OTC để xác định loài, cấu trúc rừng, trữ lượng rừng để phân loại, kiểm chứng từ ảnh vệ tinh.

Tạp chí Khoa học Biến Đổi Khí Hậu, số 20, 2021
Bản quyền @ 2017 thuộc về Sở Khoa học và Công nghệ thành phố Cần Thơ
Địa chỉ: Số 02, Lý Thường kiệt, phường Tân An, quận Ninh Kiều, thành phố Cần Thơ
Điện thoại: 0292.3820674, Fax: 0292.3821471; Email: sokhcn@cantho.gov.vn
Trưởng Ban biên tập: Ông Trần Đông Phương An - Phó Giám đốc Sở Khoa học và Công nghệ thành phố Cần Thơ