Giải pháp quy hoạch quản lý dữ liệu hỗ trợ nông nghiệp thông minh
Năng lực ra quyết định chính xác và kịp thời trong nông nghiệp ảnh hưởng trực tiếp đến mức độ thông minh của nền nông nghiệp. Đứng ở góc độ quản lý khoa học, có thể nhận thấy bài toán thu thập, quản lý, chia sẻ các nguồn dữ liệu cần thiết cho các nghiên cứu nông nghiệp đã trở nên bức thiết.
Bài viết tập trung vào việc đánh giá các nguyên nhân cốt lõi dẫn đến việc thiếu hụt nguồn dữ liệu nghiên cứu nông nghiệp ở Việt Nam, xét trên hai khía cạnh: (1) khả năng quản lý và chia sẻ các nguồn dữ liệu nghiên cứu, đặc biệt là dữ liệu công và (2) năng lực khai thác các nguồn dữ liệu mở của cộng đồng nghiên cứu. Dựa trên đó, bài viết đề xuất giải pháp tổng thể về quy hoạch dữ liệu dựa trên các nguyên lý FAIR (to be Findable, Accessible, Interoperable, Reusable).Cách thức tiếp cận là xây dựng một Quy hoạch Quản lý Dữ liệu (DMP – Data Management Plan) cho hai khối cơ quan chức năng: (1) Khối chính phủ (dịch vụ công) – là khối chịu ảnh hưởng trực tiếp bởi các văn bản quy phạm pháp luật trong lĩnh vực xây dựng nguồn dữ liệu mở; và (2) Khối nghiên cứu, học thuật (trung tâm nghiên cứu, viện, trường) – là khối mà cơ chế quản lý dữ liệu phần nhiều mang tính tự nguyện, nhưng lại rất năng động trong khả năng khai thác các nguồn dữ liệu mở và có năng lực cao vềphân tích dữ liệu.
Ra quyết định dựa trên phân tích dữ liệu là nhu cầu căn bản của quản trị thông minh. Một nền nông nghiệp thông minh nói chung phải đáp ứng hai tiêu chí quan trọng của xu hướng công nghệ, một là xu hướng Chuyển đổi số, và hai là xu hướng Cách mạng Công nghiệp lần thứ tư (4.0). Chuyển đổi số là xu hướng ra đời trước và đã phát triển mạnh mẽ ở các quốc gia phát triển, xu hướng này dẫn đến phát sinh một nguồn dữ liệu số khổng lồ trong quá trình xây dựng và phát triển. Trong khi đó, Cách mạng Công nghiệp 4.0 mới được định nghĩa từ năm 2013, hướng đến những giải pháp thông minh nhằm khai thác các nguồn dữ liệu khổng lồ mà Chuyển đổi số mang lại. Tại Việt Nam, hai xu hướng này đều khởi động chậm hơn thế giới và đang phát triển song hành. Nông nghiệp thông minh liên quan đến cả hai, trong đó nguồn dữ liệu số là điểm giao thoa, mà nếu không giải quyết tốt được bài toán quy hoạch quản lý dữ liệu sẽ không thể đưa ra được các quyết định chính xác và có cơ sở khoa học trong quản lý nông nghiệp. Hay nói cách khác, đó sẽ là nền nông nghiệp vẫn còn dựa trên cảm tính, rời rạc và thiếu tính dự báo. Khái niệm thông minh trong bài viết này dựa theo cách phân loại bao gồm ba loại hình (và cũng là ba cấp độ) khác nhau của các kỹ thuật phân tích dữ liệu (Data analytics, được trình bày trong James (2012)), bao gồm: Phân tích mô tả (Descriptive analytics), Phân tích dự báo (Predictive analytics) và Phân tích đề xuất (Prescriptive analytics).
Ba nhóm đối tượng quan trọng có thể tác động trực tiếp hoặc gián tiếp đến khả năng thông minh của nền nông nghiệp, bao gồm: (1) Nhóm chuyên gia tư vấn chính sách khối chính phủ, (2) Nhóm chuyên gia thuộc khối doanh nghiệp/hợp tác xã và (3) Các nhà khoa học và lực lượng nghiên cứu thuộc lĩnh vực nghiên cứu/giáo dục. Sở dĩ ba nhóm đối tượng này được đề cập trong nghiên cứu vì đây là các nhóm đối tượng có cách tiếp cận khoa học nhất với dữ liệu so với các nhóm còn lại khi đưa ra các quyết định liên quan đến quản trị nền nông nghiệp.
Sự phân mảnh, thiếu nhất quán và thiếu tính tương tác giữa các chủ sở hữu các nguồn dữ liệu là nguyên nhân chính dẫn đến các khó khăn về khả năng tiếp cận dữ liệu trong nghiên cứu. Các khó khăn này chủ yếu liên quan đến việc Việt Nam chưa hoàn toàn sẵn sàng tiếp cận với Khoa học mở (Open Science), cũng như chưa đánh giá đúng và vận dụng hiệu quả các chính sách chung của nhà nước và các tiêu chuẩn quốc tế. Lấy một số ví dụ để minh chứng cho các khó khăn mà cộng đồng nghiên cứu thường gặp. Chẳng hạn, phần lớn các dữ liệu cơ bản như bản đồ hành chính cấp tỉnh/huyện/xã của Việt Nam vẫn phải lấy về từ nguồn DIVA-GIS (Hijmans, 2016) (không phải dữ liệu chính thức của Việt Nam); dữ liệu về hệ thống sông ngòi, kênh rạch hiện chưa có đơn vị cung cấp chính thức; dữ liệu về hệ thống đập thủy lợi, đê điều càng khan hiếm hơn. Trong khi đó, phần lớn các dự án nghiên cứu lớn đều mang tính liên ngành, xuyên ngành và chịu ảnh hưởng của liên vùng, nên nhóm các dữ liệu không gian nêu trên đều rất cần thiết. Một ví dụ khác liên quan đến sự thiếu hụt dữ liệu về nguồn giống cây trồng cũng cần phải được nhanh chóng giải quyết. Chẳng hạn, có bao nhiêu giống lúa đang được canh tác tại Đồng bằng Sông Cửu Long, các thông số kỹ thuật về điều kiện canh tác và chất lượng nông phẩm ra sao, hoặc các khuyến cáo về chuẩn GAP (Schreinemachers et al., 2012), năng lực đảm bảo chất lượng của nông dân và hợp tác xã như thế nào, … Do vậy, mục tiêu đầu tiên của bài viết này là đưa ra các đánh giá sơ bộ về hiện trạng quản lý dữ liệu tại Việt Nam, sẽ được trình bày cụ thể ở Mục 4
nqhuy
Tạp chí Khoa học Trường Đại học Cần Thơ Tập 57, Số 6A (2021): 30-41