SỞ KHOA HỌC VÀ CÔNG NGHỆ THÀNH PHỐ CẦN THƠ

Khoa học, công nghệ và Đổi mới sáng tạo - Khơi dậy khát vọng kiến tạo tương lai

Giải pháp quy hoạch quản lý dữ liệu hỗ trợ nông nghiệp thông minh

[24/02/2022 09:05]

Nghiên cứu do Trung tâm Công nghệ Phần mềm, Phòng Quản trị Thiết bị và Viện Nghiên cứu Biến đổi Khí hậu - Trường Đại học Cần Thơ thực hiện.

Ra quyết định dựa trên phân tích dữ liệu là nhu cầu căn bản của quản trị thông minh. Một nền nông nghiệp thông minh nói chung phải đáp ứng hai tiêu chí quan trọng của xu hướng công nghệ, một là xu hướng Chuyển đổi số, và hai là xu hướng Cách mạng Công nghiệp lần thứ tư (4.0). Chuyển đổi số là xu hướng ra đời trước và đã phát triển mạnh mẽ ở các quốc gia phát triển, xu hướng này dẫn đến phát sinh một nguồn dữ liệu số khổng lồ trong quá trình xây dựng và phát triển. Trong khi đó, Cách mạng Công nghiệp 4.0 mới được định nghĩa từ năm 2013, hướng đến những giải pháp thông minh nhằm khai thác các nguồn dữ liệu khổng lồ mà Chuyển đổi số mang lại. Tại Việt Nam, hai xu hướng này đều khởi động chậm hơn thế giới và đang phát triển song hành. Nông nghiệp thông minh liên quan đến cả hai, trong đó nguồn dữ liệu số là điểm giao thoa, mà nếu không giải quyết tốt được bài toán quy hoạch quản lý dữ liệu sẽ không thể đưa ra được các quyết định chính xác và có cơ sở khoa học trong quản lý nông nghiệp. Hay nói cách khác, đó sẽ là nền nông nghiệp vẫn còn dựa trên cảm tính, rời rạc và thiếu tính dự báo. Khái niệm thông minh trong bài viết này dựa theo cách phân loại bao gồm ba loại hình (và cũng là ba cấp độ) khác nhau của các kỹ thuật phân tích dữ liệu (Data analytics bao gồm: Phân tích mô tả (Descriptive analytics), Phân tích dự báo (Predictive analytics) và Phân tích đề xuất (Prescriptive analytics).

Ba nhóm đối tượng quan trọng có thể tác động trực tiếp hoặc gián tiếp đến khả năng thông minh của nền nông nghiệp, bao gồm: (1) Nhóm chuyên gia tư vấn chính sách khối chính phủ, (2) Nhóm chuyên gia thuộc khối doanh nghiệp/hợp tác xã và (3) Các nhà khoa học và lực lượng nghiên cứu thuộc lĩnh vực nghiên cứu/giáo dục. Sở dĩ ba nhóm đối tượng này được đề cập trong nghiên cứu vì đây là các nhóm đối tượng có cách tiếp cận khoa học nhất với dữ liệu so với các nhóm còn lại khi đưa ra các quyết định liên quan đến quản trị nền nông nghiệp.

Sự phân mảnh, thiếu nhất quán và thiếu tính tương tác giữa các chủ sở hữu các nguồn dữ liệu là nguyên nhân chính dẫn đến các khó khăn về khả năng tiếp cận dữ liệu trong nghiên cứu. Các khó khăn này chủ yếu liên quan đến việc Việt Nam chưa hoàn toàn sẵn sàng tiếp cận với Khoa học mở (Open Science), cũng như chưa đánh giá đúng và vận dụng hiệu quả các chính sách chung của nhà nước và các tiêu chuẩn quốc tế. Lấy một số ví dụ để minh chứng cho các khó khăn mà cộng đồng nghiên cứu thường gặp. Chẳng hạn, phần lớn các dữ liệu cơ bản như bản đồ hành chính cấp tỉnh/huyện/xã của Việt Nam vẫn phải lấy về từ nguồn DIVA-GIS (không phải dữ liệu chính thức của Việt Nam); dữ liệu về hệ thống sông ngòi, kênh rạch hiện chưa có đơn vị cung cấp chính thức; dữ liệu về hệ thống đập thủy lợi, đê điều càng khan hiếm hơn. Trong khi đó, phần lớn các dự án nghiên cứu lớn đều mang tính liên ngành, xuyên ngành và chịu ảnh hưởng của liên vùng, nên nhóm các dữ liệu không gian nêu trên đều rất cần thiết. Một ví dụ khác liên quan đến sự thiếu hụt dữ liệu về nguồn giống cây trồng cũng cần phải được nhanh chóng giải quyết. Chẳng hạn, có bao nhiêu giống lúa đang được canh tác tại Đồng bằng Sông Cửu Long, các thông số kỹ thuật về điều kiện canh tác và chất lượng nông phẩm ra sao, hoặc các khuyến cáo về chuẩn GAP, năng lực đảm bảo chất lượng của nông dân và hợp tác xã như thế nào, …

Bên cạnh đó, khái niệm chia sẻ dữ liệu đang được hiểu rất khác nhau của các bên liên quan. Trong đó có sự khác biệt khá xa về các nội dung quản lý: định dạng dữ liệu (hiểu theo nghĩa đơn giản là loại tập tin mà hệ thống cung cấp), nội dung dữ liệu (các thông tin cụ thể bên trong của tập dữ liệu, bao gồm cả nguồn gốc dữ liệu), chuẩn dữ liệu (các thông tin tuân thủ theo các tiêu chuẩn kỹ thuật chung), quyền truy cập dữ liệu, và đặc biệt, tính đồng nhất về yếu tố không gian và thời gian. Mỗi yếu tố nêu trên đều ảnh hưởng trực tiếp đến chất lượng dữ liệu, tham số đầu vào của mọi phương pháp phân tích thông minh. Chẳng hạn, nếu muốn so sánh chất lượng hai giống lúa, mà dữ liệu nhận được từ hai nguồn dữ liệu khác nhau, thì điều kiện cơ bản đầu tiên là các trường dữ liệu phải đồng nhất và tuân thủ theo một tiêu chuẩn về mô tả giống lúa đó, chẳng hạn về tên giống, mã giống, loại giống và vùng sản xuất, được mô tả theo một quy chuẩn nhất định nào đó, chẳng hạn theo Giấy phép 28/2016/TT-BNNPTNT về Ban hành Danh mục bổ sung giống cây trồng được phép sản xuất kinh doanh ở Việt Nam. Một đòi hỏi quan trọng khác là việc ban hành các quy chuẩn này cần thống nhất với các tiêu chuẩn quốc tế khác như Dublin Core hay DCAT. Một ví dụ khác mà các nghiên cứu về môi trường, quản lý đất đai hay gặp phải là định dạng dữ liệu không có khả năng tái sử dụng, các đơn vị quản lý dữ liệu quốc gia ở Việt Nam liên quan đến dữ liệu không gian thường cung cấp dữ liệu ở dạng “chỉ xem”, ví dụ dạng ảnh, mà không cung cấp dữ liệu thuộc tính như *.shp (của ESRI), *.kml, .gml hay GeoJSON. Trong khi đó, các trung tâm dữ liệu quốc tế thường quan tâm đến vấn đề này dựa trên các nguyên tắc bình đẳng về khả năng khai thác các nguồn dữ liệu, nhất là dữ liệu công. Các nguồn dữ liệu công có thể được hiểu là các nguồn dữ liệu được quy định phải chia sẻ theo các chính sách khác nhau (miễn phí, thương mại, bảo mật), hoặc các dữ liệu nghiên cứu nhận được tài trợ công, như các đề tài nghiên cứu khoa học cấp nhà nước và cấp tỉnh/thành.

Sự thiếu hụt dữ liệu không phải là vấn đề mới, mà là vấn đề lâu năm của các nhà khoa học, nhà kinh tế và nhà quản trị, nó trở thành yếu tố cản trở sự phát triển kinh tế cá nhân, kinh tế doanh nghiệp và kinh tế vùng. Rất nhiều đề nghiên cứu khoa học khó được triển khai hoặc được triển khai nhưng tính ứng dụng không cao vì lý do không có khả năng thu thập dữ liệu cần thiết. Tuy nhiên, để khắc phục vấn đề trên, không đơn thuần là nêu ra các yêu cầu và sử dụng các mệnh lệnh hành chính để giải quyết, nó đòi hỏi một kế hoạch hoàn chỉnh và sự phối hợp đồng bộ theo các nguyên lý mang tính khoa học và thực tiễn. Quy hoạch Quản lý Dữ liệu (DMP – Data Management Plan) là một tiếp cận phổ biến, tiếp cận này thường dựa trên các nguyên lý chung được đồng thuận trong cộng đồng, chẳng hạn nguyên lý FAIR (to be Findable, Accessible, Interoperable, Reusable). FAIR là nguyên lý được đề xuất bởi nhóm G20 từ năm 2016, đã được áp dụng và ngày càng chứng minh tính hữu hiệu trong cộng đồng nghiên cứu ở các quốc gia phát triển. Các hệ thống áp dụng nguyên lý FAIR chứng tỏ tính hiệu quả trong việc thu thập, chia sẻ, nối kết và phân tích dữ liệu, qua đó hỗ trợ thiết thực cho quá trình quản trị thông minh, cụ thể hơn là giúp cho các nhà khoa học (gián tiếp) và tư vấn chính sách (trực tiếp) để có thể đưa ra các quyết định dựa trên dữ liệu (data-driven decision).

Quy trình phân tích dữ liệu thông minh

Giải pháp Quy hoạch Quản lý Dữ liệu (DMP) hỗ trợ nông nghiệp thông minh

Đứng ở góc độ quản lý khoa học, có thể nhận thấy bài toán thu thập, quản lý, chia sẻ các nguồn dữ liệu cần thiết cho các nghiên cứu nông nghiệp đã trở nên bức thiết. Nghiên cứu tập trung vào việc đánh giá các nguyên nhân cốt lõi dẫn đến việc thiếu hụt nguồn dữ liệu nghiên cứu nông nghiệp ở Việt Nam, xét trên hai khía cạnh: (1) khả năng quản lý và chia sẻ các nguồn dữ liệu nghiên cứu, đặc biệt là dữ liệu công và (2) năng lực khai thác các nguồn dữ liệu mở của cộng đồng nghiên cứu. Dựa trên đó, nghiên cứu đề xuất giải pháp tổng thể về quy hoạch dữ liệu dựa trên các nguyên lý FAIR (to be Findable, Accessible, Interoperable, Reusable).Cách thức tiếp cận là xây dựng một Quy hoạch Quản lý Dữ liệu (DMP – Data Management Plan) cho hai khối cơ quan chức năng: (1) Khối chính phủ (dịch vụ công) – là khối chịu ảnh hưởng trực tiếp bởi các văn bản quy phạm pháp luật trong lĩnh vực xây dựng nguồn dữ liệu mở; và (2) Khối nghiên cứu, học thuật (trung tâm nghiên cứu, viện, trường) – là khối mà cơ chế quản lý dữ liệu phần nhiều mang tính tự nguyện, nhưng lại rất năng động trong khả năng khai thác các nguồn dữ liệu mở và có năng lực cao vềphân tích dữ liệu.

Tạp chí Khoa học Trường Đại học Cần Thơ - Tập 57, Số 6A (2021)
Xem thêm
Bản quyền @ 2017 thuộc về Sở Khoa học và Công nghệ thành phố Cần Thơ
Địa chỉ: Số 02, Lý Thường kiệt, phường Tân An, quận Ninh Kiều, thành phố Cần Thơ
Điện thoại: 0292.3820674, Fax: 0292.3821471; Email: sokhcn@cantho.gov.vn
Trưởng Ban biên tập: Ông Trần Đông Phương An - Phó Giám đốc Sở Khoa học và Công nghệ thành phố Cần Thơ
Lưu ý: Cổng thông tin Sở Khoa học và Công nghệ không chịu trách nhiệm với nội dung các đường link liên kết bên ngoài