Sign In

Giải pháp xây dựng và cập nhật dữ liệu sử dụng đất sử dụng nền tảng Google Earth Engine (GEE)

00:00 18/10/2024

Chọn cỡ chữ A a  

Để nâng cao năng lực quản lý đất đai đặc biệt là quản lý sử dụng đất đúng theo quy hoạch, kế hoạch sử dụng đất thì việc xây dựng và cập nhật cơ sở dữ liệu sử dụng đất cần phải thực hiện với tần suất và tốc độ cao hơn trước. Trên quy mô cấp tỉnh ở tỷ lệ 1:50.000 và 1:100.000, một trong những giải pháp xây dựng và cập nhật dữ liệu sử dụng đất là sử dụng nền tảng Google Earth Engine (GEE)

Gần đây, Google Earth Engine (GEE) đã trở thành tâm điểm chú ý trong lĩnh vực xử lý dữ liệu lớn viễn thám. GEE là một nền tảng dựa trên đám mây cho phép xử lý song song dữ liệu không gian địa lý trên quy mô toàn cầu bằng cách sử dụng đám mây của Google (Gorelick và cộng sự, 2017). GEE là một nền tảng đám mây miễn phí và lưu trữ dữ liệu viễn thám ở quy mô petabyte trong hơn 40 năm, chẳng hạn như Landsat, MODIS, Máy đo bức xạ độ phân giải rất cao tiên tiến của Cơ quan Khí quyển và Hải dương học Quốc gia (NOAA AVHRR), Sentinel 1, 2, 3 và 5- P; và dữ liệu Vệ tinh quan sát mặt đất nâng cao (ALOS). (Gorelick và cộng sự, 2017). GEE cũng bao gồm các bộ dữ liệu về khí hậu-thời tiết và địa vật lý. Các sản phẩm sẵn sàng sử dụng bổ sung, chẳng hạn như Chỉ số thực vật tăng cường (EVI) và Chỉ số thực vật khác biệt chuẩn hóa (NDVI), cũng có sẵn (Kumar và Mutanga, 2018). Ngoài sự sẵn có của một kho lưu trữ lớn các hình ảnh thô được cảm nhận từ xa, người dùng còn có quyền truy cập vào các hình ảnh được xử lý trước, loại bỏ trên đám mây và được ghép trong danh mục dữ liệu GEE. 

Nền tảng GEE tận dụng cơ sở hạ tầng tính toán của Google để cho phép xử lý dữ liệu không gian địa lý song song nhằm giảm thời gian tính toán. Các API có môi trường phát triển đầy đủ tính năng dành cho JavaScript và Python được lưu trữ trên GitHub cũng hỗ trợ các yêu cầu tới máy chủ Earth Engine. Ngoài ra, nó còn cung cấp kho lưu trữ Git để lưu trữ, chia sẻ và tạo phiên bản tập lệnh cho mã của người dùng, giúp người dùng cộng tác nhiều hơn (Gorelick và cộng sự, 2017). Một tính năng khác của GEE là trình soạn thảo mã, có sẵn thông qua Môi trường phát triển tích hợp (IDE) dựa trên web và được thiết kế để viết, phát triển và chạy các tập lệnh phức tạp áp dụng API JavaScript (Kumar và Mutanga, 2018). Điều quan trọng là trình soạn thảo mã GEE chứa nhiều thuật toán khác nhau giúp đơn giản hóa việc viết tập lệnh cho cả chuyên gia và người không phải chuyên gia. Một số gói có sẵn, ví dụ như học máy, xử lý hình ảnh, thu thập hình ảnh, tính năng hình học, bộ giảm tốc, biểu đồ và các thuật toán chuyên dụng. 

GEE cũng cung cấp những cách khác để tương tác với người dùng. Explorer là một ứng dụng web đơn giản để khám phá danh mục dữ liệu, trực quan hóa và phân tích cơ bản cho phép người dùng chạy các phân tích đơn giản. Ngoài ra, timelapse là một công cụ video có khả năng thu phóng cho phép theo dõi, đo lường và hiển thị trực quan những thay đổi trên bề mặt Trái đất trong gần 40 năm qua (1984–2023). Người dùng cũng có thể xây dựng tập dữ liệu timelapse của riêng mình. Ứng dụng Earth Engine cung cấp quyền truy cập vào API giao diện người dùng phía máy khách để các nhà phát triển đam mê ứng dụng xây dựng và xuất bản ứng dụng của riêng họ. Các ứng dụng Earth Engine là giao diện người dùng năng động, dễ tiếp cận và có sẵn rộng rãi để các chuyên gia và người không phải chuyên gia phân tích GEE. Các ví dụ bao gồm LandTrendr (Kennedy và cộng sự, 2018), các ứng dụng phân mảnh, ghép dữ liệu, nghiên cứu dân số toàn cầu, biến đổi rừng toàn cầu (Hansen và cộng sự), liên kết tới bản đồ.

A diagram of a computer Description automatically generated

Hình 1: Các bước cơ bản phân tích dữ liệu sử dụng đất trên GEE.

1Độ chính xác theo phương pháp phân tích.

Trong nền tảng GEE, độ chính xác phân loại cho độ phân giải trung bình cho tất cả các phân loại đều lớn hơn 85%. Hình 2 minh họa rằng phương pháp cây quyết định đã đạt được độ chính xác tổng thể trung bình cao nhất. 

A chart of different sizes and colors Description automatically generated with medium confidence
Hình 2 : Độ chính xác của các phương pháp theo các nghiên cứu trên thế giới đã công bố

Trình phân loại cây (DT), tiếp theo là phương pháp Phân loại và hồi quy (CART). DT vượt trội hơn so với CART về sự thay đổi trong độ chính xác tổng thể, tuy nhiên DT được sử dụng ít thường xuyên hơn so với DT.

Phương pháp K-hàng xóm gần nhất (KNN) cho thấy sự thay đổi ít nhất về độ chính xác tổng thể so với các phân loại khác có phạm vi liên vùng (IQR) của KNN nhỏ hơn đáng kể so với các phương pháp khác. Bộ phân loại Máy Vector Hỗ trợ (SVM) và Naive Bayes cho thấy sức mạnh tương đối ngang nhau về độ chính xác tổng thể. Tuy nhiên, phương sai và IQR của Naive Bayes hẹp hơn so với SVM. Như được hiển thị, phương pháp phân loại Rừng ngẫu nhiên (RF) được chọn phổ biến nhất và thể hiện cả độ chính xác tổng thể tối thiểu và tối đa so với các phương pháp phân loại khác. Phạm vi độ chính xác tổng thể rộng này thu được bằng bộ phân loại RF cho thấy rằng các tham số khác, chẳng hạn như số lượng đặc điểm được trích xuất, cũng là những yếu tố ảnh hưởng đến hiệu suất phân loại. Độ chính xác tổng thể trung bình thu được bằng phương pháp khoảng cách tối thiểu (MD) là tầm thường mặc dù nó vượt trội so với độ chính xác của Mô hình hỗn hợp Gaussian (GMM) và các bộ phân loại Mạng thần kinh nhân tạo (ANN).

Từ quan điểm phạm vi, bộ phân loại GMM có phạm vi IQR rộng nhất. Nhìn chung, hiệu suất của bộ phân loại GMM không khác nhiều so với các loại mô hình khác. Đáng chú ý, độ chính xác tổng thể trung bình thấp nhất tương ứng với ANN, tuy nhiên 50% độ chính xác thu được khi sử dụng phương pháp này vẫn lớn hơn 87%.

2Độ chính xác theo loại dữ liệu và độ chính xác tổng thể. 

Để xác định ảnh hưởng của các loại dữ liệu khác nhau đến độ chính xác tổng thể, biểu đồ hộp của tham số này được trình bày trong Hình 3. Như đã thấy, độ chính xác tổng thể trung bình cho tất cả các loại dữ liệu là hơn 85%. Đa số các nghiên cứu sử dụng phép thuật quang học để chiết xuất thông tin. Mặc dù độ chính xác tổng thể trung bình của dữ liệu quang học là khoảng 88%, nhưng phạm vi giữa tối thiểu và tối đa có xu hướng từ 70% đến 99%. Sự phổ biến của việc sử dụng những dữ liệu này hoặc một loạt các ứng dụng đã làm cho kết quả kém ổn định hơn và độ chính xác của chúng phụ thuộc nhiều vào loại phân loại, vùng nghiên cứu và ứng dụng. Việc tích hợp dữ liệu quang học và radar trong nghiên cứu cho kết quả tốt hơn so với dữ liệu quang học có phạm vi IQR nhỏ hơn. Các nghiên cứu chỉ sử dụng dữ liệu radar, mang lại kết quả tốt nhất với mức trung bình khoảng 96% và phương sai nhỏ.

A diagram of a graph Description automatically generated
Hình 3: Sai số tổng thể của các loại dữ liệu

Như các phân tích ở trên về đặc điểm hiện trạng công tác xây dựng cơ sở dữ liệu sử dụng dất, phương pháp xử lý, phân tích ảnh viễn thám, đặc điểm, ưu nhược điểm của GEE, thì ta có thể thấy GEE là công cụ hữu ích cho xây dựng dữ liệu sử dụng đất vì một số lý do chính sau:

- GEE giúp giảm chi phí và thời gian do không phải đầu tư cơ sở hạ tầng, dịch vụ là miễn phí, dữ liệu phân tích đưa ra dạng dữ liệu GIS nên giảm bước chuyển đổi từ bản đồ sang dữ liệu. Trong trường hợp làm dữ liệu hiện trạng cấp tỉnh thì có thể sử dụng dữ liệu miễn phí ở tỉ lệ 1:100.000.

- GEE cung cấp công cụ thích ứng với nhiều điều kiện khác nhau nên phù hợp với đặc điểm không đồng nhất về vùng miền, khác biệt về địa hình, khí hậu, đặc điểm phân bố dân cư, văn hóa kinh tế xã hội của nước ta.

- GEE có sự hỗ trợ của cộng đồng người dùng là các nhà khoa học nhiều ngành nhiều lĩnh vực trên thế giới nên việc học hỏi kinh nghiệm và tăng cường năng lực viễn thám cũng như tìm giải pháp cho các bài toán sẽ được nhanh chóng và chính xác hơn.

Với công cụ GEE các loại hình sử dụng đất và khu vực mặt nước được xác định nhanh chóng dựa vào dữ liệu ảnh vệ tinh. Phương pháp này có thể áp dụng đối với các khu vực khác nhau, góp phần nâng cao chất lượng trong các nghiên cứu chuyên ngành.

Phòng Quản lý hoạt động viễn thám

Ý kiến

Vai trò của tư liệu viễn thám trong nghiên cứu khoa học địa chất

Trong những thập kỷ gần đây, sự phát triển của công nghệ viễn thám đã cung cấp một lượng lớn dữ liệu quan sát Trái Đất với độ chính xác cao về không gian, độ phân giải thời gian và quang phổ. Ưu điểm của việc thu thập nhanh thông tin không gian và quang phổ của các khu vực rộng lớn đã thúc đẩy việc sử dụng rộng rãi dữ liệu viễn thám trong nghiên cứu khoa học địa chất. Dữ liệu viễn thám có thể giúp phân biệt các đặc điểm mặt đất khác nhau bằng cách ghi lại phản ứng điện từ của bề mặt đối với bức xạ mặt trời.