1. Đặt vấn đề Ở Việt Nam hầu hết các loại khoáng sản phân bố không tập trung, rải rác phần lớn trên diện rộng, chủ yếu tại khu vực trung du, miền núi, nơi có địa hình hiểm trở, đi lại khó khăn, xa xôi nên cũng khó khăn trong việc quản lý. Công tác thanh tra, kiểm tra, giám sát hoạt động khai thác khoáng sản tốn kém tiền của, thời gian và sức lực của con người do vậy việc ứng dụng công nghệ hiện đại để hỗ trợ công tác quản lý khai thác khoáng sản là rất cần thiết.Ứng dụng công nghệ viễn thám đã trở thành phương tiện chủ đạo trong giám sát tài nguyên thiên nhiên, môi trường nói chung và theo dõi hoạt động khai thác khoáng sản (KTKS) nói riêng. Với ưu điểm là độ phủ trùm không gian, thời gian ảnh viễn thám cho phép ghi lại được các biến đổi trên mặt đất. Sử dụng các dải phổ khác nhau để ghi nhận chính xác các đối tượng là rất quan trọng trong việc nghiên cứu các hoạt động khai thác khoáng sản, thông qua các dấu hiệu của chúng trên bề mặt trái đất.Mục tiêu là sử dụng ảnh Sentinel đa thời gian để xác định hoạt động KTKS, đưa ra được phương pháp phân loại xác định dấu hiệu khai thác khoáng sản giúp theo dõi, qui hoạch khai thác bền vững và sử dụng có hiệu quả nguồn tài nguyên khoáng sản, đồng thời cũng là phương tiện để quản lý hữu hiệu các hoạt động khai thác khoáng sản bằng việc đưa ra thông tin về thời điểm, quá trình diễn biến về hoạt động khai thác khoáng sản trên bề mặt Trái đất theo các chuỗi ảnh viễn thám đa thời gian. Từ đó có cái nhìn tổng quan, chính xác trên đơn vị tỉnh về hoạt động khai thác khoáng sản.2. Khu vực thực hiện:Yên Bái là tỉnh miền núi phía Bắc, sâu trong nội địa, nằm giữa 2 vùng Đông Bắc và Tây Bắc. Phía Bắc giáp tỉnh Lào Cai, phía Nam giáp tỉnh Phú Thọ, phía Đông giáp 2 tỉnh Hà Giang, Tuyên Quang và phía Tây giáp tỉnh Sơn La, Lai Châu (Hình 1). Địa hình chia thành 2 vùng lớn: vùng cao và vùng thấp trong đó vùng cao có dân cư thưa thớt, có tiềm năng về đất đai, lâm sản, khoáng sản. Hình 1: Vị trí khu vực thực hiệnVới nguồn khoáng sản phong phú, tỉnh có điều kiện thuận lợi trong việc khai thác và chế biến khoáng sản. Tuy nhiên, tại nhiều nơi trong tỉnh xảy ra hiện tượng khai thác khoáng sản trái phép, như đào đãi đá quý ở khu vực xã Bảo Ái, huyện Yên Bình, và xã An Phú, Minh Tiến huyện Lục Yên. Tình trạng đào đãi vàng sa khoáng và khai thác cát sỏi trên sông Hồng (thuộc địa bàn huyện Văn Yên và một số suối nhỏ như trên địa bàn tỉnh) vẫn diễn biến phức tạp. Nạn khai thác đá cảnh tại thôn Suối Lóp, xã Suối Giàng, huyện Văn Chấn, tỉnh Yên Bái là một thực trạng nhức nhối khiến người dân địa phương bức xúc nhiều năm qua, nhưng đến nay vẫn không hề có dấu hiệu chấm dứt. Thậm chí, càng ngày, môi trường quanh những mỏ đá này càng bị xâm phạm, tàn phá nghiêm trọng hơn. Do vậy, cần thiết việc ứng dụng khoa học công nghệ trong theo dõi, quản lý, giám sát thường xuyên các hoạt động khai thác khoáng sản tránh làm thất thoát tài nguyên, tác động xấu đến cảnh quan, môi trường, …3. Dữ liệu và phương pháp nghiên cứu 3.1. Dữ liệu nghiên cứu - Tài liệu về cấp phép khai thác khoáng sản: gồm hồ sơ cấp phép hoạt động khai thác khoảng sản cấp tỉnh và hồ sơ cấp phép hoạt động khai thác khoáng sản cấp Bộ.- Ảnh Sentinel: Sentinel là tên của một loạt các vệ tinh quan sát trái đất thuộc Chương trình Copernicus của Cơ quan Không gian Châu Âu (ESA). Đây là bộ cơ sở dữ liệu ảnh rất lớn của Mỹ và Châu Âu gồm NASA, USGS và ESA đã được tích hợp toàn bộ vào hệ thống cơ sở dữ liệu của Google Earth Engine (GEE). Mỗi nguồn dữ liệu có sẵn trên GEE đều có ID và có thể tra cứu tại danh mục GEE qua trang web https://earthengine.google.com/datasets/. Bảng 1 mô tả dữ liệu Sentinel trong nghiên cứu này được truy xuất từ bộ sưu tập hình ảnh trong GEE từ 01 tháng 01 năm 2019 đến 30 tháng 12 năm 2020.Bảng 1: Dữ liệu ảnh dùng trong nghên cứu Ảnh vệ tinhIDĐộ phân giảiThời gian1Sentinel 2L1C_T48QUK_A02336710mTừ ngày 01 / 01/ 2019 đến 30 /12/20202Sentinel 2L1C_T48QVK_A02332410m3Sentinel 2L1C_T48QVJ_A02332410m3.2. Phương pháp nghiên cứu Hoạt động khai thác khoáng sản luôn luôn để lại tác động làm thay đổi cảnh quan môi trường xung quanh vị trí khai thác, thường là các thay đổi về lớp phủ bề mặt như: phủ thực vật, phủ nước mặt, phủ thổ nhưỡng. Bằng cách theo dõi và phân tích sự thay đổi phủ bề mặt, có thể phát hiện các dấu hiệu hoạt động khai thác khoáng sản.Phương pháp CCDC (Continuous Change Detection and Classification) đánh giá các thay đổi về giá trị của điểm ảnh trong một khoảng thời gian nhất định (thời kỳ) [2-4].. Trong một thời kỳ, sự biến động của giá trị điểm ảnh có thể phụ thuộc vào một trong các loại biến động sau:- Biến động theo mùa: giá trị của điểm ảnh thay đổi phản ánh sự biến động theo mùa, do các nguyên nhân nhiệt độ, ánh sáng và lượng mưa. Từ đó dẫn tới sự thay đổi lặp lại của phủ thực vật hoặc nước bề mặt có tính chu kỳ theo từng mùa.- Biến động dần đều (gradual): giá trị của điểm ảnh thay đổi phản ánh một xu hướng, ví dụ xu hướng tăng hoặc giảm phủ thực vật qua các thời kỳ.- Biến động đột ngột (abrupt): giá trị của điểm ảnh thay đổi phản ánh một thay đổi đột ngột do các nguyên nhân như chặt phá rừng, đô thị hóa. Các dấu hiệu khai thác khoáng sản sẽ gây ra các biến đổi đột ngột.Hình2: Các bước phân tích và xác định biến động phủ bề mặtThuật toán CCDC sẽ xác định cả ba loại biến động trên để nhằm mục đích chính là xác định được các biến động đột ngột. Như vậy hai loại biến động là biến động theo mùa và biến động dần đều đóng vai trò phụ trợ cho xác định các biến động đột ngột. Để ước lượng các biến động theo mùa và biến động dần đều, CCDC sử dụng mô hình hồi quy điều hòa (harmonic regression) và mô hình xu hướng (trend model). Từ đó những giá trị lệch đột ngột khỏi mô hình có thể được sử dụng để xác định các biến động đột ngột.Các bước phân tích và xác định biến động phủ bề mặt nhằm phát hiện các biến động đột ngột sử dụng thuật toán CCDC được khái quát hóa trong sơ đồ Hình 2. Các bước thực hiện được phân chia thành các công đoạn: (1) Xử lý dữ liệu đầu vào, (2) phát hiện biến động và (3) Phân loại vùng phủ và lớp biến động.4. Kết quả nghiên cứu và thảo luận 4.1. Xử lí dữ liệu đầu vào Công việc đầu tiên chính là chuẩn bị dữ liệu ảnh viễn thám. Ảnh viễn thám ở đây có thể là ảnh LandSat 8 hoặc Sentinel 2 phương pháp này có thể áp dụng với 2 loại ảnh đều cho kết quả như nhau, nhưng ảnh Sentinel có độ phân giải cao hơn ảnh Landsat. Do đó, trong bài báo này, dữ liệu ảnh Sentinel 2 được sử dụng để thực nghiệm.Khi tiến hành tải về dữ liệu ảnh viễn thám cần chú ý lựa chọn các tham số tải ảnh sao cho dữ liệu viễn thám tải về chứa đầy đủ thông tin của ảnh. Sau khi dữ liệu được tải về, việc tiếp theo là xử lí mây, bóng mây, hoặc tuyết phủ. Có nhiều phương pháp xử lí mây được trình bày trong các bài báo của chuyên nghành viễn thám, tuy nhiên thuật toán CCDC đề xuất sử dụng thuật toán Fmask, mô tả chi tiết cho thuật toán xử lí mây được trình bày trong bài báo của Zhu, Z, và Woodcock, C. E. (2014) [5]. Dữ liệu ảnh viễn thám sau khi được xử lí mây sẽ được sử dụng làm đầu vào cho mô hình hồi quy điều hòa trong công đoạn phát hiện biến động.4.2 Phương pháp lấy mẫuCác phủ bề mặt sẽ được chia thành 5 lớp cơ bản gồm: phủ nước (water), phủ thực vật (vegetation), phủ đô thị (built-up), phủ đất đai (soil) và lớp khai thác khoáng sản (mining). Sự biến động qua lại giữa các lớp được phát hiện với thuật toán CCDC và trực quan hóa thông qua kĩ thuật trực quan hóa chuỗi thời gian (time series visualization). Công tác phân loại được tiến hành trên nền tảng điện toán đám mây Google Earth Engine (GEE) nên phương pháp lấy mẫu được thực hiện theo phương pháp Stratified Equal Random Sampling (SRS(Eq)). Số điểm lấy mẫu chọn ở mỗi lớp bằng tổng số điểm lấy mẫu chia cho số lớp. Cụ thể, trong thực nghiệm tổng số điểm lấy mẫu là 100, thì số điểm lấy mẫu cho mỗi lớp trong số 5 lớp nêu trên sẽ là khoảng 20. 4.3 Mô hình hồi quy điều hoà và xác định hàm hồi quyDữ liệu được lưu trữ và xắp xếp vào cấu trúc dữ liệu chuỗi thời gian (time series data). Mô hình hồi quy điều hòa được sử dụng để tiến hành các phân tích chuỗi thời gian (time series analysis). Dữ liệu đầu vào CCD, là dữ liệu sau khi xử lí mây, sẽ được khớp (fitting) với mô hình hàm điều hòa có thành phần hình sin là bội số tần số của tần số cơ bản hàng năm. Một số hạng không đổi và tuyến tính đặc trưng cho độ phản xạ bề mặt hoặc giá trị bù nhiệt độ độ sáng và độ dốc tổng thể, tương ứng[6][7]. 4.4 Phát hiện biến động (CCD)Trong công đoạn này biến động giá trị điểm ảnh theo mùa hoặc biến động dần đều được xác định sử dụng mô hình điều hòa (harmonic model) và hàm hồi quy LASSO (Least Absolute Shrinkage and Selection Operator). Sự sai khác trong giá trị điểm ảnh trong mô hình dự đoán biến động và giá trị điểm ảnh thực được tính toán. Nếu sự sai khác này lớn gấp ba lần sai số bình phương nhỏ nhất (RMSE) thì điểm ảnh đó sẽ được đánh dấu là có khả năng xảy ra biến động đột ngột của lớp phủ. Biến động đột ngột của lớp phủ được đánh giá là biến động thực sự dựa trên việc thực hiện liên tiếp nhiều lần tính toán sự sai khác trong giá trị điểm ảnh. Nếu trong các lần thực hiện tính toán liên tiếp nhau tại một điểm ảnh, sự sai khác chỉ xảy ra một lần thì sự sai khác đó được coi như ngoại lệ thống kê (outliner). Nếu sự sai khác xuất hiện trong các lần thực hiện tính toán liên tiếp, điều đó chứng tỏ có khả năng rất cao tại điểm ảnh đó đã xảy ra biến động đột ngột phủ bề mặt (Hình 3). Hình 3. Diễn đạt sự sai khác về giá trị điểm ảnh trong một chu kìDữ liệu đầu ra của quá trình phát hiện biến động là dữ liệu raster chứa thông tin phân tích biến động và các tham số mô hình phát hiện biến động. Các điểm ảnh có dạng biến động tương tự nhau sẽ được đánh dấu màu sắc giống nhau trong dữ liệu raster phân tích thay đổi, từ đó xác định được khi nào và bao lâu một điểm ảnh được đánh dấu là có biến động phủ bề mặt. Dữ liệu raster phân tích thay đổi còn chứa các thông tin phổ cần thiết cho phân loại các loại phủ bề mặt. Cuối cùng và quan trọng nhất là dữ liệu raster phân tích thay đổi được sử dụng cùng với kết quả lấy mẫu để thực hiện bước tiếp theo phân loại phủ và lớp biến động.4.5 Huấn luyện học máyMột trong các thuật toán huấn luyện học máy hay dùng trong viễn thám để phận loại lớp phủ là Random Forest (RF). Phương pháp huấn luyện học máy này sử dụng học tập theo nhóm, là một kỹ thuật kết hợp nhiều ‘máy phân loại’ (classifier) để giải quyết các vấn đề phức tạp. RF chứa đựng nhiều cây ra quyết định (decision tree). Một rừng cây ra quyết định được sản sinh ra bởi thuật toán RF được huấn luyện thông qua kĩ thuật đóng bao (bagging). Trong lĩnh vực học máy, đóng bao là một thuật toán tổng hợp giúp cải thiện độ chính xác của các thuật toán học máy. Kĩ thuật đóng bao bao gồm việc sử dụng các mẫu dữ liệu khác nhau (dữ liệu huấn luyện) thay vì chỉ một mẫu dữ liệu. Tập dữ liệu huấn luyện bao gồm các quan sát và đặc trưng được sử dụng để đưa ra dự đoán. 4.6 Phân loại phủ và lớp biến độngCông đoạn cuối cùng trong thuật toán CCDC là phân loại các lớp phủ và lớp biến động cho tất cả các ảnh trong bộ dữ liệu đa chiều. Dữ liệu raster phân tích thay đổi kết hợp với thông tin phổ được đưa vào mô hình thông tin sẽ cho kết quả phân loại tốt hơn đối với dữ liệu raster chuỗi thời gian.Hình 4: Phân loại tự động ảnh Sentinel tại khu vực khai thác mỏ đá hoa Bản Nghè II, tỉnh Yên Bái theo 4 thời kỳ giám sát.Sau khi hoàn thành việc chuẩn bị dữ liệu huấn luyện, tiếp theo sẽ sử dụng bộ dữ liệu này để huấn luyện và tạo ra mô hình học máy, mô hình này cũng được gọi là công cụ phân loại (classifier) dựa trên thuật toán phân loại đã lựa chọn từ trước (Hình 4, 5). Hình 5. Phân loại tự động xác định dấu hiệu khai thác khoáng sản tỉnh Yên Bái theo ảnh Sentinel 2 chup ngày 201901010 đến 20201230Cuối cùng tiến hành phân loại các lớp phủ và lớp biến động sử dụng mô hình học máy. Tổng hợp thông tin, kết hợp với kết quả quá trình phân loại để cho ra bản đồ biến động (Hình 6).Hình 6: Khai thác mỏ đá hoa Bản nghè II chồng ghép 4 thời kỳKết quả của quá trình phân tích và phát hiện biến động khai thác khoáng sản bao gồm cả dạng vector (ví dụ: ranh giới khu vực xảy ra biến động) và cả dạng raster (ví dụ: ảnh đánh dấu vùng khai thác khoáng sản), được lưu trữ vào cơ sở dữ liệu không gian và được tổ chức thành các lớp thông tin. 4. Kết luận Ứng dụng công nghệ viễn thám là một phát triển mới về khoa học có tác dụng hữu hiệu hỗ trợ công tác thanh tra kiểm tra hoạt động khai thác khoáng sản trên diện rộng. Tần suất chụp ảnh thường xuyên hỗ trợ giám sát nhanh, tức thời về những biến động trên bề mặt trái đất;Khả năng chụp của các vệ tinh viễn thám ngày càng chính xác hơn, một vị trí trên bề mặt Trái đất có thể chụp lại sau vài ngày, như vậy mức độ theo dõi rất thường xuyên, liên tục mà con người không nhất thiết phải đến tận nơi. Kết quả phân tích từ ảnh viễn thám có tính trung thực, khách quan, độ phủ của ảnh rộng nên tầm bao quát lớn lại tiết kiệm thời gian trong quá trình quản lý tài nguyên thiên nhiên.Kết quả theo dõi, kiểm soát bằng công nghệ viễn thám là kênh thông tin nhanh chóng, khách quan, chính xác nhằm đưa ra các biện pháp giảm thiếu tối đa những hậu quả của việc khai thác khoáng sản bừa bãi, đưa ra biện pháp bảo vệ môi trường thiên nhiên và môi trường sống. Tài liệu tham khảo Trang thông tin điện tử tỉnh Yên Bái.Zhu, Zhe, and Curtis. E. Woodcock "Continuous change detection and classification of land cover using all available Landsat data" Remote Sensing of Environment 144 (2014) 152-171.Zhu, Zhe, Junxue Zhang, Zhiqiang Yang, Amal H. Aljaddani, Warren B. Cohen, Shi Qiu, and Congliang Zhou. "Continuous monitoring of land disturbance based on Landsat time series" Remote Sensing of Environment 238 (2020): 111116.Paulo Arévalo*, Eric L. Bullock, Curtis E. Woodcock and Pontus Olofsson (2020). A Suite of Tools for Continuous Land Change Monitoring in Google Earth Engine. Frontier in Climate. doi.org/10.3389/fclim.2020.576740.Zhu, Z., and Woodcock, C. E. (2014). Automated cloud, cloud shadow, and snow detection in multitemporal landsat data: an algorithm designed specifically for monitoring land cover change. Remote Sens. Environ. 152, 217–234. doi: 10.1016/j.rse.2014.06.012.Tibshirani, R. “Regression Shrinkage and Selection via the Lasso” Journal of the Royal Statistical Society. Series B, Vol. 58, No. 1, 1996, pp. 267–288.Zou, H., and T. Hastie. “Regularization and Variable Selection via the Elastic Net” Journal of the Royal Statistical Society. Series B, Vol. 67, No. 2, 2005, pp. 301–320.Lê minh huệ & nnk, Xác định dấu hiệu khai thác khai thác khoáng sản tại tỉnh yên bái từ ảnh vệ tinh sentinel, Hội nghị khoa học quốc gia về công nghệ địa không gian trong khoa học trái đất và môi trường, 2021