Conjunto de datos de biomasa global de JPL 2020


Este conjunto de datos (densidad global de biomasa sobre el suelo en Mg ha-1) muestra la distribución de la vegetación sobre la biomasa viva del suelo (above ground live biomass - AGB) con una resolución espacial de 100 m (1 ha). El mapa se elabora con un gran conjunto de datos dentro de un algoritmo de aprendizaje automático que incorpora datos de inventarios forestales, muestras aéreas y espaciales de formas de onda Lidar, e imágenes de satélite de ALOS-2 PALSAR-2 (cerca de 2020), SRTM, Landsat (cerca de 2020).

Descripción del conjunto de datos

El mapa de JPL 2020 es la estimación de la densidad global de la biomasa sobre el suelo (AGB) (unidad: Mg/ha) obtenida de una combinación de los compuestos del Landsat-8, los datos de retrodispersión del ALOS-2 PALSAR-2 (2019-2020) y SRTM DEM con una resolución espacial de 100 m, entrenados con muestras de datos espaciales lidar de ICESAT-1, datos de escaneo láser aerotransportado (ALS) y datos de inventario de campo. Aplicamos el modelo de aprendizaje automático "boosting tree" para predecir el AGB de pared a pared deducido según los datos de satélite.

El producto compartido en el MAAP está separado por continentes, e incluye a África, Asia, Europa, América del Norte, Oceanía y América del Sur. Es posible fusionar los 6 archivos para disponer de un mosaico global.

Uso

El producto de datos incluye las estimaciones de la densidad media de AGB a una resolución espacial de 100 m para el año 2020, y el error estándar de las estimaciones medias a nivel de píxel como un archivo de datos separado con la misma dimensión y cobertura espacial. Los archivos se guardan en formato Cloud Optimized Geotiff (COG) con un factor de escala de 10. Es necesario que el usuario divida los valores del mapa entre 10 para tener las estimaciones de AGB en Mg/ha.

La estimación AGB a partir del conjunto actual de muestras de entrenamiento (por ejemplo, el uso de ICESAT-1) puede presentar desfases de tiempo entre las muestras y las capas de predicción. En la metodología eliminamos tales diferencias, pero el efecto residual puede seguir existiendo. Vamos a reemplazar ICESAT-1 por datos GEDI en la nueva versión de la estimación de AGB 2020.

En el mapa hay algunos problemas conocidos relacionados con los artefactos en las regiones tropicales donde los efectos residuales debidos a la contaminación de las nubes aún existen, lo que también pueden provocar una clasificación incorrecta del mapa de la cubierta terrestre que hemos usado. También hay algunos problemas de mosaico en el norte de Siberia debido al uso de los datos de ALOS-2, que pueden ser evidentes cuando se lleven a cabo estudios a escala local.

Los archivos del producto de estimación de AGB guardados en MAAP pueden consultarse en /shared_bucket/alanxuliang/AGB_2020. También pueden ser descargados directamente desde AWS. Para la descarga se recomienda usar el archivo de cuaderno asociado "map_download.ipynb" en la carpeta.

Los usuarios de computadores de escritorio, también pueden copiar la URL seleccionada desde el cuaderno y pegarla en los navegadores de Internet para la descarga directa. Para la visualización, los usuarios de escritorio también pueden abrir QGIS y añadir una nueva capa rasterizada con el protocolo HTTP (pegar la URL allí sin autenticación).

Metodología

Compilamos las muestras de entrenamiento de AGB procedentes de 4 fuentes de datos, entre las que se incluye el producto espacial ICESAT-1 calibrado para tener estimaciones de AGB usando más de 40 modelos de biomasa lidar a través de diferentes tipos de bosque que cubren las métricas de forma de onda lidar a la biomasa, los datos de escaneo láser aerotransportado a través de diferentes regiones convertidos a AGB a una resolución espacial de 1 ha de los datos de campo, datos de inventario de muestra forestal disponibles de la comunidad de investigación y desde algunos inventarios regionales y nacionales, y datos de entrenamiento de muestra de las estimaciones de AGB de manglares a través de las regiones costeras globales.

Generamos una versión limpia de las capas de satélite enmascarando los píxeles en la nube y extendiendo el período de observación para conseguir más píxeles válidos. Para eliminar el efecto de reflectancia bidireccional en la región boscosa, los datos de Landsat-8 fueron calibrados de manera cruzada con los datos de MODIS NBAR, y los datos de ALOS-2 fueron calibrados de manera cruzada con la señal media de ALOS-1 (2007-2010) para eliminar el efecto residual de los ángulos de incidencia locales, el stripping orbital debido a los cambios de las condiciones ambientales. La calibración cruzada se realiza a gran escala para que se conserven los cambios locales de ALOS-2 PALSAR-2 ocasionados por las perturbaciones y la recuperación de la vegetación.

Construimos máscaras para filtrar las muestras de entrenamiento que sufrieron variaciones potenciales desde las adquisiciones de muestras AGB hasta el período de tiempo de las observaciones por satélite. Se utilizaron los datos de Global Forest Change para eliminar los posibles píxeles de deforestación. El producto de área quemada de MODIS (MCD64) se utilizó para eliminar posibles píxeles de incendios. Se utilizaron otras capas con índices de vegetación (NDVI y QVI) para filtrar otros cambios. Este filtrado ayudó a incluir sólo los datos de entrenamiento con paisajes que no han sufrido cambios notables.

Para cada tipo de bosque y tipo principal de vegetación no forestal, construimos el modelo Light Gradient Boosting Machine (LightGBM) asignando pesos iguales a las 4 fuentes de datos de entrenamiento. El modelo de aprendizaje automático para cada tipo de vegetación se ajustó para los hiperparámetros usando validación cruzada.

Los valores previstos se corrigieron usando el modelo de corrección de sesgo genérico y la coincidencia de histogramas a escala local, tomando muestras de entrenamiento ponderadas en la misma área para comparar los histogramas.

Las áreas con perturbaciones recientes se procesaron para tener una corrección adicional utilizando un factor de corrección empírico proveniente del índice espectral de Landsat-8. Las zonas sin vegetación se enmascararon para tener estimaciones de AGB nulas.

Incertidumbre y precisión

El mapa de incertidumbre del producto AGB 2020 se creó usando la regresión cuantílica para calcular el límite inferior y superior de la estimación para cada píxel, y así predecir el percentil 2,5 y el percentil 97,5 de la estimación de AGB.

El mapa de errores se elaboró suponiendo que la distribución de errores es gaussiana. Por consiguiente, el 95% de las predicciones son aproximadamente ±2SD. SD se reporta en el mapa de error final.

No tomamos el error de las muestras de entrenamiento en la propagación del error. Cuando se tienen en cuenta las incertidumbres de las muestras (debido a errores de medición, alometrías, geolocalización, etc.), la incertidumbre a nivel de píxel puede ser muy superior.

La incertidumbre del modelo no se tiene en cuenta a nivel de píxel. Sin embargo, es necesario considerarla para calcular las medias y los totales regionales (estimaciones jurisdiccionales). Se realizarán acercamientos de muestreo aleatorio para aproximar la matriz de covarianza del error debido a la incertidumbre del modelo.

Mantenimiento del conjunto de datos

Seguiremos mejorando el mapa incorporando datos contemporáneos de GEDI e ICESAT-2 para sustituir las muestras de ICESAT-1. Todos los datos de GEDI han sido ya procesados y rasterizados usando múltiples formas de onda de GEDI (> 3) dentro de celdas de cuadrícula de 100 m. Los datos de ICESAT-2 se integrarán a partir de los datos disponibles en el MAAP únicamente para las regiones boreales. Las actualizaciones del mapa de biomasa podrán consultarse en un plazo de 3 a 6 meses.

La incertidumbre del modelo se presentará en un formato eficaz para tener una forma simple de plasmar la matriz de error.

Características técnicas (ejemplo)

Resolución espacial: ~100m

Cobertura geográfica: Global

Cobertura temporal: 2020

Frecuencia de actualización: Anual

Formato: GeoTIFF

Política de datos: Creative Commons Attribution 4.0 International (CC-BY-4.0)


Orientación asociada o manual de usuario

Todos los conjuntos de datos se pondrán a disposición del público en:

https://carbon.nasa.gov

https://lpdaac.usgs.gov

El manual del producto aún no está disponible (octubre de 2021), pero lo estará a partir de:
https://carbon.nasa.gov


Contacto para consultas

Sassan Saatchi
Científico principal
Laboratorio de Propulsión a Chorro
California Institute of Technology
Pasadena, CA USA
Email: saatchi@jpl.nasa.gov

Liang Xu
Investigador científico
Laboratorio de Propulsión a Chorro
Instituto Tecnológico de California
Pasadena, CA USA
Email: alan.xu@jpl.nasa.gov

Yan Yang
Postdoctorado
Laboratorio de Propulsión a Chorro
Instituto Tecnológico de California
Pasadena, CA USA
Email: yan.yang@jpl.nasa.gov