Jeu de données sur la biomasse mondiale JPL 2020


Ce jeu de données (densité globale de la biomasse aérienne en Mg ha-1) montre la distribution de la biomasse aérienne vivante (Above Ground live Biomass = AGB) de la végétation à une résolution spatiale de 100 m (1 ha). La carte est élaborée à l'aide d'un vaste ensemble de données dans le cadre d'un algorithme d'apprentissage automatique, comprenant des données d'inventaire forestier, des échantillons aériens et spatiaux de formes d'onde Lidar, et des images satellites provenant d'ALOS-2 PALSAR-2 (vers 2020), de SRTM et de Landsat (vers 2020).

Description du jeu de données

La carte JPL 2020 est une estimation de la densité de la biomasse aérienne (AGB) à l'échelle mondiale (unité : Mg/ha) dérivée d'une combinaison de composites Landsat-8, de données de rétrodiffusion ALOS-2 PALSAR-2 (2019-2020) et de DEM SRTM à une résolution spatiale de 100 m, entraînée avec des échantillons de données lidar spatiales d'ICESAT-1, de données de balayage laser aéroporté (ALS) et de données d'inventaire sur le terrain. Nous avons appliqué le modèle d'apprentissage automatique « Boosting Tree » pour prédire la couverture complète de l’AGB déduit des données satellitaires.

Le produit partagé au MAAP est séparé par continent, incluant l'Afrique, l'Asie, l'Europe, l'Amérique du Nord, l'Océanie et l'Amérique du Sud. On peut fusionner les 6 fichiers pour obtenir la mosaïque globale.

Utilisation

Le produit de données contient les estimations de la densité moyenne de l'AGB à une résolution spatiale de 100m pour l'année 2020, et l'erreur standard des estimations moyennes au niveau du pixel comme un fichier de données séparé avec la même dimension et la même couverture spatiale. Les fichiers sont enregistrés au format Cloud Optimized Geotiff (COG) avec un facteur d'échelle de 10. Les utilisateurs doivent diviser les valeurs cartographiques par 10 pour obtenir les estimations de l’AGB en Mg/ha.

L'estimation de l'AGB à partir de l'ensemble actuel d'échantillons d'entraînement (par exemple, l'utilisation d'ICESAT-1) peut présenter des décalages temporels entre les échantillons et les couches prédictives. Nous nous sommes assurés dans la méthodologie d'éliminer de telles différences, mais l'effet résiduel peut encore exister. Nous remplacerons ICESAT-1 par les données GEDI dans la nouvelle version de l'estimation AGB 2020.

Parmi les problèmes connus de la carte figurent les artefacts dans les régions tropicales où des effets résiduels dus à la contamination par les nuages existent toujours, ce qui peut également entraîner une classification erronée de la carte d'occupation des sols que nous avons utilisée. Il y a également quelques problèmes de mosaïquage dans le nord de la Sibérie dus à l'utilisation des données ALOS-2, qui peuvent être visibles lors d'études à l'échelle locale.

Les fichiers du produit d'estimation de l'AGB stockés sur le MAAP se trouvent sur /shared_bucket/alanxuliang/AGB_2020. Il est également possible de les télécharger directement depuis AWS. La méthode recommandée pour le téléchargement est d'utiliser le fichier notebook « map_download.ipynb » associé dans le dossier.

Pour les utilisateurs d'ordinateurs de bureau, il est également possible de copier l'URL sélectionnée dans le bloc-notes et de la coller dans le navigateur Internet pour un téléchargement direct. Pour la visualisation, les utilisateurs d’ordinateurs peuvent également ouvrir QGIS et ajouter une nouvelle couche matricielle en choisissant le protocole HTTP (coller l'URL sans authentification).

Méthodologie

Nous avons compilé les échantillons de formation de l’AGB à partir de 4 sources de données, y compris le produit spatial ICESAT-1 calibré pour obtenir des estimations de l’AGB à l'aide de plus de 40 modèles de biomasse lidar dans différents types de forêts qui convertissent les formes d'onde lidar en biomasse, les données de balayage laser aéroporté dans différentes régions converties en AGB à une résolution spatiale de 1 ha à partir de données de terrain, des échantillons de données d'inventaire forestier disponibles auprès de la communauté des chercheurs et certains inventaires régionaux et nationaux, et des échantillons de données de formation provenant des estimations d’AGB des mangroves dans les régions côtières du monde.

Nous avons produit une version propre des couches satellitaires en masquant les pixels nuageux et en étendant la période d'observation pour un plus grand nombre de pixels valides. Les données Landsat-8 ont fait l'objet d'un étalonnage croisé avec les données MODIS NBAR afin de supprimer l'effet de réflectance bidirectionnelle dans la région boisée, et les données ALOS-2 ont fait l'objet d'un étalonnage croisé avec le signal moyen d'ALOS-1 (2007-2010) afin de supprimer l'effet résiduel des angles d'incidence locaux et du dépouillement orbital dû aux changements des conditions environnementales. L'étalonnage croisé est effectué à grande échelle pour s'assurer que les changements locaux d'ALOS-2 PALSAR-2 dus aux perturbations et à la reprise de la végétation soient préservés.

Nous avons construit des masques pour filtrer les échantillons d'entraînement qui ont subi des changements potentiels entre les acquisitions d'échantillons d’AGB et la période d'observation par satellite. Les données du Global Forest Change ont été utilisées pour éliminer les pixels de déforestation potentielle. Le produit MODIS sur les zones brûlées (MCD64) a été utilisé pour éliminer les pixels d'incendie potentiels. D'autres couches utilisant les indices de végétation (NDVI et QVI) ont été utilisées pour filtrer les autres changements. Ce filtrage a permis d'inclure uniquement des données de formation représentant les paysages qui n'ont pas subi de changements significatifs.

Pour chaque type de forêt et chaque principal type de végétation non forestière, nous avons construit le modèle Light Gradient Boosting Machine (LightGBM) en attribuant des poids égaux aux 4 sources de données d'apprentissage. Le modèle d'apprentissage automatique pour chaque type de végétation a été ajusté pour les hyperparamètres en utilisant la validation croisée.

Les valeurs prédites ont ensuite été corrigées à l'aide du modèle générique de correction des biais et de la correspondance des histogrammes à l'échelle locale en prenant des échantillons d'entraînement à pondération égale pour comparer les histogrammes.

Les zones présentant des perturbations récentes ont fait l'objet d'une correction supplémentaire à l'aide d'un facteur de correction empirique dérivé de l'indice spectral de Landsat-8. Les zones non végétalisées ont été masquées pour que les estimations de l'AGB soient nulles.

Incertitude et précision

La carte d'incertitude du produit de l’AGB de 2020 a été produite à l'aide d'une régression quantile pour calculer les limites inférieure et supérieure de l'estimation pour chaque pixel, de façon à prédire le percentile 2,5 et le percentile 97,5 de l'estimation de l’AGB.

La carte des erreurs a été produite en supposant que la distribution des erreurs est gaussienne. Par conséquent, 95 % des prédictions sont approximativement ±2SD. L'écart-type est indiqué dans la carte d'erreur finale.

Nous n'avons pas pris en compte l'erreur des échantillons d'entraînement dans la propagation des erreurs. Lorsque les incertitudes des échantillons (dues aux erreurs de mesure, aux allométries, à la géolocalisation, etc.) sont prises en compte, l'incertitude au niveau du pixel peut être beaucoup plus importante.

L'incertitude du modèle n'est pas prise en compte au niveau du pixel. Cependant, il est nécessaire d'en tenir compte lors du calcul des moyennes et des totaux régionaux (estimations juridictionnelles). Des approximations d'échantillonnage aléatoire seront appliquées pour approximer la matrice de covariance des erreurs dues à l'incertitude du modèle.

Maintien du jeu de données

Nous continuerons à améliorer la carte en incorporant des données contemporaines GEDI et ICESAT-2 pour remplacer les échantillons d'ICESAT-1. Toutes les données GEDI ont déjà été traitées et rastérisées en utilisant de multiples formes d'onde GEDI (> 3) dans des cellules de grille de 100 mètres. Les données ICESAT-2 seront incorporées à partir des données disponibles sur MAAP pour les régions boréales uniquement. Les mises à jour de la carte de la biomasse seront disponibles dans un délai de 3 à 6 mois.

L'incertitude du modèle sera fournie dans un format efficace pour avoir une façon simple de représenter la matrice d'erreur.

Caractéristiques techniques (exemple)

Résolution spatiale: ~100m

Couverture géographique: Mondiale

Couverture temporelle: 2020

Fréquence de mise à jour: Annuelle

Format: GeoTIFF

Politique des données: Creative Commons Attribution 4.0 International (CC-BY-4.0)


Guide ou manuel d’utilisation associé

Tous les ensembles de données seront mis à disposition du public aux adresses suivantes:

https://carbon.nasa.gov

https://lpdaac.usgs.gov

Le manuel du produit n'est pas encore disponible (octobre 2021), mais il sera disponible à l’adresse:
https://carbon.nasa.gov


Points de contact pour les questions et les requêtes

Sassan Saatchi
Scientifique principal
Laboratoire de recherche sur la propulsion par réaction
Institut de technologie de Californie
Pasadena, CA USA
Courrier électronique: saatchi@jpl.nasa.gov

Liang Xu
Chercheur scientifique
Laboratoire de recherche sur la propulsion par réaction
Institut de technologie de Californie
Pasadena, CA USA
Courrier électronique: alan.xu@jpl.nasa.gov

Yan Yang
Postdoc
Laboratoire de recherche sur la propulsion par réaction
Institut de technologie de Californie
Pasadena, CA USA
Courrier électronique: yan.yang@jpl.nasa.gov