Africa-Press – Comores. De quoi est composé le territoire français aujourd’hui ? Comment sont occupés ses sols ? Comment ont-ils évolué depuis 10 ans, 50 ans ou un siècle ? Et comment se transformeront-ils demain ? Les indicateurs sont nombreux: artificialisation des sols, surface et composition des forêts, recul des côtes, intensification agricole aussi. Mais face à l’urgence climatique, « nous avons besoin de nouvelles descriptions du territoire qui soient systématiques, détaillées et fiables afin d’observer finement chaque évolution pour éclairer l’action publique », estime Matthieu Porte, coordinateur des activités IA de l’Institut national de l’information géographique et forestière (IGN).
Depuis sa création en 1940, l’IGN a toujours misé sur l’alliance de compétences humaines d’analyse et d’interprétation, et de technologies. Aujourd’hui, il dispose d’une capacité d’observation élargie grâce au croisement d’images satellitaires, aériennes ou de lidar haute densité. Et pour analyser toutes ces données en continu, l’IA joue désormais un rôle décisif.
« Prenons un cas emblématique chez nous: le suivi de l’occupation des sols, détaille Matthieu Porte. Pour faire de l’IA un outil puissant, nous allons créer des algorithmes capables de lire des clichés du territoire, et donc d’en décrire la composition. Nos experts de l’analyse photographique savent faire cette description sur quelques centaines ou milliers de kilomètres carrés. Demain, les algorithmes vont permettre de l’étendre à la totalité du territoire national et de le faire beaucoup plus régulièrement. »
Deux projets majeurs illustrent cette ambition. Le premier, baptisé OCS GE (occupation du sol à grande échelle), a pour but de mesurer l’artificialisation du territoire avec des mises à jour tous les trois ans. Il consiste à développer un modèle d’apprentissage profond à partir de données « socles » issues de prises de vue aériennes en haute résolution, pour classer de manière automatique les zones selon 16 natures de couverture différentes (forêt, terre agricole, bâti…). Une fois cette description faite, elle est croisée avec d’autres données, comme celles des fichiers fonciers transmis par le Centre d’études et d’expertise sur les risques, l’environnement, la mobilité et l’aménagement (Cerema).
Non seulement ce projet offre une mesure plus exhaustive de l’artificialisation des sols, mais il a également pour ambition de répondre à un autre défi: identifier les zones dites de non-changement. Car le taux de changement sur une période de trois ans est estimé à 1 % de la surface du territoire. Tout reprendre à chaque fois n’a donc pas de sens.
Le temps d’actualisation des cartes divisé par trois
L’autre projet concerne la cartographie forestière nationale que produit l’IGN. En s’appuyant toujours sur l’apprentissage profond, un « masque forêt » a pu être créé pour déterminer avec précision l’emprise de la forêt et ce qui n’en fait pas partie. Il est opérationnel depuis mai 2024 dans le cadre du lancement de la nouvelle version de cette cartographie. « La précédente version a été un très grand chantier chez nous: il nous a fallu dix ans pour le mener à bien ! S’appuyer sur l’intelligence artificielle va nous permettre de diviser au moins par trois ce délai « , souligne Matthieu Porte.
Ce « masque forêt » n’a pas vocation à servir aux seuls chercheurs de l’IGN, mais à tous les professionnels de la filière du bois comme aux acteurs de l’environnement et de l’aménagement. C’est pourquoi la version bêta (non encore aboutie) est déjà en accès libre. Pour Arnaud Braun, coordinateur du projet BD Forêt v3, ce travail n’était qu’une « première étape importante avant de chercher à descendre encore un peu plus bas vers le sol et à identifier les différentes essences d’arbres qui constituent les forêts. Pour cela, l’IA intégrera des images régulièrement mises à jour issues des prises de vue satellitaires Sentinel-2, ce qui autorise la compréhension de la saisonnalité qui régit le vivant, ainsi que les données lidar HD, qui ouvrent la compréhension par la machine de la forme des arbres. »
Reste que pour que les algorithmes soient efficaces, ils doivent être entraînés à partir de données d’apprentissage adaptées. Et sur ce point, l’IGN dispose d’un atout non négligeable: sa capacité à produire des jeux de données massifs, diversifiés et de qualité. « Avec 2 milliards de pixels, 980 kilomètres carrés d’images annotées pour en décrire l’occupation des sols, le jeu de données ouvertes Flair était, par exemple, à sa publication l’un des trois plus riches du monde avec DeepGlobe (Facebook, MIT) et LoveDA (université de Wuhan, en Chine) « , s’enthousiasme le coordinateur IA de l’IGN. Idem pour le jeu de données PureForest qui, avec 135.000 images lidar de 50 m2 couvrant 449 forêts issues de 40 départements, constitue le plus grand jeu de données lidar à l’international sur les essences forestières.
Cet atout est indispensable pour observer l’occupation des sols et son évolution, car le modèle d’IA mis à l’œuvre doit être capable de fonctionner de manière fiable sur l’ensemble du territoire national. Il doit donc être en mesure de différencier les environnements urbains et naturels en fonction du type de toiture, des composants de la végétation et même de la saison. Le massif des Vosges n’aura pas le même aspect en hiver qu’à la fin du printemps par exemple, et l’IA devra pourtant le reconnaître.
Il faut donc nourrir le modèle d’apprentissage d’échantillons très variés. « La photo-interprétation est une expertise très pointue, en particulier en milieu forestier. Chez nous, on compare les spécialistes à des radiologues de la photo aérienne ! Sans leur expertise de départ, il nous serait impossible de créer des IA pertinentes « , estime Matthieu Porte.
Ultime ambition: un jumeau numérique de la France
L’IGN n’agit pas seul pour cartographier l’anthropocène. Il a ouvert ses jeux de données, ses données d’apprentissages et même ses codes algorithmiques d’IA permettant de les exploiter pour lancer des projets en partenariat avec d’autres acteurs de la recherche. « Deux sont particulièrement importants, décrit Matthieu Porte. Le premier, c’est notre partenariat avec Genci [Grand Équipement national de calcul intensif] et le CNRS, qui nous permet d’exploiter les capacités du supercalculateur Jean-Zay [le plus puissant supercalculateur français dédié à la recherche]. Avoir accès à cette puissance de calcul facilite et accélère l’entraînement de nos modèles. Par ailleurs, CarHab est un programme très ambitieux mené dans le cadre des politiques européennes de protection de la biodiversité, pour lequel nous travaillons en lien étroit avec les conservatoires botaniques. Cette alliance démontre l’intérêt de croiser les expertises pour créer des IA vraiment utiles. » CarHab vise en effet à produire d’ici à 2026 une cartographie nationale prédictive des habitats naturels et semi-naturels: c’est-à-dire tout milieu réunissant les conditions physiques et biologiques nécessaires à l’existence d’une espèce animale ou végétale.
Ultime ambition: le projet de jumeau numérique de la France et de ses territoires, lancé en mai dernier par l’IGN, le Cerema et l’Institut national de recherche en sciences et technologies du numérique (Inria). Ici, l’IA jouera un rôle central pour exploiter les millions de données obtenues dans le cadre du programme lidar HD notamment.
Pour ce jumeau, l’IGN a aussi l’ambition de s’appuyer sur les développements rapides de l’IA générative pour permettre de fabriquer des données descriptives de territoire avec l’IA et bénéficier des apports du langage naturel. « Ce qui permettra la modélisation du comportement du territoire selon des scénarios qu’on lui soumettra, décrypte Matthieu Porte. De quoi offrir des prévisions d’évolution selon des choix d’aménagement différents par exemple, pour mieux aiguiller la décision publique. «.
Vers une vision 3D de chaque parcelle
Fin 2020, l’IGN a lancé un immense chantier de modélisation 3D par lidar haute densité (HD) du territoire français. Objectif: faire que d’ici à fin 2025, les faisceaux laser apportent une vision de chaque parcelle avec une précision inédite. Séquencé sur cinq ans, le programme vise la mise à disposition de données 3D relatives au sol et au sursol, qui seront à la fois homogènes, riches, fiables, ouvertes et accessibles à tous. Le potentiel apporté par cette modélisation est considérable.
Aujourd’hui, les données lidar sont déjà exploitées en matière de prévention du risque d’inondation. En octobre 2020, les avions de l’IGN ont par exemple effectué en urgence des relevés lidar dans les zones sinistrées par la tempête Alex afin de modéliser précisément les évolutions topographiques des vallées touchées par les intempéries et de faciliter la mise à jour rapide des plans de prévention des risques. Demain, les données lidar HD concernant les zones de forêt permettront d’observer la structuration des peuplements et renseigneront les chercheurs sur la porosité du couvert végétal, l’un des indicateurs clé de la santé des forêts et de leur capacité à se régénérer. « Cela contribuera à renforcer la surveillance des forêts afin de disposer d’une carte de leur vulnérabilité au changement climatique « , souligne l’IGN.
Pour plus d’informations et d’analyses sur la Comores, suivez Africa-Press