GraphCast, l’intelligence artificielle de Google qui révolutionne les prévisions météo

2
GraphCast, l’intelligence artificielle de Google qui révolutionne les prévisions météo
GraphCast, l’intelligence artificielle de Google qui révolutionne les prévisions météo

Africa-Press – Guinee Equatoriale. La météo sur dix jours en moins d’une minute. C’est la promesse affichée par un nouveau projet de DeepMind, la division intelligence artificielle (IA) de Google, dans un article paru dans la revue Science mi-novembre 2023. Il fait partie d’une série de recherches correspondant, comme le projet AlphaFold sur la structure des protéines, à des cas d’applications scientifiques de l’IA.

Appelé GraphCast, le modèle prend en données d’entrée la météo du moment sur un carré de 0,25 degré de latitude et de longitude (correspond à 28 km de côté au niveau de l’équateur) et ce qu’elle était six heures plus tôt au même endroit. Sur cette base, l’algorithme livre une prévision du temps qu’il fera six heures plus tard. Et ces mêmes prévisions servent à leur tour de données d’entrée pour produire d’autres prévisions, et ainsi de suite, jusqu’à obtenir le temps sur une dizaine de jours.

Des données structurées en graphes

Voilà pour le mécanisme. Derrière, l’algorithme relève de ce que l’on appelle les réseaux de neurones à graphes (GNN). C’est un type d’algorithme pour lequel les données d’entrainement, d’entrée et de sortie sont en fait un ensemble de données structurées en graphes, c’est-à-dire une figure géométrique composée de nœuds (nodes) reliés entre eux par des arêtes (edges), où chaque nœud correspond à une variable. Le Jazz Musicians Network est ainsi un graphe faisant des liaisons entre des musiciens de jazz pour représenter qui a joué avec qui dans un même orchestre.

“Les nœuds d’un graphe peuvent représenter n’importe quoi du moment que les arêtes représentent les relations entre eux, explique Alvaro Sanchez-Gonzalez chez DeepMind et coauteur de l’article. Ces nœuds peuvent, par exemple, figurer les utilisateurs d’un réseau social, avec les arêtes qui correspondraient à la connexion entre deux utilisateurs, ou des villes et les routes qui les relient.”

Pour GraphCast, les nœuds sont ces carrés de 0,25 degré de côté, et les arêtes les relient aux carrés voisins, ce qui donne une représentation de toute la surface de la Terre en un graphe.

La météo sur dix jours en moins d’une minute. C’est la promesse affichée par un nouveau projet de DeepMind, la division intelligence artificielle (IA) de Google, dans un article paru dans la revue Science mi-novembre 2023. Il fait partie d’une série de recherches correspondant, comme le projet AlphaFold sur la structure des protéines, à des cas d’applications scientifiques de l’IA.

Appelé GraphCast, le modèle prend en données d’entrée la météo du moment sur un carré de 0,25 degré de latitude et de longitude (correspond à 28 km de côté au niveau de l’équateur) et ce qu’elle était six heures plus tôt au même endroit. Sur cette base, l’algorithme livre une prévision du temps qu’il fera six heures plus tard. Et ces mêmes prévisions servent à leur tour de données d’entrée pour produire d’autres prévisions, et ainsi de suite, jusqu’à obtenir le temps sur une dizaine de jours.

Des données structurées en graphes

Voilà pour le mécanisme. Derrière, l’algorithme relève de ce que l’on appelle les réseaux de neurones à graphes (GNN). C’est un type d’algorithme pour lequel les données d’entrainement, d’entrée et de sortie sont en fait un ensemble de données structurées en graphes, c’est-à-dire une figure géométrique composée de nœuds (nodes) reliés entre eux par des arêtes (edges), où chaque nœud correspond à une variable. Le Jazz Musicians Network est ainsi un graphe faisant des liaisons entre des musiciens de jazz pour représenter qui a joué avec qui dans un même orchestre.

“Les nœuds d’un graphe peuvent représenter n’importe quoi du moment que les arêtes représentent les relations entre eux, explique Alvaro Sanchez-Gonzalez chez DeepMind et coauteur de l’article. Ces nœuds peuvent, par exemple, figurer les utilisateurs d’un réseau social, avec les arêtes qui correspondraient à la connexion entre deux utilisateurs, ou des villes et les routes qui les relient.”

Pour GraphCast, les nœuds sont ces carrés de 0,25 degré de côté, et les arêtes les relient aux carrés voisins, ce qui donne une représentation de toute la surface de la Terre en un graphe. Dans un premier temps, l’équipe de DeepMind a créé un graphe en forme de volume à 20 faces triangulaires (un icosaèdre), dont les 12 nœuds étaient équidistants du centre. Puis, pour monter en résolution, les faces ont été divisées en quatre (ce qui a donné 42 nœuds), puis encore en 4 et ainsi de suite jusqu’à obtenir un total de 40.962 nœuds. “Nous avons estimé que c’était suffisant pour des prédictions exactes, même si nous avons conscience que travailler sur plus de points encore pourrait donner de meilleurs résultats”, souligne le chercheur.

Une sélection de prévisions de GraphCast sur 10 jours montrant l’humidité spécifique à 700 hectopascals (environ 3 km au-dessus de la surface), la température de surface et la vitesse du vent en surface.

37 niveaux de pressions atmosphériques

A chacun des points est associé une série de variables comme la température, la vitesse et la direction du vent, les précipitations, le niveau de la mer, le géopotentiel et l’humidité spécifique (rapport dans une parcelle d’air donnée entre la masse de la vapeur d’eau et la masse humide). Et pour chaque nœud, ces variables sont disponibles pour 37 niveaux différents de pression atmosphérique. “Pour chaque zone, le graphe apprend à communiquer aux zones voisines, grâce aux arêtes qui les relient, afin de prédire l’état de l’atmosphère à cet endroit précis mais six heures plus tard”, précise le chercheur.

La phase d’apprentissage a utilisé 39 ans d’archives météorologiques mondiales du Centre européen pour les prévisions météorologiques à moyen terme, le corpus ERA5. Bilan ? “GraphCast donne de meilleures prédictions météorologiques que le modèle HRES (l’outil du centre européen de prédictions à moyen terme, ndlr) quand on le teste à dix jours”, note l’article. Mais il rappelle que le test porte sur 13 niveaux atmosphériques (et non 37), et bien sûr, sur une résolution de 0,25° de latitude et longitude, alors que le HRES s’applique normalement à une résolution bien supérieure, de 0,1°. Sur 1380 variables évaluées, l’algorithme de DeepMind est meilleur dans 90,3% des cas. Les zones où HRES est meilleur se concentrent dans la stratosphère.

Le projet s’est aussi intéressé à la prédiction d’événements météorologiques extrêmes : suivi de cyclone, extrêmes chaleur et froid et rivières atmosphériques, cause potentielle de tempête et précipitations diluviennes. Sur une période allant de 2018 à 2021, GraphCast génère moins d’erreurs sur la trajectoire d’un cyclone que HRES, par exemple. “Même s’il n’a pas été spécifiquement entraîné pour caractériser les rivières atmosphériques, GraphCast améliore les prédictions de l’IVT (“integrated water vapor transport”, indice associé aux rivières atmosphériques, ndlr) par rapport à HRES”, note l’article. De 10 à 25% selon le moment où se place la prédiction. Les températures extrêmes sont, elles, mieux prédites par HRES sur une période de 12 heures, quand GraphCast se distingue sur des échelles de temps plus longues, de 5 et 10 jours.

GraphCast a du mal à “gérer l’incertitude”

Le modèle a en fait été entraîné quatre fois, sur quatre périodes démarrant toutes en 1979, mais se terminant à une année d’écart : 2017, 2018, 2019 et 2020. L’idée étant de voir, au moment du test du modèle, quel impact pouvait avoir des données de plus en plus récentes sur l’exactitude de la prévision. Ce qui a permis de vérifier que plus l’algorithme intègre de données récentes, meilleures sont ses prédictions, ce qui s’avère particulièrement intéressant pour notre époque de bouleversements climatiques et de phénomène extrêmes récurrents.

Pour l’équipe de DeepMind, le modèle souffre néanmoins de plusieurs limites. D’abord, sa résolution spatiale, moindre que les outils européens. Ensuite, sa nature déterministe. En effet, les outils en vigueur sont capables de fournir des probabilités que se produise un événement météorologique, variable selon l’échelle de temps. GraphCast, lui, ne reflète pas le fait que, par nature, plus une prévision est effectuée en amont, moins précise elle est. Il a du mal à “gérer l’incertitude”, comme le signalent les auteurs en conclusion, et manque encore de nombre de capacités dont sont dotés les outils actuels.

Pour plus d’informations et d’analyses sur la Guinee Equatoriale, suivez Africa-Press

LAISSER UN COMMENTAIRE

Please enter your comment!
Please enter your name here