Africa-Press – Senegal. Sciences et Avenir : Benoît Morin, pouvez-vous nous raconter votre parcours du Québec jusqu’à Plouzané en Bretagne, où vous avez posé vos valises il y a quatre ans ?
Benoît Morin : Mon parcours universitaire outre-Atlantique a balayé les domaines de l’électronique, de l’intelligence artificielle et de l’architecture et utilisation du calcul haute performance [c’est-à-dire l’agrégation de puissances de calcul pour traiter d’énormes volumes de données à des vitesses très élevées].
C’est mon épouse, bretonne, qui m’a fait traverser l’Atlantique pour rejoindre sa région natale. J’ai notamment été séduit par son climat plus clément qu’au Québec. C’est ainsi que je suis rentré à l’Ifremer pour développer une intelligence artificielle dédiée à l’océan, nommée Datarmor. Financée par la région Bretagne, cette initiative était destinée à renouveler les infrastructures de calcul de l’Ifremer.
“Ces données marines sont en usage libre et continu”
Comment ce renouvellement s’est-il mis en place ?
Les acquisitions de matériel informatique ont débuté en 2020. Elles sont d’abord destinées au stockage des flux de données fournies par les satellites, les relevés en mer, les bouées immergées, etc.
La quantité de données à enregistrer est colossale. Il existe 4 centres de calcul de haute performance en France et 15 avant-centres de calcul de taille intermédiaire. Datarmor s’inscrit dans ce second groupe, qui offre un accès plus souple.
Le supercalculateur Datarmor à Plouzané.
A qui sont destinés ces moyens de calcul et les données enregistrées en temps réel ?
Ces données marines sont en usage libre et continu. Nous comptons un millier d’utilisateurs actifs dans l’année et environ 300 utilisateurs distincts par mois : des chercheurs, des thésards, des partenaires de recherche, etc.
Derrière chaque utilisateur, il y a sans doute toute une équipe de recherche. Ce flux continu de données peut nourrir, par exemple, un système comme Mercator, qui s’attache à prévoir les caractéristiques physiques de l’océan (vagues, courants, etc.) à destination de tous les usagers des océans. En un an, Datarmor produit 65 millions d’heures de calcul et dans 10 ans, nous aurons peut-être un milliard d’heures de calculs enregistré sur notre système.
Quel en est l’objectif ultime de Datarmor ?
De créer le premier jumeau numérique entièrement dédié aux océans ! Cela permettrait d’appréhender toutes les interactions physiques et biologiques existant, depuis le plancher océanique jusqu’à la surface, de la ligne de côte jusqu’à la haute mer.
Auparavant, les chercheurs assemblaient plusieurs modèles pour atteindre une plus haute complexité. Aujourd’hui, le système Datarmor est basé sur l’intelligence artificielle, qui déduit des différents jeux de données dont elle est nourrie les relations pouvant exister à toutes les échelles. Cela devrait permettre d’extrapoler les événements futurs, d’étudier l’influence des courants marins sur les événements extrêmes, de mieux comprendre l’évolution du Gulf Stream.
“L’équivalent en capacité de stockage de 140.000 téléphones portables”
Un ChatGPT des océans en quelque sorte ?
Non ! A la différence de cette IA médiatique, Datarmor utilise exclusivement des données brutes [enregistrements satellitaires, prélèvements et mesures divers], qui n’ont pas été interpolées.
Le système est également nourri par une production de données en temps réel, alors que ChatGPT fonctionne à partir de données passées. Pour obtenir une intelligence artificielle, il faut intégrer au système un grand nombre de données afin de nuancer les résultats et contrer les biais cognitifs. Nous utilisons notamment des techniques développées pour les voitures autonomes afin de faire de la reconnaissance d’espèces marines.
Le système engrange aussi la production, à grande échelle aujourd’hui, de séquences génomiques. Nous utilisons sa capacité de calcul pour réassembler les brins de génome afin de suivre l’évolution des espèces qui occupent les environnements marins et d’observer leurs réactions au changement climatique. En Bretagne, on observe déjà l’arrivée sur les côtes de populations d’algues et de méduses depuis des régions plus méridionales.
Quelle est la capacité de stockage du système ?
Elle représente l’équivalent en capacité de 140.000 téléphones portables, soit 70 pétaoctets de stockage, contre 30 pétaoctets de stockage pour le système précédent. Je ne doute pas que d’ici cinq ans cette capacité sera déjà entièrement utilisée. Lorsqu’un satellite double sa précision, il transmet quatre fois plus de données.
Y a-t-il un projet équivalent dans le monde ?
Il existe aujourd’hui un projet de jumeau numérique de la Terre, mais il s’intéresse essentiellement à ce qu’il se passe entre la surface des océans et l’atmosphère. Ifremer est le seul organisme à s’intéresser à ce qui se passe sous les océans, soit 70,8 % de la surface terrestre.
La France a la particularité d’avoir une présence sur plusieurs continents ce qui lui offre une très bonne couverture du globe. Nous déployons depuis 2022 les capacités de calcul de Datarmor et 2024 va représenter une première étape importante pour les utilisateurs. Le système devrait atteindre un usage généralisé en 2030.
Pour plus d’informations et d’analyses sur la Senegal, suivez Africa-Press