Le cancer à l’épreuve des IA génératives

3
Le cancer à l'épreuve des IA génératives
Le cancer à l'épreuve des IA génératives

Africa-Press – Cameroun. Et si l’on pouvait interroger une tumeur comme on interroge un moteur de recherche? L’idée peut sembler saugrenue. C’est pourtant bien le type de modèle d’intelligence artificielle qu’a présenté en octobre dernier une équipe américaine de l’université Yale et du laboratoire DeepMind de Google (à l’origine du programme Alphafold, objet du Nobel de chimie 2024). Son nom: Cell2Sentence-Scale 27B (ou C2S-Scale), qui peut se traduire par « de la cellule à la phrase – échelle de 27 milliards » – soit le nombre de paramètres pris en compte par le modèle.

Ils ne correspondent pas à de simples variables biologiques, mais sont des paramètres mathématiques internes au modèle, appris pendant l’entraînement. Il est possible de dire ce qu’ils représentent fonctionnellement: l’expression de milliers de gènes, leurs interactions complexes, ou celles de protéines, l’identification d’états cellulaires récurrents… L’IA crée ainsi un pont mathématique permettant de traduire l’état de cellules humaines ou cancéreuses en langage naturel – et, inversement, de manipuler des données biologiques complexes à partir de simples phrases.

Pour l’instant, l’article n’est qu’une prépublication. Mais il y a fort à parier qu’il fera l’objet d’une publication prestigieuse dans les prochains mois – s’il passe les fourches caudines de la relecture par les pairs. Reste que les auteurs y décrivent une mise à l’épreuve vertigineuse de leur modèle. Il s’agissait d’identifier parmi 4000 molécules celles susceptibles de perturber les mécanismes par lesquels certaines cellules tumorales se camouflent pour échapper au système immunitaire. Dans les candidats médicaments retenus par l’IA, un grand nombre étaient évoqués dans la littérature scientifique, mais d’autres étaient inattendus. Comme cette molécule anticancer sélectionnée, le silmitasertib, pour laquelle l’IA précisait dans quel contexte immunitaire elle se révélerait le plus efficace.

« On ne remplace pas les essais biologiques, mais on change d’échelle. On peut explorer un espace immense d’hypothèses pour un patient donné et concentrer les expériences sur ce qui a le plus de chances de fonctionner, commente le Dr Julien Vibert, oncologue et chercheur expert de l’IA au département de l’innovation thérapeutique de l’institut Gustave-Roussy (Villejuif). Pour la première fois, on peut poser des questions à des données de single cell [cellule unique] extrêmement complexes en langage naturel, et obtenir des réponses biologiquement pertinentes.  » L’analyse « single cell », c’est ce qui permet aux biologistes depuis une dizaine d’années d’analyser l’activité des gènes cellule par cellule, au lieu de travailler sur des moyennes réalisées à partir de milliers ou de millions de cellules.

Interroger le profil génétique de 50 millions de cellules

Une approche qui a transformé la vision du cancer: une tumeur n’est pas un bloc homogène. Elle est composée d’une multitude de cellules différentes: certaines prolifèrent rapidement, d’autres résistent aux traitements, d’autres encore parviennent à échapper au système immunitaire… Le séquençage de l’ARN en cellule unique permet de mesurer, pour chaque cellule, quels gènes sont activés ou éteints à un instant donné. Résultat: des jeux de données gigantesques, parfois constitués de millions de cellules décrites par plusieurs milliers de variables. C’est là que les IA génératives, en tant que grands modèles de langage, changent la donne.

Grâce aux profils génétiques de plus de 50 millions de cellules qu’il connaît, C2S-Scale permet ainsi aux chercheurs d’interroger un jeu de données biologiques comme ils le feraient avec un outil conversationnel: quelles voies moléculaires sont impliquées dans un phénomène donné? Quelles perturbations pourraient modifier le comportement d’une cellule tumorale? « Le concept absolument révolutionnaire de leur article, c’est celui-là: poser une question en langage humain et obtenir une réponse en langage biologique « , insiste Julien Vibert.

Et l’exemple saisissant de C2S-Scale s’inscrit dans un mouvement plus vaste: l’émergence des IA génératives dans la conception même des traitements anticancéreux. En juillet 2025, une étude publiée dans Nature Communications décrivait un modèle, baptisé Genotype-to-Drug Diffusion, avec un principe radical: partir du profil génétique d’une tumeur spécifique pour générer des structures chimiques inédites susceptibles de cibler spécifiquement ses vulnérabilités biologiques. Il ne s’agit pas de trier des bibliothèques de molécules existantes, mais bien d’en concevoir de nouvelles, respectant des contraintes de faisabilité chimique et pharmacologique.

Les auteurs montrent que les molécules générées sont à la fois diverses et adaptées aux anomalies génétiques des cancers étudiés, notamment pour des cibles longtemps considérées comme difficiles. Comme pour C2S-Scale, il ne s’agit toutefois que de travaux précliniques, qui devront faire l’objet d’une validation clinique en bonne et due forme avant de pouvoir être considérés comme des avancées cliniques avérées. Or, du laboratoire au patient, 90 % des pistes thérapeutiques s’évanouissent, et il faut plusieurs années aux autres pour aboutir.

« Le graal de la médecine personnalisée »

À l’Institut Gustave-Roussy (Villejuif), premier centre européen de lutte contre le cancer, les progrès de l’IA convergent depuis l’année dernière vers un objectif presque inouï: le développement de jumeaux numériques de patients et de leur cancer. « C’est le graal de la médecine personnalisée « , résume Julien Vibert, à la tête du projet qui a vraiment démarré il y a environ un an. Il prévient tout de suite: « Le terme de ‘jumeau numérique’ est aujourd’hui très galvaudé. Beaucoup de modèles sont présentés comme tels, alors qu’ils ne permettent ni mise à jour continue ni simulation réelle.  »

De fait, un véritable jumeau numérique doit réunir plusieurs conditions: intégrer des données hétérogènes (cliniques, biologiques, génomiques, parfois d’imagerie), évoluer dans le temps et permettre de tester virtuellement des scénarios thérapeutiques. Mais en médecine, en oncologie particulièrement, réunir ces briques est plus compliqué. Contrairement aux jumeaux numériques industriels (aviation, infrastructures, voitures, etc.) alimentés en continu par des capteurs, ceux de la médecine reposent sur des données difficiles à obtenir: biopsies, analyses biologiques, imagerie… Des examens coûteux, parfois invasifs, et réalisés de façon discontinue.

Et pour des cancers disséminés, par exemple, la difficulté est plus grande encore. Une biopsie ne capture qu’une partie de la réalité tumorale, alors que la maladie est par définition hétérogène et évolutive. « Les biopsies liquides sont une piste clé pour réduire les gestes invasifs, assure Julien Vibert. Elles permettent de suivre l’évolution de la maladie à partir d’un simple prélèvement sanguin, mais leur résolution est encore limitée.  »

En IA, le nerf de la guerre reste la qualité, la diversité et la quantité des données. S’il existe déjà des modèles capables de prédire une réponse à partir de données d’entrée, aucun n’a pu bénéficier d’une validation clinique. « La difficulté principale c’est l’hétérogénéité intratumorale, reprend le chercheur. Une tumeur est composée de clones différents, qui n’évoluent pas de la même façon. Les modèles single cell sont prometteurs, mais l’accès à ces données reste coûteux.  » Même si le fait de pouvoir « leur parler » directement a rebattu les cartes.

Le principal obstacle est la validation clinique

C’est une start-up française qui pourrait être en passe de sortir le premier jumeau numérique réellement abouti. Bioptimus a été cofondée en 2024 par le Pr Jean-Philippe Vert, éminent bio-informaticien passé par l’institut Curie, le DeepMind de Google ou encore Owkin, qui développe des outils d’IA pour de nombreux hôpitaux et centres de lutte contre le cancer en France.

La force de Bioptimus serait d’avoir eu accès à des bases de données très riches, issues à la fois de partenaires académiques et de l’industrie pharmaceutique. « Mais en IA médicale, le principal obstacle reste la validation clinique, rappelle Julien Vibert. Il faut rester humble et prudent, car il existe une longue vallée de la mort entre la recherche et la preuve d’un bénéfice réel pour les patients. Mais le champ des possibles s’est considérablement élargi.  »

Des IA incontournables pour l’imagerie médicale

Bien avant l’essor des IA génératives, l’intelligence artificielle s’est imposée dans certains domaines clés de l’oncologie, avec des usages aujourd’hui validés cliniquement. Le plus avancé concerne l’imagerie médicale: des algorithmes d’apprentissage profond sont désormais utilisés pour aider les radiologues à détecter des lésions suspectes sur des scanners, des IRM ou des mammographies. Ils permettent notamment d’améliorer la détection précoce de cancers du sein, du poumon ou de la prostate, en signalant des anomalies parfois invisibles à l’œil humain ou facilement négligées.

L’IA est également de plus en plus utilisée pour analyser des images de tissus prélevés lors de biopsies ou d’opérations chirurgicales. Ces images, observées habituellement au microscope par des médecins spécialistes, peuvent aujourd’hui être examinées par des algorithmes capables de repérer des cellules cancéreuses, d’évaluer le degré d’agressivité d’une tumeur ou d’identifier des indices utiles pour le pronostic. Ces applications partagent plusieurs caractéristiques: elles reposent sur des tâches bien définies, sur des données standardisées et sur des performances mesurables. Fondées sur la vision par ordinateur, elles ont émergé il y a maintenant près de dix ans et ont fait l’objet d’essais cliniques, d’évaluations réglementaires et, pour certaines, sont déjà intégrées aux flux de soins hospitaliers.

LAISSER UN COMMENTAIRE

Please enter your comment!
Please enter your name here