Le TDAH, un trouble qui peut être repéré par l’écriture

6
Le TDAH, un trouble qui peut être repéré par l’écriture
Le TDAH, un trouble qui peut être repéré par l’écriture

Africa-Press – São Tomé e Príncipe. C’est en assistant à un cours de la Conférence universitaire de Suisse occidentale sur le sujet que le chercheur en psychologie de l’université de Genève Juan Barrios a eu l’idée: recourir à la stylométrie pour détecter un trouble déficit de l’attention avec ou sans hyperactivité (TDAH).

La stylométrie, une technique prometteuse dans le TDAH

Ce travail a été présenté à la conférence sur la recherche en humanités numériques qui s’est tenue à Paris début décembre 2023. L’article paru dans la foulée est cosigné de Juan Barrios et Martin Debbané, de l’unité de psychologie clinique développementale de l’université de Genève, et des deux spécialistes de stylométrie Florian Cafiero, de l’Ecole des Chartes à Paris, et Simon Gabay de l’université de Genève. Et les résultats s’avèrent prometteurs: la technique permet de prédire si quelqu’un est ou non affecté de TDAH avec 85% à 92% d’exactitude.

La stylométrie a jusque-là été le plus souvent mobilisée pour identifier les auteurs d’un texte, ou savoir si un ou plusieurs auteurs se cachaient derrière des écrits. Cette orientation médicale est nouvelle, mais pas la technique employée. Elle consiste en une analyse statistique de certains mots employés et un calcul de la probabilité que l’auteur d’un texte corresponde à un modèle établi à partir de cette analyse. “Nous avons répliqué des méthodes connues, comme dans notre travail mené (en 2022, ndlr) sur l’identification des auteurs de textes de la conspiration QAnon, explique Florian Cafiero. A savoir étudier la répartition de séquences de caractères, de mots outils, en testant différentes variations.”

Souvenir définissant le soi

Les chercheurs sont partis d’un corpus de textes écrits par 198 adolescents. Une partie d’entre eux étaient atteints de TDAH (par diagnostic médical), quand l’autre partie ne l’était pas et servait de groupe contrôle.

Chaque participant a rédigé trois textes en français relevant de ce que l’on appelle les souvenirs définissant le soi. Il s’agit de souvenirs biographiques emblématiques de comment la personne se perçoit. Pour l’expérience, ils devaient dater d’au moins un an, avoir de l’importance pour la personne et être racontés de manière détaillée en 1000, 1250, 1500 ou 2000 mots. “Comme il y a beaucoup de variations thématiques d’une personne à l’autre, le vocabulaire va aussi beaucoup changer donc on ne s’intéresse pas aux contenus et au sens des souvenirs mais à la manière de les raconter”, précise Florian Cafiero.

Les mots outils consistent en des articles, des prépositions, des auxiliaires, des conjonctions de coordination, etc. “Ils portent un très faible sens lexical et ont un rôle grammatical dans la phrase”, résume l’article. L’autre variable utilisée, ce sont des suites de caractères de trois lettres qui “trahissent des préférences lexicales voire grammaticales”. Ils concernent en effet souvent la conjugaison, les temps employés et à quelle personne.

Prioriser les cas à diagnostiquer

Un modèle stylométrique a été entraîné sur ces variables à partir des textes écrits par les adolescents diagnostiqués, un autre modèle est issu des textes du groupe contrôle. Deux textes de chacun des deux groupes ont été exclus de cette base, pour justement tester le modèle avec. “Les résultats sont plus nets que ce à quoi l’on s’attendait, continue Florian Cafiero. On voit que les personnes qui présentent un TDAH ont plus de mal à parler d’elles, avec plus de “on” que de “je”, moins de pluriels que dans le groupe contrôle, plus de différences de longueurs entre les textes aussi.” Les adolescents du groupe contrôle décrivent des expériences plus variées, impliquant plus de lieux, de personnes ou de situations, que ceux du groupe TDAH.

La technique s’avère cependant plus efficace quand elle s’appuie sur les suites de caractères (92% d’exactitude) que sur les mots outils (85%). Elle n’est bien sûr pas infaillible mais elle n’a pas non plus vocation à remplacer un vrai diagnostic médical. Ce dernier est un processus long et coûteux. La stylométrie permettrait surtout de prioriser les personnes à diagnostiquer à partir d’une première étape plus simple.

Il reste qu’avec le modèle basé sur les suites de caractères, ce que l’on appelle le taux de rappel est inférieur à la précision (75% contre 100%). Cela signifie que sur un panel donné, les personnes identifiées comme affectées de TDAH le sont effectivement toutes (100% de précision), mais que toutes les personnes atteintes de ce trouble au sein du panel n’ont pas été repérées (75% de rappel). Précision et rappel sont de 75% avec les mots-outils. Tout l’enjeu va donc être de mieux régler l’outil, quitte à ce qu’il sélectionne quelqu’un qui ne serait pas affecté de TDAH. “C’est moins grave que l’inverse, estime Florian Cafiero. L’idée serait alors de sacrifier un peu de la performance du modèle pour être sûr que les personnes à TDAH, elles, soient toutes repérées.”

Pour plus d’informations et d’analyses sur la São Tomé e Príncipe, suivez Africa-Press

LAISSER UN COMMENTAIRE

Please enter your comment!
Please enter your name here