https://frosthead.com

L'intelligence artificielle peut-elle détecter la dépression dans la voix d'une personne?

Diagnostiquer la dépression est une affaire délicate.

Il n'y a pas de test sanguin, pas de scan, pas de biopsie pour fournir des preuves tangibles d'un problème. Au lieu de cela, tout le poids repose sur l'habileté d'un clinicien qualifié à faire une évaluation basée largement sur les réponses d'une personne à une série de questions standard. Le diagnostic est encore compliqué par le fait que la dépression peut se manifester de plusieurs manières - de l'apathie à l'agitation en passant par des habitudes de repas ou de sommeil extrêmes.

Ainsi, l'idée que l'intelligence artificielle pourrait aider à prédire si une personne souffre de dépression constitue potentiellement un grand pas en avant, même si cela pose des questions sur la manière dont elle pourrait être utilisée.

Selon Tuka Alhanai, chercheur au Laboratoire d'informatique et d'intelligence artificielle du MIT (CSAIL), ce qui rend cela possible, c’est la capacité d’un modèle d’apprentissage automatique à identifier les schémas de langage et de parole associés à la dépression. Plus important encore, le modèle qu'elle-même et son collègue Mohammad Ghassemi, chercheur au MIT, a été capable de reconnaître la dépression avec un degré de précision relativement élevé en analysant la façon dont les gens parlent, plutôt que leurs réponses spécifiques aux questions d'un clinicien.

C'est ce que Alhanai appelle l'analyse «sans contexte». En d'autres termes, le modèle tire ses repères des mots choisis par les gens et de la façon dont ils les disent, sans chercher à interpréter le sens de leurs déclarations.

«Au lieu de demander au modèle de se concentrer sur les réponses à des questions particulières, il est programmé pour déterminer par lui-même ce sur quoi il veut se concentrer», dit-elle.

L'avantage potentiel, note Alhanai, est que ce type d'approche de réseau neuronal pourrait un jour être utilisé pour évaluer les conversations plus naturelles d'une personne en dehors d'un entretien formel structuré avec un clinicien. Cela pourrait être utile pour encourager les gens à demander l'aide d'un professionnel alors qu'ils ne le pourraient pas autrement, en raison des coûts, de la distance ou simplement du manque de conscience que quelque chose ne va pas.

«Si vous souhaitez déployer des modèles de manière évolutive, vous souhaitez réduire au minimum les contraintes que vous avez sur les données que vous utilisez. Vous voulez le déployer dans n'importe quelle conversation régulière et laisser le modèle capter, à partir de l'interaction naturelle, l'état de l'individu. "

Spotting Patterns

Le modèle s'est concentré sur l'audio, la vidéo et les transcriptions de 142 interviews de patients, dont environ 30% avaient été diagnostiqués de dépression par des cliniciens. Plus précisément, il a utilisé une technique appelée modélisation de séquence, dans laquelle des séquences de texte et de données audio de personnes déprimées et non déprimées ont été introduites dans le modèle. À partir de cela, différents modèles de langage ont émergé pour les personnes souffrant ou non de dépression. Par exemple, des mots tels que «triste», «bas» ou «bas» pourraient être associés à des signaux vocaux plus plats et plus monotones.

Mais il appartenait au modèle de déterminer quels schémas étaient compatibles avec la dépression. Ensuite, il a appliqué ce qu'il avait appris pour prédire quels nouveaux sujets étaient déprimés. En fin de compte, il a atteint un taux de réussite de 77% dans l'identification de la dépression.

Les chercheurs ont également constaté que le modèle nécessitait beaucoup plus de données pour prédire la dépression uniquement à partir du son de la voix, par opposition aux mots utilisés par une personne. Dans ce dernier cas, lorsque le modèle s’intéressait exclusivement au texte, il n’était nécessaire d’analyser une moyenne de sept séquences que pour prédire la dépression. Mais lorsque vous n'utilisez que l'audio vocal, 30 séquences sont nécessaires. Cela suggère que les mots choisis par une personne sont un meilleur prédicteur de la dépression que la façon dont ils sonnent.

Un dépassement algorithmique?

Il est encore trop tôt pour dire comment un modèle d'IA pourrait être intégré au diagnostic de la dépression. "C'est un pas en avant pour pouvoir analyser davantage d'interactions de forme libre, mais ce n'est qu'un premier pas", déclare James Glass, chercheur principal à CSAIL. Il note que l'échantillon de test était «minuscule». Il a également déclaré que les chercheurs voudraient mieux comprendre quels sont les modèles spécifiques de toutes les données brutes identifiées par le modèle comme indiquant une dépression.

"Ces systèmes sont plus crédibles lorsque vous avez une explication de ce qu'ils ramassent", dit-il.

C'est important car l'idée d'utiliser l'IA pour diagnostiquer des problèmes de santé mentale a suscité son scepticisme. Il est déjà utilisé dans les chatbots de thérapie, tels que Woebot, mais être impliqué dans un diagnostic réel ferait passer le rôle de la machine à un autre niveau.

Le médecin canadien Adam Hofmann, qui écrivait récemment dans le Washington Post, a mis en garde sur les conséquences possibles de ce qu'il a qualifié de «dépassement algorithmique».

«Les faux positifs, par exemple, pourraient-ils amener les personnes qui ne sont pas encore déprimées à le croire», a-t-il écrit. «La santé mentale est une interaction complexe de facteurs génétiques, physiques et environnementaux. Nous connaissons les effets placebo et nocebo en médecine, lorsque les utilisateurs aveugles de pilules de sucre ressentent les effets positifs ou négatifs d’un médicament parce qu’ils en ont les attentes positives ou négatives.

"Être dit que vous êtes malade pourrait littéralement le faire."

Hofmann s'est également inquiété de la durée pendant laquelle les conclusions de tels outils de diagnostic de l'IA pourraient être conservées à des tiers, tels que des assureurs ou des employeurs. Cette inquiétude au sujet des abus potentiels provoqués par des «détecteurs de dépression» a également été citée dans un récent article de blog sur The Next Web.

Alhanai et Glass ont entendu des rumeurs inquiétantes sur les risques d’une trop grande confiance dans les modèles d’IA pour le diagnostic de la santé mentale. Mais ils disent que leurs recherches visent à aider les cliniciens et non à les remplacer.

«Nous espérons pouvoir fournir une forme d'analyse complémentaire», déclare M. Glass. «Le patient n'est pas avec le médecin tout le temps. Mais si le patient parle à la maison dans son téléphone, enregistrant peut-être un journal quotidien, et que la machine détecte un changement, cela peut indiquer au patient qu'il doit contacter le médecin.

«Nous ne considérons pas que la technologie prenne des décisions en lieu et place du clinicien», ajoute-t-il. «Nous considérons que cela fournit un autre métrique d’entrée au clinicien. Ils auraient toujours accès à toutes les entrées de courant qu'ils utilisent. Cela leur donnerait simplement un autre outil dans leur boîte à outils. "

L'intelligence artificielle peut-elle détecter la dépression dans la voix d'une personne?