L'intelligence artificielle (IA) est surtout connue pour sa capacité à voir (comme dans les voitures sans conducteur) et à écouter (comme dans Alexa et d'autres aides à domicile). A partir de maintenant, ça peut aussi sentir. Mes collègues et moi développons un système d'IA capable de sentir l'haleine humaine et d'apprendre à identifier une gamme de substances révélatrices de maladies que nous pourrions expirer.
Les animaux et même les plantes utilisent le sens de l'odorat pour identifier des centaines de substances différentes qui flottent dans l'air. Mais, comparé à celui des autres animaux, l’odorat humain est beaucoup moins développé et n’est certainement pas utilisé pour les activités quotidiennes. Pour cette raison, les humains ne sont pas particulièrement conscients de la richesse des informations pouvant être transmises par l'air et pouvant être perçues par un système olfactif extrêmement sensible. AI peut être sur le point de changer cela.
Pendant quelques décennies, les laboratoires du monde entier ont pu utiliser des machines pour détecter de très petites quantités de substances dans l'air. Ces machines, appelées spectromètres de masse à chromatographie en phase gazeuse ou GC-MS, peuvent analyser l'air pour découvrir des milliers de molécules différentes appelées composés organiques volatils.
Dans la machine GC-MS, chaque composé dans un échantillon d'air est d'abord séparé puis fragmenté en fragments, créant une empreinte digitale distincte à partir de laquelle les composés peuvent être reconnus. L'image ci-dessous est une visualisation d'une petite partie des données issues de l'analyse d'un échantillon d'haleine.
Vue 3D d'une partie d'un échantillon d'haleine contenant les données d'un instrument GC-MS. (James Gathany)Chaque pic représente un fragment d'une molécule. Les modèles particuliers de tels pics révèlent la présence de substances distinctes. Souvent, même le plus petit sommet peut être crucial. Parmi les centaines de composés présents dans l'haleine humaine, quelques-uns pourraient révéler la présence de différents cancers, même à un stade précoce. Les laboratoires du monde entier expérimentent donc la GC-MS en tant qu'outil de diagnostic non invasif permettant d'identifier de nombreuses maladies, sans douleur et en temps opportun.
Malheureusement, le processus peut prendre beaucoup de temps. De grandes quantités de données doivent être manuellement inspectées et analysées par des experts. La quantité de composés et la complexité des données signifient que même les experts mettent beaucoup de temps à analyser un seul échantillon. Les humains sont également sujets aux erreurs, peuvent rater un composé ou confondre un composé avec un autre.
Comment l'intelligence artificielle peut aider
En tant que membre de l'équipe de science des données de l'Université de Loughborough, mes collègues et moi-même adaptons la dernière technologie en matière d'intelligence artificielle afin de percevoir et d'apprendre un type de données différent: les composés chimiques des échantillons d'haleine. Les modèles mathématiques inspirés par le cerveau, appelés réseaux d'apprentissage en profondeur, ont été spécialement conçus pour «lire» les traces laissées par les odeurs.
Une équipe de médecins, d’infirmières, de radiographes et de physiciens médicaux du Centre de cancérologie d’Edimbourg a recueilli des échantillons d’haleine des participants suivant un traitement contre le cancer. Les échantillons ont ensuite été analysés par deux équipes de chimistes et d'informaticiens.
Une fois qu'un certain nombre de composés ont été identifiés manuellement par les chimistes, des données ont été fournies à des ordinateurs rapides pour former des réseaux d'apprentissage en profondeur. Le calcul a été accéléré par des dispositifs spéciaux, appelés GPU, capables de traiter plusieurs informations différentes en même temps. Les réseaux d'apprentissage en profondeur ont appris de plus en plus de chaque échantillon d'haleine jusqu'à ce qu'ils puissent reconnaître des modèles spécifiques révélant des composés spécifiques dans l'haleine.
Représentation simple du processus: des composés dans l'air ou des échantillons d'haleine à la visualisation des substances détectées. (James Gathany)Dans cette première étude, l’accent était mis sur la reconnaissance d’un groupe de produits chimiques, appelés aldéhydes, souvent associés aux parfums, mais également aux conditions de stress et aux maladies humaines.
Les ordinateurs équipés de cette technologie ne prennent que quelques minutes pour analyser de manière autonome un échantillon d'haleine qui prenait auparavant des heures à un expert humain. En réalité, l'intelligence artificielle rend l'ensemble du processus moins onéreux, mais surtout plus fiable. Encore plus intéressant, ce logiciel intelligent acquiert des connaissances et s’améliore avec le temps en analysant davantage d’échantillons. En conséquence, la méthode n'est pas limitée à une substance particulière. À l'aide de cette technique, les systèmes d'apprentissage en profondeur peuvent être formés à la détection de petites quantités de composés volatils avec des applications potentiellement étendues en médecine, en criminalistique, en analyse de l'environnement, etc.
Si un système d'IA peut détecter des marqueurs de maladie, il devient alors possible de déterminer également si nous sommes malades ou non. Cela a un grand potentiel, mais cela pourrait aussi être controversé. Nous suggérons simplement que l'IA pourrait être utilisée comme un outil pour détecter des substances dans l'air. Il ne faut pas nécessairement diagnostiquer ou prendre une décision. Les conclusions et décisions finales nous sont laissées.
Cet article a été publié à l'origine sur The Conversation.
Andrea Soltoggio, maître de conférences, université de Loughborough