https://frosthead.com

Vos tweets peuvent prédire quand vous aurez la grippe

En 1854, en réponse à une épidémie de choléra dévastatrice qui sévissait à Londres, le médecin britannique John Snow a présenté une idée qui allait révolutionner le domaine de la santé publique: la carte épidémiologique. En enregistrant des cas de choléra dans différents quartiers de la ville et en les reportant sur une carte basée sur les résidences des patients, il a découvert qu'une seule pompe à eau contaminée était à l'origine d'une grande partie des infections.

La carte le persuada - et éventuellement les autorités publiques - que la théorie du miasme de la maladie (affirmant que les maladies se propagent par des gaz nocifs) était fausse et que la théorie des germes (affirmant à juste titre que les micro-organismes étaient à blâmer) était vraie. Ils ont verrouillé la poignée de la pompe responsable de l'épidémie, signalant un changement de paradigme qui a changé de façon permanente la manière dont nous traitons les maladies infectieuses et donc l'assainissement.

La technologie de cartographie est assez différente, de même que la maladie, mais il existe une certaine similitude entre la carte de Snow et un nouveau projet mené par un groupe de chercheurs dirigé par Henry Kautz de l'Université de Rochester. En créant des algorithmes capables de détecter les tendances de la grippe et d'établir des prévisions basées sur des mots clés dans des tweets géolocalisés accessibles au public, ils adoptent une nouvelle approche pour étudier la transmission des maladies - une approche qui pourrait changer notre façon d'étudier et de suivre l'évolution des maladies dans la société. .

«Nous pouvons considérer les personnes comme des capteurs qui examinent le monde qui les entoure, puis rendent compte de ce qu'ils voient et de ce qu'ils vivent sur les réseaux sociaux», explique Kautz. "Cela nous permet de faire des mesures détaillées à l'échelle de la population et n'exige pas la participation active de l'utilisateur."

En d'autres termes, lorsque nous tweetons que nous venons d'être frappés par une toux douloureuse et une fièvre, nous fournissons involontairement de riches données pour une vaste expérience de santé publique, informations que les chercheurs peuvent utiliser pour suivre le mouvement de maladies telles que la grippe. en haute résolution et en temps réel.

Le projet de Kautz, appelé SocialHealth, a utilisé des tweets et d'autres types de médias sociaux pour suivre une série de problèmes de santé publique. Récemment, il a commencé à utiliser des tweets pour surveiller les cas d'intoxication alimentaire dans les restaurants de New York en enregistrant tous ceux qui avaient posté des messages. tweets géolocalisés dans un restaurant, puis suivez leurs tweets pendant les prochaines 72 heures, en recherchant des mentions de vomissements, de diarrhée, de douleurs abdominales, de fièvre ou de frissons. Ce faisant, ils ont détecté 480 cas probables d'intoxication alimentaire.

Mais à mesure que la saison change, c'est leur travail de surveillance du virus de la grippe qui ouvre le plus les yeux. Google Flu Trends a également cherché à utiliser les chercheurs de Google pour suivre l'évolution de la grippe, mais le modèle a largement surestimé l'éclosion de l'an dernier, peut-être parce que la couverture médiatique de la grippe avait poussé les gens à commencer à poser des questions liées à la grippe. L'analyse Twitter représente un nouvel ensemble de données présentant quelques qualités (une résolution géographique plus élevée et la capacité de capturer le mouvement d'un utilisateur dans le temps), qui pourrait produire de meilleures prévisions.

Pour lancer leur projet de suivi de la grippe, les chercheurs de SocialHealth se sont plus particulièrement intéressés à New York, recueillant environ 16 millions de tweets publics géolocalisés par mois provenant de 600 000 utilisateurs pendant trois mois. Vous trouverez ci-dessous un intervalle d'une journée Twitter de New York, avec différentes couleurs représentant différentes fréquences de tweets à cet endroit (le bleu et le vert signifient moins de tweets, l'orange et le rouge en signifient davantage):

Pour utiliser toutes ces données, son équipe a développé un algorithme permettant de déterminer si chaque tweet représente un rapport de symptômes pseudo-grippaux. Auparavant, d'autres chercheurs l'avaient simplement fait en recherchant des mots-clés dans des tweets («malade», par exemple), mais son équipe a découvert que l'approche conduisait à de faux positifs: beaucoup plus d'utilisateurs tweetent qu'ils en ont assez des devoirs se sentir malade.

Pour rendre compte de cela, l'algorithme de son équipe recherche trois mots consécutifs (au lieu d'un) et considère la fréquence à laquelle la séquence en question indique une maladie, en fonction d'un ensemble de tweets qu'ils avaient étiquetés manuellement. La phrase «malade de la grippe», par exemple, est fortement corrélée à la maladie, alors que «malade et fatigué» l’est moins. Certains mots particuliers - mal de tête, fièvre, toux - sont étroitement liés à la maladie, quelle que soit la séquence de trois mots à laquelle ils appartiennent.

Une fois que ces millions de tweets ont été codés, les chercheurs ont pu faire quelques intrigues avec eux. Pour commencer, ils ont examiné l'évolution des tweets liés à la grippe au fil du temps et les ont comparés aux niveaux de grippe rapportés par le CDC, confirmant que les tweets reflétaient avec précision la tendance générale du taux de grippe. Cependant, contrairement aux données CDC, elles sont disponibles presque en temps réel, au lieu d'une semaine ou deux après le fait.

Mais ils ont également approfondi l'analyse des interactions entre différents utilisateurs (représentés par deux utilisateurs tweetant du même endroit (la résolution GPS est d'environ un demi-bloc de ville) au cours de la même heure) pour donner une idée de la probabilité qu'une personne en bonne santé tomberait malade après avoir été en contact avec une personne grippée. De toute évidence, deux personnes tweetant du même bloc à 40 minutes d'intervalle ne se rencontraient pas nécessairement en personne, mais les chances qu'elles se rencontrent sont légèrement plus élevées que deux utilisateurs aléatoires.

En conséquence, lorsque vous examinez un jeu de données d'interactions suffisamment grand, une image de la transmission apparaît. Ils ont constaté que si un utilisateur en bonne santé rencontrait 40 autres utilisateurs se déclarant comme souffrant de symptômes de la grippe, ses chances de le faire le lendemain augmentaient de moins de 1% à 20%. Avec 60 interactions, ce nombre s'élève à 50%.

L’équipe a également examiné les interactions sur Twitter, en isolant des paires d’utilisateurs qui se suivaient et en les appelant «amitiés». Même si de nombreuses relations Twitter existent uniquement sur le Web, certaines correspondent à des interactions réelles et ont permis qui a dix amis qui se déclarent malades ont 28% plus de risques de tomber malade le lendemain. Au total, en utilisant ces deux types d'interactions, leur algorithme a été en mesure de prédire si une personne en bonne santé tomberait malade (et tweetait à ce sujet) avec une précision de 90%.

Nous en sommes encore aux débuts de cette recherche, et il y a beaucoup de limitations: la plupart des gens n'utilisent toujours pas Twitter (oui, vraiment) et même s'ils le font, ils pourraient ne pas tweeter sur le fait de tomber malade.

Mais si ce type de système pouvait encore être développé, il serait facile d’imaginer toutes sortes d’applications. Votre smartphone pourrait automatiquement vous avertir, par exemple, si vous aviez passé trop de temps dans les endroits occupés par les personnes atteintes de la grippe, vous incitant à rentrer chez vous pour arrêter de vous mettre sur le chemin de l'infection. Les habitants d'une ville entière pourraient même être prévenus si elle était au bord d'une épidémie.

Malgré les 150 ans de la découverte de John Snow dans la cartographie des maladies, il est clair qu'il existe encore des aspects de l'information sur la maladie que nous ne comprenons pas complètement. Maintenant, comme alors, la cartographie des données pourrait aider à obtenir les réponses.

Vos tweets peuvent prédire quand vous aurez la grippe