https://frosthead.com

Le monde selon Twitter, dans Maps

Tweets du monde entier, tracés par lieu dans le cadre d'une nouvelle étude. Cliquez pour agrandir. Image via Premier lundi / Leetaru et. Al.

Il est difficile d’apprécier à quel point Twitter a envahi le monde rapidement et de manière approfondie. Il y a juste sept ans, en 2006, c'était une idée esquissée sur un bloc-notes. On estime que le service est utilisé par environ 554 millions d'utilisateurs, soit près de 8% de tous les humains de la planète, et 170 milliards de tweets ont été envoyés. Ce nombre augmente de quelque 58 millions chaque jour. .

Tous ces tweets constituent une source inestimable d’actualités, de divertissement, de conversation et de connexion entre les personnes. Mais pour les scientifiques, ils ont aussi de la valeur en tant que quelque chose d'assez différent: les données brutes.

Étant donné que Twitter comporte une API ouverte (qui permet de télécharger les tweets sous forme de données brutes analysables) et que de nombreux tweets sont géolocalisés, les chercheurs peuvent en utiliser des milliards et les analyser par lieu pour en savoir plus sur la géographie humaine de la planète. L’automne dernier, dans le cadre de Global Twitter Heartbeat, une équipe de l’Université de l’Illinois a analysé le langage et l’emplacement de plus d’un milliard de tweets provenant des États-Unis pour créer des cartes sophistiquées, telles que les émotions positives et négatives exprimées pendant l’ouragan Sandy ou le soutien apporté à Barack. Obama ou Mitt Romney lors de l'élection présidentielle.

Comme Joshua Keating l'a noté sur le blog War of Ideas de Foreign Policy, les membres du même groupe, dirigé par Kalev Leetaru, sont récemment allés encore plus loin. Tel que publié dans une nouvelle étude publiée plus tôt cette semaine dans le journal en ligne First Monday, ils ont analysé les emplacements et les langues de 46 672 798 tweets postés entre le 23 octobre et le 30 novembre de l’année dernière afin de dresser un portrait saisissant de l’activité humaine autour de la planète. haut de la poste. Ils ont utilisé Twitter decahose, un flux de données qui capture au hasard 10% de tous les tweets dans le monde entier (pour un total de 1 535 929 521), et se sont simplement concentrés sur les tweets avec des données géographiques associées.

Comme le notent les chercheurs, la densité géographique des tweets dans de nombreuses régions, notamment dans le monde occidental, où les ordinateurs, les appareils mobiles et Twitter sont tous utilisés à des niveaux de pointe, correspond étroitement aux taux d'électrification et d'utilisation de l'éclairage. En conséquence, les cartes de tweets (telles que la vue détaillée de la partie continentale des États-Unis) finissent par ressembler beaucoup à des images satellites de lumière artificielle la nuit.

Cliquez pour agrandir. Image via Premier lundi / Leetaru et. Al.

Afin de déterminer dans quelle mesure les tweets correspondaient à l'utilisation de la lumière artificielle, ils ont créé la carte composite ci-dessous, dans laquelle les tweets sont représentés par des points rouges et l'éclairage nocturne, en bleu. Les zones où elles correspondent en fréquence (et s'annulent effectivement) apparaissent en blanc et les zones où l'une l'emporte sur l'autre restent rouges ou bleues. Beaucoup de régions finissent par avoir une belle blancheur, à quelques exceptions près: l’Iran et la Chine, où Twitter est interdit, sont visiblement bleus, alors que de nombreux pays ayant des taux d’électrification relativement bas (mais où Twitter est toujours populaire) apparaissent en rouge.

Cliquez pour agrandir. Image via Premier lundi / Leetaru et. Al.

Le projet est devenu encore plus intéressant lorsque les chercheurs ont utilisé un système automatisé pour ventiler les tweets par langue. La langue la plus courante sur Twitter est l'anglais, qui est représenté dans 38, 25% des tweets. Viennent ensuite le japonais (11, 84%), l’espagnol (11, 37%), l’indonésien (8, 84%), le norvégien (7, 74%) et le portugais (5, 58%).

L'équipe a construit une carte de tous les tweets écrits dans les 26 langues les plus populaires, chacune étant représentée par une couleur différente, ci-dessous:

Cliquez pour agrandir. Image via Premier lundi / Leetaru et. Al.

Alors que les tweets de la plupart des pays sont dominés par leurs langues officielles, il est révélé que beaucoup incluent des tweets dans une variété d'autres langues. Si vous regardez bien, vous verrez un arc-en-ciel de couleurs émerger subtilement des points gris (tweets anglais) qui recouvrent les États-Unis:

Cliquez pour agrandir. Image via Premier lundi / Leetaru et. Al.

Parmi d’autres analyses, l’équipe de recherche a même examiné la géographie du retweet et du référencement - la distance moyenne entre un utilisateur et une personne qu’il retweetait, ainsi que la distance moyenne entre cet utilisateur et une personne à laquelle il fait simplement référence dans un tweet. En moyenne, la distance parcourue par un retweet était de 1 115 milles et de 1 118 pour une référence. Mais, contre-intuitivement, il existait une relation positive entre le nombre de fois où un utilisateur donné retweetait ou référençait un autre utilisateur et leur distance: les paires d’utilisateurs ayant très peu d’interactions, dans l’ensemble, étaient plus susceptibles d’être rapprochées (500- Distants de plus de 600 milles) que ceux avec des dizaines de retweets et de références entre eux.

Cela indique que les utilisateurs qui vivent loin l'un de l'autre sont plus susceptibles d'utiliser Twitter pour interagir régulièrement. Une explication pourrait être que les entités ayant le plus d'abonnés - et donc le plus grand nombre de références et de retweets - sont souvent des célébrités, des organisations ou des sociétés, des utilisateurs avec lesquels les gens sont familiers mais avec lesquels ils n'ont pas de relation personnelle. Une carte globale des retweets entre utilisateurs est présentée ci-dessous:

Cliquez pour agrandir. Image via Premier lundi / Leetaru et. Al.

Le document est allé encore plus en détail sur d'autres données associées aux tweets: le rapport entre la couverture de l'actualité grand public et le nombre de tweets dans un pays (l'Europe et les États-Unis obtiennent une couverture médiatique disproportionnée, tandis que l'Amérique latine et l'Indonésie sont négligées), les endroits où Twitter a ajouté le plus grand nombre d'utilisateurs récemment (Moyen-Orient et Espagne) et les endroits où les utilisateurs ont, en moyenne, le plus d'abonnés (Amérique du Sud et Côte Ouest).

Il y a quelques mises en garde à toutes ces données. D'une part, bien que les tweets analysés se comptent par dizaines de millions, ils ne représentent encore que 0, 3% de tous les tweets envoyés. Ils pourraient donc ne pas représenter correctement tous les modèles Twitter, en particulier si les utilisateurs qui activent la géolocalisation se comportent différemment des autres. De plus, dans le monde en évolution rapide de Twitter, certaines tendances ont peut-être déjà beaucoup changé depuis l'automne dernier. Mais à mesure que Twitter grandit et que de plus en plus de données sont disponibles, il est évident que ce type d'analyse ne deviendra plus populaire que par les démographes, les informaticiens et d'autres chercheurs.

Le monde selon Twitter, dans Maps