https://frosthead.com

Big Data ou trop d'informations?

Nous savons tous qu'il y a beaucoup plus d'informations dans nos mondes qu'auparavant. Quant à savoir combien, eh bien, la plupart d’entre nous n’avons aucune idée de rien.

Contenu connexe

  • Les infographies à travers les âges mettent en valeur la beauté visuelle de la science
  • Pourquoi Google Flu Trends ne peut pas suivre la grippe (encore)

Voici une pépite inestimable à propos de toutes ces informations, compliments de Dave Turek, responsable du développement des supercalculateurs chez IBM: À partir de 2003 et jusqu’au début de l’histoire humaine, nous avons généré, selon les calculs d’IBM, cinq exaoctets cinq milliards de giga-octets d'informations. L'année dernière, nous produisions autant de données tous les deux jours. Selon Turek, l'année prochaine, nous le ferons toutes les 10 minutes.

Mais comment est-ce possible? Comment les données sont-elles devenues un tel kudzu numérique? En termes simples, chaque fois que votre téléphone portable envoie sa position GPS, chaque fois que vous achetez quelque chose en ligne, chaque fois que vous cliquez sur le bouton J'aime de Facebook, vous mettez un autre message numérique dans une bouteille. Et maintenant, les océans en sont à peu près recouverts.

Et ce n'est qu'une partie de l'histoire. Messages texte, dossiers clients, transactions au guichet automatique, images de caméras de sécurité… la liste s'allonge encore et encore. Le mot à la mode pour décrire cela est «Big Data», bien que cela ne rende pas justice à l'échelle du monstre que nous avons créé.

C'est le dernier exemple de technologie dépassant notre capacité à l'utiliser. Dans ce cas, nous n’avons pas commencé à rattraper notre capacité à saisir des informations. C’est pourquoi l’un des favoris des experts en gestion est que l’avenir appartient aux entreprises et aux gouvernements qui peuvent donner un sens à toutes les données dont ils disposent. la collecte, de préférence en temps réel.

Les entreprises capables d'interpréter chaque fil d'ariane laissé par leurs clients auront un avantage, pense-t-il - non seulement qui a acheté quoi ou quoi au cours de la dernière heure - mais qu'elles aient tweeté à ce sujet ou posté une photo quelque part dans le tourbillon des réseaux sociaux. Il en va de même pour les villes qui peuvent collecter des données à partir de milliers de capteurs qui parsèment désormais les paysages urbains et transforment les aléas de la vie urbaine, tels que la fluidité du trafic, en une science.

Il n’est pas surprenant que les campagnes politiques franchissent déjà le pas, exploitant furieusement les données dans le cadre de leur objectif de «cibler de manière ciblée» les électeurs afin qu’ils sachent précisément comment les présenter pour leurs votes et leur argent. Selon le chroniqueur du New York Times, Thomas Edsall, les analystes ont notamment conclu que les républicains préféraient «The Office» et les restaurants Cracker Barrel, tandis que les démocrates étaient plus susceptibles de regarder «Late Night With David Letterman» et de manger à Chuck E. . Fromage.

Cette précipitation à interpréter la flotsam numérique explique pourquoi Google a annoncé la semaine dernière qu'il commencerait à vendre un produit appelé BigQuery, un logiciel capable de numériser des téraoctets d'informations en quelques secondes. Et pourquoi une start-up appelée Splunk, qui dispose d'une technologie capable d'analyser d'énormes quantités de données sur les clients et les transactions, a vu la valeur de ses actions grimper de près de 90% le jour de sa publication le mois dernier. Ceci, pour une entreprise qui a perdu 11 millions de dollars l’an dernier.

Montée du Data Scientist

Mais même l’accès aux meilleurs outils de déchiffrement des données n’est pas une garantie de grande sagesse. Très peu d'entreprises ont du personnel formé pour non seulement évaluer des montagnes de données, y compris des tonnes de friandises non structurées issues de millions de pages Facebook et de téléphones intelligents, mais aussi pour en faire quelque chose.

L'année dernière, le McKinsey Global Insitute a publié un rapport décrivant le «Big Data» comme «la prochaine frontière de l'innovation», mais prévoyant également que, d'ici 2018, les entreprises américaines auront une grave pénurie de talents en matière de compétences analytiques essentielles - autant 190 000 personnes. Et il affirme que 1, 5 million de gestionnaires supplémentaires devront être formés pour prendre des décisions stratégiques avec le flot de données qui les attend.

Cependant, tout le monde ne croit pas à la magie du Big Data. Peter Fader, professeur de marketing à la Wharton School of Business de Penn, n'est pas convaincu que plus de données, c'est mieux. Cela ne veut pas dire qu’une entreprise ne devrait pas essayer d’apprendre le plus possible sur ses clients. C'est juste que maintenant, on concentre tellement sur l'agrégation de chaque donnée qu'il pense que le volume vaut mieux que la vraie analyse.

Voici le commentaire de Fader tiré d'un récent entretien avec la revue Technology Review du MIT : «Même avec une connaissance infinie du comportement passé, nous ne disposons souvent pas de suffisamment d'informations pour faire des prédictions significatives sur l'avenir. En fait, plus nous disposerons de données, plus nous aurons une fausse confiance… L’important est de comprendre quelles sont nos limites et d’utiliser la meilleure science possible pour combler les lacunes. Toutes les données dans le monde n'atteindront jamais cet objectif pour nous. "

Qui sont vos données?

Voici un exemple de la manière dont le Big Data est utilisé pour résoudre de gros problèmes:

  • Ils savent quand ils ont été mauvais ou bons: alors que la plupart des entreprises se concentrent sur l'analyse de leurs clients, Amazon marque des points en utilisant le Big Data pour aider les leurs.
  • L'étude des étalons: Vous voulez savoir quels taureaux génèrent les vaches laitières les plus productives? L'industrie laitière a mis au point un moyen de réduire les chiffres.
  • Diagnostic par données: des chercheurs de SUNY Buffalo analysent d'énormes quantités de données afin de déterminer s'il existe un lien entre la sclérose en plaques et des facteurs environnementaux, tels qu'une exposition insuffisante au soleil.
  • À la recherche de problèmes: Une société appelée Recorded Future exploite des informations provenant de réseaux sociaux, ainsi que de sites gouvernementaux et financiers, afin de faire des prévisions sur l'impact potentiel de la croissance démographique, des pénuries d'eau et des conditions météorologiques extrêmes sur le terrorisme et le terrorisme.

Bonus vidéo: la capture de données est une chose. Le rendre attrayant et compréhensible est un tout autre défi. David McCandless se penche sur le pouvoir des «cartes d’information» dans cette conférence TED.

Big Data ou trop d'informations?