Avez-vous vu le supercalculateur Watson d'IBM incarner deux humains jouant à Jeopardy la semaine dernière et craignez-vous maintenant un avenir contrôlé par ces fouillis de fils et de circuits avec des voix vraiment ennuyeuses? Non? Moi non plus. Et pas seulement parce que je refuse d’être intimidé par une invention qui contient plus d’informations dont je pourrais me souvenir et des réflexes plus rapides que tout être humain. Vous voyez, les ordinateurs ne sont tout simplement pas bons à certains égards, y compris la science, comme je l’ai récemment rappelé lors d’une séance à la récente réunion de l’Association américaine pour l’avancement de la science.
Les découvertes scientifiques reposent souvent sur la recherche de données, comme un étrange nuage vert sur une photo de galaxie, et sur le fait que "c'est drôle". Les ordinateurs ne sont pas très doués pour cela, et les humains sont également beaucoup plus aptes à détecter les tendances visuellement. Cela nous rend beaucoup mieux préparés à regarder, par exemple, une image d’une galaxie et à la classer correctement. C'est ainsi que le premier zoo Galaxy est né - de la nécessité d'identifier toutes les galaxies imagées par le Sloan Digital Sky Survey.
Ce premier projet s'est terminé en 2007 avec la classification de 10 millions de galaxies (et l'identification de nombreuses choses étranges, dont Hanny's Voorwerp, l'étrange nuage vert que j'ai mentionné ci-dessus). Il existe désormais un Zoonivers entier, où vous pouvez aider les scientifiques à: effectuer des tâches telles que trouver des planètes, étudier la lune ou récupérer des observations météorologiques sur des navires de la Royal Navy datant de la Première Guerre mondiale. Mais même les personnes qui ne participent pas activement à des projets comme celui-ci sont exploitées comme des ordinateurs humains pour de grands projets - bien que vous ne puissiez pas vous en rendre compte.
Vous savez, lorsque vous remplissez un formulaire en ligne et que vous vous retrouvez dans cette case, avec le fouillis de lettres ou de mots difficile à lire? Cela s'appelle un CAPTCHA. Vous pouvez comprendre ce que les lettres disent ou épeler, mais un ordinateur ne le peut pas. C'est un blocage pour les spammeurs. La dernière itération s'appelle reCAPTCHA et ces boîtes contiennent deux mots. Ce que vous n'avez peut-être pas remarqué, c'est que lorsque vous décodez ces mots, vous aidez Google à numériser des livres. Google met un mot qu'il connaît et un second que son programme de numérisation a étiqueté comme un mot mais ne peut pas s'identifier dans cette case et vous demande ce que sont les deux. En décodant 200 millions de ces mots chaque jour, nous avons aidé Google à numériser des millions de livres.
Chris Lintott, un astronome d’Oxford et l’un des fondateurs de Zooniverse, a indiqué que bientôt, la quantité de données serait si importante qu’elle submergerait tout ce que les humains peuvent gérer. Lorsque le grand télescope Synoptic Survey sera en ligne dans quelques années, par exemple, il analysera le ciel tous les trois jours, produisant autant de données que le Sloan Digital Sky Survey l'a été pendant des années. À ce stade, il faudra toujours des humains, dit Lintott, pour entraîner les machines.