Lors d'un récent voyage dans les jardins botaniques locaux, j'ai remarqué une grande fleur pourpre frappante que je n'avais jamais remarquée auparavant. J'ai essayé de faire une recherche sur Google, mais je ne savais pas trop quoi demander. «Fleur pourpre» m'a apporté des images de narcisse et de freesia, d'orchidées et de primevère, de glaïeul et de gloire du matin. Aucune d'entre elles n'était la fleur que j'avais vue.
Contenu connexe
- La prochaine grande découverte scientifique sera-t-elle faite par des amateurs?
- Les scientifiques catalogue créatures dans tous les coins de Los Angeles
- Trois premiers résultats d'un projet scientifique citoyen vieux de 115 ans
- Sans surveillance humaine, 16 000 ordinateurs apprennent à reconnaître les chats
Mais grâce à l’intelligence artificielle, les naturalistes amateurs curieux comme moi ont maintenant de meilleurs moyens d’identifier la nature qui nous entoure. Plusieurs nouveaux sites et applications utilisent la technologie d'intelligence artificielle pour mettre des noms sur des photographies.
iNaturalist.org est l'un de ces sites. Fondé en 2008, était jusqu'à présent uniquement un site de crowdsourcing. Les utilisateurs affichent une photo d’une plante ou d’un animal et une communauté de scientifiques et de naturalistes l’identifiera. Sa mission est de mettre en relation des experts et des "citoyens scientifiques" amateurs, en suscitant l'enthousiasme des personnes pour la faune et la flore tout en utilisant les données recueillies pour aider les scientifiques professionnels à surveiller les mutations de la biodiversité ou même à découvrir de nouvelles espèces.
Selon Scott Loarie, co-directeur de iNaturalist, le modèle de «crowdsourcing» fonctionne généralement bien. Mais il y a quelques limitations. Premièrement, il peut être beaucoup plus difficile d’identifier votre photo en fonction de votre lieu de résidence. En Californie, où Loarie est basé, il peut obtenir une identification en une heure. C'est parce qu'un grand nombre des experts qui fréquentent iNaturalist sont basés sur la côte ouest. Par exemple, un habitant de la Thaïlande rurale risque de devoir attendre beaucoup plus longtemps avant de recevoir une pièce d’identité: il faut en moyenne 18 jours pour obtenir une pièce d’identité. Autre problème: à mesure que le site est devenu plus populaire, l’équilibre entre observateurs (personnes postant des images) et identificateurs (personnes vous disant en quoi consistent les images) est devenu biaisé, avec beaucoup plus d’observateurs que d’identifiants. Cela menace de submerger les experts bénévoles.Ce mois-ci, iNaturalist prévoit de lancer une application utilisant l’IA pour identifier les plantes et les animaux jusqu’au niveau de l’espèce. L'application tire parti de ce qu'on appelle «l'apprentissage en profondeur», utilisant des réseaux de neurones artificiels qui permettent aux ordinateurs d'apprendre comme le font les humains, afin que leurs capacités puissent progresser avec le temps.
«Nous espérons que cela engagera un tout nouveau groupe de citoyens scientifiques», a déclaré Loarie.
L'application est formée en recevant des images étiquetées de la base de données volumineuse d'iNaturalist contenant des observations de «qualité recherche», observations vérifiées par la communauté d'experts du site. Une fois que le modèle a été formé sur suffisamment d'images étiquetées, il commence à être capable d'identifier des images non étiquetées. Actuellement, iNaturalist est en mesure d’ajouter une nouvelle espèce au modèle toutes les 1, 7 heures. Plus il y a d'images téléchargées par les utilisateurs et identifiées par des experts, mieux c'est.
«Plus nous en obtiendrons, plus le modèle sera entraîné», explique Loarie.
L'équipe iNaturalist souhaite que le modèle soit toujours précis, même si cela signifie ne pas être aussi précis que possible. À l'heure actuelle, le modèle tente de donner une réponse sûre sur le genre de l'animal, puis une réponse plus prudente sur l'espèce, offrant les 10 meilleures possibilités. Il est actuellement correct dans le genre 86% du temps et donne à l’espèce dans ses 10 meilleurs résultats 77% du temps. Ces chiffres devraient s'améliorer à mesure que le modèle continue à être formé.
Jouant avec une version de démonstration, je suis entré dans l'image d'un macareux perché sur un rocher. «Nous sommes à peu près certains que cela fait partie du genre Puffins», a-t-il déclaré, indiquant le type d'espèce correcte, le macareux moine, comme meilleur résultat suggéré. Puis je suis entré dans une image d'une grenouille africaine à griffes. «Nous sommes à peu près certains que cela appartient au genre crapaud occidental», m'a-t-il déclaré, proposant une grenouille à griffes africaine parmi ses 10 meilleurs résultats.
L'intelligence artificielle n'était «pas assez en confiance pour faire une recommandation» concernant une photo de mon fils, mais a suggéré qu'il s'agisse d'une grenouille léopard, d'un escargot de jardin ou d'un serpent, d'une autre créature non humaine. Comme tous ces objets ont été repérés, j'ai réalisé que la vision par ordinateur consistait à voir l'arrière-plan à pois de la chaise haute de mon fils et à l'identifier comme faisant partie du spécimen. J'ai donc recadré la photo jusqu'à ce que seul son visage soit visible et que l'on clique sur «classer». «Nous sommes presque sûrs que cela se trouve dans le sous-ordre des lézards», a répondu l'IA. Soit que mon bébé ressemble à un lézard, soit — la vraie réponse, je suppose — cela montre que le modèle ne reconnaît que ce qu'il a été nourri. Et personne ne lui donne des images d’êtres humains, pour des raisons évidentes.
iNaturalist espère que l'application soulagera sa communauté d'experts et permettra à une communauté plus large d'observateurs de participer, telle que des groupes d'écoliers. Cela pourrait également permettre le «piégeage de la caméra», c'est-à-dire l'envoi de flux d'images à partir d'un piège à caméra, qui prend une photo lorsqu'elle est déclenchée par un mouvement. iNaturalist a déconseillé le piégeage avec une caméra, car il inondait le site d’énormes quantités d’images nécessitant ou non l’identification d’un expert (certaines images seront vides, tandis que d’autres attraperaient des animaux communs tels que des se). Mais avec l'IA, ce ne serait pas un problème. iNaturalist espère également que la nouvelle technologie engagera une nouvelle communauté d'utilisateurs, y compris des personnes qui pourraient être intéressées par la nature mais ne seraient pas disposées à attendre plusieurs jours pour une identification selon le modèle de la foule.
Une identification rapide des espèces pourrait également être utile dans d'autres situations, telles que l'application de la loi.
«Supposons que les employés de la TSA ouvrent une valise et que quelqu'un ait des geckos», déclare Loarie. "Ils ont besoin de savoir s'il faut arrêter quelqu'un ou non."
Dans ce cas, l'IA pourrait dire aux agents de la TSA quel type de gecko ils examinaient, ce qui pourrait faciliter une enquête.
iNaturalist n'est pas le seul site à tirer parti de la vision par ordinateur pour engager des scientifiques citoyens. L'application Merlin Bird ID du Cornell utilise l'IA pour identifier plus de 750 oiseaux d'Amérique du Nord. Vous devez d'abord répondre à quelques questions simples, y compris la taille et la couleur de l'oiseau que vous avez vu. fait la même chose pour les plantes, après que vous lui ayez indiqué la partie de la plante qu'il regarde (fleur, fruit, etc.).
Tout cela fait partie d'une plus grande vague d'intérêt pour l'utilisation de l'IA pour identifier les images. Il existe des programmes d'intelligence artificielle capables d'identifier les objets à partir de dessins (même les mauvais). Les IA peuvent regarder des peintures et identifier des artistes et des genres. De nombreux experts pensent que la vision par ordinateur jouera un rôle primordial dans les soins de santé, en facilitant l'identification, par exemple, des cancers de la peau. Les constructeurs automobiles utilisent la vision par ordinateur pour apprendre aux voitures à identifier et éviter de heurter les piétons. Un complot d'un récent épisode de la comédie Silicon Valley portait sur une application de vision par ordinateur pour identifier les aliments. Mais puisque son créateur l'a uniquement formé aux hot-dogs - car la formation d'un réseau de neurones nécessite d'innombrables heures de travail humain - il ne pouvait distinguer que des hot-dogs et des "pas des hot-dogs".
Cette question du travail d'humour est importante. Des bases de données volumineuses contenant des images correctement étiquetées sont essentielles à la formation d'IA et peuvent être difficiles à trouver. iNaturalist, en tant que site de recherche participative de longue date, possède déjà exactement ce type de base de données, ce qui explique pourquoi son modèle a progressé si rapidement, explique Loarie. D'autres sites et applications doivent trouver leurs données ailleurs, souvent à partir d'images académiques.
"Il est encore tôt, mais je vous garantis que de telles applications vont proliférer au cours de la prochaine année", a déclaré Loarie.