https://frosthead.com

Utiliser les mathématiques pour examiner les résultats des élections en Iran

Les statisticiens et les politologues ont eu une journée de terrain avec les résultats des élections iraniennes plus tôt ce mois-ci. L'élection a-t-elle été truquée? Nous ne le saurons peut-être jamais, mais nous en avons assez dans les calculs pour nous faire croire que cela aurait pu être le cas. Même dans ce cas, cependant, il y en a aussi assez pour nous faire croire que tout est légitime. Voici quelques analyses que j'ai trouvées particulièrement intéressantes:

Nettoyer les données

Immédiatement après les élections, des doutes ont été exprimés quant à la légitimité des données car chaque fois qu'un nouveau lot de résultats de vote était publié (ils sont publiés en Iran, de la même manière que les États-Unis), le pourcentage de votes revenant au président Mahmoud Ahmadinejad. était le même: 67 pour cent. Les données ne sont généralement pas propres, et certains ont commencé à se demander si les résultats avaient été fabriqués.

Une analyse de Jordan Ellenberg, professeur de mathématiques à l’Université du Wisconsin, à Slate, approfondit toutefois les données pour montrer qu’elles étaient en réalité plus compliquées que prévu. Les résultats n’ont pas été communiqués ville par ville, mais par lots importants combinant des données de plusieurs régions, ce qui signifie que les totaux des votes d’Ahmadinejad étaient en réalité des moyennes. Et la loi des grands nombres dicte, comme écrit Ellenberg:

Des moyennes de quantités très variables peuvent donner, et produisent généralement, des résultats qui semblent presque parfaitement uniformes. Avec suffisamment de données, les valeurs aberrantes ont tendance à s’annuler.

Ellenberg conclut que les données sont «suffisamment désordonnées pour être vraies».

Loi de Benford

Plusieurs analyses ont examiné les premiers chiffres des résultats des élections iraniennes pour voir s'ils étaient conformes à la loi de Benford, à savoir:

Dans les listes de nombres de nombreuses sources de données réelles (mais pas toutes), le premier chiffre est distribué de manière spécifique et non uniforme. Selon cette loi, le premier chiffre correspond à 1 presque un tiers du temps, et les chiffres les plus grands correspondent au chiffre principal avec les fréquences les plus basses et les plus basses, jusqu'au point où 9 en tant que premier chiffre apparaît moins d'une fois sur vingt. Cette distribution des premiers chiffres se produit logiquement lorsqu'un ensemble de valeurs est distribué de manière logarithmique.

Boudewijn Roukema, de l’Université Nicolaus Copernicus en Pologne, a conclu qu’il y avait presque deux fois plus de comptes de votes commençant par le chiffre 7 pour Mehdi Karroubi que ce à quoi on pourrait s’attendre avec la loi de Benford. En outre, Roukema a soupçonné que les résultats pour Ahmadinejad, dans lesquels il y avait moins de 1 et plus de 2 et 3 que prévu, auraient été probables si quelqu'un choisissait de manipuler les résultats en modifiant le total des 1 au début du vote en 2 et 3s. Cela aurait également conduit à une surestimation des totaux d'Ahmadinejad de plusieurs millions de voix.

Walter Mebane, politologue et statisticien à l'Université du Michigan, a également utilisé la loi de Benford dans son analyse, dans laquelle il trouve également plusieurs irrégularités dans les résultats des élections iraniennes. Mais même il reconnaît que, bien que ses résultats soient «compatibles avec une fraude généralisée, ils sont également« compatibles avec Ahmadinejad, qui a réellement gagné ».

Les deux derniers chiffres

Deux étudiants de troisième cycle en sciences politiques de l’Université de Columbia en ont pourtant pris une troisième. Dans une analyse qu’ils ont résumée dans un éditorial du Washington Post, ils ont examiné les deux derniers chiffres du décompte des voix dans 29 provinces pour chacun des quatre candidats (par exemple, si une personne obtenait 14 579 voix, seules les 7 et 9 ont été prises en compte. l'analyse).

Les deux derniers chiffres des résultats de l'élection sont du bruit aléatoire et la répartition des chiffres doit être relativement uniforme: chaque chiffre doit apparaître environ 10% du temps. Les humains, cependant, sont de médiocres générateurs de nombres aléatoires et lorsque nous composons des nombres, nous avons tendance à choisir certains nombres plus souvent que d’autres. Dans les résultats iraniens, seuls 4% des chiffres se terminent par le chiffre 5, tandis que le chiffre 7 apparaît 17% du temps. Des résultats aussi divergents seraient attendus à environ quatre élections sur 100.

Les humains ont également de la difficulté à créer des nombres avec des chiffres non adjacents (vous êtes moins susceptible d'en trouver 72 que 23), mais ces chiffres doivent également suivre des schémas aléatoires et environ 70% des paires doivent être composées de non-adjacents. chiffres. Cependant, dans les résultats iraniens, seulement 62% le font. Encore une fois, ces résultats seraient attendus à environ 4 élections sur 100. Mais la combinaison des deux résultats ne serait attendue qu’à une élection sur 200. Improbable, peut-être, mais pas impossible.

Où cela nous mène-t-il? Nous pourrions ne jamais savoir si les résultats rapportés sont réels ou non. Mes données personnelles préférées sur tout cela, cependant, ne nécessitent aucun calcul pour poser des questions de légitimité électorale. Cette citation de Abbas-Ali Kadkhodaei, porte-parole du Conseil des gardiens de l'Iran, ferait réfléchir presque tout le monde:

Les statistiques fournies par Mohsen Resaei dans lesquelles il affirme que plus de 100% des personnes éligibles ont voté dans 170 villes ne sont pas exactes. L'incident ne s'est produit que dans 50 villes.

(Pour plus d'informations sur les résultats des élections en Iran, consultez Nate Silver sur fivethirtyeight.com)

Utiliser les mathématiques pour examiner les résultats des élections en Iran