La Ley de Benford es una regla estadística que dice que la distribución de dígitos en conjuntos de datos numéricos del mundo real tiende a seguir un patrón específico. A menudo se utiliza para comprobar si una elección es legítima o falsa, comparando la frecuencia de los dígitos en el recuento de votos de los candidatos con el patrón esperado. Por ejemplo, se utilizó para establecer el fraude electoral en las elecciones iraníes de 2009.
Recientemente me encontré con varias fuentes de derecha que afirman que el recuento de votos del presidente electo Joe Biden en las elecciones de 2020 viola la Ley de Benford. Los ejemplos incluyen el sitio web "The Red Elephants" y este hilo r/donaldtrump . El artículo "Elefantes rojos" hace varias otras afirmaciones de fraude, pero me gustaría restringir esta pregunta al análisis de frecuencia de dígitos. Normalmente descartaría de inmediato algo como esto como una teoría de conspiración partidista sin fundamento, pero las afirmaciones deben ser comprobables utilizando registros públicos y análisis estadístico. Cita:
Según algunos analistas, los recuentos de votos de Biden violan la ley de Benford, ya que todos los recuentos de los demás candidatos siguen la ley de Benford en todo el país, excepto el de Biden cuando se encuentra en una carrera reñida. Biden claramente falla en una prueba aceptada para detectar el fraude electoral, utilizada por el Departamento de Estado y los contadores forenses.
Los analistas corrieron los datos con Allegheny usando la prueba de 2do dígito de Mebane con Trump vs Biden. La diferencia fue significativa. Simplemente no funciona. Biden es sospechoso, muchas desviaciones significativas. En el de Trump hubo solo 2 desviaciones pero ninguna es significativa al nivel del 5%. El eje X es el dígito en cuestión, el eje Y es el % de observaciones con ese dígito.
Aquí hay algunas de varias imágenes relevantes del artículo:
Frecuencias de primer dígito en Chicago
Frecuencias de segundo dígito en el condado de Alleghany, Pensilvania
Esta respuesta solo aborda los segundos gráficos. Dejaré que el matemático Matt Parker se ocupe de la ley de Benford .
Puedo confirmar que [el resultado es] exactamente lo que cabría esperar, eso no está fuera de lugar... Y, en segundo lugar, la Ley de Benford no es una buena prueba para el fraude electoral. Y cito [de la Ley de Benford y la Ley de Detección de Elecciones (2011) ] "La Ley de Benford es problemática en el mejor de los casos como herramienta forense cuando se aplica a las elecciones".
Para los gráficos, las escalas verticales son diferentes. Las escalas verticales estrechas hacen que los cambios parezcan más grandes. Mientras que las amplias escalas verticales suavizan los cambios. El gráfico de Biden utiliza una escala más estrecha que la de Trump.
Los puse todos juntos en un gráfico con la misma escala y ya no se ven tan diferentes.
No he verificado que los datos del gráfico original sean correctos. Tuve que observar los números de los gráficos.
Es sospechoso porque alguien tuvo que elegir usar diferentes ejes verticales para cada gráfico. Parece un caso sacado directamente de Cómo mentir con las estadísticas .
Descargo de responsabilidad: no he mirado los datos reales.
En general, el mayor problema con la aplicación de la ley de Benford a los datos electorales a nivel de distrito es que los precintos suelen ser pequeños y de tamaño similar. Por ejemplo, si todos los distritos electorales tienen alrededor de 800 votantes y un candidato obtiene constantemente el 40-50% de los votos, entonces se espera que los primeros dígitos más frecuentes sean 3 y 4.
La ley de Benford funciona mejor en los casos en que los valores abarcan varios órdenes de magnitud, lo que no es el caso aquí.
Para ejemplos concretos, vale la pena mirar los varios problemas de Github en la fuente del análisis:
La desaparición de la ley de Benford en Milwaukee es solo una función de la preferencia de los votantes. Si un candidato tiene entre un 60% y un 80% de probabilidad promedio de recibir un voto, entonces el tamaño de los distritos electorales de Milwaukee es demasiado pequeño para adaptarse a la ley de Benford.
De manera más general, varios artículos cuestionan la utilidad de la ley de Benford aplicada a los datos electorales:
¿La aplicación de la Ley de Benford identifica de forma fiable el fraude el día de las elecciones?
Desafortunadamente, mi análisis muestra que la Ley de Benford es una herramienta poco confiable. Y, a medida que se aplican métodos de estimación más sofisticados, los resultados se vuelven cada vez más inconsistentes. Peor aún, cuando se compara con datos de observación, la aplicación de la Ley de Benford con frecuencia predice fraude donde no ha ocurrido ninguno.
La Ley de Benford y la Detección del Fraude Electoral
No se trata simplemente de que la Ley juzgue ocasionalmente una elección fraudulenta justa o una elección justa fraudulenta. Su "tasa de éxito" de cualquier manera es esencialmente equivalente a lanzar una moneda al aire, lo que lo hace problemático en el mejor de los casos como herramienta forense y totalmente engañoso en el peor.
Mirando los datos reales de Chicago en https://www.chicagoelections.gov/en/election-results-specifics.asp por precinto a fines del 7 de noviembre, los gráficos de Chicago parecen creíbles, pero la suposición de que la ley de Benford debería aplicarse no lo es. , al menos para Biden/Harris o los candidatos menores.
De los 2069 distritos electorales (la mayoría de los cuales son de tamaño similar en términos generales), Biden/Harris obtuvo menos de 100 votos en 12 distritos electorales y más de 999 votos en 4 distritos electorales. Todos los demás (más del 99%) tenían tres dígitos para sus votos, violando el requisito de que los datos naturales que satisfacen la ley de Benford deben abarcar varios órdenes de magnitud . Más de la mitad de los precintos (1100) le dieron a Biden/Harris de 300 a 499 votos, lo que hace que 3 y 4 sean los primeros dígitos más comunes (el gráfico refleja esto y está cerca de mostrar las frecuencias reales por cientos de votos, por lo que 300-399 era el más común).
Para Trump y Pence, los votos estuvieron más dispersos: 99 distritos electorales con 1 a 9 votos, 1339 distritos electorales con 10 a 99 y 633 distritos electorales con 100 o más votos. Esta dispersión en órdenes de magnitud permitió una mayor posibilidad de acercarse a la ley de Benford.
Para los candidatos menores, solo alcanzaron dos dígitos en un número muy pequeño de distritos electorales (y obtuvieron 0 votos en cientos de distritos electorales, que no se muestran en las tablas), por lo que las tablas están cerca de mostrar su distribución real de votos con censura de 0 y 10. +; de nuevo, no esperaría que se aplicara la ley de Benford.
Chicago fue una elección extraña para investigar por sospechas de trampa en 2020, donde la brecha en Illinois era de 12 puntos porcentuales (1960, cuando era de 0,2 puntos porcentuales, podría haber sido más interesante). Sospecho que se eligió simplemente porque los datos están disponibles públicamente y las distorsiones causadas por el tamaño similar del recinto llevaron a este resultado que no es de la ley Benford. Verá esto en otros lugares por razones similares: en 2019, muy pocos parlamentarios británicos obtuvieron una cantidad de votos que comenzaba con 5 a 9, ya que sus distritos electorales son de tamaños muy similares y los ganadores generalmente obtuvieron en el rango de 10,000 a 49,999 votos, nuevamente fallando el requisito de abarcar varios órdenes de magnitud.
Según Wikipedia:
La ley de Benford, también llamada ley de Newcomb-Benford, la ley de los números anómalos o la ley del primer dígito, es una observación sobre la distribución de frecuencia de los primeros dígitos en muchos conjuntos de datos numéricos de la vida real. La ley establece que en muchas colecciones de números naturales, es probable que el primer dígito sea pequeño.
...
Tiende a ser más preciso cuando los valores se distribuyen en múltiples órdenes de magnitud, especialmente si el proceso que genera los números se describe mediante una ley de potencia (que es común en la naturaleza).
La Ley de Beford no es un fenómeno universal, y el hecho de que no se cumpla no es una "prueba" de fraude. Por ejemplo, podemos jugar este juego con los porcentajes de votos que recibió Donald Trump en 2016: 11 primer dígito de 3, 19 primer dígito de 4, 16 primer dígito de 5, 9 primer dígito de y 1 primer dígito de 7 (sí , esto suma 56; algunos estados no asignan electores en función de los totales estatales, y también está DC). ¡Claramente, los porcentajes de votos de Trump fueron fraudulentos! En el hilo de reddit, u/Three-Twelve dice
En el caso de los datos de Milwaukee y Detroit citados en las imágenes anteriores, el número de votos por área de votación no abarca varios órdenes de magnitud, por lo que la Ley de Benford no es aplicable.
El tamaño de un recinto es probablemente un predictor más fuerte de la cantidad de votos para Biden que el apoyo de Biden. Si estas personas quieren afirmar que esto es evidencia de que el número de votantes por distrito electoral no es aleatorio, eso estaría más respaldado por la evidencia, pero también sería mucho más vacuo (no es una noticia trascendental que se prefieran algunos tamaños de distrito electoral sobre otros) .
La cantidad por la cual el nivel de apoyo de un candidato predice su conteo de votos, en comparación con el tamaño del precinto, aumentará cuanto más varíe ese nivel de apoyo (como porcentaje de ese apoyo). Por lo tanto, si el apoyo de Biden varía entre el 90 % y el 95 %, y el de Trump varía entre el 5 % y el 10 %, el apoyo de Biden varía un poco más del 5 % (las matemáticas son un poco confusas, ya que es un porcentaje de un porcentaje ; el 5% es un poco más del 5% del 90%), y el apoyo de Trump varía en un 100% (el 5% es el 100% del 5%). Entonces, los totales de votos de Trump variarán más que los de Biden y, por lo tanto, los totales de Trump tendrán más variaciones en los órdenes de magnitud, y la Ley de Beford será más aplicable (tenga en cuenta que Jo Jorgensen, que tiene incluso menos apoyo que Trump, tiene una distribución que también es más cerca de Benford).
El artículo de Wikipedia dice además:
Basado en la suposición plausible de que las personas que fabrican cifras tienden a distribuir sus dígitos de manera bastante uniforme, una simple comparación de la distribución de frecuencia del primer dígito de los datos con la distribución esperada de acuerdo con la ley de Benford debería mostrar cualquier resultado anómalo.
La distribución de Biden no es consistente ni con Benford ni con una distribución uniforme. Sin embargo, se ajusta muy bien a una distribución de Poisson o lognormal.
Siempre que tenga un análisis estadístico, es importante recordar que lo que puede decirle es que los datos observados son poco probables dada su hipótesis nula. Pasar de eso a que el nulo definitivamente es falso requiere una justificación adicional, y asumir que porque el nulo es falso significa que su alternativa preferida es verdadera es una dicotomía falsa. Si alguien tiene un modelo en el que estos datos de votación son poco probables, todo eso es un argumento a favor de que su modelo es falso. Que los demócratas se comprometan con el fraude es solo una posible forma en que el modelo podría ser falso.
La razón por la que la ley de Benford a menudo se cumple para los datos de la vida real es que los datos de la vida real a menudo se distribuyen de manera bastante amplia en una escala logarítmica.
[La Ley de Benford] tiende a ser más precisa cuando los valores se distribuyen en múltiples órdenes de magnitud
https://en.wikipedia.org/wiki/Benford%27s_law
Para pasar de una distribución en una escala logarítmica a una distribución del tipo que normalmente se ve en las ilustraciones de la ley de Benford, haga lo siguiente ( cubierto con más detalle aquí ):
"Envuelve" los cubos ignorando la parte entera del logaritmo de base 10 y usando solo la parte fraccionaria. Si la distribución era amplia, entonces la distribución envuelta será bastante uniforme en el rango [0,1).
Redistribuya en nueve cubos de tamaño desigual, con el cubo más a la izquierda que va desde log 1 = 0 hasta log 2 ≈ 0,30, el cubo siguiente va desde 0,30 hasta log 3 ≈ 0,48, y así sucesivamente. Si la distribución de partes fraccionarias fuera uniforme, alrededor del 30 % de los puntos de datos terminarán en el cubo más a la izquierda, el 18 % en el siguiente, y así sucesivamente.
He aquí un ejemplo de cómo funciona esto para datos que obedecen la ley de Benford: 2069 valores generados aleatoriamente (igual que el número de distritos electorales de Chicago) en una distribución logarítmica normal con una desviación estándar de 10 0,5 :
El gráfico de la izquierda es un histograma de los valores en una escala log 10 con un tamaño de cubo de 0,05. El gráfico del medio es el mismo que el de la izquierda, pero combina cubos con la misma parte fraccionaria. El gráfico de la derecha es el mismo que el del medio, pero con cubos del tamaño de Benford.
Estos son los recuentos reales de votos para Biden en los 2.069 recintos electorales, como se encuentran aquí :
Puede ver que el histograma de la izquierda se parece mucho a los datos artificiales. La única diferencia es que la desviación estándar es mucho menor. Como resultado, los cubos envueltos no se llenan de manera uniforme y, por lo tanto, los cubos del tamaño de Benford no se llenan en proporción a su ancho.
Aquí están los datos correspondientes a Trump:
La distribución parece ser bimodal por alguna razón. Debido a la depresión en el medio, los baldes envueltos se llenan de manera algo menos uniforme de lo que serían, pero aún son más uniformes que los de Biden, simplemente porque la distribución es más amplia. Como resultado, los baldes de Benford se llenan algo más en proporción a su ancho que los de Biden.
¿Qué podemos concluir de esto? Creo que la conclusión principal es que los gráficos del medio y de la derecha son absolutamente inútiles. Cada propiedad de estas distribuciones que podría ser de interés está presente en los gráficos de la izquierda. Los procedimientos que producen los otros gráficos solo ofuscan los datos. ¿Es la buena distribución gaussiana de los datos de Biden evidencia de que se inventaron como mis datos artificiales? ¿La caída en los datos de Trump es evidencia de alguna irregularidad? Tal vez (probablemente no), pero si lo es o no, se puede responder mejor mirando los datos originales. Las gráficas de primer dígito no son útiles en lo más mínimo. La desviación de los datos de Biden de la ley de Benford no tiene nada que ver con la plausibilidad de la misma, y todo que ver con la estrechez de la misma.
En contraste con las gráficas de frecuencia de segundo dígito , no veo evidencia clara de que estas gráficas de primer dígito hayan sido diseñadas para inducir a error. Pero quienquiera que los haya hecho es, al menos, un analfabeto estadístico; para empezar, no entienden por qué la ley de Benford es verdadera, ya que si lo hicieran, habrían adivinado de inmediato (y correctamente) la razón por la cual la gráfica de primer dígito de Biden parece gaussiana.
TL; DR: No, no lo hacen; Para empezar, la Ley de Benford no se aplica así y el análisis se hizo mal.
En Twitter , la Dra. Jen Golbeck finalmente perdió los estribos después de demasiados gráficos con fuentes deficientes y lanzó una perorata breve pero informativa al respecto.
Un hilo de tweet es difícil de citar correctamente y, afortunadamente, después de darse cuenta de cuánta atención estaba recibiendo, lo transpuso a un medio algo más confiable . Citaré algunas de las partes más relevantes a continuación.
Primero, un poco sobre el autor: según su biografía, Jennifer Golbeck es profesora asociada en la Universidad de Maryland en College Park y es directora del Laboratorio de interacción humano-computadora. Más pertinente, posiblemente, es que cuando el documental de Netflix ' Connected ' hizo un episodio sobre la Ley de Benford, ella es a quien consultaron.
Primero, una introducción básica a la Ley de Benford y cómo es útil:
La ley de Benford básicamente dice que el primer dígito de los números en algunos sistemas naturales sigue un patrón. Puede pensar intuitivamente que los números que comienzan con 1 son tan comunes como los números que comienzan con 9, pero en muchos sistemas, alrededor del 30 % de los números comienzan con 1 y la frecuencia disminuye hasta que solo el 5 % de los números comienzan con 9. ¡Esto se ve por TODOS LADOS! Mostré que se aplicaba en las redes sociales al conteo de amigos y que podía usarse para detectar bots. Se utiliza en investigaciones financieras y contables e incluso se puede utilizar en los tribunales como prueba de fraude. La longitud de todos los ríos de la tierra sigue este patrón. Pesos atómicos. Coeficientes JPEG. ¡Es alucinante!
Si desea saber más al respecto, Netflix tiene una serie llamada Connected y el episodio 4 (Digits) trata sobre eso. Estoy en ese documental, así que saluda cuando me encuentre con tu pantalla.
Luego pasa a explicar por qué realmente no funciona en los resultados electorales de la forma en que la gente piensa:
En primer lugar, no hay una gran variedad de órdenes de magnitud en el tamaño de los recintos. En la mayoría de los lugares donde se aplica Benford, tiene números de 10, 100, 1,000, 10,000, etc. Los recintos no tienen tanta variación porque no queremos que sean tan gigantes que podamos No cuentes todos los votos. Ese es un golpe contra el trabajo de Benford.
Luego, y esto es realmente importante, los votos en un precinto se dividen (básicamente) entre 2 candidatos en esta elección. (Los candidatos de terceros partidos constituyen un porcentaje tan pequeño que no importan para este punto). Si Trump obtiene X votos, Biden obtiene (básicamente) TOTAL-X.
Digamos que cada recinto tiene 1,000 personas. Si Trump sigue a Benford, Biden NO PODRÍA seguirlo.
Esto no es, de hecho, un desarrollo ni remotamente nuevo:
Tercero, hemos estudiado esto. Sabemos que no funciona. Las personas pueden compartir algunos datos de elecciones pasadas, pero hay décadas de investigación que analizan las elecciones en todo el mundo y está muy bien establecido que el análisis de Benford del primer dígito significativo no funciona aquí. Punto final.
De hecho, ella afirma que las personas que afirman que sí están tratando activamente de engañar:
Todas las personas que leen un artículo de Wikipedia y ponen algunos números en Excel están haciendo lo que describí anteriormente. Sabemos que esto no funciona. Están mintiendo, no solo mal informados. Muchos de nosotros hemos estado corrigiendo incansablemente sus métodos durante los últimos 5 días, pero siguen llegando. Saben que no funciona. Los documentos son todos públicos y están disponibles. A ellos no les importa. Se ve bien para su argumento y están tratando de engañarte.
Como buena investigadora, continúa citando sus fuentes:
Aquí hay una cita de un artículo sobre el tema:
“La Ley de Benford es problemática, en el mejor de los casos, como herramienta forense cuando se aplica a las elecciones… Su 'tasa de éxito' de cualquier manera es esencialmente equivalente a lanzar una moneda al aire, lo que la vuelve problemática en el mejor de los casos como herramienta forense y totalmente engañosa en el peor”.
fuente: Deckert, Joseph, Mikhail Myagkov, Peter C. Ordeshook. "La Ley de Benford y la detección del fraude electoral". Análisis Político 19.3 (2011)
Ella cita algunas fuentes más y reitera la afirmación de que las personas que afirman que se aplica la ley de Benford y prueban el fraude electoral están actuando de mala fe, pero ya he citado demasiado del artículo tal como está.
Yo no tengo los conocimientos matemáticos para comprobar su análisis, pero suena persuasivo.
El profesor Walter Mebane de la Universidad de Michigan ha escrito un artículo (sin revisión por pares) sobre este análisis, Aplicaciones inadecuadas de las regularidades de la ley de Benford a algunos datos de las elecciones presidenciales de 2020 en los Estados Unidos.
Hasta la fecha, no he oído hablar de ninguna irregularidad sustancial que haya ocurrido en ninguna parte, y los conjuntos de datos particulares examinados en este documento esencialmente no brindan evidencia de que ocurrieron fraudes electorales.
Mi interpretación: "Buen intento, pero no".
Mebane enseña análisis forense electoral en la Universidad de Michigan y ha publicado un artículo sobre la Ley de Benford y el fraude electoral.
Podría decirse que Mebane es la principal autoridad en este tema. Él es quien lo aplicó a las elecciones iraníes para probar el fraude.
Su trabajo ha sido criticado en la literatura , pero Mebane ha respondido a esto y todo el mundo parece extrañarlo. Admite que la utilidad de usar la ley de Benford es una "pregunta abierta".
Como ya se señaló, hay 2 gráficos claramente falsos y fácilmente refutables (eje x manipulado) que se han agregado al final de los gráficos de Benford en el sitio web "Red Elephant". Nunca antes había oído hablar de ese sitio, pero creo que es más constructivo referirme a la fuente original del análisis de Biden Benford.
La investigación original está aquí y muestra que los conteos violan la ley de Benford para Biden en varios recintos y distritos electorales grandes en Michigan y Pensylvannia- https://github.com/cjph8914/2020_benfords
y luego reproducido aquí: https://www.youtube.com/watch?v=1VBK2BU0K6k
La ley de Benford muestra que el 30 % de las veces, los números naturales comenzarán con un 1. Solo el 18 % de las veces será un 2 y así sucesivamente hasta llegar a un 9 inicial, que sucede menos del 5 % de las veces.
Hay una escena clave en la película "El Contador" cuando finalmente se descubre el fraude con esta técnica (debido a la frecuencia del número 3, en el segundo dígito de los totales). Esta es una aplicación de la ley de Benford . En una entrevista, un agente del FBI dijo que usan esta técnica todo el tiempo para detectar fraudes ( https://www.thewrap.com/accountant-adds-up-real-review-ben-affleck ) y este es el mismo análisis que la gente ha estado haciendo en los últimos días para investigar el conteo de votos en los estados indecisos.
Escena de “El Contador” donde Ben Affleck prueba el fraude con la ley de Benford: https://youtu.be/qdMo4ZnTyNs?t=66
HDE 226868
mmmmmm
Giter
pensamiento extraño
pensamiento extraño
Charles
Owen Reynolds
Shadur
eckes
JG
mike serfas
llama
KT.
pensamiento extraño
Enrique
Shadur
leones
Justin Time - Reincorporar a Monica
adam.r