¿Existen métodos que compensen fenómenos como el factor Shy Tory y el efecto Bradley?

Esta es una pregunta de seguimiento de esta (¿Por qué las encuestas preelectorales y los modelos de pronóstico estaban tan equivocados sobre Donald Trump?).

La respuesta aceptada nos informa sobre las posibles razones, como el factor Shy Tory y el efecto Bradley . Para un profano, ambos dicen lo mismo: la gente dice que votará con una persona diferente de la que realmente lo hará (por varias razones).

Solo menciono las elecciones de EE. UU. como ejemplo; estoy interesado en una respuesta más general.

En mi país natal, durante muchas elecciones he visto diferencias significativas (por lo general, me perdí al ganador) entre las encuestas preelectorales y el resultado real. Como nota al margen, las encuestas a boca de urna incluso convirtieron a un candidato en presidente por un día (el conteo final cambió al ganador).

Pregunta: ¿Existen métodos de votación relacionados con las elecciones para compensar tales efectos y hacer que las votaciones sean más efectivas?

Creo que algo parecido a Electoral Compass (pero más simple) podría funcionar, ya que las preguntas evalúan indirectamente la simpatía política. Tal método puede beneficiarse de preguntas redundantes útiles para atrapar a los mentirosos, pero puede hacer que el proceso de encuesta sea demasiado complejo.

Respuestas (1)

Factor Trump tímido/efecto Clinton

En primer lugar, sigue siendo incierto que haya un factor conservador tímido en la elección de Donald Trump. El voto popular estuvo dentro del margen de error de la votación. Solo en dos estados (Wisconsin y Michigan) el resultado real difirió del resultado de la encuesta por más que el margen de error. El mayor problema fue que las encuestas estaban a favor de Trump en cinco estados importantes (también Pensilvania, Carolina del Norte y Florida). No está claro exactamente por qué eso podría ser cierto.

Tenga en cuenta que California tuvo un error casi tan alto ( 6,5% ) como Wisconsin. Simplemente lo ignoramos porque no cambió el resultado estatal (ganó Clinton) y porque fue en la dirección opuesta. Sin embargo, California tiene más sentido que Wisconsin como un lugar donde es probable que las personas no se sientan dispuestas a admitir que votaron por Trump.

Si hubiera un factor tímido de Trump, esperaríamos verlo más donde Trump fuera impopular. En cambio, Trump ganó las partes de Wisconsin que se esperaba que ganara por un margen inesperado . En todo el estado, obtuvo aproximadamente el mismo voto que Mitt Romney en 2012. Fue Hillary Clinton quien tuvo un desempeño inferior, obteniendo una votación más baja que la de Barack Obama.

Si la votación en Estados Unidos tiene un efecto Bradley, habríamos esperado verlo en 2012. Obama es exactamente el tipo de figura que el efecto Bradley dice que debería tener mejores resultados en las encuestas que en la realidad. Las encuestas deberían haber sobreestimado su voto. Sin embargo, en realidad, las encuestas subestimaron el porcentaje de votos de Obama en 2012. De hecho, subestimó el porcentaje de votos de Obama en más ( 3,2 % ) que el porcentaje de votos de Trump en 2016 ( 1,2 % ).

Se discute que hubo un "efecto Bradley" en la elección real de Bradley.

Detección

¿Es posible que podamos idear un sistema que detecte a las personas que mienten a los encuestadores? Por supuesto. Podríamos plantear una serie de preguntas inocuas que la gente no reconocería pero que nos permitirían estimar su voto. El problema es que incluso un pequeño margen de error en esa predicción abrumaría al supuesto factor conservador tímido. La diferencia en el margen en Wisconsin fue solo del 7,2% . Entonces, su método tendría que ser consistentemente más preciso que eso.

Otro problema con esto sería recopilar los datos. ¿Cómo sabrás los verdaderos sentimientos de la persona? El punto es que la persona miente en las encuestas sobre el voto real. ¿Cómo asociaría el resultado real con su resultado calculado? Tendrías que suponer que las personas que te dicen sinceramente que votan por el candidato tory dan las mismas respuestas que las que dicen que votan por el candidato Bradley pero que en realidad votan por el tory. Eso puede no ser cierto.

La presunción es que no quieren admitir su verdadera preferencia porque parece racista (anti-Bradley), económicamente egoísta (Tory), o alguna explicación similar. Hay múltiples razones para votar por cada candidato. Por ejemplo, algunas personas pueden haber votado a Trump porque era el único candidato republicano que podía ganar razonablemente. Pero ese es el tipo de cosas que alguien simplemente podría decir. Otros pueden preferir a Trump porque dice lo que piensa, por racista o misógino que sea. Esa es una razón más difícil de admitir.

Debe separar el grupo de votantes admitidos de Trump que prefieren a Trump por las mismas razones que los votantes ocultos de Trump de otros votantes admitidos de Trump. No está claro cómo hacer eso sin identificarlos primero.

Miré el sitio de Electoral Compass. Eso parece más tratar de adivinar quién te puede gustar que predecir realmente por quién podrías votar. Como detector de efecto Bradley, tiene el problema de no ocultar lo que intenta hacer. Sospecho que podría hacer que respondiera al resultado que quería que diera. Es probable que un votante conservador tímido le mienta al igual que a los encuestadores más tradicionales. La etapa en la que pregunta si varias personas son inteligentes, cariñosas, experimentadas, etc. funcionaría mejor, pero podría ser difícil calibrarla.

Muestreo estadístico

Digamos que pudimos superar todos esos problemas. Tenemos un sistema que hace ciertas preguntas y determina correctamente cómo votará esa persona con un 100% de precisión, incluso si esa persona miente en algunas respuestas. Eso todavía no nos da encuestas 100% precisas.

El problema es que las encuestas son una muestra de la población, no la población misma. Para obtener esa precisión del 100% en la predicción del voto, la encuesta tendría que cuestionar con éxito a cada votante. Más que eso, la encuesta tendría que determinar correctamente quién va a votar y quién no, también con un 100% de precisión.

La verdad es que el muestreo no es tan preciso. Un encuestador llama a mil teléfonos fijos (la llamada a móvil puede suponer un gasto para el destinatario, por lo que es más restringida). Más de la mitad de las personas que contestan dicen que no quieren hablar en este momento. Eso es autoselección y en sí mismo distorsiona la respuesta. Algunas personas nunca tomarán la encuesta.

Ese sesgo se suma a lo que se llama el margen de error. El margen de error es una construcción puramente matemática. Dice que si selecciona al azar un cierto número de una población más grande, la probabilidad de que su composición coincida con la de la población más grande es del 95% dentro del margen de error. Entonces, solo tiene un 5% de posibilidades de obtener una respuesta realmente incorrecta.

Ahora bien, ¿cuándo son más interesantes las encuestas? Cuando el resultado es cercano. ¿Cuándo es menos probable que las encuestas sean precisas? Cuando el resultado es cercano. Entonces, cuando más te importa cuál es el resultado, las encuestas no pueden predecir el ganador. ¿Por qué? Porque un resultado de encuesta del 50,1 % al 49,9 % podría representar igualmente una población con preferencias reales en cualquier lugar del 51,1 % al 48,9 % al 49,1 % al 50,9 %, incluso despreciando el 5 % de probabilidad de un resultado fuera de ese intervalo y cualquier sesgo de la encuesta. Y la mayoría de las encuestas no tienen un margen de error de solo el 1%.

Demografía

Otro problema es que el sesgo de selección a menudo se asocia con ciertos grupos demográficos. Por ejemplo, es más probable que los votantes en el grupo de edad de 18 a 29 años sean demócratas en los EE. UU. y que usen sus teléfonos celulares como únicos teléfonos. Las personas que trabajan muchas horas y nunca están disponibles tienen más probabilidades de ser republicanas. Entonces, los encuestadores ajustan sus encuestas demográficamente. Intentan artificialmente que sus encuestas tengan suficientes personas que voten como usuarios de teléfonos celulares y que voten como personas que trabajan una gran cantidad de horas.

El problema viene cuando tienen que estimar esos grupos demográficos. ¿Cuál es el mejor predictor de cómo será la demografía en un año electoral en particular? Una mirada retrospectiva a la demografía del último año electoral similar. Pero la demografía cambia cada elección. Y no sabemos cómo cambiarán hasta después de las elecciones. Podemos sondearlo, pero esa encuesta también está sujeta al sesgo de selección y al error de muestreo.

Todo esto se basa en una mala interpretación de cómo funcionan las estadísticas. Las encuestas decían que había un ~80% de posibilidades de que Clinton ganara. Eso significa que hay un ~20% de posibilidades de que Trump gane. De vez en cuando sucederá lo improbable. La gente quiere respuestas simples de "sí o no" a este tipo de preguntas, pero las encuestas (o, de hecho, la vida en general) simplemente no funcionan de esa manera.
@Brythan - Gracias por la elaborada respuesta. Me hace entender las recientes elecciones en USA. Sin embargo, mi pregunta es más sobre las formas de eludir estos problemas y obtener mejores predicciones. Por supuesto, Carpetsmoker tiene razón en no poder obtener el ganador exacto, ya que estamos hablando de estadísticas (se aplican otras reglas, no las de lógica binaria).
No es necesario que el "conservador tímido" mienta abiertamente, solo tiene que negarse a responder.