¿Cómo puede una pequeña encuesta modelar con precisión una elección?

¿Cómo puede un encuestador modelar o predecir el resultado de una elección en una población grande y demográficamente diversa con tamaños de muestra relativamente pequeños (una o dos mil personas)? ¿Son las personas así de predecibles, estadísticamente hablando?

Respuestas (2)

Esencialmente, la clave es seleccionar una buena muestra aleatoria. En general, la muestra tiene una precisión de la mitad de la raíz cuadrada del número de personas a las que se les pregunta. Dado el número estándar de 1000 personas, eso significa que el número debe tener una precisión de 17 personas más o menos. Dividido por las 1000 personas originales por la mitad, y tomando 17/500, tenemos los límites de error tradicionales del 3,4 % que normalmente se dan para los datos de las encuestas.

Específicamente, la siguiente es la clave para una buena encuesta:

  • Muestreo aleatorio con las mismas estadísticas que el grupo base.
  • Trabajadores electorales imparciales, que no influirán en los resultados.
  • Respuesta veraz a las preguntas.
  • La persona a la que se le pregunta no cambiará de opinión entre ahora y la votación real.

Suponiendo que esto sea cierto, entonces caeremos en el ámbito de las estadísticas de muestreo . La fórmula general es sqrt((pp^2)/n). Asumiendo que la carrera está casi dividida, entonces esto da sqrt(.25/n), o 1/(2*sqrt(n)). Nuevamente, para la muestra aleatoria de 1000, esto le permitirá saber qué tan precisa es una parte de los números. Dividiéndolo por la mitad del cuerpo completo, obtienes 3.4%.

Si estos no son ciertos, entonces se podría aplicar algún factor correctivo a la encuesta. Aquí es donde las cosas se ponen complicadas. La mayoría de las encuestas se realizan por teléfono. Para aquellos que no tienen acceso a teléfonos, esto distorsionará los datos. Lo que normalmente se hace para corregir esto es recopilar información adicional sobre la persona encuestada y corregir los datos generales para que se ajusten mejor al modelo de quién está votando realmente.

Si bien esta es una buena base para una respuesta, creo que se puede elaborar. Lo haría, pero mis clases de estadística se terminaron hace mucho...
Estoy trabajando en ello lentamente... Me parece mejor guardar mi trabajo mientras respondo preguntas complejas como esta...
¡Genial, sigue así y estoy feliz de leer la respuesta final!
Bueno, eso es todo lo que voy a hacer por ahora. Quizá añada más más tarde...

Similar al sabor de una sopa bien mezclada. No tienes que ingerir la mayor parte de la sopa para saber si necesita más condimento.

Las proporciones calculadas a partir de muestras aleatorias simples son estimadores imparciales de la proporción de la población.

Eso le permite decir cosas como "alrededor del 95 % de las proporciones de la muestra calculadas a partir de muestras aleatorias simples de tamaño 1000 estarán dentro de los 3,6 puntos porcentuales de la verdadera proporción de quienes apoyan al Candidato A".

Como otro, si sospecha que el apoyo al Candidato A es del 51%, puede calcular la probabilidad de obtener una muestra aleatoria simple de tamaño 523 donde 250 o más encuestados apoyan al Candidato A, etc.

Una sola encuesta realmente no puede decirte todo eso. Sin embargo, un montón de encuestas, siempre que los encuestados se elijan al azar, pueden decirte mucho.

Incluso cuando las firmas de encuestas individuales están sesgadas hacia un candidato u otro, puede controlar esos sesgos de manera similar a como lo hace Nate Silver.

El único problema real ocurre cuando las encuestas sistemáticamente pasan por alto a ciertos individuos.

Precaución: el "margen de error" y el "intervalo de confianza" son términos frecuentemente mal utilizados.

NB: Hace algún tiempo, preparé una nota extremadamente simplificada sobre estas cosas.