¿Cómo se correlacionan los resultados de Google Trends con el apoyo real del partido?

¿Alguien ha estudiado la correlación entre el apoyo a los partidos en las elecciones y los resultados de Google Trends? ¿Cuál es la conclusión? Especialmente estoy interesado en la situación en Finlandia .

Ha habido estudios que correlacionan los Tweets con los votos. No sé acerca de las tendencias de Google. Parece una forma menos directa, ya que la búsqueda de términos no está tan claramente relacionada con tener una opinión en un sentido o en otro.
@Fizz: sí, recuerdo que asistí a una conferencia tecnológica un día después de las últimas elecciones estadounidenses. Un presentador había preparado una presentación de análisis de sentimientos sobre tuits relacionados con Clinton y Trump 1 o 2 días antes de las elecciones. Los resultados del análisis se correlacionaron con los resultados de las elecciones (aunque no fue el enfoque de la presentación).

Respuestas (2)

Hay uno en The Economist que básicamente compara Google Trends ("datos de búsqueda") con la predicción de los apostadores; este último ganó, y aparentemente "incluyó" por completo los datos de búsqueda de Google (explicados debajo del gráfico):

ingrese la descripción de la imagen aquí

Querrás leer la metodología, es demasiado larga para pegarla aquí. En resumen:

Las cifras del mercado de predicción [Intrade] lo hicieron muy bien, llamando correctamente al vencedor en 91 de 107 carreras. Por el contrario, las probabilidades basadas en Google eligieron al ganador correcto solo 59 veces (ver gráfico). [...] Sin embargo, parece que los apostadores de Intrade ya eran plenamente conscientes de todo el conocimiento proporcionado por Google, ya sea porque de hecho estaban usando datos de Google para informar sus apuestas, o porque otras fuentes en las que confiaban contenían información similar. El logaritmo de verosimilitud (LL), una medida de qué tan cerca se ajustan las estimaciones hechas por una regresión logística a los resultados reales, de los números de Intrade por sí mismos fue -86,70. El LL de un modelo combinado, que representa la combinación más precisa posible de las dos fuentes de datos, fue prácticamente indistinguible de -86,52. Y el resultado de las dos ecuaciones era prácticamente idéntico,

Tenga en cuenta que se basa en una versión especializada de Trends, que se ve así:

ingrese la descripción de la imagen aquí


También hay un artículo de algunos informáticos griegos sobre la predicción de las elecciones alemanas. (probablemente porque sus propias elecciones ya no parecen importar mucho, je).

Afirman mejores resultados, pero el problema es que necesitan hacer un lavado de datos (¿manual?), Por ejemplo.

alrededor del 12 de septiembre, el WI de la palabra "Steinbruck" presenta una variación alta que no es seguida por una variación similar del WI [Interés de búsqueda en la web--reportado por Google Trends] para el nombre del líder del partido competidor. Ese día, el dirigente del SPD concedió una entrevista al canal nacional ARD TV y esa fue la razón principal de la importante variación del WI correspondiente. Este evento no incluyó a un representante del partido rival, por lo tanto, el aumento significativo del WI para "Steinbrück" no refleja necesariamente la disposición de los votantes potenciales, quienes parecen buscar este término más por curiosidad sobre lo que sucedió en el evento específico. y menos porque realmente quieren votar por el partido correspondiente. Por lo tanto, se requiere un ajuste al conjunto de datos de entrada del algoritmo para eliminar el ruido generado por este evento. De acuerdo con esta lógica, los valores de WI para el nombre de ese líder alrededor de las fechas del programa de televisión se ignoran. La figura 5 muestra el WI real y el WI después del ajuste.

ingrese la descripción de la imagen aquí

También usan datos de variación histórica (algo que hacen los encuestadores del Reino Unido) para lograr una precisión mucho mayor para las elecciones más recientes (alrededor del 5 %).

ingrese la descripción de la imagen aquí

No sé si alguien intentó replicar este método con otras elecciones/países.

No pude encontrar un estudio sobre la correlación entre los resultados de Google Trends y el apoyo real del partido, pero encontré un artículo sobre cómo Google Trends y los conceptos de campaña podrían conducir a un aumento del apoyo del partido/candidato:

Según Google, el tema principal en 2016 no ha sido la economía, la desigualdad de ingresos o incluso las relaciones raciales; ha sido la inmigración.

Cuando los votantes han elegido un tema dominante en un ciclo electoral, el ambiente político está preparado para un candidato de línea dura que pueda sacar ventaja. Esto suele ir acompañado de una intensa cobertura mediática. Durante el verano de 2015, la inmigración tuvo una racha de 17 semanas consecutivas además; al mismo tiempo, Trump entró en la contienda e hizo de la inmigración el sello distintivo de su campaña.

Por lo tanto, no es que la gente esté buscando más un candidato/partido que se correlacione con el apoyo, sino que la gente busca más y el candidato/partido que utiliza ese concepto gana el apoyo.

Google Trends es solo una buena muestra de datos de búsqueda que muestran el interés por algún tema:

Los datos de tendencias son una muestra imparcial de nuestros datos de búsqueda de Google. Está anonimizado (nadie está identificado personalmente), categorizado (determinando el tema para una consulta de búsqueda) y agregado (agrupado). Esto nos permite medir el interés en un tema en particular a través de la búsqueda, de todo el mundo, hasta el nivel geográfico de la ciudad.

Para evaluar el apoyo (sentimiento positivo hacia el partido/candidato), creo que estos datos deben complementarse con análisis de sentimientos y emociones .

Entonces, mi sensación es que una correlación directa es bastante improbable, pero podría ser una correlación entre un concepto de campaña como la inmigración, los impuestos, los problemas ambientales, etc. que aumentan las tendencias y el mismo concepto que utiliza el partido político.