Problema para comprender el cálculo de las tasas base normativas (bayesianas)

Tengo problemas para entender la Tabla 1 de Gigerenzer, Hell, and Blank (1988, PDF , tabla en la página 516):mesa 1 gigerenzer

Centrándose en la fila de Jack, se afirma que las probabilidades medias de que Jack sea ingeniero fueron del 71,4 % en una condición de tasa base baja y del 81,3 % en una condición de tasa base alta. Por lo tanto, los participantes tomaron parcialmente en cuenta las tasas base. Si ignoraran por completo las tasas base, estos valores serían los mismos, en lugar de estar separados por un 9,9%. Así que creo que entiendo lo que está pasando en la columna Negligencia de tasa base.

Sin embargo, no entiendo qué está pasando en la columna bayesiana. Hay una nota explicativa al pie de página en la página 516, pero para mí no fue esclarecedora. La nota al pie proporciona las siguientes ecuaciones:

pag 70 ( mi | D ) / ( 1 pag 70 ( mi | D ) ) = L 0.7 0.3
pag 30 ( mi | D ) / ( 1 pag 30 ( mi | D ) ) = L 0.3 0.7

Entonces, dado que la suposición media para la condición del 70% fue 81.3%, obtenemos

81.3 / 18.7 = L   0.7 / 0.3 = 81.3 / 18.7 = L   2.33 = 4.35 = L   2.33 = 1.86 = L

Sin embargo, cuando conecto esto L valor en el pag 30 ecuación obtengo un valor para pag 30 ( mi | D ) que se desvía enormemente tanto del valor 'bayesiano' como de lo que realmente se observó. Según la tabla, la desviación media del bayesiano debería ser del 16,1 %, pero según mis cálculos es mucho mayor. Agradecería mucho si alguien pudiera decirme qué estoy haciendo mal.

Referencias

  • Gigerenzer, G., Hell, W. y Blank, H. (1988). Presentación y contenido: El uso de tasas base como variable continua. Journal of Experimental Psychology: Human Perception and Performance, 14, 513. PDF
Esto probablemente recibiría más atención en Stats.SE .
@eykanal Creo que estaría en el tema en ambos sitios. Las preguntas en la interfaz de los métodos cuantitativos y la psicología/ciencia cognitiva son muy bienvenidas aquí, como se ve en los votos a favor.

Respuestas (1)

Creo que está haciendo el cálculo correctamente, pero Gigerenzer y Blank no nos proporcionaron los resultados completos de su experimento, lo que nos impide repetir sus cálculos exactamente: los datos proporcionados en las columnas 1 y 2 de la tabla son solo los promedios . Los datos en la columna 4 (bayesiana) no son una transformación del valor promedio utilizando alguna fórmula (ver a continuación), sino que los datos originales se transformaron y luego se promediaron :

Para cada sujeto en el grupo de tasa base del 70 %, predijimos, utilizando el teorema de Bayes, cómo habría respondido este sujeto en el grupo de tasa base del 30 %.

Si divide la primera ecuación de la nota al pie por la segunda y obtiene una fórmula para p30 en función de p70, obtiene:

pag 30 ( mi | D ) pag 70 ( mi | D ) 5.44 4.44 pag 70 ( mi | D )

Tenga en cuenta que esta función es estrictamente convexa en la región [0,1], lo que significa que si la calcula en el promedio p70, obtendrá un valor que es más bajo que el valor que obtendría al promediar los valores de varios datos. puntos.

Como ejemplo, examinemos la fila Jack: si transformas la media p70 de 0,813, obtienes p30 de 0,44, que tiene una desviación de 0,27 de la media observada p30 (como probablemente hayas encontrado). Supongamos que los datos en la fila Jack, en la columna p70 se obtuvieron de dos sujetos, que respondieron 0.968 y 0.658 (produciendo el promedio de 0.813 que se informa en la tabla). Transforme estos dos valores y obtendrá 0,848 y 0,261, respectivamente, lo que arroja un p30 promedio de 0,553, lo que daría una desviación bayesiana de 0,161 exactamente como se indica en la columna 4.