¿Cuál es la media óptima correcta en una prueba de opción múltiple para maximizar la medición de las diferencias individuales?

¿Cuál es la media correcta óptima en un elemento de prueba de opción múltiple para maximizar la medición de las diferencias individuales?

Respuestas (1)

Tengo entendido que, en general, un porcentaje correcto del 50% es óptimo cuando no hay lugar para adivinar. Sin embargo, en las pruebas de opción múltiple hay un cierto número de opciones de respuesta. Por lo tanto, la probabilidad de obtener la respuesta correcta si no sabe nada, es uno sobre el número de opciones de respuesta.

En este caso creo que lo óptimo es:

1 / k + 1 1 / k 2

donde k es el número de opciones de respuesta.

Entonces el óptimo para diferentes valores de k sería:

  • k = 2: proporción óptima correcta = 0,75
  • k = 3: proporción óptima correcta = 0,67
  • k = 4: proporción óptima correcta = 0,625
  • k es infinito: proporción óptima correcta = 0.50

Dicho esto, todavía me gustaría encontrar las referencias clásicas de donde obtuve estas ideas. Y me imagino que la teoría de la respuesta al ítem podría tener algo más que decir al respecto, particularmente con respecto a la recomendación común de variar la proporción correcta en un rango.

Además, ninguna de las recomendaciones anteriores aborda el problema de que establecer la dificultad en el nivel anterior para la mayoría de los elementos puede resultar intimidante para algunos examinados.

Si cree que "la probabilidad de obtener la respuesta correcta si no sabe nada, es uno sobre el número de opciones de respuesta", ¿no esperaría simplemente 0,5 en lugar de 0,75 para dos opciones? ¿Podría explicar un poco más por qué agregaría la segunda parte de la fórmula?
Si las respuestas a una prueba son puramente aleatorias (es decir, la media correcta es del 50 % en una pregunta VERDADERO/FALSO), lo más probable es que no esté aprendiendo nada sobre los examinados. Solo cuando algunas personas pueden responder la pregunta y otras no, es cuando aprendes sobre las diferencias individuales. O más precisamente, las personas diferirán en una distribución de conocimiento y la ubicación en esa distribución debería influir en la probabilidad de responder un ítem correctamente. Entonces, un nivel de dificultad informativo está a medio camino entre una respuesta aleatoria y que todos respondan el ítem correctamente.
Ah ahora veo. Entonces, ¿este valor corregiría las diferencias entre pruebas, dentro de los sujetos, de modo que una puntuación de 75 en una prueba de dos opciones correspondería a un 67 en una prueba de tres opciones?
No se trata tanto de las diferencias de prueba. Es más una cuestión de qué tan difícil un diseñador de pruebas debe hacer elementos de opción múltiple para maximizar la confiabilidad y la validez.