¿Cómo medir la precisión en el marco de la teoría clásica de pruebas?

¿Qué métodos o enfoques existen o podrían desarrollarse para medir la precisión de la medición en un marco de teoría de prueba clásica? Standards for Educational and Psychological Testing (American Psychological Association, 2014) habla sobre la precisión de la medición en varios lugares, pero no parece proporcionar ninguna referencia.

Además, ¿en qué medida la precisión de la medición en la teoría IRT es similar o diferente del acuerdo absoluto en la puntuación (en oposición a la confiabilidad entre evaluadores o la confiabilidad de la prueba medida por alfa) en CTT?

Respuestas (1)

'Precisión' en la teoría clásica de pruebas

La mayoría de las explicaciones de la teoría clásica de pruebas no tienen una noción de precisión como tal, pero en ocasiones, la confiabilidad puede llamarse precisión en su lugar. La relación probablemente se ilustra de manera más concisa con los tableros de dardos estándar. Esto también se explica en la página Teoría de la respuesta al ítem de Wikipedia , pero como puede ver, en CTT, la precisión es a la confiabilidad lo que la exactitud es a la validez.

ingrese la descripción de la imagen aquí Mechón U

( Artículo de confiabilidad de Wikipedia yuxtapuesto con una guía de la Universidad de Tufts .

Origen de la 'precisión' en la teoría clásica de las pruebas

Cronbach (1951) sugirió a Coombs (1950) como el origen de la confusión confiabilidad/precisión.

Coombs (6) ofrece el nombre algo más satisfactorio de "coeficiente de precisión" para este índice que informa el error mínimo absoluto que se encuentra si el mismo instrumento se aplica dos veces independientemente al mismo sujeto. Se puede obtener un coeficiente de estabilidad haciendo las dos observaciones con cualquier intervalo deseado entre ellas. Entonces, una definición rigurosa del coeficiente de precisión es que es el límite del coeficiente de estabilidad, ya que el tiempo entre las pruebas se vuelve infinitesimal.

No estoy completamente seguro de si estoy interpretando correctamente la pregunta secundaria, pero la precisión de IRT es una medida de precisión bajo IRT, y el ICC es una medida de confiabilidad bajo CTT. La principal diferencia es que CTT expresa la confiabilidad como un valor único, mientras que IRT expresa la precisión para diferentes valores del rasgo subyacente. Sin embargo, esto no es específico del acuerdo absoluto, así que tal vez estoy malinterpretando.

Referencias

No entiendo su vocabulario: "la precisión es válida". ¿Son sinónimos precisión y validez? ¿Confiabilidad y precisión son sinónimos bajo CTT?
Es más un paralelo. En pocas palabras, no hay "precisión" en CTT, solo "confiabilidad".