Contexto: cuando lee artículos de investigación en psicología, a menudo encuentra nuevas pruebas psicológicas de autoinforme que no son de aptitud (por ejemplo, medidas de personalidad, bienestar, psicopatología, estilo de aprendizaje, estrés, orientación a objetivos, etc.). La mayoría de estas pruebas implican obtener la suma o la media de un conjunto de ítems para una o más escalas o subescalas. Cada elemento generalmente incluye texto de elemento y un conjunto consistente de opciones de respuesta (por ejemplo, escalas de respuesta tipo Likert, escalas de respuesta sí-no, etc.). Hay miles de tales escalas, algunas de las cuales se usan con frecuencia; otros se usan solo una vez.
Se ha escrito mucho sobre cómo evaluar la validez de las pruebas . Sin embargo, aquí quería centrarme particularmente en cómo evaluar lo que significa un puntaje individual o grupal en particular. Específicamente, estoy pensando en la situación en la que estás leyendo un artículo de revista y te encuentras con una escala que no has visto antes, como:
Para pruebas bien desarrolladas, existe un manual de pruebas. Otras veces hay un sitio web o un artículo de revista clave con información. Finalmente, en algunos casos, muy poca información está fácilmente disponible. En algunos casos, se brinda información útil en la sección de métodos, pero por lo general, por sí sola, es inadecuada. Por lo tanto, comienza el proceso de tratar de localizar información como el contenido del elemento y las comparaciones normativas.
Mucho se ha dicho acerca de la interpretación de pruebas normativas y con referencia a criterios . Si está utilizando una prueba en la práctica clínica o está utilizando una prueba en su propia investigación, debe invertir tiempo en comprender qué significan realmente las diferentes puntuaciones en la prueba. Sin embargo, al leer casualmente un artículo de revista, puede encontrarse con muchas pruebas. En tales casos, el artículo es uno de muchos, y es posible que desee obtener una idea rápida de lo que significa un puntaje determinado.
Tenga en cuenta el uso del término "no aptitud". Me gustaría excluir la discusión de pruebas de inteligencia, pruebas de habilidad, pruebas de conocimiento, etc.
Actualización: para aclarar, no quise dar a entender en la pregunta que la información del artículo no estaba disponible en ninguna parte. Supongo que la pregunta se refiere a la situación general donde probablemente haya usos previos de la medida en la literatura, y podría haber un artículo clave que describa la medida en alguna parte. Supongo que estoy pensando en una buena estrategia general para obtener información relevante y luego usarla para comprender las propiedades de la escala.
Pregunta difícil.
Voy a suponer que la pregunta se refiere a medidas que carecen de toda la información que ha descrito: manual de prueba, estudios de validez, sitio web y artículos clave, contenido de elementos y comparaciones normativas. Si estas suposiciones son correctas, entonces lo que está describiendo es una medida insuficientemente explicada. Argumentaré que necesariamente no podemos saber qué significa tal escala en ningún sentido científico.
Una escala es una medida. Una medida científica es un proceso que genera evidencia, es decir, observaciones que discriminan entre diferentes respuestas posibles a una pregunta específica. (Los datos pueden constituir evidencia con respecto a una pregunta y no a otra). El resultado de esta discriminación, o análisis, es lo que "significa" la escala, es decir, la interpretación lógicamente sólida que podemos hacer sobre la base del análisis de la evidencia.
Para determinar si un método, de hecho, genera evidencia, necesitamos poder replicarlo independientemente. Pero las premisas implican que no tenemos suficiente información para hacerlo. Debido a que no podemos verificar de forma independiente qué hipótesis discrimina la evidencia generada por el método, si las hay, no hay forma de saber qué significa.
Christian Hummeluhr
Josh de Leeuw
Jeromy Anglim
Christian Hummeluhr
Jeromy Anglim