¿Cómo obtener una idea eficiente del significado de un puntaje en una prueba de no aptitud que encuentra en un artículo de revista?

Contexto: cuando lee artículos de investigación en psicología, a menudo encuentra nuevas pruebas psicológicas de autoinforme que no son de aptitud (por ejemplo, medidas de personalidad, bienestar, psicopatología, estilo de aprendizaje, estrés, orientación a objetivos, etc.). La mayoría de estas pruebas implican obtener la suma o la media de un conjunto de ítems para una o más escalas o subescalas. Cada elemento generalmente incluye texto de elemento y un conjunto consistente de opciones de respuesta (por ejemplo, escalas de respuesta tipo Likert, escalas de respuesta sí-no, etc.). Hay miles de tales escalas, algunas de las cuales se usan con frecuencia; otros se usan solo una vez.

Se ha escrito mucho sobre cómo evaluar la validez de las pruebas . Sin embargo, aquí quería centrarme particularmente en cómo evaluar lo que significa un puntaje individual o grupal en particular. Específicamente, estoy pensando en la situación en la que estás leyendo un artículo de revista y te encuentras con una escala que no has visto antes, como:

  • Una medida de autoestima de 10 ítems en una escala de 1 a 5; la media del grupo es 3,2. ¿Es la muestra generalmente alta, baja o moderada en autoestima?
  • Check-list de 30 ítems de buenos hábitos alimentarios con una media de 20,7. ¿La muestra tiene buenos hábitos alimenticios?

Para pruebas bien desarrolladas, existe un manual de pruebas. Otras veces hay un sitio web o un artículo de revista clave con información. Finalmente, en algunos casos, muy poca información está fácilmente disponible. En algunos casos, se brinda información útil en la sección de métodos, pero por lo general, por sí sola, es inadecuada. Por lo tanto, comienza el proceso de tratar de localizar información como el contenido del elemento y las comparaciones normativas.

Mucho se ha dicho acerca de la interpretación de pruebas normativas y con referencia a criterios . Si está utilizando una prueba en la práctica clínica o está utilizando una prueba en su propia investigación, debe invertir tiempo en comprender qué significan realmente las diferentes puntuaciones en la prueba. Sin embargo, al leer casualmente un artículo de revista, puede encontrarse con muchas pruebas. En tales casos, el artículo es uno de muchos, y es posible que desee obtener una idea rápida de lo que significa un puntaje determinado.

Pregunta

  • ¿Cuál es una buena manera de obtener una comprensión normativa y absoluta del significado de un puntaje de prueba de no aptitud grupal o individual?
  • ¿Cuál es una forma eficiente de obtener la información requerida para hacer tal juicio?

Tenga en cuenta el uso del término "no aptitud". Me gustaría excluir la discusión de pruebas de inteligencia, pruebas de habilidad, pruebas de conocimiento, etc.

Actualización: para aclarar, no quise dar a entender en la pregunta que la información del artículo no estaba disponible en ninguna parte. Supongo que la pregunta se refiere a la situación general donde probablemente haya usos previos de la medida en la literatura, y podría haber un artículo clave que describa la medida en alguna parte. Supongo que estoy pensando en una buena estrategia general para obtener información relevante y luego usarla para comprender las propiedades de la escala.

Respuestas (1)

Pregunta difícil.

Voy a suponer que la pregunta se refiere a medidas que carecen de toda la información que ha descrito: manual de prueba, estudios de validez, sitio web y artículos clave, contenido de elementos y comparaciones normativas. Si estas suposiciones son correctas, entonces lo que está describiendo es una medida insuficientemente explicada. Argumentaré que necesariamente no podemos saber qué significa tal escala en ningún sentido científico.

Una escala es una medida. Una medida científica es un proceso que genera evidencia, es decir, observaciones que discriminan entre diferentes respuestas posibles a una pregunta específica. (Los datos pueden constituir evidencia con respecto a una pregunta y no a otra). El resultado de esta discriminación, o análisis, es lo que "significa" la escala, es decir, la interpretación lógicamente sólida que podemos hacer sobre la base del análisis de la evidencia.

Para determinar si un método, de hecho, genera evidencia, necesitamos poder replicarlo independientemente. Pero las premisas implican que no tenemos suficiente información para hacerlo. Debido a que no podemos verificar de forma independiente qué hipótesis discrimina la evidencia generada por el método, si las hay, no hay forma de saber qué significa.

La primera vez que hice una respuesta de metodología pura, así que llámalo prueba. No me siento muy bien acerca de la falta de referencias para la definición de evidencia, pero ni siquiera sé por dónde empezaría a rastrearlas. Pensamientos, comentarios, votos negativos bienvenidos.
Tiendo a estar de acuerdo con la conclusión de que una comprensión normativa o absoluta de la prueba es imposible dadas las premisas que están en la pregunta. Creo que la mejor solución, que no es muy buena, es recopilar los datos usted mismo.
Gracias por volver a esta pregunta. Para aclarar, no quise dar a entender en la pregunta que la información del artículo no estaba disponible en ninguna parte. Supongo que la pregunta se refiere a la situación general donde probablemente haya usos previos de la medida en la literatura, y podría haber un artículo clave que describa la medida en alguna parte. Supongo que estoy pensando en una buena estrategia general para obtener información relevante y luego usarla para comprender las propiedades de la escala.
@JeromyAnglim Entonces, solo para aclarar ... algo como (1) ¿Qué información necesitamos para interpretar una escala? (2) ¿Cómo podemos obtener esa información de la manera más efectiva?
@ChristianHummeluhr Sí :-)