¿Cuándo es defendible utilizar variables manifiestas en lugar de variables latentes en la investigación psicológica?

En psicología, la mayoría de los conceptos, teorías, ideas, etc. de interés se refieren a variables latentes , donde una variable latente es aquella que no se puede observar directamente. En cambio, uno tiene que encontrar una variable manifiesta , que se pueda observar directamente y que se pueda usar como indicador de la variable latente. A menos que haya un indicador perfecto (que generalmente no lo hay), la medición de la variable latente contiene un error. Para estimar el error se han desarrollado técnicas de modelado de variables latentes como CFA o Teoría de Respuesta al Ítem (entre otras).

Teoría de la variable latente

Ahora bien, en general se acepta que variables como la edad y el género son manifiestas. Pero, ¿qué es lo que marca la diferencia entre una variable latente y una manifiesta? Borsboom (2008) explica esta diferencia. En su teoría de la variable latente , la distinción depende de la certeza con la que se puede hacer una inferencia a partir de los datos observados a la variable en cuestión. En este sentido, se manifiesta una variable como el género, porque se puede inferir con certeza si un sujeto es hombre o mujer a partir de su respuesta en un cuestionario. Tenga en cuenta que esto es posible, aunque uno no haya observado realmenteel género de ese sujeto. La explicación de Borsboom de la teoría de la variable latente también implica que el estado de una variable como latente frente a manifiesta puede cambiar con el tiempo, si, por ejemplo, se vuelve accesible más información. Pero mientras una variable ha demostrado ser manifiesta, permanece latente.

Me parece, entonces, que casi todos los investigadores en psicología deberían usar técnicas de modelado de variables latentes, ya que la mayoría de las veces no es posible inferir algo con certeza. Como sea, este no es el caso. Existen numerosos artículos publicados que utilizan variables manifiestas y analizan las relaciones entre ellas sin tener en cuenta el error de medición, lo que implícitamente convierte a la variable latente en cuestión en una variable manifiesta. (Si alguien quiere citas para este reclamo, con gusto se las proporcionaré).

Pregunta: ¿Bajo qué circunstancias es defendible usar variables manifiestas en lugar de latentes en la investigación psicológica, incluso si está claro que las variables solo pueden medirse con error?

Borsboom, D. (2008). Teoría de la variable latente. Medición: investigación y perspectiva interdisciplinaria , 6(1-2), 25-53. PDF

Quizás le interese el artículo clásico de Lee Cronbach “Las dos disciplinas de la psicología científica”. Creo que Dennis Borsboom también escribió algo sobre eso.
Por cierto, la forma en que enmarca su pregunta parece sugerir que está viendo esto desde una perspectiva psicométrica/psicológica de la personalidad. Mirándolo desde una perspectiva de psicología experimental, también podría preguntarse: ¿Realmente vale la pena todo el bagaje técnico, la recopilación de datos, etc. necesarios para la variable latente?
@GaëlLaurans: Es cierto que abordé esta pregunta desde una perspectiva psicométrica. Pero mi pregunta al final estaba pensada exactamente de la manera que usted sugiere: ¿Cuáles son los casos en los que un enfoque de variable latente no es tan útil? Me doy cuenta de que esto significa que supongo que en la mayoría de los casos es útil. (gracias por la pista con el papel, lo buscaré.)
@GaëlLaurans: No creo que, desde la perspectiva de la psicología experimental, se requiera mucho esfuerzo adicional para adoptar un enfoque de variable latente. Es posible que necesite un indicador adicional, pero creo que eso es todo. La diferencia está en cómo analizas los datos.
¿Cuántos psicólogos experimentales conoces? ¿Lees revistas de psicología experimental? Lo haces parecer como si no fuera mucho, pero conocer/aprender las técnicas ya es un gran esfuerzo. Tratar con el hecho de que usted está interesado en las respuestas de los participantes a diferentes estímulos (a diferencia de los rasgos) tampoco es fácil y hace que gran parte de la literatura/material introductorio sobre variables latentes sea básicamente irrelevante. También creo que obtener resultados razonables requeriría muestras más grandes que los experimentos típicos de psicología (muchos tienen N = 10 a 40).
Creo que esto se está desviando un poco del tema. Mi pregunta era sincera, quería obtener respuestas de las personas en este sitio sobre lo que creen que podrían ser preguntas psicológicas que pueden/deben investigarse utilizando variables manifiestas. Sin embargo, no quería menospreciar a nadie, ni restarle importancia a la psicología experimental, que me parece de lo que me está acusando. Soy un gran creyente en la ciencia empírica. Tampoco creo que hacer experimentos o aprender técnicas sea fácil. Y, de hecho, estoy de acuerdo con la mayoría de sus argumentos (por ejemplo, el tamaño de la muestra) y tengo la sensación de que tenemos puntos de vista similares.

Respuestas (3)

Los psicólogos experimentales parecen bastante contentos de trabajar con escalas de autoinforme ad hoc de un solo elemento, medidas fisiológicas, etc. con muy poca evaluación psicométrica, por lo que incluso antes de hablar sobre un enfoque completo de modelado de variables latentes, análisis factorial confirmatorio y similares, es posible que desee Me pregunto por qué parecen relativamente despreocupados por los problemas de medición en general y por qué todavía hay una brecha tan grande entre la psicología experimental y la psicometría.

Algunas posibles explicaciones (algunas de ellas no son justificaciones muy convincentes para no hacer modelos de variables latentes, pero aún así explican por qué las personas se contentan con usar variables manifiestas):

  • El experimentalista puede crear efectos (relativamente) fuertes. Si está realizando un experimento en el que intenta inducir disgusto mostrando imágenes de cosas desagradables a las personas y sus imágenes no parecen producir un efecto medible, podría intentar mejorar su medición, pero también puede usar imágenes aún más desagradables. o agregue algunas pruebas adicionales en su experimento. Por otro lado, cuando está creando una prueba de personalidad con fines de reclutamiento, no puede simplemente desear que los candidatos sean más diferentes entre sí para facilitar su tarea o contentarse con estimar el promedio de todos los candidatos, realmente necesita asigna una puntuación a cada candidato con un nivel de precisión que te permita discriminar entre ellos.
  • Se basan en la naturaleza de la manipulación y sus efectos en la respuesta y no principalmente en la correlación entre diferentes escalas para interpretar sus resultados.
  • A menudo están interesados ​​en las diferencias de grupo. (Las diferencias entre individuos a menudo empequeñecen cualquier error relacionado con los elementos, entonces, ¿por qué preocuparse por eso? ¡Solo agregue algunos participantes!)
  • Todavía estructuran sus experimentos como una prueba de alguna hipótesis 'nula' (¿hay un efecto o no?)
  • No están muy interesados ​​en los tamaños del efecto como tales, una consecuencia del punto anterior (si calculan alguna medida del tamaño del efecto, es principalmente con miras al poder estadístico).

En resumen, si cualquier diferencia estadísticamente significativa se considera un resultado interesante (es decir, su manipulación tuvo un efecto), no necesita preocuparse demasiado por la confiabilidad o el significado de la respuesta.

Curiosamente, parece estar abordando la pregunta desde un campo, asumiendo que el modelado de variables latentes es claramente útil y que las personas necesitan defenderse activamente por no hacer lo correcto obvio. También puede darle la vuelta a la pregunta y preguntar: "¿Es tan útil el modelado de variables latentes? ¿Qué nos compra? En el contexto que acabo de destacar, puede que no sea tan fácil articular una respuesta convincente.

Y, por supuesto, en la práctica, muchas personas solo se preocupan por la metodología en la menor medida posible para dedicarse a sus negocios, publicar y hacer las cosas que consideran realmente interesantes. En consecuencia, muchos investigadores no escuchan mucho sobre el modelado de variables latentes después de terminar su maestría y ni siquiera les importa de una forma u otra porque simplemente no es la forma en que se hacen las cosas en sus disciplinas.

Estoy totalmente de acuerdo contigo en todo el tema de la psicología frente a la psicometría. Desde que comencé a interesarme por estos temas, la falta de preocupación por la medición me ha desconcertado.

Es una pregunta interesante. Aquí hay un montón de pensamientos que me vinieron a la mente sobre por qué los investigadores podrían centrarse en las variables observadas.

  • Muchos investigadores informan sobre la confiabilidad y las relaciones observadas entre las variables. Al adoptar algunas suposiciones, el lector puede estimar cuáles serían las relaciones latentes (ver, por ejemplo, la fórmula para la corrección de la atenuación ).

  • Algunos investigadores interpretan los tamaños de sus efectos en relación con otros estudios que han informado variables observadas . Por lo tanto, los tamaños del efecto no se interpretan en términos absolutos. En áreas donde los tamaños del efecto se informan típicamente utilizando variables observadas, este marco de referencia puede tener más sentido. Dicho esto, esto se vuelve problemático cuando la confiabilidad varía entre los estudios. En estos casos, las correcciones metaanalíticas al estilo de Hunter y Schmidt por falta de confiabilidad generalmente conducen a resultados más comparables.

  • El modelado de variables observadas implica menos opciones de modelado que el modelado de variables latentes. En particular, las estimaciones de las relaciones entre las variables latentes dependen de los supuestos para estimar las variables latentes. Si, como lector, no está de acuerdo con estas suposiciones, puede ser difícil recuperar las relaciones entre las variables observadas.

  • Modelar variables observadas es más simple que modelar variables latentes. Esto ayuda a explicar por qué muchos investigadores reportan matrices de correlación y regresiones en psicología, en lugar de equivalentes de variables latentes. Sin embargo, las cosas pueden volverse mucho más complejas a medida que se sale de los contextos SEM normales multivariados estándar: por ejemplo, incorporando variables categóricas, efectos moderadores, variables latentes mal definidas, efectos no lineales, varianza de error no normal, varianza de error correlacionada , etcétera. Es comprensible que algunos investigadores de las ciencias sociales recurran al territorio más familiar de modelar las variables observadas por partes. Sin embargo, si bien esta es una explicación, los investigadores aún deben esforzarse por modelar los datos de formas más integradas y realistas.

  • En última instancia, es el investigador quien decide si desea extraer inferencias sobre las relaciones entre las variables observadas o latentes . Si bien algunos contextos sugieren que el investigador debería estar interesado en el constructo subyacente, todavía depende del investigador decidir.

  • Las relaciones entre las variables observadas a veces son de interés primordial . Algunos ejemplos: (a) condiciones experimentales; (b) cuando los investigadores están interesados ​​en la predicción aplicada; (c) cuando los investigadores están interesados ​​en la variable observada en sí.

  • Si los investigadores modelan las variables latentes parece estar relacionado con el dominio . En particular, el modelado de variables latentes parece ser particularmente popular en campos con muestras grandes, diseños observacionales, que utilizan autoinforme o escalas psicológicas de opción múltiple. En tales contextos, la suposición de que las variables observadas son una muestra aleatoria de posibles variables observadas y son una manifestación de una variable latente, a menudo parece más apropiada. Es fácil imaginar los elementos alternativos que podrían haberse recopilado y cómo se podría haber mejorado la confiabilidad si se hubieran incluido más elementos. Es interesante reflexionar por qué este es el caso y si hay áreas que se beneficiarían de una mayor incorporación de modelos de variables latentes.

  • A menudo, la variable latente de interés no es la variable implícita en la intercorrelación de las variables observadas . Por ejemplo, el factor latente subyacente a un conjunto de elementos de extraversión autoinformados no será una verdadera extraversión. Puedo conceptualizar una verdadera extraversión que podría calcularse si fuera posible integrar todo lo que se podría saber sobre el comportamiento de una persona, sus pensamientos, su fisiología y sus regularidades ambientales. Sin embargo, el factor subyacente a las intercorrelaciones de los elementos de autoinforme no sería este factor. Si bien es valioso estimar las relaciones si se hubiera obtenido una confiabilidad perfecta, esto no debería absolvernos de tratar de estimar la variable latente real de interés.

  • La corrección del error de medición no debe impedir que los investigadores intenten aumentar la confiabilidad y validez de la medición. Corregir la falta de confiabilidad no es tan bueno como medir de manera confiable en primer lugar.

El significado de las variables latentes tiene la desafortunada desventaja de cambiar entre muestras porque se ajustan a la matriz de correlación observada (probablemente solo alterando el significado, pero definitivamente cambiando de muestra a muestra).

Con esto, diría que es mejor usar variables manifiestas cuando se usa una escala estándar que tiene la intención de comparar sus resultados con otros que usan esa escala estándar.

La otra razón para usar variables de manifiesto es si hay puntos de corte establecidos que desea usar.

Usaría una variable latente para cualquier cosa elaborada en casa o para cualquier construcción en la que recogí múltiples escalas/otros indicadores.