En psicología, la mayoría de los conceptos, teorías, ideas, etc. de interés se refieren a variables latentes , donde una variable latente es aquella que no se puede observar directamente. En cambio, uno tiene que encontrar una variable manifiesta , que se pueda observar directamente y que se pueda usar como indicador de la variable latente. A menos que haya un indicador perfecto (que generalmente no lo hay), la medición de la variable latente contiene un error. Para estimar el error se han desarrollado técnicas de modelado de variables latentes como CFA o Teoría de Respuesta al Ítem (entre otras).
Teoría de la variable latente
Ahora bien, en general se acepta que variables como la edad y el género son manifiestas. Pero, ¿qué es lo que marca la diferencia entre una variable latente y una manifiesta? Borsboom (2008) explica esta diferencia. En su teoría de la variable latente , la distinción depende de la certeza con la que se puede hacer una inferencia a partir de los datos observados a la variable en cuestión. En este sentido, se manifiesta una variable como el género, porque se puede inferir con certeza si un sujeto es hombre o mujer a partir de su respuesta en un cuestionario. Tenga en cuenta que esto es posible, aunque uno no haya observado realmenteel género de ese sujeto. La explicación de Borsboom de la teoría de la variable latente también implica que el estado de una variable como latente frente a manifiesta puede cambiar con el tiempo, si, por ejemplo, se vuelve accesible más información. Pero mientras una variable ha demostrado ser manifiesta, permanece latente.
Me parece, entonces, que casi todos los investigadores en psicología deberían usar técnicas de modelado de variables latentes, ya que la mayoría de las veces no es posible inferir algo con certeza. Como sea, este no es el caso. Existen numerosos artículos publicados que utilizan variables manifiestas y analizan las relaciones entre ellas sin tener en cuenta el error de medición, lo que implícitamente convierte a la variable latente en cuestión en una variable manifiesta. (Si alguien quiere citas para este reclamo, con gusto se las proporcionaré).
Pregunta: ¿Bajo qué circunstancias es defendible usar variables manifiestas en lugar de latentes en la investigación psicológica, incluso si está claro que las variables solo pueden medirse con error?
Borsboom, D. (2008). Teoría de la variable latente. Medición: investigación y perspectiva interdisciplinaria , 6(1-2), 25-53. PDF
Los psicólogos experimentales parecen bastante contentos de trabajar con escalas de autoinforme ad hoc de un solo elemento, medidas fisiológicas, etc. con muy poca evaluación psicométrica, por lo que incluso antes de hablar sobre un enfoque completo de modelado de variables latentes, análisis factorial confirmatorio y similares, es posible que desee Me pregunto por qué parecen relativamente despreocupados por los problemas de medición en general y por qué todavía hay una brecha tan grande entre la psicología experimental y la psicometría.
Algunas posibles explicaciones (algunas de ellas no son justificaciones muy convincentes para no hacer modelos de variables latentes, pero aún así explican por qué las personas se contentan con usar variables manifiestas):
En resumen, si cualquier diferencia estadísticamente significativa se considera un resultado interesante (es decir, su manipulación tuvo un efecto), no necesita preocuparse demasiado por la confiabilidad o el significado de la respuesta.
Curiosamente, parece estar abordando la pregunta desde un campo, asumiendo que el modelado de variables latentes es claramente útil y que las personas necesitan defenderse activamente por no hacer lo correcto obvio. También puede darle la vuelta a la pregunta y preguntar: "¿Es tan útil el modelado de variables latentes? ¿Qué nos compra? En el contexto que acabo de destacar, puede que no sea tan fácil articular una respuesta convincente.
Y, por supuesto, en la práctica, muchas personas solo se preocupan por la metodología en la menor medida posible para dedicarse a sus negocios, publicar y hacer las cosas que consideran realmente interesantes. En consecuencia, muchos investigadores no escuchan mucho sobre el modelado de variables latentes después de terminar su maestría y ni siquiera les importa de una forma u otra porque simplemente no es la forma en que se hacen las cosas en sus disciplinas.
Es una pregunta interesante. Aquí hay un montón de pensamientos que me vinieron a la mente sobre por qué los investigadores podrían centrarse en las variables observadas.
Muchos investigadores informan sobre la confiabilidad y las relaciones observadas entre las variables. Al adoptar algunas suposiciones, el lector puede estimar cuáles serían las relaciones latentes (ver, por ejemplo, la fórmula para la corrección de la atenuación ).
Algunos investigadores interpretan los tamaños de sus efectos en relación con otros estudios que han informado variables observadas . Por lo tanto, los tamaños del efecto no se interpretan en términos absolutos. En áreas donde los tamaños del efecto se informan típicamente utilizando variables observadas, este marco de referencia puede tener más sentido. Dicho esto, esto se vuelve problemático cuando la confiabilidad varía entre los estudios. En estos casos, las correcciones metaanalíticas al estilo de Hunter y Schmidt por falta de confiabilidad generalmente conducen a resultados más comparables.
El modelado de variables observadas implica menos opciones de modelado que el modelado de variables latentes. En particular, las estimaciones de las relaciones entre las variables latentes dependen de los supuestos para estimar las variables latentes. Si, como lector, no está de acuerdo con estas suposiciones, puede ser difícil recuperar las relaciones entre las variables observadas.
Modelar variables observadas es más simple que modelar variables latentes. Esto ayuda a explicar por qué muchos investigadores reportan matrices de correlación y regresiones en psicología, en lugar de equivalentes de variables latentes. Sin embargo, las cosas pueden volverse mucho más complejas a medida que se sale de los contextos SEM normales multivariados estándar: por ejemplo, incorporando variables categóricas, efectos moderadores, variables latentes mal definidas, efectos no lineales, varianza de error no normal, varianza de error correlacionada , etcétera. Es comprensible que algunos investigadores de las ciencias sociales recurran al territorio más familiar de modelar las variables observadas por partes. Sin embargo, si bien esta es una explicación, los investigadores aún deben esforzarse por modelar los datos de formas más integradas y realistas.
En última instancia, es el investigador quien decide si desea extraer inferencias sobre las relaciones entre las variables observadas o latentes . Si bien algunos contextos sugieren que el investigador debería estar interesado en el constructo subyacente, todavía depende del investigador decidir.
Las relaciones entre las variables observadas a veces son de interés primordial . Algunos ejemplos: (a) condiciones experimentales; (b) cuando los investigadores están interesados en la predicción aplicada; (c) cuando los investigadores están interesados en la variable observada en sí.
Si los investigadores modelan las variables latentes parece estar relacionado con el dominio . En particular, el modelado de variables latentes parece ser particularmente popular en campos con muestras grandes, diseños observacionales, que utilizan autoinforme o escalas psicológicas de opción múltiple. En tales contextos, la suposición de que las variables observadas son una muestra aleatoria de posibles variables observadas y son una manifestación de una variable latente, a menudo parece más apropiada. Es fácil imaginar los elementos alternativos que podrían haberse recopilado y cómo se podría haber mejorado la confiabilidad si se hubieran incluido más elementos. Es interesante reflexionar por qué este es el caso y si hay áreas que se beneficiarían de una mayor incorporación de modelos de variables latentes.
A menudo, la variable latente de interés no es la variable implícita en la intercorrelación de las variables observadas . Por ejemplo, el factor latente subyacente a un conjunto de elementos de extraversión autoinformados no será una verdadera extraversión. Puedo conceptualizar una verdadera extraversión que podría calcularse si fuera posible integrar todo lo que se podría saber sobre el comportamiento de una persona, sus pensamientos, su fisiología y sus regularidades ambientales. Sin embargo, el factor subyacente a las intercorrelaciones de los elementos de autoinforme no sería este factor. Si bien es valioso estimar las relaciones si se hubiera obtenido una confiabilidad perfecta, esto no debería absolvernos de tratar de estimar la variable latente real de interés.
La corrección del error de medición no debe impedir que los investigadores intenten aumentar la confiabilidad y validez de la medición. Corregir la falta de confiabilidad no es tan bueno como medir de manera confiable en primer lugar.
El significado de las variables latentes tiene la desafortunada desventaja de cambiar entre muestras porque se ajustan a la matriz de correlación observada (probablemente solo alterando el significado, pero definitivamente cambiando de muestra a muestra).
Con esto, diría que es mejor usar variables manifiestas cuando se usa una escala estándar que tiene la intención de comparar sus resultados con otros que usan esa escala estándar.
La otra razón para usar variables de manifiesto es si hay puntos de corte establecidos que desea usar.
Usaría una variable latente para cualquier cosa elaborada en casa o para cualquier construcción en la que recogí múltiples escalas/otros indicadores.
Gala
Gala
Jens Kouros
Jens Kouros
Gala
Jens Kouros
Gala