¿Cómo medir el estrés cuantitativamente?

Me pregunto cuál es la forma más sencilla de medir los niveles de estrés de manera objetiva y cuantitativa* y, en concreto, la carga cognitiva . Estoy abierto a sugerencias, pero tengo entendido que la dilatación de la pupila y el aumento de la conductividad de la piel son buenas medidas objetivas y cuantificables del estrés.

Mi pregunta ahora es: ¿existe una opinión establecida sobre cuál de los dos es el método preferido?

La cuestión es que la conductancia de la piel es relativamente sencilla. Basta con uno o dos electrodos, demasiado fácil. La pupilometría, por otro lado, requiere anteojos incómodos o un dispositivo montado en la cabeza o, alternativamente, un dispositivo de mesa que requiere que el sujeto enfoque en un campo de visión restringido (de lo contrario, la cámara pierde la pupila).

Dado que estamos considerando medir a los niños, un electrodo intuitivamente sería mejor, ya que se puede asegurar firmemente a un dedo, permite instrucciones sencillas: "no lo toques", y es relativamente resistente a los artefactos, dado que las grabaciones puil sufre de parpadeo.

¿Deberíamos considerar solo consideraciones prácticas y elegir la conductancia de la piel, o hay razones de peso para usar un rastreador ocular en su lugar **?

*: deseamos evitar cuestionarios debido a limitaciones de tiempo
**: no tenemos dinero para ambos :-)

En la conferencia de CHI de este año hubo una sesión sobre Usabilidad y carga del usuario con algunos artículos que podrían valer la pena analizar: "Desarrollo y validación de la escala de carga del usuario: una herramienta para evaluar la carga del usuario en los sistemas informáticos" y "Comprender la relación entre la frustración y la gravedad de los problemas de usabilidad: ¿qué pueden (no) decirnos los datos psicofisiológicos? específicamente parecen prometedores.
Acabo de hojear rápidamente " Comprender la relación entre la frustración y la gravedad de los problemas de usabilidad: ¿Qué pueden (no) decirnos los datos psicofisiológicos? " y creo que es muy relevante para esta pregunta. No tengo tiempo para informarlo a fondo, pero creo que un resumen de ese documento sería una respuesta adecuada a esta pregunta.
@StevenJeuris - nuevamente, muchas gracias - ¡Lo revisaré!

Respuestas (1)

Cuando tu objetivo es medir una opción sobre la otra

Como parte de un estudio de interacción humano-computadora (HCI), también necesitaba medir la carga cognitiva para evaluar si una interfaz de usuario en particular podría reducir la carga cognitiva percibida (en comparación con un grupo de control). Por razones prácticas (y para no entrometerme demasiado en el uso 'ordinario' de la computadora), decidí apegarme a la escala TLX de la NASA comúnmente utilizada ( Hart, 2006). Sin embargo, para los estudios a pequeña escala (el mío involucró solo a 16 participantes), tengo la impresión de que es mejor pedir simplemente comentarios cualitativos. Por supuesto, no puede ejecutar estadísticas sobre estos, pero podría decirse que interpretar el tamaño del efecto en tamaños de muestra tan pequeños no tiene sentido de ninguna manera. Por lo tanto, podría simplemente preguntar a los participantes qué opción prefieren con respecto a la carga cognitiva percibida e informar sobre esto como un resultado "significativo". Por supuesto, no puedo garantizar si los revisores estarían de acuerdo. :) En el caso de que tenga medidas TLX de la NASA existentes adecuadas para comparar, esta sigue siendo una opción que vale la pena.

Sin embargo, como usted afirma, una gran desventaja de una prueba basada en escalas de este tipo es que solo se puede administrar en algunos puntos a lo largo del estudio, ya que completar las escalas requiere mucho tiempo.

Para estudios cuantitativos continuos o a gran escala

La conductancia de la piel, el volumen sanguíneo y la frecuencia del pulso parecen bastante prometedores y se están utilizando en HCI ( Janssen et al., 2015 ; Mark et al., 2012 ), que son indicativos de excitación . Estos hoy en día se pueden medir más fácilmente en un factor de forma fácil (por ejemplo, un reloj). Sin embargo, es importante mencionar que la excitación no es indicativa de valencia .—el agrado o desagrado de los estímulos. Tampoco es sencillo usar dicho equipo. Establecer una línea de base para los participantes requiere una cantidad considerable de trabajo y se debe tener cuidado para hacerlo correctamente (si se desea comparar los resultados con otros participantes). Las medidas en la muñeca (como las medidas con un reloj) son más débiles que en las palmas. Para algunas personas, no se mide ninguna señal adecuada. Es necesario controlar los factores ambientales como los cambios de temperatura y el movimiento (en lo que respecta a la conductancia de la piel) y los cambios en la iluminación (dilatación de la pupila).

Para responder a una de sus preguntas contenidas, no creo que haya una opinión establecida o un método preferido y todavía depende en gran medida de lo que se puede medir en el contexto dado y lo que se espera (por ejemplo, ¿se puede suponer que hay sin valencia positiva?). Dependiendo del estudio, aún podría preferirse uno sobre el otro (¿la tarea implica movimiento?), y definitivamente no descartaría medidas cualitativas.

Estudios que comparan diferentes medidas

Cuando estaba buscando información, encontré algunas fuentes que comparan diferentes medidas. Sin embargo, no puedo resumirlos de memoria, pero espero que los problemas y las fuentes mencionados actualmente puedan guiarlo en la dirección correcta.

Hart, SG (2006, octubre). Índice de carga de tareas de la NASA (NASA-TLX); 20 años después. En Actas de la reunión anual de la sociedad de factores humanos y ergonomía (Vol. 50, No. 9, pp. 904-908). Publicaciones de salvia.
Janssen, CP, Gould, SJ, Li, SY, Brumby, DP y Cox, AL (2015). Integrar el conocimiento de multitarea e interrupciones a través de diferentes perspectivas y métodos de investigación. Revista Internacional de Estudios Humano-Computadores, 79, 1-5.
Mark, G., Voida, S. y Cardello, A. (2012, mayo). Un ritmo no dictado por electrones: un estudio empírico del trabajo sin correo electrónico. En Actas de la Conferencia SIGCHI sobre factores humanos en sistemas informáticos (págs. 555-564). ACM.
Forné, M. (2012).La fisiología como herramienta para pruebas de UX y usabilidad. Facultad de Informática y Comunicación, Maestría. Instituto Real de Tecnología, Estocolmo.
Haapalainen, E., Kim, S., Forlizzi, JF y Dey, AK (septiembre de 2010). Medidas psicofisiológicas para evaluar la carga cognitiva. En Actas de la 12.ª conferencia internacional ACM sobre computación ubicua (págs. 301-310). ACM.

No sé si esto es relevante: pequeñas tareas secundarias que se ejecutan junto con una tarea principal también pueden usarse para medir la carga cognitiva (como en la disminución del rendimiento). Por ejemplo, una prueba de stroop: Uso de la tarea de stroop para evaluar la carga cognitiva .
Wow, gracias por este +1: simplemente lo hojeé y haré una lectura más completa después de un buen descanso nocturno. Gracias de nuevo.
@Christiaan. De nada. Quizás un poco de contexto con respecto a esta respuesta. Leí y experimenté un poco con esto ya que también estaba buscando una medida de carga cognitiva más "objetiva" y temporalmente sensible. Sin embargo, terminé sin hacer nada con los datos grabados debido a las dificultades para interpretarlos. :) Sin embargo, definitivamente vale la pena seguirlo si constituye una de las medidas principales que busca, lo que en mi caso no fue la intención principal de mi estudio.
¿Sabe por casualidad si Haapalainen et al. (2010) es una fuente confiable? No estoy familiarizado con Ubicomp y los autores. ¡Ese tipo de investigación es exactamente lo que estaba buscando! Gracias de nuevo.
@Christiaan, UbiComp es una conferencia de primer nivel (revisada por pares) en HCI (y las conferencias en comparación con otros campos son tan importantes como las revistas, si no más). Sin embargo, es un campo multidisciplinario que simplemente está interesado en medir la carga cognitiva como parte de su agenda de investigación más amplia, por lo tanto, valoraría más los artículos de un campo más enfocado, ya que espero que tengan más experiencia en el tema. En otras palabras, debería ser de buena calidad, pero también miraría la experiencia pasada de los autores.