Cómo medir la prominencia visual cuantitativamente

La prominencia hace que los objetos surjan de su entorno y atraigan inmediatamente nuestra atención. Un objeto destacado en el dominio visual sería, por ejemplo , un punto rojo entre los blancos. A veces podemos decir intuitivamente que un objeto es más destacado que otro, por ejemplo , un punto rojo en movimiento puede ser más destacado que uno estático.

¿Hay alguna manera de cuantificar qué tan saliente es un objeto?


ACTUALIZAR

Para acotar un poco la pregunta, suponga que tiene un conjunto de diferentes dispositivos de salida que pueden proporcionar señales visuales o auditivas (LED, altavoces, lámparas, pantallas...) y están cerca de un objeto de destino al que llamar la atención. . Lo ideal sería elegir el dispositivo de salida más cercano al objeto de destino para atraer la atención, pero dependiendo de la distancia, el dispositivo de salida puede no ser tan llamativo. Entonces, a una distancia determinada, me gustaría saber qué dispositivo llamará más la atención. El entorno sería mayormente estático y bien iluminado.

La pregunta es increíblemente amplia. Depende del tipo de estímulo y del contexto (distractores) qué tan destacado es algo. Hablando visualmente, con un fondo estático, es probable que un estímulo en movimiento sea más destacado, pero el mismo estímulo puede ser indistinguible en un fondo dinámico. ¿Podría por favor acotar su pregunta? De lo contrario, la respuesta no sería más satisfactoria que "calificaciones subjetivas de prominencia".
@RobinKramer Reduje un poco la pregunta, ¿sabe si se han realizado algunas investigaciones en esta área?
Eso ya está mejor. Todavía hay muchas cosas que pueden desempeñar un papel, pero creo que es responsable. Mis pensamientos iniciales son que los estímulos auditivos pueden dar algún tipo de respuesta emocional (es decir, sobresalto), más fuerte que las señales visuales y, por lo tanto, pueden ser más sobresalientes. Sin embargo, las fuentes auditivas son más difíciles de localizar en comparación con los estímulos visuales. Veré si puedo encontrar algunas referencias para respaldar esto, y veré si hay algunas medidas de la prominencia, pero otras personas también pueden responder :)
Girauder, ¿ha investigado la teoría de detección de señales? comentando porque es anecdótico, pero lo que hice para medir la prominencia fue una simple tarea de detección sí/no (2AFC) y alterar el objetivo, por ejemplo, brillo/tamaño. Luego calcule el umbral de detección a partir de eso, luego compare esto para los diferentes objetivos. Sin embargo, no estoy seguro acerca de los estímulos auditivos.
@queenslug Todavía no he investigado eso, ¡pero parece que podría ser realmente útil! ¿Publicaste tu investigación? ¡Me encantaría leer con más detalle lo que hiciste!
No, lamentablemente nuestra investigación no dio frutos, esta es una de mis publicaciones de supervisores a través de sciencedirect.com/science/article/pii/S004269890300275X

Respuestas (2)

La duración de la fijación de los ojos se ha utilizado tanto en bebés como en adultos para medir el lugar de atención. Esto se puede lograr usando un eye-tracker. Una forma más primitiva y menos exacta es contar manualmente los cuadros de una grabación de video de sujetos. Los fotogramas por segundo (FPS) serían un factor limitante. Además, el elemento que se observó primero es el más destacado, siempre que no haya un sesgo secundario en la tarea (es decir, los objetos deben estar separados por la misma distancia o la distancia podría ser aleatoria).

Para las tareas de búsqueda visual y búsqueda en serie, las respuestas se recopilan y las curvas de respuesta individuales (características del operador del receptor, ROC) para los participantes y las condiciones se pueden calcular utilizando la teoría de detección de señales (SDT) . El índice de discriminación d prime (d') puede entonces calcularse sólo si se requieren dos respuestas explícitas.

Otra opción es variar el tiempo de presentación sistemáticamente para cuantificar la velocidad de procesamiento, pero esto requiere un enfoque más computacional.

¿Qué quiere decir con: el índice de discriminación d 'solo se puede calcular si existen condiciones de coincidencia y no coincidencia? Muchas gracias por la información por cierto. Mencionó "Además, el elemento que se observó por primera vez es el más destacado". Pero, ¿qué ocurre si uno tiene 2 dispositivos que se pueden presentar a un usuario? ¿Se puede determinar cuál de los dos será más destacado, o al menos? ¿Cuál será percibido por el usuario a una distancia determinada antes de emitir algún estímulo?
Para calcular d' , también debe registrar una aproximación de la tasa de conjetura. Esto a menudo se denomina sesgo, por ejemplo, sesgo de percepción. Digamos que tiene dos condiciones: objetivo presente, objetivo no presente. En lugar de darle al usuario una opción de respuesta para presionar un botón cuando el usuario ve el objetivo, le dice al usuario que presione uno de los dos botones: Objetivo presente, Objetivo no presente. De ello se deduce que tendrá cuatro tipos de respuesta diferentes: Aciertos, Errores, Falsas alarmas y Rechazos correctos. (En la investigación de la memoria, una tarea común es la coincidencia retrasada, por lo tanto, "coincidencia"...). continuación
Si conoce la distancia entre el usuario y la pantalla, puede calcular el ángulo visual correspondiente al tamaño del estímulo, pero si puede mantener esta distancia constante, no tiene que calcular demasiado los valores individuales. // Al comparar dos estímulos diferentes, puede presentarlos en orden aleatorio y calcular d' individualmente para cada condición (es decir, estímulo). A continuación, puede comparar las curvas ROC de ambos estímulos para determinar cuál es el más destacado, al menos para las circunstancias de visualización específicas. Sin embargo, debe especificar un criterio, por ejemplo: 75% correcto o 95% correcto.

Al igual que con muchas de estas preguntas, esto depende de su definición de prominencia (visual). Su pregunta sugiere que desea comparar esto entre las modalidades sensoriales (auditiva y visual), lo que presenta considerables dificultades.

Una posible definición de "saliencia" es la propiedad de un estímulo que lo hace sobresalir de su fondo y llamar nuestra atención (ver http://www.scholarpedia.org/article/Visual_salience ). Podría medir esto empíricamente pidiendo a los observadores que encuentren/respondan al elemento en varios lugares diferentes. Deberían ser más rápidos para hacerlo si este elemento es más destacado (en igualdad de condiciones). Esta es esencialmente la lógica detrás de la mayoría de los experimentos de atención visual y búsqueda visual. Como se mencionó en otra respuesta, también puede monitorear hacia dónde mira el observador, porque las cosas sobresalientes deben mirarse antes y con más frecuencia.

Ahora hay una gran cantidad de investigación sobre el modelado de prominencia visual basada en imágenes. En teoría, estos modelos tienen como objetivo tomar una fotografía de una escena y predecir qué partes de la imagen llamarán la atención. Por lo tanto, otra forma de cuantificar la prominencia de diferentes elementos sería medir el contraste o la actividad en el mapa de prominencia para ubicaciones particulares. Hay mucho más sobre esto, y muchas referencias, en la referencia de Scholapedia anterior.