¿Qué mecanismo neuronal explica la tendencia a prestar atención visual a toda la escena antes de prestar atención a los detalles?

Tengo la intuición de que la visión humana atiende primero a los objetos de gran escala y luego a los detalles de pequeña escala. ¿Existe algún mecanismo en la corteza visual que explique este fenómeno? ¿Hay un proceso de refinamiento de la resolución cuando miramos escenas?

Respuestas (3)

Primero, no es solo su intuición: hay muchos resultados experimentales que muestran que primero percibimos la esencia de las escenas (por ejemplo, ¿es al aire libre o adentro?), Luego las partes principales (¿había un animal o un ser humano?) figura en ella?) luego más y más detalles (¿esa figura es masculina o femenina? ¿cuál es su expresión?) [1] [2] . Tenga en cuenta, sin embargo, que no está exactamente relacionado con el tamaño del objeto, sino más bien con su importancia o relevancia percibida. (Vea también este gran video sobre la ceguera al cambio , que ejemplifica eso)

La teoría de la jerarquía inversa [3] propone un mecanismo para eso: la activación en la red fluye principalmente "de abajo hacia arriba", pero la percepción consciente comienza en un nivel superior y luego accede activamente (a través de la atención) a los detalles de "nivel inferior" a medida que se necesitan. o en sus palabras:

Clásicamente, el sistema visual se veía como una jerarquía de áreas corticales y tipos de células. Las neuronas de áreas de bajo nivel (V1, V2) reciben información visual y representan características simples como líneas o bordes de orientación y ubicación específicas. Sus resultados son integrados y procesados ​​por niveles corticales sucesivos (V3, V4, área medial-temporal MT), que se generalizan gradualmente sobre parámetros espaciales y se especializan para representar características globales. Finalmente, otros niveles (área inferotemporal IT, área prefrontal PF, etc.) integran sus salidas para representar formas abstractas, objetos y categorías. Se desconocía la función de las conexiones de retroalimentación. La teoría de la jerarquía inversa propone que la jerarquía directa anterior actúa implícitamente, con una percepción explícita que comienza en la corteza cerebral de alto nivel. representando la esencia de la escena sobre la base de una integración aproximada de primer orden de entrada de bajo nivel. Más tarde, la percepción explícita vuelve a las áreas inferiores a través de las conexiones de retroalimentación, para integrar en la visión consciente con escrutinio la información detallada allí disponible. Así, la percepción inicial se basa en la atención dispersa (amplios campos receptivos), adivinando detalles y cometiendo errores de unión o conjunción. La visión posterior incorpora detalles, superando tales cegueras.


[1] Potter, MC (1976). Memoria conceptual a corto plazo para imágenes. Revista de Psicología Experimental: Aprendizaje y Memoria Humana; Journal of Experimental Psychology: Human Learning and Memory, 2(5), 509. enlace

[2] Rensink, RA, O'Regan, JK y Clark, JJ (1997). Ver o no ver: La necesidad de atención para percibir cambios en las escenas. Ciencia Psicológica, 8(5), 368-373. Enlace

[3] Hochstein, S. y Ahissar, M. (2002). Vista desde las jerarquías superiores y jerarquías inversas en el sistema visual. Neurona, 36(5), 791-804. Enlace

El fenómeno que describe se denomina efecto de precedencia global y fue estudiado extensamente por primera vez por David Navon (1977). Una forma de medir este efecto es crear un conflicto entre las características globales y locales. Por ejemplo, Navon presentó observaciones con estímulos de letras que se organizaron globalmente en diferentes letras, como;

ingrese la descripción de la imagen aquí

Se instruyó a los observadores para que indicaran a) cuando las letras más pequeñas eran E frente a H ob) cuando las letras más grandes formaban una E frente a H. Navon descubrió que los tiempos de reacción eran generalmente más rápidos cuando las características globales y locales eran congruentes. Sin embargo, el conflicto causado por la forma global perjudicó los tiempos de reacción en a) mucho más que el conflicto causado por las letras más pequeñas en b). Se interpretó que una mayor interferencia de la estructura global muestra que la forma global se procesa antes que los detalles locales.

Este efecto fue estudiado con mayor detalle por Aude Oliva y Phillipe Schyns. Oliva presentó imágenes híbridas de escenarios naturales. Estas imágenes estaban compuestas por la información de alta frecuencia espacial de una escena y la información de baja frecuencia espacial de otra escena. Por ejemplo, en las siguientes imágenes, la información de baja frecuencia espacial de una autopista se ha combinado con la información de alta frecuencia espacial de una imagen de rascacielos (imagen superior) y viceversa en la imagen inferior. Demostraron que la información de baja frecuencia espacial es más útil, particularmente en los casos en que las escenas se vieron solo brevemente o cuando los participantes tuvieron que hacer un juicio muy rápido.

ingrese la descripción de la imagen aquí

Lo interesante del estudio realizado por Schyns y Oliva es que proporciona evidencia de una explicación neural de por qué las características globales dominan sobre los detalles. Esta explicación se basa en dos tipos de células que existen en la retina y envían axones al tálamo en el cerebro. Estos tipos de células se dividen aproximadamente en dos tipos: la neurona magnocelular más grande y la neurona parvocelular más pequeña. Estos tipos de células tienen diferentes preferencias espaciales y características temporales. Las neuronas mangocelulares prefieren entradas de baja frecuencia espacial y muestran una respuesta rápida y transitoria. Las neuronas parvocelulares, por otro lado, prefieren entradas de alta frecuencia espacial coloridas y muestran una respuesta lenta y sostenida. Entonces, la idea es que la vía magnocelular transporta rápidamente partículas gruesas, información de baja frecuencia espacial al cerebro para formar una interpretación inicial del mundo. Esta interpretación luego se compara con la información más detallada transportada por la vía parvocelular a medida que llega a la corteza.

Referencias Navon, D. (1977). Bosque antes que árboles: La precedencia de las características globales en la percepción visual, Psicología Cognitiva, Vol 9(3), 353-383.

Schyns, PG y Oliva, A. (1994). De manchas a bordes de límites: evidencia de reconocimiento de escena dependiente de la escala temporal y espacial. Ciencia Psicológica, 5(4), 195-200.

La visión humana está más acostumbrada a ver primero las cosas que se mueven. Entonces, considerando que tanto los objetos a gran escala como los objetos a pequeña escala están presentes en el campo de visión, el objeto mostrará el primer signo de movimiento y será atendido primero por la corteza visual. Creo que esto se debe al proceso evolutivo en el que los humanos eran cazadores y la mente evolucionó para detectar cualquier movimiento animal en la periferia.