¿Cómo controlan los humanos los movimientos sacádicos?

Reuní la lógica estándar para un sistema visual que utiliza movimientos sacádicos de los libros de texto de percepción: el costo neuronal de procesar una escena completa con un alto nivel de detalle sería prohibitivo, pero las imágenes de baja fidelidad no son lo suficientemente buenas para funcionar en el mundo. . Por lo tanto, tiene una retina con un centro de alta fidelidad que puede muestrear la escena moviéndose sacádicamente , presumiblemente guiada por una combinación de información sobre el entorno de baja fidelidad y las creencias y objetivos del perceptor.

Sin embargo, todavía tengo que encontrar una teoría detallada que responda a la pregunta de cómo se selecciona el próximo objetivo sacádico.

Para aclarar, por 'teoría detallada' me refiero a una teoría que describe los mecanismos utilizados para lograr las hazañas computacionales descritas en la explicación estándar del libro de texto que mencioné anteriormente.

Respuestas (1)

La Teoría de Integración de Funciones de Treisman & Gelade sugiere que somos capaces de procesar una escena visual completa en paralelo al nivel de las funciones individuales. Por ejemplo, en una tarea de búsqueda visual, el tiempo necesario para encontrar un círculo azul en un campo de círculos rojos es independiente del número total de círculos . Sin embargo, se requiere atención enfocada (típicamente foveal) para integrar características independientes en un objeto cohesivo. Por lo tanto, si busca un círculo rojo en un campo de círculos azules y cuadrados rojos, el tiempo de búsqueda crece linealmente con el número total de objetos. Esto se debe a que el objetivo se compone de dos características (círculo y rojo) que deben integrarse para identificarse, lo que requiere movimientos sacádicos alrededor de la escena.

Varias teorías de la búsqueda visual utilizan esta distinción para modelar los cambios de atención visual. En particular, la búsqueda guiada de Jeremy Wolfe y el modelo de atención visual de Itti & Koch. La premisa básica detrás de ambos modelos es algo similar: los receptores de características de bajo nivel responden automáticamente y en paralelo a todo el campo visual. Por lo tanto, hay muchos mapas de características individuales que representan la prominencia de abajo hacia arriba de las ubicaciones en la escena visual. Esta prominencia de abajo hacia arriba puede ser suficiente para desencadenar un movimiento sacádico; por ejemplo, un mapa de características que responde al movimiento local es beneficioso para que un organismo identifique a los depredadores en movimiento. Por lo tanto, las áreas con movimiento reciben un gran valor porque tienen un historial de proporcionar información que es beneficiosa para un organismo.

Durante las condiciones de la tarea (como la búsqueda visual), también se pueden crear mapas de prominencia de arriba hacia abajo basados ​​en el conocimiento de qué cosas en el entorno tienen valor. Si estoy buscando mi paraguas, sé que es azul, largo y recto, y esta información se puede codificar en los mapas de características que impulsan los movimientos sacádicos.

Más generalmente, los movimientos sacádicos se dirigen a objetivos que tienen un alto valor esperado. (Incluso se ha demostrado que la velocidad de los movimientos sacádicos es proporcional al valor esperado del objetivo: Shadmehr, et al.) Este valor se determina a partir de una evaluación ponderada de los mapas de características de arriba hacia abajo y de abajo hacia arriba, disponibles previamente. atentamente.

La ubicación exacta de un movimiento sacádico se determina a través de un proceso llamado agrupación espacial, que intenta determinar el "centro de gravedad" de un objetivo, nuevamente utilizando mapas de características de bajo nivel. Si bien los movimientos sacádicos son sorprendentemente rápidos y precisos, por supuesto hay algún error en la posición sacádica final que a menudo requiere movimientos sacádicos más pequeños para alcanzar el objetivo. Recientemente se ha sugerido que esta serie de movimientos sacádicos emulan la ley de Fitts con respecto a las compensaciones entre velocidad y precisión. En Kowler, 2011, se puede encontrar una excelente y exhaustiva revisión del estado actual de los movimientos oculares sacádicos.

Obviamente, hay bastante información detallada que no he cubierto aquí: de las referencias citadas, comenzaría con la sección 3 ("Sacades") del artículo de Kowler, luego pasaría al artículo de Itti & Koch para detalles más concretos sobre su modelo específico.

Wolfe, JM (1994). Búsqueda guiada 2.0. Un modelo revisado de búsqueda visual. Boletín psiconómico y revisión, 1, 202-238.

Itti, L. y Koch, C. (2001). Modelado computacional de la atención visual. Nature Reviews Neurociencia, 2, 1-11.

Shadmehr et al. (2010). Descuento temporal de la recompensa y del coste del tiempo en el control motor. Revista de Neurociencia, 30, 10507-10516.

Kowler, E. (2011). Movimientos oculares: Los últimos 25 años. Investigación de la visión, 51, 1457-1483.

** Tenga en cuenta que cito la Búsqueda guiada 2.0 porque es una buena exposición de toda la teoría, aunque la teoría misma ha progresado a 4.0

También puede consultar este documento y los modelos que se analizan en él. SWIFT y EZ-Reader son modelos de control oculomotor en la lectura. ncbi.nlm.nih.gov/pmc/articles/PMC2906818