Por favor, ¿me puede dar una explicación muy breve sobre todas las funciones en la arquitectura de flujo ventral resumidas en esta figura?
Esta figura es de Serre et al.'s Una teoría cuantitativa del reconocimiento visual inmediato . Prog Brain Res. 2007.
Leí varios artículos sobre este modelo, pero todavía no entiendo el objetivo básico, especialmente detrás de las dos operaciones (operaciones de tipo gaussiano y de tipo máximo). Así que, por favor, alguien me puede explicar en detalle la vía de la corriente ventral ( de V1-V2-V4-IT-PFC) incluidas las dos operaciones en este modelo.
Por ejemplo: no entiendo cómo se construyen las celdas en S1...
Esta es una arquitectura típica de computación propuesta como modelo para el flujo ventral de procesamiento visual en primates . Tiene una larga historia (p. ej., Neocognitoron de Fukushima fue en 1980 ) y sigue siendo ampliamente aceptado en el aprendizaje automático (p. ej., aprendizaje profundo ) y la neurociencia.
Está motivado por la organización de células simples V1 y células complejas. Las células simples en V1 pueden considerarse aproximadamente como detectores de bordes en una ubicación retiniana específica. Es por eso que en la figura que cita, se representan como un círculo con una barra (un campo receptivo de dibujos animados). Las celdas simples solo pueden detectar cosas muy localmente, lo que significa que si el borde aparece en una ubicación diferente en su campo de visión, no responderá.
Matemáticamente, puede pensar en un filtro espacial que detecta un borde (por ejemplo, un parche de Gabor orientado) multiplicado por su imagen retinal y sumado. Por ejemplo, el filtro a continuación detectará coincidencias con una barra de 45 grados alineada en el área de colores vivos, pero tendrá menos actividad si la barra se desplaza fuera de la posición específica.
Las celdas complejas en V1 , por otro lado, siguen siendo un detector de bordes, pero tienen cierta invariancia de ubicación. En otras palabras, cuando el borde se desplaza ligeramente, la respuesta de las celdas complejas no parece cambiar. Se cree que esto se debe a que las células complejas extraen de múltiples células simples con la misma orientación. Esto es lo que ve en su figura, donde una sola celda compleja extrae información de celdas simples con la misma orientación pero en diferentes ubicaciones.
Matemáticamente, una operación soft-max o una operación max sobre las salidas de celda simples puede conducir a un buen modelo de celda complejo. Pero, no se limita a tales operaciones. De hecho, los modelos cuadráticos u otros modelos no lineales también se utilizan ampliamente en la neurociencia computacional.
La jerarquía completa para la corriente ventral se obtiene simplemente extendiendo repetidamente usando la analogía de célula simple-célula compleja. Para cada pila, la capa de celda simple extrae alguna característica local (al calcular la salida de la celda compleja de la capa anterior), y la capa de celda compleja la hace invariable en el espacio. Desde los bordes en V1, uno puede obtener esquinas en la siguiente capa, luego contornos complejos y todo el camino hasta los objetos. Al menos así es como va la historia.
memming
Cristina
memming
Cristina
memming
Cristina
jonsca
Cristina
memming