Modelo computacional de reconocimiento de objetos biológicos

El cerebro humano puede lograr una notable habilidad para reconocer patrones visuales de manera invariable, selectiva y rápida. El sistema visual humano es bastante poderoso. Tiene una selectividad exquisita que nos permite distinguir entre objetos muy similares. Además, iy también permite Robustez (Invarianza) a las transformaciones.

En el modelo (vía y arquitectura de la corriente ventral propuesta por el grupo de Poggio) que se muestra en la imagen a continuación, ¿por qué el modelo es selectivo en las capas S e invariante en las capas C? No entendí bien por qué la capa S logra selectividad y la capa C logra invariancia. ¿Alguien puede explicarme en detalle por qué el modelo es selectivo en las capas S e invariante en las capas C?

Y quien conoce el modelo HMAX, el modelo se llama "Modelo Jerárquico y X". ¿Por qué X? ¿Qué se entendía por "X"?

ingrese la descripción de la imagen aquíEsta figura es de Serre et al.'s Una teoría cuantitativa del reconocimiento visual inmediato . Prog Brain Res. 2007.

Cualquier ayuda será muy apreciada.

Aquí hay una versión gratuita del documento. Todavía estoy trabajando en ello, yo mismo. Mi impresión es que, básicamente, siempre se puede confiar en que los objetos estén formados por bordes con orientaciones, por lo que son entradas fijas (invariantes), pero cada objeto es una combinación emergente de las entradas fijas, por lo que necesitan selectividad para distinguir formas emergentes particulares. de otras formas emergentes en niveles de abstracción más altos, pero aún ser capaz de reconocer el objeto en diferentes perspectivas o configuraciones, por lo que S no puede ser demasiado invariable.
Muchas gracias por tu explicación. ¿Estás trabajando en el modelo HMAX? si es asi te puedo ayudar :)
No, era solo una pregunta interesante, así que quería leer sobre ella. Sin embargo, últimamente no encuentro mucho tiempo.
Puedes ver mi respuesta a continuación :)

Respuestas (1)

La pregunta está resuelta:

El nombre HMAX (Modelo jerárquico y X) fue acuñado por "Mike Tarr", quien escribió las "Noticias y opiniones" que acompañan al artículo en Nature Neuroscience.

¿Qué se entendía por Jerárquico?

El modelo tiene una arquitectura jerárquica: contiene diferentes etapas (capas).

-- Aumento en el tamaño del campo receptivo y complejidad en las preferencias de características de la unidad a lo largo de la
jerarquía.

¿Qué se entendía por X?

Creo que es la operación de agrupación (se refiere al MAX).

Selectividad en capa S

La actividad de cada unidad S es máxima si todos los aferentes tienen los valores especificados.

Invariancia en la capa C

A diferencia de las unidades S, las células C se agrupan sobre sus aferentes y la respuesta es alta si una de las aferentes es alta. Esto aumenta la invariancia si los aferentes están sintonizados con la misma característica, pero en diferentes posiciones o escalas.