¿Existen modelos cognitivos para la interpretación de imágenes?

¿Existen modelos cognitivos que puedan utilizarse para la interpretación de imágenes? He intentado encontrar algunos modelos específicos que puedan usarse para la interpretación de imágenes, pero no he podido encontrar ningún modelo.

¿Cómo defines "interpretación de imágenes"? Existe una gran literatura sobre una variedad de temas, como la categorización visual, la discriminación visual, los juicios estéticos, etc.
queremos categorizar las características visualmente presentes en una imagen. queremos discriminar entre las características de las imágenes
Como señaló @JeromyAnglim, hay campos completos relacionados con este amplio tema. Sería útil especificar más detalles en su pregunta.
Estoy dispuesto a conocer los modelos que se han desarrollado en la interpretación cognitiva de imágenes.

Respuestas (1)

He intentado encontrar algunos modelos específicos que puedan usarse para la interpretación de imágenes, pero no he podido encontrar ningún modelo.

Esta pregunta es amplia y como ha dicho que no ha podido encontrar modelos, pensé en proporcionarle referencias donde se investiga la cognición visual.

El Instituto de Neurociencia Cognitiva de la UCL tiene un grupo de cognición visual.

La investigación de este grupo se ocupa de la detección, discriminación y memoria a corto plazo de estímulos visuales. Una parte clave del enfoque del trabajo es estudiar las interacciones entre diferentes regiones de la corteza visual y las interacciones entre áreas visuales y no visuales mediante el uso de estimulación magnética transcraneal, psicofísica, movimientos oculares y métodos de registro electrofisiológico. La visión humana es una fuerza dominante en nuestro comportamiento y, por lo tanto, el estudio de la visión lleva preguntas de investigación a muchas áreas diferentes de percepción fuera de nuestro trabajo visual más obvio sobre la búsqueda visual, las funciones de la corteza parietal, los campos oculares frontales y cómo funciona el cerebro. cambia con el aprendizaje. Estos incluyen la percepción del tiempo, el aprendizaje visomotor, la música, y las matemáticas, funciones aparentemente diferentes que a menudo recurren a los mismos recursos cerebrales. El grupo se dedica a ampliar el uso de TMS en combinación con otras metodologías, en particular el registro electrofisiológico y el trabajo con pacientes neuropsicológicos.

Esta entrada de wikipedia sobre la percepción; analiza cómo la percepción entre individuos tiene una amplia variación, incluida la capacidad de interpretar señales visuales.

El Laboratorio de cognición visual de Duke tiene extensos artículos de investigación sobre este tema. He proporcionado algunos extractos adecuados.

El sistema visual se ha desarrollado para transformar un flujo de información indiferenciado y continuo en representaciones discretas y manejables, y esta capacidad se basa principalmente en la naturaleza ininterrumpida de la entrada. 1

El trabajo de laboratorio reciente ha indicado que la baja prevalencia de objetivos puede conducir a tasas de error alarmantemente altas en la búsqueda visual. 2

La ceguera al cambio, la incapacidad para detectar cambios visuales que ocurren durante una interrupción, se ha utilizado cada vez más para inferir la naturaleza de las representaciones internas. Si se detectara cada cambio, las representaciones detalladas del mundo tendrían que ser almacenadas y accesibles. Sin embargo, debido a que no se detectan muchos cambios, es posible que las representaciones visuales no estén completas y que el acceso a ellas sea limitado. El uso de la detección de cambios para inferir la integridad de las representaciones visuales requiere una comprensión de las razones de la ceguera al cambio. Este artículo proporciona apoyo empírico para una de esas razones: la ceguera al cambio que resulta de no poder comparar las representaciones retenidas de la información anterior y posterior al cambio. Incluso cuando no estaban al tanto de los cambios, los observadores aún retenían información sobre los objetos anteriores y posteriores al cambio en el mismo ensayo.3

La entrada al procesamiento visual consiste en una serie indiferenciada de características que deben analizarse en unidades discretas. Aquí exploramos el grado en que la conciencia es importante para formar tales representaciones de objetos y para actualizarlas frente a escenas visuales cambiantes. 4

Hay una gran cantidad de información aquí, es bastante fascinante. Espero que disfruten esto, y no duden en volver con las preguntas que tengan al respecto.

1. Appelbaum, LG, Cain, MS, Schroeder, JE, Darling, EF y Mitroff, SR (2012). El entrenamiento visual estroboscópico mejora la codificación de la información en la memoria a corto plazo. Atención, Percepción y Psicofísica.
2. Fleck, MS y Mitroff, SR (2007). Los objetivos raros rara vez se pasan por alto en la búsqueda corregible. Ciencia Psicológica, 18, 943-947.
3. Mitroff, SR, Simons, DJ y Levin, DT (2004). Nada compara 2 vistas: la ceguera al cambio puede ocurrir a pesar del acceso preservado a la información modificada. Percepción y Psicofísica, 66, 1268-1281.
4. Mitroff, SR y Scholl, BJ (2005). Formando y actualizando representaciones de objetos sin conciencia: evidencia de ceguera inducida por movimiento. Investigación de la visión, 45(8), 961-967.