¿Dónde se ensambla finalmente la "imagen" visual que "vemos"?

El libro en línea de David Hubel, Eye, Brain and Vision, describe con gran detalle nuestro sistema visual primitivo. La imagen de la que somos conscientes cuando abrimos los ojos pasa por un camino complejo:

vía visual 1

La "imagen" final estereoscópica (2.5D) sin costuras que "vemos" solo se puede ensamblar después de V1, la corteza visual primaria. Desafortunadamente, V1 es hasta donde llega el libro de Hubel, y por lo que puedo decir, también es un misterio para Google, exactamente dónde se ensambla la "imagen" final que "vemos". ¿Alguien tiene mejor información que Google sobre esto?

Le he remitido a esta pregunta antes, consúltela y las respuestas para evitar malentendidos en su párrafo final. Además, tenga más cuidado con su terminología, parece que su confusión en esta (y su pregunta anterior ) se origina en que usted usa "imagen que vemos" como si el cerebro viera una imagen.
Hice los cambios duros a mi pregunta anterior , aclarando la terminología y la pregunta en sí. En una respuesta a la pregunta del cambio de imagen , Peter Helfer dice que solo el sujeto que experimenta ve. Mi primera pregunta es sobre la naturaleza de este sujeto experimentador, y mi especulación es que el yo está asentado en una región de la corteza. Esta pregunta es sobre dónde se ensambla finalmente la "imagen" que es "vista" por el yo.
@ArtemKaznatcheev Ahora entiendo lo que me falta. Sí, estoy de acuerdo en que para la región/yo cortical que "ve" apenas importa cómo se oriente la "imagen" que se le presenta. Todo lo que importa es que la información en esta "imagen" coincida con la información en otros modos de entrada, como el tacto, el sonido, etc.

Respuestas (2)

Creo que estás sucumbiendo al argumento del homúnculo , la falacia de que hay algún tipo de imagen en el cerebro para que alguien la vea. No existe un teatro mágico en tu cabeza donde se proyecte lo que incide en tu retina. Todo lo que tienes en tu cerebro son patrones complicados de actividad neuronal, no hay imágenes ni nada que ver. Sin embargo, estos patrones de actividad dan lugar a tu experiencia fenomenológica. Para comprender completamente esto, debe preguntarse:

¿Cuáles son las explicaciones y modelos neuronales actuales de la 'conciencia'?

Pero intentemos aclarar algunas de las dificultades conceptuales con la visión en particular. Tu experiencia del mundo visual se ve afectada por dos tipos de entradas: (1) los datos de tu retina y (2) los datos del resto de tus sentidos, incluida la memoria. ¿Por qué es obvio que no todo viene de (1)? Considere uno de los siguientes:

  • Experimentas una escena visual completa, no hay una cierta nada en alguna parte. Sin embargo, en tu retina hay un punto ciego , algo llena esa parte de tu experiencia por ti.

  • Tienes la experiencia de que ciertos edificios lejanos están más lejos que los edificios cercanos. Sin embargo, sus ojos están demasiado juntos para que la diferencia en el ángulo de las dos imágenes sea medible con la fidelidad de su retina. ¿Cómo sabe tu mente que los edificios están más lejos? Parallax y recuerdos de qué tan grandes son típicamente ciertos objetos y cómo esto se escala con la distancia.

Si nos concentramos solo en el método (1), entonces toda la información está allí desde la retina hacia adelante y solo se degrada (ya que parte de la señal se desecha, se comprime o sufre ruido) en su camino hacia V1 y hacia adelante. . Sin embargo, su codificación cambia para volverse más compatible con la integración con otra información sensorial y de memoria. Cuando los datos llegan a V1 y V2, están en una codificación que entendemos lo suficientemente bien como para reconstruir videos de lo que las personas están viendo/experimentando . Como resume el Gallant Lab que realizó el estudio vinculado:

El sistema visual humano consta de varias docenas de áreas visuales corticales distintas y núcleos subcorticales, dispuestos en una red que es tanto jerárquica como paralela. La información visual entra en el ojo y allí se transduce en impulsos nerviosos. Estos se envían al núcleo geniculado lateral y luego a la corteza visual primaria (área V1). El Área V1 es el módulo de procesamiento individual más grande del cerebro humano. Su función es representar la información visual de forma muy general descomponiendo los estímulos visuales en elementos espacialmente localizados. Las señales que salen de V1 se distribuyen a otras áreas visuales, como V2 y V3. Aunque la función de estas áreas visuales superiores no se comprende completamente, se cree que extraen información relativamente más complicada sobre una escena. Por ejemplo, Se cree que el área V2 representa características moderadamente complejas, como ángulos y curvatura, mientras que las áreas de alto nivel representan patrones muy complejos, como caras. El modelo de codificación utilizado en nuestro experimento fue diseñado para describir la función de las primeras áreas visuales como V1 y V2, pero no pretendía describir áreas visuales superiores. Como era de esperar, el modelo hace un buen trabajo al decodificar información en las primeras áreas visuales, pero no funciona tan bien en las áreas más altas.

Recuerde, no hay video en esas áreas. Es solo el disparo de neuronas que los científicos han descubierto cómo decodificar e interpretar. Como se menciona en la cita, las áreas visuales superiores no se entienden bien en este momento, pero presumiblemente ahí es donde está ocurriendo gran parte de la retroalimentación del tipo (2). Incluso dentro de las áreas visuales levemente comprendidas, se distribuye una gran cantidad de procesamiento. Por ejemplo, eche un vistazo a la pregunta sobre la ceguera facial:

¿El área fusiforme de la cara en pacientes con prosopagnosia (ceguera facial) muestra menor actividad bajo una resonancia magnética funcional?

Al dañar una parte del cerebro (el área fusiforme de la cara ), puede continuar 'ver' mesas y sillas perfectamente bien y, sin embargo, no puede identificar o reconocer caras correctamente.

Esperemos que esto te convenza de que no tiene sentido buscar 'la imagen' en el cerebro. Juntos, la mente y el ojo son capaces de dar forma a lo que percibes y darle significado, pero es una pseudopregunta preguntar dónde se ensambla finalmente esa imagen. No está ensamblado, no hay imagen, solo hay codificación de la actividad de la retina en patrones de disparo de nivel superior que produce en nosotros la experiencia de la visión y el significado.

Estaría cometiendo la falacia del argumento del homúnculo si no fundamentara mi idea. En lugar de un "hombrecito" que ve imágenes proyectadas, estoy pensando en una región de la corteza (que presumiblemente es el asiento del yo ) que se presenta con una "imagen" sintetizada de las regiones corticales visuales inferiores. "imagen" entre comillas significa que no me refiero a ninguna imagen óptica proyectada en el cerebro, sino a los flujos de picos que codifican las imágenes.
@bfrs, entonces, ¿por qué usa palabras como 'ensamblado' y hace preguntas como "¿dónde está la imagen?" Cuando digo que estás cometiendo la falacia del homúnculo, no estoy sugiriendo que pienses que hay un hombrecito dentro de nuestras cabezas. Lo que estoy sugiriendo es que usted piensa que la experiencia de la vista está de algún modo ensamblada en un lugar para ser 'vista' o asimilada por algún otro lugar. El punto es que esto no sucede, hay retroalimentación constante en ambos sentidos y muchas cosas se hacen en paralelo o se distribuyen para que puedas dañar partes de tu escena visual pero no toda.

El sistema nervioso, especialmente la corteza, es un sistema distribuido. Preguntar "dónde" no siempre es una pregunta sensata. En realidad, diferentes propiedades de la escena visual se ensamblan en diferentes áreas de la corteza. No hay un área donde se vuelva a montar todo. Toda la información que conocemos sobre una escena se almacena en todo el sistema visual. En inferotemporal, podríamos representar objetos complejos. En mediotemporal, podríamos representar el movimiento dentro de la escena visual. Estas propiedades están integradas en alguna parte en la comprensión de la escena como un todo (podemos ver un objeto en movimiento y también saber quélo es), probablemente en el lóbulo parietal posterior o en la circunvolución temporal superior. Pero sería un error decir que el PPL/STG es donde "vemos" el mundo. Simplemente está ensamblando otros grupos de neuronas en una representación de la escena visual general.

Piensa en esto, de esta manera. Diferentes áreas de la corteza llegan a representar diferentes propiedades de la escena visual. Estas representaciones pueden ser utilizadas por otras áreas para formar representaciones más complicadas. Etcétera. No hay un punto de convergencia en la corteza, solo una disponibilidad de representaciones cada vez más complejas.