El libro en línea de David Hubel, Eye, Brain and Vision, describe con gran detalle nuestro sistema visual primitivo. La imagen de la que somos conscientes cuando abrimos los ojos pasa por un camino complejo:
La "imagen" final estereoscópica (2.5D) sin costuras que "vemos" solo se puede ensamblar después de V1, la corteza visual primaria. Desafortunadamente, V1 es hasta donde llega el libro de Hubel, y por lo que puedo decir, también es un misterio para Google, exactamente dónde se ensambla la "imagen" final que "vemos". ¿Alguien tiene mejor información que Google sobre esto?
Creo que estás sucumbiendo al argumento del homúnculo , la falacia de que hay algún tipo de imagen en el cerebro para que alguien la vea. No existe un teatro mágico en tu cabeza donde se proyecte lo que incide en tu retina. Todo lo que tienes en tu cerebro son patrones complicados de actividad neuronal, no hay imágenes ni nada que ver. Sin embargo, estos patrones de actividad dan lugar a tu experiencia fenomenológica. Para comprender completamente esto, debe preguntarse:
¿Cuáles son las explicaciones y modelos neuronales actuales de la 'conciencia'?
Pero intentemos aclarar algunas de las dificultades conceptuales con la visión en particular. Tu experiencia del mundo visual se ve afectada por dos tipos de entradas: (1) los datos de tu retina y (2) los datos del resto de tus sentidos, incluida la memoria. ¿Por qué es obvio que no todo viene de (1)? Considere uno de los siguientes:
Experimentas una escena visual completa, no hay una cierta nada en alguna parte. Sin embargo, en tu retina hay un punto ciego , algo llena esa parte de tu experiencia por ti.
Tienes la experiencia de que ciertos edificios lejanos están más lejos que los edificios cercanos. Sin embargo, sus ojos están demasiado juntos para que la diferencia en el ángulo de las dos imágenes sea medible con la fidelidad de su retina. ¿Cómo sabe tu mente que los edificios están más lejos? Parallax y recuerdos de qué tan grandes son típicamente ciertos objetos y cómo esto se escala con la distancia.
Si nos concentramos solo en el método (1), entonces toda la información está allí desde la retina hacia adelante y solo se degrada (ya que parte de la señal se desecha, se comprime o sufre ruido) en su camino hacia V1 y hacia adelante. . Sin embargo, su codificación cambia para volverse más compatible con la integración con otra información sensorial y de memoria. Cuando los datos llegan a V1 y V2, están en una codificación que entendemos lo suficientemente bien como para reconstruir videos de lo que las personas están viendo/experimentando . Como resume el Gallant Lab que realizó el estudio vinculado:
El sistema visual humano consta de varias docenas de áreas visuales corticales distintas y núcleos subcorticales, dispuestos en una red que es tanto jerárquica como paralela. La información visual entra en el ojo y allí se transduce en impulsos nerviosos. Estos se envían al núcleo geniculado lateral y luego a la corteza visual primaria (área V1). El Área V1 es el módulo de procesamiento individual más grande del cerebro humano. Su función es representar la información visual de forma muy general descomponiendo los estímulos visuales en elementos espacialmente localizados. Las señales que salen de V1 se distribuyen a otras áreas visuales, como V2 y V3. Aunque la función de estas áreas visuales superiores no se comprende completamente, se cree que extraen información relativamente más complicada sobre una escena. Por ejemplo, Se cree que el área V2 representa características moderadamente complejas, como ángulos y curvatura, mientras que las áreas de alto nivel representan patrones muy complejos, como caras. El modelo de codificación utilizado en nuestro experimento fue diseñado para describir la función de las primeras áreas visuales como V1 y V2, pero no pretendía describir áreas visuales superiores. Como era de esperar, el modelo hace un buen trabajo al decodificar información en las primeras áreas visuales, pero no funciona tan bien en las áreas más altas.
Recuerde, no hay video en esas áreas. Es solo el disparo de neuronas que los científicos han descubierto cómo decodificar e interpretar. Como se menciona en la cita, las áreas visuales superiores no se entienden bien en este momento, pero presumiblemente ahí es donde está ocurriendo gran parte de la retroalimentación del tipo (2). Incluso dentro de las áreas visuales levemente comprendidas, se distribuye una gran cantidad de procesamiento. Por ejemplo, eche un vistazo a la pregunta sobre la ceguera facial:
Al dañar una parte del cerebro (el área fusiforme de la cara ), puede continuar 'ver' mesas y sillas perfectamente bien y, sin embargo, no puede identificar o reconocer caras correctamente.
Esperemos que esto te convenza de que no tiene sentido buscar 'la imagen' en el cerebro. Juntos, la mente y el ojo son capaces de dar forma a lo que percibes y darle significado, pero es una pseudopregunta preguntar dónde se ensambla finalmente esa imagen. No está ensamblado, no hay imagen, solo hay codificación de la actividad de la retina en patrones de disparo de nivel superior que produce en nosotros la experiencia de la visión y el significado.
El sistema nervioso, especialmente la corteza, es un sistema distribuido. Preguntar "dónde" no siempre es una pregunta sensata. En realidad, diferentes propiedades de la escena visual se ensamblan en diferentes áreas de la corteza. No hay un área donde se vuelva a montar todo. Toda la información que conocemos sobre una escena se almacena en todo el sistema visual. En inferotemporal, podríamos representar objetos complejos. En mediotemporal, podríamos representar el movimiento dentro de la escena visual. Estas propiedades están integradas en alguna parte en la comprensión de la escena como un todo (podemos ver un objeto en movimiento y también saber quélo es), probablemente en el lóbulo parietal posterior o en la circunvolución temporal superior. Pero sería un error decir que el PPL/STG es donde "vemos" el mundo. Simplemente está ensamblando otros grupos de neuronas en una representación de la escena visual general.
Piensa en esto, de esta manera. Diferentes áreas de la corteza llegan a representar diferentes propiedades de la escena visual. Estas representaciones pueden ser utilizadas por otras áreas para formar representaciones más complicadas. Etcétera. No hay un punto de convergencia en la corteza, solo una disponibilidad de representaciones cada vez más complejas.
Artem Kaznatchev
bfrs
bfrs