Adobe Illustrator ha tardado más de cinco minutos (y contando) en renderizar una imagen 2D vectorial rotada 18° en 3D en mi computadora. Y, sin embargo, yo y casi cualquier otra persona podemos visualizar fácilmente que el sujeto gira casi instantáneamente y, con poco esfuerzo, rotar el objeto continuamente en tiempo real en el ojo de la mente.
No estoy preguntando cómo almacena el cerebro las representaciones de los objetos, ya que eso es claramente un tema de debate. Pero, ¿cómo estructura el cerebro su representación interna de datos visuales en 3D?
Es casi seguro que no está en algún formato basado en píxeles, como se puede mostrar simplemente visualizando un objeto de algún tipo, y luego haciendo zoom mentalmente en algún detalle y notando que la imagen conserva su nitidez. Probablemente tampoco es descomponer objetos en formas geométricas, porque al menos yo personalmente no visualizo a mis amigos como figuras de palitos. Podría ser un formato vectorial , pero entonces debería ser más fácil visualizar formas complejas que son matemáticamente simples, como esta:
Entonces parecería que el cerebro usa algún otro formato. Según el mejor conocimiento de la cognición moderna, ¿cómo funciona esto?
Esta pregunta no puede responderse en la forma en que la formulaste tanto por los límites de las teorías y metodologías neurocientíficas actuales a la hora de determinar las estructuras de representaciones neuronales complejas (aunque hemos avanzado en algunos casos, como las células de lugar y celdas de cuadrícula), y porque las representaciones neuronales no son realmente análogas a nuestros conceptos coloquiales de asignaciones simples de números a imágenes (por ejemplo, píxeles, vectores, ondículas, etc. bases para la representación de imágenes digitales).
Le animaría a pensar, no sólo en términos de estos formatos de representación privilegiados por las arquitecturas informáticas de estilo Von Neumann (es decir, computadoras normales) con procesamiento separado y sistemas de memoria digital, sino en términos de una computadora neuronal con computación y memoria distribuidas. Los neurocientíficos suelen pensar que la representación neuronal en la percepción visual ocurre en una serie de etapas de mayor abstracción. En la retina , la imagen se representa aproximadamente en términos de lo que podría pensarse como píxeles, pero en realidad es solo un conjunto de fotosensores y neuronas conectadas que se activan debido a que la luz golpea la retina en diferentes lugares a diferentes frecuencias y amplitudes. En V1 o corteza visual primaria, la representación es en términos de lo que se puede considerar como "detectores de borde". En V2, las celdas se ajustan para una variedad de propiedades un poco más complejas, como la orientación, la frecuencia espacial, el color y la disparidad binocular (una información importante para la percepción 3D). A medida que avanza por V3, V4, V5 , y V6, las representaciones se vuelven cada vez más complejas hasta que contienen información sobre la estructura del propio concepto subyacente.
La tridimensionalidad no aparece hasta que la información visual de ambos ojos se combina con información de arriba hacia abajo sobre cómo tienden a ser las cosas en el mundo (que también proviene de otros sentidos y experiencias) para inferir la forma probable de el objeto. No está claro si hay algún lugar en el cerebro donde una imagen se represente explícitamente como un modelo 3D de un objeto visual. Es más probable que los datos de percepción sin procesar, como colores y patrones, se representen en un área y se asocien con la representación estructural más centrada en el objeto en otra área y esta asociación provoque la coactivación de todas las neuronas relevantes para la percepción del objeto en es una forma tridimensional.
También podemos pensar en esto en términos de la teoría contemporánea de la percepción enactiva, que establece que el cerebro representa la información en términos de contingencias de estado-acción-observación. En esta teoría, no hay ninguna "imagen" presente en absoluto, sino solo un conjunto de activaciones neuronales que se correlacionan con la experiencia previa (donde las correlaciones se almacenan en términos de vínculos asociativos entre neuronas que crean un camino de activación causal a lo largo del cual viaja la "información" ) y relaciones entre acciones potenciales (ya sea acciones motoras de bajo nivel de la retina u otros músculos,
Si desea leer más, estas fuentes deberían ser un buen comienzo: memoria neuronal distribuida , representación neuronal distribuida de un proceso de orden superior , percepción como asociaciones entre acciones y observaciones
También hay algunas fuentes que ofrecen evidencia experimental directa sobre su pregunta, pero no brindan una introducción conceptual a la computación y representación neuronal. Consulte "Cálculos neuronales subyacentes a la percepción de profundidad" , Percepción de profundidad binocular y la corteza cerebral como punto de partida.
Su pregunta también hace referencia a la rotación de un objeto "en el ojo de la mente". También hay un gran cuerpo de investigación sobre este fenómeno, que se llama "rotación mental". El artículo de wikipedia es un buen lugar para comenzar, pero hay mucho más que decir sobre este interesante fenómeno, ¡así que no dude en hacer una pregunta relacionada si tiene curiosidad!
Robin Kramer-diez tienen
El Ambientalista
Perro
El Ambientalista
Izhaki
entablillar
entablillar