Antecedentes: en muchas situaciones, las personas suelen clasificar objetos sin conocer la teoría del aprendizaje automático. Por ejemplo, si un niño pequeño ve un animal desconocido en la naturaleza, intenta clasificarlo como peligroso o no peligroso (basándose en "datos" anteriores).
Pregunta: Obviamente, los humanos usan cualquier clasificador. Mi pregunta es: ¿Cuál?
Esta es, por supuesto, una gran pregunta y no creo que haya una respuesta definitiva. Una investigación muy completa de este asunto proviene de Rogers y McClelland (2004), quienes desarrollaron una teoría paralela distribuida de adquisición, representación y uso del conocimiento semántico humano . Como su nombre lo indica, este esfuerzo proviene del ámbito del procesamiento distribuido paralelo, que también se denomina conexionismo.. Los libros que citó @DikranMarsupial pueden verse como los cimientos del campo. Según tengo entendido, los dos volúmenes y sus autores (McClelland es solo uno de ellos, al menos otros dos nombres importantes son David Rumelhart y Geoffrey Hinton) tuvieron un enorme impacto en el renacimiento de las redes neuronales dentro de la ciencia cognitiva y en el desarrollo del enfoque distribuido paralelo.
Rogers y McClelland (2004) ofrecen una descripción interesante de cómo se agrupan las cosas en categorías, que es lo que está preguntando. Para dar una explicación muy breve: según su teoría, todos los objetos tienen ciertos atributos. Por ejemplo, un canario tiene patas, alas y plumas. Un petirrojo también tiene todas estas cosas. Un pino, en cambio, tiene hojas, raíces y raíces. Lo mismo es cierto para un roble. En realidad, hay muchos más atributos, pero esto debería ser suficiente para aclarar el punto.
Los objetos que tienden a covariar entre sí de manera coherente (porque tienen atributos similares) se perciben como similares y se clasifican como pertenecientes a una categoría, como el canario y el petirrojo. Otros objetos, que no covarían con los de este primer grupo, pero sí covarían coherentemente con otros objetos, se clasifican como pertenecientes a otro grupo, como el pino y el roble. Son estas categorías coherentes las que son importantes para clasificar objetos.
Rogers y McClelland (2004) utilizaron una red neuronal para demostrar y probar su teoría. Sus hallazgos son consistentes con una variedad de hallazgos de estudios de desarrollo. También tienen un artículo, que es básicamente un breve resumen del libro (Rogers & McClelland, 2008). Si está interesado, es posible que desee ver esto primero. El artículo tiene comentarios de revisores pares que señalan las debilidades de la teoría, lo cual también es muy interesante.
Dado que se refirió al aprendizaje automático en su pregunta: el algoritmo de aprendizaje utilizado en los estudios de simulación fue el algoritmo de propagación hacia atrás del error . Como también mencionó @DikranMarsupial, este no es un algoritmo especialmente plausible biológicamente. Curiosamente, sin embargo, como también se explica con mucho detalle en el libro, es posible predecir el orden en el que los objetos dentro del corpus de entrenamiento podrían clasificarse mediante una descomposición de vectores propios de una variante especial de la matriz de covarianza de los objetos. No soy un experto aquí, pero para mí parece haber una conexión con la llamada regla de covarianza (desafortunadamente no tengo una cita aquí), que, según mi conocimiento, es biológicamente plausible.
Referencias:
Rogers, T. T y McClelland, JL (2004). Cognición semántica: un enfoque de procesamiento distribuido paralelo. Cambridge, MA: MIT Press. PDF
Rogers, Timothy T. y McClelland, JL (2008). Resumen de la cognición semántica: un enfoque de procesamiento distribuido en paralelo. Ciencias del comportamiento y del cerebro, 31(06), 689. doi:10.1017/S0140525X0800589X PDF
La respuesta obvia sería las redes neuronales, que es la familia de métodos de aprendizaje automático inicialmente inspirados en la estructura de nivel más bajo del cerebro humano.
Ver los libros de Mclelland et al.
que dan cuenta de la investigación sobre redes neuronales en los días en que la plausibilidad biológica era más una consideración de lo que es ahora (desde una perspectiva de aprendizaje automático).
memming
Quonux