¿Por qué modelado cognitivo bayesiano?

Recientemente leí un artículo sobre la síntesis de programas bayesianos . Dice que el modelado cognitivo bayesiano ayudaría a los sistemas de IA a aprender de algunos ejemplos en comparación con el aprendizaje profundo. Pero no pude entender las ventajas de usar Bayesian frente a otras formulaciones en el modelado cognitivo. Me gustaría entender por qué se destaca este enfoque bayesiano. ¿Cuáles son los inconvenientes de los enfoques actuales del modelado cognitivo?

Respuestas (1)

Aquí hay una respuesta rápida de conocimientos básicos generales, no de ningún conocimiento específico de "Síntesis de programa bayesiano (BPS)"

En general, los modelos bayesianos pueden utilizar antecedentes fuertemente informados o antecedentes difusos "podría ser cualquier cosa". Los valores previos fuertes especifican que muchos valores de parámetros son muy poco probables, mientras que algunos otros valores de parámetros son posibles descripciones de los datos. Con un previo sólido, se necesitan relativamente pocos datos para reducir las posibilidades (es decir, un aprendizaje más rápido). Los antecedentes débiles permiten una gama mucho más amplia de posibilidades, pero se necesita una tonelada de datos para reducir las posibilidades (es decir, un aprendizaje más lento).

Muchos modelos bayesianos de la mente utilizan fuertes antecedentes. Dichos modelos vienen preestablecidos con una estructura particular o dependencias de parámetros que están ajustados para el tipo de problema que debe aprenderse. Esto no es "hacer trampa"; el previo es una parte crucial de la teoría. Otro ejemplo proviene de la visión por computadora: averiguar qué objetos e iluminación produjeron una imagen 2D pixelada solo se puede hacer asumiendo un conocimiento previo sólido de los tipos de objetos y tipos de iluminación "allá afuera" en el mundo, de lo contrario es un problema irresoluble. Un artículo introductorio está aquí o aquí (específicamente, ver la sección sobre "Conocimientos previos" a partir de la página 17).

Sin embargo, el aprendizaje profundo es (hasta donde yo sé) un enfoque genérico que puede aprender casi cualquier relación posible entre variables. El costo de este previo débil es que se necesita mucho entrenamiento para reducir la distribución de parámetros.