Diferencias computacionales entre las redes neuronales de picos y las RNA anteriores

Esta es una pregunta de IA sobre "redes neuronales de tercera generación": redes neuronales de picos (SNN).

He estado estudiando este concepto en línea a partir de varios artículos, principalmente Maass (1997) . No estoy completamente seguro de entender por qué los SNN se consideran códigos de pulso en contraste con los ANN anteriores que son códigos de velocidad.

Tengo experiencia en neurociencia, por lo que entiendo los términos y la proporción, pregunto sobre la implementación real.

¿La diferencia práctica está en el hecho de que cuando cada neurona actualiza su estado actual en un SNN, se trata de la historia completa de cada neurona presináptica y no solo del último paso? ¿Es eso lo que le da las características temporales de las que carecen las ANN de generaciones anteriores? ¿Cuál es la diferencia computacional clave entre SNN y los enfoques anteriores?

notas

Esta pregunta se migró de SO y se hizo un duplicado en cstheory que se migró a CS.SE.

En general, en Stack Exchange esto está muy mal visto; las preguntas deben existir en un solo sitio. Amir, asegúrese de mantener ambas preguntas actualizadas y, cuando acepte una respuesta en un sitio, asegúrese de responder la pregunta usted mismo en el otro sitio y vincúlelas. Y, por favor, evite las publicaciones cruzadas en el futuro. ¡Gracias!
Lo siento, no estaba al tanto de la política. Solo pensé que la pregunta estaba en el área gris entre los dos campos. Mantendré ambos y vincularé una respuesta final si la alcanzo.

Respuestas (1)

La red basada en tasas es una implementación específica de las redes de picos más generales. Uno puede ver una red basada en tasas como una red de picos en la que las entradas de cada neurona se acumulan durante un período de tiempo corto (piense en "un segundo") y se utilizan para actualizar el estado de su neurona objetivo solo una vez. en cada periodo de tiempo.

Por ejemplo, si una neurona de entrada tiene una salida de '40' en una red basada en frecuencia, debe considerarlo como si se disparara 40 veces en el período de tiempo, y solo una vez en cada período de tiempo es la neurona objetivo. 'leer' esta entrada.

Por otro lado, con las neuronas de pico, la salida está limitada a binaria y, por lo tanto, el período de tiempo utilizado debe ser más corto que la tasa máxima. En cada período de tiempo, la neurona objetivo actualiza su estado en función de su entrada (binaria).

Entonces, para resumir:
* Las redes de picos describen un fenómeno más general.
* Las redes de picos pueden reaccionar a las entradas con una estructura temporal fina y actuar en períodos de tiempo que son un orden de magnitud más pequeños que los modelos basados ​​en tasas.

También se puede agregar que es probable que las redes de picos sean una descripción biológica más precisa del cerebro (pero sigue siendo una descripción muy aproximada).

Tomemos un perceptrón simple también con una salida binaria. Según su descripción, parece que él también puede interpretarse como un código de pulso, todo es cuestión de a qué escala de tiempo atribuye cada iteración de la red (cada período de tiempo). Sin embargo, se considera que las neuronas IAF tienen habilidades diferentes a las de los perceptrones, a saber, la capacidad de encontrar patrones temporales en los datos. Entonces, independientemente de la interpretación, debe haber alguna diferencia esencial en la implementación para dar cuenta de eso. ¿Me estoy perdiendo de algo? muchas gracias uri
Consideremos una red que recibe entradas en M períodos de tiempo de N entradas. Luego, para cada uno de esos períodos de tiempo, puede pensar en la red como un perceptrón; pero la relación entrada-salida en todos los M períodos, donde hay 2^M salidas diferentes, es inherentemente diferente a tener M perceptrones independientes, debido a las interacciones no triviales entre ellos.
Vale, creo que lo entiendo. Pero tomemos esa red, con exactamente la misma estructura, y cambiemos la implementación de la neurona de IAF a perceptrón. Tener 2 copias de la misma topología y tiempo de ejecución (M tiempo, N entradas) con una implementación diferente para las neuronas. ¿Por qué uno sería código de pulso y el otro código de tarifa?
Esos son solo nombres, que indican que cada período de tiempo se procesa de forma independiente (en perceptrón) o interactúan entre sí a través del cambio del estado de la red (el 'voltaje', en IAF).