Problemas con la parametrización de la simulación neuronal en un número limitado de conjuntos de datos

Espero contribuir al proyecto OpenWorm ayudando en sus esfuerzos para parametrizar las neuronas en CElegans para que el modelo provoque un comportamiento biológicamente realista.

El problema es que solo tengo cinco conjuntos de datos de series de actividad para todas las neuronas en CE y me temo que cualquier modelo que se entrene en estos conjuntos de datos no será un modelo preciso del espacio completo de actividad neuronal en CElegans.

¿Puede dar algunas ideas sobre cómo funciona el campo en torno a esto y dónde puedo leer sobre qué métodos se utilizan para resolver este problema?

Haces lo que puedes. luego la gente lo refinará. eso es lo mejor que puedes hacer. todos los modelos computacionales biofísicamente realistas están lamentablemente limitados en este punto.
Entonces, ¿cuál es el valor de su modelo entonces?
bueno, hay varios beneficios. una es que con un modelo puede explorar los efectos de cambiar valores de parámetros desconocidos, lo que podría proporcionar predicciones sobre cuáles deberían ser esos parámetros. otra es que con un modelo, puedes hacer experimentos que no podrías hacer en un animal real porque realmente tienes acceso a todas las variables relevantes. no te da una respuesta slam dunk pero te da otra perspectiva sobre el problema. el modelo también se puede refinar iterativamente haciendo predicciones, probándolas experimentalmente y luego mejorando el modelo en función de esos experimentos.

Respuestas (1)

Debido a la variación entre organismos, las células del mismo organismo, o incluso la misma célula separada por unos pocos días, pueden tener un conjunto de parámetros diferente. Sin embargo, creo que aquí es donde el ajuste de parámetros se vuelve útil. Como se sugiere en los comentarios, saber cómo cambian los parámetros entre celdas o con el tiempo puede ser muy revelador. La estimación de parámetros es muy importante porque nos permite recopilar más información sobre el conjunto de parámetros a partir de datos menos experimentales y, por lo tanto, permite experimentos más complejos.

Dejando de lado la filosofía, aquí hay algunos consejos para entrar en el campo. Sugeriría leer este artículo de acceso abierto de Van Giet et al. aquí y daré una breve reseña de su artículo.

Modelo General Primero se necesita un marco general para trabajar dentro,

  • ¿Cuál va a ser tu tipo de modelo neuronal? una neurona de integración y disparo (reinicio discontinuo) o es un modelo electrofisiológico (continuo).
  • ¿Cuáles son las corrientes/canales/puertas en él (Sodio, Potasio, Cloro, Calcio)?
  • ¿Qué forma toman las ecuaciones diferenciales?
  • ¿Cuáles son los parámetros conocidos/desconocidos?

Cuanto más pueda responder a estas preguntas, más fácil será el proceso de ajuste de parámetros, pero tenga cuidado, un enfoque único para todos rara vez funciona en biología debido a la variación de una célula a otra.

Función de error A continuación, se necesita lo que se llama una función de error, o una forma de saber si la traza de voltaje de salida del modelo es similar a la traza de voltaje real. El más clásico (pero en mi honesta opinión el peor) es el L 2 norma sobre los voltajes. Él L 2 es simple

i norte ( V metro o d mi yo ( i ) V d a t a ( i ) ) 2

Para ver por qué esto es tan malo, adjunté una muestra (traza simulada del modelo Hodgkin-Huxley).

Dos trazas de voltaje

El Blue Trace es de una neurona con un poco menos de corriente inyectada que el Yellow Trace one. Como puede ver, el amarillo tiene una frecuencia más rápida que el azul y, como resultado, el L 2 la norma es masiva para cada pico desalineado. Sin embargo, los trenes de picos están intuitivamente muy cerca, como se ve no solo en el lugar donde se alinean los picos, sino también en el lugar donde los picos, por lo que a uno le gustaría una medida que defina la fase y la frecuencia desalineadas.

Van Geit et al. la idea es que el L 2 es la norma incorrecta para comparar la distancia de voltaje. Lo que hacen es hacer un gráfico paramétrico de la derivada del voltaje en función del voltaje. Luego compare la distancia entre las curvas como en el siguiente gráfico.

ingrese la descripción de la imagen aquí.

Vemos que las trazas de voltaje son muy similares, pero para calcular la distancia entre estas curvas, debemos ignorar los datos de tiempo. Podemos imaginarnos subdividiendo el espacio de fase en una cuadrícula de cajas de igual tamaño. Luego cuente el número de puntos de datos y puntos de modelo en las casillas. En notación matemática esto equivale a

i , j norte X , norte y ( V metro o d mi yo ( i , j ) V d a t a ( i , j ) )

hemos perdido información sobre la fase del pico. También es importante tener en cuenta que esto depende en gran medida del tamaño de las cajas, si son demasiado pequeñas, el error será alto, si son demasiado grandes, el error será bajo. Si bien el método puede no ser la única solución propuesta, funciona mejor que el L 2

ingrese la descripción de la imagen aquí

Aquí están ambos métodos uno al lado del otro para comparar. El punto negro es la verdadera solución. azul es L 2 y Yellow es el método de Van Geit. Notará que ambos son "ruidosos", pero hay una mejor tendencia en el método de Van Geit que en el L 2 norma, por lo que la optimización es más fácil. Para el L 2 Observe cómo la función es plana lejos de un valle muy empinado y angosto. Esto es difícil de alcanzar para los algoritmos de optimización. El método de Van Geit es mejor porque tiene una mayor pendiente descendente que se puede seguir hasta un mejor mínimo global.

También tenga en cuenta que este ruido no se debe a la variación aleatoria (aunque eso lo empeora), sino a la discretización de los datos y el modelo. (recuerde que todo lo que se almacena en una computadora tiene una frecuencia de muestreo por pequeña que sea).

Algoritmo de optimización ahora Una vez que se tiene una función de error apropiada, se necesita usar un algoritmo de optimización para encontrar el mínimo local de dicha función de error. En mi ejemplo aquí, estoy usando la corriente inyectada como mi parámetro, pero en cada modelo de neurona hay muchos parámetros que uno necesita optimizar, por lo que la visualización directa suele ser imposible.

Otra advertencia es el "ruido". Estos valles locales pueden hacer que los algoritmos de optimización se atasquen en los mínimos locales. Los algoritmos de optimización estocásticos (aleatorios), como el recocido simulado, pueden ayudar a quedarse atascados en estos valles, ya que tienen la posibilidad de superarlos. .

Buenas conjeturas iniciales En cuanto a no responder el "espacio completo" de soluciones, cuantas más entradas posibles tenga, más posibilidades tendrá de poder predecir una entrada diferente. También definir el comportamiento computacional de su neurona es un buen comienzo. Tener un modelo general que actúa cualitativamente correctamente pero no cuantitativamente suele ser un buen comienzo para el ajuste de parámetros. Esto significa que uno no comienza con una neurona que no responde a las entradas, o algo físicamente poco realista.

De todos modos, espero que esto brinde antecedentes sobre las cosas a considerar, este campo está lejos de resolverse y necesita soluciones creativas.

Esto terminó mucho más de lo que esperaba. Espero que esto ayude y si necesito aclarar algo, hágamelo saber.