¿Por qué es razonable la función objetivo utilizada en el método Nudged Elastic Band?

En el método Nudged Elastic Band (NEB) , que se utiliza para encontrar rutas de reacción cuando se conocen los estados inicial y final, primero se construye una función objetivo y luego se minimiza para encontrar rutas de reacción.

NEB crea una cadena de réplicas (o 'imágenes') del sistema entre los estados inicial y final, y las conecta con resortes para representar un camino que conecta los estados inicial y final. Inicialmente, las imágenes pueden interpolarse linealmente entre el reactivo y el producto. Luego se aplica un algoritmo de optimización para relajar las imágenes hacia la ruta de energía mínima (MEP).

La función objetivo se construye como una combinación de la energía potencial de cada imagen y la "energía de resorte" entre cada imagen, como muestra la siguiente ecuación.

S ( R 0 , . . . , R norte ) = i = 1 norte 1 mi ( R i ) + i = 1 norte k 2 ( R i R i 1 ) 2

Dónde R i son las coordenadas de la i-ésima imagen.

NEB resolvió los problemas de "corte de esquina" y "deslizamiento hacia abajo" en este modelo al considerar los componentes verticales y paralelos de la fuerza potencial y la fuerza de la cuerda. No lo presentaré aquí, puede consultar este artículo para obtener más detalles.

Mi pregunta es por qué la función objetivo anterior es razonable. ¿La minimización de esta función objetivo lleva suficientemente al MEP? En caso afirmativo, ¿cómo probarlo? Si no, ¿por qué se usa ampliamente este modelo de "cadena de estados"?

Muchas Gracias por responder.

Respuestas (2)

No tengo antecedentes en este asunto, pero creo que es necesaria cierta intuición básica.

Deslizándose por:

Suponga que tiene una cadena de pelotas de goma conectadas por resortes elásticos. Sostenga la cadena y déjela colgar. Observe que la energía del sistema es exactamente igual a la anterior, con mi ( R norte ) = metro gramo Z norte dónde Z norte es la altura de la pelota norte .

¿Como se verá esto? Numerando la bola en la parte inferior como norte = 1 y los de arriba como norte = 2 , 3... , tienes que la fuerza sobre la bola norte de los que cuelgan debajo es metro gramo ( norte 1 ) . Por lo tanto, la distancia de estiramiento del resorte debajo de él es d ( norte ) = metro gramo ( norte 1 ) / k . Definiendo la altura de la bola 1 como 0, la altura de la bola norte será

h ( norte ) = j = 1 norte d ( j ) = gramo metro ( norte 2 norte ) 2 k
que se ve así:

ListLinePlot[
 Table[{0, (g m (-n + n^2))/(2 k) /. {g -> 1, m -> 1, k -> 1}}, {n, 
   10}], Axes -> False, PlotMarkers -> Automatic, AspectRatio -> 4]

ingrese la descripción de la imagen aquí

Como puede ver, se estira en la parte superior porque los enlaces en la parte superior soportan más peso.

Ahora suponga que coloca la cuerda sobre una tortuga (o algún otro objeto con forma de colina). ¿Como se verá esto? Del ejemplo anterior, debería ser intuitivamente obvio que en la parte superior de la tortuga, las bolas se estirarán más separadas, mientras que en los bordes inferiores los resortes estarán más relajados y las bolas estarán más juntas. En otras palabras, la resolución es peor en la parte superior del caparazón de la tortuga que en los bordes inferiores.

Esto es un problema. Cuando intenta encontrar una superficie de energía mínima, desea obtener una buena resolución en la región del punto de silla (también conocido como punto de no retorno), pero este método hace exactamente lo contrario. Eso es lo que significa cuando el artículo dice "deslizarse hacia abajo": las cuentas se hunden hacia las partes sin importancia y se estiran sobre las partes importantes.

Tenga en cuenta que la fuerza que causa este problema es paralela a los resortes, como se menciona en el artículo.

Esquinas de corte:

Ahora suponga que se encuentra en un valle entre dos colinas y que el valle se curva en una dirección. Deja caer una cuerda en el valle y tira de ella para que quede tensa.

Cómo se ve?

Si no tira demasiado fuerte, se enderezará y hará todo lo posible para adaptarse a la forma del valle, más o menos así:

ingrese la descripción de la imagen aquí

Pero, si lo tira demasiado fuerte, comenzará a cortar la esquina, así:

ingrese la descripción de la imagen aquí

Tenga en cuenta que la fuerza que causa este problema es perpendicular a los resortes, como se menciona en el artículo.

¡Buena explicación! Pero, ¿qué piensas de la función objetivo en sí? Dadas suficientes imágenes, ¿la minimización de la función conduce necesariamente al punto de silla entre los estados inicial y final?
Realmente no sé lo suficiente como para probar rigurosamente bajo qué condiciones converge a un camino de energía mínima, pero sospecho que la experiencia práctica en probar el método en superficies y ver qué tan bien converge supera las consideraciones teóricas. Parece algo intuitivamente probable que debería converger; el término de energía conduce a minimizar la energía de la cadena, y la elección de un valor distinto de cero k -constant hace que la cadena sea algo rígida (de lo contrario, todas las bolas colapsarían en un solo punto de baja energía en el espacio de configuración). Pero realmente no lo sé.

Ok, entonces, esta es una respuesta bastante tardía, pero estaba pensando en esto y creo que lo descubrí, aunque ni siquiera estoy seguro de si el NEB original se implementó con esta justificación exacta en mente, viendo cuán arrogante parece estar con su notación. Sin embargo, es una buena justificación. Abróchate el cinturón, porque es un paseo, ¡eso involucra la mecánica cuántica y las integrales de trayectoria de Feynman, nada menos!

Entonces, primero comencemos con la noción de 'acción'. La acción es una cantidad definida sobre un camino. Si tenemos un movimiento en el tiempo de t = 0 a t = T siguiendo un camino X ( t ) entonces la acción es la integral en el tiempo del Lagrangiano, L :

S = 0 T L ( t ) d t = 0 T 1 2 metro X ˙ 2 V ( X ) d t

Esto tiene en cuenta una propiedad interesante de la mecánica cuántica. Si nos preguntamos "¿qué tan probable es que una partícula en eso se pueda encontrar en X 0 en t = 0 en un potencial V para luego ser encontrado en X norte en t = T ?", la respuesta puede expresarse mediante un propagador o mediante una integral de trayectoria. Específicamente:

PAG ( X norte , T ; X 0 , 0 ) = X norte | mi i H T | X 0 = A D [ X ( t ) ] mi i S

De acuerdo. ¡Tiempo de explicaciones! La primera formulación es la típica notación de corchetes cuánticos: eliges tu estado inicial, lo desarrollas usando un propagador de tiempo que es el exponencial del hamiltoniano (también conocido como la energía del sistema) dividido por los tiempos constantes de Planck i T , luego lo proyecta contra el estado final deseado. La superposición entre el estado evolucionado y el deseado es la probabilidad de que suceda ese proceso específico. ¿Aún conmigo? Bien.

La segunda formulación es la notación integral de trayectoria de Feynman. Dice algo ligeramente diferente: dice que la probabilidad de encontrar el sistema en ese estado final es proporcional (hay un factor de normalización A de la que no nos preocuparemos por ahora) a la suma de una exponencial imaginaria de la acción, dividida por la constante de Planck, para todos los caminos posibles que conectan los dos estados en ese tiempo . eso es lo que D [ X ( t ) ] significa: no es una integral sobre una variable, es una integral sobre funciones . Y como puede suponer, eso es muy difícil de calcular. Más de eso en un minuto. Primero, consideremos qué significa este formalismo de integral de trayectoria.

La acción, como la energía, no es un valor absoluto, se define hasta una constante, siendo una integral de una cantidad muy energética, la lagrangiana, y todo. Así que supongamos que existe un camino que conecta nuestros dos eventos que tiene una acción mínima, y ​​todos los demás caminos tienen uno más grande. Tenga en cuenta que esta suposición no siempre es cierta, y eso significa que este razonamiento y todas sus consecuencias pueden estropearse a veces; pero, de nuevo, también puede hacerlo el NEB si hay dos puntos de silla igualmente posibles, así que tengan paciencia conmigo. Si trabajamos bajo esa suposición, entonces podemos establecer S = 0 por ese camino y S > 0 para todos los demás. Estos otros caminos entonces contribuirán con términos oscilatorios a la integral general, y cuanto mayor sea S , cuanto más rápidas sean las oscilaciones, más probable es que se cancelen entre sí. Si imaginamos encogernos (que es un gran no-no, no se llama constante por nada, pero vamos a hacernos dioses y crear nuestras propias versiones del universo por un momento), entonces estas oscilaciones se vuelven más y más salvajes; y en el limite de 0 , es decir, en el límite de un universo perfectamente clásico, newtoniano, totalmente no cuántico, se descontrolan por completo, y sólo queda un camino por aportar: el de la mínima acción.

Acabamos de recuperar el Principio de Mínima Acción , que dice que el camino (newtoniano) entre dos puntos en el espacio y el tiempo es siempre el que tiene la mínima acción posible.

Entonces, ¿qué tiene esto que ver con NEB? Bueno, necesitamos algunos pasos más y un truco.

Supongamos que tenemos un sistema clásico y queremos calcular la ruta de acción mínima entre dos puntos en el espacio y el tiempo. La cuestión es que todas las trayectorias newtonianas son el camino de menor acción entre donde comienzan y donde llegan; pero no sabemos dónde llegarán antes de probarlos. Aquí, en cambio, conocemos las condiciones iniciales y finales, y no sabemos nada sobre el camino en sí (incluida la velocidad inicial). Entonces, ¿cómo hacemos eso, especialmente con una computadora? Bueno, yo diría que discretizamos la integral para calcular la acción en norte pasos, con un paso de tiempo d t = T / norte , separándolo en una suma de pasos intermedios X 1 , X 2 , . . . . De esta manera, la acción se convierte en:

S = i = 0 norte [ 1 2 metro X i ˙ 2 V ( X i ) ] d t

Esta discretización, por cierto, también es una forma excelente de calcular la integral anterior y se usa a menudo, por ejemplo, en la teoría cuántica de campos. Entonces, ¿cómo calculamos esas velocidades? Bueno, supongamos que son constantes entre cada par de pasos, entonces

X i ˙ = X i X i 1 d t

y

S = i = i norte 1 2 metro ( X i X i 1 ) 2 d t i = 0 norte V ( X i ) d t

¿Está comenzando a parecerse a su función de objeto NEB original, si toma k = metro / d t ?

Pero mira, todavía hay un problema, a saber, ese pernicioso signo "menos" frente al potencial. En su fórmula original, ¡es un plus! Eso es un hamiltoniano, no un lagrangiano. Entonces, ¿qué hace que desaparezca?

Último truco, lo juro. Tiempo de rotación de la mecha . Otro favorito de los proveedores de QFT.

Este suena un poco como magia, de verdad. ¿Ves ese propagador cuántico, arriba? Quiero decir esto:

mi i H t

Ahora, si sabes que el hamiltoniano es básicamente la energía del sistema, esto se parece mucho a una función de partición. Así que hagamos que se vea como uno. Hagamos un cambio de parámetros: T i τ .

mi i H t mi H τ

Ok, eso tiene que ser trampa, ¿verdad? Pero, de hecho, está perfectamente bien, simplemente estamos redefiniendo un parámetro en nuestras matemáticas, nada ha cambiado. Llamamos τ el "tiempo imaginario" y lo único que es realmente importante recordar es que no tiene nada que ver con el tiempo real y nunca debemos relacionar los dos como si fueran lo mismo, no lo son. Ahora veamos qué hace eso por nuestra acción. Tenemos que cambiar su elemento de tiempo, así que d t i d τ , pero mira lo que pasa...

S = i i = i norte 1 2 metro ( X i X i 1 ) 2 d τ + i i = 0 norte V ( X i ) d τ

¡Bueno, aquí lo tenemos! También hay muchas consecuencias convenientes, como, si volvemos a la integral de trayectoria, ahora las acciones no mínimas no solo oscilan, se desvanecen exponencialmente , y eso hace que la integral converja mucho mejor. ¡Pero en el proceso perdimos la conexión original entre caminos y dinámicas! Estos caminos que obtenemos al optimizar esta acción no son caminos reales, son caminos en un "tiempo imaginario", lo que francamente parece sacado de un mal episodio de Doctor Who. Entonces, ¿este tiempo tiene que ver con algo? Bueno, revisa la parte donde primero realizamos la rotación de Wick. Eso se parece mucho a una función de partición, ¿verdad? De hecho, sería totalmente una función de partición si establecemos τ = β ( β siendo aquí el inverso habitual de la temperatura por la constante de Boltzmann). Así que ahí lo tienes: el tiempo imaginario es la temperatura inversa . Cuando calcula esa ruta, arriba, no está buscando una ruta específica en el tiempo, está buscando una ruta a una temperatura dada, y cuanto más alta T (la última vez), cuanto más baja sea la temperatura... eh... T Supongo (bueno, me doy cuenta de que aquí en realidad usé una notación un poco confusa. Lo siento por eso). Resulta que tu k en la función objetivo NEB es exactamente proporcional a la temperatura. Póngalo alto y las partículas cortarán esquinas: tienen suficiente energía cinética para hacer eso. Ajústelo bajo y las partículas simplemente se deslizarán hacia atrás en sus cuencas potenciales: no pueden salir de ellas.

Y por eso el NEB usa esa función objetivo, y cuál es su sentido físico.

La función de objeto que anotó no es para NED, es para un método simple de banda elástica. NED comienza con esta acción, pero elimina la fuerza del resorte del camino y, a lo largo del camino, NEB ignora todo lo que no sea la fuerza del resorte.
La función de objeto que intenta minimizar es conceptualmente la misma; Luego, NEB agrega correcciones artificiales para tratar de evitar el problema del exceso de tensión del resorte que conduce a que el camino simplemente pase por el camino más corto en lugar de deslizarse hacia el punto de silla. No creo que haya una justificación teórica más profunda para eso en lugar de "funciona". La diferencia es que NEB busca solo un camino, no un proceso específico a una temperatura determinada.