Distribución de Maxwell-Boltzmann (velocidad) como distribución de máxima entropía y su interpretación

Soy consciente de la forma típica de "física" de derivar la distribución de Maxwell-Boltzmann para la velocidad v :

pag ( v ) = ( metro 2 π k B T ) 3 4 π v 2 Exp ( metro v 2 2 k B T )

de la isotropía de v , integre sobre direcciones para obtener una función de v solo, función de partición, y todo eso.

También sé que la distribución de Maxwell-Boltzmann puede surgir como resultado de maximizar la entropía (diferencial de Shannon) H = pag en pag d v bajo ciertas restricciones. En particular, las restricciones están en mi ( v 2 ) y mi ( en ( v ) ) . ( https://en.wikipedia.org/wiki/Maximum_entropy_probability_distribution#Other_examples )

Veo por qué esto 'funciona' matemáticamente.

Sin embargo, mi pregunta es: ¿Existe alguna interpretación "física" de la segunda restricción, es decir, sobre el valor esperado de en ( v ) ? La primera restricción es simplemente la de que la energía cinética esperada sea una constante (su significado físico está relacionado con la temperatura), pero no tengo idea de cuál es la en ( v ) implica.

Creo que es una forma muy extraña de escribir la restricción de que las probabilidades deben sumar 1. Sin embargo, no veo una forma obvia de mostrar esto sin comenzar con la distribución de Boltzmann. En cualquier caso, las restricciones normales dadas son que las probabilidades suman 1 y la energía media es fija.
@BySymmetry No, no es la restricción de normalización. La restricción de normalización se escribe simplemente como 0 pag ( v ) d v = 1 , y esto con un multiplicador de Lagrange simplemente ajusta el factor de escala constante por adelantado. El en v restricción agrega el v 2 dependencia fuera de la exponencial, cuando usa un multiplicador de Lagrange para maximizar H .
Si solo usa la normalización y las restricciones medias en valores reales no negativos v , se obtiene una distribución exponencial pag ( v ) = λ Exp ( λ X ) (media = 1 / λ ) como la distribución MaxEnt.
En ese caso, suena como si estuviera determinando la dependencia de la velocidad de la energía cinética.
@BySymmetry tampoco creo que ese sea el caso. Como está escrito en la pregunta original, la restricción mi ( v 2 ) es la restricción de energía media. No es una restricción sobre la velocidad media sino sobre la media de la velocidad al cuadrado (es decir, la energía cinética, hasta una constante).
Lo que quiero decir es que creo que la primera restricción fija la energía media, mientras que la segunda te dice que la energía cinética es 1 2 metro v 2 . La primera restricción no te dice esto; es solo una restricción | v | y le dará la distribución exponencial de nuevo.
Otra forma de decir lo mismo es que la segunda restricción determina la densidad de estados
Creo que solo está arreglando la escala de la entropía.

Respuestas (1)

Respuesta corta.

Incluir la restricción sobre la expectativa del logaritmo de la velocidad es equivalente a asumir una cuantización uniforme del espacio de fase clásico que, por experiencia, sabemos que es la receta correcta para aplicar MaxEnt a la mecánica estadística clásica.

Detalles.

Jaynes demostró que la entropía diferencial es solo una generalización continua apropiada de la entropía discreta de Shannon si la discretización que se elige es uniforme. Para una buena discusión de esto, recomendaría leer primero la sección 4b. de las conferencias de Teoría de la Información y Mecánica Estadística de Jaynes, ya que parece ser la fuente original de esta observación. También encontré un buen artículo de Wikipedia discutiendo este punto:

Limitación de la densidad de puntos discretos

Jaynes demostró que si uno quiere generalizar la entropía de la información de una función de masa de probabilidad en un espacio de estado finito a una distribución de probabilidad continua en algún subconjunto de R norte , como cuando tratamos con el espacio de fase clásico, aunque la entropía diferencial que anotaste parece la generalización obvia que se obtendría al discretizar el espacio y aplicar la versión discreta de la entropía, en realidad asume implícitamente una discretización uniforme, como dividir el espacio en cubos de igual volumen. La expresión más general que permite una discretización en la que la densidad de estados metro ( X ) en el espacio no es necesariamente uniforme es

H [ ρ ] = ρ ( X ) en ρ ( X ) metro ( X ) d norte X .
Jaynes admite que en el contexto de la mecánica clásica no está claro qué justifica la elección de un determinado metro sobre otro, pero argumenta que si, motivados por la mecánica cuántica, usamos el truco habitual de "cuantización" de dividir el espacio de fase en celdas de igual volumen d 3 pag d 3 q / h 3 , entonces deberíamos elegir correspondientemente metro ( X ) = C o norte s t . . Si hacemos esto y eliminamos una constante general sin importancia que resulta, podemos usar la ingenua expresión de entropía diferencial
H [ ρ ] = ρ ( pag , q ) en ρ ( pag , q ) d 3 pag d 3 q
Por otro lado, observe que si desea describir las estadísticas de un sistema clásico utilizando una distribución de probabilidad en el espacio de la magnitud del momento pag = | pag | (o velocidad equivalente), entonces la densidad uniforme de estados en el espacio de cantidad de movimiento se convierte en una densidad creciente de estados en pag -espacio que depende de la dimensión del espacio Para ver esto, observe que la densidad uniforme de estados en el espacio fase corresponde al hecho de que el número de estados en una región dada es proporcional a su volumen. En d -dimensiones, el número de estados con momentos entre pag y pag + d pag es por lo tanto proporcional a pag d 1 d pag . De ello se deduce que debemos tomar
metro ( pag ) = ( constante ) pag d 1
Ignorar las constantes aditivas generales sin importancia que resultan de la normalización de metro y luego incluyendo metro pag d 1 en el cómputo de H es equivalente a sumar un término multiplicador de Lagrange en el que el multiplicador de Lagrange tiene valor d 1 . Para ver esto, observe por un lado que incluyendo metro y utilizando la versión más general de H nos hace encontrar puntos críticos de los siguientes funcionales:
j [ ρ ] = ρ ( pag ) en ρ ( pag ) d pag + λ 0 ( ρ ( pag ) d pag 1 ) + λ 1 ( ρ ( pag ) pag 2 d pag C ) + ( d 1 ) ρ ( pag ) en ( pag ) d pag
Por otro lado, usar la entropía diferencial y agregar un término multiplicador de Lagrange nos lleva a encontrar puntos críticos del funcional
GRAMO [ ρ ] = ρ ( pag ) en ρ ( pag ) d pag + λ 0 ( ρ ( pag ) d pag 1 ) + λ 1 ( ρ ( pag ) pag 2 d pag C ) + λ 2 ( ρ ( pag ) en ( pag ) d pag k )
Cuando encontramos puntos críticos de GRAMO , encontramos eso
ρ ( pag ) = C mi λ 1 pag 2 mi λ 2 en pag = C pag λ 2 mi λ 1 pag 2
Si elegimos adecuadamente k de modo que λ 2 = d 1 , entonces obtenemos
ρ ( pag ) = C pag d 1 mi λ 1 pag 2
Para d = 3 obtenemos un pag 2 tener en cuenta ρ , que es precisamente lo que tenemos para el 3 Distribución de velocidad de Maxwell -dimensional.

Muchas gracias por esta detallada explicación. ¿Podría explicar cómo se pueden expresar estas consideraciones como una restricción en < registro v > , y en particular, ¿de dónde proviene el valor de restricción que figura en la página de Wikipedia?
@ user8153 Recomiendo leer lo siguiente que analiza sus preguntas en un entorno general: en.wikipedia.org/wiki/… No he resuelto los detalles algebraicos de las relaciones entre los multiplicadores de Lagrange y las expresiones que restringen la expectativa. valores en este caso particular, pero si tengo tiempo/energía para publicar un apéndice al respecto, lo haré.
¡Gracias! Supuse que más o menos de ahí venía, pero esto ciertamente ayuda. @ user8153 La respuesta a la segunda pregunta proviene del hecho de que en el espacio tridimensional, la "degeneración" de v está sobre una capa esférica, cuyo volumen va como v norte 1 ( 2 π ) norte / 2 / Γ ( norte / 2 ) d v . El término de la función Gamma en el denominador conduce a la apariencia "no tan obvia" de la constante de Euler Gamma.
¿Es esto lo mismo que realizar maxent con un v 2 restricción en 3 dimensiones (dando mi λ v 2 , luego cambiando a coordenadas radiales e integrando sobre los ángulos? Este último también debería resultar en un factor v 2 por cambio de variable