¿Cómo puedo entender intuitivamente el factor de Boltzmann?

Se sabe que para un sistema en equilibrio térmico descrito por el conjunto canónico , la probabilidad de encontrarse en un estado de energía mi a temperatura T viene dada por la distribución de Boltzmann :

(1) PAGS ( estado con energia  mi ) mi mi / k T .

No tengo problemas con la derivación matemática de este resultado, pero me pregunto si hay una manera de entender lo que (1) significa intuitivamente.

En otras palabras: ¿hay alguna manera de "adivinar" que la distribución correcta para tal sistema está dada por (1), usando únicamente argumentos físicos ?

Este factor podría estar fundado por argumentos físicos. ver esto
Para aclarar: la pregunta que está haciendo es ¿Por qué la distribución debería ser exponencial? Porque deberia β ser ( k B T ) 1 ¿O está preguntando por ambos (el título parece preguntar por el segundo, sin embargo, en la pregunta en sí solo pregunta por el primero)?
@kristjan Edité. ¿Está más claro ahora?
Ahora parece más claro.
Podemos notar que la fluctuación mucho más grande que k b T está amortiguada por el factor exponencial.
Un ejemplo físico muy simple (a partir del cual uno podría generalizar) es el de la fórmula barométrica , donde uno deriva la forma exponencial de la densidad del aire (y por lo tanto, la probabilidad de estar en un estado de energía particular).
@Nogueira Ese es ciertamente un argumento hermoso (una de las mejores piezas de escritura técnica de la OMI, si te refieres a la sección 2), pero creo que el OP busca algo como el argumento de Feynman.
Querido vistazo: Las conferencias Feynman sobre física derivan la ley de la ley de los gases ideales y la distribución exponencial de la presión con la altura de un gas a temperatura uniforme en un campo gravitacional constante, y luego argumentan que la ley es general. Vea si esto es lo que busca feynmanlectures.caltech.edu/I_40.html
En realidad el Exp H k b T es el corazón de un equilibrio térmico: cuando el sistema alcanza el valor máximo de entropía, la tasa de energía por entropía, es decir, la temperatura, es igual en cada subsistema. Esto sucede porque si el sistema pudiera dividirse en conjuntos de subsistemas con diferentes temperaturas, la entropía del sistema no es un máximo (no es estacionario).
@WetSavannaAnimalakaRodVance: gracias, leeré los textos sugeridos en cuanto tenga tiempo

Respuestas (4)

Lo que es más intuitivo para mí es mirar lo que estamos preguntando. ¿Cuál es la probabilidad de que encontremos el sistema en un estado con energía total mi ^ ? Es solo la fracción de todos los estados posibles que tienen energía total. mi ^ , es decir

pags ( mi ) d ( mi ( Ω ) mi ^ ) d Ω d Ω norte mi ^

Pero norte mi ^ es solo

mi en norte mi ^ mi S S ( mi ^ ) / k B
dónde mi S S ( mi ^ ) es el número de estados en los que nuestro sistema tiene energía total mi ^ , que es igual al número de estados en los que el resto del universo ha descendido a la energía mi t o t mi ^ al dar mi ^ a nuestro sistema, es decir S S ( mi ^ ) = S tu ( mi mi ^ ) S tu ( mi ) mi ^ S tu ( mi ) mi .

Para unirlo, haría la demostración habitual de que en equilibrio, debe darse el caso de que en un sistema simple que intercambia calor S mi debe ser el mismo valor en todas las zonas del sistema.

Además, si una zona del sistema tiene un valor menor de este que las otras, el sistema tenderá a llevar más energía a esa zona.

Por lo tanto 1 / S mi se identifica naturalmente con nuestra noción de temperatura, es decir, 1 / S mi T .

Entonces claramente tenemos

pags ( mi ^ ) norte mi ^ mi S S ( mi ^ ) / k B mi mi ^ / k B T
Esto siempre me deja claro que solo estamos tomando subvolúmenes del conjunto total de microestados y preguntando qué tan grande es junto a la colección de todos los microestados.

Además, seleccionar los subvolúmenes con el d -La función se generaliza naturalmente a todos los demás escenarios, que generalmente se clasifican como conjuntos diferentes. Aquí es solo una relación de restricción diferente dentro del d -recogedor.

Si hay otra cosa que queremos restringir, tal vez el número de partículas, entonces el d instala un factor de S norte arriba, junto con el S mi .

Esta vista ha sido la más útil para mí, ya que unifica todas las descripciones y hace explícito lo que realmente se está haciendo.

Esto explica cómo llegamos al resultado, pero no parece dar una justificación intuitiva del resultado. La respuesta que estoy buscando es más algo como: debe ser una exponencial por esta y esta razón, el argumento de la exponencial debe ser esta por esta razón y por esa razón y así sucesivamente
Creo que lo de podar el espacio de fase con d -funciones, es decir, exigir que realicemos una ponderación extrema de alguna propiedad extensiva, explica por qué "el argumento de la exponencial debe ser este por esta razón". Pero, lo que cuenta como "intuición" depende de lo que estemos dispuestos a dar por probado. ¿Puede ser más específico sobre qué tipo de cosas se siente cómodo dando por sentado? Es decir, desea ir de A a B de una forma menos abstracta, entonces, ¿qué puede ser A?

Está bien. Pongamos de esta manera:

  1. Conocemos la energía media: mi = PAGS k mi k
  2. PAGS k es una distribución de probabilidad: PAGS k = 1
  3. No sabemos nada más sobre el sistema.

La pregunta es, ¿qué distribución de probabilidad PAGS k capturar las afirmaciones anteriores de una manera imparcial? La respuesta es, la distribución que maximiza la entropía de Shannon

H ( PAGS 1 . . . PAGS k ) = k b PAGS k yo norte ( PAGS k )
y respetar las restricciones (1) y (2) .

Para ello utilizamos los multiplicadores de Lagrange . El multiplicador correspondiente a la restricción (1) es la temperatura. La restricción (2) nos dio la función de partición.

La constante de Boltzmann tiene la función de acoplar la entropía a la temperatura. Usamos una base de Euler para los logaritmos y las exponenciales. Si cambiamos eso, necesitamos cambiar la constante de Boltzmann.

Aquí, la temperatura aparece como tasa de energía promedio asociada a una variación de entropía. Si el máximo de H ( PAGS 1 . . . PAGS k ) para algunos mi es S , después

d mi = T d S

Tenga en cuenta que podemos hacer que la entropía sea una cantidad adimensional y usa la constante de Boltzmann como conversor de kelvin a julios.

¿Cómo podemos interpretar el resultado?

Tenemos la probabilidad PAGS ( mi ) = mi mi / k T . esto significa que

k b T PAGS ( mi ) d PAGS ( mi ) d mi = 1
.

Esta ecuación nos dice que para cada temperatura tenemos una escala fija de energía. Podemos ver esto haciendo k b T = 1 . En la escala definida por la temperatura podemos ver que la probabilidad de energía mi tener un máximo en mi = 0 (Esta energía cero está definida por la normalización, es decir, la función de partición del sistema). Podemos pensar que esta exponencial representa la fluctuación térmica de la energía en algún cero de energía definido por el sistema.

Mi problema con esto es que usar multiplicadores de Lagrange no es realmente intuitivo. Obtiene el resultado correcto, como lo hace con otros métodos, pero aún no tengo ninguna intuición sobre por qué el resultado debería ser el que es. Lo que busco es más como un argumento que explique por qué la distribución debe ser exponencial y por qué la exponencial debe tener esa forma particular.
La intuición de los multiplicadores de Lagrange es en realidad muy simple. Queremos maximizar la entropía de Shannon manteniendo intacta la energía promedio. Conocemos la energía promedio del sistema porque nos es accesible (mediante el procedimiento de medición), ¡pero solo sabemos esto! Entonces, necesitamos aumentar la entropía de Shannon con algunas restricciones, y este es el papel de los multiplicadores de Lagrange.
Podemos notar aquí que los multiplicadores de Lagrange nos dicen cómo la entropía (máximo de la entropía de Shannon restringida por la energía promedio) cambia con la energía promedio. Luego, notamos que estos multiplicadores nos dicen cómo se relacionan la información (entropía) y la energía (energía promedio).
Podemos afirmar rápidamente que esta distribución es la distribución de probabilidad más imparcial que tiene una energía promedio bien definida.
Es sencillo entender lo que hacen los multiplicadores de Lagrange, no tanto entender el resultado que dan.

Al derivar un resultado (ya sea física o matemáticamente), puede ser útil averiguar primero los límites del resultado. Entonces, si su supuesta explicación "explica" el resultado en regiones donde no se sostiene, sabe que su explicación es defectuosa.

Entonces, el factor de Boltzmann para el conjunto canónico. Tenemos que suponer que el número de partículas no está cambiando, y tenemos que suponer que el volumen no está cambiando. Tener ambos es en realidad bastante restrictivo. Por ejemplo, podría tener un gas de hidrógeno, pero para preservar el número de partículas, deben estar lo suficientemente fríos para evitar cualquier posibilidad de fusión (incluso a través de la formación de túneles, que es lo que ocurre en el sol, ya que incluso en el sol hace frío en relación con la fusión se puede lograr clásicamente solo con KE superando a PE). Pero para preservar el volumen, debe tener espacio para todo su hidrógeno, lo que significa que todos deben estar cerca del estado fundamental, porque los átomos de Rydberg (hidrógeno altamente excitado pero no del todo ionizado) pueden volverse muy, muy grandes si el número cuántico principal es increíblemente grande. Si quieres que esto nunca jamás te pase' Tendría que tener tan poca energía disponible que incluso si cada átomo tuviera poca energía cinética, no quedaría suficiente energía para usar como energía interna dentro de un hidrógeno para ionizar incluso un solo hidrógeno. Entonces, técnicamente, solo esperaríamos que Boltzmann se mantuviera para hidrógeno muy, muy frío.

Así que mirando T d S = d tu + PAGS d V m d norte , podemos ver que en esas situaciones, d V = 0 porque no hay cambio en el volumen y d norte = 0 porque no hay cambio en el número de partículas, entonces d S = d tu / T , ahora estamos la mayor parte del camino allí.

Entonces, dado que no esperamos que se mantenga exactamente, la verdadera pregunta es por qué funciona tan bien. Debe ser que los efectos de las violaciones sean pequeños, transitorios, o sus efectos netos se anulen. Entonces, por ejemplo, si los átomos de hidrógeno solo se superponen un poco (en el espacio y el tiempo), podríamos ignorarlo. Si hay una cantidad de equilibrio de electrones libres, hidrógeno ionizado e hidrógeno neutro, entonces podríamos ignorar algunos de ellos si los efectos son pequeños. Si tenemos una población de hidrógeno en diferentes estados, y aunque algunos son grandes en promedio, hay mucho espacio, podemos obtener eso.

Una forma de ver esto físicamente es imaginar un montón de regiones aproximadamente idénticas, cada una con algo de gas, lo suficiente como para que haya una gran cantidad de átomos de hidrógeno en las muchas regiones juntas. Entonces podemos tratar de encontrar un equilibrio para cuántos electrones, iones e hidrógeno, cuántos son grandes en promedio. Entonces podemos intentar tomar esos valores típicos y ver qué tan realista es ignorar ciertas habilidades.

Al final, sin cambios en el número de partículas, sin cambios en el volumen y una relación entre la entropía y la probabilidad, se obtiene un factor de Boltzmann. Entonces, si desea verlo físicamente, concéntrese en la relación entre la entropía y la energía interna en ausencia de cambios en el volumen o el número de partículas.

esto explica los límites de validez de la distribución de Boltzmann. Pero no parece ayudar a comprender por qué el factor Boltzmann es como es.

Creo que este es el argumento más simple. No implica explícitamente la entropía.

  • la multiplicidad de dos sistemas es el producto de sus multiplicidades
  • en equilibrio termodinámico la multiplicidad es máxima
  • el cambio fraccionario de multiplicidad con energías internas ( β = 1 Ω d Ω d mi ) es igual para ambos sistemas.
  • identificar β = 1 / k T

Hasta ahora esto es estándar. Sospecho que lo que sigue es un poco dudoso, porque no lo he visto en ningún otro lado.

  • Considere un pequeño sistema con niveles de energía no degenerados que intercambian energía con un gran reservorio.
  • escriba la expresión anterior como una ecuación diferencial para Ω ( mi ) y ajuste el signo para la energía del sistema pequeño: d Ω d mi = β Ω
  • solución para la multiplicidad del sistema combinado en términos de sistema grande β y la energía de sistemas pequeños mi : Ω mi β mi

Puedo ver problemas con esta derivación, pero no veo por qué sería mucho peor que muchos otros argumentos en física estadística.

Un ejemplo numérico: los sistemas que no están demasiado lejos del equilibrio con nuestro entorno tienen una β de alrededor del 4 % por meV. Este valor se puede calcular a partir de la fórmula barométrica. Ahora contempla un oscilador armónico con ω = 1 meV con un depósito en β = 0.04 /meV. Entonces para el norte En el estado excitado, el reservorio verá reducida su multiplicidad por un factor de 0,96 norte , la exponencial negativa que da la probabilidad del factor de Boltzmann.