Muestreo de una distribución (a partir de un modelo de galaxia)

Question

Muestreo de una distribución (a partir de un modelo de galaxia)

modelos
Física
galaxias
física computacional

avanwieringen

Estoy leyendo el siguiente artículo: http://www.kof.zcu.cz/st/dis/schwarzmeier/galaxy_models.html y actualmente estoy en la sección 5.6 (posiciones de cuerpos en una galaxia).

Estoy tratando de rehacer las simulaciones yo mismo en Python, pero tengo preguntas sobre el muestreo de la distribución.

Dada una función de distribución (distribución de Hernquist):

ρ (r) = \frac{METRO}{2 π} \cdot \frac{a}{r (a + r)^{3}}

$\rho(r)=\dfrac{M}{2\pi}\cdot \dfrac{a}{r(a+r)^3}$

el artículo establece que para simular la distribución, uno tiene que calcular la masa dentro de un círculo de radio $r$ como sigue:

metro (r) = \int_{0}^{r} 4 π r^{' 2} ρ (r^{'}) d r^{'}

$m(r) = \int_{0}^{r} 4 \pi r'^2 \rho(r') dr'$

que es la función de distribución de masa acumulada.

El artículo establece que esta fórmula representa el PDF. Sin embargo, mirando la forma, me parece que es un CDF. Al acercarse al infinito, la función se acerca a 1.0, lo que para mí es una clara indicación de un CDF.

Para muestrear esta distribución el artículo cita el método de Von Neumann donde uno tiene que generar un $r$ y un $m$ valor, y escalarlos en consecuencia, y comprobar si caen o no por debajo del $m(r)$ grafico. Si lo hacen, se aceptan; de lo contrario, se rechazan.

¿Estoy completamente equivocado al pensar que esto está mal? Si hago esto, termino con la mayoría de las estrellas terminando en los radios más altos.

Tengo la sensación de que estoy probando un CDF aquí en lugar de un PDF. Para obtener resultados precisos (por ejemplo, tener la mayoría de las estrellas en el centro) significa que tengo que realizar el método de Von Neumann con el $\rho(r)$ función.

No puedo contactar al autor del artículo, por eso pregunto aquí.

Respuestas (2)

Muestreo de una distribución (a partir de un modelo de galaxia)

púlsar · Answer 1

El artículo se ve realmente mal. De hecho, hay dos errores.

Primero, tiene razón en que el método de aceptación-rechazo debe aplicarse a $\rho(r)$ , y no a $m(r)$ . Para entender cómo funciona esta idea, supongamos que queremos generar una función de distribución normalizada unidimensional $p(y)$ . Ahora, supongamos que podemos reescribir esta función de distribución en términos de una variable $x$ , tal que toma la forma de una distribución uniforme. Eso es,

pag (X) = {\begin{cases} 1 & para 0 ⩽ X ⩽ 1, \\ 0 & en otra parte . \end{cases}

$p(x) = \begin{cases} 1& \text{for $0\leqslant x \leqslant 1,$}\\ 0& \text{elsewhere}. \end{cases}$ Dado

p (y)

$p(y)$ , qué es

x

$x$ ? Tenemos la transformación jacobiana

pag (y) d y = pag (X (y)) | \frac{d X}{d y} | d y = | \frac{d X}{d y} | d y,

$p(y)dy = p(x(y))\left|\frac{dx}{dy}\right|dy = \left|\frac{dx}{dy}\right|dy,$ lo que implica

pag (y) = \frac{d X}{d y},

$p(y) = \frac{dx}{dy},$ asumiendo que

x (y)

$x(y)$ es una función creciente. De este modo

X = \int_{0}^{y} pag (y^{'}) d y^{'} = F (y) .

$x = \int_0^y p(y')dy' = F(y).$ En otras palabras, la integral de

p (y)

$p(y)$ (o de manera equivalente, el área bajo la curva) sigue una distribución uniforme. Con esto en mente, existen esencialmente dos formas de realizar una simulación Monte-Carlo.

La primera forma es el método de aceptación-rechazo: trace la curva $p(y)$ y generar uniformemente un par de números $(a,b)$ en el intervalo $([0,y_\max],[0,p_\max])$ , dónde $y_\max$ y $p_\max$ son los límites superiores de $y$ y $p(y)$ . Si la coordenada $(a,b)$ se encuentra debajo de la curva $p(y)$ , acéptalo; de lo contrario, rechácelo. Si se acepta la coordenada, $y=a$ es el punto generado.

ingrese la descripción de la imagen aquí

Hay grandes inconvenientes en este método: $y_\max$ y $p_\max$ puede ser infinito, por lo que uno necesitaría un corte. Y si $p(y)$ tiene un pico agudo, uno termina rechazando muchos puntos.

Un método mucho más eficiente es generar uniformemente $x$ , y calcular el correspondiente $y$ invirtiendo $x=F(y)$ :

y = F^{- 1} (X) .

$y = F^{-1}(x).$ Esto llena automáticamente el área bajo la curva, sin rechazar puntos. ingrese la descripción de la imagen aquí

Si el cálculo de $F^{-1}(x)$ está demasiado involucrado numéricamente, se puede usar una combinación de ambos métodos: introducir otra función (más simple) $f(y)$ que yace en todas partes arriba $p(y)$ . Aplicar el método de inversión a $f(y)$ , generando un punto $y$ . Luego genera uniformemente un valor $b$ en el intervalo $[0,f(y)]$ . Si $b\leqslant p(y)$ , aceptar $y$ ; de lo contrario, rechácelo.

Ahora, considere la distribución de Hernquist. Como tiene una cúspide en el origen y la masa acumulada $m(r)$ es una funcion sencilla

metro (r) = METRO \frac{r^{2}}{(a + r)^{2}},

$m(r) = M\frac{r^2}{(a+r)^2},$ Definitivamente recomendaría el método de inversión. Pero hay una advertencia importante aquí, y ese es el segundo error del artículo: $\rho(r)$ no es realmente una distribución unidimensional . En cambio, es una distribución en un espacio tridimensional, y es solo una función de una variable debido a la simetría esférica. Para aplicar el método Monte-Carlo, tenemos que expresar

ρ

$\rho$ como una función de distribución verdaderamente unidimensional, lo que podemos hacer expresándola en términos del volumen

y = \frac{4 π}{3} r^{3} .

$y = \frac{4\pi}{3}r^3.$ Ahora tenemos

pag (y) = ρ (y) = \frac{METRO}{2 π} \frac{a (3 y / 4 π)^{- 1 / 3}}{{[a + (3 y / 4 π)^{1 / 3}]}^{3}}, F (y) = metro (y) = \int_{0}^{y} ρ (y^{'}) d y^{'} = METRO \frac{(3 y / 4 π)^{2 / 3}}{{[a + (3 y / 4 π)^{1 / 3}]}^{2}} .

$p(y) = \rho(y) = \frac{M}{2\pi}\frac{a\,(3y/4\pi)^{-1/3}}{\left[a + (3y/4\pi)^{1/3}\right]^3},\\ F(y) = m(y) = \int_0^y\rho(y')dy' = M\frac{(3y/4\pi)^{2/3}}{\left[a + (3y/4\pi)^{1/3}\right]^2}.$ Una vez que generamos un punto

y

$y$ , el radio correspondiente es

r = {(\frac{3 y}{4 π})}^{1 / 3} .

$r=\left(\frac{3y}{4\pi}\right)^{1/3}.$

Hay una consecuencia importante: es probable que haya más partículas en radios grandes que alrededor del centro, aunque $\rho(r)$ es mucho mayor en radios pequeños. La razón es que las partículas entre dos radios $r$ y $(r+\Delta r)$ ocupan una concha con volumen

V = \frac{4 π}{3} [(r + Δ r)^{3} - r^{3}] .

$V = \frac{4\pi}{3}\left[(r+\Delta r)^3-r^3\right].$ Cuanto mayor sea el radio

r

$r$ , cuanto mayor sea el volumen del caparazón, lo que significa que necesita más partículas para llenarlo y obtener

ρ (r)

$\rho(r)$ . Esto es obvio en el caso de una densidad constante, pero también es cierto para las densidades generales.

¡Gracias por la respuesta increíblemente detallada! Y me alegro de haber acertado con el método de aceptación-rechazo :)
Si no me equivoco, estas imágenes son del texto de Recetas numéricas , que es material con derechos de autor, por lo que debe incluir referencias de dónde provienen.

kyle kanos · Answer 2

la FCD, $F(x)$ , está relacionado con el PDF, $f(x)$ , a través de la relación:

F (X) = \int_{- \infty}^{X} d X^{'} F (X^{'})

$F(x) = \int_{-\infty}^xdx'\,f(x')$ En el caso de distribuciones radiales, su límite inferior es obviamente 0 y no

- \infty

$-\infty$ . Por lo tanto, su CDF es

m (r)

$m(r)$ y el pdf es

4 π (r^{'})^{2} ρ (r^{'})

$4\pi(r')^2\rho(r')$ (técnicamente debería ser

ρ (r^{'})

$\rho(r')$ con el

4 π (r^{'})^{2}

$4\pi(r')^2$ procedente de

d x \to d r

$dx\to dr$ e isotropía espacial, pero lo que sea).

En el caso de funciones invertibles (por ejemplo, $f(x)=Ax$ con constante de normalización $A$ ), puedes resolver esto como

F (X) = \frac{A}{2} X^{2} \to X = \sqrt{\frac{2 F}{A}}

$F(x)=\frac{A}{2}x^2\to x=\sqrt{\frac{2F}{A}}$ Si genera un número aleatorio, configúrelo igual a

F

$F$ y sale tu

x

$x$ que satisface el PDF.

En el caso de que sus funciones no sean invertibles (a menudo el caso que involucra distribuciones radiales), sugeriría usar un método iterativo de Newton-Raphson para encontrar raíces para este caso. Esto se puede hacer fácilmente ya que sabes $F(x)$ (su FCD) $F'(x)=f(x)$ (tu PDF):

X_{norte mi w} = X_{o yo d} - \frac{F (X_{o yo d})}{F (X_{o yo d})}

$x_{new}=x_{old}-\frac{F(x_{old})}{f(x_{old})}$ Cuando

| x_{n e w} | < ϵ

$|x_{new}|<\epsilon$ , entonces

x_{o l d}

$x_{old}$ es la raíz (aproximada). A menudo, solo se necesitan unas pocas iteraciones para la convergencia.

Aparte, no puedo enfatizar lo suficiente lo terrible que es la sugerencia del método de aceptación-rechazo. NO USE ESTE MÉTODO . Literalmente desperdicia tiempo de computación, algo que debería considerarse valioso, independientemente de la prevalencia de las computadoras. No escuches a nadie que diga que tienes que usar este método, están total y absolutamente equivocados.

El método de Newton que sugiero anteriormente no rechaza un solo número aleatorio, se ajustará al PDF con precisión y es altamente eficiente.

Muestreo de una distribución (a partir de un modelo de galaxia)

avanwieringen

Respuestas (2)

púlsar

avanwieringen

kyle kanos

kyle kanos

¿Cómo sabe comportarse una partícula? [duplicar]

¿Pueden las redes neuronales artificiales ser teorías efectivas?

¿Cuantificación de la incertidumbre, o pérdida de información, al modelar un sistema físico?

¿Distribución de velocidades orbitales en una galaxia de disco para la simulación de N-cuerpos?

¿Existen modelos/simulaciones de galaxias de antimateria antigravitacionales?

¿Debe incluirse la aceleración en el vector de estado de un filtro de Kalman?

Movimiento de proyectil de arrastre cuadrático

¿Mapa actual de las distancias y z de las galaxias?

Diagonalización exacta para resolver las degeneraciones del estado fundamental

¿Qué significa que una ley sea fundamental?