¿Por qué trazamos distribuciones (histogramas, etc.) por intervalo logarítmico (es decir, por "dec"/"dex")?

Estaba tratando de explicar por qué trazamos distribuciones (por ejemplo, la función de distribución de luminosidad adjunta) por intervalo logarítmico (otro ejemplo sería distribuciones de energía espectral por intervalo de frecuencia logarítmica), cuando me di cuenta de que no tenía ni idea.

ingrese la descripción de la imagen aquí

En esta imagen la función de luminosidad AGN,

ϕ ( L ) d Φ d registro L ,
se representa en unidades de por-cúbico-Mpc, por-log-L. Φ tiene un significado perfectamente intuitivo: la densidad numérica de AGN, pero ¿por qué usar la función de luminosidad (diferencial)? ϕ ¿en cambio?


Editar: para aclarar un poco, lo que nos confunde no es la naturaleza de registro, sino las unidades. Digamos que tengo una distribución de Lvalores, luego puedo calcular el histograma sobre algunos contenedores, norte ( L ) , luego trama registro norte contra registro L --- está bien. Pero aquí, la distribución no es sólo registro norte contra registro L , es ( registro norte / registro L ) contra registro L .

es decir, no quise preguntar: "¿Por qué es útil el trazado log-log?"

Digamos que estoy mirando el histograma de la altura de las personas en el mundo, pero luego trazo el logaritmo del número de personas con una altura determinada dividido por el ancho de su contenedor de altura (por ejemplo, 6 pulgadas)... ¿por qué?

F ( X ) X α gráfica lineal en log-log con pendiente α es una de las razones
@KyleKanos por favor vea editar

Respuestas (3)

Esto es bastante obvio si aprendiste el análisis de datos en los días antes de que las computadoras fueran fáciles, porque entonces entenderías que un gráfico y versus X en papel log-log es equivalente a trazar registro y contra registro X en papel cuadriculado lineal ordinario.

Literalmente estás diciendo "Quiero trazar ϕ contra L "

ϕ = ϕ ( L ) ,
pero "Tengo que mostrar un rango enorme" o "Quiero exponer una ley de potencia" (o un cambio en la ley de potencia como se indicó anteriormente), así que trazaré
registro ( ϕ ( L ) ϕ ( L ) )
versus
registro ( L L ) .
en cambio.

Luego solo miras las unidades de lo que estás trazando.

Ahora, hay una sutileza que se relaciona con el hecho de que este es un histograma. Desde un punto de vista ingenuo, los histogramas solo cuentan cuántos de algo están asociados con rangos particulares de la variable independiente, y eso tiene la extraña propiedad de hacer que el eje vertical del gráfico dependa inversamente del tamaño del agrupamiento. Para facilitar las comparaciones entre hisotgramas con diferentes intervalos, incluso si ambos utilizan intervalos del mismo tamaño, debe dividir el eje vertical por el tamaño del intervalo. Entonces, los historgramas en mis campos a menudo tienen unidades de "eventos por 50 MeV" o similares.

En principio, puede ignorar eso si no desea comparar con otro histograma a menos que tenga contenedores de diferentes tamaños: incluso comparar de un contenedor a otro requiere ese tipo de normalización. Y las escalas logarítmicas son de poca utilidad a menos que deje que el tamaño del contenedor varíe.

O no estoy entendiendo, o tal vez no expliqué bien la pregunta: estoy feliz con la trama de log-log. Pero la sutileza que no entiendo es que las unidades de la ordenada no son solo registro ϕ , pero registro ϕ por intervalo logarítmico . Intenté editar la pregunta para aclarar un poco.
@DilithiumMatrix Ah. Entonces, esto se trata realmente de por qué los histogramas se escalan por tamaño de contenedor en primer lugar. He explicado ese contexto también.

No sé en este caso específico, pero en la mayoría de los casos en los que trazamos algo en el espacio logarítmico, es porque los datos abarcan muchos órdenes de magnitud y hay características importantes que deben identificarse tanto a escala grande como pequeña.

Si tuviera que trazar su luminosidad en un espacio lineal, básicamente pasaría de 1e-3 a 0 casi instantáneamente y luego parecería quedarse allí. Se perdería el hecho de que parece que hay dos regiones que son lineales (en el espacio de registro) con una función de combinación en el medio. También perdería las diferencias entre las líneas: en el espacio lineal, todas colapsarían juntas y se verían como una gota de una línea que se dirige a cero.

En casi todos los casos, se usa el espaciado de registro porque los datos abarcan una gran cantidad de valores y esto ayuda a resaltar las diferencias que normalmente estarían ocultas a escalas grandes y pequeñas.

En el procesamiento/análisis de señales, el espacio de registro es extremadamente importante por esa razón. Desea ver cómo se comporta algo en muchos rangos de frecuencia (por ejemplo, la diferencia entre la interacción en el rango de Hz y el rango de GHz).

Déjame tirar mis 5 centavos al tema. Por lo general, la razón para trazar d F ( X ) d registro X = X d F ( X ) d X es doble. En primer lugar el rango (argumento) X puede abarcar muchos órdenes de magnitud. El remedio para esto es hacer un diagrama logarítmico. Graficado d F ( X ) d registro X en una escala lin-log, sin embargo, va un paso más allá, ya que conserva la integral. es decir, en base a dicha trama, uno podría juzgar cuánto contribuyen las diferentes partes de la trama. Si uno usara una gráfica logarítmica para mostrar d F ( X ) d registro X la preservación del área está ligeramente distorsionada, pero aún se pueden juzgar visualmente las contribuciones relativas.

Se podría verificar la preservación del área computando

X 1 X 2 mi X F ( mi X ) d X = a b z F ( z ) d z z = a b F ( z ) , d z
donde usé la sustitución mi X = z .

Estos gráficos son especialmente útiles cuando se trazan espectros de energía de partículas. En ese caso, la trama tendrá unidades de partículas, no partículas por energía.