Delta de Dirac y notación descuidada

Soy un neurocientífico de pregrado y recientemente he estado estudiando las distribuciones de probabilidad en relación con la teoría de la información, y encontré la definición de Dirac Delta como una distribución singular. Mi madurez matemática es relativamente baja, ya que recién ahora estoy tomando cálculo multivariable, así que tengan paciencia si mi comprensión no es muy profunda.

Entiendo que la Delta de Dirac es una regla de la forma

d X 0 ( ϕ ) = ϕ ( X 0 )
que asigna a cada valor de la función de prueba ϕ ( X ) su valor en X 0 , a saber ϕ ( X 0 ) . También entiendo la prueba por negación que demuestra que no existe una distribución regular que satisfaga esta propiedad, haciendo del Delta una distribución singular.

Mi confusión surge en la notación de los físicos de Delta, que entiendo que es un abuso de notación:

d ( X X 0 ) ( ϕ ) = d ( X X 0 ) ϕ ( X ) d X = ϕ ( X 0 )
Así que mi pregunta es doble: ¿Qué poder matemático se gana al representar el Delta de Dirac como tal y por qué el ( X X 0 ) entra la notación? Parece que podría escribirse con la misma facilidad
d X 0 ( ϕ ) = d ( X 0 ) ϕ ( X ) d X = ϕ ( X 0 )
ya que esta notación es simplemente el físico imaginando que existe alguna función que satisface esta distribución, aunque no exista.

Atribuyes la ecuación d ( X X 0 ) ( ϕ ) = d ( X X 0 ) d X a los físicos, pero en diez años de física nunca he visto esa notación. Por lo general, cuando escribimos d ( X X 0 ) , estamos pensando en d como una función en la recta real. No puede actuar una función sobre otra función, es decir d ( X X 0 ) ( ϕ ) no tiene sentido me gusta la otra nota d X 0 ( ϕ ) , ya que eso deja mucho más claro que d X 0 es un funcional, es decir, toma una función como entrada y escupe un número.
@DanielSank "No puede actuar una función en otra función" Claro que puede. Si d fuera una función que mapeara números reales en operadores, puede perfectamente aplicar la salida de d a otra función. (Por ejemplo, d podría mapear el entero i sobre el operador que produce el i ª derivada, en cuyo caso d ( i ) ( F ) sería el i la derivada de la función F .) Ahora, supongo que eso no es lo que está sucediendo aquí y confío en que los físicos no hacen lo que dices que no hacen. Pero la objeción de que las funciones no pueden aplicarse a las funciones no es correcta.
@DavidRicherby De hecho, este es un caso en el que hay que tener cuidado con el lenguaje. Usé la palabra "función" para significar un mapa R R . Obviamente, esta no es la definición más general de "función".
En una nota histórica, Dirac introdujo originalmente su función delta como un límite como se describe en las respuestas. La interpretación de d como un funcional lineal solo llegó más tarde cuando los matemáticos trataron de descubrir cómo poner el concepto obviamente útil sobre una base firme.
Es interesante notar que Wikipedia distingue entre abuso y mal uso de la notación. (El primero de los cuales es totalmente aceptable)

Respuestas (3)

la notación

d X 0 ( ϕ ) = ϕ ( X 0 )
tiene sentido para mi. Está claro que d X 0 es lineal [ a ] funcional, es decir, toma una función ϕ como entrada y produce un número ϕ ( X 0 ) como salida.

Supongamos que nos gustaría una representación integral de d X 0 . Una forma de hacerlo es con un límite, por ejemplo

d X 0 ( ϕ ) ϕ ( X 0 ) = límite σ 0 [ 1 2 π σ 2 Exp ( ( X X 0 ) 2 2 σ 2 ) ] Función delta aproximada ϕ ( X ) d X .

La cosa marcada por la riostra tiene integral 1, y como σ 0 , se vuelve más delgado y más alto. Es molesto escribir el límite y la función gaussiana en la integral, por lo que los físicos usan una forma abreviada y escriben

( ) d X 0 ( ϕ ) ϕ ( X 0 ) = d ( X X 0 ) ϕ ( X ) d X .

Aquí estamos pensando en d ( X X 0 ) como una función. Por supuesto, como dices, no es realmente funcional; no hay función que satisfaga la ecuación integral ( ) . Por cierto, d ( X X 0 ) es mejor pensarlo como un límite de una función, como escribimos en la primera ecuación integral.

Ahora respondamos las preguntas.

¿Por qué el d ( X X 0 ) entra la notación?

Bueno, acabamos de mostrar que más o menos proviene del hecho de que, en el sentido físico, d representa un límite de una función real, y esa función real tiene argumento ( X X 0 ) (mira el guassiano en la primera ecuación integral). Sin embargo, esa es una respuesta bastante débil, pero...

¿Qué poder matemático se gana al representar el delta de Dirac como tal?

...podemos ver por qué el d ( X X 0 ) es poderoso a través de un ejemplo. Considere la ecuación

( ) F ( X 0 ) = d ( X X 0 ) F ( X ) d X .

representemos F por su transformada de Fourier

F ( X ) = d k 2 π F ~ ( k ) mi i k X .

Insertando la transformada de Fourier en ( ) da

F ( X 0 ) = d X d k 2 π d ( X X 0 ) F ~ ( k ) mi i k X ( cambiar variables  y X X 0 ) = d y d k 2 π d ( y ) F ~ ( k ) mi i k ( y + X 0 ) = d k 2 π F ~ ( k ) mi i k X 0 F ( X 0 ) .

El punto aquí es que podemos manipular el argumento de d ( X X 0 ) por ejemplo, en cambios de variables como cualquier otra función y funciona . Sin embargo, es bastante obvio que esto debería funcionar, porque como señalamos anteriormente, siempre puedes pensar en un d como límite de una sucesión de funciones reales cada vez más estrechas.

[ a ] : Digo que es lineal porque

d X 0 ( ϕ + θ ) ( ϕ + θ ) ( X 0 ) = ϕ ( X 0 ) + θ ( X 0 ) d X 0 ( ϕ ) + d X 0 ( θ ) .

Muchas gracias, esta es una de las mejores ideas que he tenido hasta ahora. Así que soy un poco lento aquí; después de su cambio de variables, ¿cómo funciona exactamente el d y   d ( y ) mi i k y ¿desaparecer?
@nguzman exactamente por el mismo tipo de relación que en (**)
@LLlAMnYP Pero por esa relación no debería   d y d ( y ) mi i k y = mi i k y ? ¿O estamos aquí usando la definición de que   d y d ( y ) ϕ ( y ) = 1 siempre que no hayamos especificado algún valor y 0 ?
@nguzman absolutamente no. d ( y ) = d ( y 0 ) , de este modo d y d ( y y 0 ) mi i k y = mi i k y 0 pero y 0 = 0 asi que mi i k y 0 = 1 . También el rhs de la definición en tu comentario debe ser ϕ ( 0 ) , no 1. Y, obviamente, como arriba, hemos especificado y 0 , es igual a 0.
los d ( X X 0 ) notación tiene la gran ventaja de que automáticamente muestra la "simetría" básica entre X y X 0 . De lo contrario, siempre hay que tener en cuenta el hecho de que d X 0 ( ϕ ) es exactamente el mismo objeto matemático que d ϕ ( X 0 ) .
@alephzero No estoy de acuerdo con tu comentario. Dices que hay simetría entre X y X 0 , pero eso no significa que haya simetría entre X 0 y ϕ ! Esas dos cosas son de una naturaleza completamente diferente.
@nguzman ¿El comentario de LLlAMnYP te lo explicó lo suficiente?

β ( X 0 ) = α ( X 0 X ) ϕ ( X ) d X

Esta es una convolución.

Las circunvoluciones son cosas bastante útiles para trabajar y aparecen por todas partes.

Si conoce el procesamiento de señales, la multiplicación puntual de una transformada de Fourier de dos funciones es igual a la transformada de Fourier de la convolución de dos funciones. Y la transformada de Fourier es su propia inversa.

En el procesamiento de señales, utiliza la transformada de Fourier para extraer los componentes de frecuencia de una función de entrada. La multiplicación puntual en el "dominio de la frecuencia" corresponde a la convolución en el dominio del tiempo; por lo que puede usar la convolución para hacer un filtro de "paso de banda" en una función (por ejemplo, eliminar todos los componentes por encima de una cierta frecuencia).

Todo esto es relativamente académico, pero el punto es que las circunvoluciones son comunes y bastante útiles en una amplia variedad de lugares.

Ahora, si imaginamos el Delta de Dirac como una función, podemos convolucionar con otra función de modo que cuando lo hagamos, extraigamos la función original.

d ( X X 0 ) ϕ ( X ) d X = ϕ ( X 0 )

Notarás cómo esto se parece mucho a una convolución. Dichos formularios están bien estudiados y puede usar otras funciones en lugar del delta de Dirac allí y obtener resultados razonablemente interesantes.

Para que esto sea "verdadero", solo necesitamos que delta sea una función que sea cero en todas partes excepto en 0, y que su integral de épsilon negativo a épsilon positivo sea 1. Luego, la matemática de la convolución nos da que el resultado de la convolución es \phi(x_0).

d ( X 0 ) ϕ ( X ) d X = β ( X 0 )

Aquí, si usamos el mismo delta de Dirac imaginario, terminamos con β ( X 0 ) igual a infinito en X 0 = 0 , e igual a cero en todo lo demás.

esto no es ϕ ( X 0 ) como queremos

los X X 0 término es distinto de cero a menos que X = X 0 y cero si X = X 0 . En cierto sentido, esto obliga a todo el "muestreo" de ϕ ocurrir en X = X 0 y cero contribución a ocurrir en otro lugar.

Para hacer esto formal sin usar definiciones extendidas de "función", afirmamos que en lugar de que el delta de Dirac sea una función, es un límite de funciones, y la convolución es el límite de las convoluciones.

Tomamos cualquier conjunto ordenado de funciones cuyo límite fuera de 0 sea 0, y cuya integral de épsilon negativo a épsilon positivo limite a 1 desde abajo para cualquier épsilon.

Por ejemplo, d i ( X ) = i / 2 si | X | < 1 / i y 0 en caso contrario. O una miríada de otras opciones.

Ahora tomamos esto:

d i ( X 0 X ) ϕ ( X ) d X = β i ( X 0 )

Esto nos da una serie de funciones. β i , generado por una convolución tradicional. el limite de la β i es ϕ independientemente de qué forma d i tomar. 1

Ahora, la ecuación que mostraste fue X X 0 en lugar de mi convolución X 0 X . Bueno el d i Usé son simétricos alrededor de 0, así que d i ( X X 0 ) = d i ( X 0 X ) .

En resumen, lo que sucede es que la convolución es útil, la delta de Dirac "pretendida" tratada como una ecuación de convolución suele ser útil, y lo que "realmente" sucede puede interpretarse como un límite de convolución de funciones para las cuales la ecuación representa.

Ahora que se trata de matemáticas, cuando tenemos un concepto útil como el delta de Dirac, salimos y redefinimos lo que significan los símbolos para hacer del delta de Dirac una "función generalizada" y hacer que la notación que queremos usar "simplemente funcione" sin que "sea taquigrafía para lo que realmente está pasando", porque todas las matemáticas prácticas son solo taquigrafías de todos modos.

Finalmente, d ( X X 0 ) ( ϕ ) solo parece una notación descuidada. Ellos están usando d como una especie de macro para mí. No le veo el uso, de verdad.

Me gustaria d ϕ ( X 0 ) o d ( ϕ ) ( X 0 ) o incluso d X 0 ( ϕ ) o d ( X 0 ) ( ϕ ) o o d ϕ igual a d i ( X 0 X ) ϕ ( X ) d X (dónde es convolución)


1 Mi análisis de Fourier está un poco oxidado, creo que hay funciones patológicas que no se comportan bien cuando están intrincadas pero satisfacen los requisitos que puse en el d i . Por lo tanto, cubriré mis apuestas y diré funciones "suficientemente agradables" en su lugar.

Como señaló DanielSank, la notación d ( X X 0 ) ( ϕ ) no es estándar.

En cuanto a dónde se origina la "notación de los físicos", proviene de la representación de la distribución delta como un límite

d X 0 [ ϕ ] = límite ϵ 0 d ϵ ( X X 0 ) ϕ ( X ) d X

de funciones d ϵ como

d ϵ ( X ) = 1 π ϵ X 2 + ϵ 2

Es más que sólo desde el límite. los d ( X X 0 ) La notación es realmente útil para realizar manipulaciones algebraicas y de cálculo. Mira mi respuesta.
Solo un comentario general. Si F : R R es absolutamente integrable y F d X = 1 , después límite ϵ 0 + 1 ϵ F ( X / ϵ ) gramo ( X ) d X gramo ( 0 ) para toda función acotada continua gramo . No es necesario nada más (por ejemplo, que F ( 0 ) 0 ).
Diría que realmente se origina por no querer tratar las partículas puntuales de manera diferente en las matemáticas que las distribuciones continuas. Pero, sí, Dirac lo "justificó" como tal límite.