¿Cómo funciona la idea de una diferencial dxdx\text{d}x si las derivadas no son fracciones?

Estaba revisando un trabajo antiguo y tenía una pregunta sobre los diferenciales .

Sé que los derivados d y ( X ) d X no son fracciones, sino un operador d d X en la función y ( X ) . (leer esto ).

Pero cuando tenemos esta definición: d y = d y d X d X , se supone que esto es algo que hemos definido simplemente porque funciona, o podemos expresar esto sin "reorganizar la fracción".

Si, por ejemplo, tratamos de hacer lo mismo con funciones multivariables, esta lógica de "cancelación" no necesariamente funciona.

He usado esta sustitución muchas veces, pero nunca entendí completamente qué representaba el diferencial en sí mismo, por lo que agradecería cualquier explicación al respecto.

Si tuviera que tratar de explicarlo, terminaría regurgitando los primeros capítulos de este texto. Gran parte de la confusión conceptual que encuentras en el cálculo se debe a que primero no te enseñan sobre vectores y covectores.
Creo que dy/dx es una fracción. También funciona bien con ecuaciones multivariables. La dificultad son los diferenciales de orden superior, pero vea mi artículo "Extending the Algebraic Manipulability of Differentials" para ver cómo hacer que funcionen también.

Respuestas (2)

Una forma de verlos es como formas únicas. Consulte Ayuda para comprender la expresión de Derivada de una función para la situación multivariable. La idea es que (en una sola variable) dada una función diferenciable F : R R , y un punto a R , la cantidad F ( a ) R es lo que geométricamente consideramos como la pendiente en el punto ( a , F ( a ) ) de la gráfica de F (de hecho, lógicamente hablando, esta debería ser una definición para el término "pendiente en un punto").

Ahora, lo que les sugiero es que en lugar de pensar en el número único F ( a ) , consideramos la transformación lineal L F , a : R R definido como

L F , a ( h ) := F ( a ) h
¿Cuál es el significado de esta transformación lineal? Reescribiendo la definición de la derivada F ( a ) = límite h 0 F ( a + h ) F ( a ) h , obtenemos
F ( a + h ) F ( a ) = L F , a ( h ) + R a ( h )
dónde R a ( h ) es el término "resto" que es "pequeño" en el sentido de que límite h 0 R a ( h ) h = 0 . Ahora, la notación tradicional exige que el LHS se denote como Δ F a ( h ) y L F , a ser denotado como D F a ( h ) o d F a ( h ) . Por lo tanto, obtenemos la muy memorable ecuación
Δ F a ( h ) = d F a ( h ) + R a ( h )
"el cambio real en la función en un punto es igual a un término lineal más un pequeño término de error". Tenga en cuenta que esto no es más que una simple reescritura algebraica de la definición de derivada, pero es muy poderosa porque la misma idea se puede usar en dimensiones más altas: estamos cambiando nuestra perspectiva principal de pendientes a aproximación lineal simplemente porque el álgebra lineal es una herramienta poderosa y muy estudiada para organizar sistemáticamente toda esta información (en una dimensión, el álgebra lineal es casi trivial, por lo que no enfatizamos esta perspectiva).

Entonces, ahora para una función diferenciable F : R R , en lugar de considerar la derivada F : R R , en su lugar consideramos el objeto d F , que para cada punto a R da una transformación lineal d F a : R R , donde la interpretación es que para un "vector de desplazamiento desde el punto a " h R , d F a ( h ) es la aproximación lineal del error real Δ F a ( h ) .

Eso es todo lo que hay en la definición de d F ; es solo una simple reinterpretación de la función F . A continuación, ¿qué hace d X ¿significar? Bueno, ahora entendemos que d actúa sobre funciones diferenciables, entonces, ¿qué función es X ? Bueno, es tradición usar X : R R para significar la función identidad, es decir, para cualquier punto a R , establecimos X ( a ) := identificación R ( a ) := a . Ahora bien, se comprueba fácilmente que d X a = identificación R (Todo esto está diciendo es que X ( a ) = 1 para todos a ). Por lo tanto,

d F a ( h ) = F ( a ) h = F ( a ) d X a ( h ) = ( F d X ) a ( h )
Por eso si no escribimos el desplazamiento h en ninguna parte, ni el punto de evaluación de la derivada a , terminamos con d F = F d X , donde ahora ambos lados tienen una definición adecuada.


Nota:

A lo largo de esta respuesta, dado que solo estamos tratando con funciones definidas en espacios vectoriales como R (o en mi otra respuesta vinculada, R norte ), he evitado una cuidadosa distinción entre el espacio vectorial y su espacio tangente en un punto. Pero con suerte, con esta introducción, futuros encuentros con d F a siendo definido en el espacio tangente en a no parecería tan aleatorio.

Y para agregar una cosa más: una vez que llegas a d F = F d X es bastante natural permitir reescribir esto como F = d F d X (aunque la forma libre de fracciones es sorprendentemente útil para tener a mano).
@EikeSchulte tal vez sea natural, pero soy de la opinión de que el hecho de que uno pueda no significa que deba hacerlo. Como es habitual en el álgebra lineal, definir cocientes siempre es un asunto complicado y es mejor evitarlo si es posible. Aquí preferiría evitar tal reescritura notacional porque interpretarlo correctamente requeriría que restableciésemos todos los argumentos: F ( a ) = d F a ( 1 ) d X a ( 1 ) , y de repente se pierde toda la sencillez. Y entrando en varias variables, no hay una forma directa en la que F X i es un cociente de d F y d X i .
(por supuesto que podemos decir F X i ( a ) = d F a ( mi i ) d X a i ( mi i ) , dónde mi i = ( 0 , , 1 , 0 ) es el i t h vector de base estándar... pero de nuevo escribir todo esto con detalles sangrientos solo para proporcionar una interpretación adecuada como un cociente simplemente para preservar algo de "fracción" parece demasiado exagerado para mí)
Estoy un poco de acuerdo con eso, pero mencionar la fracción se conecta con la pregunta original. Tal vez sea mejor si dejo mi comentario, para que la conexión esté allí sin convertirse en una recomendación. (Y cierto: las fracciones para derivadas parciales son (básicamente) una tontería).

Bueno, en realidad no tratamos d y d X como fracciones. Cada vez que veas que se manipula como una fracción, recuerda que lo que sea que estés haciendo es en realidad un teorema probado que aún no conoces. La notación de Leibniz se usa para definir derivados y esa notación está bellamente diseñada de tal manera que se pueden tratar como fracciones en la mayoría de los casos.

Por ejemplo, sabes

d y / d t d X / d t = d y d t
Aquí no solo cancelaste d t . Si intenta esto como un ejercicio, simplemente use la definición de límites de una derivada y resuelva, verá que esto es cierto en la forma en que se definen las derivadas y no es necesario que sean fracciones para esto.

Aquí está la definición límite de derivados.

d y d X = límite Δ X 0 y ( X + Δ X ) y ( X ) Δ X

Ahora bien, si las dos variables X y y se definen paramétricamente y desea encontrar la tasa a la que la función y está cambiando con respecto a la función X , tenemos que ser conscientes del hecho de que ambas funciones dependen de una variable t . Ahora, si desea encontrar la tasa de cambio, debe encontrar cómo cambian esas dos funciones con t . Es por eso que la notación se cambia a d y / d t d X / d t . Ahora la definición límite de la misma se convierte en,

d y / d t d X / d t = límite Δ t 0 ( y ( t + Δ t ) y ( t ) Δ t ) límite Δ t 0 ( X ( t + Δ t ) X ( t ) Δ t )

Verías que eso se puede escribir como,

d y / d t d X / d t = límite Δ t 0 ( y ( t + Δ t ) y ( t ) Δ t ) ( X ( t + Δ t ) X ( t ) Δ t )

Ahora el Δ t los términos se cancelan en los respectivos denominadores y te queda,

d y / d t d X / d t = límite Δ t 0 y ( t + Δ t ) y ( t ) X ( t + Δ t ) X ( t )

ahora tu tratas d y como y ( t + Δ t ) y ( t ) y d X como X ( t + Δ t ) X ( t ) como un pequeño cambio en y y X respectivamente. Por eso la notación d y / d X . Tambien como Δ t 0 Se define como d t . Esto es completamente válido. Intenta probarlo para otros teoremas, pero ten cuidado de que para d X / d y = 1 d y / d X para que sea cierta, la función también debe ser invertible.

Tener la intuición de que funcionan como fracciones ayuda, pero debes ser consciente de que d d X es un operador.