¿Cómo tratar diferenciales e infinitesimales?

En mi clase de Cálculo, mi profesor de matemáticas dijo que diferenciales como d X no son números, y no deben ser tratados como tales.

En mi clase de física, parece que tratamos los diferenciales exactamente como números, y mi profesor de física incluso dijo que, en esencia, son números muy pequeños.

¿Puede alguien darme una explicación que satisfaga ambas clases, o simplemente tengo que aceptar que los diferenciales se tratan de manera diferente en diferentes cursos?

PD Tomé Cálculo 2, así que trate de mantener las respuestas alrededor de ese nivel.

PSS Siéntete libre de editar las etiquetas si crees que es apropiado.

@dmckee Dependiendo de lo que quiera decir con "tales atajos", creo que son perfectamente rigurosos, ya sea por las razones que se ven en el enlace de anupam o por las formalizaciones del análisis no estándar o el análisis infinitesimal suave. (para una demostración muy breve de cómo es el cálculo con el primero, consulte math.stackexchange.com/a/623657/26369 )
@Marcas. Sí, parece que mi información de tradición oral de enésima mano estaba muy desactualizada.
Como no experto (aunque educado en Física), me pareció suficiente darme cuenta de que cosas como pasar de d y d X = X a d y = X d X o usando d y d X = d y d t d t d X no son operaciones algebraicas como podría parecer a primera vista. Podemos hacer eso, pero se requiere una gran cantidad de matemáticas complicadas para justificarlo (como se ve en estas respuestas). Así que no pensé en ellos como números. Simplemente pensé en lo que estaba haciendo como un atajo que me permitía realizar un seguimiento de lo que estaba haciendo, y me aseguré de nunca intentar aplicar operaciones algebraicas a ciegas.
Cuando alguien te dice que algo no es un número, probablemente quiere decir que no es un número real , o que no pertenece a los números reales ni a ningún otro conjunto de números que tenga en mente la persona que habla. Por ejemplo, la gente puede decir que infinito no es un número, pero lo es, por ejemplo, en la esfera de Riemann, pero no es un número real . Lo mismo ocurre con los infinitesimales.
Dado que esta es una pregunta frecuente de los estudiantes de física y está formulada en lenguaje físico, parece una pregunta válida en Phys.SE. También tenga en cuenta que Math.SE ya tiene varias publicaciones sobre diferenciales e infinitesimales.
@ jpmc26 Las matemáticas no son tan complicadas. Vea mi respuesta a continuación. Se vuelve un poco más complicado si quieres hacer todo lo posible sin coordenadas. Pero eso no es necesario para Cálculo 2.
No hay ningún esfuerzo por incorporar la física en esta pregunta, y debe migrarse, a pesar de lo que dice QM.
Esta es una buena pregunta, ya que el tratamiento diferente de diferenciales e infinitesimales entre los cursos de física y los cursos de cálculo ha causado que los estudiantes que han tenido éxito en la clase de cálculo estén mal preparados para su clase de física. (Consulte journals.aps.org/prper/pdf/10.1103/PhysRevSTPER.9.020108 )
Es más como que los cursos de física están mal preparados para los estudiantes que han tenido éxito en la clase de Cálculo. ☺

Respuestas (9)

Hay una vieja tradición, que se remonta al propio Leibniz y continúa mucho en los departamentos de física, de pensar intuitivamente en los diferenciales como " números infinitesimales ". A lo largo de la historia, grandes mentes han criticado a Leibniz por esto (por ejemplo, el gran Bertrand Russell en el Capítulo XXXI de "A History of Western Philosophy" (1945)) por ser informal y acientífico.

Pero entonces sucedió algo profundo: William Lawvere , uno de los pensadores más profundos de los fundamentos de las matemáticas y de la física, enseñó al mundo sobre la teoría del topos y allí sobre la " geometría diferencial sintética ". Entre otras cosas, se trata de un contexto matemático de pleno rigor en el que la vieja intuición de Leibniz y la intuición de muchos físicos ingenuos encuentra una plena justificación formal. En la geometría diferencial sintética, esos diferenciales existen explícitamente ("sintéticamente") como elementos infinitesimales de la línea real.

Una exposición básica de cómo funciona esto está en el nLab en

Tenga en cuenta que esta no es solo una gran máquina para producir algo que ya conoce, como inevitablemente algunos se apresurarán a pensar. Por el contrario, esto abre el camino a los lugares más sofisticados de la física moderna. Es decir, la versión "derivada" o " geométrica superior " de la geometría diferencial sintética incluye la geometría D moderna que está en el centro, por ejemplo, de temas modernos como el formalismo BV-BRST (ver, por ejemplo , la encuesta de Paugam ) para la cuantificación de las teorías de calibre, o por ejemplo , la correspondencia geométrica de Langlands , por lo tanto, la dualidad S en la teoría de cuerdas .

+1 No exactamente en el nivel solicitado por el OP, pero de hecho es muy interesante y una colección de este tipo de publicaciones de este tipo podría hacer de esta una pregunta y un conjunto de respuestas excelentes. Me has animado a escribir el análisis no estándar de Robinson cuando tenga más tiempo si alguien no se me adelanta.
es el intervalo infinitesimal D utilizado para engañar a nuevos elementos generalizados en nuestro espacio X , que no están en las formulaciones clásicas? Algunos de los enlaces hablan de D como un subconjunto de un anillo. ¿Hay siempre una ordenación en el intervalo infinitesimal y se piensa en esto como una colección de cosas pequeñas diferentes, dotadas de alguna noción de tamaño para distinguirlas? También parece el axioma de Kock-Lawvere (un funcional " ϵ 2 = 0 "?) parece adecuado para la extensión a cálculos infinitesimales como el cálculo de Ito, etc., ¿es así? ¿Hacemos súper cosas directamente agregando este objeto?
Hay dos aspectos complementarios a esto. Por un lado, la lógica categórica de topos permite hablar formalmente del subconjunto de la línea real de elementos que cuadran a 0. Esto es justo lo que intuitivamente hicieron las personas que siguieron a Leibniz, pero la lógica categórica muestra eso y cómo exactamente esto es consistente. Así es como notablemente Anders Kock ( home.imf.au.dk/kock ) escribió sus dos libros de texto sobre geometría diferencial sintética ( home.imf.au.dk/kock/SGM-final.pdf ): habla "sintéticamente" de el subconjunto D de R en los elementos que cuadran a 0 y deriva toda la geometría diferencial.
Por otro lado, se puede optar por construir modelos concretos para los axiomas en los que se escriben, en particular, los libros de texto de Kock, por lo tanto, para topos que validen los axiomas de Kock-Lawvere. En los modelos típicos de este tipo, la categoría de variedades suaves se amplía un poco con objetos conocidos como "loci suaves", que incluyen, por ejemplo, el espacio formalmente dual al "anillo de números duales", que es solo el anillo que encarna la ecuación "épsilon ^ 2 = 0". Esta encarnación más concreta de SDG se puede expresar completamente en lógica clásica y, por lo tanto, muestra qué nociones clásicas encarnan la idea de los infinitesimales.
Hola Urs, si bien estoy de acuerdo en que el enfoque de Lawvere es un gran logro, presentar el desarrollo histórico como tú lo hiciste parece menospreciar la contribución de Robinson a la interpretación de los procedimientos infinitesimales de Leibniz. El artículo original de Robinson apareció en 1961, que sería anterior al enfoque de Lawvere.
@Wet, lo alentaría a llevar a cabo su plan de escribir una respuesta en términos del marco de Robinson.

(Estoy abordando esto desde el punto de vista del análisis estándar)

No creo que tengas una comprensión satisfactoria de esto hasta que vayas al cálculo multivariable, porque en cálculo 2 es fácil pensar que d d X es todo lo que necesitas y que no hay necesidad de X (Esto es falso y tiene que ver con por qué en general las derivadas no siempre se comportan como fracciones). Esa es una de las razones por las que los diferenciales no son como los números. Sin embargo, hay algunas formas en que los diferenciales son como números.

Creo que lo más fundamental es que si te dicen que F d X = d y , esto significa que y se puede aproximar como y ( X ) = y ( X 0 ) + F ( X X 0 ) + O ( ( X X 0 ) 2 ) cerca del punto X 0 (esto plantea otro problema*). Dado que este término de primer orden es realmente todo lo que importa después de que uno aplica los procedimientos de limitación del cálculo, esto proporciona un argumento de por qué se permite un tratamiento tan inapropiado de las diferenciales: los términos de orden superior no importan. Esto es una consecuencia del teorema de Taylor , y es lo que le permite a tu profesor de física tratar las diferenciales como números muy pequeños, porque X X 0 es como su "dx" y ES un número real. Lo que te permite hacer cosas que no puedes hacer con un solo número real es que esa fórmula para y ( X ) vale para todos X , no solo algunos x. Esto le permite aplicar todos los complicados trucos de análisis .

Si me molesta particularmente el tratamiento inadecuado de los diferenciales y veo a alguien trabajando en un ejemplo en el que escribe: "Ahora tomamos el diferencial de X 2 + X dándonos ( 2 X + 1 ) d X ", puedo imaginar d X siendo un número real estándar, y que hay un pequeño + O ( d X 2 ) clavado a un lado.

Tu profesor de matemáticas podría argumentar: "No sabes lo suficiente sobre esos teoremas para aplicarlos correctamente, por eso no puedes pensar en las diferenciales como similares a los números", mientras que tu profesor de física podría argumentar: "La intuición es realmente la clave". algo importante, y tendrías que aprender matemáticas complicadas para verlo como O ( d X 2 ) . Es mejor centrarse en la intuición".

Espero haber aclarado las cosas en lugar de hacer que parezcan más complicadas.

*(La notación O es otra lata de gusanos y también se puede usar incorrectamente. Usando la notación vinculada estoy diciendo " y ( X ) y ( X 0 ) F ( X X 0 ) = O ( ( X X 0 ) 2 ) como X X 0 ". Tenga en cuenta que uno podría ver que esto va en contra de mi argumento: no tiene sentido decir "un valor de X satisface esta ecuación", por lo que cuando se escribe de esta forma (que su profesor de física puede encontrar más obtuso y su profesor de matemáticas puede encontrar más significativo) es menos una ecuación y más una declaración lógica).

Ver también: https://mathoverflow.net/questions/25054/ different -ways-of-thinking-about-the-derivative

buena respuesta, pero solo rascando la superficie. Además del cuadrado de un infinitesimal, también existe el 'cuadrado' de un infinitesimal (que básicamente es una matriz, piense en ds ^ 2 en Landau-Lifshitz Volumen II). Y ds en realidad no es una forma diferencial (por lo que puedo decir, ya que no es lineal), parece un desastre.

Creo que tu profesor de matemáticas tiene razón. Una forma de ver que los diferenciales no son números normales es observar su relación con las llamadas formas 1. No sé si ya has tenido formularios en cálculo 2, pero es fácil buscar en internet.

Dado que eligió una etiqueta "integrales" en su pregunta, permítame darle un ejemplo basado en una integral. Digamos que tienes una función F ( X 2 + y 2 ) y quiero integrarlo en alguna área A :

A F ( X 2 + y 2 ) d X d y

Lo importante a tener en cuenta aquí es que el d X d y en realidad es solo una abreviatura de d X d y . Este cosita es una operación (producto cuña - muy parecido a la multiplicación, pero con reglas ligeramente diferentes) que puede combinar formas (en este caso combina dos 1 -formas a un 2 -forma). Una regla importante para los productos de cuña es la anticonmutación:

d X d y = d y d X

Esto asegura que d X d X = 0 (donde un físico podría engañar diciendo que descuida todo el orden O ( d X 2 ) , pero eso es como mezclar peras y manzanas, francamente engañoso). ¿Por qué los diferenciales en las integrales se comportarían así y dónde está el significado físico? Bueno, aquí puedes pensar en la 'partididad' de un sistema de coordenadas. Por ejemplo, la medida de integración d X d y d z es cartesiano 'diestro'. Puedes hacerlo 'zurdo' conmutando el d X con d y para obtener d y d X d z , pero luego aparece el signo menos al frente, lo que asegura que su integración en un sistema de coordenadas 'zurdo' aún le dé el mismo resultado que el inicial 'diestro'.

En cualquier caso, para volver al ejemplo integral anterior, digamos que te gustan más las coordenadas polares para realizar tu integración. Así que haces la siguiente sustitución (asumiendo que ya sabes cómo tomar diferenciales totales):

X = r porque ϕ       ,       d X = d r porque ϕ d ϕ r pecado ϕ
y = r pecado ϕ       ,       d y = d r pecado ϕ + d ϕ r porque ϕ

Multiplicando tu d X d y encuentras lo que probablemente ya sabes y esperas:

d X d y = ( d r porque ϕ d ϕ r pecado ϕ ) ( d r pecado ϕ + d ϕ r porque ϕ )
= d r d r = 0 pecado ϕ porque ϕ + d r d ϕ r porque 2 ϕ d ϕ d r r pecado 2 ϕ d ϕ d ϕ = 0 r 2 porque ϕ pecado ϕ
= r ( d r d ϕ porque 2 ϕ d ϕ d r pecado 2 ϕ )
= r ( d r d ϕ porque 2 ϕ + d r d ϕ pecado 2 ϕ )
= r d r d ϕ ( porque 2 ϕ + pecado 2 ϕ )
= r d r d ϕ

Con esto la integral anterior expresada en coordenadas polares quedará correctamente:

A F ( r 2 ) r d r d ϕ

Donde suprimimos el producto de cuña aquí. Es importante darse cuenta de que si no hubiéramos tratado los diferenciales como formas 1 aquí, la transformación de la medida de integración d X d y en el que involucra d r y d ϕ no habría funcionado correctamente!

Espero que este ejemplo haya sido lo suficientemente práctico y proporcione una idea de cómo los diferenciales no son números muy pequeños.

Interesante interpretación de los diferenciales. Pero debe decirse que la interpretación donde los diferenciales son algo así como números pequeños también funciona bien en su ejemplo. En esta visión tradicional, no hay necesidad de exigir que d X d y = r d r d ϕ , pero en cambio requerimos que la última expresión dé un hipervolumen estándar (es decir, el volumen estándar del dominio correspondiente), hasta el primer orden en los diferenciales. Esto conduce entonces al determinante de la matriz de Jacobi y al factor r en r d r d ϕ .
Es engañoso interpretar d X d X = 0 como despreciar los términos de O ( d X 2 ) . Lo primero es una cosa geométrica: el área de un paralelogramo con lados degenerados es cero. Este último está arraigado en la teoría.
@Ján: No estoy completamente seguro de entender lo que quiere decir, pero creo que, dado que las formas codifican efectivamente la geometría del espacio sobre el que se está integrando, si realmente elige definir diferenciales simplemente como números muy pequeños sin operador -como la naturaleza, entonces tendrás que imponer la geometría de alguna otra manera.
@Emilio: Totalmente de acuerdo. Por eso lo señalé como trampa. Cual es malo. De ninguna manera lo apoyé. En realidad, permítanme editar mi publicación y enfatizarla más claramente, para evitar malentendidos como este.
@Kagaratsch: si la integración se realiza en el espacio euclidiano, podemos olvidarnos de la geometría, es todo un simple intercambio de variables. Quizás en espacios curvos las formas se vuelven más útiles.
@Ján: Personalmente, normalmente prefiero mantener las cosas más generales. Se siente más riguroso, en cierto modo.
Las cosas deberían hacerse lo más simple posible... aunque me gusta tu ejemplo de formas diferenciales, no creo que sea razonable explicar diferencial por formas diferenciales. Debería ser de otra manera.
Bueno, en mi curso de Análisis en el pasado, los diferenciales se introdujeron por definición como elementos del espacio dual y, por lo tanto, objetos de valor de 1 forma. Nuestro Prof. en realidad desalentó explícitamente cualquier noción 'más simple' para los diferenciales. Entonces, no sé...
Creo que esta interpretación del cambio de coordenadas es incorrecta. La integral de un norte forma sobre un norte cadena C : [ 0 , 1 ] norte R norte Se define como
C ω = [ 0 , 1 ] norte C ω ,
porque esto da exactamente el resultado de un cambio de coordenadas, si ω = F d X 1 d X norte . Así que si C ( [ 0 , 1 ] norte ) = A , podemos escribir
A F = C ω
como consecuencia de la definición de la integral de formas. En otras palabras, el cambio de coordenadas a través del pullback no constituye una prueba del cambio de fórmula de la variable.
Para ver esto desde otra luz, ya que la prueba de que gramo F d X 1 = F gramo | det gramo | d y 1 no es difícil en absoluto, no tendría sentido hacer todo ese alboroto para probar la fórmula del cambio de variables para integrales a través de cosas complicadas como la partición de la unidad.
Último comentario: esto no es una crítica a la sugerencia de estudiar formas diferenciales, en absoluto. Pero creo que la respuesta de Ron Maimon aquí physics.stackexchange.com/questions/32296/… es relevante.
En realidad, dx dy es la abreviatura del valor absoluto de dx ^ dy. Puede ver esto si usa una transformación de coordenadas de orden inverso (por ejemplo, cambie a dphi dr en lugar de a dr dphi).
@pppqqq: Lo siento, pero creo que sus comentarios no vienen al caso aquí. Se supone que esta respuesta no es una prueba de nada, sino un ejemplo de cómo los diferenciales pueden ser muy diferentes a los números pequeños simples.
@Toby: si esto fuera cierto, cualquier integral d X F ( X 2 ) sería trivialmente cero, lo que claramente no es el caso. (Solo reemplaza X y . Si d X en la integral es la abreviatura de | d X | , entonces obtienes F ( y 2 ) d y , extraiga un menos invirtiendo la dirección de integración y vuelva a etiquetar y como x. Obtendrías que la integral debe ser igual a más o menos a sí misma y por lo tanto cero. Claramente no es un resultado correcto en general.)
@Kagaratsch: ¡Estás viendo un tipo diferente de integral! En a b F ( X ) d X , la d X realmente es la forma 1 d X , no su valor absoluto (como dices). Pero en A F ( X , y ) d X d y , la d X d y no significa la forma 2 d X d y , sino su valor absoluto (como dije). Esta discrepancia es confusa, pero es la única forma en que las sustituciones de inversión de orientación saldrán correctamente en ambos casos.
La diferencia entre estos no es realmente la dimensión, sino cómo se especifica la región de integración. En el primer caso, se nos da una región de integración orientada, que va de a a b (incluso si a pasa a ser mayor que b ). En el segundo caso, simplemente se nos da una región no orientada en el plano. Dado que es más fácil trabajar con formas diferenciales que con sus valores absolutos, las personas finalmente aprenden a especificar regiones orientadas, pero ese no es el tipo de integral de área que aparece en los cursos básicos de Cálculo.
Si observa la fórmula general para el cambio de variables en una integral de área en un libro de texto de Cálculo, verá una referencia al valor absoluto del jacobiano. Pero si observa una descripción de la sustitución de u para integrales unidimensionales, entonces no hay un valor absoluto. Este es el mismo problema. Una vez más, no es realmente la dimensión lo que importa, sino cómo se especifica la región de integración. Si observa la fórmula para una integral de flujo a través de una superficie, el valor absoluto desaparece nuevamente, porque ahora se le indica que realice un seguimiento de la orientación.
@Toby: el jacobiano es solo una forma conveniente de escribir el prefactor, pero nunca toma el valor absoluto de las formas diferenciales. Simplemente repita el argumento de sustitución anterior con R norte d X 1 d X 2 . . . d X norte F ( X 1 2 + X 2 2 + . . . + X norte 2 ) para uno de los X i para ver que funciona de la misma manera en cualquier número de dimensiones.
lo repetí Necesitaba un valor absoluto. ¡Deberías probarlo! En realidad, su ejemplo original es más interesante; pruébalo con A siendo el círculo unitario, F ( X 2 + y 2 ) = 1 (una función constante), y parametrizarla usando 0 ϕ π y 1 r 1 (más bien que 0 ϕ 2 π y 0 r 1 ). La integral en cuestión simplemente está tomando el área del círculo unitario, por lo que la respuesta es π . Por cierto, 0 π 1 1 | r | d r d ϕ = π . Sin embargo, 0 π 1 1 r d r d ϕ = 0 .
Si usa formas diferenciales, debe realizar un seguimiento de la orientación del sistema de coordenadas ( r , ϕ ) , tenga en cuenta que se invierte, divida la región en dos regiones con orientación constante, configure dos integrales, invierta el signo en la que tiene orientación invertida y obtenga la respuesta correcta como su suma. Pero el método en los libros de Cálculo, usando el valor absoluto del jacobiano, obtiene la respuesta correcta usando solo una integral, como lo hice anteriormente. Y utilizando el valor absoluto de las formas diferenciales se reproduce este mismo resultado.
Por cierto, no estoy tratando de argumentar que su respuesta es fundamentalmente incorrecta. Estoy tratando de corregir lo que veo como un error menor. Su respuesta es buena, y la voté cuando la vi por primera vez.
¿Podría mover esta discusión a una sala de chat para continuar? Puede usar Physics Chat o simplemente hacer clic en el aviso para pasar al chat que debería aparecer cuando intenta publicar un comentario en algún momento.
@Toby Bartels y Kagaratsch: hasta donde Ī entendió, su disputa de "forma diferencial frente a su valor absoluto" es en realidad la cuestión de las formas diferenciales frente a las densidades . A los matemáticos les importaba.
@Incnis Mrsi: Sí, de hecho. El valor absoluto de una forma diferencial exterior de rango superior es una densidad, y también hay densidades de rango inferior (menos famosas) que sirven como (entre otras cosas) los valores absolutos de las formas diferenciales exteriores de rango inferior. Más sobre estas densidades en MathOverflow aquí: mathoverflow.net/a/90714

En matemáticas la notación d X es en realidad una forma lineal , esto significa que d X es una función lineal tomando un vector y dando un escalar.

Tomemos una función diferenciable F definido sobre R y considerarlo en el punto a . La tangente a la curva de F en el punto a tiene una pendiente F ( a ) . El punto en esta tangente de abscisas b tiene ordenada F a ( b ) = F ( a ) + ( b a ) F ( a ) . F a ( b ) es la aproximación lineal de F ( b ) conocimiento F en el punto a .

Definimos entonces d X ( b a ) = b a . Tenemos

(1) F a ( b ) F ( a ) = F ( a ) d X ( b a ) ,
y escribimos
d F a = F ( a ) d X
que es la fórmula (1) escrita para formas lineales . De hecho, la forma lineal d F a es definido por
d F a ( ϵ ) = F ( a ) d X ( ϵ ) = F ( a ) ϵ .

En física a menudo se hace la confusión entre d X (la forma lineal) y ϵ (el argumento de d X ). Espero que entiendas por qué al mirar la última ecuación.

NOTA . Esto puede parecer bastante inútil, pero en dimensión norte > 1 esto se vuelve más interesante. de hecho tienes

d F a = F ( a ) d r = ( F ( a ) X 1 F ( a ) X norte ) ( d X 1 d X norte )
que se traduce en, por ϵ = ( ϵ 1 , , ϵ k ) R norte ,
d F a ( ϵ ) = k = 1 norte F ( a ) X k d X k ( ϵ ) = k = 1 norte F ( a ) X k ϵ k ,
porque d X k ( ϵ ) = ϵ k ( d X k es el k t h forma de coordenadas).

Hay una vieja tradición que se remonta al propio Leibniz de pensar intuitivamente en los diferenciales como "números infinitesimales". A lo largo de la historia, grandes mentes han criticado a Leibniz por esto. Por lo tanto, Russell aceptó la afirmación de Cantor de que los infinitesimales son inconsistentes e incluso la reprodujo en su libro Principios de las matemáticas en 1903.

Pero entonces sucedió algo profundo en 1961: Abraham Robinson, uno de los pensadores más profundos de los fundamentos de las matemáticas, enseñó al mundo una construcción rigurosa de infinitesimales en el marco tradicional de la teoría de conjuntos de Zermelo-Fraenkel, expresada en términos de la teoría de tipos Entre otras cosas, se trata de un contexto matemático de pleno rigor en el que la vieja intuición de Leibniz y la intuición de muchos físicos ingenuos encuentra una plena justificación formal. En el marco de Robinson, esos diferenciales existen explícitamente como elementos infinitesimales de un campo cerrado real adecuado.

Una exposición detallada de cómo funciona esto se encuentra en el libro de Robinson de 1966, pero desde entonces se han desarrollado tratamientos más simples, como los libros de Martin Davis o Robert Goldblatt, incluida la exposición de la diferenciación a través de infinitesimales.

Tenga en cuenta que esta no es solo una gran máquina para producir algo que ya conoce, como inevitablemente algunos se apresurarán a pensar. Por el contrario, esto abre el camino a los lugares más sofisticados de la física moderna, como se desarrolla en detalle en el libro de Albeverio et al.:

Albeverio, Sergio; Høegh-Krohn, Raphael; Fenstad, Jens Erik; Lindström, Tom. Métodos no estándar en análisis estocástico y física matemática . Matemáticas puras y aplicadas, 122. Academic Press, Inc., Orlando, FL, 1986. xii+514 págs.

Nota 1. La contribución de Lawvere en el marco de la teoría de categorías data de la década de 1970.

Nota 2. (En respuesta a la pregunta del usuario Ovi) El marco de Robinson es parte del análisis tradicional en el sentido de que utiliza los fundamentos tradicionales de Zermelo-Fraenkel y la lógica clásica (a diferencia del enfoque de Lawvere que se basa en la lógica intuicionista en una ruptura con las matemáticas clásicas ). El marco de Robinson es un área de investigación activa en la actualidad, que presenta su propia revista: Journal of Logic and Analysis (ver http://logicandanalysis.org/ ) y un número cada vez mayor de monografías; más recientemente por Loeb y Wolff (ver http://www.springer.com/us/book/9789401773263 ).

Escuché el análisis de Abraham Robinson, pero ¿por qué parece que no se usa con mucha frecuencia? ¿Es inferior al análisis convencional?
@Ovi, eso sería una buena pregunta por separado .

Como puede ver en la variedad de respuestas, hay muchas posibilidades para interpretar diferenciales matemáticamente exactos.

Una buena interpretación simple es como coordenadas de vectores tangenciales.

Considere una ecuación

z = F ( X , y )
describir una superficie curva en un espacio tridimensional ( z es la altura).

Entonces la ecuación

d z = X F ( X , y ) d X + y F ( X , y ) d y
describe los puntos ( X ¯ , y ¯ , z ¯ ) = ( X + d X , y + d y , z + d z ) del plano tangencial en el punto ( X , y , z ) en la superficie. Esta ecuación a menudo se denomina ecuación tangente .

si tienes algun punto en especifico ( X , y , z ) dado por valores de coordenadas como números y me gustaría tener también un punto específico en el plano tangente solo ingrese números para d X , d y y d z . Por lo tanto, los diferenciales pueden representar números. Por que no.

Hasta aquí todo bien. Ahora, ¿por qué los números deberían ser pequeños? Suponemos que la superficie es lisa en el punto ( X , y , z ) , significa que F debe ser continuamente diferenciable allí. Después

z + d z F ( X + d X , y + d y ) | ( d X , d y ) | 0  por  | ( d X , d y ) | 0
dónde d z cumple la ecuación tangente anterior. Aquí | ( d X , d y ) | = d X 2 + d y 2 denota la norma euclidiana.

La división por | ( d X , d y ) | veamos una imagen a escala de la superficie alrededor del punto ( X , y , z ) . Para mantener los ángulos como están, escalamos la imagen uniformemente en todas las direcciones. La imagen siempre se escala de manera que la perturbación ( d X , d y ) desde el punto ( X , y , z ) está en el orden de magnitud de 1. Incluso en esta imagen ampliada, la altura z + d z del punto perturbado ( X + d X , y + d y , z + d z ) en el plano tangencial se ajusta cada vez mejor a la altura correspondiente F ( X + d X , y + d y ) en la superficie curva.

: El plano tangente con las coordenadas locales d X , d y y d z se adapta mejor a la superficie curva, menores las perturbaciones d X , d y , d z son.


Para aclarar las cosas, consideremos un ejemplo. Sea la superficie curva

z = X 2 y .
Elegimos el punto específico con X = 1 y y = 2 flexible z = 1 2 2 = 1 . La ecuación tangente es
d z = 2 X d X d y ,
y en nuestro punto especifico
d z = 2 d X d y .
Para tener un punto específico en el plano tangente consideremos las diferenciales d X = 1 4 y d y = 1 flexible
d z = 2 1 4 1 = 1 2 .

La ubicación de este punto en el plano tangente en el espacio tridimensional es ( X + d X , y + d y , z + d y ) = ( 1 + 1 4 , 2 + 1 , 1 1 2 ) = ( 5 4 , 3 , 3 2 ) .

Al mismo X - y y -coordenadas obtenemos en la superficie curva la altura z con

z = F ( X + d X , y + d y ) = F ( 5 4 , 3 ) = ( 5 4 ) 2 3 = 23 dieciséis = 1.4375.
Está un poco fuera de la altura. z + d z = 1.5 del punto correspondiente en el plano tangente.


Incluso si presenté aquí un ejemplo numérico en la práctica, los diferenciales se usan más a menudo como variables para determinar las relaciones entre los diferenciales (con su interpretación como coordenadas tangentes).

En el contexto de las coordenadas tangentes, el cociente diferencial d y d X = F ( X ) es la razón de las coordenadas d X y d y de la tangente en la gráfica de F a X .

Siempre que evite la división por cero, puede dividir a través de un diferencial d X (como coordenada tangente).

Tobías: " Entonces la ecuación d z = [ . . . ] describe los puntos ( X ¯ , y ¯ , z ¯ ) = ( X + d X , y + d y , z + d z ) del plano tangencial en el punto ( X , y , z ) en la superficie. " -- ¿Cómo debe distinguirse si la ecuación indicada describe puntos/elementos de un plano, y no (por ejemplo) elementos de alguna otra superficie, como una "esfera osculadora" ("Schmiegekugel") a la superficie dada, en el punto ( X , y , z ) ; o de hecho cualquier otra superficie que contenga un punto ( X , y , z ) ? ¿O eso ni siquiera importa?
Yo sé lo que quieres decir. ¡Pero no! Todo lo que escribí se toma literalmente. Para leer el texto, olvide lo que ha aprendido sobre vectores tangentes en variedades en semestres superiores. La versión anterior funciona siempre que lo consideres fluido. metro -subvariedades dimensionales de R norte con metro norte . Este enfoque es simple y ayuda con problemas prácticos en los que tiene algunas coordenadas canónicas (por ejemplo, envolventes, muchos problemas numéricos, mecánica de múltiples cuerpos en simulación por computadora, etc.).
He agregado un ejemplo para mostrar cuán literal se puede ver.
@ user12262 Una buena manera de comprender la "no unicidad" de la que habla es pensar en los vectores tangentes como clases de equivalencia de C 1 caminos , porque puede mostrar que este tipo de discusión es independiente del miembro de la clase.
Tobias: " Sé lo que quieres decir ". -- Fabuloso. (Por cierto, en mi comentario anterior, tal vez sería mejor que hubiera escrito sobre "Elipsoide osculador" ("Schmiegeellipsoid") en lugar de esferas). " [...] siempre que considere suave metro -subvariedades dimensionales de R norte " -- Bueno, todavía necesito digerir su ejemplo agregado y el comentario de WSA-(RV). Cada vez que leo " curvatura " miro en orbit.dtu.dk/en/publications/… ...
@WetSavannaAnimal alias Rod Vance: WetSavannaAnimal alias Rod Vance: " piense en los vectores tangentes como clases de equivalencia de C 1 caminos " -- Buen punto; "suena familiar". (Simplemente no había recordado esta formulación en mi primer comentario a Tobias). Entonces: Tobias debería llamar a la ecuación indicada más correctamente "puntos que describen de la superficie tangencial en el punto ( X , y , z ) ", ¿verdad? Y si esta pregunta no estuviera etiquetada calculus, ahora insisto en aclarar cómo determinar 1. ¿Qué eventos constituyen un " camino " (o "superficie")?, y 2. ¿Cuáles de esos pertenecen al mismo " clase de equivalencia "?.
@user12262 Con "Sé lo que quieres decir" quise decir que sé las cosas de [Jänich:Vektoranalysis] o [Abraham/Marsden:Tensor analysis Manifolds Applications] o [Abraham/Marsden:Math Foundations of Elasticity]. Sin embargo, si tiene un espacio euclidiano lineal distinguido (lo mejor es expresarlo como R norte ) donde su objeto interesante es una subvariedad, entonces la versión anterior es suficiente, correcta y, lo que es más importante, fácil de entender. Si no recuerdo mal, se acerca mucho a lo que enseña Königsberger en su libro "Análisis 2".
@ user12262 Tenga en cuenta que el espacio R norte donde nuestra subvariedad está incrustada es un salvador. Evita la necesidad de las clases de equivalencia de curvas para la definición de vectores tangentes. Para una subvariedad dada de R norte todas las curvas de una clase de equivalencia de vector tangente en algún punto de la subvariedad tienen el mismo vector de velocidad en ese punto. Este es el vector tangente como se define en mi respuesta. (Tenga en cuenta que la definición de un vector de velocidad solo tiene sentido con el entorno R norte .)
@Tobias: " [...] espacio euclidiano lineal (es mejor expresarlo como R norte ) " -- R norte no es euclidiana "por sí sola", sino solo junto con una función de distancia "euclidiana/plana" adecuada " d F yo a t : R norte × R norte R ". " Para una subvariedad dada [...] todas las curvas de una clase de equivalencia de vector tangente en algún punto [...] tienen el mismo vector velocidad en ese punto de la subvariedad. Este es el vector tangente como se define en mi respuesta. " -- Parece que hay una línea muy fina entre la " definición " y " una capa más de ofuscación "...
@Tobias: PD Hice referencia a SLKokkendorff anteriormente especialmente para anunciar la consideración (si no en calculus, al menos en physics) de espacios métricos (o sus generalizaciones) en lugar de variedades; con las definiciones correspondientes de "curvatura" en términos de distancias (o incluso solo en términos de relaciones de distancia) por determinantes de Gram (y correspondientemente de "planitud" por determinantes de Cayley-Menger) en lugar de "algo que tiene que ver con coordenadas".
@user12262 Lo siento, debería haber escrito R norte equipado con la norma euclidiana. Gracias por la aclaración.

Con el objetivo de mantener la complejidad al mínimo, la mejor solución "unificadora" es pensar en diferenciales, infinitesimales, números, etc. como símbolos matemáticos a los que se aplican ciertas características, propiedades y operaciones matemáticas (reglas).

Dado que no todas las reglas son aplicables a todos los símbolos, debe aprender qué reglas son aplicables a un conjunto de símbolos en particular.

Ya sea que esté aprendiendo fracciones, decimales, diferenciales, etc., solo aprenda los símbolos y sus reglas y operaciones particulares y eso será suficiente el 99% del tiempo.

Esto parece "responder" a la pregunta diciendo "Debes aprender las reglas que puedes aplicar a diferenciales e infinitesimales" . Es correcto hasta donde llega, pero no ayuda en absoluto.

El significado matemático riguroso de los infinitesimales se da en el análisis usando el ϵ - d definición de un límite. En lo que se refiere a la física ϵ generalmente se refiere a la precisión experimental o margen de error. Esto significa que d es un número lo suficientemente pequeño, entonces hacerlo más pequeño no hace ninguna diferencia práctica para las predicciones.

el formal ϵ - d La definición de un límite estrictamente no significa el punto final de un proceso infinito, sino que simplemente significa que continuar el proceso no tiene sentido empíricamente.

La razón por la que los matemáticos no usarán d X como numero es eso d X sólo se define como parte de una expresión, no como algo en sí mismo. En física d X se puede tomar para significar d X , un número lo suficientemente pequeño como para que la precisión experimental no se vea afectada.

Estoy de acuerdo con las respuestas ya publicadas, pero siento que les falta un aspecto importante: los diferenciales son objetos matemáticos , y para un físico son una herramienta teórica (¡muy importante!) Pero sigue siendo una herramienta, y como todo lo que es Un resultado experimental (o un intento de una teoría fundamental) debe usarse de una manera que lo haga útil, no en la forma en que "debería ser".

Toma una llave inglesa. Si le pregunta a un diseñador si la llave inglesa es un martillo, lo más probable es que responda que no, con razón, porque no lo es. Pero si necesita clavar un clavo, y si descubre que las llaves funcionan bien y son más fáciles de alcanzar por alguna razón, ¡adelante, use llaves!

Los diferenciales en física a menudo se usan como algo que se supone que no deben hacer: en la regla de la cadena puedes tratarlos como fracciones, en el jacobiano puedes tratarlos como pequeños elementos de longitud en la dirección de las diferentes coordenadas. ¿Significa esto que son fracciones o longitudes diminutas? ¡Absolutamente no! Pero si funciona (es decir, obtienes un resultado experimentalmente correcto), no hay razón por la que no debas usarlo. Hay veces que notrabajo: en estos casos, no tendrás la espada láser llameante de Newton a tu lado y necesitarás hacer cálculos matemáticos. Por supuesto, no saber qué son realmente los diferenciales deja el conocimiento incompleto, pero sus cálculos seguirán siendo correctos en los casos anteriores. Como decía mi profesor de cálculo, "los ingenieros siempre usan diferenciales como fracciones, los matemáticos siempre como formas diferenciales, los físicos aprenden que son formas diferenciales y luego las usan como fracciones".