¿Por qué necesitamos descripciones sin coordenadas?

Estaba leyendo un libro sobre geometría diferencial en el que decía que un problema al que se enfrentaban los primeros físicos como Einstein eran las coordenadas y se dieron cuenta de que la física no obedece a los sistemas de coordenadas del hombre.

¿Y por qué no? Cuando estoy caminando de la escuela a mi casa, estoy caminando en un plano 2D el conjunto de R × R reales La trayectoria de un avión en el cielo se puede caracterizar en parámetros 3D. Un punto en una bola gira en coordenadas esféricas. Una corriente fluye a través de un inductor a través de coordenadas cilíndricas.

¿Por qué necesitamos una descripción libre de coordenadas en primer lugar? ¿Qué cosas que existen se pueden describir mejor si no tuviéramos un sistema de coordenadas para describirlo?

¿Desde cuando la tierra que caminas en un plano 2D? claro, puedes aproximarlo como tal para distancias pequeñas, pero comienza a deteriorarse bastante rápido. Su último ejemplo, el flujo de corriente en un inductor podría ser un buen ejemplo de dónde tiene sentido hablar sobre el flujo de corriente sin las coordenadas específicas del inductor, según su caso de uso, es decir, a EE podría no importarle si es un toroide o una bobina, y simplemente trátelo en términos de su inductancia.
@FemaleTank: incluso cuando soy matemática, nunca he visto un número real ni ordenado un par de números reales cerca de mi casa. Y ni siquiera sabría cómo subirme encima R × R caminar sobre ella.
La ventaja de tener una descripción sin coordenadas es, bueno, que no tienen coordenadas (ya que las coordenadas dependen de los observadores).

Respuestas (5)

Esa es una muy buena pregunta. Si bien puede parecer "natural" que el mundo esté ordenado como un espacio vectorial (¡es el orden al que estamos acostumbrados!), de hecho es un requisito completamente antinatural para la física que se supone que se basa solo en las leyes locales. ¿Por qué debería haber un orden espacial perfecto de largo alcance? ¿Por qué el espacio se extendería desde aquí hasta el final del universo visible (que ahora está a unos 40 mil millones de años luz de distancia) como una estructura matemática casi trivial sin ninguna causa identificable para esa estructura? Dondequiera que tengamos estructuras similares, como cristales, hay fuerzas causales que son tanto locales (interacción entre átomos) como globales (termodinámica de la fase ordenada que tiene una entropía más baja que las posibles fases desordenadas), que son responsables de ese orden de largo alcance. . Nosotros no

Si uno no puede encontrar una causa obvia (y hasta ahora no lo hemos hecho), entonces la suposición de que el espacio "tiene que estar ordenado como es" no es natural y toda la teoría que construimos sobre esa suposición se basa en una kludge que proviene de la ignorancia.

"¿Por qué necesitamos coordenadas libres en primer lugar?"... bueno, no está claro que lo necesitemos. El hecho de que los hayamos estado usando, y con bastante éxito, no significa que fueran necesarios. Sólo significa que eran convenientes para la descripción del mundo macroscópico. Esa conveniencia, desafortunadamente, se detiene una vez que nos ocupamos de la teoría cuántica. La integración de todos los estados de impulso posibles en QFT es una operación increíblemente costosa y complicada que conduce a una serie de divergencias triviales y no tan triviales con las que tenemos que luchar todo el tiempo. Hay algunos indicios de la naturaleza y la teoría de que en realidad puede ser una tontería mirar la naturaleza de esta manera altamente ordenada y que tratar de ordenar microscópicamente causa más problemas de los que resuelve.https://www.youtube.com/watch?v=sU0YaAVtjzE . La charla es mucho mejor al principio cuando expone los problemas con el razonamiento basado en coordenadas y luego desciende al problema no resuelto de cómo superarlo. En todo caso, esta charla es una visión maravillosa del caos creativo de la teoría de la física moderna.

Como comentario final, les advierto sobre la tendencia de la mente humana a adoptar cosas que ha escuchado de otros como "perfectamente normales e inventadas aquí". alguien te hablo de R y lo ha adoptado como si fuera la cosa más natural del mundo que existiera una infinidad incontable de objetos inexistentes llamados "números" y que mágicamente se mapearan en objetos del mundo real, que son bastante contables y nunca infinitos. ¡Nunca hagas eso! Ni en física ni en política.

¿40 mil millones de años luz? ¿Qué pasa con 13.7 billones? ¿Cómo podemos ver más lejos que el propio tamaño del universo? Estoy confundido.
Es confuso. El universo se ha estado expandiendo durante 13.800 millones de años y las luces más antiguas que podemos ver son por lo tanto antiguas. Sin embargo, el espacio se está expandiendo por todas partes, por lo que la superficie de la última dispersión que creó esta luz es el borde del "universo visible" para nosotros. ahora se está alejando de nosotros más rápido que a la velocidad de la luz, por lo que la distancia métrica en un universo en expansión puede ser mayor (mucho, mucho mayor) de lo que sugerirían la edad y la velocidad de la luz. Véase, por ejemplo , en.wikipedia.org/wiki/… . ¡Se tarda un poco en solucionarlo!
En cuanto al último punto, eso sí, hay que recalcar que R es solo un modelo para el espacio. Probablemente no sea el mejor y el último, sino simplemente uno que es bastante fácil y conveniente de usar para la mayoría de los usos. Los modelos nunca deben tomarse más en serio de lo que se supone que deben ser.

¿Por qué necesitamos coordenadas libres en primer lugar?

Permítanme contarles acerca de una experiencia relacionada que he tenido enseñando a los estudiantes. Cuando les pido que definan el producto escalar, la gran mayoría escribirá algo similar a

v w = v X w X + v y w y + v z w z ( 1 )
es decir, una descripción basada en coordenadas . Sin embargo, de vez en cuando un estudiante comete un error y escribe algo como esto
v w = | ( v X w X , v y w y , v z w z ) | ( 2 )
(Es sorprendentemente común; enseño una clase introductoria de métodos matemáticos y la veo al menos una vez por semestre...)

Por supuesto, puede enseñarles a hacer (1) en lugar de (2), pero explicar por qué (1) es "correcto" y (2) es "incorrecto" en la descripción de coordenadas es bastante difícil. ¿Por qué no deberíamos combinar vectores como (2)?

Lo que hago en este caso es entrar en la descripción sin coordenadas. Ahí es obvio que v w = | v | | w | porque θ es invariable bajo rotaciones, mientras que puede verificar fácilmente que (2) no lo es. Dado que las leyes físicas son rotacionalmente invariantes, cualquier expresión matemática de ellas solo puede usar operaciones que preserven la simetría rotacional. Por lo tanto (1) está bien mientras que (2) no está bien.

Así que esto muestra al menos una ventaja de las descripciones sin coordenadas: aclaran inmediatamente las simetrías de las ecuaciones.

No estoy seguro de aceptar la respuesta para 3 vectores cuando la respuesta para todos los vectores es más sucinta: v w = i v i w i

Esta es una gran pregunta, con tres grandes respuestas, y aquí estoy, un poco tarde para la fiesta. Hay dos cosas cruciales que las respuestas anteriores no parecen abordar, por lo que intentaré dar una explicación realmente simple en esos niveles.

Localidad / Colectores

Voy a acercarme a darles una definición técnica de variedad , siguiendo el libro de Penrose Spinors and Space-Time , pero trataré de mantener esto ligero y con sentido común. Comencemos por olvidar por un segundo qué más sabemos sobre el espacio y centrémonos en una cosa: el espacio-tiempo es un conjunto de "puntos". Claro, no es un conjunto "discreto" (tiene un número incontablemente infinito de puntos), pero el espacio-tiempo se define fundamentalmente por el hecho de que contiene estos otros objetos, que son "puntos" en el espacio-tiempo, y no podemos realmente definir esos puntos aún más . Son solo una especie de cosa atómica de la que podemos hablar, y el espacio-tiempo es un conjunto S de esos puntos.

Obviamente, sin más información estamos bastante atascados.

Flechas como información

La forma más simple de información es crear los campos escalares permitidos A ( S R ) , lo que significa " A es algún subconjunto de (o igual a) las funciones que toman puntos en S a números en R ." Podríamos llamar a estos "campos escalares", pero tal vez una mejor idea es robar alguna teoría de categorías y llamarlos "flechas". Al restringir las flechas que elegimos en el conjunto A en realidad podemos ajustar cuán quisquillosos/quisquillosos estamos siendo acerca de nuestras descripciones de S , ya que son nuestra única herramienta para describir S . No obstante, es bueno hacer algunas suposiciones realmente básicas. Una suposición general es sobre el cierre : supongamos F es una función suave R norte R , entonces tiene sentido que si a 1 , a norte son todas flechas (campos escalares en A ), entonces el campo escalar pags F ( a 1 ( pags ) , , a norte ( pags ) ) también debería estar en A . Voy a usar estas funciones suaves nuevamente, así que escribamos pags F ( a 1 ( pags ) , , a norte ( pags ) ) como F [ a 1 , , a norte ] entre corchetes, para recordarnos que estamos "levantando" la definición de F de R norte R a A norte A de la manera "más obvia" que podamos.

Ese axioma de cierre nos da operaciones útiles como + y en flechas, "elevando" esas operaciones de reales a campos escalares en A . De hecho, el cierre de A nos da algo aún más profundo: la "topología de conjunto cerrado del núcleo". Definir un conjunto s S como "cerrado" si existe una flecha a A tal que ker a = s (en otras palabras, s es el conjunto de puntos que a lleva al numero 0 ). Defina un conjunto como abierto si su conjunto-complemento es cerrado. Este conjunto de definiciones se llama topología (si cumple con ciertos axiomas, que garantiza el axioma de cierre) y le permite definir lo que significa que los mapas sean "continuos" (lo que resulta que todas las flechas lo son). Lo hace con algunas otras definiciones: por ejemplo, un "vecindario" de un punto es un conjunto abierto que contiene ese punto.

Así que si S es una esfera de 2 (es decir, una superficie de una bola de 3), lo obvio es usar coordenadas 3D y asignar valores X , y , y z a la esfera, permitiendo cualquier función suave R 3 R de esos tres números para ser nuestras "flechas".

Coordenadas como flechas

Y ahora finalmente podemos hablar sobre lo que significa tener coordenadas agregando otro axioma sobre A : por cada punto s S entonces tiene un barrio norte s y algunas flechas C 1 s , . . . C d s tal que si dos puntos pags , pags norte s son diferentes ( pags pags ), entonces alguna coordenada es diferente ( C i s ( pags ) C i s ( pags ) para algunos i ). Entonces, las flechas se pueden usar, localmente, para distinguir puntos.

Tenga en cuenta que podemos hacer esto con 2 coordenadas en la esfera 2; podemos hacerlo localmente, pero no globalmente. ( θ no es una flecha; tiene una discontinuidad). Entonces, si un punto está en el hemisferio norte o sur, podemos usar X , y como coordenadas. Si está en el ecuador, debemos usar X , z o y , z como coordenadas. Hay funciones continuas que mapean X 0 a 0 y así sucesivamente, así que eso es todo lo que necesitamos: los barrios son hemisferios.

Esto da una razón muy técnica pero 100% válida de "por qué necesitamos descripciones sin coordenadas": una vez que sepa qué son las coordenadas , el hecho de que sean locales a ciertos puntos en el espacio-tiempo significa que cualquier definición específica de coordenadas solo es válida en un vecindario de su posición actual . Comienzas a dar una descripción 2D de tu mundo en términos de Norte/Sur y Este/Oeste, pero tu descripción falla cuando comienzas a ir más de 10,000 km al Este o al Oeste. Una vez que define su función lo suficientemente bien, se convierte en una flecha y, por lo tanto, "sin coordenadas".

De manera similar, a menudo ves a la gente decir que "llevaría una eternidad llegar a un agujero negro" o "el tiempo se detiene en el horizonte de eventos" o cosas similares. De hecho, sabemos desde hace mucho tiempo que eso no es cierto , y es un error del mismo tipo. Si está parado y lejos del agujero negro, tiene ciertas coordenadas que son "naturales" para describirlo. Resulta que tus coordenadas no pueden atravesar el horizonte de sucesos del agujero negro. Pero eso no significa que importeno poder. De hecho, descubrimos que hay "coordenadas de movimiento conjunto", un conjunto de coordenadas utilizadas por alguien que cae naturalmente en el agujero negro, que funcionan bien para cruzar el horizonte de eventos de un agujero negro. Es solo que cuando pasas el horizonte de eventos en tu hora local t , dejas de poder enviar luz tuya a la persona que está lejos del agujero negro: así la última imagen que ven de ti es en tu momento t , y debido a que la luz de ese momento necesita escapar cada vez más de la gravedad a medida que te acercas al horizonte, las imágenes de ese momento tardan cada vez más en llegar allí. Desde su perspectiva, entonces, por supuesto, "parece" que te lleva una eternidad llegar al agujero negro y que todo en el horizonte de eventos "deja de cambiar" y todo eso. Pero eso es porque sus coordenadas no pueden pasar a través de él.

Los campos vectoriales lo hacen aún más obvio

Un ejemplo diferente: ciertamente puede comenzar a definir campos vectoriales ahora en nuestro ( S , A ) espacio topológico, como derivaciones : funciones de flechas a flechas que satisfacen una "regla de la cadena" en el sentido de que, si F es una función suave R norte R (¿recuerdas esos?) donde F ( i ) es la primera derivada de F con respecto a su i el parámetro, entonces

v ( F [ a 1 , , a norte ] ) = i = 1 norte F ( i ) [ a 1 , , a norte ] v ( a i ) .
Nótese de nuevo que esto significa que v ( a + b ) = v ( a ) + v ( b ) y v ( a b ) = a v ( b ) + v ( a ) b . Obtenemos mucho de estas funciones fluidas R norte R ! (Si nunca antes ha visto un campo vectorial como una derivación, en el espacio euclidiano con sus coordenadas ortonormales habituales, el producto interno , y campos vectoriales, la derivación correspondiente a campo v es la función v ( F ) = v , F .

Ahora, localmente, puede definir campos vectoriales distintos de cero en todas partes en sus coordenadas, ajustando esas reglas: pero en la esfera 2, no hay campos vectoriales que sean distintos de cero en todas partes. Esto tiene el encantador nombre del "teorema de la bola peluda" y si interpretas los campos vectoriales en las 2 esferas como perfiles de viento, dice que esencialmente siempre hay al menos dos "ciclones" (medidos contando los ojos de las tormentas). donde la velocidad del viento es 0) sobre la esfera.

No habrías esperado esto con tus descripciones del viento basadas en coordenadas, ¿verdad?

Coordenadas generalizadas

En realidad, no es solo con las variedades y la relatividad general donde se beneficia de la independencia de las coordenadas: mucho antes en la escuela, comenzamos a enseñar a los estudiantes sobre cálculo variacional y coordenadas generalizadas . La forma habitual de motivar estos es el problema Brachistochrone:

Considere una montaña rusa sin fricción alimentada puramente por gravedad que comienza en ( L , 0 ) y terminando en ( L , 0 ) . encuentra la pista y ( X ) que tiene que hacer la montaña rusa, para que el viaje de principio a fin tome el menor tiempo posible.

Podemos ver dos extremos. Piense en una pista que baja directamente a una altura muy alta. h , seguido de un giro brusco que lo convierte todo en un impulso hacia adelante en ( L , h ) , seguido de un giro brusco que lo convierte todo en un impulso ascendente en ( L , h ) . Por la energía, sabemos que la velocidad en la parte inferior de esta pista es v 2 / 2 = gramo h o v = 2 gramo h . Las caídas libres aceleran linealmente desde 0 a h , por lo que promedian la mitad de esta velocidad, gramo h / 2 . Así que el tiempo total para este tipo de pista es

T = 2 h gramo h / 2 + 2 L 2 gramo h = 4 h + 2 L 2 gramo h .

Los dos extremos aquí son h 0 dónde T (sin caída libre, pero tampoco suficiente velocidad de avance) y h dónde T también (moviéndote infinitamente rápido, cruzas el 2 L distancia en poco tiempo, pero te toma una eternidad caer lo suficientemente lejos para llegar allí. Con algunos cálculos puedes incluso encontrar un mínimo T entre ellos, asumiendo esa forma del camino, pero hay otros caminos más curvos para investigar entre estas líneas rectas.

El problema es que esos "giros bruscos" en el ejemplo anterior son las únicas fuerzas de restricción que son "agradables". Una fuerza de restricción tiene que operar en conjunto con el impulso de una partícula, apuntando ese impulso en las direcciones permitidas. Y si aún no conoce la pista, entonces aún no conoce la dirección de la fuerza de restricción, ¡mucho menos la magnitud! Entonces, la fuerza más importante para este problema (de hecho, la única fuerza además de la gravedad) es bastante difícil de determinar, incluso si asumimos que tienes una forma para y ( X ) . Es difícil resolver este problema con métodos y fuerzas clásicos basados ​​en coordenadas y demás.

Algo similar sucede con los péndulos dobles : la fuerza de restricción que mantiene las dos partes del péndulo a la misma distancia varía su dirección constantemente; ¿cómo vas a manejarlo? Bueno, ¿no sería bueno si tuviera una comprensión de la física independiente de las coordenadas para poder elegir las coordenadas que imponen las restricciones , en este caso? θ 1 , θ 2 , y luego hacer física con esos ? Después de todo, si elige las coordenadas correctas , no tiene que modelar la fuerza de restricción . Y luego puede obtener algunas ecuaciones diferenciales para el péndulo doble, demostrar que es caótico y construir dos de ellas para mostrar el caos en su salón de clases.

Es posible que desee utilizar \mapstoen lugar de \rightarrowen las definiciones de funciones como pags F ( a 1 ( pags ) , , a norte ( pags ) ) en vez de pags F ( a 1 ( pags ) , , a norte ( pags ) ) , de lo contrario puede confundirse con declaración de F : R norte R . Además, en lugar de \rightarrowen las declaraciones de funciones, puede usar \to, que parece más lógico (y podría estar espaciado más correctamente, aunque no veo demasiada diferencia).

Déjame decirte primero que lo que lees es muy vago. En GR, se supone que las leyes de la física son independientes del observador. Un observador está representado por un marco de referencia que el observador usa para medir fenómenos físicos.

Hay un conjunto de transformaciones de coordenadas que relaciona observables para diferentes observadores. Digamos, por ejemplo, que la velocidad de un automóvil observada por un observador estacionario y un observador que se mueve a una velocidad constante con respecto al observador estacionario están relacionados por las transformaciones de Galileo (esto es solo un ejemplo, no lea demasiado).

Cuando decimos que la física no tiene coordenadas, nos referimos a que las ecuaciones de la física conservan su forma cuando transformamos de un marco de referencia a otro.

Para decirlo de una manera menos formal, si hay dos observadores con diferentes coordenadas de espacio-tiempo y tratan de derivar las leyes de la física a través de una serie de experimentos en sus respectivos marcos de referencia, deberían obtener las mismas leyes de la física o las mismas ecuaciones. encuentran para las leyes de la física debe ser el mismo. Digamos que para la electrodinámica ambos deberían obtener las ecuaciones de Maxwell.

Representar la independencia de las coordenadas de una forma obvia se denomina representación covariante (que puede consultar si está interesado).

Mientras lee ecuaciones diferenciales, lo más parecido que se me ocurre para que entienda esto es buscar la representación libre de coordenadas de la ecuación del geodisco e intentar hacer una transformación de coordenadas arbitraria y observar cómo la forma es la misma.

En cuanto a por qué necesitamos una descripción libre de coordenadas, es solo porque la descripción libre de coordenadas produce correctamente todos los resultados experimentales y no se requiere una descripción dependiente de coordenadas más complicada.

¿Por qué necesitamos una descripción libre de coordenadas en primer lugar?

En física, tenemos una descripción libre de coordenadas en primer lugar.

Considere su ejemplo:

Cuando estoy caminando de la escuela a mi casa

La descripción de esto consiste en

  • tú y la escuela (edificio) separándose el uno del otro,
  • tú y tu casa encontrándose,

y, completando algunos detalles más,

  • tus pies encontrándose y pasando componentes particulares del "pavimento"; entre tu indicación de salir de la escuela y tu indicación de llegar a tu casa.

(Se pueden completar aún más detalles, por ejemplo, con respecto a qué más ha observado en coincidencia con cualquiera de estos "pasos" en particular que tomó;
y qué la escuela y su casa y los diversos constituyentes identificables del pavimento observaron de usted y el uno del otro.)

Y eso es todo, en lo que se refiere a la descripción física, geométrica.
No se agrega nada significativo al salpicar los elementos de la descripción con tuplas de valores de números reales como coordenadas.

Estoy caminando en un avión 2D

De hecho, los componentes identificables del pavimento (que sus pies habían tocado, o incluso más allá) pueden, por ejemplo, determinar que estaban (al menos hasta cierto punto) en reposo entre sí y planos entre sí.

Nuevamente: si esto se ha medido (derivado de lo que los participantes relevantes observaron entre sí), entonces este resultado no se altera al asignar coordenadas de ninguna manera.

Ahora, por supuesto, se pueden asignar coordenadas para (más o menos) representar resultados geométricos. Por ejemplo:

  • es posible que prefiera asignar a (los pasos de) sus valores de coordenadas de caminata t de manera que aumentan monótonamente con respecto al orden de tus pasos (que conoces mejor); o

  • a los constituyentes identificables del pavimento se les pueden asignar pares de números reales como coordenadas (en lugar de solo números simples o triples, etc.) porque (para representar) el resultado de que eran planos entre sí.

Aún más:
dadas las distancias entre todos los constituyentes del pavimento,

d : PAGS × PAGS R ,

cualquier asignación de coordenadas uno a uno

C : PAGS R 2

induce una función de representación de distancia particular

gramo : R 2 × R 2 R ,

tal que para cualesquiera dos constituyentes (no necesariamente distintos) A y B

gramo [   C [   A   ] , C [   B   ]   ] = d [   A , B   ] .

Entonces, por ejemplo, puede preferir tales asignaciones de coordenadas para las cuales gramo es una función suave de sus dos argumentos.

Decidir si los valores resultantes pueden ser representados por ciertos valores de coordenadas (con sus propiedades implícitas sobre topología y álgebra), y en qué sentido, es siempre posterior a la obtención de tales valores, y especialmente a decidir y comprometerse a medirlos en primer lugar.