Intuición física sobre el tensor de inercia

Estoy estudiando Mecánica en el libro de Goldstein (Mecánica clásica) y el libro de Spivak (Física para matemáticos) y tengo dudas sobre la intuición física sobre el tensor de inercia. En ambos libros, el tensor de inercia aparece naturalmente al calcular el momento angular L de un cuerpo rígido que, por simplicidad, sólo gira.

El tensor de inercia se define entonces como el operador lineal I : R 3 R 3 dada por

I ( ϕ ) = i metro i b i × ( ϕ × b i ) ,

dónde b i R 3 son las posiciones iniciales de las partículas del cuerpo, y metro i sus masas. Con esta definición se demuestra que

L = I ( ω ) ,

ser ω la velocidad angular del cuerpo rígido. Todo eso, desde el punto de vista matemático, está bien.

Ahora, ¿cuál es la intuición física detrás de esto? El operador lineal I permite relacionar de forma lineal la velocidad angular y el momento angular. Esto se parece mucho a que la masa se relaciona de forma lineal con la velocidad y el momento. Pero en el último caso, la masa es un escalar mientras que I es una transformación lineal.

¿Cuál es, entonces, la mejor manera de entender físicamente el tensor de inercia?

Respuestas (5)

tienes razon al decir eso I permite relacionar la velocidad angular y el momento angular de forma lineal. Simplemente no es tan simple como el caso del impulso y la velocidad. Una intuición de por qué las cosas se complican es que L = r × pag implica un producto cruzado que lo hace muy sensible a la elección de un conjunto específico de bases ortonormales (con origen fijo). Mientras pag = metro v involucra una masa escalar que es independiente de su elección de coordenadas.

Para explicar el tensor de inercia, supongo que podríamos comenzar con casos más simples donde hay suficiente simetría (por ejemplo, una esfera en 3D o un panqueque circular en 2d), L = I ( ω ) reduce a L = I ω dónde L y ω son vectores y I es solo un escalar. Una intuición para esta reducción es que la simetría hace I parecerse metro más. Como mencioné anteriormente, la masa siempre es independiente de la elección de coordenadas. pero I sólo es independiente de las coordenadas que CONSERVAN la simetría. Por lo tanto, las esferas y los panqueques circulares son bastante fáciles de manejar y no se necesita un tensor de inercia.

Pero para un cuerpo rígido general extendido en 3D, la falta de simetría rompe la relación lineal simple. Suponga que tiene una base ortonormal, cuyo origen es la esquina de un cubo y los ejes se alinean con las aristas del cubo. Básicamente, cuando el cubo gira alrededor del eje z, todas las partes del cubo también giran instantáneamente en las otras direcciones (si dibuja un diagrama, sería claro). Por lo tanto ω z afecta L y y L X . No veo una explicación intuitiva de los detalles cuantitativos... Pero este simple ejemplo de cubo muestra que L X , L y , L z cada uno debe ser una combinación lineal de ω X , ω y , ω z . Y la expresión matemática que cuantifique esto debe ser una matriz.

*Un desvío matemático: esta matriz en sí no es un tensor, sino una REPRESENTACIÓN de un tensor que asigna vectores de velocidad angular a vectores DUAL de momento angular. En notación de índice abstracto, L α = I α β ω β Verá muchas notaciones similares en E&M, Relatividad, etc.

Entonces, hay dos cosas distintas de las que estamos hablando aquí. Parece que no te importa alguna notación avanzada, así que intentaré usar eso para ilustrar el lado matemático de la física de la que estoy hablando.

La rigidez y el eje de rotación.

Una de las cosas de las que estamos hablando es que el objeto es rígido , lo que significa que está compuesto por un montón de partículas cuyas distancias son fijas. La forma matemática de decir esto es que en cualquier momento debe estar representado por una isometría , y el grupo de isometrías es T ( 3 ) × O ( 3 ) . De hecho, la isometría debe ser continua con la identidad, por lo que en el espacio euclidiano infinito normal podemos especificar que T ( 3 ) × S O ( 3 ) , traslaciones más rotaciones. Solo para resolver la idea básica, deje que los índices griegos sean coordenadas y los índices latinos sean partículas, de modo que podamos usar la suma de Einstein en los índices griegos. Intentaré usar algunos tensores métricos explícitos. gramo α β para denotar el producto escalar, para mantener los índices latino y griego visiblemente separados. Las partículas tienen vectores de posición. r norte α pero las distancias entre esas partículas son constantes, entonces

d d t [ gramo α β   ( r metro α r norte α )   ( r metro β r norte β ) ] = 2 gramo α β   ( r metro α r norte α )   ( r ˙ metro β r ˙ norte β ) = 0.
Dada una orientación (totalmente antisimétrica [ 0 , norte ] tensor ϵ en nuestro R norte espacio) podemos describir la rotación con un [ norte 2 , 0 ] tensor Ω como
r ˙ metro β = x β + gramo β γ ϵ γ d Λ   Ω Λ   r metro d .
Esta forma funcional hace que el término anterior sea ϵ α d Λ   Ω Λ   R metro norte α   R metro norte d = 0 debido a la antisimetría de los ϵ término, donde la forma exacta de R metro norte α = r metro α r norte α no importa, así como Ω Λ no importa, al derivar eso 0 . Es puramente por antisimetría. en 2D, Ω Λ es un escalar; en 3D es un vector; en dimensiones superiores es un tensor, pero en cada caso se convierte en esta matriz antisimétrica Ω γ d = ϵ γ d Λ   Ω Λ . El hecho de que todas las rotaciones puedan ser representadas por estas matrices antisimétricas será muy útil en un momento. No estoy seguro de si en dimensiones superiores también aparecen otros términos; mi pensamiento fue simplemente "necesitas velocidad para desaparecer directamente o para ser perpendicular a la posición".

Momento angular

Otra es, debido al hecho de que la fórmula para las energías cinética y potencial no depende de la rotación (una simetría continua), existe una corriente de Noether conservada asociada con esa simetría: el momento angular. En este caso nuestro Lagrangiano tiene la forma

1 2 norte metro norte gramo α β r ˙ norte α r ˙ norte β metro norte tu metro norte [ gramo α β   ( r metro α r norte α )   ( r metro β r norte β ) ] ,
para algún conjunto de fuertes potenciales que obligan al cuerpo a permanecer rígido tu metro norte . Dado que son rotacionalmente simétricos, y el término cinético es rotacionalmente simétrico, el teorema de Noether dice que, por lo tanto, tomamos una cantidad conservada para cualquier desplazamiento infinitesimal que obedezca a la simetría. d r α de
q = norte L r ˙ norte α   d r norte α .
Una vez más, la rotación se convierte, pase lo que pase, en una matriz antisimétrica, d r norte α = gramo α m   d ϕ m v   r norte v , por lo que lo anterior se convierte en:
q = norte metro norte gramo α β   r ˙ norte β   gramo α m   d ϕ m v   r norte v = d ϕ m v   norte metro norte   r ˙ norte m   r norte v = d ϕ m v   q m v .
Por lo tanto, esta cantidad conservada tiene un [ 2 , 0 ] carácter tensor, ya que podemos elegir cualquier eje para esta rotación. Además, cualquier parte simétrica de este tensor quedará destruida por la antisimetría de la rotación, por lo que sin pérdida de generalidad también podemos antisimetrizarla. La notación usual para esto es escribir q [ m v ] con corchetes,
q [ m v ] = 1 2 ( q m v q v m ) = norte metro norte   r ˙ norte [ m   r norte v ] .

Reuniéndolos

Hemos visto dos expresiones fundamentalmente diferentes aquí: una es el tensor de velocidad angular Ω α β , que se deriva de la rigidez del sistema; el otro es el tensor de momento angular q m v , que se deriva de la simetría en las ecuaciones de movimiento. Obviamente, no están definidos de la misma manera , pero ambos resultan ser antisimétricos. ¿Cuál es la relación entre ellos? Eso es fácil: sustituye el término rotacional de la Ω expresión para r ˙ norte β en el mismo r ˙ término en la energía cinética para encontrar:

q [ m v ] = [ norte metro norte   r norte [ v   gramo m ] γ   r norte d ]   Ω γ d .
Aquí vemos que un [ 4 , 0 ] el tensor los relaciona linealmente y tiene v - d y m - γ simetría pero v - m antisimetría. Por lo tanto, siempre se encuentran en una relación directa a través de este tensor de momento de inercia, y eso se debe básicamente a que las velocidades de las partículas alrededor del centro de masa contribuyen directamente al momento angular y están determinadas directamente por una rotación.

por supuesto en R 3 resulta más fácil trabajar con los vectores de momento angular y velocidad angular; nosotros escribimos q m v como q λ   ϵ λ m v y observe que para la orientación más común (donde ϵ 123 = 1 ) tenemos ϵ α β γ ϵ β γ d = 2 d d α , de modo que

q λ = 1 2 [ norte metro norte   ϵ λ m v   gramo m γ   r norte v   r norte d   ϵ γ d k ] Ω k .
así que en R 3 encontramos un directo [ 0 , 2 ] -relación tensorial entre las mismas cantidades, porque ambas matrices de momento angular son secretamente vectores de momento angular.

No estoy del todo seguro de haber hecho todos los detalles correctamente aquí, pero esa es la historia general. Los dos conceptos son diferentes, en parte porque uno contiene ideas de "masa" que son diferentes en distintas direcciones y el otro no; pero resultan estar linealmente relacionados a través de los términos r ˙ norte α . Son matrices secretamente antisimétricas con una relación lineal, pero se pueden convertir a la baja en R 2 a escalares o en R 3 a vectores o en R 4 a pares de vectores en R 3 .

Para obtener intuición, recomiendo comenzar no con la definición, sino con el problema que está tratando de resolver. Es decir, dado un cuerpo rígido B , con una cierta velocidad angular ω con respecto a su centro de masa, ¿cuál es su momento angular? L ? Defina el "momento de inercia" como la propiedad de B que determina el valor de L dado ω .

Definido de esta manera, el "momento de inercia" podría ser, en principio, una función horriblemente complicada que depende de alguna manera no lineal de la forma del cuerpo rígido. Después de todo, hay infinitos vectores de entrada posibles ω , y a priori, podrían dar lugar a valores de L de acuerdo con algún cálculo loco que requiere que lleves un registro explícito de la posición exacta de cada partícula en el cuerpo rígido.

Lo que nos salva de esta pesadilla es que el vector de salida L depende linealmente del vector de entrada ω . ¿Cómo podemos ver que esto es cierto? Bueno, es bastante intuitivo que si duplicas ω entonces doblarás L , por lo que es un buen comienzo. Lo que es menos obvio de inmediato es que si L 1 es el momento angular correspondiente a una cierta velocidad angular ω 1 , y L 2 es el momento angular correspondiente a una cierta velocidad angular ω 2 , entonces el momento angular correspondiente a ω 1 + ω 2 es L 1 + L 2 . Pero intuitivamente, puedes convencerte de esto si imaginas el caso especial donde ω 1 puntos a lo largo del X -eje y ω 2 puntos a lo largo del y -eje, y calcula el momento angular de un elemento infinitesimal del cuerpo rígido en ( X , y ) girando primero de acuerdo con ω 1 , entonces según ω 2 , y finalmente según ω 1 + ω 2 . Y si la linealidad se cumple en el nivel infinitesimal, entonces debe valer para todo el cuerpo rígido, porque la integración es lineal.

Una vez que haya establecido que L depende linealmente de ω , básicamente has terminado; eso es lo que es un tensor de rango 2 , algo que te da un vector de salida a partir de un vector de entrada de forma lineal. Entonces, el momento de inercia no es una función incomprensiblemente complicada del cuerpo rígido después de todo; porque es un tensor de rango 2 en 3 dimensiones, está determinado por (como máximo) 9 números. Estos números capturan la resistencia del cuerpo al torque en tres direcciones independientes, y la linealidad nos permite derivar su resistencia al torque en cualquier dirección.

Por cierto, esta forma de pensar también ayuda a ver que el momento de inercia es una propiedad física del objeto que disfruta de una existencia independiente de nuestra elección de sistema de coordenadas. La velocidad angular y el momento angular son físicos, y la relación entre ellos depende solo de la estructura física del cuerpo rígido. Pensar en el momento del tensor de inercia como una relación lineal independiente de las coordenadas entre cantidades independientes de las coordenadas (vectores) nos permite derivar la ley de transformación cuando cambiamos las coordenadas (en lugar de tomar la ley de transformación como la definición de un tensor, que tengo siempre resultó ser muy confuso.)

Una observación más. El ejercicio antes mencionado que involucra un elemento infinitesimal del cuerpo rígido nos ayuda a ver por qué el momento de inercia tensor no se describe con un solo número. Eso es, L no es solo un múltiplo escalar de ω , porque la misma velocidad angular alrededor de dos ejes diferentes dará lugar a diferentes magnitudes del momento angular, dependiendo de qué tan lejos esté la masa del eje de rotación. Así que necesitamos más de un número. Ahora, como sin duda sabe, el momento del tensor de inercia es en realidad un tensor simétrico , por lo que en realidad no necesita 9 números para describirlo; 6 números son suficientes. Esta simetría no se sigue sólo del hecho general de que L depende de ω de forma lineal; es un hecho especial sobre la mecánica de los cuerpos rígidos. Pero creo que el principal obstáculo para la intuición es comprender qué significa físicamente un tensor de rango 2, y eso es en lo que me he centrado aquí.

El tensor de inercia es el objeto que nos dice cómo la velocidad angular se convierte en energía cinética o momento angular y, por lo tanto, desempeña un papel similar al de la masa en el movimiento rectilíneo. Para entender físicamente por qué este factor de conversión es solo un número en un caso pero es un tensor en el otro, solo tenemos que notar que ambas cantidades representan la inercia total del sistema.

Debido a la isotropía del espacio, la inercia de la partícula en movimiento rectilíneo está completamente determinada por un solo parámetro, la masa. Sin embargo, en el movimiento de rotación, diferentes ejes de rotación del mismo cuerpo muestran en general diferentes inercias y un solo escalar no será suficiente para describir cómo la velocidad angular se convierte en energía cinética. Para describir completamente la inercia del cuerpo con respecto a un punto dado necesitamos en general seis parámetros, tres para fijar la orientación de los ejes de coordenadas y tres para cuantificar la inercia con respecto a cada uno de estos ejes.

Al tener seis números a especificar, la inercia del cuerpo requiere al menos un tensor simétrico de segundo rango para ser representada. Si el cuerpo tiene simetrías particulares, el número total de parámetros diferentes se reduce. Por ejemplo, considere una esfera homogénea centrada en el origen que está fija. Con respecto a ese punto, todas las orientaciones de los ejes son equivalentes por lo que no necesitamos ningún parámetro para fijar el sistema de coordenadas. Además, las rotaciones a lo largo de cada uno de los tres ejes también son equivalentes, la inercia debe ser la misma. Por lo tanto, la inercia de la esfera homogénea está descrita por un solo escalar y el tensor de inercia es un múltiplo del tensor de identidad.

También me encontré con el mismo problema hasta que recientemente entendí el significado detrás de los índices.

Aunque hay muchas definiciones de un tensor, nos queda decidir cuál es aceptable para el tipo de contexto en el que nos encontramos.

I X y significa cuánto se aceleraría el objeto 3D en el y eje cuando aplico el torque en el X eje.