Representación matricial de una rotación con una base no canónica

Quiero encontrar la representación matricial de una rotación T en un plano con respecto a una base de a 1 = mi 1 , a 2 = mi 1 + mi 2 . Encontré lo siguiente, pero tengo problemas para entender por qué funcionó. Nota: estoy evitando el uso de matrices inversas y tratando de hacerlo simplemente mediante definiciones de transformaciones lineales.

Primero, tenga en cuenta que la rotación en la base canónica es:

R = [ porque θ pecado θ pecado θ porque θ ] = [ C s s C ]

Aplicándolo a la nueva base,

R a 1 = [ C s ]
R a 2 = [ C s C + s ]

Entonces, ¿aparentemente la nueva matriz de transformación también transformará la nueva base de la misma manera?

T a 1 = [ C s ] = α [ 1 0 ] + β [ 1 1 ]
T a 2 = [ C s C + s ] = γ [ 1 0 ] + d [ 1 1 ]
Podemos resolver para encontrar los coeficientes, y luego forman la nueva matriz, pero ¿colocándolos en columnas?
α = C s ,   β = s ,   γ = 2 s ,   d = C + s
T = [ C s 2 s s C + s ]
Esta parece ser la respuesta correcta - si tomamos el ángulo como π / 4 y rotar a 1 obtenemos un vector en el a 2 dirección pero magnitud 1 / 2 ya que es originalmente de magnitud 1 y a 2 es de magnitud 2 . si rotamos a 2 de manera similar obtenemos [ 2 2 3 2 ] que también parece correcto.

Entonces, ¿alguien podría explicar qué sucedió aquí? ¿Por qué podemos establecer R a j = T a j = i = 1 2 T i j a j ?

Creo que te referías a una rotación por π / 4 en vez de π / 2 ; en cualquier caso cuando construyo y aplico T segun tu formula no obtengo la misma respuesta que tu para rotar a 2 , pero obtengo lo que parece ser una respuesta correcta.
Tienes razón, quise decir π / 4

Respuestas (3)

La clave aquí es que las columnas de la matriz de una transformación son las imágenes de los vectores base, expresados ​​en la base de "salida". Si llamamos a la ( a 1 , a 2 ) base B , esto significa que las columnas de la matriz [ T ] B B de la rotación son los B -coordenadas de T a 1 y T a 2 . Eso es,

[ T ] B B = [ [ T a 1 ] B [ T a 2 ] B ] .
Por definición, estas coordenadas son los coeficientes de las combinaciones lineales de a 1 y a 2 que producen T a 1 y T a 2 . Usando su notación, entonces,
[ T ] B B = [ α γ β d ]
donde los elementos de la matriz son las soluciones del sistema de ecuaciones
α + β = C β = s γ + d = C s d = C + s
que configuraste.

Puede verificar que obtuvo la respuesta correcta calculando esta matriz utilizando la fórmula habitual de cambio de base. Llamando a la base estándar mi ,

[ T ] B B = [ i d ] B mi [ T ] mi mi [ i d ] mi B = ( [ i d ] mi B ) 1 [ T ] mi mi [ i d ] mi B = [ [ a 1 ] mi [ a 2 ] mi ] 1 R [ [ a 1 ] mi [ a 2 ] mi ] = [ 1 1 0 1 ] [ C s s C ] [ 1 1 0 1 ] = [ C s 2 s s C + s ] .
Estas multiplicaciones e inversiones de matrices son solo una forma diferente de resolver el sistema de ecuaciones lineales para las coordenadas de T a 1 y T a 2 .

Considere estas dos ecuaciones de la pregunta:

(1) [ C s ] = α [ 1 0 ] + β [ 1 1 ] , (2) [ C s C + s ] = γ [ 1 0 ] + d [ 1 1 ] .

Este es fundamentalmente un sistema lineal de cuatro ecuaciones con cuatro incógnitas. Y ciertamente puedes resolverlo de la forma en que lo hiciste.

Otra forma de escribir ecuaciones ( 1 ) y ( 2 ) juntos es

[ C C s s C + s ] = [ 1 1 0 1 ] [ α γ β d ] .
Resulta que
(3) [ C C s s C + s ] [ X y ] = [ 1 1 0 1 ] [ α γ β d ] [ X y ]
para cualquier número real X , y .

Observe que la matriz del lado izquierdo de la ecuación es la matriz que transforma las coordenadas de un vector relativas a la base a 1 , a 2 en las coordenadas del vector rotado relativo a la base mi 1 , mi 2 . Es decir, si tenemos un vector v = X a 1 + y a 2 , y la rotación de este vector produce v , entonces las coordenadas de v en la base estándar están dadas por

[ C C s s C + s ] [ X y ] .

La matriz [ 1 1 0 1 ] , por otro lado, transforma las coordenadas de un vector relativas a la base a 1 , a 2 en las coordenadas del mismo vector relativo a la base mi 1 , mi 2 , sin girarlo. Así que si v = X a 1 + y a 2 , entonces

[ 1 1 0 1 ] [ X y ] .
da las coordenadas de v en la base canónica. Eso es,
(4) [ C C s s C + s ] [ X y ] = [ 1 1 0 1 ] [ X y ] .

Pero la matriz T para la rotación con respecto a la base a 1 , a 2 es simplemente la matriz por la que multiplicamos cualquier [ X y ] para obtener el correspondiente [ X y ] . Eso es,

[ X y ] = T [ X y ] .
Haciendo esta sustitución en la ecuación ( 4 ) , obtenemos
(5) [ C C s s C + s ] [ X y ] = [ 1 1 0 1 ] T [ X y ] .

Ahora compare la ecuación ( 5 ) con ecuación ( 3 ) . Una ecuación tiene la matriz [ α γ β d ] donde el otro tiene T ; de lo contrario, las ecuaciones son idénticas. y ecuación ( 3 ) hace exactamente el trabajo que queremos Ecuación ( 5 ) hacer. Entonces parece plausible que la matriz [ α γ β d ] es una representación adecuada de T .

Para probar realmente que T = [ α γ β d ] , podrías multiplicar ambos lados de la ecuación ( 3 ) y ( 5 ) a la izquierda por la matriz [ 1 1 0 1 ] 1 = [ 1 1 0 1 ] . Esto transformaría las coordenadas en el lado izquierdo de cualquier ecuación nuevamente en coordenadas con respecto a la base a 1 , a 2 , mientras transforma el lado derecho de ( 3 ) a [ α γ β d ] [ X y ] . Dijiste que no querías usar matrices inversas; ¿Eso se aplica al método de encontrar la rotación, o al método y la prueba del método? Podría haber una manera de hacer la prueba sin invocar la existencia de la inversa de [ 1 1 0 1 ] , pero no lo he probado.

tienes que expresar T a 1 bajo la forma α a 1 + β a 2 y para expresar T a 2 como γ a 1 + d a 2 . Entonces, la matriz de T con respecto a { a 1 , a 2 } es ( α β γ d ) .

Hay otra manera de hacer esto. Dejar

B = ( 1 1 0 1 ) ,
que es la matriz de cambio de base de { a 1 , a 2 } a { mi 1 , mi 2 } . Entonces la matriz que buscas es
B 1 . ( C s s C ) . B = ( C s 2 s s C + s ) ,
que es (como era de esperar) la misma matriz que obtuviste.

Primero preguntaste por qué introduje R para encontrar T, pero sin R, ¿cómo encuentro T entonces? Traté de usar geometría pero se complicó debido a las diferentes longitudes de los vectores. Y también usaste R al aplicar B 1 R B - es como tomar un vector en base { a 1 , a 2 } , transformándolo en { mi 1 , mi 2 } , girándolo y luego transformándolo de nuevo en { a 1 , a 2 } ?
@wobertson Ya veo. Usted llamó R a la matriz. Pensé que era una transformación lineal. Editaré mi respuesta.
Acabo de editar mi pregunta para notar que estoy tratando de lograr esto usando las definiciones de transformaciones lineales y, por lo tanto, sin inversas explícitas, lo que parece lograr el trabajo original que hice, aunque estoy tratando de averiguar por qué. Sin embargo, es bueno tener su respuesta para verificar la solución, gracias.