¿Cuál es una forma intuitiva de pensar sobre el determinante?

En mi clase de álgebra lineal, solo hablamos de determinantes. Hasta ahora he estado entendiendo bien el material, pero ahora estoy muy confundido. Entiendo que cuando el determinante es cero, la matriz no tiene inversa. Puedo encontrar el determinante de a 2 × 2 matriz por la fórmula. Nuestro maestro nos mostró cómo calcular el determinante de un norte × norte matriz descomponiéndola en los determinantes de matrices más pequeñas. Aparentemente, hay una manera de sumar un montón de permutaciones. Pero la notación es realmente difícil para mí y realmente ya no sé qué está pasando con ellos. ¿Puede alguien ayudarme a descubrir qué es un determinante, intuitivamente, y cómo se relacionan todas esas definiciones?

Solo quería que esta pregunta estuviera en los archivos, porque es una pregunta perenne que admite una mejor respuesta que en la mayoría de los libros de texto.
¡Jeje, vas en contra de tu propia sugerencia de hacer preguntas que realmente quieres que te respondan! Sin embargo, estoy bromeando, entiendo tu motivación. ¿Podemos sentar un precedente de hacer preguntas semilla en CW? Me gusta la idea, la propondré en Meta. estoy divagando
En caso de que alguien tuviera curiosidad sobre la forma de seguimiento de esta pregunta, es más difícil y es el tema de una de mis preguntas de MO: D mathoverflow.net/questions/13526/…
@BBischof, vea el meta hilo para la discusión de CW
Al final, espero que esto no haya parecido como si yo odiara tu pregunta... Sin embargo, de alguna manera, siento que eso sucedió.
no, no lo tomé así en absoluto... :)
Estoy confundido: ¿Katie Banks respondió a su propia pregunta?
Aquellos que lean este foro en el 2016 pueden estar interesados ​​en este video The Determinant , que es parte de un conjunto de videos que brindan una muy buena perspectiva de la comprensión intuitiva del álgebra lineal (más bien la esencia de esto)
Un recurso increíble que utilicé para motivar mi comprensión del determinante: askamathematician.com/2013/05/…

Respuestas (17)

Tu problema con los determinantes es bastante común. También son algo difícil de enseñar bien, por dos razones principales que puedo ver: las fórmulas que aprendes para calcularlas son confusas y complicadas, y no hay una forma "natural" de interpretar el valor del determinante, la forma es fácil interpretar las derivadas que haces en cálculo al principio como la pendiente de la recta tangente. Es difícil creer cosas como la condición de invertibilidad que ha establecido cuando ni siquiera está claro qué significan los números y de dónde provienen.

En lugar de mostrar que las muchas definiciones habituales son todas iguales comparándolas entre sí, voy a establecer algunas propiedades generales del determinante que afirmo que son suficientes para especificar de manera única qué número debe obtener cuando ingresa un determinado matriz. Entonces, no está mal comprobar que todas las definiciones de determinante que has visto satisfacen las propiedades que mencionaré.

Lo primero en lo que debe pensar si desea una definición "abstracta" del determinante para unificar a todos los demás es que no es una matriz de números con barras al costado. Lo que realmente estamos buscando es una función que tome N vectores (las N columnas de la matriz) y devuelva un número. Supongamos que estamos trabajando con números reales por ahora.

¿Recuerdas cómo esas operaciones que mencionaste cambian el valor del determinante?

  1. Cambiar dos filas o columnas cambia el signo.

  2. Multiplicar una fila por una constante multiplica todo el determinante por esa constante.

  3. El hecho general de que el número dos se basa en: el determinante es lineal en cada fila . Es decir, si lo piensas como una función det : R norte 2 R , entonces

    det ( a v 1 + b w 1 , v 2 , , v norte ) = a det ( v 1 , v 2 , , v norte ) + b det ( w 1 , v 2 , , v norte ) ,
    y la condición correspondiente en cada otra ranura.

  4. El determinante de la matriz identidad I es 1 .

Afirmo que estos hechos son suficientes para definir una función única que toma N vectores (cada uno de longitud N) y devuelve un número real, el determinante de la matriz dada por esos vectores. No probaré eso, pero te mostraré cómo ayuda con algunas otras interpretaciones del determinante.

En particular, hay una buena forma geométrica de pensar en un determinante. Considere el cubo unitario en N espacio dimensional: el conjunto de N vectores de longitud 1 con coordenadas 0 o 1 en cada punto. El determinante de la transformación lineal (matriz) T es el volumen con signo de la región obtenido al aplicar T al cubo unitario . (No se preocupe demasiado si no sabe lo que significa la parte "firmada", por ahora).

¿Cómo se sigue eso de nuestra definición abstracta?

Bueno, si aplicas la identidad al cubo unitario, obtienes el cubo unitario. Y el volumen del cubo unidad es 1.

Si estira el cubo por un factor constante en una sola dirección, el nuevo volumen es esa constante. Y si apila dos bloques alineados en la misma dirección, su volumen combinado es la suma de sus volúmenes: todo esto muestra que el volumen con signo que tenemos es lineal en cada coordenada cuando se considera como una función de los vectores de entrada.

Finalmente, cuando cambias dos de los vectores que definen el cubo unitario, cambias la orientación. (Nuevamente, esto es algo a lo que volveremos más adelante si no sabes lo que eso significa).

Entonces, hay formas de pensar sobre el determinante que no son símbolos. Si has estudiado cálculo multivariable, podrías pensar, con esta definición geométrica de determinante, por qué aparecen los determinantes (el jacobiano) cuando cambiamos las coordenadas al hacer la integración. Sugerencia: una derivada es una aproximación lineal de la función asociada y considere un "elemento de volumen diferencial" en su sistema de coordenadas inicial.

No es demasiado trabajo comprobar que el área del paralelogramo formado por vectores ( a , b ) y ( C , d ) es | C d a b | cualquiera de los dos: puede intentarlo para tener una idea de las cosas.

Gran respuesta. Nos enseñaron el determinante como la función de volumen generalizada en nuestra clase de álgebra.
Espero que no le importe, pero corregí un pequeño error tipográfico en la tercera propiedad del determinante y agregué algo de látex para que la identidad sea un poco más fácil de leer.
Bien hecho. Todos deberíamos tener esto en mente cuando enseñamos los determinantes.
Solo por curiosidad, ¿ a quién le estás hablando con la primera frase? ¿¡¿No hiciste la pregunta?!? De cualquier manera, dirijo a los estudiantes a estas preguntas y respuestas todo el tiempo para obtener ayuda determinante.
@TheChaz esta pregunta se hizo cerca de los comienzos de Math.SE, cuando era necesario llenar el sitio con preguntas antes de que se abriera al "público". En cualquier caso, hoy en día se recomienda explícitamente responder a sus propias preguntas .
Para ver que la interpretación geométrica (volumen de la imagen del cubo) satisface la propiedad de multilinealidad no basta con apilar dos bloques "alineados", esto es nuevamente la multiplicación de una columna por un escalar. Debe tratar con dos bloques "no alineados" producidos al cambiar un solo vector de columna, y ver que la suma de sus volúmenes es el volumen del bloque obtenido al poner la suma de los dos vectores. Esto no es tan fácil de atrapar...
Quiero compartir este enlace. Da una muy buena respuesta a esta pregunta, en mi opinión.
¿Hay alguien que automáticamente entienda el determinante inmediatamente después de aprenderlo? :\
¿Por qué se incluye el axioma (2)? (3) lo hace redundante...
@JamieBanks ¿Hay alguna prueba de que esas propiedades sean suficientes? Dijiste que no lo probarías aquí, pero me gustaría ver uno si existe.
Tengo una pregunta, en el punto 4. Dice que esta función es única. En este contexto, ¿qué entendemos por único?
He aprendido o vuelto a aprender diferentes partes del álgebra lineal de seis a diez libros de texto diferentes en diferentes momentos de mi vida; nunca recordaré cómo calcular un determinante si no lo he hecho recientemente, y nunca he visto esta explicación de su significado. ¡Finalmente!
@StanShunpike: La idea detrás de la prueba de unicidad es la siguiente. Escriba sus vectores de entrada v i en una base fija mi 1 , , mi norte . Usando (3), expanda todo tanto como sea posible hasta que obtenga una suma de det cuyas entradas son solo los vectores base. Usando (1), det ( mi 1 , mi 1 ) = 0 y de manera similar, las n entradas a cada uno de estos dets son vectores base distintos en algún orden. Nuevamente usando (1), reordenarlos para que cada uno sea det ( mi 1 , mi 2 , , mi norte ) , que es 1 por (4). Esto fuerza el valor de det en v 1 , , v norte .
La señal y la orientación no son difíciles de motivar. Calcular det ( C mi 1 , mi 2 , mi 3 ) pictóricamente como c varía de 1 a -1. el volumen es | C | en cada caso, y para que este proceso sea sencillo, necesitamos recoger un negativo para C < 0 . Puede rotar rígidamente ( mi 1 , mi 2 , mi 3 ) en ( mi 2 , mi 1 , mi 3 ) que razonablemente debe preservar det , entonces det ( mi 2 , mi 1 , mi 3 ) = 1 . El hecho de que pueda tomar este tipo de decisiones de manera constante (y en gran medida sin tomar decisiones realmente) es a primera vista un pequeño milagro, pero de todos modos eso no es una cuestión de motivación.
¿Alguien puede explicarme la multilinealidad del volumen de los paralelepípedos?
Para ser franco, si la pregunta proviniera de un interrogador real, esta respuesta no ayudaría. Has introducido una notación alienígena más probable ( \mathbb{R}^n^2 ), dada una interpretación geométrica similar a la de la mayoría de los textos (área de un paralelogramo) y que no da ninguna intuición. Después de leer esta respuesta, no tengo una mejor idea de cómo alguien habría llegado a la noción de un determinante en primer lugar. Un grupo de personas que ya entienden el concepto apreciando la respuesta es una mala prueba para decidir el valor educativo de una explicación.
En el número 2 de esas propiedades generales, ¿dividir una fila por una constante no multiplica el determinante por esa constante?
Pregunta: ¿es equivalente a exigir que el vector w 1 en la propiedad número 3) es w 1 = v k para algunos k con 1 k norte ? Permitir que sea cualquier vector parece una gran restricción para el determinante.
Emil Artin, Galois Theory (segunda edición 1944, reimpreso por Dover 1998), páginas 11-20, caracteriza la función determinante de manera similar y prueba que existe y es única.
@ChrisTaylor Si bien responder a su propia pregunta está bien y es recomendable, no creo que sea lo mismo cuestionar su propia respuesta (tengo esta explicación genial para dar, ahora si alguien me hiciera una pregunta correspondiente). Especialmente, la ingenuidad de la pregunta ("en mi clase solo hablamos de determinantes", lo que sugiere la perspectiva de un estudiante en lugar de un maestro) es claramente fingida y contradicha por una respuesta inmediata de OP.
Esta respuesta está confundida acerca de los roles de filas y columnas. Si está viendo (de hecho, especificando) el determinante como una función de las columnas de una matriz, entonces debería hablar sobre condiciones multilineales y alternas solo en las columnas . Obtendrá el otro tipo de multilinealidad de forma gratuita (una vez que se deduzca la invariancia bajo la transposición), pero no debería ser parte de la especificación. De hecho (3) habla de linealidad por filas, pero (si interpreto la notación con respecto a lo dicho anteriormente) especifica linealidad por columnas. Difícil sacar algo definitivo de ello.
@MarcvanLeeuwen Sinceramente, no veo ningún problema, especialmente dado que la pregunta es una con la que muchas personas han tenido problemas y la respuesta es clara y útil. Citando la publicación de blog a la que me vinculé (énfasis mío), Stack Exchange "no es solo una plataforma de preguntas y respuestas: también es un lugar donde puede publicar cosas que ha aprendido: recetas, preguntas frecuentes, instrucciones, tutoriales e incluso fragmentos de documentación del producto, siempre que la formatee como una pregunta y una respuesta ". (Por cierto, ¿te das cuenta de que el comentario al que estás respondiendo tiene siete años y medio?)
Tuve el mismo pensamiento que esta pregunta, "¿Cuál es una forma intuitiva de pensar en los determinantes?", Así es como llegué aquí. La respuesta fue muy perspicaz para mí, especialmente al establecer un marco geométrico del que no era consciente. Gracias

Podrías pensar en un determinante como un volumen. Piense en las columnas de la matriz como vectores en el origen que forman los bordes de una caja sesgada. El determinante da el volumen de esa caja. Por ejemplo, en 2 dimensiones, las columnas de la matriz son las aristas de un rombo.

Puedes derivar las propiedades algebraicas de esta interpretación geométrica. Por ejemplo, si dos de las columnas son linealmente dependientes, a su caja le falta una dimensión y, por lo tanto, se ha aplanado para tener un volumen cero.

Si se me permite, agregaría a esta respuesta (que creo que es muy buena) en dos aspectos menores. Primero, un determinante también tiene un signo, por lo que queremos el concepto de volumen orientado. (Esto es algo complicado, pero definitivamente importante, por lo que es mejor que lo tengas en cuenta cuando estés aprendiendo sobre las "reglas de la mano derecha" y demás). Segundo, creo que es mejor que un volumen pensar en el determinante como el multiplicativo. cambio de volumen de un paralelepípedo bajo la transformación lineal. (Por supuesto, siempre puede tomar el primero como la unidad n-cubo y decir que solo está dividiendo por uno).
Tengo diez años de retraso, pero aquí hay un video de 3blue1brown sobre el determinante que usa la misma interpretación geométrica.

Además de las respuestas anteriores, el determinante es una función del conjunto de matrices cuadradas en los números reales que conserva la operación de multiplicación:

det ( A B ) = det ( A ) det ( B )
y así lleva s o metro mi información sobre matrices cuadradas en el conjunto mucho más familiar de números reales.

Algunos ejemplos:

La función determinante mapea la matriz identidad I al elemento identidad de los números reales ( det ( I ) = 1 .)

¿Qué número real no tiene inverso multiplicativo? El número 0. Entonces, ¿qué matrices cuadradas no tienen inversas multiplicativas? Aquellos que son mapeados a 0 por la función determinante.

¿Cuál es el determinante de la inversa de una matriz? El inverso del determinante, por supuesto. (Etc.)

Esta propiedad de "preservación de la operación" del determinante explica parte del valor de la función determinante y me proporciona un cierto nivel de "intuición" al trabajar con matrices.

Aquí hay una grabación de mi conferencia sobre la definición geométrica de determinantes:

Definición geométrica de determinantes

Tiene elementos de las respuestas de Jamie Banks y John Cook, y entra en detalles de manera pausada.

Yo también encuentro más intuitiva la forma en que se tratan los determinantes en el álgebra exterior. La definición se da en la página 46 de "Tensores: geometría y aplicaciones" de Landsberg. Dos ejemplos a continuación le dirán todo lo que necesita saber.

Di, te dan una matriz

A = ( a b C d )
y se le pidió que calculara su determinante. Puedes pensar en la matriz como un operador lineal F : R 2 R 2 definido por

( X y ) ( a b C d ) ( X y ) .

Si define el vector base estándar por mi 1 = ( 1 0 ) y mi 2 = ( 0 1 ) , entonces puede definir F por los valores que asume sobre los vectores base: F ( mi 1 ) = a mi 1 + C mi 2 y F ( mi 2 ) = b mi 1 + d mi 2 .

El operador lineal F se extiende a bivectores por

F ( mi 1 mi 2 ) = F ( mi 1 ) F ( mi 2 ) .

Entonces puedes escribir

F ( mi 1 mi 2 ) = ( a mi 1 + C mi 2 ) ( b mi 1 + d mi 2 ) = ( a d b C ) mi 1 mi 2 ,

donde utilicé la distributividad y la anticonmutatividad del producto cuña (este último implica a a = 0 para cualquier vector a ). Entonces, obtenemos el determinante como un factor escalar en la ecuación anterior, es decir

F ( mi 1 mi 2 ) = det ( A ) mi 1 mi 2 .

El mismo procedimiento funciona para matrices de 3 por 3, solo necesita usar un trivector. Di, te dan

B = ( a 11 a 12 a 13 a 21 a 22 a 23 a 31 a 32 a 33 ) .

Define un operador lineal gramo : R 3 R 3

( X y z ) ( a 11 a 12 a 13 a 21 a 22 a 23 a 31 a 32 a 33 ) ( X y z ) ,

para lo cual tenemos

gramo ( mi 1 ) = a 11 mi 1 + a 21 mi 2 + a 31 mi 3 , gramo ( mi 2 ) = a 12 mi 1 + a 22 mi 2 + a 32 mi 3 , gramo ( mi 3 ) = a 13 mi 1 + a 23 mi 2 + a 33 mi 3

sobre la base estándar mi 1 = ( 1 0 0 ) , mi 2 = ( 0 1 0 ) , mi 3 = ( 0 0 1 ) . El operador gramo se extiende a trivectores por

gramo ( mi 1 mi 2 mi 3 ) = gramo ( mi 1 ) gramo ( mi 2 ) gramo ( mi 3 ) ,

lo que da

gramo ( mi 1 mi 2 mi 3 ) = ( a 11 mi 1 + a 21 mi 2 + a 31 mi 3 ) ( a 12 mi 1 + a 22 mi 2 + a 32 mi 3 ) ( a 13 mi 1 + a 23 mi 2 + a 33 mi 3 ) .

Si entonces sigues las reglas de como distributividad, anticonmutatividad y asociatividad, se obtiene

gramo ( mi 1 mi 2 mi 3 ) = det ( B ) mi 1 mi 2 mi 3 .

Funciona exactamente de la misma manera en dimensiones superiores.

Para que conste, intentaré dar una respuesta a esta vieja pregunta, ya que creo que se pueden agregar algunos elementos a lo que ya se ha dicho.

Aunque son básicamente expresiones (complicadas), los determinantes pueden ser misteriosos cuando se encuentran por primera vez. Las preguntas que surgen naturalmente son: (1) ¿cómo se definen en general?, (2) ¿cuáles son sus propiedades importantes?, (3) ¿por qué existen?, (4) ¿por qué nos debería importar?, y (5) ¿por qué ¿Se vuelve tan grande su expresión para matrices grandes?

Desde 2 × 2 y 3 × 3 los determinantes se definen fácilmente de forma explícita, la pregunta (1) puede esperar. Si bien (2) tiene muchas respuestas, las más importantes son, para mí: los determinantes detectan (al convertirse en 0) la dependencia lineal de norte vectores en dimensión norte , y son una expresión en las coordenadas de esos vectores (en lugar de, por ejemplo, un algoritmo). Si tiene una familia de vectores que dependen (o al menos uno de ellos depende) de un parámetro, y necesita saber para qué valores de parámetro son linealmente dependientes, puede intentar usar, por ejemplo, la eliminación gaussiana para detectar la dependencia lineal. en problemas: uno podría necesitar suposiciones sobre el parámetro para asegurar que algún coeficiente sea distinto de cero, e incluso entonces dividir por él da expresiones muy desordenadas. Siempre que el número de vectores sea igual a la dimensión norte del espacio, tomar un determinante transformará inmediatamente la pregunta en una ecuación para el parámetro (que uno puede o no ser capaz de resolver, pero esa es otra cuestión). Así es exactamente como se obtiene una ecuación en problemas de valores propios, en caso de que los hayas visto. Esto proporciona una primera respuesta a (4). (Pero hay mucho más que puede hacer con los determinantes una vez que se acostumbre a ellos).

En cuanto a la pregunta (3), el misterio de por qué existen los determinantes en primer lugar se puede reducir al considerar la situación en la que uno tiene norte 1 dados vectores linealmente independientes, y pregunta cuándo un vector desconocido final X permanecerá independiente de ellos, en cuanto a sus coordenadas. La respuesta es que generalmente lo hará, de hecho siempre a menos que X pasa a estar en el lapso lineal S de aquellos norte 1 vectores, que es un subespacio de dimensión norte 1 . Por ejemplo, si norte = 2 (con un vector v dado) la respuesta es "a menos que X es un múltiplo escalar de v ". Ahora bien, si uno imagina una combinación lineal fija (diferente de cero) de las coordenadas de X (el término técnico es una forma lineal en el espacio), entonces se convertirá en 0 precisamente cuando X está en algún subespacio de dimensión norte 1 . Con un poco de suerte, esto se puede arreglar para que sea precisamente el tramo lineal S . (De hecho, no hay suerte involucrada: si uno extiende el norte 1 vectores por un vector más a una base, luego expresando X en esa base y tomando su coordenada final definirá tal forma lineal; sin embargo, puede ignorar este argumento a menos que sea particularmente sospechoso). Ahora, la observación crucial es que no solo existe tal combinación lineal, sino que sus coeficientes pueden tomarse como expresiones en las coordenadas de nuestro norte 1 vectores Por ejemplo en el caso norte = 2 si uno pone v = ( a b ) y X = ( X 1 X 2 ) , entonces la combinación lineal b X 1 + a X 2 hace el trabajo (se convierte en 0 precisamente cuando X es un múltiplo escalar de v ), y b y a son claramente expresiones en las coordenadas de v . De hecho, son expresiones lineales . Para norte = 3 con dos vectores dados, las expresiones para los coeficientes de la combinación lineal son más complicadas, pero todavía pueden escribirse explícitamente (cada coeficiente es la diferencia de dos productos de coordenadas, uno de cada vector). Estas expresiones son lineales en cada uno de los vectores, si el otro es fijo.

Así se llega a la noción de una expresión (o forma) multilineal. El determinante es de hecho una forma multilineal: una expresión que depende de norte vectores, y es lineal en cada uno de ellos tomados individualmente (fijando los otros vectores a valores arbitrarios). Esto significa que es una suma de términos, cada uno de los cuales es el producto de un coeficiente y de una coordenada cada uno de los norte vectores Pero incluso ignorando los coeficientes, hay muchos términos posibles: una enorme norte norte ¡de ellos!

Sin embargo, queremos una expresión que se convierta en 0 cuando los vectores son linealmente dependientes. Ahora, la magia (más o menos) es que incluso el requisito aparentemente mucho más débil de que la expresión se convierta en 0 cuando dos vectores sucesivos entre los norte son iguales asegurará esto, y además casi nos impondrá la forma de nuestra expresión. Las formas multilineales que satisfacen este requisito se denominan alternas. Me saltaré los argumentos (fáciles), pero una forma alterna no puede involucrar términos que toman la misma coordenada de dos vectores diferentes, y deben cambiar de signo cada vez que uno intercambia el papel de dos vectores (en particular, no pueden ser simétricos con respecto a a los vectores, aunque la noción de dependencia lineal es simétrica; tenga en cuenta que ya b X 1 + a X 2 no es simétrica con respecto al intercambio de ( a , b ) y ( X 1 , X 2 ) ). Por lo tanto, cualquier término debe involucrar a cada uno de los norte coordenadas una vez, pero no necesariamente en orden: aplica una permutación de las coordenadas 1 , 2 , , norte a los vectores sucesivos. Además, si un término involucra una permutación de este tipo, entonces cualquier término obtenido al intercambiar dos posiciones en la permutación también debe ocurrir, con un coeficiente opuesto. Pero dos permutaciones cualesquiera pueden transformarse una en otra intercambiando repetidamente dos posiciones; así que si hay términos en absoluto, entonces debe haber términos para todos norte ! permutaciones, y sus coeficientes son todos iguales u opuestos. Esto explica la pregunta (5), por qué el determinante es una expresión tan grande cuando norte es largo.

Finalmente, el hecho de que existan determinantes resulta estar directamente relacionado con el hecho de que los signos pueden asociarse a todas las permutaciones de tal manera que el intercambio de entradas siempre cambia el signo, lo cual es parte de la respuesta a la pregunta (3). En cuanto a la pregunta (1), ahora podemos decir que el determinante está determinado únicamente por ser un norte -expresión alterna lineal en las entradas de norte vectores columna, que contiene un término que consiste en el producto de sus coordenadas 1 , 2 , , norte en ese orden (el término diagonal) con coeficiente + 1 . La expresión explícita es una suma de todos norte ! permutaciones, obteniéndose el término correspondiente aplicando dichas coordenadas en orden permutado, y con el signo de la permutación como coeficiente. Se puede decir mucho más sobre la pregunta (2), pero me detendré aquí.

La máxima potencia exterior de un norte -espacio vectorial dimensional V es unidimensional. Sus elementos a veces se llaman pseudoescalares, y representan orientados norte -elementos de volumen dimensional.

Un operador lineal F en V se puede extender a un mapa lineal en el álgebra exterior de acuerdo con las reglas F ( α ) = α para α un escalar y F ( A B ) = F ( A ) F ( B ) , F ( A + B ) = F ( A ) + F ( B ) para A y B cuchillas de grado arbitrario. Trivia: algunos autores llaman a esta extensión un morfismo externo . El mapa extendido preservará las calificaciones; es decir, si A es un elemento homogéneo del álgebra exterior de grado metro , entonces F ( A ) también tendrá grado metro . (Esto se puede verificar a partir de las propiedades del mapa extendido que acabo de enumerar).

Todo esto implica que un mapa lineal sobre el álgebra exterior de V una vez restringida a la potencia exterior superior se reduce a la multiplicación por una constante: el determinante de la transformación lineal original. Dado que los pseudoescalares representan elementos de volumen orientado, esto significa que el determinante es precisamente el factor por el cual el mapa escala los volúmenes orientados.

Aquí hay excelentes respuestas que son muy detalladas.

Aquí proporciono una respuesta más simple, también discutida en wikipedia . Piensa en el determinante como el área (en 2D; en 3D sería el volumen, etc.) del paralelogramo formado por los vectores:

Paralelogramo de vectores

Tenga en cuenta que el área de un paralelogramo es la base × altura _ Haciendo algunos trucos con el producto escalar, esto produce el determinante:

| a b C d | = a d b C = A r mi a pag a r a yo yo mi yo o gramo r a metro

Puede colocar los vectores unitarios para cada dimensión para probar la matriz de identidad al ver que:

| 1 0 0 1 | = a d b C = 1 × 1 0 × 0 = 1

Este es un volumen con una matriz de 3 por 3 y será igual a 1 en todos los casos ya que los elementos fuera de la diagonal eliminan cualquier efecto del único valor que contribuye al volumen como el producto diagonal de 1s. Se entiende en algunos contextos que el sistema de coordenadas no se modifica.

Pensando en estos términos, también me resulta más fácil pensar en matrices singulares: no poder tomar el inverso de una matriz con un determinante 0 ahora "se siente como" tratar de dividir por 0, ya que puedo pensar en el determinante como el "valor escalar" de la matriz. Puede que esto no ayude a otros, pero si te ayuda a ti, ¡genial!

Estaba repasando mi álgebra lineal a través de Khan Academy, y encontré una lección maravillosa sobre los detalles aburridos/sangrientos de cómo resulta este cálculo de área de paralelogramo. ¡Échale un vistazo, para cualquiera que quiera una mejor comprensión!
Una imagen/visualización vale más que mil palabras (como las respuestas anteriores).

Si tienes una matriz

  • H entonces puedes calcular la matriz de correlación con
  • GRAMO = H × H H (H^H denota la versión compleja conjugada y transpuesta de H ).

Si haces una descomposición de valores propios de GRAMO obtienes valores propios λ y vectores propios v , que en combinación λ × v describe el mismo espacio.

Ahora existe la siguiente ecuación, diciendo:

  • Determinante( H H H ) = Producto de todos los valores propios λ

es decir, si tiene un 3 × 3 matriz H entonces GRAMO es 3 × 3 también dándonos tres valores propios. El producto de estos valores propios da como el volumen de un paralelepípedo. Con cada dimensión adicional/valor propio, el cuboide obtiene una dimensión adicional.

(Consideré hacer de esto un comentario, pero pensé que podría merecer más atención de la que recibiría un comentario. Los votos positivos y negativos dirán si tengo razón o no).

Complemento sobre el signo del determinante

Me encantó la respuesta aceptada por Jamie, pero me frustró que no diera más explicaciones sobre el signo del determinante y la noción de "rotación" u "orientación" de un vector. La respuesta de Marc Van Leeuwen comenta más sobre esto, pero tal vez no sea suficiente para que todos, al menos no para mí, entiendan lo que significa que una matriz cambie la orientación del espacio que transforma. Así que busqué en Google el problema y terminé con la siguiente explicación que me parece excelente y accesible:

http://mathinsight.org/determinant_linear_transformation#lintrans3D

Si bien ya hay algunas respuestas excelentes, creo que hay un aspecto que aún no se cubre adecuadamente. Es decir, dado que la matriz puede considerarse como representación de una transformación lineal en una base dada, ¿qué nos dice el determinante de la matriz sobre una transformación dada?

Supongamos que tenemos una forma en nuestro espacio vectorial, cualquier forma, con la única restricción de que tiene un volumen bien definido. Ahora podemos preguntar, ¿qué significa una transformación lineal dada en el volumen de esa forma?

Bueno, lo primero que notamos es que si tomamos una dirección, cualquier dirección, y estiramos la forma a lo largo de esa dirección con un factor positivo mientras dejamos sin cambios todas las direcciones ortogonales, el volumen también se multiplicará por ese factor. También si “estiramos” la forma con el factor 0 (haciéndolo plano), claramente tendrá volumen 0 después, por lo que esa regla también se extiende muy bien a este caso límite.

Además, si rotamos la forma (o la dejamos como está), el volumen tampoco cambiará. Tenga en cuenta que no cambiar el volumen significa multiplicar el volumen por uno.

Tenga en cuenta que todo lo anterior no depende de la forma, sino que es solo una propiedad de la transformación. Por lo tanto, tiene sentido asignar a cada una de estas transformaciones T una función, llamémosla det T , que nos dice el factor que tenemos que aplicar a un volumen para obtener el volumen de la imagen.

Por supuesto, si hacemos varias de estas transformaciones seguidas, y cada una multiplica el volumen por un cierto factor, entonces los factores también se multiplican. Eso es,

det ( T 1 T 2 ) = ( det T 1 ) ( det T 2 ) .

Ahora, mirando más de cerca lo anterior, vemos que aún no hemos cubierto todas las transformaciones posibles. Cubrimos todas esas transformaciones que se pueden hacer mediante combinaciones de estiramiento y rotación, pero aún no sabemos qué hacer al reflejar. Consideremos el caso específico de reflejar en una dirección, es decir, invertir el signo de una dirección y mantener todo lo demás. Llamemos a eso transformación de espejo METRO .

Bueno, a primera vista, parece obvio qué hacer: el reflejo no cambia el volumen de ninguna forma, por lo tanto det METRO = 1 , ¿bien? Pero luego, notamos que cuando escribimos doen METRO , realmente se está estirando con el factor 1 . Como siempre estamos multiplicando, ese factor 1 siempre se puede eliminar aplicando el valor absoluto al final. Pero, ¿realmente el factor tiene sentido geométricamente?

Bueno, hay muchas formas que no son idénticas a su imagen especular, y resulta que si quieres transformarlas continuamente en su imagen especular a través de transformaciones lineales, siempre tienes que pasar por una forma con volumen. 0 . Entonces, el signo de hecho lleva información geométrica, por lo que también tiene sentido geométrico mantenerlo.

Dado que todas las transformaciones lineales se pueden obtener mediante secuencias de estiramiento unidimensional, rotaciones y transformaciones especulares unidimensionales, ahora hemos determinado completamente el valor de det T para cualquier transformación. También es intuitivamente claro que está bien definido (si logramos la misma transformación de diferentes maneras, afectará el volumen de las formas de la misma manera).

Ahora que hemos definido el efecto sobre la transformación, podemos ver lo que significa para la matriz.

Obviamente, una matriz diagonal es el producto de estiramientos/espejos en las direcciones de las coordenadas, por lo tanto, el determinante de una matriz diagonal es simplemente el producto de sus entradas diagonales. Intercambiar dos columnas o filas de la matriz significa reflejar en la dirección diagonal correspondiente antes o después de aplicar la transformación original, por lo que da un factor 1 . Si la matriz no es invertible (las columnas son linealmente dependientes), la imagen tendrá volumen cero, por lo que el determinante es 0 . Y los vectores base estándar se asignan a las columnas del vector, por lo tanto, el cubo unitario generado por los vectores base se asignará al paralelepípedo generado por los vectores columna, cuyo volumen, por lo tanto, estará dado por | det A | .

esta es, con mucho, la explicación más intuitiva de lo que es un determinante. La parte más complicada tiene que ver con la orientación de una transformación, lo que puede hacer que el volumen resultante sea negativo. +1

Piensa en una ecuación escalar,

a X = b
donde queremos resolver X . Sabemos que siempre podemos resolver la ecuación si a 0 , Sin embargo, si a = 0 entonces la respuesta es "depende". Si b 0 , entonces no podemos resolverlo, sin embargo, si b = 0 entonces hay muchas soluciones (es decir, X R ). El punto clave es que la capacidad de resolver la ecuación sin ambigüedades depende de si a = 0 .

Cuando consideramos la ecuación similar para matrices

A X = b

la cuestión de si podemos resolverlo no se resuelve tan fácilmente si A = 0 porque A podría consistir en todos los elementos distintos de cero y aún no ser solucionable para b 0 . De hecho, para dos vectores diferentes y 1 0 y y 2 0 muy bien podríamos tener eso

A y 1 0
y
A y 2 = 0 .

si pensamos en y como un vector, entonces hay algunas direcciones en las que A se comporta como distinto de cero (esto se llama el espacio de fila ) y otras direcciones donde A se comporta como cero (esto se llama el espacio nulo ). La conclusión es que si A se comporta como cero en algunas direcciones, entonces la respuesta a la pregunta "es A X = b generalmente solucionable para cualquier b ?" es "depende de b ". Más específicamente, si b está en el espacio columna de A , entonces hay una solución.

Entonces, ¿hay alguna manera de que podamos saber si A se comporta como cero en algunas direcciones? ¡Sí, es el determinante! Si det ( A ) 0 entonces A X = b siempre tiene una solución. Sin embargo, si, det ( A ) = 0 entonces A X = b puede o no tener una solución dependiendo de b y si hay una, entonces hay un número infinito de soluciones.

Una forma de tratar la definición del determinante que aclara la relación entre todas las diversas nociones que mencionó es la siguiente:

Dado un espacio vectorial mi de dimensión norte sobre el campo k y una base B = ( b 1 , . . . , b norte ) de mi , el determinante es el único (distinto de cero) multilineal alterno norte -forma ϕ de mi que satisface ϕ ( b 1 , . . . , b norte ) = 1 .

Esto simplemente significa que el determinante es una función ϕ que toma una tupla ( X 1 , . . . , X norte ) de norte vectores de mi y devuelve un escalar del campo k , tal que

(1) ϕ es lineal en cada uno de los norte Variables ( X 1 , . . . , X norte ) (es "multilineal")

(2) si dos de los X i son iguales, entonces ϕ ( X 1 , . . . , X norte ) = 0 ( ϕ es "alterno")

(3) Resulta que el conjunto de funciones ϕ que satisfacen las dos propiedades anteriores son todos múltiplos entre sí. Así que elegimos una base B de mi y decir que el determinante es la función ϕ satisfaciendo las propiedades anteriores que mapea B a 1 .

Por supuesto, no es inmediatamente obvio que tal función ϕ existe y es único!

Para simplificar un poco tomaremos el espacio vectorial mi ser k norte y la base B ser la base canónica.

Resulta que el determinante satisface la propiedad milagrosa de que d mi t ( X 1 , . . . , X norte ) 0 si y solo si ( X 1 , . . . , X norte ) es una base

Ahora... dado norte vectores X 1 , . . . , X norte tal que para las coordenadas en la base B de X i son ( a i , 1 , . . . , a i , norte ) , el determinante de la norte -vectores X 1 , . . . , X norte se puede demostrar que es igual a

σ S norte s gramo norte ( σ ) a 1 , σ ( 1 ) . . . a norte , σ ( norte )

que debería ser familiar para usted como la expresión del determinante en términos de permutaciones. Aquí S norte es el grupo simétrico, es decir, el conjunto de permutaciones de { 1 , 2 , . . , norte } y s gramo norte ( σ ) es la firma de la permutación σ .

Para establecer el vínculo entre el determinante de un conjunto de norte vectores al determinante de una matriz, solo tenga en cuenta que la matriz A = ( a i , j ) es exactamente la matriz cuyos vectores columna son X 1 , . . . , X norte .

Así, cuando tomamos el determinante de una matriz, lo que realmente estamos haciendo es evaluar una función en términos de la norte vectores de columna Dijimos anteriormente que esta función es distinta de cero si y solo si la norte los vectores forman una base - en otras palabras, si y sólo si la matriz es de rango completo, es decir, si es invertible.

Entonces, la definición abstracta del determinante como una función que asigna un conjunto de vectores al campo escalar (mientras obedece a algunas buenas propiedades como la linealidad) es equivalente a una función de matrices al campo escalar que es distinto de cero exactamente cuando la matriz es invertible. ¡Además, esta función resulta ser multiplicativa! (En consecuencia, la restricción de esta función al conjunto de matrices invertibles da como resultado un homomorfismo de grupo de ( GRAMO yo norte ( k ) , × ) a ( k / { 0 } , ) .

La expresión del determinante de una matriz en términos de permutaciones se puede utilizar para derivar muchas de las buenas propiedades con las que está familiarizado, por ejemplo

  • una matriz y su transpuesta tienen el mismo det

  • det de una matriz triangular es el producto de los elementos diagonales

  • la fórmula de Laplace, también conocida como expansión del cofactor, que le indica cómo calcular el determinante en términos de una suma ponderada de determinantes de submatrices:

det ( A ) = i = 1 norte ( 1 ) i + j a i , j Δ i , j

dónde Δ i , j es el determinante de la matriz obtenida de A eliminando la fila i y la columna j , conocido como el menor ( i , j ) .

Imagina un sistema de ecuaciones completamente general.

a 11 X 1 + a 12 X 2 + a 13 X 3 = b 1
a 21 X 1 + a 22 X 2 + a 23 X 3 = b 2
a 31 X 1 + a 32 X 2 + a 33 X 3 = b 3

Si resolvemos para las variables X i en términos de las otras variables y escribimos los resultados en términos mínimos, veremos que las expresiones para cada X i todos tienen las mismas funciones de a i j en el denominador. (Digamos que trabajamos sobre los números enteros). Esta expresión es (hasta una unidad) el determinante del sistema.

Si elige alguna forma sistemática de resolver norte × norte sistemas, digamos eliminación gaussiana, puede usarlo para generar una fórmula para este determinante.

Creo que esto es mucho más natural que los otros enfoques porque comienzas con algo sencillo y común como un sistema de ecuaciones lineales, luego bajas la cabeza y lo resuelves, y aparece esta noción.

Por supuesto, esto solo te da la respuesta hasta un signo, pero en realidad tiene sentido, porque hay una elección arbitraria de signo.

Garibaldi tiene un artículo que presenta este enfoque y algunos relacionados, titulado El polinomio determinante y característico no son construcciones ad hoc . (Para formalizar esto, debe incorporar un poco de teoría de anillos para que tenga nociones formales de indeterminados, etc.).

El documento mencionado arxiv.org/abs/math/0203276

Intentaré explicar esto intuitivamente. Pero primero debes entender ciertos conceptos. Recomiendo videos 3b1b para intuición en "combinaciones lineales". De todos modos, no es un concepto difícil de entender, lo presentaré un poco.

En primer lugar, comencemos con un ejemplo y luego tratemos de generalizar. Así que imagina que tenemos la matriz A = [ 3 1 1.5 2 ] .

Ahora tomemos los vectores columna de esta matriz, [ 3 1.5 ] y [ 1 2 ] . La combinación lineal de estos vectores es lo que llamamos el Espacio Columna - Col(A) , todas las combinaciones posibles de estos vectores:

a [ 3 1.5 ] + b [ 1 2 ] para a y b como números reales.

Gráficamente se parece a esto (por a y b como números enteros):

También tenemos el Espacio Fila - Fila(A) , idénticamente, definido como las combinaciones lineales de los vectores fila r 1 = [ 3 1 ] y r 2 = [ 1.5 2 ] . Se pueden representar gráficamente de la misma forma que con Col(A).

ingrese la descripción de la imagen aquí

Básicamente, el determinante es el área creada por el paralelogramo definido por los vectores de fila (el vector de columna genera la misma área, pero por convención usemos los vectores de fila). En la imagen está representado por el paralelogramo azul. Entonces, área de paralelogramo = D mi t mi r metro i norte a norte t ( A ) = D mi t ( A ) .

Entonces, ¿cómo podemos calcular esta área? Para comprender esta parte, debe tener conocimientos básicos en "operaciones de fila" y "área de un paralelogramo".

Llamemos " r 1 "la primera fila y" r 2 " la segunda fila. Una de las operaciones básicas de fila consiste en agregar a una fila otra fila escalada. Así que imagina una fila operando en r 1 como r 1 = r 1 + k r 2 , k cualquier número real. No se desespere si no entiende por qué estamos operando en fila, las cosas se aclararán de inmediato.

Entonces, llamemos a B la nueva matriz generada después de reemplazar r 1 por r 1 + k r 2 . Entonces, r 1 entre comillas va a ser la versión transformada de r 1 . ¿Qué pasaría con Row(A) y con Det(A)? Vea lo que sucede con Row(B) y Det(B) cuando cambiamos r 1 a r 1 = r 1 + k r 2 con diferentes valores para k :

Entonces, podemos ver que r 1 se mueve paralelo a r 2 lo cual es obvio porque estamos agregando una versión escalada de r 2 a r 1 .

Suponiendo que tiene conocimiento en "áreas de paralelogramo", puede verificar que la base y la altura no cambian. Eso significa que el área se mantiene constante al agregar una fila escalada a otra fila porque no cambiamos la altura porque nunca nos movemos en paralelo. Así Det(A)=Det(B) .

Así que aquí viene la PARTE MÁGICA , deberíamos encontrar un k tal que eliminamos la componente y de r 1 vector fila (componente y = A 12 = 0 ). Así que aplicando la operación de fila con k = 1 2 tal que A 12 = 0 , la matriz transformada sería:

[ 3 1 1.5 2 ] r 1 1 2 r 2 [ 2.25 0 1.5 2 ]

Entonces nuestra matriz B tiene una forma triangular, Row(B) se ve así:

ingrese la descripción de la imagen aquí

Ahora tenemos un paralelogramo con base de longitud = 2.25 y altura longitud = 2 . Así, por definición de área de paralelogramo, tenemos que D mi t ( A ) = D mi t ( B ) = 2.25 2 = 4.5 . Entonces, el determinante es solo el producto de los elementos diagonales de la forma de matriz triangular, lo llamamos forma escalonada. MAGIA

Podríamos buscar un rectángulo que tenga la misma área que Det(A) repitiendo este proceso pero esta vez aplicando la operación de fila a r 2 tal que eliminamos su componente x (componente x = A 21 = 0 ) tal que obtenemos un rectángulo con área Det(B) que tiene el área equivalente a Det(A), pero esto es completamente innecesario ya que no cambia la base y la altura del paralelogramo. De todos modos para la intuición de este proceso. r 2 = r 2 + k r 1 se vería como:

Entonces k = 2 3 0,66 .

[ 2.25 0 1.5 2 ] r 2 2 3 r 1 [ 2.25 0 0 2 ]

Tenemos que la base es 2.25 y la altura es 2 , entonces el área del rectángulo es D mi t ( B ) = 4.5 = D mi t ( A ) . El determinante es simplemente el producto de los elementos diagonales de la matriz diagonal.

Así que hemos visto que el producto de los elementos diagonales de una matriz convertida en forma triangular nos da el determinante de la matriz. ¿Por qué forma triangular? Imaginar X i siendo el i dimensión, por lo que cada vector de fila en forma escalonada de la matriz agrega un nuevo componente a la i dimensión, por lo que en términos geométricos agrega una altura a la dimensión.

La gran idea de esta técnica es que se puede aplicar a cualquier n-dimensión y mantiene la intuición de lo que estás haciendo. Me gustaría presentar la prueba gráfica en 3D pero sería mucho trabajo que creo que podrías hacer con un poco de imaginación. La idea es que al agregar una versión a escala de un vector a otro vector, te estás moviendo paralelo al hiperplano donde se encuentra ese vector, por lo que la altura no se modifica.

Intento hacer un proceso intuitivo y geométrico usando esta Bibliografía:

Buen trabajo y animación más intuitiva para operaciones elementales de fila/columna.
The determinant of a matrix gives the signed volume of the parallelepiped
that is generated by the vectors given by the matrix columns.

Puede encontrar una discusión muy pedagógica en la página 16 de

Una introducción visual a formas diferenciales y cálculo en variedades Fortney, JP

enlace del libro de Google, haga clic en "1 material de fondo"

Dado un paralelepípedo cuyas aristas están dadas por v 1 , v 2 , , v norte R norte . Entonces si aceptas estas 3 propiedades:

  1. D ( I ) = 1 , dónde I = [ mi 1 , mi 2 , , mi norte ] (matriz de identidad)
  2. D ( v 1 , v 2 , , v norte ) = 0 si v i = v j para cualquier i j
  3. D es lineal,
    j ,   D ( v 1 , , v j 1 , v + C w , v j + 1 , , v norte ) = D ( v 1 , , v j 1 , v , v j + 1 , , v norte ) + C D ( v 1 , , v j 1 , w , v j + 1 , , v norte )

puedes demostrar eso D es el volumen con signo paralelepípedo y que D es el determinante.

Dejar A 1 , , A norte F norte ser linealmente independiente (y por lo tanto una base). Así que para cualquier b F norte , existen únicos X 1 , , X norte con X 1 A 1 + + X norte A norte = b .
Pero no está claro cuáles son los valores explícitos de X i s (en términos de A i arena b ) son.

Para cualquier mapa lineal T : F norte F , X 1 T ( A 1 ) + + X norte T ( A norte ) = T ( b ) .
Entonces, si podemos especificar (explícitamente) un mapa lineal T 1 : F norte F con T 1 ( A 2 ) = = T 1 ( A norte ) = 0 y T 1 ( A 1 ) 0 , X 1 se puede calcular como X 1 = T 1 ( b ) T 1 ( A 1 ) .
En general, si especificamos mapas lineales T 1 , , T norte : F norte F con T i ( A j ) = 0 para i j y T i ( A i ) 0 , el X i s se puede calcular como X i = T i ( b ) T i ( A i ) .

Entonces, si de alguna manera construimos un mapa multilineal F : F norte × × F norte F donde) F ( v 1 , , v norte ) = 0 si dos argumentos cualesquiera son iguales, y ii) F ( v 1 , , v norte ) 0 cuando sea v 1 , , v norte son linealmente independientes, habremos terminado

Tomando T j : F norte F ,

  T j ( v ) = F ( A 1 , , v j t h  posición , , A norte ) .


Resulta que tal construcción es posible y única hasta la multiplicación por escalares distintos de cero. Sujeto a la restricción de normalización F ( mi 1 , , mi norte ) = 1 , obtenemos un mapa único, llamado determinante.