Matrices con una indexación más general que por enteros

Una matriz generalmente se entiende como una matriz rectangular de objetos (en su mayoría números de parte) dispuestos en filas y columnas. Si los objetos pertenecen a un conjunto S , entonces se puede escribir METRO ( metro , norte ; S ) para el conjunto de ( metro × norte ) -matrices A con entradas en S . Tal matriz A tiene metro filas y norte columnas la entrada de A ocurriendo en fila i y columna j a menudo se denota como a i j y uno escribe A = ( a i j ) .

En álgebra lineal se utilizan matrices para representar mapas lineales F : V W entre espacios vectoriales de dimensión finita V , W con respecto a las bases V = { v 1 , , v norte } de V y W = { w 1 , , w metro } de W . Tenemos F ( v j ) = i = 1 metro a i j w i con único a i j y por lo tanto F ( j = 1 norte λ j v j ) = j = 1 norte λ j F ( v j ) = i , j λ j a i j w i . El ( metro × norte ) -matriz ( a i j ) es la representación matricial de F con respecto a V , W .

Para tales representaciones matriciales, trabajamos solo con bases indexadas por conjuntos de la forma especial I k = { 1 , , k } . Aquí está mi pregunta:

¿ No sería más flexible permitir conjuntos de índices finitos arbitrarios ? Es decir, para considerar conjuntos de matrices de la forma METRO ( I , j ; S ) = S I × j con conjuntos finitos arbitrarios I , j . una matriz A METRO ( I , j ; S ) es entonces una colección indexada A = ( a ( i , j ) ) S I × j . Todavía podemos considerarlo como una serie rectangular de objetos de S ordenados en filas y columnas, aunque estos no tienen números de fila y números de columna enteros .
Por supuesto, este concepto no es una gran innovación. Pero, ¿ocurre en alguna parte de la literatura?

Esta pregunta fue motivada por las respuestas a la regla de la cadena para que la diferenciación produzca dimensiones conflictivas . La pregunta trata con una función de valor matricial. F : R METRO ( norte , norte ; R ) . Claramente METRO ( norte , norte ; R ) es isomorfo a R norte 2 , pero no tiene una base canónica indexada por { 1 , norte 2 } . En cambio, tiene una base natural que consiste en las matrices ( mi i j ) METRO ( norte , norte ; R ) donde el mi i j tener una entrada 1 en fila i y columna j , siendo todas las demás entradas 0 . El conjunto índice de esta base natural es I metro , norte = { 1 , , metro } × { 1 , , norte } . Al considerar la derivada D F X en X R , que naturalmente es un mapa lineal R METRO ( norte , norte ; R ) , las respuestas mencionadas están dando vueltas diciendo que tenemos que "aplanar matrices" o "identificar METRO ( norte , norte ; R ) con R norte 2 " para obtener una matriz en METRO ( norte 2 , 1 ; R ) . Uno puede hacer esto, pero creo que es innecesario e incluso puede causar confusión (el OP de la pregunta anterior parece confundirse) METRO ( norte 2 , 1 ; R ) con METRO ( norte , norte ; R ) al aplanar D F X ) ). En mi opinión es mucho más transparente decir que el jacobiano de F en X es una matriz en METRO ( I metro , norte , 1 ; R ) .

La respuesta en sí. Y para agregar a la respuesta de Andrew, el buen orden de estos índices es lo que es realmente importante. Además, puede tomar matrices que son infinitas usando ordinales (vea como ejemplo, la Matriz Ulam).

Respuestas (2)

Brevemente, tiene razón sobre la utilidad de los conjuntos de índices arbitrarios; podría decirse que, de hecho, las exposiciones estándar de álgebra lineal hacen exactamente lo que usted sugiere.[1] Pero para mí, el mayor escollo no es indexar por números enteros versus indexar por conjuntos finitos: el problema es que los conjuntos de índices en álgebra lineal están ordenados aunque pocos libros lo noten explícitamente.

Cuando hablamos de bases en álgebra lineal, siempre[2] nos referimos a bases ordenadas . En otra notación, el conjunto índice de un vector o de una base de un espacio vectorial de dimensión finita no es el conjunto desordenado { 1 , , norte } (digamos), pero el conjunto ordenado ( 1 , , norte ) . Cuando representamos una transformación lineal como una matriz, el orden de las bases es crucial.

Cualquier conversación sobre "aplanar" una matriz a una columna fija implícitamente una biyección de { 1 , , metro } × { 1 , , norte } a ( 1 , , metro norte ) , es decir, una ordenación del conjunto de doble índice.


Nota 1. Un poco tangencialmente, hay una perspectiva en el álgebra lineal real donde los vectores son funciones de valor real en un conjunto de índices. Esto se extiende, por ejemplo, a los operadores integrales, donde

T F ( X ) = k ( X , y ) F ( y ) d y
es una analogía directa a la fórmula de multiplicación de matrices y i = j a j i X j .

Nota 2. Hay instancias en las que el orden es irrelevante, como cuando se habla de intervalos, pero en muchas más instancias, como el acto de escribir vectores y matrices como matrices, orientación y determinantes, donde el orden es importante pero no se dice o no se dice a medias. dicho.

¡Gracias por su respuesta! Por supuesto, si escribimos explícitamente vectores de V a través de sus coordenadas con respecto a una base V , con mayor frecuencia hacemos esto en forma de vectores de columna (o alternativamente fila) en k norte . Esta representación vectorial se basa en la elección de una ordenación de los vectores base, es decir, en la elección de una biyección { 1 , , norte } V . Lo mismo ocurre con las representaciones matriciales de mapas lineales cuando queremos escribirlos explícitamente como matrices rectangulares en una hoja de papel. Sin embargo pienso que a nivel conceptual ordenamientos de bases
no juegues un papel aquí, siempre podemos escribir de manera abstracta ( λ v ) v V para v V λ v v . En algunos casos, esto incluso tiene perfecto sentido para escribir vectores concretos con sus valores numéricos. Por ejemplo, los vectores de METRO ( metro , norte ; R ) se escriben por definición como matrices (y no como vectores de columna o fila) sin elegir una biyección definida { 1 , , metro } × { 1 , , norte } ( 1 , , metro norte ) . Por lo tanto, ambas perspectivas son útiles y deben presentarse en los libros de texto.
Por cierto, creo que esto está relacionado de alguna manera con mi pregunta math.stackexchange.com/q/4290850 donde esencialmente afirmé que en nuestro "mundo mental" el concepto de tupla ordenada precede al de un conjunto (desordenado) .

Decidí escribir un comentario extenso en forma de wiki de la comunidad a la excelente respuesta de Andrew D. Hwang. Solo considero el caso de dimensión finita, aunque hay análogos para la dimensión infinita.

El "problema de indexación" surge ya en el nivel de representación de vectores de un espacio vectorial de dimensión finita V a través de sus coordenadas con respecto a una base V de V . una base de V generalmente se define como un subconjunto V V que es linealmente independiente y genera V . En la mayoría de las definiciones V se escribe en forma { v 1 , , v norte } . Esto dice implícitamente que en realidad consideramos bases ordenadas que son secuencias ordenadas finitas ( v 1 , , v norte ) en lugar de conjuntos finitos (desordenados) . En otras palabras, elegimos un bijecton I norte = { 1 , , norte } V para que los enteros i = 1 , , norte se utilizan para indexar los elementos de V . Esto parece bastante natural porque escribir explícitamente los elementos de V se suele hacer en forma de lista, es decir, en forma de disposición secuencial lineal (ya sea de izquierda a derecha o de arriba hacia abajo).

En mi opinión, trabajar con bases ordenadas es conceptualmente innecesario para la mayoría de los propósitos del álgebra lineal. Una excepción es el concepto de orientación . De hecho, cada elemento X V Se puede escribir como X = v V X v v con único X v k . En otras palabras, cuando se trabaja con una base V podemos evitar la identificación V k norte y usamos el isomorfismo canónico V k V . Es decir, la representación coordinada de X con respecto a V se escribe de forma abstracta como ( X v ) v V y no como ( X i ) i I norte .

El problema aquí es que si queremos escribir explícitamente ( X v ) v V para valores numéricos concretos de la X v , entonces tenemos que acordar un patrón de arreglo definido para el X v en una hoja de papel que permite identificar el índice v desde la posición del elemento X v k en el patrón de arreglo. La forma habitual es, por supuesto, hacerlo en forma de un arreglo secuencial lineal , ya sea de izquierda a derecha, dando vectores de fila, o de arriba hacia abajo, dando vectores de columna. Esto no es más que la elección de una biyección I norte V . Sin embargo, también podríamos acordar organizar el X v en norte posiciones de un círculo (que requiere especificar una función de V al círculo). En algunos casos incluso tenemos un patrón de disposición no lineal por definición de V . Este es el caso de V = METRO ( metro , norte ; k ) . Este espacio vectorial tiene una base canónica en forma de mi i j (ver la pregunta). La representación de coordenadas de una matriz. A con respecto a esta base se escribe naturalmente en un patrón matricial que nos da nuevamente A . Por supuesto que podemos aplanarlo, pero esto sería antinatural y arbitrario.