Saltar al contenido

¿Por qué definimos la matriz de cambio de base como la transpuesta de la transformación?

Posterior a de una larga búsqueda de datos hemos podido solucionar esta interrogante que suelen tener muchos de nuestros lectores. Te compartimos la respuesta y nuestro objetivo es servirte de gran ayuda.

Solución:

Esta es una buena pregunta. Puede ser reconfortante saber que siempre hay algunas elecciones arbitrarias involucradas en todo el asunto de representar vectores de un espacio vectorial abstracto como un array de números, mapas lineales como un doble array de números (matrices) y lo que se entiende por cambiar una base. Lo más importante es establecer una notación que minimice el número de opciones arbitrarias y sea autoconsistente.

Déjame tratar de explicar la motivación detrás de la notación más popular y luego reconsiderar tu ejemplo. Fija un espacio vectorial $V$ y deja que $mathcalB = (v_1, dots, v_n)$ sea alguna base de $V$. La base $mathcalB$ nos permite identificar un vector $v in V$ con una lista de escalares representando $v$ (únicamente) como $v = a_1 v_1 + dots + v_n a_n$ e identificando $ v$ con la lista $(a_1,dots,a_n)$ que se llama las coordenadas de $v$ con respecto a $mathcalB$. Él convención es que tratamos esta lista como una columna vector y escribir

$$ [v]_ mathcalB := beginpmatrix a_1 \ vdots \ a_n endpmatrix. $$

Dado un mapa lineal $T colon V rightarrow W$, una base $mathcalB = (v_1,dots,v_n)$ de $V$ y una base $mathcalC = (w_1, dots,w_m)$ de $W$, podemos representar cada vector $T(v_i)$ como una combinación lineal $T(v_j) = sum_i=1^m a_ij w_i$. Él convención es que tratamos a los array $A = (a_ij)$ como doble array (que llamamos matriz) para la cual $i$ es el índice de fila y $j$ es el índice de columna. La matriz $A in M_m times n(mathbbF)$ se denota por $A = [T]^mathcalB_mathcalC$ y se llama la matriz que representa $T$ con respecto a la base $mathcalB$ (del dominio) y la base $mathcal C$ (del codominio). Esta convención tiene la característica ligeramente molesta (especialmente para los principiantes) de que un mapa lineal de un espacio de $n$ dimensiones a un espacio de $m$ dimensiones está representado por una matriz $m times n$ (por lo que las dimensiones están “invertidas”). “), pero su ventaja más importante es que identifica la multiplicación de matrices y la composición/evaluación. Es decir, tenemos las siguientes fórmulas:

$$ [T(v)]_ mathcalC = [T]^mathcalB_mathcalC cdot [v]_mathcalB, ,,, [T circ S]^mathcalB_mathcalD = [T]^mathcalC_mathcalD cdot [S]_mathcalC^mathcalB $$

donde $cdot$ es la multiplicación de matrices.

Finalmente, analicemos las matrices de cambio de base. Si $mathcalB = (u_1,dots,u_n)$ y $mathcalB’ = (v_1,dots,v_n)$ son dos bases de $V$, la matriz de cambio de base “de $mathcalB’$ a $mathcalB$” es la matriz $P = [operatornameid]_ mathcalB^mathcalB’$ donde $operatornameid colon V rightarrow V$ es la transformación de identidad. Usando las propiedades anteriores, vemos que tenemos

$$ P[v]_mathcalB’ = [operatornameid]_mathcalB^mathcalB’ [v]_mathcalB’ = [v]_ mathcalB. $$

Así, dada la coordenadas un vector $v in V$ en la “nueva base” $mathcalB’$, la matriz $P$ nos permite calcular las coordenadas de $v$ en la “vieja base” $mathcalB $ realizando la multiplicación de matrices. La decisión de qué base llamar “la antigua” y cuál “la nueva” no es del todo estándar y depende de si prefiere cambiar los vectores base o las coordenadas. En física, esto está relacionado con el punto de vista “pasivo frente a activo” de las transformaciones lineales.


Finalmente, déjame reconsiderar tu ejemplo. Tenemos $V = mathbbR^2$, $mathcalB = (u_1 = (1,2),u_2 = (3,5))$ y $mathcalB’ = (v_1 = (1,-1), v_2 = (1,2))$. Al representar elementos en la base $mathcalB$, usaré la letra $a$ y al escribir elementos en la base $mathcalB’$ usaré la letra $b$ para los coeficientes . Es decir,

$$ v = a_1 u_1 + a_2 u_2 = b_1 v_1 + b_2 v_2. $$

La matriz $P$ tiene la característica de que

$$ P beginpmatrix b_1 \ b_2 endpmatrix = beginpmatrix a_1 \ a_2 endpmatrix $$

y así te dice cómo transformar las coordenadas de un vector arbitrario en la base $mathcalB’$ a sus coordenadas en la base $mathcalB$. Por ejemplo, si

$$ v = 1 cdot v_1 + 1 cdot v_2 = 1 cdot (-8u_1 + 3u_2) + 1 cdot (-11u_1 + 4u_2) = -19 u_1 + 7 u_2 $$

tenemos

$$ [v]_mathcalB = beginpmatrix -19 \ 7 endpmatrix, ,,, [v]_ mathcalB’ = beginpmatrix 1 \ 1 endpmatrix, \ beginpmatrix -8 && -11 \ 3 && 4 endpmatrix begin pmatrix 1 \ 1 endpmatrix = beginpmatrix -8 && -11 \ 3 && 4 endpmatrix [v]_ mathcalB’ = beginpmatrix -19 \ 7 endpmatrix = [v]_ mathcalB. $$

Cuando una transformación de base, o de coordenadas, está en acción, entonces no estamos tan interesados ​​en cómo se definen los nuevos vectores de base (esto se trata al principio), pero necesitamos transformar las coordenadas de los vectores mil veces. Por lo tanto, las cosas se configuran de tal manera que las fórmulas para la transformación de coordenadas sean lo más simples posible.

Una segunda cosa: según la definición de la multiplicación de matrices, las matrices deberían operar, respectivamente, se multiplican con, tuplas de números, y no tuplas de vectores. Pero en la configuración que propones, este último es el caso.

valoraciones y comentarios

Te invitamos a añadir valor a nuestro contenido asistiendo con tu experiencia en las notas.

¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)



Utiliza Nuestro Buscador

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *