CAPÍTULO Inversa generalizada e inversa condicional de matrices Este capítulo consta de cuatro secciones Las dos primeras versan sobre la definición, propiedades y cálculo de la inversa generalizada de una matriz La tercera sección trata sobre la definición y el cálculo de inversas condicionales de una matriz En la última sección se verán algunas aplicaciones de la inversa generalizada y de la inversa condicional de una matriz a los sistemas de ecuaciones lineales y a los problemas de mínimos cuadrados Inversa generalizada de una matriz La inversa generalizada de una matriz es una herramienta de gran utilidad en los cursos de modelos lineales (véase la sección de []) Antes de dar la definición de inversas generalizada de una matriz, veamos un par de teoremas que serán útiles en el desarrollo del resto del capítulo Teorema Si A es una matriz m n de rango r > 0 entonces existen matrices invertibles P m m y Q n n tales que P AQ es igual a: Ir si r < n y r < m Ir si r = n < m ˆ I r si r = m < n I r si r = n = m Demostración Se hará aquí sólo la demostración del inciso () Si R es la forma escalonada reducida de A entonces R = P A P es un producto de matrices elementales, (véase el apartado ) Las últimas m r filas de R son nulas y R tienen la estructura siguiente: 6 0 0 a k 0 a k a k 0 a k 0 0 0 0 a k a k 0 a k 0 0 0 0 0 0 0 a k 0 0 0 0 0 0 0 0 0 ahora bien, efectuando las operaciones elementales sobre las columnas de la matriz R se obtiene 99
G-Inversa y C-inversa Inversa generalizada e inversa condicional Ir F = Así que F = RQ donde Q es un producto de marices elementales (por columnas) Por lo tanto; F = RQ = P AQ, donde P y Q son matrices invertibles Ejemplo Considere la matriz A = 0 6 claramente las dos primeras filas son linealmente independientes, y la tercera es un múltiplo escalar de la primera fila de A por lo tanto, el número máximo de filas linealmente independientes de A es ; o sea, A tiene rango Por el teorema anterior existen matrices invertibles P y Q tales que I P AQ = = 0 0 0 0 0 0 0 0 0 0 Ahora se procede a calcular las matrices invertibles P y Q siguiendo las pautas de la demostración del teorema anterior Paso : Se encuentra una matriz invertible P tal que P A = R, donde R es la forma escalonada reducida de A [ A I ] = filas filas 0 0 0 0 0 6 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 = [ R P ] Paso : Se encuentra una matriz invertible Q tal que RQ = F donde I F = 00
Inversa generalizada e inversa condicional G-Inversa y C-inversa [ R I ] = col col col 6 6 6 6 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 = [ F Q ] Las matrices invertibles son tales que: P = 0 0 0 0 I P AQ = y Q = 6 = 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Teorema Si A es una matriz m n de rango r > 0 entonces existen matrices B m r y C r n, de rango r, tales que A = B C Demostración Considere distintas posibilidades para rango de la matriz A, ρa) = r Si r = m entonces A = BC, donde B = I r y C = A Si r = n entonces A = BC, donde B = A y C = I r Si r < n y r < m entonces por el teorema () existen matrices invertibles P y Q tales que: Ir P AQ = De aquí que: A = P Ir Q ˆ Ir Q = P Ir = BC 0
G-Inversa y C-inversa Inversa generalizada e inversa condicional donde B m r y C r n son las matrices de rango r, dadas por B = P Ir y C = ˆ I r Q El teorema queda entonces demostrado Una forma de calcular las matrices B y C que aparecen en el teorema anterior, en el caso en que r < n y r < m tal como aparece en la demostración, es calculando primero las matrices invertibles P y Q tales que: Ir P AQ = después calcular las matrices P y Q, y por último obtener: B = P Ir y C = ˆ I r Q Para el caso en que la matriz A no sea de rango fila completo, existe una demostración alternativa, la cual presentamos a continuación Como veremos, esta demostración facilitará un algoritmo más económico para calcular matrices B y C adecuadas Demostración [Otra prueba del teorema para r < m] Suponga que A es una matriz de rango r < m Sea P una matriz invertible de orden m tal que P A = R, donde R es la forma escalonada reducida de A (véase apartado ) Puesto que r < m, R tiene la estructura siguiente: C R = donde C es una matriz r n de rango r Ahora, si escribimos P particionada adecuadamente P = ˆ B D donde B es una matriz m r de rango r Dado que P A = R se tiene A = P R = ˆ B D C = BC Ahora se presenta a continuación un método basado en esta demostración para calcular matrices B y C, de rango r tales que A = BC Algoritmo Considere una matriz A de tamaño m n Paso Forme la matriz [ A m n I m] Paso Efectúe operaciones elementales en las filas de A hasta obtener su forma escalonada reducida, y en las columnas de I m, siguiendo las siguientes pautas: i) Si se intercambian las filas i y j de A entonces intercambie las columnas i y j de I m ii) Si se multiplica la i-ésima fila de A por el número α = 0, entonces se multiplica la i-ésima columna de I m por el número α 0
Inversa generalizada e inversa condicional G-Inversa y C-inversa iii) Si a la j-ésima fila de A se le suma α veces la i-ésima fila de A (α = 0), entonces a la i-ésima columna de I m se le suma α) veces la j-ésima columna de I m Al final de este paso se obtiene la matriz [ R P ] Paso B = ˆPrimeras r columnas de P, C = [Primeras r filas de R] Ejemplo La matriz del ejemplo A = 0 6 tiene rango Existen por lo tanto matrices B y C de rango tales que A = BC Las matrices B y C se pueden ahora calcular siguiendo los pasos indicados anteriormente 0 0 [ A I ] = 0 0 0 6 0 0 0 0 0 0 0 0 0 0 0 0 = [ R P ] Así, tomando las primeras columnas de R y las primeras filas de P se obtiene respectivamente las matrices B = 0 0 y C = 0 0 las cuales tienen rango y son tales que: BC = = 0 0 6 0 0 0 = A 6 Definición (Inversa generalizada o pseudoinversa) Sea A una matriz m n Si M es una matriz n m tal que: AM es una matriz simétrica MA es una matriz simétrica AMA = A MAM = M entonces se dice que M es una inversa generalizada (pseudoinversa) de A o simplemente que M es una g-inversa de A Ejemplo Verifique que la matriz M = es una g-inversa de la matriz A = 0 En efecto, 0
G-Inversa y C-inversa Inversa generalizada e inversa condicional AM = 0 0 MA = AMA = I A = A 0 0 MAM = MI = 8 Observación = I es una matriz simétrica es una matriz simétrica Si A es invertible, entonces la matriz A es una g-inversa de A Si A = m n entonces la matriz M = n m es una g-inversa de A 9 Teorema (Existencia de una g-inversa) Toda matriz A de tamaño m n tiene una inversa generalizada Demostración De acuerdo con la observación 8(), la demostración es trivial en el caso en que A = Suponga ahora que que A = tiene rango r > 0 Por el teorema, existen matrices B de tamaño m r y C de tamaño r n, ambas de rango r tales que A = BC Puesto que B y C tiene rango r, las matrices B T B y CC T son invertibles (véase el teorema 6) Finalmente, se considera la matriz M = C T `CC T `BT B B T El resultado quedará comprobado, se se verifica que M es una g-inversa de A Es decir, si se verifica que se satisfacen las condiciones de la definición 6 En efecto: Las matrices AM y MA son simétricas puesto que y AM = BCC T `CC T `BT B B T = B`B T B B T MA = C T `CC T `BT B B T BC = C T `CC T C De otro lado, AMA = B `B T B B T BC = BC = A y MAM = C T `CC T CC T `CC T `BT B B T = C T `CC T `BT B B T = M Es decir, AMA = A y MAM = A, por lo tanto, M es una g-inversa de A 0 Teorema [Unicidad de la g-inversa]toda matriz A tiene una única g-inversa Demostración Supongamos que M y M son dos g-inversas de una matriz A Utilizando la definición de g-inversa de una matriz se obtiene la cadena siguiente de igualdades: AM = AM A)M = AM )AM ) = AM ) T AM ) T = AM )AM )) T = AM A)M ) T = AM ) T = AM De aquí que AM = AM En forma análoga se obtiene que M A = M A Por lo tanto M = M AM = M A)M = M A)M = M AM ) = M AM ) = M AM = M 0
Inversa generalizada e inversa condicional G-Inversa y C-inversa Nota En lo sucesivo, la g-inversa de una matriz la se denotará con el nombre de la matriz y con el signo + como exponente Por ejemplo, por A + B + denotarán respectivamente las inversas generalizadas de las matrices A y B Teorema (Propiedades de la g-inversa) Para cualquier matriz A tiene que: a) A + ) + = A b) αa) + = α A + para todo escalar α = 0 c) A T ) + = A + ) T d) AA T ) + = A T ) + A + e) A T A) + = A + A T ) + Demostración Por el teorema anterior, toda matriz tiene una única g-inversa Sólo resta verificar en cada caso, que se satisfacen las condiciones de la definición 6 Para ello se hará la demostración sólo para el inciso (e) suponiendo, que las afirmaciones (a)-(d) son válidas (las verificaciones quedan a cargo del lector) y se aplicarán las propiedades de la definición 6: Inicialmente se verifica que la matriz `A A `A T + A T ) + es simétrica, para ello se muestra que para la matriz M = A + A T ) + se satisface la igualdad `A A T M = A + A En efecto: A T A M = A T A A + A T ) + c) = A T AA + )A + ) T def = A T AA + ) T A + ) T = `A + AA + A + T def = `A + A T = A + A Ahora se verifica que la matriz `A + A T ) + `A A T es simétrica, para ello muestra como antes, de que la matriz M = A + A T ) + satisface la igualdad M `A A T = A + A En efecto: M A T A = A + A T ) + A T A c) = A + A + ) T A T A def = A + AA + ) T A def = A + AA + A def = A + A La matriz M = A + A T ) + satisface la igualdad A T A)MA T A) = A T A A T A)MA T A) = A T A A + A T ) + A T A ) = `A + A A T A = A + A) T A T A = `AA + A) T A def = `AA + A T A = A T A 0
G-Inversa y C-inversa Inversa generalizada e inversa condicional La matriz M = A + A T ) + satisface la igualdad MA T A)M = M En efecto MA T A)M = M = A + A T ) + A T A A + A T ) + ) = `A + A A + A T ) + = `A + AA + A T + def = A + A T ) + Observación No siempre es cierto que AB) + = B + A + Para mostrar este hecho basta considerar un ejemplo (ver ejemplo siguiente) Ejemplo Si A = ˆ y B = entonces AB = [] Por lo tanto AB) + = / De acuerdo ˆ con el corolario 6, A + = y B + =, de donde se tiene que B + A + = ˆ = 0 [] = [/0] = [] = AB)+ Ejercicios En los ejercicios al 9, responda verdadero o falso justificando su respuesta Si las matrices B m r y C r m tienen el mismo rango, entonces BC) + = C + B + Si S es una matriz simétrica, entonces S + es una matriz simétrica Si S es una matriz simétrica tal que S = S entonces S + = S Si S es una matriz simétrica tal que S = S entonces S + = S Para toda matriz A se tiene que A + = A T A) + A T 6 Para toda matriz A se tiene que A + = A T AA T ) + Para toda matriz A se tiene que AA + ) = AA + y A + A) = A + A 8 Si A m n tiene rango m entonces el sistema de ecuaciones lineales Ax = y tiene solución para cualquier y m 9 Si A m n tiene rango n y si el sistema de ecuaciones lineales Ax = y tiene solución, entonces el sistema tiene solución única En los ejercicios 0 al demuestre la afirmación correspondiente 0 Si BC T =, entonces BC + = y CB + = B Si A = y BC T = entonces A + = ˆ B + C + C Si B es una matriz simétrica m m y si C T B = donde C T es la matriz C =ˆ T entonces la g-inversa de la matriz: B A = C T es A + = ˆ B + /m C m 06
Inversa generalizada e inversa condicional Cálculo de la g-inversa Si D = [d ij] n n es una matriz diagonal, entonces D + =[a ij] n n es una matriz diagonal, donde ( /d ii, si d ii = 0 a ij = 0 si d ii = 0 B B Si A = entonces A + + = C C + Si S es una matriz simétrica, entonces SS + = S + S 6 Si A es una matriz tal que A T A = AA T entonces A + A = AA + Si A es una matriz m n, donde A ij = para i = m y j = n entonces A + = mn A 8 Si P n n y Q m m son matices ortogonales, entonces para cualquier matriz m n A, se tiene que P AQ) + = Q T A + P T 9 Si S es una matriz simétrica no negativa, entonces S + es una matriz no negativa 0 Para cada matriz m n A; AB = AA + sii B es tal que ABA = A y AB es simétrica Si B es una c-inversa de A entonces la matriz BAB también lo es Cálculo de la g-inversa de una matriz En esta sección se verán algunos teoremas que pueden usarse para calcular la g-inversa de una matriz Empezamos con el siguiente resultado, el cual se deduce de los teoremas, 9 y 0 Teorema Sea A una matriz m n de rango r > 0 Si r = n = m, entonces A es invertible y A + = A Si r = m < n, entonces A + = A T `AA T Si r = n < m, entonces A + = `A T A A T Si r < n y r < m, entonces existen matrices B m r y C r n de rango r tales que A = B C y A + = C T `CC T `BT B B T 6 Corolario Sea a un vector no nulo de n componentes Si a n entonces a + = `aa T a T Si a n entonces a + = `a T a a T Ejemplo Ilustre el teorema con alguna matrices sencillas La matriz A = La matriz A = es invertible, así que A + = A = tiene rango, así que: A + = A T `AA T = = 6 9 0 0 0
Cálculo de la g-inversa Inversa generalizada e inversa condicional La matriz A = 6 La matriz A dada por tiene rango, así que: A + = `A T A A T = 6 = 8 6 6 8 0 A = 0 6 6 Del ejemplo se sabe ρa) = y que las matrices B = 0 0 y C = 0 0 son tales que A = BC Luego A + = C T `CC T `BT B B T = 6 0 0 8 9 8 0 Para la matriz A = ˆ = se tiene que: a + = aa T a T = 6 La matriz A = = se tiene que, a + = a T a a T = ˆ 8 Teorema Sea A m n una matriz de rango r > 0 Entonces la g-inversa de A se puede calcular siguiendo los pasos dados a continuación: Calcule M = A T A Haga C = I Calcule C i+ = TrCiM)I CiM para i = r i r Calcule Tr C rm) CrAT ésta es la matriz A + Además, se tiene que C r+m = y Tr C rm) = 0 Para la demostración de este teorema, remitimos al lector a [] (teorema 68) Obsérvese además, que la condición C r+m = permite proceder sin conocer de antemano el rango de A 08
Inversa generalizada e inversa condicional Cálculo de la g-inversa 9 Ejemplo Considere la matriz A = 0 6 del ejemplo () Calcule A + utilizando el teorema anterior Para ello se puede calcualar M = A t A Esto es, M = 6 y considere C = I Entonces se tiene que: C = Tr C M) I C M = 6 Como C M = entonces ρa) = y además A + = 6 0 0 9 Tr C M) CAT = 0 8 60 0 0 9 6 0 0 8 9 8 0 El siguiente teorema presenta una forma alternativa para calcular la g-inversa de una matriz Para su demostración, remitimos a [9] (véase páginas -) 0 Teorema Sea A m n una matriz de rango r > 0 La g-inversa de A se puede calcular mediante los siguientes pasos: Forme la matriz [ A I m ] Efectúe operaciones elementales en las filas de la matriz anterior hasta conseguir la forma escalonada reducida de A Al final de este paso se obtiene una matriz que descrita por bloques queda así: ó E r n m r) n P r m P m r) m ˆ Em n P m m si r < m si r = m (Si r = m = n A es invertible, E = I y P = A = A + ) Forme la matriz: Er na T E r n si ó P m r) m m r) n ˆ Em na T E m n r < m si r = m Efectúe operaciones elementales en las filas de la matriz anterior hasta conseguir la forma escalonada reducida Al final de este paso se obtiene la matriz h i `A+ T I m 09
Cálculo de la g-inversa Inversa generalizada e inversa condicional Ejemplo Considere de nuevo la matriz A del ejemplo 9 A = 0 6 Con el objeto de calcular A + utilizando el teorema anterior, se forma la matriz ˆ A I y se aplican operaciones elementales en las filas hasta encontrar la forma escalonada reducida de A [ A I ] = = 0 0 0 0 0 6 0 0 0 0 0 0 0 0 0 0 0 0 0 E P P Se construye ahora la matriz de la forma E A T E P y se aplican de nuevo operaciones elementales en las filas, hasta obtener la matriz identidad I en el lado izquierdo de este arreglo E A T E 9 0 = 8 0 0 P 0 0 0 0 0 = 0 0 0 0 6 0 0 h i I A + ) T 9 0 9 Así que A + = 6 9 0 9 = 6 0 0 0 8 9 8 0 0
Inversa generalizada e inversa condicional Cálculo de la g-inversa Ejemplo Considere la matriz A del ejemplo () A = y siga los pasos del ejemplo anterior (teorema 0) para calcular A + [ A I ] = 0 0 0 0 = ˆ E P Se construye ahora la matriz ˆ E A T E y se reduce para obtener ˆ E A T E = = 6 6 0 0 0 0 h i I A + ) T Así que A + = 6 = 6 6 9 Ejercicios Para cualquier matriz A se tiene que: ρa) = ρa + ) = ρaa + )= ρa + A) Calcule la g-inversa de cada una de las matrices siguientes: i) A = ˆ 0 0 0 ii) A = iii) A = ˆ iv) A =
C-inversa Inversa generalizada e inversa condicional v) A = vii) A = 6 ix) A 9 = 6 0 0 0 0 vi) A 6 = viii) A 8 = 0 0 0 0 0 0 0 6 0 0 0 0 0 0 0 0 Inversa condicional de una matriz Al igual que el concepto de inversa generalizada de una matriz, el concepto de inversa condicional es de gran utilidad en los cursos de modelos lineales (véase la sección de []) y en la caracterización del conjunto solución de sistemas lineales de ecuaciones Definición Sea A una matriz m n Si M es una matriz n m tal que: AMA = A entonces se dice que M es una inversa condicional de A o simplemente, que M es una c-inversa de A Observación De acuerdo con el teorema 0, toda matriz A tiene una única inversa generalizada A + ésta es a su vez por definición una c-inversa de A Así que, toda matriz A tiene al menos una c-inversa Se verá aquí, que una matriz A puede tener varias (incluso infinitas) inversas condicionales, salvo cuando la matriz A es invertible, en cuyo caso A es la única c-inversa Nota El teorema dará una caracterización del conjunto de todas las inversas condicionales de A (c-inversas de A) Teorema Sea A m n una matriz de rango r Entonces: W = {N n m : ANA = } es un subespacio de n m La dimensión del espacio W mencionado en () es m n r Demostración Para demostrar el inciso () basta demostrar, según el teorema, que el conjunto W es cerrado bajo la suma y la multiplicación por un escalar En efecto, Sean N y N dos elementos (matrices) del conjunto W, entonces AN + N )A = AN A + AN A = + = esto implica que N + N W ésto es, W es cerrado bajo la suma De otro lado, para cualquier escalar α R se tiene que AαN )A = αan A = α = ésto implica que, αn W Es decir, W es cerrado bajo la multiplicación por un escalar El conjunto W es entonces un subespacio vectorial de n m, lo que completa la demostración del inciso ()
Inversa generalizada e inversa condicional C-inversa Hagamos ahora la demostración del inciso () en el caso en la matriz A m n 0 < r < mín {m n} Las demostraciones en los demás casos son similares tenga rango r con Sea entonces A una matriz m n de rango r con 0 < r < mín {m n} De acuerdo con el inciso () del teorema, existen matrices invertibles P m m y Q n n tales que: Ir () P AQ = o A = P Ir Q Considere ahora matrices arbitrarias X r r Y r m r) Z n r) r y W n r) m r) y la matriz N n m dada por X Y N = Q P Z W Ahora N W sii ANA = De () se sigue que ANA = P Ir = P X Q X Y Q Q Z W P P Ir De aquí se deduce ANA = sii X = Esto es, N W sii N es de la forma: Y N = Q P Z W Q Ahora se demuestra que la dimensión de W es m n r Para ello, se hace uso del hecho que el espacio de matrices k j tiene dimensión k j En efecto, considere los espacios r m r) n r) r y n r) m r) con las bases respectivas, siendo = {Y Y Y r m r) }, = {Z Z Z r n r) } y = {W W W n r) m r) } Es fácil mostrar entonces que el conjunto = {N N N m n r r} con Yi N i = Q P ; i = m r r N rm r)+j = Q P ; j = n r r es una base de W Z j N rm+n r)+k = Q W k P ; k = n r) m r) 6 Teorema Sea A una matriz m n El conjunto M c A de todas las c-inversas, es una variedad lineal de dimensión m n r M c A = {M n m : AMA = A} Demostración Por el teorema 6 M c A es no vacío, sea entonces M 0 un elemento de M c A Se verifica entonces, que M M c A si y sólo si M se puede escribir como la suma de M 0 y un elemento N W Esto es, si y sólo si M = M 0 + N para algún N W, siendo W el conjunto dado en el teorema Si M = M 0 + N con N W, entonces AMA = AM 0A + ANA = A + = A Esto es, M M c A De otra parte, si M M c A entonces se puede escribir M = M + M 0 M 0 = M 0 + M M 0) = M 0 + N
C-inversa Inversa generalizada e inversa condicional donde N = M M 0 Puesto que AM M 0)A = AMA AM 0A = A A = se tiene entonces que N = M M 0 W y de aquí se sigue que: M c A = {M + N N W} El teorema siguiente establece cómo determinar los elementos de M c A Teorema Sea A una matriz m n de rango r Sean P m m y Q n n matrices invertibles como en el teorema Si A =, entonces M c A = n m Si r = n = m, entonces M c A = A + = A Si r = m < n, entonces Si r = n < m, entonces j M c Ir A = Q Y P : Y n r) m ff M c A = Q ˆ I r X P : X n m r) Si 0 < r < n y 0 < r < m entonces el conjunto M c A está dado por j M c Ir X A = Q P : Z Y Z n r) m r) ff Y n r) m X n m r) Demostración De acuerdo con los teoremas y 6, se tiene que en cada caso M c A es una variedad lineal de dimensión mn r De otro lado, se puede verificar que si M M c A, entonces AMA = A 8 Ejemplo Sea A = 0 6 la matriz del ejemplo De dicho ejemplo se sabe que las matrices invertibles 0 0 0 P = 0 y Q = 6 0 0 0 0 0 0 0 0 0 I son tales que P AQ = M c A = j Q ρa) = r = En este caso, I X Y Z P : X Y Z ff
Inversa generalizada e inversa condicional C-inversa representará, el conjunto de todas las inversas condicionales de A En particular, si tomamos X = Y = y Z = se tiene que una c-inversa de A es: 0 0 I 0 M 0 = Q P = 6 0 0 0 0 0 0 0 0 0 En lo que resta de esta sección se abordará un método alternativo para calcular una c-inversa de una matriz Considere inicialmente el caso de matrices cuadradas 9 Definición Una matriz cuadrada H = [h ij] n n tiene la forma Hermite superior, si satisface las condiciones siguientes: H es triangular superior h ii = h ii; esto es, h ii = 0 ó h ii = i = n Si h ii = 0, entonces la i-ésima fila es nula, esto es, H i = Si h ii =, entonces el resto de los elementos de la i-ésima columna son nulos; es decir, H i = I i es la i-ésima columna de la matriz idéntica 0 Ejemplo La matriz tiene la forma Hermite superior H = 6 0 0 0 0 0 0 0 0 0 0 0 0 El siguiente teorema establece que una matriz Hermite superior es idempotente La demostración de dicho resultado es consecuencia directa de la definición y se deja como un ejercicio para el lector Teorema Si H es una matriz que tiene la forma Hermite superior, entonces H = H Demostración Si A B n m son matrices triangulares superiores, entonces AB es triangular superior y AB ii = A iib ii (ver ejercicio de la sección ) De esto se sigue que: H es triangular superior H ii = H iih ii = h ii = h ii De otra parte, Si h ii = 0, entonces H i = y H i = H ih = Si h ii =, entonces H i = I i y H ) i = HH i = HI i = H i = I i Teorema Para toda matriz cuadrada A existe una matriz invertible B tal que BA = H tiene la forma Hermite superior
C-inversa Inversa generalizada e inversa condicional Demostración Sea P una matriz invertible tal que P A = R es la forma escalonada reducida de A Si R tiene la forma Hermite superior, entonces la matriz B = P satisface la condición de que BA = R = H Si R no tiene la forma Hermite superior, intercambiamos las filas de R hasta que el primer elemento no nulo (de izquierda a derecha) de cada fila no nula de R, sea un elemento de la diagonal Así se tiene una matriz H que tiene la forma Hermite superior Así que existen matrices elementales (por filas) E E E k tales que o sea: E E E kr = H E E E kp A = H En consecuencia, la matriz invertible B = E E E kp es tal que BA = H tiene la forma Hermite superior Ejemplo Para la matriz cuadrada: la matriz invertible es tal que A = P = P A = R = 0 / / 0 / / 0 0 0 0 0 0 0 0 donde R es la forma escalonada resucida de A Intercambiando las filas y de R se obtiene la matriz: 0 H = 0 0 0 0 0 la cual tiene la forma Hermite superior Además, / / 0 B = 0 / / 0 es invertible y es tal que BA = H Teorema Sea A una matriz cuadrada Si B es una matriz invertible tal que BA = H tiene la forma Hermite superior, entonces B es una c-inversa de A Demostración Como H tiene la forma Hermite superior, por el teorema, H BABA = H = H = BA o sea: BABA = BA Premultiplicando los dos miembros de la última igualdad por la matriz B se obtiene: ABA = A esto es, B es una c-inversa de A = H Así que 6
Inversa generalizada e inversa condicional C-inversa Ejemplo Considere la matriz A del ejemplo, A = 0 Se sabe de dicho ejemplo, que la matriz invertible / / 0 B = 0 / / 0 es tal que BA = H tiene la forma Hermite superior Por lo tanto, por teorema anterior, B es una c-inversa de A El siguiente corolario presenta una forma de calcular una c-inversa para el caso de matrices rectangulares 6 Corolario Sea A una matriz m n Si m > n, sea A = ˆ A, donde es la matriz nula m m n) Sea además B una matriz invertible tal que B A = H tiene la forma Hermite superior Si escribimos la matriz B entonces particionada así: B B = B donde B es una matriz n m, entonces B es una c-inversa de A A Si n > m, sea A =, donde es la matriz nula n m) m Sea además B una matriz invertible tal que B A = H tiene la forma Hermite superior Si escribimos la matriz B entonces particionada así: B = ˆ B B donde B es una matriz n m, entonces B es una c-inversa de A Demostración Se presenta aquí sólo la demostración del inciso () Para ello suponga que A es una matriz m n, con m > n y considere la matriz cuadrada A = ˆ A n n Según el teorema, existe una matriz invertible B tal que B A = H tiene la forma Hermite superior Dicha matriz B es una c-inversa de A (teorema ), así que, A B A = A o sea: A B A = ˆ A B ˆ A B = ˆ ABA = ˆ A = A De esto se sigue que ABA = A Es decir, B es una c-inversa de A Ejemplo Encontre una c-inversa para la matriz: A = 0 0 Sea A = 0 0 0
C-inversa Inversa generalizada e inversa condicional Efectuando los cálculos pertinentes se encuentra que la matriz invertible: 0 B B = 0 = B es tal que B A = H tiene la forma Hermite superior Por lo tanto, por el corolario anterior, la matriz 0 B = 0 es una c-inversa de A Ejercicios En los ejercicios al, responda verdadero o falso justificando su respuesta Para toda c-inversa A c de A se tiene que AA c ) = AA c y A c A) = A c A Si A c es una c-inversa de A, entonces A es una c-inversa de A c Si A c es una c-inversa de A, entonces A c ) T es una c-inversa de A T En los ejercicios al 9 haga la demostración correspondiente Si A c es una c-inversa de A, entonces ρa c ) ρa) = ρaa c ) = ρa c A) Si A c es una c-inversa de A, entonces TrAA c ) = TrA c A) = ρa) (sugerencia véase el ejercicio de la sección de ejercicios ) 6 Sea A una matriz m n Entonces ρa) = m sii AA + = I sii AA c = I para cada c-inversa A c de A Sea A una matriz m n Entonces ρa) = n sii A + A = I sii A c A = I para cada c-inversa A c de A 8 Si B es una c-inversa de A entonces también lo es BAB 9 Si B c y C c son c-inversas de las matrices B y C respectivamente, entonces una c-inversa de la matriz 0 Para la matriz A = B A = C 0 es A c B c = ρa) Determine el conjunto de todas las c-inversas de las matrices A = A = A = C c dé dos c-inversa A c y A c tales que ρa c ) > ρa) y ρa c ) = A = 8
Inversa generalizada e inversa condicional Mínimos cuadrados Sistemas de ecuaciones lineales: g-inversa y c-inversa de una matriz mínimos cuadrados En esta sección se verán algunas aplicaciones de la g-inversa y la c-inversa de una matriz a los sistemas de ecuaciones lineales y al problema de los mínimos cuadrados 8 Teorema Sea A m n una matriz y sea y m un vector El sistema de ecuaciones lineales Ax = y es consistente sii AA c y = y para cada c-inversa A c de A Demostración Suponga que el sistema de ecuaciones lineales Ax = y es consistente ésto quiere decir, que existe al menos un x 0 tal que: Ax 0 = y Sea ahora A c una c-inversa de A entonces: AA c y = AA c Ax 0 = Ax 0 = y Suponga ahora, que para cada c-inversa A c de A, se tiene que AA c y = y Entonces para cada c-inversa A c, el vector x 0 = A c y es una solución del sistema de ecuaciones lineales Ax = y Por lo tanto, el sistema es consistente 9 Teorema Sea A una matriz m n y sea A c una c-inversa de A Si el sistema de ecuaciones lineales Ax = y es consistente, entonces su solución general es () x = A c y + I A c A)h h n Demostración Puesto que por hipótesis el sistema de ecuaciones lineales Ax = y es consistente, entonces por el teorema anterior, AA c y = y En consecuencia, para cada x de la forma (): esto es, x es una solución del sistema dado Ax = AA c y + AI A c A)h = y + A A)h = y + h = y De otro lado, si x 0 es solución del sistema dado, entonces Ax 0 = y Premultiplicando los miembros de la última igualdad por A c se obtiene A c Ax 0 = A c y de donde: = A c y A c Ax 0 Sumando x 0 a los dos lados de la última igualdad se llega a: x 0 = A c y + x 0 A c Ax 0 = A c y + I A c A)x 0 = A c y + I A c A)h donde h = x 0 Esto es, x 0 se puede expresar en la forma Puesto que A + es una c-inversa de A se tiene el siguiente corolario 9
Mínimos cuadrados Inversa generalizada e inversa condicional 0 Corolario Sea A una matriz m n Si el sistema de ecuaciones lineales Ax = y es consistente, entones su solución general es () x = A + y + I A + A)h h n Problema de los Mínimos Cuadrados Como se estableció en el teorema (), para un sistema de ecuaciones Ax = y se presenta una y sólo una de las opciones siguientes: (i) El sistema tiene infinitas soluciones (ii) El sistema tiene solución única (iii) El sistema no tiene solución En el trabajo experimental generalmente se da generalmente la opción (iii), es decir, que el vector y no es un elemento del espacio columna de la matriz A, (y / CA)) (véase figura ) En este caso se puede preguntar, si existe una solución aproximada del sistema, para una definición conveniente de solución aproximada Un problema que se presenta con frecuencia en el trabajo experimental es: IR m y (A) 0 A x 0 A x A x Dado una serie de puntos Figura Problema de los mínimos cuadrados x y ); x y ); ; x n y n) obtener una relación y = fx) entre las dos variables x y y adaptando (en algún sentido) una curva a dicho conjunto de puntos Como los datos se obtienen experimentalmente, generalmente existe un error en ellos (errores de aproximación), lo que hace prácticamente imposible encontrar una curva de la forma deseada que pase por todos los puntos Por medio de consideraciones teóricas o simplemente por acomodo de los puntos, se decide la forma general de la curva y = fx) que mejor se adapte Algunas posibilidades son (ver figura ): Funciones lineales (rectas): y = fx) = a + bx; a b R Polinomios de grado dos: y = fx) = a + bx + cx ; a b c R Polinomios de grado tres: y = fx) = a + bx + cx + dx ; a b c d R A Adaptación de puntos a una línea recta Considere los puntos x y ); x y ); ; x n y n) los cuales se pretende ajustar mediante la gráfica de la línea recta y = fx) = a + bx Si los puntos correspondientes a los datos fuesen colineales, la recta pasaría 0
Inversa generalizada e inversa condicional Mínimos cuadrados y y y x x x () Aproximacion lineal () Aproximacion cuadratica () Aproximacion cubica Figura Ajuste por mínimos cuadrados por todos los n puntos y, en consecuencia, los coeficientes desconocidos a y b satisfarían la ecuación de la recta Esto es, se tendrían las siguientes igualdades: y = a + bx y = a + bx y n = a + bx n Estas igualdades se pueden escribir, utilizando notación matricial, así: y x y () y = 6 = x a 6 = Ax b y n x n Si los puntos que corresponden a los datos no son colineales, es imposible encontrar coeficientes a y b que satisfagan () En este caso, independientemente de la forma en que se escojan a y b, la diferencia Ax y a entre los dos miembros de () no será cero Entonces, el objetivo es encontrar un vector x = que minimice la longitud del vector Ax y, esto es, que minimice Ax y lo que es equivalente a minimizar su cuadrado, Ax y a Si x 0 = es un vector que minimiza tal longitud, a la línea recta y = a + b x se le denomina recta b de ajuste por mínimos cuadrados de los datos La figura ilustra la adaptación de una línea recta por el método de los mínimos cuadrados Se tiene que Ax y y Ax y = a + b x y ) + a + b x y ) + + a + b x n y n) b
Mínimos cuadrados Inversa generalizada e inversa condicional a son minimizados por el vector x 0 = b En dicha figura se ve que a + b x i y i corresponde a la distancia vertical, d i tomada desde el punto x i y i) hasta la recta y = a + b x Si se toma a d i como el error vertical en el punto x i y i), la recta de ajuste minimiza la cantidad: d + d + + d n que es la suma de los cuadrados de los errores verticales De allí el nombre de método de los mínimos cuadrados y ( x, y ) n n ( x, y ) d d ( x, y ) d ( x, y ) d n * * y=a+b x x Figura Ajuste lineal por mínimos cuadrados A continuación se darán dos definiciones motivadas por la discusión anterior En el ejemplo 0 se explicará cómo se adaptar, por mínimos cuadrados, una línea recta y = a + bx a una serien de n puntos x y ); x y ); ; x n y n) dados Definición (Solución M nima Cuadrada) Se dice que el vector x 0 es una solución mínima cuadrada (SMC) del sistema de ecuaciones lineales Ax = y si para todo vector x se tiene que: Ax 0 y Ax y Definición (Mejor Solución Aproximada) Se dice que el vector x 0 es una mejor solución aproximada (MSA) del sistema de ecuaciones lineales Ax = y si: Para todo vector x se tiene que: Ax 0 y Ax y Para todo vector x = x 0 tal que Ax 0 y < Ax y se tiene que x 0 < x Nota Observe que una MSA de un sistema de ecuaciones lineales Ax = y es una SMC del mismo Teorema Sea A una matriz m n y sea y un vector R m Si A c es una c-inversa de A tal que AA c es simétrica, entonces para todo vector x R n se tiene que: Ax y = Ax AA c y + AA c y y
Inversa generalizada e inversa condicional Mínimos cuadrados Demostración Por hipótesis AA c = AA c ) T Así que para todo vector x se tiene que: Ax y = Ax AA c y) + AA c y y) = Ax AA c y + Ax AA c y) T AA c y y) + AA c y y El teorema quedará demostrado si verificamos que el segundo término de esta igualdad es cero, esto es, si comprobamos la igualdad Ax AA c y) T AA c y y) = 0 En efecto tenemos: Ax AA c y) T AA c y y) = x A c y) T A T AA c ) T I)y = x A c y) T A T AA c ) T A T )y = x A c y) T AA c A) T A T )y = x A c y) T A T A T )y = Teorema Sea A una matriz m n y sea y un vector R m Si A c es una c-inversa de A tal que AA c es simétrica, entonces x 0 = A c y es una SMC para el sistema Ax = y Demostración Por hipótesis y por el teorema anterior se tiene que x 0 = A c y es tal que: Ax y = Ax Ax 0 + Ax 0 y Ax 0 y Para todo vector x De aquí que para todo vector x: Ax 0 y Ax y esto es, x 0 = A c y es una SMC para el sistema Ax = y Teorema Sea A una matriz m n y sea y un vector R m El sistema de ecuaciones lineales Ax = y tiene una única MSA, a saber x 0 = A + y Demostración Por definición de g-inversa se tiene que A + es en particular una c-inversa de A que satisface la propiedad de que AA + es una matriz simétrica, entonces por el teorema se tiene para todo x que: Ax y = Ax AA + y + AA + y y AA + y y De aquí que para todo vector x : () AA + y y Ax y Esto es, x 0 = A + y es una SMC para el sistema Ax = y Se quiere demostrar ahora x 0 = A + y que la MSA para ello se muestra, que si x = x 0 es otra SMC del sistema Ax = y (esto es si x satisface Ax = AA + y) entonces se tiene que x 0 < x Para ello se verifica primero que para todo x se satisface la igualdad () A + y + I A + A)x = A + y + I A + A)x
Mínimos cuadrados Inversa generalizada e inversa condicional En efecto se tiene que: A + y + I A + A)x = A + y + A + y) T I A + A)x + I A + A)x La igualdad () se obtendrá entonces si verifica que el segundo término de la igualdad anterior es cero Esto último se sigue fácilmente de A + y) T I A + A)x = y T h A + ) T A + ) T AA + ) T i x = y T h A + ) T A + AA + ) T i x = y T )x = Tómese ahora un vector x = x 0, tal que Ax = AA + y Multiplicando por A + obtenemos A + Ax = A + y De aquí y de () aplicada a x se tiene que: x = A + y + x A + y = A + y + x A + Ax = A + y + I A + A)x = A + y + I A + A)x > A + y = x 0 6 Observación El teorema anterior establece que todo sistema de ecuaciones lineales Ax = y tiene una única MSA, x 0 = A + y Por esto, se hablará de aquí en adelante de la mejor solución aproximada (MSA) de un sistema de ecuaciones lineales Ahora bien, puesto que la mejor solución aproximada del sistema de ecuaciones lineales Ax = y es una solución mínima cuadrada, se tiene el siguiente teorema Corolario Todo sistema de ecuaciones lineales Ax = y tiene al menos una SMC 8 Ejemplo Para el sistema de ecuaciones lineales Ax = x y se tiene que x 0 = A + y = 6 así que para todo vector x se tiene que: = = Ax 0 y = ; Ax y = y es la MSA Además: y si existe un vector x tal que Ax y =, entonces se debe tener que: x 0 = < x 9 Teorema Sea A una matriz m n y sea y un vector R m Si ρa) = n, entonces el sistema de ecuaciones lineales Ax = y tiene una única SMC que es justamente la MSA dada por: x 0 = A + y
Inversa generalizada e inversa condicional Mínimos cuadrados Demostración Sea x una SMC del sistema de ecuaciones Ax = y Por definición se tiene para todo x R n, entonces que Ax y Ax y en particular, para el vector x 0 = A + y se tiene: (6) Ax y AA + y y De otra parte, como A + es una c-inversa de A tal que AA + es simétrica, entonces se tiene (ver teorema ) En particular, para el vector x se tiene: Ax y = Ax AA + y + AA + y y x R n () Ax y = Ax AA + y + AA + y y De (6) y () se sigue que: AA + y y Ax AA + y + AA + y y De aquí que Ax AA + y = 0 y por lo tanto: = Ax y AA + y y Ax = AA + y Puesto que ρa) = n, entonces A + = `A T A A T (teorema ), en consecuencia: Ax = A A A T A T y Premultiplicando esta igualdad por `A T A A T se obtiene: x = = A T A A T Ax A A T A T A A A T A T y A A T A T y = A + y = x 0 0 Ejemplo Encuentre una recta de ajuste, por mínimos cuadrados (ver figura ), que se adapte a los puntos: 0 ); ); ); ) Para ello se debe encontrar una SMC del sistema de ecuaciones lineales Ax = y, donde x 0 y A = 6 x x = 6 y = 6 y y = 6 x y y el vector incógnita x está dada por a x = b
Mínimos cuadrados Inversa generalizada e inversa condicional Puesto que ρa) = entonces por el teorema anterior, el sistema dado tiene una única SMC, a saber: x 0 = A + y = A T A) A T y = 0 = a = b 6 En consecuencia, la recta de ajuste, por mínimos cuadrados, de los datos dados es: y = a + b x = + x y (,) (,) (,) y=+x (0,) x Figura Ajuste lineal ejemplo 0 Ejemplo Encuentre una recta de ajuste, por mínimos cuadrados, que se adapte a los puntos: ); ) Observe que en este caso los puntos dados pertenecen a la recta, de pendiente infinita, x = (ver figura (a)) 6
Inversa generalizada e inversa condicional Mínimos cuadrados y x = y y=/x (,) (,) y=/+/x (,) (,) x x a) Ajuste por una recta de pendiente infinita b) Ajuste por rectas de pendiente no infinita Figura Ajuste lineal ejemplo Ahora bien, si se busca una recta y = a + bx que no tenga pendiente infinita, que se adapte por mínimos cuadrados, a los puntos dados, entonces se debe encontrar una SMC del sistema de ecuaciones lineales (ver figura (b)) Ax = Una SMC del sistema dado es: = x x 0 = A + y = x = a b y y = = y / = / a b a = b Así que una recta de ajuste, por mínimos cuadrados, de los puntos dados es: De otra parte, la matriz y = a + b x = + x A c = es una c-inversa de A, AA c es simétrica En efecto, Por lo tanto, de acuerdo con el teorema, 0 0 / / AA c / / = / / x 0 = A c y = 0 / â = ˆb es también una SMC Así que otra recta de ajuste por mínimos cuadrados, de los puntos dados es (ver figura (b)): y = a + b x = x
Mínimos cuadrados Inversa generalizada e inversa condicional B Adaptación a polinomios de grado n La técnica descrita antes para adaptar una recta a n puntos dados, se generaliza fácilmente a la adaptación, por mínimos cuadrados, de un polinomio de cualquier grado a un conjunto de puntos dados A continuación se muestra cómo adaptar un polinomio de grado m y = a 0 + a x + a x + + a mx m a un conjunto de n puntos x y ); x y ); ; x n y n) mediante la técnica de los mínimos cuadrados Sustituyendo estos n valores de x y y en la ecuación polinómica se obtienen las n ecuaciones siguientes: 6 y y y n x x x m = x x x m 6 6 x n x n x m n a 0 a a m De lo que se trata nuevamente, es de encontrar una SMC del sistema de ecuaciones lineales Ax = y Ejemplo Encontrar un polinomio de grado dos que mejor se ajuste, por mínimos cuadrados, a los puntos: 0); 0 ); ); 0) Se debe encontrar una SMC del sistema de ecuaciones lineales: Ax = 6 0 0 a a = 6 a 0 0 = y Puesto que ρa) = el sistema dado tiene una única SMC, la cual está dada por: x 0 = A + y = A T A) A T y = 9 6 0 = 0 = 06 0 En consecuencia, existe un único polinomio de grado dos que se ajuste por mínimos cuadrados de los datos dados Este polinomio está dado por (ver figura 6): 0 0 y = 06x + 0x 8
Inversa generalizada e inversa condicional Mínimos cuadrados y y= 06x+0x (,0) (, ) (,0) x (0, ) Figura 6 Ajuste cuadrático ejemplo Ejercicios Si el sistema de ecuaciones lineales Ax = y tiene solución, demuestre entonces que la solución x = A + y es única sii A + A = I y en este caso A + y = A c y para toda c-inversa A c de A Si x x x n son soluciones del sistema de ecuaciones lineales Ax = y, y si λ λ λ n son escalares tales que P n i= λi =, demuestre entonces nx x = λ ix i i= es una solución del sistema Ax = y Sea y = a + bx una línea recta que se quiere adaptar, por mínimos cuadrados, a los puntos x y ); x y ); ; x n y n) Utilice el teorema 9 y la regla de Cramer para demostrar que si para algún i y para algún j, x i = x j entonces existe una única recta de ajuste, por mínimos cuadrados, a los puntos dados: y = a + b x y que a = Δa Δ y b = Δb Δ, donde: P n n i= xi Δ = det P n i= xi P n i= yi P n i= x i P n i= xi Δa = det P n i= xiyi P n i= x i Δb = det n P n i= xi P n i= yi P n i= xiyi 9
Mínimos cuadrados Inversa generalizada e inversa condicional Encuentre la MSA del sistema de ecuaciones lineales Ax = y donde: A = 6 0 y y = 6 0 Encuentre la MSA del sistema de ecuaciones lineales 8 x + y = >< x + y = x y = >: x + y = 6 Encuentre la ecuación de la recta que mejor se ajuste por mínimos cuadrados a los puntos: 0 ); ); ); ) Obtenga la ecuación del polinomio de grado dos que mejor se adapte, por mínimos cuadrados, a los puntos: ); 0 ); 0); ) 8 Dé, si las hay, dos SMC diferentes del sistema de ecuaciones lineales: x Ax = = y 0 9 Suponga que las variables x y y se relacionan por medio de la ecuación y = a b x ; a > 0 b > 0 a) Verique que dicha ecuación se puede transformar en la ecuación y = a + b x donde y = ln y a = ln a y b = ln b Y viceversa b) Determine, los valores de las constantes a > 0 b > 0 en el modelo y = a b x que mejor se adapte a los datos x - y 6 0 Estime el valor de y para x = Para ello encuentre la recta y = a +b x que mejor se adapte, por mínimos cuadrados a los puntos de la forma x ln y) 0 Determine la ecuación del plano z = a + bx + cy que mejor se adapte, por mínimos cuadrados, a los puntos 0 ) 0 ) ) (,-,-) 0