Diagonalización de una Matriz Departamento de Matemáticas, CCIR/ITESM 9 de febrero de 2011 Índice 19.1.Introducción............................................... 1 19.2.Matriz diagonalizable.......................................... 1 19.3.Condiciones para la diagonalización.................................. 2 19.4.Uso de la Factorización PDP 1.................................... 5 19.5.Aplicación: Cadenas de Markov.................................... 6 19.1. Introducción En esta lectura veremos uno de los temas más importantes del Álgebra Lineal que tiene aplicaciones fundamentales en Ingeniería. Éste es el tema de la diagonalización de una matriz cuadrada. Se revisará la definición, algunos resultados teóricos y algunas aplicaciones. Se requieren los conceptos de valor y vector propio, polinomio característico y bases de un espacio lineal. 19.2. Matriz diagonalizable Definición 19.1 Una matriz cuadrada A n n se dice matriz diagonalizable si existe existe una matriz P n n invertible que cumple P 1 AP = D donde D es una matriz diagonal. El siguiente resultado indica qué significa que una matriz A sea diagonalizable. Teorema Sea A una matriz cuadrada n n, entonces son equivalentes: A es una matriz es diagonalizable, R n posee una base formada por vectores propios de la matriz A. Demostración Supongamos que A es diagonalizable. Por tanto, existen matrices P invertible y D diagonal tal que P 1 AP = D ó PDP 1 Si p i es la i-esima columna de P y d j el j-ésimo elemento de la diagonal de D, veamos que B = {p 1,p 2...,p n }
es base para R n y que Ap i = d i p i. Como P 1 P = I n n = [e 1 e 2 e n = P 1 [p 1 p 2 p n = [ P 1 p 1 P 1 p 2 P 1 p n Por tanto, P 1 p i = e i. Así mismo, De i = d i e i y Pe i = p i Así Ap i = ( PDP 1 p i = (PD ( P 1 p i = (PDe i = P(De i = P(d i e i = d i Pe i = d i p i Por tanto, p i es un vector propio asociado al valor propio d i de A. Siendo P es invertible, P se reduce a I n n. Por tanto, B es linealmente independiente y genera a R n. Por tanto, B es una base para R n formada por vectores propios. Supongamos ahora que se tiene una base para R n B = {p 1,p 2...,p n } formada por vectores propios de A y que Ap i = d i p i. Definamos P = [p 1 p n y D = diag(d 1,d 2,...,d n Así, P es invertible y P 1 AP = P 1 (A[p 1 p 2 p n = P 1 [Ap 1 Ap 2 Ap n = P 1 [d 1 p 1 d 2 d 2 d n d n = [ P 1 d 1 p 1 P 1 d 2 p 2 P 1 d n p n = [ d 1 P 1 p 1 d 2 P 1 p 2 d n P 1 p n = [d 1 e 1 d 2 e 2 d n n n = D por tanto, A es diagonalizable. 19.3. Condiciones para la diagonalización Reglas básicas para saber si una matriz es diagonalizable: Si tiene algún valor propio complejo, no es diagonalizable. Efectivamente, si A es diagonalizable p A (t = det(a ti = det ( PDP 1 ti = det ( PDP 1 tipp 1 = det ( PDP 1 P(tIP 1 = det ( P(D tip 1 = det(pdet(d tidet ( P 1 = det(d ti = n i=1 (d i t por tanto, p A (t tiene todos sus valores propios reales. La contrapositiva de esta afirmación es que si el polinomio característico de A al menos una raíz compleja, entonces A no puede ser diagonalizable. 2
Si tiene todos sus valores propios reales y son diferentes, sí es diagonalizable. Supongamos que sea el caso. Como p A (t tiene grado n entonces tendrá n raíces reales y diferentes. Por tanto, si B = {x 1,x 2,...,x n } es un conjunto formado por vectores propios asociados a valores propios diferentes entonces, B es un conjunto linealmente independiente. Como tiene n elementos B, es base para R n. Por el resultado ya probado A es diagonalizable. Si tiene todos sus valores propios reales, y si para cada valor propio que apareció repetido como raíz de la ecuación característica el número de veces que apareció repetido (multilicidad algebraica es igual a la multiplicidad o dimensión geométrica entonces sí es diagonalizable. Un resultado importante es: Teorema Toda matriz cuadrada simétrica es diagonalizable. Más aún: A es simétrica si y sólo si es ortogonalmente diagonalizable. PDP Esto es, la matriz P se puede cambiar por otra ortogonal (PP = I. Ejemplo 19.1 Determine si la matriz es diagonalizable Solución El polinomio característico de A es [ 1 2 1 2 p A (t = 4 3t+t 2 y sus raíces son: t 1 = 3/2 + i 7/2 y t 1 = 3/2 + i 7/2. Por tanto, tiene raíces complejas y por tanto no es diagonalizable Ejemplo 19.2 Determine si la matriz es diagonalizable [ 1 1 0 1 Solución: El polinomio característico de A es p bfa (t = (t 1 2. Y por tanto, el único valor propio es t = 1. El espacio nulo de [A (1I es precisamente el espacio invariante de t = 1 de A y es: kernel([a (t = 1I = Gen ( (1,0 El conjunto B = {(1,0 } no alcanza para una base para R 2. Por tanto, A no es diagonalizable. Ejemplo 19.3 Determine si la matriz es diagonalizable y calcule una factorización: [ 1 2 2 1 3
Solución: El polinomio característico de A es p A (t = 3 2t+t 2 y sus raíces son t 1 = 1 y t 2 = 3. Por tanto, sus raíces son reales y diferentes. Por tanto, A es diagonalizable. Deteminemos bases para los espacios nulos. Para t = 1 ν(a ( 1I = Gen ( ( 1,1 Para t = 3 Por tanto una base para R 2 con vectores propios es: ν(a (3I = Gen ( (1,1 B = { ( 1,1,(1,1 } Por consiguiente, P = [ 1 1 1 1 [, P 1 1/2 1/2 = 1/2 1/2 [ 1 0, D = 0 3 Ejemplo 19.4 Determine si la matriz es diagonalizable y calcule una factorización: 1 1 1 1 2 4 1 4 2 Solución: El polinomio característico de A es p A (t = 18t+3t 2 t 3 y sus raíces son t 1 = 0, t 2 = 3 y t 3 = 6. Por tanto, sus raíces son reales y diferentes. Por tanto, A es diagonalizable. Deteminemos bases para los espacios nulos. Para t 1 = 0 ν(a (0I = Gen ( ( 2,1, 1 Para t 2 = 3 Para t 3 = 6 ν(a ( 3I = Gen ( ( 1, 1,1 ν(a (6I = Gen ( (0,1,1 Por tanto una base para R 3 con vectores propios es: B = { ( 2,1, 1,( 1, 1,1,(0,1,1 } Por consiguiente, P = 2 1 0 1 1 1 1 1 1 4
P 1 = D = 1/3 1/6 1/6 1/3 1/3 1/3 0 1/2 1/2 0 0 0 0 3 0 0 0 6 Ejemplo 19.5 Determine todos los valores del parámetro real c para los cuales no es diagonalizable la matriz. 4 0 0 0 3 1 0 0 c Solución Tenemos que p A (t = det(a ti = (4 t( 3 t(c t Por consiguiente, los únicos valores propios son t 1 = 4, t 2 = 3 y t 3 = c. Como se tiene que: Si todos los valores propios son reales y diferentes, entonces es diagonalizable. Por tanto, para cualquier real c diferente de 4 y de 3 se garantiza tres valores propios reales y diferentes. Por tanto, para cualquier real c diferente de 4 y de 3 será diagonalizable. Por tanto, los únicos valores donde puede no ser diagonalizable son c = 4 y c = 3. Para c = 4 Los valores propios son t 1 = 4, t 2 = 3 y t 3 = 4. Por tanto, el único valor propio que debemos revisar para la posible diagonalización es t = 4: [A (4I 0 rref 0 1 1/7 0 0 0 0 0 0 0 0 0 Por tanto, la dimensión geométrica de t = 4 es 2. Por tanto, la dimensión geométrica de t = 4 coincide con la dimensión algebraica (2. Por tanto, para todos los valores propios la dimensión dimensión algebraica coincide con la geométrica. Por tanto, para c = 4 la matriz A sí es diagonalizable. Para c = 3 Los valores propios son t 1 = 4, t 2 = 3 y t 3 = 3. Por tanto, el único valor propio que debemos revisar para la posible diagonalización es t = 3: [A ( 3I 0 rref 1 0 0 0 0 0 1 0 0 0 0 0 Por tanto, la dimensión geométrica de t = 3 es 1 y no coincide con la dimensión algebraica (2. Por tanto, la matriz A no esdiagonalizable para c = 3. Por tanto, c = 3 es el único número real para el cual A no es diagonalizable 19.4. Uso de la Factorización PDP 1 Si A es diagonalizable entonces: P 1 AP = D PDP 1 5
Y por tanto: De igual manera se obtiene: A 2 = A PDP 1 PDP 1 = PD 2 P 1 A k = PD k P 1 La gran ventaja de esto es que debido a que D es diagonal: k λ 1 0 0 k D k 0 λ 2 0 =.... 0 k 0 0 λ n Se considera ventaja pues el número de FLOPs usados para calcular A k por la manera tradicional es (k 1n 2 (2n 1, es decir O(2kn 3 mientras que para calcular PD k P 1 es n 2 (2n 1+n(k 1+kn 2. Es decir, es O(2n 3 +kn 2. Dando un ahorro sustancial de FLOPs en el cálculo de potencias de una matriz cuando ya se posee una factorización diagonal. 19.5. Aplicación: Cadenas de Markov Veamos algunas aplicaciones del uso de la diagonalización de una matriz. En la siguiente lectura se verá su aplicación a sistemas de ecuaciones diferenciales lineales. Ejemplo 19.6 Supongamos que la probabilidad de que un fumador siga fumando al año siguiente es %65, mientras que la probabilidad de que un no fumador continue sin fumar es de %85. Determine los porcentajes de fumadores y no fumadores a la larga. Describiremos el estado de la situación en el año i por medio de un vector columna: ( xi X i = donde x i representa el porcentaje de no fumadores en el año i y y i representa el porcentaje de fumadores. Se supondrá que para calcular el estado en el año i+1 habrá que multiplicar el vector de estado en el año i por la matriz de transición A: Solución La matriz de transición es ( xi y i y i ( pasó un año xi+1 y i+1 [ 0.65 0.15 0.35 0.85 ( xi = A y i El elemento (2,1 0.35 indica que un fumador tiene un 35% de dejar de fumar un año después, mientras que el elemento 0.15 quiere decir que un no fumador tiene un 15% de probabilidades de volverse fumador. Esta matriz puede ser utilizada para determinar el porcentaje en el año siguiente dados los porcentajes de fomadores y no fumadores en el presente año. Por ejemplo, si en el año actual la relación fumadores no fumadores es 50% y 50% entonces en el año siguiente será: [ 0.65 0.15 0.35 0.85 ( 0.50 0.50 = ( 0.40 0.60 En forma análoga, si por porcentajes actuales para los fumadores y no fumadores son x o % y y o % respectivamente, al año siguiente serán: [ ( 0.65 0.15 xo 0.35 0.85 6 y o
Y dentro de k años serán: X k = A k X o = [ 0.65 0.15 0.35 0.85 k ( xo Los valores propios para la matriz A son λ 1 = 1 y λ 2 = 1/2 y vectores propios correspondientes son: ( ( 3 1 v 1 =, v 7 2 = 1 y o Por tanto, [ 3 1 [ 1 0 0 1/2 [ 3 1 1 Por tanto Así A k = [ 3 1 [ 3 1 lím k Ak = [ 1 k 0 [ 1 0 0 0 [ 0.3 0.3 X = lím k Ak X o = 0.7 0.7 0 (1/2 k ( xo [ 3 1 y o [ 3 1 1 = 1 [ 0.3 0.3 0.7 0.7 ( 0.3xo +0.3y = o = 0.7x o +0.7y o ( 0.3 0.7 Por consiguiente, a largo plazo, los fumadores serán el 30% de la población en comparación con el 70% de no fumadores. Recuerde que x o +y o = 1. Ejemplo 19.7 Suponga que sólo existen tres lecherías en el mercado Leche Lola, Leche Los Puentes, y Leche ParmaLac. Suponga que de un mes a otro Lola retiene el 80% de sus clientes, atrae 20% de los clientes de Los Puentes, y atrae 10% de los clientes de ParmaLac, Los puentes retiene 70% de sus clientes, atrae 10% de los clientes de Lola, y atrae 30% de los clientes de ParmaLac, y ParmaLac retiene 60% de sus clientes, atrae el 10% de los clientes de Lola, y atrae el 10% de los clientes de Los puentes. Suponga el tamaño de la población no cambia y se mantiene fijo en 1000000 de consumidores. Determine si existe los porcentajes a largo plazo de la distribución de clientes de Lola, Los puentes, y ParmaLac. Solución La matriz de transición queda:.80.20.10.10.70.30.10.10.60 El polinomio característico de A es: p A (t = (t 3 2.1t 2 +1.40t.300 Usando los cálculos reportados en las figuras 1 y 2, los valores propios son: λ 1 = 1.00, λ 2 = 0.60, λ 3 = 0.50 7
Figura 1: Ejemplo 3: cálculo de vectores propios de A. Figura 2: Ejemplo 3: Matriz límite de A. y los vectores propios correspondientes son: Por tanto Por tanto, v 1 = (.744845,.579324,.331042 v 2 = (.707107, +.707107,0. v 3 = (+.408248,.816497, +.408248 P = 0.744845 0.707107 +0.408248 0.579324 +0.707107 0.816497 0.331042 0. +0.408248 D = 1.0 0 0 0.60 0 0 0.50 A = lím k Ak = P A = lím k Ak = 1 0 0 0 0 0 0 0 0 P 1.45.45.45.35.35.35.20.20.20 Por tanto la ditribución del mercado de leche a largo plazo sin importar la distribución actual es: 45% 35% 20% 8