Determinación Numérica de Eigenvalores y Eigenvectores José María Rico Martínez Departamento de Ingeniería Mecánica Universidad de Guanajuato, F I M E E Calle Tampico No 912, Col Bellavista CP 3673, Salamanca, Gto, México Tel +52-464-648911, Fax: +52-464-64724 E-mail: jrico@salamancaugtomx 1 Introducción Estas notas tienen como objetivo presentar los conceptos fundamentales de la teoría de Eigenvalores y Eigenvectores, también conocidos como valores y vectores caraterísticos o como valores y vectores propios, de una matriz cuadrada, así como una revisión somera de los métodos numéricos empleados para su determinación 2 Establecimiento del problema y definiciones Considere una matriz A R n n dada por A = a 11 a 12 a 13 a 1n a 21 a 22 a 23 a 2n a 31 a 32 a 33 a 3n a n1 a n2 a n3 a nn (1) Definición: Eigenvalor y Eigenvector Un vector b R n,talque b, se dice que es un eigenvector, vector propio o vector característico, delamatriza si y sólo si 1 A b = λ b, donde λ C (2) Además, se dice que el escalar λ es el eigenvalor, valor propio o valor characteristico de la matriz A asociado al eigenvector b; de manera recíproca, se dice que b es un eigenvector de A asociado al eigenvalor λ Debe notarse que, aún cuando la matriz A es real, los eigenvalores asociados a la matriz pueden ser números complejos Teorema I El conjunto de todos los eigenvectores b asociados al eigenvalor λ constituyen un subespacio vectorial de R n, concido como el eigenespacio asociado al eigenvalor λ Prueba: Es suficiente mostrar que el conjunto de vectores E = { b R n A b = λ b} está cerrado respecto a la adición de vectores y la multiplicación por escalar 1 Debe notarse que la ecuación (2) requiere necesariamente que la matriz deba ser cuadrada 1
1 Sean b 1, b 2 E, porlotanto A b 1 = λ b 1 y A b 2 = λ b 2 Puesto que la multiplicación de matrices es una operación lineal, se tiene que ( A b1 + ) b 2 = A b 1 + A b 2 = λ b 1 + λ ( b 2 = λ b1 + ) b 2 porlotanto,elconjuntoestá cerrado respecto de la adición 2 Sea b 1 E y μ R,porlotanto A b 1 = λ b 1 Puesto que la multiplicación de matrices es una operación lineal, se tiene que A (μ ) b 1 = μa b 1 = μλ b 1 = λμ b 1 = λ (μ ) b 1 por lo tanto,el conjunto está cerrado respecto a la multiplicación por escalar Estas dos pruebas parciales verifican que el conjunto de todos los eigenvectores b asociados al eigenvalor λ constituyen un subespacio vectorial de R n Considere ahora la ecuación (2), que puede reescribirse de la siguiente forma A b = λ b, o A b = I n λ b, o [A λi n ] b = (3) donde I n es la matriz identidad de orden n Puesto que, por definición, b, la única posibilidad para que la ecuación (3) se satisfaga es que, la matriz [A λi n ] sea singular y que b sea un elemento del espacio nulo o kernel de la matriz Una condición necesaria y suficiente para que la matriz [A λi n ] sea singular es que su determinante sea cero; es decir p(λ) = A λi n = (4) Expandiendo el determinante de la ecuación (4), se obtiene una ecuación polinomial real de n-ésimo orden en λ Esta ecuación se denomina la ecuación característica de la matriz A Las raices de la ecuación característica son los eigenvalores de la matriz y los vectores que satisfacen la ecuación (3) son los eigenvectores asociados a los eigenvalores respectivos Es importante señalar que si la matriz A es real, la ecuación característica de orden n es real Del teorema fundamental del algebra, se sabe que la ecuación (4) tiene n raices cuando se analiza en el campo de los números complejos, tomando en cuenta la multiplicidad de una raiz; es decir, cuantas veces aparece como repetida una raiz Además, si la ecuación (4) tiene una raiz compleja o imaginaria, el complejo conjugado de esa raiz, también es raiz de la ecuación En otras palabras, las raices complejas o imaginarias de una ecuación polinomial real siempre aparecen como pares conjugados 3 Método directo de determinación de los eigenvalores y eigenvectores de una matriz Las observaciones indicadas al término de la sección 2, constituyen las bases de la determinación de eigenvalores y eigenvectores por el método directo Los pasos necesarios para esta determinación se indican a continuación 1 Determine la ecuación característica de la matriz; es decir determine p(λ) = A λi n = 2 Encuentre las n raices de la ecuación característica Estas raices son los eigenvalores de la matriz 2
3 Para cada uno de los eigenvalores determine el subespacio solución de la ecuación [A λi n ] b = Estos subespacios solución constituyen el eigenespacio asociado al eigenvalor λ 31 Ejemplo 1 Considere la matriz dada por 8 2 4 1 2 6 2 1 A = 4 3 8 2 3 4 5 La ecuación característica de la matriz A está dadapor = A λi 4 = p(λ) = 1636 + 756 λ 49 λ 2 11 λ 3 + λ 4 La figura 1 muestra la gráfica de la ecuación característica, es evidente, de la figura que existen 4 raices reales Las raices de la ecuación característica y, por lo tanto, los eigenvalores de la matriz A están dadas por 2, 1, lambda 8 6 4 2 2 4 6 8 1 1, 2, 3, 4, Figure 1: Gráfica de la Ecuación Característica de la Matriz A λ 1 = 838243513, λ 2 =394656787, λ 3 =6339424118, λ 4 =994834968 Para la determinación de los eigenvectores asociados a λ 1 = 838243513, se tienen que realizar los siguientes cálculos 1 Determinar la matriz A λ 1 I 4, dada por 163824351 2 4 1 2 143824351 2 1 A λ 1 I 4 = 4 3 38243513 2 3 4 133824351 3
2 Obtener la forma escalonada reducida de la matriz A λ 1 I 4, dada por 163824351 2 4 1 141382665 248832829 8779179928 559299318 13336562 9 Este resultado parece contradictorio, si los cálculos se hubieran realizado de manera exacta, la matriz A λ 1 I 4 debe ser singular, y el término (4, 4) de la forma escalonada reducida debería ser igual a La diferencia es el resultado de no realizar los cálculos de manera exacta 3 Despreciando el error indicado en el punto anterior, el eigenvector asociado al eigenvalor λ 1 está dado por la solución del sistema 163824351 2 4 1 x 1 141382665 248832829 8779179928 x 2 x 3 = 559299318 13336562 x 4 La solución está dadapor bλ1 = [ 2453188593 1996149746 1 38317842 ] T Es importante señalar que cualquier múltiplo escalar de b λ1 asociado al eigenvalor λ 1 es igualmente un eigenvector de la matriz A Procediendo de manera semejante con los restantes eigenvalores, se tiene que 1 Para λ 2 =394656787, se tiene que bλ2 = [ 647883394 4579574956 1473512 1 ] T 2 Para λ 3 =6339424118, se tiene que bλ3 = [ 58249415 215377152 11681568 1 ] T 3 Para λ 4 =994834968, se tiene que bλ4 = [ 1 3756429166 285649351 544676338 ] T 4 Determinación de Eigenvalores y Eigenvectores de Matrices Simétricas Esta sección inicia definiendo de manera formal una matriz simétrica Definición Una matriz A R n n se dice que es simétrica, si y sólo si, su transpuesta es igual a la matriz original, es decir: A T = A Si la matriz cuyos eigenvalores y eigenvectores se desea determinar es simétrica, entonces es posible encontrar interesantes resultados teóricos que simplifican esa determinación Por ejemplo, en la sección 2, se comentó que 4
los eigenvalores de una matriz real pueden ser reales o complejos, sin embargo, si la matriz es simétrica, puede probarse que todos sus eigenvalores son reales Sin embargo, para probar estos resultados, es necesario emplear algunos resultados acerca de matrices definidas sobre el campo de los números complejos y de espacios vectoriales complejos Definición Considere el espacio vectorial C n, definido sobre el campo de los números complejos, C, es posible definir la siguiente forma cuadrática q : C n R q( v) = v v, donde la barra indica la transpuesta conjugado del vector Es necesario probar que la imagen de este mapeo es efectivamente un número real q( v) = v T v = v j v j = (a j + ib j )(a j + ib j )= (a 2 j + b 2 j) R Teorema II La forma cuadrática definida en la definición anterior es positiva definida Prueba: Es evidente que q( v) v C n En particular, si q( v) =, entonces (a 2 j + b2 j )= a j = b j = j =1, 2,,n Por lo tanto, q( v) = v = Ahora se analizarán algunas propiedades de matrices complejas Definición Considere el álgebra de matrices cuadradas, C n n, definidas sobre el campo de los números complejos Una matriz A C n n se denomina hermitiana si A = A Donde, A representa la transpuesta conjugada de la matrix A Es decir, una matriz es hermitiana, si la matriz es igual a su transpuesta conjugada Puesto que el campo de los números reales es un subcampo de los números complejos, R <C, entonces si a R, entonces a = a, y se tiene el siguiente resultado Teorema III Una matriz simétrica, real, es una matriz hermitiana Prueba: Suponga que A R n n <C n n es simétrica, entonces A = A T,ysetieneque A = A T = A por lo tanto es hermitiana Teorema IVSeaA C n n una matriz hermitiana Entonces 1 x A x es un número real para todo x C n,y 2 Todos los eigenvalores de A son reales Prueba: Para la primera parte, considere el número complejo ( x ) A x = x A x = x A x 5
puesto que el número complejo satisface la propiedad de que su conjugado es igual al número, entonces el número complejo es, en realidad, un número real Para la segunda parte considere, un eigenvalor λ de la matriz A hermitiana y sea x un eigenvector de A asociado a λ y con la propiedad que su forma cuadrática q( x) = x x = 1, entonces A x = λ x Además λ = λ x x = x λ x = x A x Debe notarse que por el primer resultado de este teorema λ es un número real Debe recordarse que como indica el Teorema III, todas las matrices simétricas son hermitianas, de manera que todos los resultados del Teorema IV son aplicables a todas las matrices simétricas Puede, además, mostrarse que si la matriz es simétrica los eigenvectores son ortogonales, sin embargo, la prueba de este resultado requiere de conceptos bastante mas complicados 41 Ejemplo 2 Considere la matriz dada por 8 2 4 1 2 6 2 1 A = 4 2 8 1 1 5 La ecuación característica de la matriz A está dadapor = A λi 4 = p(λ) = 2444 + 946 λ 6 λ 2 11 λ 3 + λ 4 La figura 2 muestra la gráfica de la ecuación característica, es evidente, de la figura que existen 4 raices reales Las raices de la ecuación característica y, por lo tanto, los eigenvalores de la matriz A están dadas por 3, 2, 1 8 6 4 1, 2 2 4 lambda 6 8 1 1, 2, 3, 4, 5, 6, Figure 2: Gráfica de la Ecuación Característica de la Matriz A 6
λ 1 = 932552313, λ 2 =4446795311, λ 3 =591525526, λ 4 =996351476 Para la determinación de los eigenvectores asociados a λ 1 = 932552313, se tienen que realizar los siguientes cálculos 1 Determinar la matriz A λ 1 I 4, dada por 173255231 2 4 1 2 153255231 2 1 A λ 1 I 4 = 4 2 132552313 1 1 143255231 2 Obtener la forma escalonada reducida de la matriz A λ 1 I 4, dada por 173255231 2 4 1 159462877 246174774 8845632315 866122253 1421594747 332 Este resultado parece contradictorio, si los cálculos se hubieran realizado de manera exacta, la matriz A λ 1 I 4 debe ser singular, y el término (4, 4) de la forma escalonada reducida debería ser igual a La diferencia es el resultado de no realizar los cálculos de manera exacta 3 Despreciando el error indicado en el punto anterior, el eigenvector asociado al eigenvalor λ 1 está dado por la solución del sistema 173255231 2 4 1 x 1 159462877 246174774 8845632315 x 2 x 3 = 866122253 1421594747 x 4 La solución está dadapor bλ1 = [ 2512856 162735853 1 69261111 ] T Es importante señalar que cualquier múltiplo escalar de b λ1 es igualmente un eigenvector de la matriz A asociado al eigenvalor λ 1 Procediendo de manera semejante con los restantes eigenvalores, se tiene que 1 Para λ 2 =4446795311, se tiene que 2 Para λ 3 =591525526, se tiene que 3 Para λ 4 =996351476, se tiene que bλ2 = [ 7156723992 4816374493 5439198782 1 ] T bλ3 = [ 5818315235 1 319782378 456912971 ] T bλ4 = [ 1 496171156 167431799 31434454 ] T 7