5.1.- Autovalores y autovectores. Definición y propiedades. La ecuación característica. El teorema de Cayley-Hamilton.

Documentos relacionados
Tema 11.- Autovalores y Autovectores.

Autovalores y autovectores Diagonalización y formas canónicas

Descomposición en forma canónica de Jordan (Segunda versión)

Tema 6.- Autovalores y autovectores.

Tema 3: Espacios vectoriales

Tema 1. Espacios Vectoriales Definición de Espacio Vectorial

Fundamentos Matemáticos de la Ingeniería. Tema 4: Diagonalización de matrices. Curso

TEMA 8. GEOMETRÍA ANALÍTICA.

Espacios Vectoriales. AMD Grado en Ingeniería Informática. AMD Grado en Ingeniería Informática (UM) Espacios Vectoriales 1 / 21

Capítulo 1: Diagonalización de matrices

Tema 2.- Formas Cuadráticas.

de la forma ), i =1,..., m, j =1,..., n, o simplemente por (a i j ).

1 SISTEMAS DE ECUACIONES LINEALES. MÉTODO DE GAUSS

Esta expresión polinómica puede expresarse como una expresión matricial de la forma; a 11 a 12 a 1n x 1 x 2 q(x 1, x 2,, x n ) = (x 1, x 2,, x n )

un conjunto cuyos elementos denominaremos vectores y denotaremos por es un espacio vectorial si verifica las siguientes propiedades:

Base y Dimensión de un Espacio Vectorial

Tema 4.- Espacios vectoriales. Transformaciones lineales.

Tema 2: Teorema de estructura de los grupos abelianos finitamente generados.

Sistemas de Ecuaciones Lineales y Matrices

Espacios Vectoriales

Apéndice sobre ecuaciones diferenciales lineales

Definición Dados dos números naturales m y n, una matriz de orden o dimensión m n es una tabla numérica rectangular con m filas y n columnas.

Espacios Vectoriales Asturias: Red de Universidades Virtuales Iberoamericanas 1

Algebra lineal y conjuntos convexos

TEMA 1. MATRICES, DETERMINANTES Y APLICACIÓN DE LOS DETERMINANTES. CONCEPTO DE MATRIZ. LA MATRIZ COMO EXPRESIÓN DE TABLAS Y GRAFOS.

Sistemas lineales homogéneos

Resumen de Teoría de Matrices

1 ÁLGEBRA DE MATRICES

ÁLGEBRA LINEAL II Algunas soluciones a la práctica 2.3

Espacios vectoriales

Tema 3: Sistemas de ecuaciones lineales

Dos matrices son iguales cuando tienen la misma dimensión y los elementos que ocupan el mismo lugar en ambas son iguales

ALGEBRA. Escuela Politécnica Superior de Málaga

Sistemas de ecuaciones lineales dependientes de un parámetro

TEMA 11. Autovalores y autovectores. Diagonalización y formas canónicas.

Tema 1: Matrices. El concepto de matriz alcanza múltiples aplicaciones tanto en la representación y manipulación de datos como en el cálculo numérico.

SISTEMAS DE ECUACIONES LINEALES

DETERMINANTES UNIDAD 3. Página 76

Espacios Vectoriales, Valores y Vectores Propios

Universidad Nacional de Colombia Departamento de Matemáticas Álgebra Lineal - Grupo 1 Resumen Unidad n 3

Es decir, det A = producto de diagonal principal producto de diagonal secundaria. Determinante de una matriz cuadrada de orden 3

RESOLUCIÓN DE SISTEMAS MEDIANTE DETERMINANTES

Espacios vectoriales reales.

Modelización por medio de sistemas

520142: ALGEBRA y ALGEBRA LINEAL

Espacios Vectoriales

Vectores y Matrices. Tema 3: Repaso de Álgebra Lineal Parte I. Contenidos

Objetivos formativos de Álgebra

UNIDAD I: SISTEMAS DE DOS ECUACIONES CON DOS INCÓGNITAS

CURSO CERO DE MATEMATICAS. Apuntes elaborados por Domingo Pestana Galván. y José Manuel Rodríguez García

Teoría Tema 9 Ecuaciones del plano

Conjuntos y matrices. Sistemas de ecuaciones lineales

Tema 1: MATRICES. OPERACIONES CON MATRICES

Tema 5: Sistemas de ecuaciones lineales.

EJERCICIOS DE ÁLGEBRA LINEAL TEMA 1 ESPACIOS VECTORIALES

ÁLGEBRA LINEAL I Algunas soluciones a la Práctica 3

RESOLUCIÓN DE SISTEMAS MEDIANTE DETERMINANTES

Espacios Vectoriales

DEFINICIONES TIPOS DE MATRICES DETERMINANTES Y PROPIEDADES OPERACIONES MATRICIALES INVERSA DE UNA MATRIZ SISTEMAS DE ECUACIONES

Tema 2: Espacios Vectoriales

Determinantes. Determinante de orden uno. a 11 = a 11 5 = 5

IES Fco Ayala de Granada Junio de 2012 (Común Modelo 4) Soluciones Germán-Jesús Rubio Luna

DETERMINANTES Profesor: Fernando Ureña Portero

Matemáticas I Grado de Administración y Dirección de Empresas Examen de Febrero Curso 2011/ ?

Sistem as de ecuaciones lineales

Matrices y determinantes. Sistemas de ecuaciones lineales

ELEMENTOS DE GEOMETRÍA. Eduardo P. Serrano

Solución de Sistemas de Ecuaciones Diferenciales Lineales

Capítulo 8: Vectores

Semana 09 [1/28] Sucesiones. 29 de abril de Sucesiones

Problemas de Espacios Vectoriales

RESOLUCIÓN DE SISTEMAS MEDIANTE DETERMINANTES

1 0 4/ 5 13/

Sistemas de ecuaciones lineales

Introducción a los espacios vectoriales

MATRICES DETERMINANTES

CAPÍTULO 4. Sistemas de ecuaciones lineales de primer orden

Clase 8 Matrices Álgebra Lineal

MATEMÁTICAS 1º BACH. C. N. Y S. 25 de enero de 2010 Geometría y Logaritmos

Matrices y determinantes

Sistemas de ecuaciones lineales

Álgebra y Trigonometría Clase 7 Sistemas de ecuaciones, Matrices y Determinantes

APUNTES DE ÁLGEBRA LINEAL TEMA 2. SISTEMAS DE ECUACIONES LINEALES

Matrices, Determinantes y Sistemas Lineales.

NÚMEROS COMPLEJOS: C

Matrices: repaso. Denotaremos con M m n el conjunto de matrices de tamaño m n, o sea, de m filas y n columnas. Una matriz A M m n es de la forma A =

Sistemas de ecuaciones lineales

ALGEBRA 1- GRUPO CIENCIAS- TURNO TARDE- Espacios vectoriales

2. El conjunto de los números complejos

Sistemas de ecuaciones diferenciales lineales J.L. Mancilla Aguilar

GEOMETRÍA. que pasa por el punto P y es paralelo a π. (0,9 puntos) b) Determinar la ecuación del plano π

Matrices, determinantes, sistemas de ecuaciones lineales.

Sistemas de ecuaciones lineales

Espacios vectoriales y aplicaciones lineales

A1.- Determina a y b sabiendo que el sistema de ecuaciones. x + 3y +z = 1 -x + y +2z = -1 ax + by + z = 4 tiene, al menos, dos soluciones distintas.

Matriz A = Se denomina MATRIZ a todo conjunto de números o expresiones dispuestos en forma rectangular, formando filas y columnas.

IES Fco Ayala de Granada Sobrantes de 2011 (Modelo 4) Soluciones Germán-Jesús Rubio Luna

CAPÍTULO 3: DETERMINANTES Y SISTEMAS DE ECUACIONES

Estructuras Algebraicas

Factorización ecuación identidad condicional término coeficiente monomio binomio trinomio polinomio grado ax3

Transcripción:

MATEMÁTICAS I (Curso 2-22) Primer Curso del Grado en Ingeniería Electrónica, Robótica y Mecatrónica, Ingeniería de la Energía e Ingeniería de Organización Industrial Departamento de Matemática Aplicada II. Universidad de Sevilla Lección 5: Autovalores y Autovectores (Tema 4 del temario) 5..- Autovalores y autovectores. Definición y propiedades. La ecuación característica. El teorema de Cayley-Hamilton. 5.2.- Diagonalización. Matrices diagonalizables. Matrices no diagonalizables. Forma canónica de Jordan y matriz exponencial. 5.3.- Aplicaciones del cálculo de autovalores y autovectores. 5.4.- Ejercicios. A lo largo de todo el tema trataremos esencialmente con matrices cuadradas reales (aunque muchos de los resultados que veamos también serán válidos para el caso de matrices cuadradas complejas). De todos modos, aun trabajando con matrices reales, será imprescindible hacer referencia a los números (y a los vectores) complejos. La razón es que necesitaremos considerar las raíces de un polinomio con coeficientes reales (si la matriz es real) y éstas pueden ser complejas con parte imaginaria no nula. Una matriz A cuadrada m m define una transformación lineal sobre K m, x K m y = Ax K m. Aunque la matriz sea real, cuando algunas de las raíces del llamado polinomio característico de A (que será un polinomio real) sean números complejos, con parte imaginaria no nula, será conveniente referirnos a la transformación definida por A sobre el espacio complejo C m. En estos casos, tendremos que considerar para vectores complejos todos los aspectos lineales que hemos considerado en el tema 4: combinaciones lineales, dependencia/independencia lineal, subespacios vectoriales de C m, dimensión, espacios nulo y columna, etc. La transformación de vectores que efectúa la matriz A puede ser más o menos sencilla de describir dependiendo del vector (o de la dirección) sobre la que se efectúe. El problema fundamental que se aborda es el de la determinación de las llamadas direcciones principales: direcciones sobre las que la matriz A actúa como la multiplicación por un número. Calculemos para algunos ejemplos geométricos en el plano y en el espacio, los vectores sobre los cuales la transformación asociada a una matriz actúa simplemente multiplicando por un número.

2 Lección 5.- Autovalores y autovectores. Ejemplos. () Consideremos la transformación lineal en el plano consistente en la simetría respecto de una recta r que pase por el origen de coordenadas. Aplicando esta transformación sobre un vector de dicha recta se obtiene el mismo vector y aplicándola sobre un vector de la recta s perpendicular a r que pasa por el origen de coordenadas se obtiene el vector opuesto. Los vectores (no nulos) de las rectas r y s se denominan vectores propios o autovectores de la transformación dada. Las rectas a veces se denominan direcciones principales de la transformación y los coeficientes λ = y λ 2 =, asociados a dichas direcciones, se suelen denominar valores propios o autovalores. (2) Consideramos un plano π que pase por el origen en el espacio R 3 y la transformación lineal T : R 3 R 3 que asocia a cada vector v R 3 el vector T(v) R 3 que se obtiene al proyectar v (ortogonalmente) sobre el plano considerado. Si {v,v 2 } son dos vectores que generan el plano y v 3 es un vector (no nulo) perpendicular al plano tenemos que T(v ) = v, T(v 2 ) = v 2, T(v 3 ) = con lo cual v,v 2 y v 3 son autovectores y los coeficientes respectivos, y son autovalores. Puesto que los vectores v,v 2 y v 3 forman una base de R 3, cualquier vector v R 3 puede expresarse como combinación de ellos y teniendo dicha expresión v = αv +βv 2 +γv 3 es inmediato obtener T(v) como combinación lineal de los vectores v,v 2 y v 3, T(v) = αt(v )+βt(v 2 )+γt(v 3 ) = αv +βv 2. Por ejemplo, para el plano π 2x 3y +z = podemos tomar los vectores v = 3 2, v 2 = 2 y v 3 = (latransformaciónlinealnodependedecómoelijamoslosvectores v,v 2 yv 3 ).Notemos que a partir de lo anterior es fácil obtener la matriz A de T respecto a la base canónica (puesto que tenemos los vectores v,v 2 y v 3 y sus transformados expresados respecto a la base canónica). La matriz A verifica A v v 2 v 3 = 2 3 Av Av 2 Av 3 y puesto que la matriz P = v v 2 v 3 tiene inversa (por ser sus columnas linealmente independientes), podemos despejar la 2

5..- Autovalores y autovectores. 3 matriz A, A = = Av Av 2 Av 3 3 2 2 28 v v 2 v 3 6 5 3 2 3 3 4 6 2 = = 28 2 2 4 2 6 4 6 26. (3) Si A es una matriz diagonal con elementos diagonales d,d 2,...,d m, es claro que para los vectores canónicos e,e 2,...,e m se verifica Ae k = d k e k. (4) Si tomamos dos vectores {v,v 2 } linealmente independientes del plano, cualquier transformación lineal T : R 2 R 2 queda determinada si conocemos cómo actúa sobre estos vectores. Si A es la matriz asociada a T respecto a la base canónica, podemos determinar dicha matriz a partir de Av y Av 2 (si conocemos las coordenadas de los vectores v,v 2,Av y Av 2 respecto a la base canónica). Si tomamos por ejemplo los vectores æ é æ é 2 v =, v 2 2 =, T(v ) = Av = 3v, T(v 2 ) = Av 2 = 2v 2 (con lo cual tenemos una situación en la que conocemos las direcciones sobre las cuales la transformación actúa multiplicando por un número), es fácil determinar la matriz A teniendo en cuenta que, puesto que v y v 2 son linealmente independientes, la matriz cuyas columnas son v y v 2 tiene inversa y A v v 2 = 3v 2v 2 = A = v v 2 = A æ 3 2 v v 2 = é v v 2 v v 2 æ 3 2 é = Notemos que de esta última expresión es fácil obtener las matrices A n,n =,2,... A n = v v 2 æ é ( 3) n 2 n v v 2 y, por tanto, los vectores que se obtienen al aplicar sucesivamente la matriz A sobre un vector dado u,au,a(au) = A 2 u,...,a n u,... 3

4 Lección 5.- Autovalores y autovectores. 5..- Autovalores y autovectores. 5...- Definición y propiedades. Definición. Sea A una matriz cuadrada de orden m. Diremos que un escalar λ C es un autovalor de A si existe un vector v C m, v tal que Av = λv, en cuyo caso se dice que v es un autovector de A asociado al autovalor λ. Obviamente, si tenemos un autovector v de A asociado a un autovalor λ, cualquier múltiplo no nulo de v también es un autovector de A asociado al mismo autovalor λ. Por otra parte, si tenemos dos autovectores v y v 2 asociados a un mismo autovalor λ, cualquier combinación lineal no nula de dichos autovectores también es un autovector de A asociado al mismo autovalor λ. Observaciones. (a) Al hacer transformaciones fila (o columna) sobre una matriz A, los autovalores y los autovectores de la matriz que se obtiene NO guardan relación(en general) con los autovalores y autovectores de la matriz original. En general, tampoco es cierto que los autovalores de una matriz suma/resta/producto de otras dos sean suma/resta/producto de los autovalores de cada uno de los sumandos. Ejercicio. Busca ejemplos de todo lo anterior. (b) El concepto de autovalor y autovector no es exclusivo de los espacios de coordenadas, ni de los espacios vectoriales de dimensión finita. Por ejemplo, siendo V el espacio vectorial de las funciones y : R R indefinidamente derivables y siendo T : V V la aplicación lineal y T(y) = y, se tiene que λ = es un autovalor de T y todo polinomio de primer grado es un autovector asociado. Por otra parte λ = también es autovalor y la función y(x) = e x es un autovector asociado. 5..2.- La ecuación característica. El teorema de Cayley-Hamilton. Proposición. Dada una matriz cuadrada A y un número λ C, son equivalentes: () λ es un autovalor de A. (2) El sistema homogéneo (A λ I)x = es un sistema compatible indeterminado. (3) dim [Nul (A λ I)]. (3 ) El rango[a λ I] no es máximo. (4) La matriz (A λ I) no tiene inversa. (5) det[a λ I] =. Por tanto, los autovalores de A son las soluciones de la ecuación p(λ) = det [A λi] =. Esta ecuación se denomina ecuación característica de la matriz A y p(λ) = det [A λi] se denomina polinomio característico. Siendo A = [a ij ] una matriz m m, p(λ) = det [A λi] = a λ a 2... a m a 2 a 22 λ... a 2m...... a m a m2... a mm λ 4 = ( ) m λ m +c m λ m + +c

5..- Autovalores y autovectores. 5 es un polinomio de grado m y, por tanto, tiene m raíces (contando cada una según su multiplicidad) que pueden ser reales o complejas no-reales (aun en el caso en que la matriz A sea real). El subespacio vectorial Nul [A λ I] se denomina espacio propio asociado al autovalor λ (notemos que en general estará compuesto por vectores complejos, los autovectores de A asociados a λ y el vector nulo), Nul [A λ I] = {} {autovectores asociados a λ }. De manera habitual cuando hablemos de autovectores asociados a un autovalor nos referiremos a una base del espacio propio asociado, es decir autovectores linealmente independientes de forma que cualquier autovector asociado al autovalor en cuestión sea combinación lineal de ellos. Ejemplos. Además de los ejemplos considerados anteriormente, veamos algunos ejemplos en los que la matriz A viene dada. () Consideremos la matriz A = æ 2 2 Autovalores: Para cualquier escalar λ tenemos que A λi = æ λ 2 2 λ é Por tanto det(a λi) = λ = 3 ó λ =. Autovectores é. = det(a λi) = ( λ) 2 4 = λ 2 2λ 3 = (λ 3)(λ+). asociados a λ = 3 : son los vectores no-nulos que están en el espacio nulo de A 3I, (A 3I)x = æ 2 2 2 2 é æ é x = x 2 æ é æ v = é, asociados a λ 2 = : son los vectores no-nulos que están en el espacio nulo de A+I, (A+I)x = æ 2 2 2 2 é æ é x = x 2 æ é v 2 = æ é. (2) Consideremos la matriz asociada a un giro (en el plano) de centro el origen de coordenadas y ángulo ϕ [,2π). En el caso ϕ = se obtiene la identidad y en el caso ϕ = π la simetría respecto al origen de coordenadas. Si ϕ,π, al aplicar el giro sobre un vector (real) distinto de cero se obtiene otro vector que en ningún caso será un múltiplo (real) del vector al que se aplica el giro. Esto quiere decir que la matriz del giro no tiene ningún autovalor real (salvo en los casos ϕ =,π). Resolvamos la ecuación 5

6 Lección 5.- Autovalores y autovectores. característica cos(ϕ) sen(ϕ) G = sen(ϕ) cos(ϕ) p(λ) = det(g λi) = cos(ϕ) λ sen(ϕ) sen(ϕ) cos(ϕ) λ = = (cos(ϕ) λ)(cos(ϕ) λ)+sen(ϕ) 2 = = λ 2 2cos(ϕ)λ+ = λ = cos(ϕ)±isen(ϕ) = e ±iϕ. Calculemos los autovectores asociados a cada uno de los autovalores. λ = e iϕ Tenemos que resolver el problema homogéneo (G λ I)x =, æ é æ é isen(ϕ) sen(ϕ) F2 if isen(ϕ) sen(ϕ) sen(ϕ) sen(ϕ) i sen(ϕ) = = æ x x 2 é = x æ i λ 2 = e iϕ Es fácil comprobar que é Nul [G λ 2 I] = Gen Nul [G λ I]Gen æ v 2 = i é. æ v = i é. Las propiedades referidas a autovalores las podemos agrupar dependiendo de si pueden obtenerse directamente de la definición (con lo cual estarán involucrados los autovectores) o si se obtienen a partir del polinomio característico (algunas de ellas pueden obtenerse de las dos formas). Proposición. Sea λ un autovalor de A y v un autovector asociado, entonces: () αλ es un autovalor de αa y v es un autovector asociado. (2) (λ µ) es un autovalor de A µi y v es un autovector asociado. (3) λ k es un autovalor de A k y v es un autovector asociado. (4) Si q( ) es un polinomio, entonces q(λ) es un autovalor de q(a) y v es un autovector asociado. (Ejemplo: 3λ 3 +5λ 2 7λ+2 es unautovalor dela matriz3a 3 +5A 2 7A+2I). (5) Si A tiene inversa, entonces λ, λ es un autovalor de A y v es un autovector asociado. (6) Sea Aesuna matriz real, λ = a+bi C,(a,b R) unautovalordeayv = u+iw C m un autovector de A asociado a λ. Entonces λ = a bi C también es autovalor de A y v = u iw C m es un autovector de A asociado a λ. 6

5..- Autovalores y autovectores. 7 Proposición. Sea A una matriz m m. Se verifica: (a) A tiene a lo sumo m autovalores distintos. (b) A y A T tienen los mismos autovalores (aunque los autovectores asociados pueden ser distintos). Proposición. Sea A una matriz m m y sea p(λ) = det [A λi] = ( ) m λ m +c m λ m + +c λ+c = = ( ) m (λ λ ) (λ λ m ) su polinomio característico (es decir λ,,λ m son los autovalores de A, iguales o distintos). Se verifica: (a) El determinante de A es igual al producto de sus autovalores (apareciendo cada uno, en dicho producto, tantas veces como indique su multiplicidad como raíz del polinomio característico) λ λ m = det(a) = p() = c. (b) La traza de A (la suma de los elementos diagonales de A) es igual a la suma de sus autovalores (apareciendo cada uno, en dicha suma, tantas veces como indique su multiplicidad como raíz del polinomio característico) λ +λ 2 + +λ m = ( ) m c m = traza(a) := a +a 22 + +a mm. Uno de los resultados más importantes referidos a autovalores y autovectores es el siguiente. Teorema. A autovalores distintos corresponden autovectores linealmente independientes. Es decir, si λ,...,λ p son autovalores de A distintos dos a dos y v,...,v p son autovectores de A asociados respectivamente a λ,...,λ p, entonces {v,...,v p } es linealmente independiente. Demostración.- En el caso de tener un solo autovector (p = ) no hay nada que discutir. Supongamos que p 2 y que los vectores v,...,v p son linealmente dependientes, entonces para un cierto índice k tendremos que {v,...,v k } son linealmente independientes y v k+ es combinación lineal de ellos. Entonces, tendremos unos coeficientes α,...,α k C tales que v k+ = α v +α 2 v 2 + +α k v k. ( ) Multiplicando por la matriz A en los dos miembros de esta igualdad tenemos Av k+ = α Av +α 2 Av 2 + +α k Av k λ k+ v k+ = α λ v +α 2 λ 2 v 2 + +α k λ k v k. ( ) Multiplicando los dos miembros de la igualdad (*) por λ k+ tenemos λ k+ v k+ = α λ k+ v +α 2 λ k+ v 2 + +α k λ k+ v k. 7

8 Lección 5.- Autovalores y autovectores. y restando (**) obtenemos = α (λ k+ λ )v +α 2 (λ k+ λ 2 )v 2 + +α k (λ k+ λ k )v k. Puesto que los vectores v,...,v k son linealmente independientes, de la última igualdad tenemos que los coeficientes tienen que ser todos nulos α (λ k+ λ ) = α 2 (λ k+ λ 2 ) = = α k (λ k+ λ k ) = y puesto que los autovalores son distintos entre sí λ k+ λ,...,λ k obtenemos α = α 2 = = α k = y, por tanto v k+ = en contradicción con el hecho de ser un autovector de A (asociado a λ k+ ). El siguente resultado tiene un carácer esencialmente teórico aunque puede utilizarse para obtener algunas matrices relacionadas con una matriz A. No estamos en condiciones de dar la demostración en el caso general. Más adelante veremos la demostración en un caso especial. Teorema (de Cayley-Hamilton). Sea p(λ) = det(a λi) el polinomio característico de una matriz cuadrada A, entonces p(a) = Es decir, si una matriz A de orden 3 tiene como polinomio característico, por ejemplo entonces la matriz verifica que p(λ) = λ 3 +2λ 2 5λ+7, p(a) = A 3 +2A 2 5A+7I =. En este caso, puesto que el término independiente es no-nulo, de la anterior ecuación podemos despejar A en función de potencias de A con exponente no-negativo. Ejercicio.- Hazlo. 5.2.- Diagonalización. Consideremos una transformación lineal T : K m K m y la matriz A asociada (cuadrada, m m) respecto de la base canónica C de K m. Es decir, siendo x lascoordenadas canńicas de un vector v y siendo y las coordenadas canónicas del transformado T(v), tenemos que y = Ax. Consideremos otra base B y denotemos por x e y a las coordenadas de v y T(v), respectivamente, respecto de dicha base B. Si P es la matriz del cambio de base C B tenemos que x = Px e y = Py. Por tanto, la transformación lineal T se puede expresar, en coordenadas respecto a B mediante y = Ax Py = APx y = P APx. Es decir, de la misma forma que A representa a T respecto a la base canónica, la matriz B = P AP también representa a T, pero respecto a la base B. Cuando dos matrices A y B (cuadradas del mismo orden) están relacionadas mediante la igualdad B = P AP para alguna matriz P no-singular, se dice que A y B son semejantes. En este caso se trata de matrices que representan a la misma transformaión lineal respecto de bases distintas. En este apartado vamos a considerar el problema de intentar determinar una matriz P para la cual B = P AP sea una matriz lo más sencilla posible (que permita describir la transformación T asociada de la forma más simple). La forma más simple que se puede plantear es el de una matriz diagonal. Para algunas matrices A será posible obtener una matriz diagonal y para otras no. 8

5.2.- Diagonalización. 9 5.2..- Matrices diagonalizables. Definición. Se dice que una matriz A m m es diagonalizable si existe alguna matriz P no singular tal que P AP es una matriz diagonal D. En este caso, se dice que P es una matriz de paso que diagonaliza A y que la expresión A = PDP es una diagonalización de A. Notemos que si d... d 2... P AP = D = d 3............. d m entonces de la igualdad matricial AP = PD, A v v 2... v m = v v 2... v m d... d 2............ d m se obtiene que cada columna, Av k, de la matriz AP es igual a la correspondiente columna de PD. Es decir, cada columna de P es un autovector de A asociado al correspondiente elemento diagonal de D, que será un autovalor de A. Por otra parte, el que la matriz P sea no-singular ( tiene inversa det(a) ) es equivalente a que sus m columnas sean linealmente independientes. Cuando sea posible, para construir una diagonalización de A bastará con obtener m autovectores linealmente independientes. La matriz P de orden m que tenga a dichos autovectores linealmente independientes como columnas (en un cierto orden) será no-singular y verificará AP = PD siendo D la matriz diagonal cuyos elementos diagonales son los autovalores (en el mismo orden en el que hayamos puesto los autovectores en la matriz P). Por tanto tenemos una diagonalización de A. Notemos que si en una diagonalización A = PDP, cambiamos el orden en las columnas de P y de forma simultánea cambiamos el orden en los elementos diagonales de D, de manera que se correspondan columnas de P- elementos diagonales de D, se obtiene otra diagonalización de A; sustituimos cada columna de P por un múltiplo no-nulo de dicha columna, se obtiene otra matriz de paso distinta que también diagonaliza a A (la matriz D no cambia). Proposición. Sea A una matriz m m. Se verifica: () A es diagonalizable si y sólo si tiene m autovectores linealmente independientes. (2) Si A es diagonalizable también lo es cualquier potencia A k,k =,2, (3) Si A es diagonalizable también lo es cualquier matriz de la forma A µi. 9

Lección 5.- Autovalores y autovectores. (4) Si A es diagonalizable también lo es cualquier polinomio en A q(a) = c k A k + +c A+c I. (5) Si A tiene inversa, A es diagonalizable si y sólo si lo es su inversa A. (6) A es diagonalizable si y sólo si lo es A T. Si tenemos una diagonalización de A, P AP = D A = PDP se obtienen las siguientes diagonalizaciones de A k,a µi,a T y A (si existe) A k = PD k P, A µi = P(D µi)p, A T = (P T ) D(P T ), A = PD P. Recordemos que a autovalores distintos corresponden autovectores linealmente independientes. Por tanto, Teorema. Si todos los autovalores de A son simples (A tiene m autovalores distintos), entonces A es diagonalizable. Para que una matriz sea diagonalizable no es imprescindible que todos sus autovalores sean simples. Por ejemplo λ = es un autovalor doble de la matriz A = 2 2 y A es diagonalizable(compruébalo!). Aunque hay matrices que no son diagonalizables, como por ejemplo æ é 2 B =. 2 Para analizar de forma más detallada cuando una matriz es diagonalizable consideramos los siguientes conceptos. Definición. Sea A una matriz m m y sea λ un autovalor de A. Se llama: (a) Multiplicidad algebraica de λ, y se denota por m a (λ ), a la multiplicidad de λ como raíz del polinomio característico p(λ) = det(a λi) de A. Es decir, p(λ) puede factorizarse como p(λ) = (λ λ ) ma(λ ) q(λ), siendo q(λ) un polinomio (de grado m m a (λ )) que no se anula para λ, q(λ ). (b) Multiplicidad geométrica de λ, y se denota por m g (λ ), a la dimensión del espacio nulo de A λ I, dim [Nul (A λ I)] = m rango[(a λ I)]. Es decir, la multiplicidad geométrica es el número (máximo) de autovectores linealmente independientes asociados al autovalor.

5.2.- Diagonalización. Lo único que se puede afirmar en general sobre la relación entre las multiplicidades algebraica y geométrica de un autovalor de una matriz viene dado por el siguiente resultado. Lema. Sea λ un autovalor de una matriz A, entonces m g (λ ) m a (λ ). Teorema. A es diagonalizable si y sólo si para cada autovalor λ se verifica que m a (λ) = m g (λ). En ese caso, si λ,...,λ p son (todos) los autovalores distintos de A y tenemos una base B k de cada uno de los subespacios Nul [A λ k I] (es decir, tenemos tantosautovectores linealmente independientes asociados a λ k como indica su multiplicidad algebraica), entonces es una base de R m o de C m. Por tanto: B = B B p Para determinar si una matriz es diagonalizable habrá que determinar si cada autovalor múltiple tiene asociados tantos autovectores linealmente independientes como indique su multiplicidad algebraica. Para construir una diagonalización, cuando sea posible, habrá que obtener tanto autovectores linealmente independientes, asociados a cada autovalor, como indique su multiplicidad algebraica; Vamos a demostrar el teorema de Cayley-Hamilton para las matrices diagonalizables. Teorema (de Cayley-Hamilton). Sea p(λ) = det(a λi) el polinomio característico de una matriz cuadrada A, entonces p(a) =. D. Aunque el resultado es cierto para una matriz cuadrada arbitraria, aquí sólo vamos a considerar el caso en que A es diagonalizable. Si A es diagonalizable mediante una matriz de paso P, P AP = D = A = PDP = p(a) = Pp(D)P = P = P............ P =.... p(λ )... p(λ 2 )............ p(λ m ) P =

2 Lección 5.- Autovalores y autovectores. Observación.- Para una matriz diagonalizable A, el tener una diagonalización P AP = D (diagonal), permite obtener funciones de dicha matriz que esten definidas por polinomios o por series de potencias. Por ejemplo, A k = PD k P, polinomio(a) = Ppolinomio(D)P, e A = k= A k k! = P k= D k P = P k! e λ e λ 2...... e λm P puesto que calcular la correspondiente función matricial para una matriz diagonal se reduce a obtener el valor de dicha función en cada uno de los elementos de la diagonal principal. 5.2.2.- Matrices no diagonalizables. Una matriz cuadrada A es diagonalizable si, y sólo si, hay una base (de R n ó C n ) formada por autovectores de A. Cuando A no es diagonalizable hay situaciones en las que es necesario encontrar también una base cuyos elementos verifiquen ciertas propiedades similares a las de los autovectores de A. Éstos serán los denominados autovectores generalizados de A. Definición. Sea A una matriz m m y sea λ un autovalor de A. Se dice que un vector v es un autovector generalizado de A asociado a λ si se verifica que (A λi) k v = para algún entero positivo k. Es decir, los autovectores generalizados de A asociados a λ son (excluyendo al vector nulo), los vectores de los espacios nulos de las matrices (A λi) k, k =,2,3,... Observaciones. ) Es fácil comprobar que Nul (A λi) Nul ä (A λi) 2ç Nul ä (A λi) kç Nul ä (A λi) k+ç... 2) Puesto que la dimensión del espacio es finita, los subespacios anteriores no pueden crecer de manera indefinida, sino que para un cierto valor r se verificará Nul [A λi] Nul ä (A λi) 2ç Nul [(A λi) r ] = Nul ä (A λi) r+ç =. 3) Si v Nul ä (A λi) kç entonces Av Nul ä (A λi) kç. Es decir, si v es un autovector generalizado, Av también lo es (o es el vector nulo). El siguiente resultado indica que para calcular los autovectores generalizados hay que llegar, a lo sumo, hasta la potencia m a (λ). Nos indica además que, si bien en general no es cierto que para un autovector generalizado v asociado a λ se tenga que Av es λv, se tiene en cambio que Av es también autovector generalizado asociado a λ. 2

5.2.- Diagonalización. 3 Teorema. Sea A matriz m m y sea λ autovalor de A de multiplicidad algebraica m a (λ). Existe un valor r m a (λ) tal que dim (Nul [A λi]) < < dim (Nul [(A λi) r ]) = dim Nul ä (A λi) ma(λ)ç = m a (λ), y Nul ä (A λi) kç = Nul ä (A λi) ma(λ)ç para k r. Observaciones. ) La proposición anterior no contradice lo visto hasta ahora para autovectores: si A es diagonalizable y λ es autovalor de multiplicidad algebraica m a (λ) = l (su multiplicidad geométrica será por tanto m g (λ) = l) el valor r de la proposición anterior es r =. 2) Observe que según el teorema anterior los autovectores generalizados siempre son los elementos de Nul ä (A λi) ma(λ)ç, aunque dependiendo de cada caso, dicho espacio nulo puede coindicir con el espacio nulo de una potencia inferior de A λi. Ejemplo. Consideremos la matriz A = 2 2 4 4 2 4 8 4 9. 4 5 5 Vamos a calcular una base de R 4 formada por autovectores y autovectores generalizados de A. Su polinomio característico es p A (x) = (x ) 3 (x+), luego sus autovalores son λ = con multiplicidad algebraica m a (λ ) = y λ 2 = con multiplicidad algebraica m a (λ 2 ) = 3. Como λ = es autovalor simple, sus multiplicidades algebraica y geométrica coinciden. Un autovector asociado a λ = es, por ejemplo, v = (,,3,3) T y los demás autovectores asociadosalmismoautovalorsonmúltiplosdev.paraelautovalortripleλ 2 =,lasmatrices A λ 2 I y la escalonada superior obtenida de ella por eliminación gaussiana son A λ 2 I = 2 2 2 4 3 2 4 8 3 9 4 5 6 Elim. Gauss. 2 2 2 3 3 6 3. Puesto que A λ 2 I tiene rango 3, sólo hay un autovector independiente asociado al autovalor λ 2 = ypor tanto, Ano es diagonalizable. Losautovectores asociados sonlosmúltiplos (no nulos) de v 2 = (2,,3,) T. Calculemos una base de autovectores generalizados asociados al autovalor λ 2 =. Para ello, debemos calcular las potencias A λ 2 I hasta que una de ellas tenga rango m m a (λ 2 ) = 4 3 = con lo cual el espacio nulo de dicha potencia de A λ 2 I tendrá dimensión 3. La matrices (A λ 2 I) 2 y la escalonada superior obtenida por eliminación gaussiana son (A λ 2 I) 2 = 4 6 2 8 9 7 3 3 8 7 9 3 Elim. Gauss. 4 6 2 3 3,

4 Lección 5.- Autovalores y autovectores. cuyo rango es 2 (todavía distinto de = 4 m a (λ 2 )). Por tanto la dimensión del espacio nulo de (A λ 2 I) 2 es 2 y podemos obtener en dicho espacio nulo un autovector generalizado v 3 linealmente independiente con v 2, por ejemplo v 3 = (,,,) T. Notemos que Nul ((A λ 2 I) 2 ) = Gen{v 2,v 3 }. La matriz (A λ 2 I) 3 es (A λ 2 I) 3 = 8 8 8 8 8 8 24 24 24 24 24 24 cuyo rango es = 4 m a (λ 2 ). Por tanto, el espacio nulo de (A λ 2 I) 3 tiene dimensión 3. En este espacio nulo podemos obtener un autovector generalizado v 4 que sea linealmente independiente con {v 2,v 3 }, por ejemplo v 4 = (,,,) T. Notemos que Nul((A I) 3 ) = Gen{v 2,v 3,v 4 } y que los vectores de este espacio son, además del vector nulo, todos los autovectores y autovectores generalizados asociados al autovalor λ =. Así, hemos obtenido tres autovectores (generalizados) asociados al autovalor triple λ = de una determinada forma, ampliando de una base de Nul(A I) a una de Nul((A I) 2 ) y de ésta a una de Nul((A I) 3 ). Podríamos haber obtenido una base de Nul((A I) 3 ) sin necesidad de pasar por bases de los espacios intermedios. Por ejemplo, los vectores w 2 = (,,,) T, w 3 = (,,,) T, w 4 = (,,,) T forman una base de Nul((A I) 3 ). Por tanto, tenemos como bases de R 4 {v,v 2,v 3,v 4 } y {v,w 2,w 3,w 4 }. Para observar la diferencia entre ellas (y entender por qué, en general, es más conveniente encontrar una base por el procedimiento seguido para construir {v,v 2,v 3,v 4 }) se propone como ejercicio determinar la matriz P AP tomando respectivamente como matriz P la matriz cuyas columnas son las coordenadas de los vectores de cada una de las bases anteriores. Así, si formamos P = [v,v 2,v 3,v 4 ] y P 2 = [v,w 2,w 3,w 4 ] obtenemos P AP =, P 2 AP 2 =, 2 2 4 4 Observamos que con P, en el bloque correspondiente al autovalor, éste aparece en la diagonal y además es un bloque triangular superior, es decir, en la matriz obtenida (que no puede ser diagonal pues A no es diagonalizable), los autovalores aparecen en la diagonal y el bloque del autovalor al menos tiene ceros por debajo de la diagonal. Sin embargo, con P 2 ni el autovalor aparece en la diagonal ni su bloque correspondiente es triangular. Si una matriz es diagonalizable al juntar autovectores independientes de autovalores diferentes se obtiene una base de R m (o de C m ). De la misma forma cuando se unen bases 4.

5.2.- Diagonalización. 5 de los espacios de autovectores generalizados se obtiene una base de R m (o de C m ). Siendo más preciso, tenemos el siguiente resultado. Proposición. Sea A una matriz cuadrada de orden m, con polinomio característico p A (λ) = (λ λ ) m...(λ λ p ) mp, con λ,...,λ p distintos entre sí. Si B j es base de Nul(A λ j I) m j, para j =,...,p, la unión de dichas bases B = {B,...,B p } es base de R m (o de C m ). Observación-Ejercicio. Según vimos en el estudio de las propiedades del cálculo de autovalores y autovectores, todo autovector de una matriz A es autovector de cualquiera de sus potencias A 2,A 3,... El recíproco no es cierto, en general. Por ejemplo, tomando la matriz æ é A = se verifica que A 2 es la matriz nula y, por tanto, cualquier vector no-nulo de R 2 es autovector de A 2 asociado a su único autovalor λ =. Sin embargo, hay vectores de R 2 que no son autovectores de A, por ejemplo v = [, ]. Determina los autovectores de cada una de las potencias de A = 5.2.3.- Forma canónica de Jordan y matriz exponencial. En esta sección veremos que los autovectores generalizados pueden elegirse de forma que la matriz A puede escribirse de la forma A = PJP siendo J la forma canónica de Jordan que definimos a continuación y P una matriz cuyas columnas son autovectores generalizados independientes. Definición. Un bloque de Jordan es una matriz cuadrada triangular superior J(λ) tal que: a) Todos los elementos de la diagonal principal son iguales a λ. b) Todos los elementos en la primera sobre diagonal son iguales a. c) Todos los demás elementos son iguales a.. Por ejemplo un bloque de Jordan de orden cuatro es la matriz J(λ) = λ λ λ λ 5.

6 Lección 5.- Autovalores y autovectores. Puede probarse el siguiente resultado Teorema. Dada una matriz A de orden m m existe una base de autovectores generalizados tal que A = PJP, siendo P la matriz cuyas columnas es la base de autovectores generalizados y J, a la que se denomina forma canónica de Jordan de A, es la matriz J = J J 2... J s donde cada J r es un bloque de Jordan de orden n r. El número de bloques s es igual a la suma de las multiplicidades geométricas de los autovalores diferentes de la matriz A. El mismo autovalor puede estar en distintos bloques de Jordan J r, pero el número total de bloques con ese autovalor es igual a su multiplicidad geométrica, mientras que el número total de elementos en la diagonal prinicpal con cada autovalor es su multiplicidad algebraica. Los números n r y el número total de bloques quedan determinados por la matriz A. Observar que la matriz J es una matriz diagonal por bloques y tiene una estructura muy particular. Es triangular superior, con los autovalores de A en la diagonal, la sobre diagonal está formada por unos o ceros y todos los demás elementos son ceros. Por tanto el teorema anterior nos dice que aunque una matriz no sea diagonalizable siempre es semejante a una matriz diagonal por bloques. (Aunque la matriz A sea real, las matrices J y P no tienen por qué ser reales). Veamos algunos ejemplos que expliquen el contenido del teorema anterior. Ejemplo. Forma canónica de Jordan de la matriz A = 5 4 3 3 2 Obtenemos su polinomio característico det(a λi) = (2 + λ)(4 λ) 2. Por lo tanto los autovalores de A son λ = 2 con multiplicidad algebraica m a (λ ) = y λ 2 = 4 con m a (λ 2 ) = 2. Comoλ = 2esunautovalorsimple,sumultiplicidadalgebraicaygeométricacoinciden, y su valor es uno. Ya que el rango de la matriz A 4I es 2, la multiplicidad geométrica del autovalor λ 2 es m g (λ 2 ) = 3 2 =. Por lo tanto la matriz A no es diagonalizable. De acuerdo con el teorema anterior la forma canónica de Jordan deberá tener dos bloques de Jordan, uno con el autovalor λ de orden uno (porque este autovalor sólo debe aparecer una vez en la diagonal de J) y otro bloque de Jordan de orden dos asociado al autovalor λ 2 ya que este autovalor debe aparecer dos veces en la diagonal de J. Por lo tanto la forma canónica de Jordan de A es: J = 2 4 4 La matriz de paso P = ä v v 2 v 3 ç la obtenemos con la condición de que A = PJP, o lo que es lo mismo AP = PJ. Entonces los vectores v, v 2 y v 3 deben verificar las siguientes 6..

5.2.- Diagonalización. 7 condiciones: Av = 2v Av 2 = 4v 2 Av 3 = v 2 +4v 3 La condición Av = 2v nos dice que v es un autovector asociado al autovalor λ = 2, por ejemplo, v = ä ç T. La condición Av 2 = 4v 2 nos dice que v 2 es un autovector asociado al autovalor λ 2 = 4, por ejemplo, v 2 = ä ç T. Para obtener v 3 debemos resolver el sistema Av 3 = v 2 + 4v 3, es decir (A 4I)v 3 = v 2. Utilizando el método de Gauss, obtenemos 4 3 4 3 2 3 4 3 6 6 4 3 y la solución es v 3 = +α α α siendo α un parámetro arbitrario. Tomando α =, obtenemos que v 3 = ä ç T. Observar que, ya que (A 4I)v 3 = v 2 se obtiene que (A 4I) 2 v 3 = (A 4I)v 2 =, por lo tanto v 3 es un autovector generalizado asociado al autovalor λ 2. Finalmente, hemos conseguido descomponer A de la forma A = y por lo tanto A = PJP. Ejemplo 2. Forma canónica de Jordan de la matriz A = 2 4 4 2 2 2 2 Obtenemos su polinomio característico det(a λi) = ( λ) 3. Por lo tanto A tiene un único autovalor λ = de m a (λ ) = 3, con lo que en la diagonal de J el autovalor λ = aparecerá tres veces. Ya que el rango de la matriz A I =. 2 2 2 es, la multiplicidad geométrica del autovalor es m g (λ ) = 3 = 2, con lo que habrá dos bloques de Jordan. Ya que la 7

8 Lección 5.- Autovalores y autovectores. matriz es de orden tres uno de los bloques es de orden uno y otro de los bloques es de orden dos. Es decir que la forma canónica de Jordan de esta matriz es: J = La matriz de paso P = ä v v 2 v 3 ç la obtenemos con la condición de que A = PJP, o lo que es lo mismo AP = PJ. Entonces los vectores v, v 2 y v 3 deben verificar las siguientes condiciones: Av = v Av 2 = v 2 Av 3 = v 2 +v 3 La condición Av = v nos dice que v es un autovector asociado al autovalor λ =. La condición Av 2 = v 2 nos dice que v 2 es un autovector asociado al autovalor λ =. Para obtener v 3 debemos resolver el sistema Av 3 = v 2 +v 3, es decir (A I)v 3 = v 2. Obtenemos losautovectores asociadosalautovalorλ =.Para ello resolvemos el sistema homogéneo (A I)x =, cuyas soluciones son los vectores de la forma v = 2β +α β α., α,β R. Por tanto para obtener v y v 2, no tendríamos más que dar valores a α y β para que v y v 2 fuesen independientes. Por ejemplo podríamos tomar α = y β =, para obtener que 2 v = y α = y β =, para obtener que v 2 =. Ahora tendríamos que resolver el sistema (A I)v 3 = v 2. Aplicamos el método de Gauss al sistema 2 2 2 2 2 2 2 que claramente no tiene solución. El motivo de esta aparente contradicción es que no podemos fijar desde el principio el vector v 2 y debemos trabajar con autovector v 2 genérico. Es decir 2β +α tomamos como vector v 2 = β y al resolver (A I)v 3 = v 2 obtendremos los α valores de α y β adecuados para que dicho sistema tenga solución. Resolvemos por el método de Gauss el sistema 2 2β +α 2 β 2 α 2 2β +α β +α β +α yobtenemos que el sistema tiene solución si y sólo si β+α =. Resuelvo el sistema anterior tomando α = β = y obtenemos que v 3 = +t 2s s t 8, t,s R.

5.2.- Diagonalización. 9 Si elegimos t = s =, obtenemos que v 3 = generalizados está formada por los vectores y v = A = PJP =,v 2 = Ejemplo 3. Forma canónica de Jordan de la matriz A =. Finalmente la base de autovectores, v 3 = 2 2 4 4 2 4 8 4 9. 4 5 5 Para esta matriz ya obtuvimos en la sección anterior dos bases de autovectores generalizados. Con la primera de las bases obtuvimos que A era semejane a una matriz tiangular superior con los autovalores de la matriz en la diagonal, pero esa matriz no es la forma canónica de Jordan, con la segunda obtuvimos que A era semejante a una matriz que ni siquiera era triangular. Ahora vamos a obtener una base adecuada para comprobar que A es semejante a su forma canónica de Jordan. De la sección anterior tenemos que los autovalores de la matriz son λ = con multiplicidad algebraica y geométrica uno y λ 2 = con m a (λ 2 ) = 3 y m g (λ 2 ) =. Por lo tanto la forma canónica de Jordan tiene dos bloques, uno asociado al autovalor λ de orden uno y otro asociado al autovalor λ 2 de orden tres. Por lo tanto su forma canónica de Jordan es J = ä ç La matriz de paso P = v v 2 v 3 v 4 la obtenemos con la condición de que A = PJP, o lo que es lo mismo AP = PJ. Entonces los vectores v, v 2, v 3 y v 4 deben verificar las siguientes condiciones: Av = v Av 2 = v 2 Av 3 = v 2 +v 3 Av 4 = v 3 +v 4 La condición Av = v nos dice que v es un autovector asociado al autovalor λ =, por ejemplo v = ä 3 3 ç T La condición Av 2 = v 2 nos dice que v 2 es un autovector asociado al autovalor λ 2 =. Tomamos como vector v 2 = ä 2α α 3α α ç T, siendo α un parámetro arbitrario α. 9.

2 Lección 5.- Autovalores y autovectores. La condición Av 3 = v 2 +v 3 da lugar al sistema (A I)v 3 = v 2. Determinamos α con la condición de que este sistema tenga solución. Por el método de Gauss obtenemos 2 2 2 2α 4 3 2 α 4 8 3 9 3α 4 5 6 α que este sistema tiene solución para todo α y su solución es v 3 = 2β β α+3β β 2 2 2 2α 3 3 6 3α 8 7 3 7α 5 5 5α 2 2 2 2α 3 3 6 3α 3 α siendo α y β parámetros arbitrarios con la condición de que α. La condición Av 4 = v 3 +v 4 da lugar al sistema (A I)v 4 = v 3. Determinamos α y β con la condición de que este sistema tenga solución. Por el método de Gauss obtenemos 2 2 2 2β 4 3 2 β 4 8 3 9 α+3β 4 5 6 β 2 2 2 2β 3 3 6 3β 8 7 3 7β +α 5 5 5β que este sistema tiene solución para todo α y β y su solución es v 4 = α+γ α γ α+β +3γ γ 2 2 2 2β 3 3 6 3β 3 α+β siendo α, β y γ parámetros arbitrarios con la condición de que α. Eligiendo los valores α =, β = y γ =, obtenemos que la base de autovectores generalizados que nos da la matriz P es la formada por los vectores: por lo tanto A = v = 3 3,v 2 = 2 3 3 3 2 3, v 3 = 2, v 4 = 2 3 3 3.

5.2.- Diagonalización. 2 Acabamos esta sección introduciendo brevemente el concepto de exponencial de una matriz. Es conocido que la función exponencial e x puede desarrollarse en serie de potencias de x y que dicha serie de potencias es convergente para todo x, e x = k= k! xk. Si A es una matriz cuadrada de orden m m entonces puede probarse que la serie k= k! Ak = I +A+ 2! A2 + 3! A3 + es convergente. A la matriz resultante (que es no singular) se le llama expnencial de la matriz y se escribe e A, es decir e A = k! Ak k= Evidentemente, si queremos obtener e A, debemos ser capaces de calcular previamente A k. Veamos las distintas situaciones que pueden presentarse: Si A es una matriz diagonal A = λ λ 2... λ m entonces y e A = = k= A k = k! Ak = λ k λ k 2... λ k m È k= k! λk e λ e λ 2... e λm. È k= k! λk 2. È k=. k! λk m Si A es diagonalizable, entonces existe una matriz diagonal D con los autovalores de A en la diagonal de D y una matriz de paso P no singular tal que A = PDP. En este caso 2

22 Lección 5.- Autovalores y autovectores. A k = PD k P y la mariz exponencial es e A = = P k= k! Ak = P k= e λ e λ 2 k! Dk P... P. e λm Cuando la matriz A no es diagonalizable haremos uso de la forma canónica de Jordan. En primer lugar veremos que calcular potencias de bloques de Jordan es sencillo (aunque no tan sencillo como calcular la potencia de una matriz diagonal). Por comodidad escribimos la k potencia para un bloque de orden cuatro, pero es sencillo intuir como sería para un bloque de orden n. λ λ Si J(λ) = λ entonces λ J k (λ) = λ k kλ k k(k ) λ k 2 k(k )(k 2) λ k 3 2! 3! λ k kλ k k(k ) λ k 2 2! λ k kλ k λ k y la matriz exponencial de un bloque de Jordan sería e J(λ) = = È È k! λk È k! kλk k(k ) È λ k 2 2!k! k= k= k=2 k=3 È È k! λk È k! kλk k= k= k=2 È È k! λk k= k= e λ e λ 2! eλ 3! eλ e λ e λ 2! eλ e λ e λ. e λ k(k )(k 2) λ k 3 3!k! k(k 2!k! λ k 2 k! kλk Si A no es diagonalizable podemos descomponerla en la forma A = PJP, siendo J = J J 2 su forma canónica de Jordan. Entones... J s A k = P J k J k 2... Js k 22 P È k= k! λk

5.2.- Diagonalización. 23 y e A = P e J e J 2... e Js P Acabamos con unos cuantos ejemplos. Ejemplo 4. Calcular la matriz exponencial e A de la matriz A = 2 Calculamos el polinomio característico de la matriz A, det(a λi) = λ(λ )(λ 3) Como la matriz tiene tres autovalores simples, es diagonaizable. Calculamos los autovectores asociados a cada uno de los autovalores, que son: a λ = el autovector v = ä ç T, al autovalor λ 2 = el autovector v = ä ç T y al autovalor λ3 = 3 el autovector v = ä 2 ç T. Por lo tanto e A = 2 e e 3 2 Ejemplo 5. 5 4 3 Calcular la matriz exponencial e A de la matriz A del ejemplo, A = 3 2 Como ya tenemos calculada su forma canónica de Jordan, su matiz exponencial será e A = e 2 e 4 e 4 e 4 Ejemplo 6. 2 2 Calcular la matriz exponencial e A 4 4 2 de la matriz A del ejemplo 3, A = 4 8 4 9 4 5 5 Como ya tenemos calculada su forma canónica de Jordan, su matiz exponencial será e A = 2 3 3 3 e e e 2! e2 e e e 2 3 3 3. 23

24 Lección 5.- Autovalores y autovectores. 5.3.- Aplicaciones del cálculo de autovalores y autovectores. Vamos a considerar la relación del cálculo de autovalores y autovectores con los llamados problemas de evolución. Dichos problemas vendrán expresados por una ecuación en diferencias en el caso discreto y por una ecuación diferencial en el caso continuo. En forma genérica se tratará de obtener una función vectorial de variable discreta(en cuyo caso tendremos una sucesión de vectores) o de variable continua (en cuyo caso tendremos una función vectorial de variable real) determinadas por una condición sobre su evolución. Como es natural sólo consideraremos problemas lineales. De esta forma los correspondientes conjuntos de soluciones tendrán una estructura similar a la del conjunto de soluciones de un sistema de ecuaciones lineales. Es decir, tendrán una estructura de subespacio vectorial (o de variedad lineal) y podrán manipularse de forma análoga a la manipulación de vectores de coordenadas. 5.3..- Sistemas de ecuaciones en diferencias. Aquí trataremos de obtener las sucesiones de vectores en R m (ó C m ) u,u,u 2,u 3,...,u n,... en la que la relación entre dos términos consecutivos es lineal, constante y homogénea. De forma más precisa, la relación entre dos vectores consecutivos será de la forma u n+ = Au n siendo A una matriz cuadrada m m constante (independiente de n). Definición. Sea A una matriz cuadrada de orden m y sea u,u 2,...,u n,... una sucesión de vectores en R m definidos de manera recurrente por u n = Au n, n =,2,... a partir de un vector inicial u R m. Una relación de recurrencia de esta forma se llama sistema de ecuaciones en diferencias lineal homogéneo de primer orden (con coeficientes constantes). No nos ocuparemos aquí ni del caso no homogéneo, ni del caso de coeficientes no constantes y muchisimos menos de casos no lineales. A partir de la relación u n = Au n se tiene que u n = A n u y tenemos la expresión del término general u n en función del vector original u. El problema es determinar las potencias A n de A. Tendremos esencialmente dos situaciones. Por un lado, el caso en que A sea diagonalizable será fácil detratar y por otro,el caso enel que A no sea diagonalizableque necesitará de más elaboración puesto que tendremos que recurrir al cálculo de autovectores generalizados. Uno de los aspectos que permite estudiar la expresión del término general u n (a partir de u ) es el comportamiento asintótico, es decir el comportamiento a largo plazo de la sucesión u n, qué sucede con los vectores u n cuando n se hace grande? Proposición. Sea A una matriz cuadrada de orden m y u R m. Entonces (a) Si A es diagonalizable, A = PDP (P matriz de paso de orden m cuyas columnas son autovectores de A linealmente independientes, D matriz diagonal cuyos elementos diagonales son los autovalores correspondientes de A), se verifica que A n = PD n P y u n = A n u = PD n P u, n =,2,... 24

5.3.- Aplicaciones del cálculo de autovalores y autovectores. 25 (b) Si u es combinación lineal de autovectores de A (independientemente de que A sea diagonalizable o no), u = c v + +c k v k y Av j = λ j v j, j =,...,k, entonces A n u = c λ n v + c k λ n k v k. Observaciones. Qué sucede si A no es diagonalizable y u no es combinación lineal de autovectores? Sea A una matriz m m no diagonalizable. (a) Si v es un autovector generalizado de A asociado a un autovalor λ, para un cierto valor k se verifica que (A λi)v,..., (A λi) k v, (A λi) k v =. Utilizando esto podemos determinar la solución (sucesión de vectores) del sistema de ecuaciones en diferencias u n = Au n que tiene como valor inicial u = v. Para ello, basta considerar la fórmula del binomio de Newton: n (a+b) n = p q a n b + := n a n b + n 2 p(p ) (p q +) q! a n 2 b 2 + = n n n a b n + n p!, (! := ) q!(p q)! a b n que es aplicable a la potencia de una suma de matrices si estas conmutan. Es decir, si A y B son dos matrices cuadradas que conmutan (AB = BA), se verifica la igualdad (A+B) n n = A n B n + A n B n + A n 2 B 2 n + + A B n 2 n siendo A = B = I. Puesto que las matrices A λi y λi conmutan, podemos aplicar la fórmula del binomio de Newton y para n k obtenemos A n v = [λi +(A λi)] n v = æ n n = (λi) n + n (λi) n (A λi) + + n ä ç puesto que (A λi) k v = (A λi) k+ v = (A λi) k+2 v = = (A λi) n é v = λ n v +nλ n (A λi)v + n(n ) λ n 2 (A λi) 2 v + + 2 n + +λ n k+ (A λi) k k v y aparecen (a lo sumo) k sumandos en el sumatorio, independientemente de lo grande que sea n. En los ejemplos que veremos k será pequeño y aparecerán pocos términos en el sumatorio. 25

26 Lección 5.- Autovalores y autovectores. (b) Si obtenemos una base {v,...,v m } (de R m ó C m ) formada por autovectores generalizados de A, entonces puede encontrarse la solución general del sistema de ecuaciones en diferencias u n = Au n para cualquier u R n. Para ello, expresamos u como combinación lineal de los autovectores generalizados {v,...,v m }, con lo que u = α v + +α m v m u n = A n u = α A n v + +α m A n v m y, por tanto, bastará determinar (A n v j ) para cada autovector generalizado v j. (c) Cálculo de A n.apartirdeunabaseformadaporautovectoresgeneralizados{v,...,v m } podemos calcular A n sin más que obtener los vectores {A n v,...,a n v m } y despejar A n de la igualdad matricial A n v v 2... v m = A n v A n v 2... A n v m. (d) Comportamiento asintótico de A n u. Con este término se designa al estudio del comportamiento de la sucesión de vectores u,u,u 2,... a largo plazo. Es decir se trata de estudiar qué sucede cuando n. Los vectores u n convergen a un cierto vector? oscilan entre ciertos vectores? tienden a? Es decir, lím n u n =? Si tenemos un vector u expresado como combinación lineal de autovectores y autovectores generalizados u = c v + +c m v m, la sucesión generada viene dada mediante u n = A n u = c A n v + +c m A n v m con lo cual podemos reducir el estudio al comportamiento de las sucesiones A n v siendo v un autovector o un autovector generalizado de A. En la situación más simple, que v sea un autovector asociado a un cierto autovalor λ tenemos que y, por tanto, A n v = λ n v Si λ <, tenemos que (λ n ) y (A n v) = (λ n v). Si λ >, tenemos que (λ n ) y ( A n v ) = ( λ n v ) +. Si λ = hay que distinguir dos casos (al menos): Si λ =, la sucesión de vectores A n v = v es constante. 26

5.3.- Aplicaciones del cálculo de autovalores y autovectores. 27 Si λ =,λ, puesto que λ n = para todo n =,2,..., los coeficientes λ,λ 2,λ 3,... recorren la circunferencia unidad (no completa, infinitas veces) y los vectores A n v = λ n v presentan un comportamiento oscilante. Veamos a continuación dos ejemplos de cómo obtener A n v. Ejemplo. Calcular u n = A n u siendo A = 2 y u = Por ser A triangular es inmediato que los autovalores son λ = (doble) y λ 2 = 2 (simple). Como es fácil comprobar, m g (λ = ) = < m a (λ = ) = 2 y la matriz A no es diagonalizable. No existe una base de autovectores (λ y λ 2 aportan uno cada uno) y necesitamos recurrir a un autovector generalizado de λ para obtener una base de R 3 formada por autovectores y autovectores generalizados. Autovectores asociados a λ =, 2 (A I)x = = Nul(A I) = Gen Autovectores generalizados asociados a λ =, (A I) 2 x = = Nul ä (A I) 2ç = Gen Autovectores asociados a λ 2 = 2, (A 2I)x = = Nul(A 2I) = Gen. v = v,v 2 = v 3 =... Es decir, trabajaremos con la base de R 3 formada por {v,v 2,v 3 } (que en este caso sencillo coincide con la canónica). Así, Por ser v y v 3 autovectores: u n = A n u = A n (2v +v 2 v 3 ) = 2A n v +A n v 2 A n v 3. A n v = λ n v = n v = v y A n v 3 = λ n 2v 3 = 2 n v 3. Mientras que por ser v 2 autovector generalizado de λ =, que verifica (A I) 2 v 2 = (k = 2 en la fórmula dada anteriormente): A n v 2 = [λ I +(A λ I)] n v 2 = λ n v 2 +nλ n (A λ I)v 2 + n(n ) 2 λ n 2 (A λ I) 2 v 2 + = n v 2 +n n v ++... = v 2 +nv ya que (A I)v 2 = v. 27

28 Lección 5.- Autovalores y autovectores. Finalmente u n = A n u = 2v +(v 2 +nv ) 2 n v 3 = (n+2)v +v 2 2 n v 3 = 2+n 2 n Ǒ. Ejemplo 2. Calcular u n = A n u siendo A = 3/2 /2 /2 2 /2 /2 5/2 y u = Autovalores. Calculamos sus autovalores mediante la ecuación característica, 2. A λi = λ 3 6λ 2 +2λ 8 = (λ 2) 3 =, de donde obtenemos que λ = 2 es un autovalor triple (m a (λ ) = 3). (Recuérdese que la traza de la matriz debe coincidir con la suma de los autovalores; en este caso ambas valen 6, puesto que tr(a) = 3/2+2+5/2 = 2+2+2 = 6). Si calculamos su multiplicidad geométrica m g (λ = 2) = 3 rango(a 2I) = 3 2 = vemos que sólo tiene un autovector asociado linealmente independiente, con lo que necesitaremos encontrar dos autovectores generalizados (linealmente independientes) para formar una base de R 3 con autovectores y autovectores generalizados. Autovectores: (A 2I)x = 2 2 2 2 2 2 x x 2 x 3 Tomamos como autovector, por ejemplo, v = (,,) T. Autovectores generalizados: (A 2I) 2 x = 2 2 2 2 2 2 x x 2 x 3 x x = 2 +x 3 = x 3 = x = x 2 = x x 2 +x 3 = x = x +x 3 Tomamos como primer autovector generalizado (que debe ser linealmente independiente con v ), por ejemplo, v 2 = (,,) T. Finalmente, (A 2I) 3 x = x x 2 x 3 = x = x x 2 x 3 R 3 arbitrario. Podemos tomar como segundo autovector generalizado cualquier vector de R 3 que sea linealmente independiente con {v,v 2 }, por ejemplo, v 3 = (,,) T. 28..