Instituto de Matemática y Estadística Prof Ing Rafael Laguardia Facultad de Ingeniería Universidad de la República C1 y GAL1 anuales 2009 Trabajo: número de condición y SVD El objetivo de este trabajo es presentar una introducción al número de condición, a los valores singulares y a la descomposición en valores singulares de matrices reales Para evitar complicaciones técnicas presentaremos estos conceptos para matrices 2 2, pero se generalizan a matrices de cualquier tamaño, y también a matrices complejas La descomposición en valores singulares tiene mucho sentido geométrico, y es además una herramienta importante para el análisis de datos, por lo que es de gran aplicabilidad en áreas como la estadística, el tratamiento de imágenes, la compresión de datos y la inteligencia artificial Ejercicio 1 1 Resolver el sistema de dos ecuaciones con dos incógnitas AX = B, donde ( ) ( ) 1 0,999 1,999, 0,999 1 1,999 2 Considerar el sistema AX = B 1, con la misma matriz A, y B 1 = (1,989, 2,009) Dar una estimación del valor de X antes de resolver el sistema 3 Resolver AX = B 1 Obtuviste un resultado cercano al que esperabas? 4 Resolver AX = B 2, con B 2 = (2,009, 2,009) 5 Discutir los resultados obtenidos Ejercicio 2 1 Hallar los dos valores propios λ 1 > λ 2 > 0 y una base ortonormal de R 2 formada por dos vectores propios O 1 y O 2 de la matriz ( ) 1 0,999 0,999 1 2 Para los vectores O 1 y O 2 hallados en la parte anterior, calcular las soluciones de AX = O 1, AX = O 2 3 Para dos constantes reales α y β cualesquiera hallar la solución de AX = αo 1 + βo 2 4 Escribir (1,989, 2,009) como una combinación lineal de O 1 y O 2, y usar los resultados de las partes anteriores para entender los resultados que se encontraron al resolver el ejercicio 1 En el próximo ejercicio estudiaremos la relación que hay entre el módulo AX del vector AX, y el módulo X de X 1
Ejercicio 3 Llamemos O 1 y O 2 a los vectores de la base ortonormal del ejercicio 2 1 Mostrar que si X se escribe como X = α 1 O 1 + α 2 O 2 entonces 2 Mostrar que, para X O, concluir que AX = 1,999α 1 O 1 + 0,001α 2 O 2 AX 2 = 1,9992 α1 2 + 0,001 2 α2 2, X 2 α1 2 + α2 2 0,001 AX X 1,999, (1) y que los valores máximo y mínimo del cociente en (1) se alcanzan, respectivamente en los vectores colineales con O 1 y con O 2 En el ejemplo del ejercicio anterior encontramos que 0,001 y 1,999 son la mínima y la máxima dilatación que puede producir la matriz A al actuar sobre los vectores de R 2 Estos números son los que controlan lo que ocurre con los errores relativos al resolver el sistema AX = B Nuestra próxima serie de ejercicios extiende estos resultados a matrices cualesquiera Introducimos entonces el número m que mide la más pequeña dilatación que produce A, simplemente examinando todos los cocientes AX / X para los vectores no nulos del espacio, consideramos entonces el conjunto { } AX D = X ; X R2, X O R (2) Ejercicio 4 1 Mostrar que D es un conjunto acotado y no vacío Concluir que tiene un ínfimo m y un supremo M 2 Mostrar que M = 0 si y sólo si A es la matriz nula Puede ser m = 0 para una matriz A no nula? Qué ocurre cuando m y M son iguales? 3 Mostrar que D = { AX ; X R 2, X = 1 } 4 Mostrar que el ínfimo m y el supremo M son en realidad el mínimo y el máximo de D Sugerencia: los vectores de módulo 1 de R 2 son los vectores de la forma (cos θ, sen θ), con θ R 5 Mostrar que para cualquier X R 2 se satisfacen las desigualdades m X AX M X, (3) En el próximo ejercicio vamos a analizar como los números m y M intervienen en el control de los errores relativos Consideraremos que al intentar resolver un sistema AX = B, 2
su término independiente B está afectado de error, por lo que en realidad conocemos una perturbación B + B El vector B es el error absoluto cometido en la determinación de B, la diferencia entre el dato que ponemos en la ecuación, y el valor correcto de B Es interesante medir este error en relación a B, y es la forma adecuada de medir el error para la mayoría de las aplicaciones Claro está, por ejemplo, que no es lo mismo cometer un error de algunos milímetros respecto a lo planificado en la construcción de una carretera, que en el análisis de una imagen que se utiliza para preparar una operación al corazón 1 Introducimos entonces la noción de error relativo δb = B B, comparando el tamaño (módulo) del error absoluto B contra el de B Ejercicio 5 1 Consideremos una solución X de AX = B, y llamemos X + X a una solución del sistema en el que B se ha visto perturbado a B + B Es decir, X + X satisface A(X + X) = B + B El vector X es entonces el error que B introduce en la solución del sistema Mostrar que A( X) = B 2 Concluir que m X B Observar también que M X B 3 Llamando δx = X / X al error relativo en X, concluir que se satisface la desigualdad δx M m δb Cuál es el sentido de esta desigualdad en el caso en que m = 0? El cociente M/m es lo que se llama el número de condición de una matriz Cuando m 0 definimos entonces para una matriz A su número de condicion κ(a) como κ(a) = sup { AX / X ; X O} ínf { AX / X ; X O} Por supuesto, vale la acotación δx κ(a)δb para el error relativo δx que se comete al resolver AX = B + B cuando se pretendía resolver AX = B El número de condición κ(a) controla la propagación de los errores relativos Es posible que el ejemplo que hemos tratado haya dejado en el lector la idea de que el número de condición de una matriz 2 2 es el cociente del máximo valor propio dividido el mínimo valor propio Aunque esto es cierto para matrices simétricas cuando los valores propios se ordenan según su valor absoluto, no es cierto en general En los próximos ejercicios desarrollamos la teoría para matrices cualesquiera Ejercicio 6 1 Mostrar que si X es un vector donde la dilatación AX / X alcanza su máximo M, entonces AX AY = M 2 X Y 1 En este ejemplo los márgenes de error tolerables no dependen sólo de los órdenes de magnitud de las variables en juego, sino también de lo que está en juego en cada caso 3
se satisface para todo Y R 2 Sugerencia: considerar el hecho de que la función auxiliar ϕ(t) = A(X + ty 2 X + ty 2 tiene un máximo en t = 0, está definida en un entorno de t = 0 y es derivable 2 Enunciar y demostrar un resultado análogo para los X en que la dilatación alcanza su mínimo 3 Mostrar que si m < M entonces los vectores O 1 en los que se alcanza el máximo y O 2 en los que se alcanza el mínimo de la dilatación por A son ortogonales, y que también los son sus imágenes AO 1 y AO 2 4 Mostrar que para toda matriz A 2 2 existen matrices ortogonales U y V tales que con Σ = La fórmula (4) es equivalente a la factorización AU = V Σ, (4) ( M 0 0 m V ΣU para A Esta factorización se conoce con el nombre de descomposición en valores singulares de A Su significado geométrico es que hay una base ortogonal de R 2 que es transformada por A en un conjunto ortogonal Los números M y m que representan la dilatación que sufren los vectores de la base ortonormal al ser transformados son los valores singulares El número de condición de una matriz es el cociente entre su mayor y su menor valor singular Ejercicio 7 Es usual llamar S 1 al conjunto de vectores de R 2 que tienen módulo 1 Mostrar que, según los valores de m y M, la imagen de S 1 por una matriz A es una elipse, un segmento o un punto El objetivo del próximo ejercicio es determinar la descomposición en valores singulares y el número de condición de una familia de matrices no simétricas, y observar que el número de condición es diferente al cociente de los valores propios Ejercicio 8 Consideraremos las matrices donde n es un natural cualquiera ( 2 n 0 1 1 Hallar los valores y vectores propios de A 2 Para calcular el módulo de AX observemos que AX 2 = (AX) (AX) = (AX) AX = X (A A)X = X (A AX) Hallar los valores y vectores propios de A A, verificar que existe una base ortonormal (U 1, U 2 ) de R 2 formada por vectores propios de A A y usar esa base para calcular el cociente AX / X entre el módulo de AX y el de X Sugerencia: el cuadrado de ese cociente tiene una expresión simple en términos de los coeficientes α 1 y α 2 de la expresion ), ) X = α 1 U 1 + α 2 U 2 de un vector X cualquiera como combinación lineal de los vectores U 1 y U 2 4
3 Hallar el número de condición κ(a) de A Determinar los vectores de R 2 sobre los que A produce las dilataciones máxima y mínima, y sus imágenes al multiplicarlos por A 4 Determinar la descomposición en valores singulares de A 5 Dibujar las imágenes por A de S 1, para distintos valores de n 6 Calcular lím n κ(a) Observar que los valores propios de A no dependen de n Qué ocurre? 5