.6 Ajuste lineal por ínios cuadrados (6_AL_T_v9;005.w0.4; C & / C) 0. Notación (, ) producto interno de vectores A atriz de diseño (rectangular; n); contiene por colunas los vectores de las funciones del odelo A T A atriz de las ecuaciones norales (cuadrada; n n) d vector error o diferencia e vector de una base f vector de la función f () evaluada para el vector de las abscisas núero de datos (diensiones de espacio) n núero de paráetros ajustables (diensión del subespacio) vector con abscisas o variable independiente del odelo abscisa del dato vector con ordenadas o variable dependiente (ordenada) del odelo a (vector) aproiación a ordenada del dato α vector de paráetros ajustables α paráetro ajustable * α valor óptio o valor dado de un paráetro ajustable χ función escalar que representa la agnitud del vector error (sua de residuales); depende de los paráetros ajustables incertidubre en la ordenada α incertidubre en la abscisa varianza de residuales incertidubre en el paráetro α. Introducción: aproiación de un vector Considereos la epansión de un vector en térinos de una base en el espacio de - diensiones. Si la base es { e, e,..., e }, entonces (0.) α e. Para deterinar los coeficientes α, proectaos el vector sobre cada uno de los vectores base obteneos ecuaciones para coeficientes. El sistea tiene solución única. Si la base es ortogonal, entonces (,e (0.) ) ( e,e )e. Para una base ortonoral
(0.) (,e )e. Ahora bien, qué pasa si en vez de la base utilizaos un conjunto de n (< ) vectores { f, f,..., f n } LI? Si el vector en una cobinación lineal de los n vectores se podrá hacer una epansión; sin ebargo, en el caso ás general, eistirán vectores que no se podrán epresar en térinos de { f, f,..., f n }. En este caso podeos hacer una aproiación; podeos construir un vector (0.4) a α f preguntar que tan parecido (o que tan cercano) es este vector a. Para cuantificar la aproiación definios el vector error (o diferencia) (0.5) d a escogeos los paráetros α, α,..., α n será cero si está en el subespacio de cubierto por los n vectores. n { } para que d sea lo ás cercano a cero; d Considerando una aproiación con dos vectores en el espacio -D, teneos que a está en el plano generado por { f, f } ; si está tabién en el plano entonces podeos escoger { α, α } tal que d 0 la aproiación es eacta (i.e. la α * f aproiación se convierte en una f epansión). Si no está en el d * plano, d no puede ser cero; sin f d () * ebargo, podeos escoger los a paráetros para que la longitud d () () de d sea ínia ( d * a ) coo se α * f uestra en la figura. a () La relación con ínios cuadrados (lineales) se puede ver si pensaos en ajustar un odelo de dos paráetros a tres puntos. Considerando el ajuste de una recta, el odelo sería α + α (en este caso representa la ordenada no un vector). Si consideraos que la función a iniizar (χ) sea la sua del cuadrado de los residuales (diferencia entre la ordenada el odelo α + α coo se uestra en la siguiente figura), teneos que (, ) (, ) α + α ( α + α ) (, )
( ) (0.6) χ + α ). La ecuación anterior se puede escribir coo la ultiplicación (atricial) de un vector fila por un vector coluna; esto es + α ) χ ( + α ) + α ) + α )) + α ). + α ) Lo anterior se puede ver coo el cuadrado de la nora de un vector; esto es χ + α ) + α ) + α ) (α + α (0.7) χ ( α f + α f ) a d. El problea de ínios cuadrados consiste en encontrar valores α * * {, α } que iniizan la sua de residuales (χ) o, equivalenteente, la longitud del vector error (o diferencia) d. Notas:. Es iportante no confundir coo ordenada (del odelo α + α ) con coo el vector de coponentes (. El vector f ientras que el vector f. Equivalenteente, en el odelo f (), ientras que f (). Los coponentes de los vectores se generan cuando se aplican las funciones a las abscisas,,...,. En algunos tetos se utiliza χ ó χ en vez de χ. 4. La diensión del espacio es el núero de puntos (). 5. La diensión del subespacio en donde se encuentra la aproiación a es el núero de paráetros (o funciones) del odelo (n). 6. Por lo general, n < ; si n, entonces la aproiación se convierte en una epansión (d 0) a enos que los vectores sean LD. Aun en el caso n <, podeos obtener una epansión si resulta que d 0 (i.e. podeos encontrar una recta que pasa por ás de dos puntos). ). ) { }.. Solución: iniización utilizando la nora euclideana Regresando a la ecuación (6) ó (7) de la sección anterior teneos que:
( ) (0.8) χ(α,α ) + α ) a (α,α ) d(α,α ) Entonces, para encontrar puntos críticos, diferenciaos con respecto a α, α χ ( + α ))( ) ( + α ) ) α 0 4 { }. χ ( + α ) α )( ) ( + α ) ) 0 Puesto que α, α salen de la suatoria aparecen de anera lineal, podeos escribir un sistea para encontrar la solución al problea anterior: α α Este sistea tiene solución resulta que los valores de α, α iniizan a χ. Toando el punto de vista de vectores, podeos usar un arguento geoétrico para encontrar α, α. Sabeos que la longitud del vector d será ínia cuando éste sea perpendicular al plano; entonces, el producto interno entre d a es cero. Esto es, ( d, a ) 0 ( a, a ) 0 (, a ) ( a, a ) 0 Ahora bien, α + α a α + α α + α α α Aα α + α Donde A ( f f ) es la atriz de diseño tiene por colunas las funciones evaluadas para cada ; α es el vector de los paráetros α, α. Del arguento geoétrico teneos que ( ) T (Aα) α T A T Aα a T α T A T ( a, a ) (, a ) ( a, ) T a a Aα con esto α T (A T Aα A T ) 0. Puesto que α T no es el vector cero, A T Aα A T 0 ( A T A)α A T. Esta es la ecuación atricial que resuelve el problea de ínios cuadrados utilizando las ecuaciones norales (esto es, teneos que invertir una atriz cuadrada de n n donde n es el núero de paráetros ajustables). De la isa anera podeos pensar que puesto que A T no es cero podeos escribir A T Aα ( ) 0 Aα. En este caso la ecuación es al parecer ás sencilla ecepto que ahora teneos que invertir una atriz rectangular de n donde ha filas (de datos) n colunas (de
n paráetros ajustables); para resolver esta ecuación es necesario utilizar Descoposición por Valores Singulares (que no es parte del curso). Por tanto sólo utilizareos las ecuaciones norales. Ejeplo: recta (odelo α + α ) que iniiza la distancia a los puntos 0 - / En este caso la atriz de diseño es 0 A, el vector de ordenadas es, las ecuaciones norales son ( A T A)α A T 0 0 α α 0 5 Invirtiendo la atriz noral teneos que α α 5 5 6 5 5 5 6 con esto deducios que la recta que pasa ás cerca de los tres puntos es 5 6 +. 5 α α 5.. Modelos con tres paráetros fora generalizada del odelo Considereos el ajuste de una parábola a cuatro o ás puntos ; en este caso el odelo es (0.9) α + α + α la función a iniizar es χ(α, α, α ) ( + α + α )). La iniización nos lleva a
α α 4 α Se puede ver que llegaos a las ecuaciones norales ( A T A)α A T donde A es A M M M 6 ( f f f ) las colunas son las funciones {,, } evaluadas para cada una de las abscisas. Con esto podeos generalizar a un odelo de tres funciones arbitrarias α f () + α f () + α f () lo cual nos lleva al iso problea: ( A T A)α A T ; en este caso la atriz de diseño es f ( ) f ( ) f ( ) f ( ) f ( ) f ( ) A f ( ) f ( ) f ( ) M M M f ( ) f ( ) f ( ) ( f f f ). De hecho se puede ver que la atriz cuadrada (A T A) está dada por los productos internos de los vectores { f, f, f } f ( f, f ) ( f, f ) ( A T A) ( f, f ) f ( f, f ) ( f, f ) ( f, f ) f que es siétrica pues el producto interno lo es para el capo de los reales. Las ecuaciones norales son ( A T A)α A T f ( f, f ) ( f, f ) ( f, f ) f ( f, f ) ( f, f ) ( f, f ) f α α α ( f, ) ( f, ). ( f, ) De la desigualdad de Schwarz se puede deostrar que el problea tiene solución (i.e. la atriz noral tiene inversa) siepre que los vectores sean linealente independientes (LI); con esto se puede ver que se pueden considerar odelos ás generales siepre cuando sean lineales en los paráetros a iniizar. Esto es, podeos considerar varias
variables independientes funciones (no-lineales) de las variables independientes la dependiente. El único requisito es que se foren vectores LI. Ejeplo: Ajusteos los paráetros {α, α, α } del odelo α + α + α utilizando los datos 0 0 0 - - En este caso las colunas (vectores) de A son {,, } claraente se generan vectores LI; la atriz de diseño es 0 0 A, el planteaiento del problea es 4 4 α ( A T A)α A T 4 6 α α la solución es 7 α 4 4 6 α 4 6. 6 α Queda claro que el odelo lineal ás general de n paráetros para dos variables es f 0 (, ) α f (, ) + α f (, ) +... + α n f n (, ). Adeás, si teneos un odelo con n paráetros algunos de ellos los quereos fijar en valores dados, sólo pasaos esos suandos al lado izquierdo de la ecuación consideraos un vector que depende de. Considerando el odelo α f () + α f () + α f () + α 4 f 4 () + α 5 f 5 () podeos toar {α, α, α 4 } coo fijos ajustar {α, α 5 } reacoodando α * f () α * f () α 4 * f 4 () α f () + α 5 f 5 () considerando el vector α * f () α * f () α 4 * f 4 () en vez del vector de ordenadas. 4. Linealización de algunos odelos no-lineales Para odelos coo 7
α e α no se pueden generar las ecuaciones norales pues α aparece de anera no-lineal. En este caso se pueden sacar el logarito del odelo considerar ln ln α e α ( ) lnα + α. Se puede utilizar la teoría epuesta para encontrar {lnα, α }. Tabién se puede linealizar α ( α ) pero no así α sen ( α ). 5. Ajuste con errores (incertidubres) en los datos Suponiendo que las ordenadas están caracterizadas por desviaciones estándar Modelo α + α datos ± ± M M ± Nota : si se consideran incertidubres en las abscisas el problea se vuelve no-lineal Modelo α + α datos ± ± El problea se trata en Press, Flanner, Teuols &Vetterling; Nuerical Recipes in {Fortran, c, Pascal} ± ± M M ± ± En este curso consideraos que no ha incertidubre en las s Esto es, los datos son de la fora: Consideraos χ ( α,α ) + α ) 8 ± 0 ± ± 0 ± M M ± 0 ± le daos aor peso a puntos con enor incertidubre
χ α Si + α ) 0 α α i,,... * ( ) χ α α α + α ) 0, el problea queda igual 6. Incertidubre en los paráetros Propagación de errores: si z f (, ), dz f f d + d Sua (valor edio cuadrático; rs) para calcular incertidubre en z z f + f Incertidubre en z en térinos de las incertidubres en & (, ) Regresaos al ajuste de una línea recta α + α con paráetros ajustables α, α A M { } ; en este caso α α α M A T Aα A T α α 9
Sea * S S S * S S S α α Si * S S, α α S S * S S S S * α S S S S S S S S S S S S * atriz de covarianzas S S S S * S S S α * S S S Suponiendo incertidubre en solaente α S S S S S S ( ± ) Con esto podeos calcular la incertidubre en α α α S S ( S S ) S { S * S S + S S } S S S S * S 4 4 + S α S De anera siilar α * 0
Nótese que * S S S S S S α * cov α,α cov ( α,α ) ( ) α Resultados del ajuste α ± α α ± α Si consideraos el caso en que todas las incertidubres de las ordenadas son iguales o no las ha (i.e. todas son iguales a uno), teneos que odificar las fórulas de las incertidubres: α S α S S χ n α * * α * χ n S Para propósito de eáenes en el curso de FMM, bastará con calcular, * para obtener las incertidubres en los paráetros (dejando indicado que éstas ha que ultiplicarlas por χ n. 7. El problea de la recta a través de tres puntos Regreseos al odelo α + α con datos A ± ± ; esto es,,,. ± α α α R R
Considerando que la solución al problea de ínios cuadrados está dada por A T Aα α α + + α + + + + α + + + + Siplificaos el problea suponiendo que las abscisas están dadas por {-δ, 0, δ}; con 0 α esto obteneos: 0 δ α + + δ( ). La solución del problea es: α α 0 + + 0 + + 0 δ δ( ) + + 0 δ δ( ) δ α + + ± intercepto de la recta es la altura proedio; incertidubre en el intercepto : α δ ± δ pendiente es la diferencia de las alturas laterales con incertidubre : δ χ Teneos casos etreos (recordeos que ): Incertidubre en pendiente pequeña Incertidubre en pendiente grande δ << δ >> odelo de paráetros + + ± + δ ± δ odelo de paráetro: nos da la altura pero nos dice que no toeos en cuenta la pendiente + + ±
8. Resuen Ajuste de odelos utilizando ínios cuadrados lineales es equivalente a buscar una aproiación al vector de -diensiones en un subespacio de n-diensiones (odelo con n paráetros ajustables). La ejor aproiación utilizando la nora euclideana está dada por A T Aα. Para el ajuste de la recta ás cercana a puntos utilizaos χ ( + α )). ( ) es la atriz de covarianzas nos da las incertidubres en los paráetros (caso especial cuando no ha incertidubres en las ordenadas o todas las incertidubres son iguales: ultiplicaos por La inversa de A T A χ n ). Modelos coo α e α o α α ( ) se pueden linealizar Modelo lineal ás general de n paráetros para dos variables es f 0 (, ) α f (, ) + α f (, ) +... + α n f n (, ) ; en este caso, ( A T A)α A T f ( f, f ) ( f, f ) ( f, f ) f ( f, f ) ( f, f ) ( f, f ) f α α α ( f, ) ( f, ). ( f, )