3. La dstrbucó ormal multvarada Por qué es mportate la dstrbucó ormal multvarada? o Muchas de las téccas multvaradas supoe que los datos fuero geerados de ua dstrbucó ormal multvarada. o E la vda real alguos cojutos de datos sí se comporta como ua ormal multvarada. o Alguas estadístcas multvaradas tee dstrbucó astótca ormal multvarada debdo al T.C.L. Defcó: Sea X' ( X, K, ) = u vector aleatoro. Se dce que X tee X p ua dstrbucó ormal multvarada s su fucó de desdad está dada por dode p p / / ' f ( x) = ( π) Σ exp ( x µ ) Σ ( x µ ) I(, ) (x ), p µ R y Σ p p es ua matrz defda postva. = Cometaros: o E otacó: X N p (µ,σ) o Se puede demostrar que µ=e(x) y Σ=Var(X) ' o ( µ ) Σ x ( x µ ) de desvacoes estádar. es ua medda de dstaca etre x y µ e udades = E e = exp t' µ + t' Σt t'x o S X N p (µ,σ) () ( ) m X t Maestría: Admstracó de resgos 4 Aálss multvarado para resgos
Dstrbucó ormal bvarada: o Sea ' ( X, ) X = u vector aleatoro de dmesó p=, co µ =E(X ), X µ =E(X ), σ =Var(X ), σ =Var(X ) y ρ =Corr(X,X ). Etoces, det σ Σ = σ σ σ σ σ Σ = σ σ σ σ σ ( Σ ) = σ σ σ = σ σ ρ σ σ = σ σ ( ρ ) ' ( x µ ) Σ ( x µ )= x µ µ µ µ x x + ρ x ρ σ σ σ σ / ' f ( x,x ) = ( π) { σ σ ( ρ )} exp ( x µ ) Σ( x µ ) o Qué pasa s ρ =0? S ρ =0 f(x,x ) = f(x )f(x ) X y X so depedetes o Nota: Ver gráfcas aexas Curvas de vel (cotours): so cortes a ua altura f(x) costate. Es decr, { ( ) ( ) } ' x : x µ Σ x µ = c = elpsodes cetradas e µ o Los ejes de la elpsode va e dreccó de los egevectores de Σ - o La logtud de los ejes so proporcoales al recíproco de la raíz de los egevalores de Σ - Maestría: Admstracó de resgos 5 Aálss multvarado para resgos
Resultado 0: S Σ es defda postva tal que Σ - exste, etoces además Σ - es defda postva. Σ e = λe Σ e = e, λ o E resume, las curvas de vel de ua dstrbucó ormal p varada so elpsodes defdos por x tal que ' ( x µ ) Σ ( x µ ) = c Estas elpsodes está cetradas e µ y tee ejes ± c λ j e j, dode Σ e j = λ j e j, j=,,...,p. o S σ =σ y ρ =0 Las curvas de vel so círculos s σ σ ó ρ 0 Las curvas de vel so elpses Para qué me srve las curvas de vel de ua dstrbucó ormal multvarada?. Para costrur IC multvarados (regoes de cofaza)!! P ' {( X µ ) Σ ( X µ ) χ } = α (p), α Nota: Es posble demostrar que s Y = Σ / ( X µ ) y A es ua matrz de rago p etoces Y ' AY (p) χ. 3. Propedades Resultado. S X N p (µ,σ), etoces cualquer combacó leal a'x ( µ,a' a) = ax + a X + L + a pxp N a' Σ. Maestría: Admstracó de resgos 6 Aálss multvarado para resgos
També, s a'x N( a' µ,a' Σa) DEM. para toda a, etoces X N p (µ,σ). Resultado. S X N p (µ, Σ) y A (q p) etoces, las q combacoes leales a AX = a q X X + La M + La tee ua dstrbucó N q (Aµ, AΣA ). Además X+d, dode d (p ) es u vector de costates, tee ua dstrbucó N p (µ+d, Σ). DEM. p qp X X p p Resultado 3. Todos los subcojutos de X (p ) tee ua dstrbucó ormal. S X N p (µ, Σ) y s partcoamos X, µ y Σ como X (q ) X =, X ((p q) ) µ (q ) µ =, µ ((p q) ) Σ = (q q) ((p q) q) Σ Σ Σ Σ (q (p q)) ((p q) (p q)) etoces, X N q (µ, Σ ). DEM. Resultado 4. a) S X (q ) y (q ) X so depedetes etoces Cov ( X,X ) = 0(q q ) Maestría: Admstracó de resgos 7 Aálss multvarado para resgos
b) S X X N X = q+ q µ Σ, µ Σ depedetes s y solo s Σ =0. c) S X N ( µ Σ ) y X N ( µ Σ ) q, depedetes, etoces Σ, etoces X y X so Σ además X y X q, X N X q+ q µ Σ, µ 0 0. Σ Ejemplo: X N 3 (µ, Σ), dode 4 Σ = 0 Qué varables so depedetes?. 0 0 0 3 Resultado 5. Sea X µ Σ Σ X = Np, co Σ > 0. X µ Σ Σ Etoces, la dstrbucó codcoal de X dado X =x es ormal co parámetros ( X X = x ) = µ + Σ Σ ( ) E µ Var DEM. x ( X X = ) = Σ Σ Σ Σ x Maestría: Admstracó de resgos 8 Aálss multvarado para resgos
Resultado 6. Sea X N p (µ, Σ) co Σ >0. Etoces, ' a) ( X µ ) Σ ( X µ ) χ ' b) P ( X µ ) Σ ( X µ ) (p) { χ } = α (p), α dode ( p), α χ es el cuatl superor de orde α DEM. Resultado 7. Sea X,X,...,X vectores depedetes tal que X N p (µ, Σ), co dstta meda y msma matrz de var-cov. Etoces, para c,...,c escalares costates, Y = + µ Σ cx L cx Np c, c. = = Más aú, Y y Y multvarada co varaza bx + LbX = tee dstrbucó cojuta ormal ( c'c) Σ ( b'c) Σ ( ) ( ) b'c Σ b'b Σ 3. Estmacó máxmo verosíml o Sea X,X,...,X ua muestra aleatora de ua poblacó X N p (µ, Σ). La fucó de desdad de la muestra está dada por: f X, K,X p / / ' ( x, K,x ) = ( π) Σ exp ( x µ ) Σ ( x µ ) = p / / ' ( π) Σ exp ( x µ ) Σ ( x µ ) = = Maestría: Admstracó de resgos 9 Aálss multvarado para resgos
o La fucó de verosmltud para ua muestra observada (X,...,X )=(x,...,x ) está dada por, L vsta como fucó de µ y Σ. ( µ, Σ x) = f ( x, K,x µ, Σ) X, K,X o Los estmadores máxmo verosímles de µ y Σ so aquellos valores µˆ y Σˆ que maxmza la fucó L(, Σ x) ecestamos alguos resultados. µ. Para poder obteer estos estmadores Resultado 8. Sea A (k k) smétrca y x (k ) u vector. Etoces, a) x Ax = tr(x Ax) = tr(axx ) b) tr ( A) = k = λ, dode λ s so los egevalores de A o Se puede demostrar que la fucó de verosmltud se puede rescrbr como L p / / ' ' ( µ, Σ x) = ( π) Σ exp tr Σ ( x x)( x x) ( x µ ) Σ ( x µ ) DEM. = Resultado 9. Dada ua matrz B (p p) smétrca postva defda y u escalar b>0 se sgue que Σ b exp tr b pb pb ( Σ B) B ( b) e para toda matrz defda postva Σ (p p) co gualdad s y solo s Σ = ( )B. b Maestría: Admstracó de resgos 30 Aálss multvarado para resgos
DEM. Joso & Wcher (00). Teorema. Sea X,...,X ua muestra aleatora de ua poblacó X N p (µ, Σ), etoces los EMV de µ y Σ está dados por, DEM. ' µ ˆ = X y Σˆ = ( X X)( X X) = S =. ' o Nota: Las estadístcas X y ( X)( X X) sufcetes. = X so estadístcas Teorema. Sea X,...,X ua muestra aleatora de ua poblacó X N p (µ, Σ). Etoces, a) X Np µ, Σ = ' b) ( ) S = ( X X)( X X) W ( Σ) Dstrbucó Wshart co g.l. y parámetro Σ c) X y S so depedetes DEM. o Fucó de desdad Wshart. Sea A ua matrz defda postva. La fucó de desdad Wshart co g.l. y parámetro Σ evaluada e A está dada por, Maestría: Admstracó de resgos 3 Aálss multvarado para resgos
w ( A Σ) = A p( ) / ( p ) / π p(p ) / 4 exp Σ { ( ) tr( AΣ )} ( ) / p = Γ (( ) ) Teorema. Teorema Cetral del Límte. Sea X,...,X ua muestra aleatora de ua poblacó p varada co meda µ y matrz de var-cov Σ fta. Etoces, a) N µ, Σ X p ó ( X µ ) N ( 0, Σ) ' b) ( X µ ) S ( X µ ) χ S es grade relatvo a p. p (p) o Nota: Para pequeña relatvo a p y s X N p (µ, Σ), la dstrbucó exacta e el puto (b) del Teorema ateror es: T ' ( )p = ( X µ ) S ( X µ ) F(p, p), ( p) y es llamada dstrbucó T de Hotellg. Itervalos de cofaza smultáeos para el vector de medas µ. Sea X,...,X ua muestra aleatora de ua poblacó X N p (µ, Σ). Etoces, las regoes de cofaza al ( α) 00% para µ so: { : χ(p), α} ' a) S Σ es coocda µ ( x µ ) Σ ( x µ ) ' b) S Σ es descoocda ( x µ ) S ( x µ ) ( )p : F(p, p),, ( p) µ α dode ( p), α χ y F (p, p), α so cuatles superores de orde α. Maestría: Admstracó de resgos 3 Aálss multvarado para resgos
c) Itervalos cojutos de Boferro: Costrur IC uvarados para µ j, j=,...,p, de vel ( α/p). De esta maera por la desgualdad de Boferro la cofaza cojuta de todos los tervalos es de al meos ( α). 3.3 Valdacó del supuesto de ormaldad La valdacó del supuesto de ormaldad es muy mportate debdo a que la mayoría de las téccas estadístcas multvaradas supoe que las observacoes X provee de ua dstrbucó ormal multvarada. Para verfcar este supuesto de ormaldad os basaremos e las propedades de la dstrbucó ormal multvarada: Las dstrbucoes margales so todas ormales Combacoes leales so també ormales Las curvas de vel so elpsodes Nos cocetraremos prcpalmete e valdad ormaldad uvarada y bvarada debdo a que so pocos y raros los casos que cumple co estas dos codcoes y que o cumple co la ormaldad multvarada. VALIDACIÓN DE NORMALIDAD UNIVARIADA: o Hstogramas o dagramas de caja y brazos: buscamos smetría, umodaldad, etc. Maestría: Admstracó de resgos 33 Aálss multvarado para resgos
o Regla empírca: S X j N (µ j, σ jj ), S es grade uo esperaría que { X j ( µ j ± σ jj )} = 0. 683 { X ( µ ± σ )} 0. 954 P P j j jj = pˆ j =proporcó muestral de obs. e el tervalo ( j s jj ) pˆ =proporcó muestral de obs. e el tervalo ( ) j x ± 0.68 x ± 0.95 j s jj Más aú, usado la aproxmacó muestral a la dstrbucó de muestreo pˆ y pˆ j, de j ó (0.683)(0.37).396 pˆ j 0.683 > 3 =, (0.954)(0.046) 0.68 pˆ j 0.954 > 3 = dcaría que las observacoes de la varable X j o so ormales. o Gráfca de probabldad ormal (Q-Q plot). Para 0 de prefereca. Sea X( ) X() L X() las estadístcas de orde de la varable X j, #X 's X() P( X j X() ) que por razoes aalítcas de cotudad se puede aproxmar por ( /)/. Por otro lado, bajo ormaldad ( X ( ) ) q() E =, dode q () es u cuatl de orde ( /)/,.e., q () es tal que ( Z q ) = ( / ) / P ( ), co Z N(0,). Maestría: Admstracó de resgos 34 Aálss multvarado para resgos
La gráfca de probabldad ormal cosste e grafcar x () vs. q (). S los datos so ormales, los pares (x (), q () ) estará relacoados lealmete. Ua prueba de hpótess basada e estos cuatles es: H 0 : X j es ormal vs. H : X j o es ormal { r } RR = q k, dode, r q = coefcete de correlacó muestral etre (x (), q () ) k α = puto crítco (ver copa pag. 8 de la refereca básca) α VALIDACIÓN DE NORMALIDAD EN COMBINACIONES LINEALES: o Combacoes leales de las p varables X j da ua v.a. uvarada sobre la cual se puede vestgar su ormaldad usado las téccas presetadas aterormete. Qué combacoes leales so de terés? ê ' X y ê p ' X, dode, Sê j = λˆ ê, j=,...,p so los egevectores de la matrz S. j j VALIDACIÓN DE NORMALIDAD BIVARIADA (MULTIVARIADA): o Gráfcas de dspersó de dos varables: Las observacoes debe de formar ua elpse para dcar ormaldad bvarada. o Regla empírca: Recordemos, s X N p (µ, Σ) etoces, ' ( X µ ) Σ ( X µ ) χ (p), Maestría: Admstracó de resgos 35 Aálss multvarado para resgos
P ' {( X µ ) Σ ( X µ ) χ } = α (p), α S es grade uo esperaría que ( α)00% de las observacoes cayera e la elpse dada por Lo más comú es tomar α=0.5 ' { x : ( x x) S ( x x) χ }. (p), α o Gráfca de probabldad J-cuadrada (Q-Q plot): Como e el caso de que X N p (µ, Σ) ( X µ ) Σ ( X µ ) χ S y p so grades se esperaría que ' (p) d = ' ( X X) S ( X X) χ (p), =,..., Ua forma de verfcar esto es grafcado las estadístcas de orde d () cotra su valor esperado bajo ua dstrbucó χ (p),.e., grafcar d () vs. q (), dode q () es tal que ( J q ) = ( / )/ P ( ), co J χ (p). Los putos e esta gráfca debe de estar sobre ua líea recta que pasa por el orge co pedete uo para dcar ormaldad multvarada. o Deteccó de observacoes extremas: Ua observacó multvarada X es extrema s ' ( X X) S ( X X) > χ (p), α co α pequeña (por lo geeral se toma α=0.00). Por otro lado, ua observacó es extrema e ua sola varable s Maestría: Admstracó de resgos 36 Aálss multvarado para resgos
Z X X j j j = > S jj 3.5 3.4 Trasformacoes para cosegur ormaldad S los datos o satsface el supuesto de ormaldad multvarada, es ecesaro trasformarlos. TRANSFORMACIONES UNIVARIADAS: o Sugerdas por cosderacoes teórcas: ) S X co coteos X X ) S X so proporcoes log X + X 3) S X so correlacoes log X o Sugerdas por los datos: Trasformacoes poteca s λ=0 X 0 = logx. λ X, para λ etero o fraccoaro. E partcular, a) Para acortar valores grades de X:..., X -, X 0, X /4, X / b) Para alargar valores grades de X: X, X 3,... Maestría: Admstracó de resgos 37 Aálss multvarado para resgos
o Trasformacó de Box y Cox: λ X ( ) λ X, = λ logx, s λ 0 s λ = 0 para λ real. La trasformacó X (λ) es cotua e λ para X>0. El valor de λ óptmo se puede estmar por máxma verosmltud,.e., λˆ es tal que maxmza la expresó ( λ) ( λ) log L( λ) = log ( x x ) + ( λ ) log x. = = La maxmzacó se puede hacer umércamete grafcado logl(λ) vs. λ. U procedmeto alteratvo para ecotrar λˆ es costrur y ( λ) = λ x = λ x ( λ ) /, =,...,, calcular la varaza muestral de las ( ) y λ s y el mímo de esta varaza ocurre e el máxmo de logl(λ). o Nota: No hay garatía de que exsta ua trasformacó óptma que coverta ua varable o ormal a ormal. o Trasformacoes multvaradas: Usar la trasformacó de Box y Cox e cada varable y maxmzar smultáeamete la verosmltud cojuta,.e., p ( λ,, λ ) = logs( λ) + ( λ ) p j log xj j= = logl K, dode S(λ) es la matrz de var-cov muestrales de Maestría: Admstracó de resgos 38 Aálss multvarado para resgos
x ( λ) ' λ λp x xp =, K,. λ λ p Nota: U puto cal para la maxmzacó so los valores ˆλ j, j=,...,p que maxmza la verosmltud uvarada. Maestría: Admstracó de resgos 39 Aálss multvarado para resgos