TEMA 4. Procediments de contrastació i selecció de models 1. Introducció i principis generals de contrastació 2. Contrastos de validació 3. Tres contrastos assimptòtics: raó de versemblança, Wald i multiplicadors de Lagrange 4. Instruments per a la selecció de models 5. Exercicis pràctics Econometria II - Tema 4 Curs 2006-2007 - Prof. Raúl Ramos 1
i. Introducció 1. Introducció i principis generals de contrastació Els contrastos d hipòtesi es basen en la construcció d estadístics -a partir d una determinada mostra- que permetin decidir, amb un nivell de confiança raonable, si aquestes dades podrien haver estat generades per una població amb unes determinades característiques. Objectiu bàsic dins aquest tema: podem refiar-nos dels resultats del model que hem especificat per treure conclusions econòmiques? Econometria II - Tema 4 Curs 2006-2007 - Prof. Raúl Ramos 2
i. Principis generals de contrastació El primer pas sempre consisteix en definir la hipòtesi a contrastar. Normalment cal definir una hipòtesi nul la (H 0 ) i una hipòtesi alternativa (H A ) El procediment seguit per a contrastar hipòtesis consisteix a establir una regla de decisió basada en l evidència empírica. L espai mostral es divideix en dues regions: la regió de rebuig de la hipòtesi nul la i la regió d acceptació on no es rebutja la hipòtesi nul la. Econometria II - Tema 4 Curs 2006-2007 - Prof. Raúl Ramos 3
Qualsevol contrast dona lloc a dos tipus d error: Error tipus I: el contrast ens porta a rebutjar la hipòtesi nul la quan és certa Error tipus II: el contrast ens porta a no rebutjar la hipòtesi nul la quan aquesta és falsa A partir d aquests errors es defineixen dos conceptes: Nivell de significació o tamany del contrast: probabilitat de cometre un error tipus I Potència del contrast: probabilitat de rebutjar la hipòtesi nul la quan aquesta és falsa (1-probabilitat d error tipus II) Econometria II - Tema 4 Curs 2006-2007 - Prof. Raúl Ramos 4
El nivell de significació del contrast està sempre sota control de l investigador, és a dir es tria el nivell d error tipus I que s està disposat a assumir. Ara bé, cal tenir en compte que com més petit sigui, però això augmentaria l error tipus II. Per tant, el que intentem és que per un determinat nivell d error tipus I, el procediment de contrastació triat tingui una probabilitat associada a l error tipus II el més petita possible. Habitualment, definirem un estadístic de prova calculat a partir de les dades de partida i el compararem amb un valor crític d una determinada distribució un cop fixat el nivell de significació que volem assumir. La regla de decisió habitual ens diu que si l estadístic de prova és més gran que el valor crític, rebutjarem H 0. Econometria II - Tema 4 Curs 2006-2007 - Prof. Raúl Ramos 5
Validació vs. selecció de models Hi ha diferents procediments de contrastació i diferents tipus de contrastos. En el context del MRLMG, podem distingir dos grans tipus de contrastos: Contrastos de validació (o d especificació errònia) Constrastos de selecció de models (o d especificació) Per models ennierats ( anidados ) Per models no ennierats Quan s ha de fer servir cada contrast? Quines característiques/propietats tenen? Econometria II - Tema 4 Curs 2006-2007 - Prof. Raúl Ramos 6
2. Contrastos de validació Els contrastos de validació és caracteritzen perquè la hipòtesi alternativa no està definida de manera exacta. Idea bàsica: Permeten determinar si el MRLMG especificat compleix uns requisits mínims que garanteixen la validesa de la inferència realitzada i, per tant, que les conclusions del model són valides. Es tracta d un conjunt de contrastos ja vistos a l Econometria I i als primers temes de l Econometria II i que sovint s han complementat amb anàlisis gràfiques. Econometria II - Tema 4 Curs 2006-2007 - Prof. Raúl Ramos 7
Podem agrupar aquests contrastos en tres categories: b. Anàlisi dels paràmetres estimats i. Significació econòmica: signe i magnitud ii. Significació estadística individual (t) i global (F) c. Anàlisi dels residus MQO i. Anàlisi gràfica (linealitat, outliers, terme de pertorbació no esfèric, ) ii. iii. Distribució dels residus (histograma, contrast de Bera-Jarque) Contrastos específics (autocorrelació, heteroscedasticitat) d. Canvi estructural i valoració de la capacitat predictiva i. Canvi estructural: Chow, Cusum i Cusum-q ii. Capacitat predictiva: Error absolut mig (EAM), Error quadràtic mig (EQM), Error percentual absolut mig (EPAM) Econometria II - Tema 4 Curs 2006-2007 - Prof. Raúl Ramos 8
Cal recordar els següents aspectes d aquests contrastos: Hipòtesi nul la i alternativa (quin és l objectiu del contrast? què pretenem analitzar?) Procediment del contrast (com s obté l estadístic de prova i amb quina distribució l hem de comparar) Regla de decisió (com es defineixen els espais de rebuig i no rebuig de la H 0 ) Quina és la conclusió del contrast? (perquè ens ha servit?, què hem après del nostre model?) Limitacions del contrast (quan podem fer-lo servir amb garanties i quan no) Econometria II - Tema 4 Curs 2006-2007 - Prof. Raúl Ramos 9
3. Tres contrastos assimptòtics: raó de versemblança, Wald i multiplicadors de Lagrange Tots tres es basen en el càlcul de la funció de versemblança. A continuació s ofereixen algunes idees bàsiques sobre cadascun d aquests tres contrastos: Raó de versemblança Wald Multiplicador de Lagrange Econometria II - Tema 4 Curs 2006-2007 - Prof. Raúl Ramos 10
i. Introducció El procediment de contrastació a que estem més habituats pren com a punt de partida la utilització d intervals de confiança. Aquest mètode és especialment adequat quan es contrasta una hipòtesi nul la relativament senzilla, és a dir quan conté un únic paràmetre, per exemple H 0 :θ= θ 0 davant una hipòtesi alternativa com H A : θ θ 0 La idea és que un cop s ha estimat θ, es calcula un interval pel nivell de confiança triat al voltant de θˆ i es rebutja H 0 si θ 0 cau fora d aquest interval. Econometria II - Tema 4 Curs 2006-2007 - Prof. Raúl Ramos 11
i. Wald Un procediment de Wald consisteix a avaluar la discrepància amb que la estimació realitzada satisfà les restriccions que s especifiquen a la hipòtesi nul la. Per exemple, si volem contrastar H 0 :θ= θ 0 davant una hipòtesi alternativa com H A : θ θ 0 La idea és que un cop s ha estimat θ, es calcula la discrepància entre el valor estimat i el valor de la hipòtesi: θˆ θ Econometria II - Tema 4 Curs 2006-2007 - Prof. Raúl Ramos 12
Ara bé per tal de decidir si aquesta diferència es gran o petita, cal comparar-la amb la variància de l estimador: ( θˆ θ ) / var( θˆ) Aquest estadístic es distribueix com una khi-quadrat amb un grau de llibertat de manera que també resulta fàcil establir una regla de decisió. Econometria II - Tema 4 Curs 2006-2007 - Prof. Raúl Ramos 13
i. Raó de versemblança El procediment de la raó de versemblança es basa en la utilització de la funció de versemblança. De manera similar a l estimació màxim versemblant, és possible avaluar el valor de la funció de versemblança en funció de dos conjunts diferents de valors pels paràmetres de la funció. Econometria II - Tema 4 Curs 2006-2007 - Prof. Raúl Ramos 14
Imaginem, per exemple, que s estableix una H 0 : θ Θ davant una H A : θ Ω. Si denotem per L(Θ) i per L(Ω), els valors màxims de la funció de versemblança per a aquests conjunts de valors, la diferència entre aquests valors es pot comparar a partir de l estadístic 2[ln(L(Θ))-ln(L(Ω))] que es distribueix d acord amb una khi-quadrat amb K graus de llibertat, on K és el nombre de restriccions que defineixen el subespai Θ. De manera anàloga al procediment anterior, també resulta fàcil establir una regla de decisió. Econometria II - Tema 4 Curs 2006-2007 - Prof. Raúl Ramos 15
i. Multiplicadors de Lagrange El procediment dels Multiplicadors de Lagrange també es basa en la utilització de la funció de versemblança. La idea és que a partir de l estimador de màxima versemblança sota les restriccions de la Hipòtesi θˆr nul la ( ) podem obtenir el següent estadístic: ML = ln L( θˆ R ) I θˆ 1 ( R ) θˆ R ln L( θˆ θˆ Aquest estadístic es distribueix con una khi-quadrat amb K graus de llibertat on K és el nombre de restriccions avaluat. R R ) Econometria II - Tema 4 Curs 2006-2007 - Prof. Raúl Ramos 16
i. Representació gràfica dels tres tipus de contrastos Greene (1999), p. 143 Novales (1993), p. 392 Econometria II - Tema 4 Curs 2006-2007 - Prof. Raúl Ramos 17
i. Relació entre Wald, RV i ML Tots tres contrastos són equivalents a nivell assimptòtic, malgrat que en mostra finita es compleix la següent desigualtat: Wald > RV > ML L elecció d un o altra estarà en funció de la complexitat de càlcul. Cal tenir en compte que els requisits d informació són diferents en cada cas: Wald RV ML General Sí Sí No Restringit Molts contrastos populars són casos particulars d aquests. No Sí Sí Econometria II - Tema 4 Curs 2006-2007 - Prof. Raúl Ramos 18
1. Instruments per a la selecció de models Un aspecte clau dels contrastos de selecció de model és que es disposa d una hipòtesi alternativa clarament definida. L objectiu bàsic d aquests instruments consisteix a seleccionar o discriminar entre dos models o dues hipòtesis alternatives. Cal distingir entre: Models ennierats (totes les variables explicatives d un dels models estan també presents a l altre model). Models no ennierats (no es dóna la situació anterior). Econometria II - Tema 4 Curs 2006-2007 - Prof. Raúl Ramos 19
i. Models alternatius ennierats Hi ha tot un conjunt d instruments (ja coneguts) per a discriminar entre models ennierats Per exemple, H + H X + 0 : Yi = β 1 + β 2 X 2i +... + β K X Ki Ui A : β 2 = 1- β 1 Yi = β 1 + (1 β 1) X 2i +... + β K Ki U i En aquests casos, el contrast de restriccions es pot realitzar a través dels tests habituals: t, F, etc. Econometria II - Tema 4 Curs 2006-2007 - Prof. Raúl Ramos 20
i. Models alternatius no ennierats En aquest cas, és possible utilitzar alguns instruments diferents als ja coneguts. Per exemple, H = X i + U H = Z + V 0 : Yi β 1 + β 2 A : Yi α 1 + α 2 i i i Com podem seleccionar entre aquests dos models alternatius? Econometria II - Tema 4 Curs 2006-2007 - Prof. Raúl Ramos 21
Es pot discriminar entre tots dos models a través de diferents instruments: Coeficient de determinació corregit Criteris d informació: d Akaike (AIC) de Schwarz (SC) Basats en la capacitat de predicció error de predicció final Econometria II - Tema 4 Curs 2006-2007 - Prof. Raúl Ramos 22
Coeficient de determinació corregit Es calcula a partir de la següent expressió: R 2 = 1 N N 1 K (1 R 2 ) Quan el nombre de variables explicatives K augmenta, la fracció (T-1)/(T-K) també augmenta mentre que (1-R 2 ) disminueix, ja que l R 2 augmenta per definició. La idea és que amb aquest estadístic tots dos efectes es compensen i permet, per tant una valoració adequada de la bondat d ajust del model. Econometria II - Tema 4 Curs 2006-2007 - Prof. Raúl Ramos 23
Criteri d informació d Akaike Es calcula a partir de la següent expressió: 2 2 AIC = ln( L) + K N N La idea bàsica d aquest instrument consisteix a seleccionar el model que implica la mínima pèrdua d informació. Cal tenir en compte que a mesura que augmenta el valor de la funció de versemblança, l AIC disminueix (corregint aquest valor pel nombre d explicatives: a mesura que augmenta K, AIC també augmenta) i per tant s hauria d agafar aquell model amb menor valor d AIC (aquell amb menor SQE). Econometria II - Tema 4 Curs 2006-2007 - Prof. Raúl Ramos 24
Criteri d informació de Schwarz Es calcula a partir de la següent expressió: 2 K ln( N) SC = ln( σˆ ) + N Com més gran sigui la variància estimada del terme de pertorbació, major serà el valor d SC (tenint en compte el nombre d observacions i el nombre de variables del model). Cal triar, per tant, el model amb el menor valor d SC. Econometria II - Tema 4 Curs 2006-2007 - Prof. Raúl Ramos 25
Error de predicció final Es calcula a partir de la següent expressió: EPF = N N + K K ( σˆ 2 ) Com més gran sigui la variància estimada del terme de pertorbació, major serà el valor d EPF (tenint en compte el nombre d observacions i el nombre de variables del model). Cal triar, per tant, el model amb el menor valor d EPF Econometria II - Tema 4 Curs 2006-2007 - Prof. Raúl Ramos 26
Temporització 2 sessions teòriques de 2 hores Bibliografia Novales, Econometría, capítol 2, apartat 12 capítol 11, apartat 5 Econometria II - Tema 4 Curs 2006-2007 - Prof. Raúl Ramos 27