Capítulo 3. El modelo de regresió múltiple. Jorge Feregrio Feregrio
Idetificació del modelo La idetificació del objeto de ivestigació permitirá realizar ua búsqueda exhaustiva de los datos para llevar a cabo ua aproximació del comportamieto del feómeo mediate los hechos estilizados. La búsqueda de la iformació de las variables, la relació teórica y la descripció estadística de estas será útil para determiar la metodología de aálisis. La elecció de la variable depediete y las idepedietes coformará ua relació fucioal múltiple para describir el feómeo ecoómico mediate la metodología ecoométrica propuesta.
La presetació del modelo E el modelo de regresió múltiple las variables exógeas (Χ j ), asociadas a coeficietes lieales costates (β j ), idica el efecto codicioado de cada variable idepediete sobre la variable depediete (Y), la especificació geeral del modelo co cico variables idepedietes es la siguiete: Y = β 0 + β 1 Χ 1 + β 2 Χ 2 + β 3 Χ 3 + β 4 Χ 4 +β 5 Χ 5
Los errores La relació etre las variables es iexacta, por lo tato, la evaluació se realiza e térmios probabilísticos. La forma fucioal reducida de la estimació de la regresió múltiple, al expresarse e térmios probabilísticos debe icorporar u térmio de error (ε i ). y i = b 0 + 5 j=1 b j x ji + ε i
Objetivos de la regresió 1) Estimar los valores de ua variable idepediete ( y) mediate ua fució lieal de u úmero (K) variables idepedietes observadas x j, dode j = 1,., K 2) Obteer los efectos estadísticos de cada variable idepediete, mediate la estimació de los coeficietes b j, sobre la variable depediete ( y). 3) Estimar la exogeeidad débil, para mostrar que la distribució margial de la variable idepediete, al o coteer iformació relevate para estimar los parámetros de iterés, se puede elimiar.
Supuestos para la estimació de la regresió múltiple 1) Las variables idepedietes x ji so úmeros fijos o bie variables aleatorias X j, idepedietes del térmio de error ε i. 2) El valor esperado de la variable aleatoria ( y) es ua fució de las variables idepedietes X j 3) Los térmios de error ε i so variables cuya media esperada es igual a cero y la variaza es costate σ 2 para todas las observacioes: E ε i = 0 y E ε i 2 = σ 2 para i = 1,.,
Supuesto para la estimació 4) Los térmios de error aleatorios ε i, o está correlació etre sí E ε i ε j = 0 para todo i = j 5) Es imposible hallar u cojuto de úmeros que o sea iguales a cero tal que, c 0 + c 1 x 1i + c 2 x 2i + + cx ki = 0
Estimació mediate los MCO E modelo de Míimos Cuadrados Ordiarios (MCO), los coeficietes se obtiee mediate la miimizació de los errores o la suma de residuos explicados al cuadrado (SCE) Para miimizar la SCE se procede de la SCE tiee la siguiete represetació: siguiete forma, matemática la SCE = e i 2 = SCE = (y i y i ) 2
El resultado obteido al miimizar los errores e el MCO El desarrollo exteso del MCO es resultado de la aplicació de cálculo y se obtiee 3 ecuacioes lieales y 3 icógitas, (b 0, b 1, b 2 ) : = b 0 + b 1 x 1i + b 2 x 2i = y i b 0 x 1i + b 1 x 2 1i + b 2 x 1i x 2i = x 1i y i b 0 x 2i + b 1 x 1i x 2i + b 2 x 2 2i = x 2i y i
Iferecia estadística a partir de los resultados del MCO De la represetació de la regresió múltiple se ifiere, que e el caso de la primera variable idepediete (x 1i, b 1 ), esta explicada por la misma variable al cuadrado, y e el caso del otro coeficiete (b 2 ) esta explicado por la asociació etre las variables idepedietes. E la regresió los dos coeficietes asociados a cada variable idepediete explica el comportamieto de la variable depediete de forma sigificativa.
Notació matricial Y = Xβ + U La estimació objetivo del modelo, busca obteer los coeficietes estimados del modelo e relació a las variables idepedietes, para explicar la variable depediete ( Y) y su otació es la siguiete: Y = X β
Los resultados del MCO e la otació matricial Al respecto al vector de los coeficietes (β) teemos la siguiete otació matricial reducida: s β = XT Y X T Y + 2 (X T Xβ) s β = 2XT Y + 2 (X T Xβ) = 0 Para obteer los coeficietes estimados despejamos β β = (X T X) 1 X T Y
Las propiedades de errores para realizar iferecia estadística 1) La sumatoria de los errores e ua serie so igual a cero: e i x ij = 0. j = 1 k 2) La covariaza etre los errores y las variables explicativas a medida que aumeta el úmero de observacioes es igual cero: Cova = e i, x ij = 0 3) La variaza residual de los errores, e ausecia de sesgo, debe estar etoro a la misma variaza: s r 2 = 1 (k + 1) e i 2
La eficiecia del modelo y su poder explicativo La estabilidad de los coeficietes se aaliza mediate su distribució estadística, al igual que e la regresió simple se distribuye como ua ormal, es decir, la media es igual a cero y la desviació estádar es igual a uo. β~ N (0,1) Esto comportamieto asegura que los coeficietes estimados siga ua trayectoria ormal y o siga u comportamieto errático
El poder explicativo de los coeficietes El aálisis de probabilidad sobre los coeficietes, permite idetificar la ifluecia de cada variable a partir de la hipótesis plateada desde el diseño del modelo y su forma fucioal. El cotraste de hipótesis, se costruye mediate ua t de Studet co k grados de libertad: La hipótesis ula: La hipótesis alterativa: H 0 : β i = 0 H a : β i 0
La lectura de la sigificacia idividual La distribució del valor de los coeficietes para > 30 observacioes sigue ua distribució t -k-1, co ua probabilidad del 95% se ecuetra e el itervalo [-2,2]. Si t>2, se rechaza la hipótesis ula y se puede iferir estadísticamete que las variables idepedietes ifluye e la variable depediete, es decir, se acepta la hipótesis alterativa. H a : β i 0
El itervalo de cofiaza El criterio del itervalo de cofiaza está diseñado de la siguiete forma: P β i tαse β i 2 β i β i + tαse β i 2 = 1 α El criterio muestra la probabilidad de que el verdadero β i se ecuetra e el itervalo etre el coeficiete estimado ( β i ) y 2 desviacioes estádar (SE) a la derecha y a la izquierda.
El poder explicativo del modelo EL cotraste F, muestra si las variables explicativas e cojuto explica las variacioes de la variable idepediete. Se ha demostrado que los coeficietes β 1 = β 2 = = β k = 0 y además, sigue ua distribució F dado la siguiete forma: ( y i y i ) 2 k 2 e i k 1 ~F k, k 1
Criterios de la prueba F Cuado se acepta la hipótesis ula se debe a dos factores: 1) las variables o ifluye e la variable idepediete, 2) existe depedecia o lieal etre la variable explicada y algú regresor. Cuado se rechaza la hipótesis ula e el cotraste del test F, muestra que la variable depediete esta explicada por algua de las variables idepedietes.
Casos e el cotraste de la prueba F 1) Cuado el cotraste F es sigificativo y todos los coeficietes idividuales de acuerdo al cotraste de la t de studet tambié so sigificativos, todas las variables idepedietes so sigificativas. 2) Si el cotraste F es sigificativo y sólo alguos de los coeficietes idividuales so sigificativos de acuerdo al cotraste de la t de studet, las variables o sigificativas debe ser elimiadas del modelo. Otra solució, es realizar ua trasformació y estimar uevamete para verificar si la relació etre las variables o es lieal. 3) Cuado el cotraste de F es sigificativo y iguo de los coeficietes asociados a las variables es sigificativo, etoces podría estar presete u problema de multicoliealidad.
Casos e el cotraste de la prueba F El Test F muestra la proporció e que la variaza de los errores determia el poder explicativo del modelo. La otació matricial de la prueba, muestra que la diagoal de la matriz coocida, arroja los valores de la variaza (σ 2 ): d 00 d 11 D(X T X) 1 d ii d kk De esta forma, la distribució de los coeficietes estimados es la siguiete: β i ~ N (β i, σ d ii ) La desviació etre el coeficiete estimado ( β) y el coeficiete (β i ) e proporció a la iteracció e diagoal coocida se comporta como ua ormal.