Modelo lineal general (K variables) Interpretación y usos Mariana Marchionni marchionni.mariana@gmail.com Mariana Marchionni Modelo lineal general 1 / 45
Temario de la clase 1 El modelo lineal general o modelo con K variables 2 Uso de variables explicativas binarias 3 Uso de no linealidades en las variables 4 Uso de interacciones entre variables 5 Ejemplo empírico: determinantes de los salarios Mariana Marchionni Modelo lineal general 2 / 45
Vimos el modelo lineal simple bajo los supuestos clásicos Y i = α + βx i + µ i, i = 1,...n 1 E[µ i ] = 0, i = 1,..., n. 2 V [µ i ] = σ 2, i = 1,..., n. 3 Cov[µ i, µ j ] = 0, i j. 4 Las X i no son aleatorias y no son todas iguales Mariana Marchionni Modelo lineal general 3 / 45
El modelo lineal general (K variables) Simplemente agregamos variables explicativas: Y i = β 1 + β 2 X 2i + β 3 X 3i +... + β K X Ki + µ i, i = 1,..., n Ahora los regresores son X 2,..., X K Por comodidad de notación: la primera variable es X 1i = 1 i, que corresponde al intercepto del modelo Mantendremos todos los supuestos clásicos salvo una pequeña modicación en la segunda parte del supuesto 4 No multicolinealidad perfecta No hay dependencia lineal entre las variables explicativas (ya no alcanza con que los regresores varíen entre observaciones) Mariana Marchionni Modelo lineal general 4 / 45
El modelo lineal general (K variables) Simplemente agregamos variables explicativas: Y i = β 1 + β 2 X 2i + β 3 X 3i +... + β K X Ki + µ i, i = 1,..., n Ahora los regresores son X 2,..., X K Por comodidad de notación: la primera variable es X 1i = 1 i, que corresponde al intercepto del modelo Mantendremos todos los supuestos clásicos salvo una pequeña modicación en la segunda parte del supuesto 4 No multicolinealidad perfecta No hay dependencia lineal entre las variables explicativas (ya no alcanza con que los regresores varíen entre observaciones) Mariana Marchionni Modelo lineal general 4 / 45
No multicolinealidad perfecta Implica que ninguno de los regresores pueda expresarse como una combinación lineal de otros regresores. Entonces, no pueden existir constantes a j tales que: X k = j k a j X j Caso particular: ninguna de las variables X 2,..., X K puede ser una constante. Por qué? Notar: no multicolinealidad perfecta no correlación entre los regresores puede haber correlación siempre que no sea perfecta no alcanza con que la relación no sea perfecta de a pares de variables Mariana Marchionni Modelo lineal general 5 / 45
Interpretación de los parámetros del modelo lineal general Y = β 1 + β 2 X 2i + β 3 X 3i +... + β K X Ki + µ i, i = 1,..., n Con E (µ i ) = 0 y regresores no aleatorios tenemos que: E(Y i ) = β 1 + β 2 X 2i + β 3 X 3i +... + β K X Ki El efecto marginal de X k viene dado por: E (Y i ) X ki = β k i Mariana Marchionni Modelo lineal general 6 / 45
Interpretación de los parámetros del modelo lineal general E (Y i ) X ki = β k i β k mide el efecto sobre E(Y i ) de cambiar marginalmente la k-ésima variable explicativa, manteniendo constantes todas las demás (derivada parcial) El signicado de marginalmente está atado a las unidades de medida de la variable explicativa (1 centavo, 1$, 1 mil $, 1 millón $, etc.) Mariana Marchionni Modelo lineal general 7 / 45
Interpretación de los parámetros del modelo lineal general ¾Y si el cambio no es marginal sino discreto? ¾Cuál es el efecto sobre E(Y i ) cuando X s cambia en X s? E(Y i ) = β 1 + β 2 X 2i + β 3 X 3i +... + β s (X si + X si ) +... + β K X Ki [β 1 + β 2 X 2i + β 3 X 3i +... + β s X si +... + β K X Ki ] E(Y i ) = β s X si Vale la regla de 3. Notar que dejamos constantes todas las demás variables explicativas (ceteris paribus) Mariana Marchionni Modelo lineal general 8 / 45
Podemos evaluar cambios discretos en variables de naturaleza continua Ejemplo: un aumento en el ingreso de los hogares de 25.000$ a 32.000$. También hay variables de naturaleza discreta: Variables de conteo (count variables): número de hijos por familia, número de veces que un estudiante repitió un año, número de visitas al médico, etc. Variables binarias o dummy Mariana Marchionni Modelo lineal general 9 / 45
Variables explicativas binarias ¾Cómo incorporamos al modelo variables explicativas que son cualitativas? género raza sector productivo región geográca Primero nos concentramos en los fenómenos binarios: se tiene o no cierta característica En un fenómeno binario hay sólo dos posibilidades y son excluyentes. un individuo es hombre o mujer un banco quebró o no quebró durante la crisis un país rmó o no rmó cierto acuerdo internacional un trabajador tiene seguro social o no lo tiene Mariana Marchionni Modelo lineal general 10 / 45
Variables explicativas binarias ¾Cómo incorporamos al modelo variables explicativas que son cualitativas? género raza sector productivo región geográca Primero nos concentramos en los fenómenos binarios: se tiene o no cierta característica En un fenómeno binario hay sólo dos posibilidades y son excluyentes. un individuo es hombre o mujer un banco quebró o no quebró durante la crisis un país rmó o no rmó cierto acuerdo internacional un trabajador tiene seguro social o no lo tiene Mariana Marchionni Modelo lineal general 10 / 45
¾Cómo incorporamos un fenómeno binario en el modelo? Creamos una variable articial que toma un valor cuando la característica de interés está presente y otro valor distinto cuando no lo está. Los valores son arbitrarios, pero es práctico elegir 1 y 0 Llamamos variable binaria o dummy a esa variable articial Ejemplo: queremos incorporar una variable que indique el sexo del individuo. Denamos la variable dummy d i = 1 si el individuo i es hombre, d i = 0 si el individuo i es mujer. obs. sexo d 1 mujer 0 2 hombre 1......... n hombre 1 Mariana Marchionni Modelo lineal general 11 / 45
Podríamos capturar la misma información deniendo la variable d al revés: que valga 1 para las mujeres y 0 para los hombres obs. sexo d (opción 1) d (opción 2) 1 mujer 0 1 2 hombre 1 0............ n hombre 1 0 Esta abitrariedad no modica los resultados, sólo condiciona la manera de interpretarlos Resulta útil que el nombre de la variable dummy sugiera cuál es la característica asociada con el valor 1. En la primer opción la variable podría llamarse hombre (hombre i = 1 para los hombres y hombre i = 0 para las mujeres) La característica asociada al valor 0 se conoce como categoría base. Siguiendo con la opción 1, mujer es la categoría base. Esto es clave para la interpretación (ya veremos) Mariana Marchionni Modelo lineal general 12 / 45
Ejemplo: modelo de los determinantes del salario W i = β 1 + β 2 aedu i + δhombre i + µ i Si E (µ i ) = 0 E(W i ) = β 1 + β 2 aedu i + δhombre i Notar que hay dos regresiones: Para los hombres: E [W i hombre i = 1] = β 1 + β 2 aedu i + δ Para las mujeres: E [W i hombre i = 0] = β 1 + β 2 aedu i Restando miembro a miembro: E [W i hombre i = 1] E [W i hombre i = 0]= β 1 + β 2 aedu i + δ 1 (β 1 + β 2 aedu i + δ 0) = δ Entonces δ es la diferencia entre el salario esperado de un hombre y de una mujer que tienen la misma educación Mariana Marchionni Modelo lineal general 13 / 45
E(W i ) = β 1 + β 2 aedu i + δhombre i con δ > 0 La recta de regresión de los hombres es paralela a la de las mujeres (misma pendiente) pero tiene una ordenada al origen mayor. Mariana Marchionni Modelo lineal general 14 / 45
El fenómeno binario tiene 2 categorías (hombre o mujer), pero alcanza con una sola variable dummy para diferenciar entre ambas. Dada la información de la variable dummy hombre, la variable mujer no agrega nada, es redundante. obs. sexo d (opción 1): hombre d (opción 2): mujer 1 mujer 0 1 2 hombre 1 0............ n hombre 1 0 Regla: si hay 2 categorías incluimos sólo una dummy. ¾Qué pasa si incluimos las dos variables dummy en el modelo? Trampa de la variable binaria Mariana Marchionni Modelo lineal general 15 / 45
¾Cuál de las 2 variables dummy incluir? Opción 1: W i Opción 2: W i = β 1 + β 2 aedu i + δ hombre i + µ i = β 1 + β 2 aedu i + η mujer i + µ i Puede mostrarse que las 2 opciones son equivalentes con δ = η La interpretación cambia con la opción (¾cuál es la categoría base en cada caso?) Supongamos δ = 5 ( η = 5) Interpretación basada en la Opción 1: el salario esperado de un hombre es 5$ más alto que el de una mujer (categoría base) con la misma educación Interpretacion basada en la Opción 2: el salario esperado de una mujer es 5$ más bajo que el de un hombre (categoría base) con la misma educación Mariana Marchionni Modelo lineal general 16 / 45
Variables dummy para categorías múltiples Supongamos que los salarios no solo dependen de la educación y del sexo, sino también de la región; supongamos que hay 3 regiones Generalizamos la regla: si hay S categorías incluimos S-1 variables dummy Hay 3 regiones necesitamos 2 dummies: region1 i = 1 si el individuo pertenece a la región 1 region1 i = 0 en caso contrario región2 i = 1 si el individuo pertenece a la región 2 region2 i = 0 en caso contrario La categoría base u omitida se da cuando region1 i = 0 y region2 i = 0, y corresponde a la región 3 Mariana Marchionni Modelo lineal general 17 / 45
El modelo viene dado por: W i = β 1 + β 2 aedu i + δhombre i + λ 1 región1 i + λ 2 región2 i + µ i Supongamos que, manteniendo las demás variables constantes, los hombres ganan más que las mujeres δ > 0 Además, supongamos que los trabajadores de la región 1 ganan más que los de la región 2, que a su vez ganan más que los de la región 3 (λ 1 > λ 2 > 0) (dado todo lo demás...¾qué es todo lo demás?) Mariana Marchionni Modelo lineal general 18 / 45
E[W i ] = β 1 + β 2aedu i + δhombre i + λ 1región1 i + λ 2región2 i con β 1 > 0, β 2 > 0, δ > 0 y λ 1 > λ 2 > 0 Mariana Marchionni Modelo lineal general 19 / 45
E[W i ] = β 1 + β 2aedu i + δhombre i + λ 1región1 i + λ 2región2 i con β 1 > 0, β 2 > 0, δ > 0 y λ 1 > λ 2 > 0 Mariana Marchionni Modelo lineal general 20 / 45
E[W i ] = β 1 + β 2aedu i + δhombre i + λ 1región1 i + λ 2región2 i con β 1 > 0, β 2 > 0, δ > 0 y λ 1 > λ 2 > 0 Mariana Marchionni Modelo lineal general 21 / 45
E[W i ] = β 1 + β 2aedu i + δhombre i + λ 1región1 i + λ 2región2 i con β 1 > 0, β 2 > 0, δ > 0 y λ 1 > λ 2 > 0 Mariana Marchionni Modelo lineal general 22 / 45
E[W i ] = β 1 + β 2aedu i + δhombre i + λ 1región1 i + λ 2región2 i con β 1 > 0, β 2 > 0, δ > 0 y λ 1 > λ 2 > 0 Mariana Marchionni Modelo lineal general 23 / 45
Estimación e inferencia con variables explicativas binarias Todo igual que antes Lo único que cambia es la manera de interpretar los coecientes Mariana Marchionni Modelo lineal general 24 / 45
El modelo lineal no es tan lineal Y i = β 1 + β 2 X 2i + β 3 X 3i +... + β K X Ki + µ i Notemos que este modelo puede entenderse como lineal en dos dimensiones: Y es una función lineal de las variables X 2, X 3,..., X K Modelo lineal en las variables Y es una función lineal de β 1, β 2,..., β K Modelo lineal en los parámetros MCO sólo requiere linealidad en los parámetros Mariana Marchionni Modelo lineal general 25 / 45
El modelo lineal no es tan lineal Y i = β 1 + β 2 X 2i + β 3 X 3i +... + β K X Ki + µ i Notemos que este modelo puede entenderse como lineal en dos dimensiones: Y es una función lineal de las variables X 2, X 3,..., X K Modelo lineal en las variables Y es una función lineal de β 1, β 2,..., β K Modelo lineal en los parámetros MCO sólo requiere linealidad en los parámetros Mariana Marchionni Modelo lineal general 25 / 45
No linealidades en las variables Ya vimos algunos casos de modelos no lineales en los parámetros que se pueden linealizar mediante alguna transformación Ejemplos: Modelo logarítmico (log-log): ln Y i = β 1 + β 2 ln X i + u i, β 2 es una elasticidad Modelo semilogarítmico (log-lin): ln Y i = β 1 + β 2 X i + u i, β 2 es una semielasticidad El modelo transformado es lineal en parámetros y no lineal en variables Mariana Marchionni Modelo lineal general 26 / 45
No linealidades en las variables Ya vimos algunos casos de modelos no lineales en los parámetros que se pueden linealizar mediante alguna transformación Ejemplos: Modelo logarítmico (log-log): ln Y i = β 1 + β 2 ln X i + u i, β 2 es una elasticidad Modelo semilogarítmico (log-lin): ln Y i = β 1 + β 2 X i + u i, β 2 es una semielasticidad El modelo transformado es lineal en parámetros y no lineal en variables Mariana Marchionni Modelo lineal general 26 / 45
Interpretación cuando hay variables en logaritmos Importante: prestar atención a las unidades de medida. Supongamos que Y y X están medidas en pesos, y que β 2 = 0,5 Modelo Ecuación Efecto marginal Lineal Y = β 1 + β 2 X i + u i Si X aumenta en $1, Y aumenta en $0,50 Logarítmico ln Y i = β 1 + β 2 ln X i + u i Si X aumenta un 1 %, Y aumenta en 0,50 % Semilogarítmico ln Y i = β 1 + β 2 X i + u i Si X aumenta en $1, Y aumenta en 50 % (0,50 100 %) Mariana Marchionni Modelo lineal general 27 / 45
¾Qué sugieren estos datos? Mariana Marchionni Modelo lineal general 28 / 45
Variables cuadráticas Modelo cuadrático en X : Y i = β 1 + β 2 X i + β 3 X 2 i + u i El efecto marginal de X ahora viene dado por: E[Y i ] X i = β 2 + 2β 3 X i β 2 ya no resume el efecto marginal. El signo de β 3 indica si el efecto marginal crece o decrece a medida que X aumenta Mariana Marchionni Modelo lineal general 29 / 45
Por construcción, el modelo lineal predice un efecto marginal constante de X sobre Y El efecto marginal estimado por un modelo cuadrático cambia con el valor de las X (en este caso, el efecto marginal es cada vez más negativo) Mariana Marchionni Modelo lineal general 30 / 45
Interacción entre variables Un año más de educación ¾tiene el mismo efecto sobre la productividad/salarios para cualquiera? Es factible que la inteligencia potencie el efecto de la educación sobre la productividad/salarios, de manera que un año más de educación rinda más para individuos más inteligentes. ¾Cómo podemos reejar que el efecto de una variable X se potencia con el de otra variable Z? Con un término de interacción (producto) entre esas variables: Y i = β 1 + β 2 X i + γ(x i Z i ) + u i El efecto marginal de X viene dado por E[Y i ] X i = β 2 + γz i Si γ > 0 (γ < 0), aumentos de Z potencian (atenúan) el efecto de X Mariana Marchionni Modelo lineal general 31 / 45
E[Y i ] = β 2 + γz i X i Ejemplo: efecto de la educación sobre los salarios Supongamos Y =salario, X =años de educación, Z =inteligencia. Si β 2 > 0 y γ > 0, la educación tiene un efecto positivo sobre los salarios que se potencia con la inteligencia. ¾Y si Z fuera una variable dummy? Mariana Marchionni Modelo lineal general 32 / 45
Volvamos al modelo con interacción, pero reemplacemos Z por la variable dummy hombre (=1 si es hombre, =0 si es mujer) Y i = β 1 + β 2 X i + γ(x i hombre i ) + u i Tenemos dos modelos en realidad: Para las mujeres: Y i Para los hombres: Y i = β 1 + β 2 X i + u i = β 1 + β 2 X i + γx i + u i El efecto marginal de X también diere: Para las mujeres: E[Y i ] X i = β 2 Para los hombres: E[Y i ] X i = β 2 + γ Mariana Marchionni Modelo lineal general 33 / 45
Volvamos al modelo con interacción, pero reemplacemos Z por la variable dummy hombre (=1 si es hombre, =0 si es mujer) Y i = β 1 + β 2 X i + γ(x i hombre i ) + u i Tenemos dos modelos en realidad: Para las mujeres: Y i Para los hombres: Y i = β 1 + β 2 X i + u i = β 1 + β 2 X i + γx i + u i El efecto marginal de X también diere: Para las mujeres: E[Y i ] X i = β 2 Para los hombres: E[Y i ] X i = β 2 + γ Mariana Marchionni Modelo lineal general 33 / 45
E[Y i ] = β 1 + β 2X i + γ(x i hombre i ) con β 2 > 0 y γ > 0 Mariana Marchionni Modelo lineal general 34 / 45
E[Y i ] = β 1 + β 2X i + γ(x i hombre i ) con β 2 > 0 y γ < 0 Mariana Marchionni Modelo lineal general 35 / 45
Dummies aditivas y multiplicativas Consideremos el siguiente modelo: Y i = β 1 + β 2 X i + γ(x i hombre i ) + δhombre i + u i El término γ(x i hombre i ) permite que las pendientes de las regresiones dieran por género El término δhombre i permite que las ordenadas al origen dieran Mariana Marchionni Modelo lineal general 36 / 45
E[Y i ] = β 1 + β 2X i + γ(x i hombre i ) + δ hombre i supongamos todos los parámetros positivos Mariana Marchionni Modelo lineal general 37 / 45
E[Y i ] = β 1 + β 2X i + γ(x i hombre i ) + δ hombre i ¾Qué signo tienen los parámetros? Mariana Marchionni Modelo lineal general 38 / 45
Ejemplo empírico: los determinantes de los salarios en Argentina Modelo semilogarítmico con variables lineales, cuadráticas y dummies: ln(w i ) = β 1 + β 2 aedu i + β 3 edad i + β 4 edad 2 i + β 5 hombre i + µ i W es el salario por hora trabajada aedu son años de educación formal edad en años edad 2 es la edad al cuadrado hombre es un indicador binario, =1 si hombre, =0 si mujer. Datos: extraídos de EPH onda octubre 2002, total del país Mariana Marchionni Modelo lineal general 39 / 45
Mariana Marchionni Modelo lineal general 40 / 45
Recordar: especicación semilogarítmica. Un año más de educación (aedu) tendría el efecto de aumentar en un 9.07 % el salario por hora esperado, manteniendo constantes las demás variables (retorno a la educación) Mariana Marchionni Modelo lineal general 41 / 45
Como edad 2 es estadísticamente signicativa, decimos que la edad tiene un efecto no lineal sobre el log. de los salarios horarios. Si la edad aumenta 1 año, ceteris paribus, esperamos que el salario por hora aumente en [0.06 2 x 0.0005 x edad] x 100 %. Para edad=20 años, el efecto es de un 4 %. Mariana Marchionni Modelo lineal general 42 / 45
¾Cómo se interpreta el coeciente de la variable binaria hombre? Para hombres tenemos: lnŵ H = ˆβ 1 + ˆβ 2 aedu + ˆβ 3 edad + ˆβ 4 edad 2 + ˆβ 5 Para mujeres tenemos: lnŵ M = ˆβ 1 + ˆβ 2 aedu + ˆβ 3 edad + ˆβ 4 edad 2 Restando miembro a miembro: = [ ] lnŵ H lnŵ M = ln ŴH = ˆβ Ŵ 5 [ ] [ ] M ( ) ŴH 1 = ŴH Ŵ M = exp Ŵ M Ŵ ˆβ 5 1 M Para ˆβ ( ) 5 pequeño, exp ˆβ5 1 = ˆβ 5. ¾Pequeño? < 0.20 aprox. Entonces, dado que ˆβ 5 = 0,07, deberíamos esperar que un hombre gane por hora un 7 % más que una mujer con la misma edad y educación. Mariana Marchionni Modelo lineal general 43 / 45
Agregamos una interacción entre educación y género ln(w i ) = β 1 + β 2 aedu i + β 3 edad i + β 4 edad 2 i + β 5 hombre i +β 6 (hombre aedu) i + µ i ¾Cuál es el retorno a la educación bajo esta especicación? para mujeres β 2 100 % para hombres (β 2 + β 6 ) 100 % ¾Cómo evaluarían la hipótesis de que el retorno a la educación no diere entre hombres y mujeres? Mariana Marchionni Modelo lineal general 44 / 45
Mariana Marchionni Modelo lineal general 45 / 45