Modelo de Regresión Lineal Simple

Documentos relacionados
Taller I Econometría I

ECONOMETRÍA I. Tema 2: El Modelo de Regresión Lineal Simple. Patricia Moreno Juan Manuel Rodriguez Poo Alexandra Soberon Departamento de Economía

Estadística y sus aplicaciones en Ciencias Sociales 7. El modelo de regresión simple. Facultad de Ciencias Sociales - UdelaR

ECONOMETRÍA I. Tema 3: El Modelo de Regresión Lineal Múltiple: estimación

Tema 4. Regresión lineal simple

Estadística para la Economía y la Gestión IN 3401

El Modelo de Regresión Simple

T2. El modelo lineal simple

ANÁLISIS DE REGRESIÓN

TODO ECONOMETRIA. Bondad del ajuste Contraste de hipótesis

Modelo de Regresión Lineal

Regresión Lineal Múltiple. Dr. Víctor Aguirre Torres, ITAM. Guión 12.

ASIGNATURA: ESTADISTICA II (II-055) Ing. César Torrez

Econometría 1. Karoll GOMEZ Segundo semestre 2017

El Modelo de Regresión Lineal General Estimación

Métodos Estadísticos Multivariados

TEMA 10 Correlación y regresión. El modelo de regresión simple

Escuela de Economía Universidad de Carabobo Profesor: Exaú Navarro Pérez.

Introduccion a los Modelos de Regresion

Econometría 1. Karoll GOMEZ Segundo semestre 2017

Regresión Lineal Simple. Dr. Víctor Aguirre Torres, ITAM. Guión 11.

Estadística aplicada al medio ambiente

T3. El modelo lineal básico

= 15 CALIFICACION:

Los estimadores mínimo cuadráticos bajo los supuestos clásicos

Análisis de Regresión Múltiple: Estimación

Tema 2: Análisis de datos bivariantes

Regresión Simple. Leticia Gracia Medrano. 2 de agosto del 2012

Prueba de Hipótesis. Para dos muestras

TEMA 4 Modelo de regresión múltiple

Universidad Técnica de Babahoyo CORRELACIÓN DE VARIABLES Y REGRESIÓN LINEAL

REGRESIÓN Y ESTIMACIÓN TEMA 1: REGRESIÓN LINEAL SIMPLE

Regresión múltiple. Demostraciones. Elisa Mª Molanes López

Econometría Aplicada

Método de cuadrados mínimos

ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE

Tema 8: Regresión y Correlación

Estadística II Tema 4. Regresión lineal simple. Curso 2009/10

ECONOMETRÍA I. Tema 6: Heterocedasticidad. Patricia Moreno Juan Manuel Rodriguez Poo Alexandra Soberon Departamento de Economía

Tema 2: Análisis de datos bivariantes

ECONOMETRÍA I. Tema 4: El Modelo de Regresión Lineal Múltiple: inferencia y validación

Modelación estadística: La regresión lineal simple

TALLER DE INTRODUCCIÓN A LOS NEGOCIOS

Tema 3: Análisis de datos bivariantes

CUESTIONES Y PROBLEMAS DE DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES PROPUESTOS EN EXÁMENES

GEOESTADÍSTICA APLICADA

Tema 10: Introducción a los problemas de Asociación y Correlación

TEMA 2: Propiedades de los estimadores MCO

Modelado y simulación en Ingeniería Química. Manuel Rodríguez

INTERPRETACIÓN DE LA REGRESIÓN. Interpretación de la regresión

Soluciones Examen Final de Econometría Universidad Carlos III de Madrid 26 de Mayo de 2015

EXTENSIÓN DEL MODELO DE REGRESIÓN LINEAL DE DOS VARIABLES

CALIFICACION: 287,33 218, sí 1 sí 1. Se especifica el siguiente modelo de regresión para el precio de las viviendas: G i =

Errores de especificación

Estadística II Examen final junio 27/6/17 Curso 2016/17 Soluciones

UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS NATURALES Y MUSEO CÁTEDRA DE ESTADÍSTICA CLASE ESPECIAL. Tema:

Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.

TEMA 3: PROPIEDADES DEL ESTIMADOR MCO

Regresión lineal. Marcelo Rodríguez Ingeniero Estadístico - Magíster en Estadística

Julio Deride Silva. 4 de junio de 2010

Coeficiente de Correlación

El modelo de regresión múltiple

EXAMEN DE ESTADÍSTICA II Junio de 2002 SOLUCIÓN (tiempo:100 minutos)

Estimación del modelo lineal con dos variables

Multicolinealidad Introducción. Uno de los supuestos básicos del modelo lineal general. y = Xβ + u

ESTADISTICA AVANZADA MODULO I

Correlación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r)

con los supuestos clásicos, uno de ellos es que ninguna de las variables X 1, X 2,, X K es

Regresión Lineal Simple y Múltiple Regresión Logística

PROPIEDADES DEL ESTIMADOR MCO

Capítulo 8. Selección de variables Introducción

Tema1. Modelo Lineal General.

Curso de nivelación Estadística y Matemática

TM 4. PROBLEMAS FRECUENTES PROVOCADOS POR LOS DATOS ECONOMICOS. 1. MULTICOLINEALIDAD: CONCEPTO Y TIPOS.

ESTADÍSTICA. Tema 4 Regresión lineal simple

ASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN

Lección 3. Análisis conjunto de dos variables

1 Introducción. 2 Modelo. Hipótesis del modelo. MODELO DE REGRESIÓN SIMPLE Julián de la Horra Departamento de Matemáticas U.A.M.

Ejemplo 7.1. Heterocedasticidad. Pilar González y Susan Orbe. Dpto. Economía Aplicada III (Econometría y Estadística)

Estadística II Ejercicios Tema 5

Estadística. Tema 3. Esperanzas Esperanza. Propiedades Varianza y covarianza. Correlación

Estadística II Examen Final 19/06/2015 Soluciones. Responda a las preguntas siguientes en los cuadernillos de la Universidad

TEMA N 1.- ANÁLISIS DE REGRESIÓN Y MÉTODO DE MÍNIMOS CUADRADOS

Se permite un folio escrito por las dos caras. Cada problema se realiza en hojas diferentes y se entregan por separado.

Prácticas Tema 2: El modelo lineal simple

peso edad grasas Regresión lineal simple Los datos

Examen de Introducción a la Econometría 8 de septiembre de 2008

Anomalías en regresión y medidas remediales

TEMA 3 Modelo de regresión simple

Fundamentos del Análisis Econométrico. Dante A. Urbina

SOLUCIONES AL EXAMEN DE SEPTIEMBRE DE ESTADÍSTICA EXAMEN DE MATEMÁTICAS II

Regresión Lineal. Rodrigo A. Alfaro. Rodrigo A. Alfaro (BCCh) Regresión Lineal / 16

MODELO DE RESPUESTAS Objetivos 2, 3, 4, 5, 6, 7, Y 8.

Econometría II. Hoja de Problemas 1

Transcripción:

1. El Modelo Modelo de Regresión Lineal Simple El modelo de regresión lineal simple es un caso especial del múltple, donde se tiene una sola variable explicativa. y = β 0 + β 1 x + u (1.1) Donde u representa la influencia que otros factores, diferentes a x, tienen sobre y. Estos son llamados los errores de la regresión, que como se explicará más adelante son diferentes a los residuos de la misma (û). Para la interpretación del modelo es necesario establecer un supuesto básico: u = 0 Cuando se sacan entonces la diferencia a todo el modelo, se tiene que: Lo que quiere decir entonces que: y = β 1 x β 0 : Intercepto β 1 : Pendiente Ahora bien, el supuesto de que E(u) = 0 es una condición necesaria más no suficiente. Esto sólo asegura que la correlación entre la variable x y el término de error no presenten una dependencia lineal. La condición suficiente entonces para el modelo es: E(u x) = 0 Así pues, la media de u es independiente de x. Es pertinente ahora hacer una aclaración, linealidad hace referencia a los parámetros. Es decir, las variables pueden tomar cualquier forma funcional, pero los parámetros de la regresión deben ser siempre lineales y aditivos. Los siguientes modelos son lineales: y = β 0 + β 1 2 x + u log(y) i = β 0 + β 1 x 3 i De ahora en adelante log( ) hará referencia al logaritmo natural. 1

1.1. Estimación de los parámetros Se tiene que el problema de minimización en Mínimos Cuadrados Ordinarios es: mín ˆβ 0, ˆβ 1 û 2 i = (y i ˆβ 0 ˆβ 1 x i ) 2 Hallando las condiciones de primer orden se tiene: 2 2 (y i ˆβ 0 ˆβ 1 x i ) = 0 (1.1.2) [x i (y i ˆβ 0 ˆβ 1 x i )] = 0 (1.1.3) A continuación utilizamos varias propiedades de la sumatoria que se pueden encontrar en el apéndice A del Wooldridge. Analizando cada C.P.O. por separado se tiene que: La primera orden de condición da: (y i ˆβ 0 ˆβ 1 x i ) = 0 y i n ˆβ 0 ˆβ 1 y i ˆβ 1 x i = 0 x i = n ˆβ 0 Usando las propiedades de la sumatoria se tiene entonces: De la segunda resulta entonces: Reemplazando ˆβ 0 se tiene que: n ˆβ 0 = nȳ n ˆβ 1 x ˆβ 0 = ȳ ˆβ 1 x [x i (y i ˆβ 0 ˆβ 1 x i )] = 0 (x i y i x i ˆβ0 ˆβ 1 x 2 i ) = 0 [x i y i x i (ȳ ˆβ 1 x) ˆβ 1 x 2 i ] = 0 2

Aplicando las propiedades de la sumatoria: x i y i ȳ x i = ˆβ 1 ( x 2 i x x i ) x i y i n xȳ = ˆβ 1 ( x 2 i n x 2 ) ˆβ 1 = x iy i n xȳ x2 i n x2 Entonces la Funcióde Regresión muestral está definida por: ŷ ii = ˆβ 0 + ˆβ 1 x (1.1.4) Y la Función de Regresión poblacional es: y = β 0 + β 1 x (1.1.5) 1.2. Características del Modelo 1.2.1. Propiedades Algebraicas Los residuos de la regresión están definidos por: Los residuales tienen dos propiedades importantes: A. ûi = 0. B. x iû i = 0. û i = y i ŷ i (1.2.6) La segunda propiedad hace referencia a la covarianza muestral de los residuos y la variable independiente. Esto implica que la covarianza muestral de ŷ y û es 0, y por lo tanto ŷ i = ȳ iii. ii Nótese que acá se tienen los valores estimados, que son diferentes a los poblacionales (sin gorro). iii Esta demostración se le deja al lector. 3

Una vez definidos los residuales se puede definir la Suma Total de Cuadrados (SST), la Suma Explicada de Cuadrados (SSE), y la Suma de Residuos al Cuadrado (SSR). SST = SSE = SSR = (y i ȳ) 2 (1.2.7) (ŷ i yb) 2 (1.2.8) û i (1.2.9) SST : La Suma Total de Cuadrados mide la variación total muestral de y i ; es decir, qué tan dispersos están los datos distribuidos en la muestra. SSE: Mide la variación muestral del y estimado (ŷ i ). SSR: MIde la variación muestral de los residuales. Finalmente, se tiene que: SST = SSE + SSR iv (1.2.10) 1.2.1.1. Bondad de Ajuste La bondad de ajuste mide qué tan bien la línea de regresión se ajusta a los datos. Está definido por la siguiente fórmula: R 2 = SSE SST = 1 SSR SST (1.2.11) Esto representa la fracción de la variación muestral de y que está explicada por x. El rango es 0 R 2 1 puesto que la SSE no puede ser mayor a la SST. Este coeficiente de determinación se interpreta usualmente multiplicándolo por 100. Se dice entonces que el modelo explica α % de la variación de y. Es importante señalar que un R 2 bajo no significa que el modelo no es útil. 1.2.2. Forma Funcional A continuación se presenta una tabla con las transformaciones del modelo más comúnmente utilizadas y su interpretación. iv Esta demostración se le deja al lector. 4

Modelo Lin-Lin Cuadro 1: Interpretación de los coeficientes Interpretación y = β 1 x Ceteris Paribus un cambio de una unidad en x, representa un cambio de β 1 unidades en y. Lin-Log y = β 1 % x Ceteris Paribus un cambio porcentual en x, 100 y varía en bd unidades 100 Log-Lin % y = (100 β 1 ) x Ceteris Paribus si x aumenta en una unidad, se espera que y aumente en 100 β 1 % Log-Log % y = β 1 % x Ceteris Paribus un cambio porcentual de x significa un cambio de β 1 % en y. 1.3. Propiedades En esta sección se revisarán algunas de las propiedades en muestras finitas. 1.3.1. Insesgamiento Para tener esta propiedad se requieren de los siguientes supuestos: a Lineal en parámetros. b Muestra aleatoria. c Variación muestral aleatoria de la variable independiente. {x i ; i = 1, 2,, n} no son todos el mismo valor. d Media condicional de los errores es cero. E(u x) = 0. 5

La prueba de insesgadez para la pendiente es entonces: ˆβ 1 = x i x x 2 i n x 2 = y i (x i x)(β 0 β 1 x i + u i ) x2 i n x2 = (x i x)β 0 + [(x i x)x i ]β 1 + [(x i x)u i ] x2 i n x2 = β 1 + [(x i x)u i ] x2 i n x2 Tomando el valor esperado condicionado a x: E( ˆβ 1 x) = E(β 1 x) + E( [(x i x)u i ] x2 i x) n x2 1 ˆβ 1 = β 1 + ( x2 i ) [(x i x) E(u i x)] n x2 Se tiene que E(u i x) = 0 por supuesto ˆβ 1 = β 1 Haciendo la demostración para el intercepto: a Desarrollando ȳ. ˆβ 0 = ȳ }{{} ˆβ 1 x a y i = β 0 + β 1 x i + u i y i = (β 0 + β 1 x i + u i ) n n ȳ = β 0 + β 1 x + ū ˆβ 0 = β 0 + β 1 x + ū ˆβ 1 x Sacando el valor esperado condicionado a x: E( ˆβ 0 x) = β 0 + E[(β 1 ˆβ 1 )x x] + E(ū x) De la anterior prueba se sabe que ˆβ 1 = β 1 ˆβ 0 = β 0 1.3.2. Varianza Muestral Para demostrar esta propiedad se debe hacer un supuesto adicional: 6

5. Homocedasticidad. Var(u x) = σ 2. Para el lector debería ser claro que las varianzas muestrales de los parámetros entonces son: Var( ˆβ 1 ) = Var( ˆβ 0 ) = σ 2 n (x i x) σ2 n x2 i n (x i x) (1.3.12) (1.3.13) 1.3.2.1. Error estándar ˆσ 2 = SSR n 2 (1.3.14) Sacando la raíz cuadrada obtenemos el error estándar de la regresión ( ˆσ2 ). Lo mismo sucede con los errores de los parámetros: Se( ˆβ 1 ) = ˆσ (x i x) 2 (1.3.15) Se( ˆβ 0 ) = ˆσ x2 i n (x i x) 2 (1.3.16) 7