Capítulo 3. El modelo de regresión múltiple. Jorge Feregrino Feregrino. Econometría Aplicada Utilizando R

Documentos relacionados
ANEXO B. Se define como Regresión al estudio de la fuerza, consistencia o grado de asociación de la

PROBLEMA DEL USO DE FERTILIZANTE EN GRANJAS DE PRODUCCIÓN DE TOMATES.

e i y i y i y i 0 1 x 1i 2 x 2i k x ki

Distribuciones en el muestreo, EMV

TEMA 5: REGRESION LINEAL

SESIÓN 8 DESCRIPCIONES DE UNA RELACIÓN

y i 0 1 x i 2 2 y i media 2 Varianza 2 i 1 Para calcular el los valores que maximizan L derivamos e igualamos a cero 2 y i 0 1 x i 0 # i 1

Estimación por intervalos

Universidad Nacional del Litoral Facultad de Ingeniería y Ciencias Hídricas ESTADÍSTICA. Ingenierías RH-Amb-Ag TEORÍA

ESTADÍSTICA. n i Se pide:

) se obtiene un valor específico del estimador que recibe el nombre de estimación del parámetro poblacional θ y lo notaremos por = g ( x 1

I.T. INDUSTRIAL METODOS ESTADÍSTICOS. FORMULARIO I. ESTADISTICA DESCRIPTIVA Xv.a. Media x = n n i x 2 Varianza poblacional σ 2 i

Estimación de Parámetros

En el tema anterior se estudió que muchas decisiones se toman a partir de resultados muestrales. Por ejemplo:

1 x 1 0,1666. sabiendo que 506, 508, 499, 503, 504, 510, 497, 512, 514, 505, 493, 496, 506, 502, 509, 496.

Análisis de resultados. Independencia de las muestras

Determinación del tamaño de una muestra (para dos o más muestras)

T5. Contrastes para los parámetros de una población Normal

Intervalos de Confianza basados en una sola muestra. Denotaremos al parámetro de interés con la letra θ y con θ un estimador para θ.

Número de personas que se forman en una fila en 1 hora Número de águilas que se obtienen al lanzar una moneda 5 veces.

Problemas de Estimación de Una y Dos Muestras. UCR ECCI CI-1352 Probabilidad y Esradística Prof. M.Sc. Kryscia Daviana Ramírez Benavides

TEMA 1. ESTADÍSTICA DESCRIPTIVA

2 Conceptos básicos y planteamiento

INTRODUCCION Teoría de la Estimación

Test de Hipótesis. Material Preparado por Hugo Delfino

IntroducciónalaInferencia Estadística

Tema 4. Estimación de parámetros

República Bolivariana de Venezuela Universidad Nacional Abierta Vicerrectorado Académico Área de Matemática

TEORÍA DE LA ESTIMACIÓN

Métodos de Análisis Cuantitativo

Figura 10. No se satisface el supuesto de linealidad.

MINITAB y MODELOS DE REGRESIÓN

TEMA 5: Gráficos de Control por Atributos. 1. Gráfico de control para la fracción de unidades defectuosas

9.3. Contrastes de una proporción

INFERENCIA ESTADÍSTICA

INFERENCIA ESTADÍSTICA CONCEPTOS BÁSICOS

Formulas. Población infinita. Población finita

Práctica 7 CONTRASTES DE HIPÓTESIS

Burgos Simón, Clara Cortés López, Juan Carlos; Navarro Quiles, Ana

REPASO DE ESTADÍSTICA

Hacia dónde tienden los datos? Se agrupan en torno a un valor? o, se dispersan? Su distribución se parece a alguna distribución teórica?

Tema 14: Inferencia estadística

Prueba A = , = [ 7.853, 8.147]

12 I N F E R E N C I A E S T A D Í S T I C A II (CONTRASTE DE HIPÓTESIS)

TEMA 4: CONTRASTE DE HIPOTESIS

EJERCICIOS RESUELTOS TEMA 8

Pasos básicos para docimar una hipótesis:

Análisis estadístico de datos simulados Estimadores

Bloque 3 Tema 12 PRUEBAS ESTADÍSTICAS PARA EL CONTRASTE DE HIPÓTESIS: PRUEBAS PARAMÉTRICAS

Paso 2: Elegir un estadístico de contraste. Como queremos hacer un contraste de hipótesis para la media, el estadístico de contraste adecuado es:

Parte 1: UNIDADES DIDÁCTICAS 2 Y 3. Probabilidades con Sucesos y Variables Aleatorias.

5.1. Tipos de convergencia

CURSO CONVOCATORIA:

SESION 15 DISTRIBUCIONES DE MUESTREO

4.- Aproximación Funcional e Interpolación

Identificación de Sistemas

2 Algunos conceptos de convergencia de sucesiones de variables aleatorias

EJERCICIO 1. , a partir de las frecuencias observadas, nij. , que se dan en la tabla del ejercicio.

TEST DE HIPÓTESIS. a la hipótesis que se formula y que se quiere contrastar o rechazar. Llamamos hipótesis alternativa, H

INFERENCIA ESTADÍSTICA Y ESTIMACIÓN

R-SQUARED RESID. MEAN SQUARE (MSE) σˆ 2 ADJUSTED R-SQUARED STANDARD DEVIATION σ ˆ

Intervalos de Confianza basados en una muestra. Instituto de Cálculo

PRUEBAS DE ACCESO A LA UNIVERSIDAD L.O.G.S.E

Población Joven Adulta Total A favor En contra Total

INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA DISTRIBUCIÓN EN EL MUESTREO

3.1. Muestreo aleatorio sin reposición Muestreo aleatorio con reposición (muestreo aleatorio simple)

Intervalos de confianza Muestras grandes

Probabilidad y Estadística 2003 Intervalos de Confianza y Test de Hipótesis paramétricos

PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA

Solución: de una distribución con media µ y varianza conocida. = X. Aquí 100. Así σ = a) Se pide determinar "n", de modo que:

θˆ = h(x 1,X 2,...,X n ) θˆ es un estimador puntual de θ

Objetivos. 1. Inferencia Estadística. INFERENCIA ESTADÍSTICA Tema 3.1: Muestreo. M. Iniesta Universidad de Murcia

4.4 Sistemas mal condicionados

Unidad 1: Las Ecuaciones Diferenciales y Sus Soluciones

CAPÍTULO 8: INTERVALOS DE CONFIANZA PARA PROPORCIONES Y MEDIAS

TEMA 3: INFERENCIA ESTADISTICA

PRUEBAS DE ACCESO A LA UNIVERSIDAD L.O.G.S.E

Laboratorio N 10, Series de Fourier. Introducción. Para funciones ( ) cos. f x está definida en la mitad del intervalo

TEMA 6.- INTERVALOS DE CONFIANZA

CONTRASTE DE HIPÓTESIS

Estimación de Parámetros. Estimación de Parámetros

Ejemplo Solución. 2) Datos p 1 =253/300 p 2 =196/300 n 1 =n 2 =300 α= ) Ensayo de hipótesis

Medidas de Tendencia Central

- estimación de parámetros, - intervalos de confianza y

Regresión lineal simple

PRUEBAS DE HIPÓTESIS.

2.- ESPACIOS VECTORIALES. MATRICES.

MATEMÁTICAS 2ºBACHILLERATO CCSSII

INTRODUCCIÓN AL ANÁLISIS DE DATOS FEBRERO 2015 Código asignatura: EXAMEN TIPO TEST MODELO C DURACION: 2 HORAS. Soluciones

Estadística Descriptiva

SOLUCIONES X X

UNIVERSIDAD TECNOLÓGICA DE PEREIRA FACULTAD DE INGENIERIA INDUSTRIAL

SELECTIVIDAD ANDALUCÍA MATEMÁTICAS CCSS SOBRANTES 2012 (MODELO 6)

MUESTREO Y ESTIMACIÓN ESTADÍSTICA

Métodos Numéricos (SC 854) Ajuste a curvas. 2. Ajuste a un polinomio mediante mínimos cuadrados

CLAVES DE CORRECCIÓN GUÍA DE EJERCITACIÓN FACTORES Y PRODUCTOS PREGUNTA ALTERNATIVA Nivel

DISTRIBUCIONES BIDIMENSIONALES

Transcripción:

Capítulo 3. El modelo de regresió múltiple. Jorge Feregrio Feregrio

Idetificació del modelo La idetificació del objeto de ivestigació permitirá realizar ua búsqueda exhaustiva de los datos para llevar a cabo ua aproximació del comportamieto del feómeo mediate los hechos estilizados. La búsqueda de la iformació de las variables, la relació teórica y la descripció estadística de estas será útil para determiar la metodología de aálisis. La elecció de la variable depediete y las idepedietes coformará ua relació fucioal múltiple para describir el feómeo ecoómico mediate la metodología ecoométrica propuesta.

La presetació del modelo E el modelo de regresió múltiple las variables exógeas (Χ j ), asociadas a coeficietes lieales costates (β j ), idica el efecto codicioado de cada variable idepediete sobre la variable depediete (Y), la especificació geeral del modelo co cico variables idepedietes es la siguiete: Y = β 0 + β 1 Χ 1 + β 2 Χ 2 + β 3 Χ 3 + β 4 Χ 4 +β 5 Χ 5

Los errores La relació etre las variables es iexacta, por lo tato, la evaluació se realiza e térmios probabilísticos. La forma fucioal reducida de la estimació de la regresió múltiple, al expresarse e térmios probabilísticos debe icorporar u térmio de error (ε i ). y i = b 0 + 5 j=1 b j x ji + ε i

Objetivos de la regresió 1) Estimar los valores de ua variable idepediete ( y) mediate ua fució lieal de u úmero (K) variables idepedietes observadas x j, dode j = 1,., K 2) Obteer los efectos estadísticos de cada variable idepediete, mediate la estimació de los coeficietes b j, sobre la variable depediete ( y). 3) Estimar la exogeeidad débil, para mostrar que la distribució margial de la variable idepediete, al o coteer iformació relevate para estimar los parámetros de iterés, se puede elimiar.

Supuestos para la estimació de la regresió múltiple 1) Las variables idepedietes x ji so úmeros fijos o bie variables aleatorias X j, idepedietes del térmio de error ε i. 2) El valor esperado de la variable aleatoria ( y) es ua fució de las variables idepedietes X j 3) Los térmios de error ε i so variables cuya media esperada es igual a cero y la variaza es costate σ 2 para todas las observacioes: E ε i = 0 y E ε i 2 = σ 2 para i = 1,.,

Supuesto para la estimació 4) Los térmios de error aleatorios ε i, o está correlació etre sí E ε i ε j = 0 para todo i = j 5) Es imposible hallar u cojuto de úmeros que o sea iguales a cero tal que, c 0 + c 1 x 1i + c 2 x 2i + + cx ki = 0

Estimació mediate los MCO E modelo de Míimos Cuadrados Ordiarios (MCO), los coeficietes se obtiee mediate la miimizació de los errores o la suma de residuos explicados al cuadrado (SCE) Para miimizar la SCE se procede de la SCE tiee la siguiete represetació: siguiete forma, matemática la SCE = e i 2 = SCE = (y i y i ) 2

El resultado obteido al miimizar los errores e el MCO El desarrollo exteso del MCO es resultado de la aplicació de cálculo y se obtiee 3 ecuacioes lieales y 3 icógitas, (b 0, b 1, b 2 ) : = b 0 + b 1 x 1i + b 2 x 2i = y i b 0 x 1i + b 1 x 2 1i + b 2 x 1i x 2i = x 1i y i b 0 x 2i + b 1 x 1i x 2i + b 2 x 2 2i = x 2i y i

Iferecia estadística a partir de los resultados del MCO De la represetació de la regresió múltiple se ifiere, que e el caso de la primera variable idepediete (x 1i, b 1 ), esta explicada por la misma variable al cuadrado, y e el caso del otro coeficiete (b 2 ) esta explicado por la asociació etre las variables idepedietes. E la regresió los dos coeficietes asociados a cada variable idepediete explica el comportamieto de la variable depediete de forma sigificativa.

Notació matricial Y = Xβ + U La estimació objetivo del modelo, busca obteer los coeficietes estimados del modelo e relació a las variables idepedietes, para explicar la variable depediete ( Y) y su otació es la siguiete: Y = X β

Los resultados del MCO e la otació matricial Al respecto al vector de los coeficietes (β) teemos la siguiete otació matricial reducida: s β = XT Y X T Y + 2 (X T Xβ) s β = 2XT Y + 2 (X T Xβ) = 0 Para obteer los coeficietes estimados despejamos β β = (X T X) 1 X T Y

Las propiedades de errores para realizar iferecia estadística 1) La sumatoria de los errores e ua serie so igual a cero: e i x ij = 0. j = 1 k 2) La covariaza etre los errores y las variables explicativas a medida que aumeta el úmero de observacioes es igual cero: Cova = e i, x ij = 0 3) La variaza residual de los errores, e ausecia de sesgo, debe estar etoro a la misma variaza: s r 2 = 1 (k + 1) e i 2

La eficiecia del modelo y su poder explicativo La estabilidad de los coeficietes se aaliza mediate su distribució estadística, al igual que e la regresió simple se distribuye como ua ormal, es decir, la media es igual a cero y la desviació estádar es igual a uo. β~ N (0,1) Esto comportamieto asegura que los coeficietes estimados siga ua trayectoria ormal y o siga u comportamieto errático

El poder explicativo de los coeficietes El aálisis de probabilidad sobre los coeficietes, permite idetificar la ifluecia de cada variable a partir de la hipótesis plateada desde el diseño del modelo y su forma fucioal. El cotraste de hipótesis, se costruye mediate ua t de Studet co k grados de libertad: La hipótesis ula: La hipótesis alterativa: H 0 : β i = 0 H a : β i 0

La lectura de la sigificacia idividual La distribució del valor de los coeficietes para > 30 observacioes sigue ua distribució t -k-1, co ua probabilidad del 95% se ecuetra e el itervalo [-2,2]. Si t>2, se rechaza la hipótesis ula y se puede iferir estadísticamete que las variables idepedietes ifluye e la variable depediete, es decir, se acepta la hipótesis alterativa. H a : β i 0

El itervalo de cofiaza El criterio del itervalo de cofiaza está diseñado de la siguiete forma: P β i tαse β i 2 β i β i + tαse β i 2 = 1 α El criterio muestra la probabilidad de que el verdadero β i se ecuetra e el itervalo etre el coeficiete estimado ( β i ) y 2 desviacioes estádar (SE) a la derecha y a la izquierda.

El poder explicativo del modelo EL cotraste F, muestra si las variables explicativas e cojuto explica las variacioes de la variable idepediete. Se ha demostrado que los coeficietes β 1 = β 2 = = β k = 0 y además, sigue ua distribució F dado la siguiete forma: ( y i y i ) 2 k 2 e i k 1 ~F k, k 1

Criterios de la prueba F Cuado se acepta la hipótesis ula se debe a dos factores: 1) las variables o ifluye e la variable idepediete, 2) existe depedecia o lieal etre la variable explicada y algú regresor. Cuado se rechaza la hipótesis ula e el cotraste del test F, muestra que la variable depediete esta explicada por algua de las variables idepedietes.

Casos e el cotraste de la prueba F 1) Cuado el cotraste F es sigificativo y todos los coeficietes idividuales de acuerdo al cotraste de la t de studet tambié so sigificativos, todas las variables idepedietes so sigificativas. 2) Si el cotraste F es sigificativo y sólo alguos de los coeficietes idividuales so sigificativos de acuerdo al cotraste de la t de studet, las variables o sigificativas debe ser elimiadas del modelo. Otra solució, es realizar ua trasformació y estimar uevamete para verificar si la relació etre las variables o es lieal. 3) Cuado el cotraste de F es sigificativo y iguo de los coeficietes asociados a las variables es sigificativo, etoces podría estar presete u problema de multicoliealidad.

Casos e el cotraste de la prueba F El Test F muestra la proporció e que la variaza de los errores determia el poder explicativo del modelo. La otació matricial de la prueba, muestra que la diagoal de la matriz coocida, arroja los valores de la variaza (σ 2 ): d 00 d 11 D(X T X) 1 d ii d kk De esta forma, la distribució de los coeficietes estimados es la siguiete: β i ~ N (β i, σ d ii ) La desviació etre el coeficiete estimado ( β) y el coeficiete (β i ) e proporció a la iteracció e diagoal coocida se comporta como ua ormal.