Prácticas Tema 4: Modelo con variables cualitativas

Documentos relacionados
ESTADÍSTICA. Tema 4 Regresión lineal simple

TEMA 3: Contrastes de Hipótesis en el MRL

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA

Tercera práctica de REGRESIÓN.

INFERENCIA ESTADÍSTICA. Metodología de Investigación. Tesifón Parrón

Teorema Central del Límite (1)

Diplomatura en Ciencias Empresariales X Y

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

INTERPRETACIÓN DE LA REGRESIÓN. Interpretación de la regresión

REGRESIÓN LINEAL SIMPLE, COEFICIENTE DE DETERMINACIÓN Y CORRELACIONES (EJERCICIOS RESUELTOS)

Tema 5. Contraste de hipótesis (I)

2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...

INFERENCIA ESTADISTICA

1 Introducción. 2 Modelo. Hipótesis del modelo. MODELO DE REGRESIÓN MÚLTIPLE Julián de la Horra Departamento de Matemáticas U.A.M.

Pregunta 1. Pregunta 2. Pregunta 3. Pregunta 4. Pregunta 5. Pregunta 6. Pregunta 7. Comenzado el lunes, 25 de marzo de 2013, 17:24

Multicolinealidad. Universidad de Granada. RSG Incumplimiento de las hipótesis básicas en el modelo lineal uniecuacional múltiple 1 / 17

CONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS

Hoja de Ejercicios 4 Análisis de regresión con información cualitativa

3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS

Estadística y sus aplicaciones en Ciencias Sociales 7. El modelo de regresión simple. Facultad de Ciencias Sociales - UdelaR

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos

Regresión con variables independientes cualitativas

Estructura de este tema. Tema 3 Contrastes de hipótesis. Ejemplo

INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 29 de Abril de 2016

3.1 Proyección de la Demanda. Fundación Bariloche. Noviembre de Documento PDF.

478 Índice alfabético

Contraste de hipótesis Tema Pasos del contraste de hipótesis. 1.1 Hipótesis estadísticas: nula y alternativa. 1.3 Estadístico de contraste

Tipo de punta (factor) (bloques)

Introducción a la regresión ordinal

ÍNDICE INTRODUCCIÓN... 21

ANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada.

Tema 2. Descripción Conjunta de Varias Variables

Objetivos del tema. Qué es una hipótesis? Test de Hipótesis Introducción a la Probabilidad y Estadística. Contrastando una hipótesis

Pruebas de Hipótesis-ANOVA. Curso de Seminario de Tesis Profesor QF Jose Avila Parco Año 2016

1. Caso no lineal: ajuste de una función potencial

Medidas de dispersión

Facultad de Ciencias Sociales - Universidad de la República

Esquema (1) Análisis de la Varianza y de la Covarianza. ANOVA y ANCOVA. ANOVA y ANCOVA 1. Análisis de la Varianza de 1 Factor

Contrastes de hipótesis paramétricos

Tema 5: Introducción a la inferencia estadística

DEPARTAMENTO DE MATEMÁTICAS. IES GALLICUM

MATEMÁTICAS APLICADAS A LAS C.C. SOCIALES

ENUNCIADOS DE PROBLEMAS

Tema 4: Probabilidad y Teoría de Muestras

GRADO EN ECONOMIA SEGUNDO CURSO

INTRODUCCIÓN DIAGRAMA DE DISPERSIÓN. Figura1

Reporte de Pobreza por Ingresos JUNIO 2015

TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD

MODELO ECONOMÉTRICO. José María Cara Carmona. Adrián López Ibáñez. Explicación del desempleo

INTERVALOS DE CONFIANZA. La estadística en cómic (L. Gonick y W. Smith)

Prácticas de Ecología Curso 3 Práctica 1: Muestreo

TEMA 4 ELABORACIÓN Y COMPROBACIÓN DE LAS HIPÓTESIS DE INVESTIGACIÓN

15. Regresión lineal. Te recomiendo visitar su página de apuntes y vídeos:

A qué nos referimos con medidas de dispersión?

A/42/10 ANEXO IV TASAS DEL PCT Y MECANISMOS RELATIVOS AL TIPO DE CAMBIO

Nivel socioeconómico medio. Nivel socioeconómico alto SI NO TOTAL

Econometría de Económicas

Validación de los métodos microbiológicos HERRAMIENTAS ESTADISTICAS. Bqca. QM Alicia I. Cuesta, Consultora Internacional de la FAO

Econometria de Datos en Paneles

ANÁLISIS DISCRIMINANTE

UNIVERSIDAD AUTONOMA DE SANTO DOMINGO

Estadística Descriptiva. SESIÓN 11 Medidas de dispersión

El Modelo de Regresión Simple

Tema 2.- Formas Cuadráticas.

Funciones de Regresión No Lineales (SW Cap. 6)

1º CURSO BIOESTADÍSTICA

CDEE. Cuestiones 3er Ejercicio. 0 si x 1. k(x + 1) + x2 1. k(x + 1) x si x > 1

Reporte de Pobreza y Desigualdad DICIEMBRE 2015

RESUMEN DE ALGUNOS CONCEPTOS ESTADÍSTICOS ELEMENTALES Y NOTACIÓN EMPLEADA EN EL CURSO

Estadística descriptiva y métodos diagnósticos

CAPITULO V CONCLUSIONES. a) El índice de Gini, Theil y el Coeficiente de Variación la Distribución Salarial se

Esta expresión polinómica puede expresarse como una expresión matricial de la forma; a 11 a 12 a 1n x 1 x 2 q(x 1, x 2,, x n ) = (x 1, x 2,, x n )

CAPÍTULO 10 ESTIMACIÓN POR PUNTO Y POR INTERVALO 1.- ESTIMACIÓN PUNTUAL DE LA MEDIA Y DE LA VARIANZA 2.- INTERVALO DE CONFIANZA PARA LA MEDIA

Análisis de datos Categóricos

Universidad Carlos III de Madrid Econometría Funciones de regresión no lineales Hoja de Ejercicios 8

Técnicas Cuantitativas para el Management y los Negocios I

DIPLOMADO EN RELACIONES LABORALES Estadística Asistida por Ordenador Curso

4,2 + 0,67 Y c) R 2 = 0, En la estimación de un modelo de regresión lineal se ha obtenido:

Desigualdad y diversidad en América Latina: hacia un análisis tipológico comparado.

Reporte de Pobreza. Marzo 2016

El modelo semiclásico de las propiedades de transporte: Objetivo

UNIDAD 6. Estadística

Práctica 9: Anova (2).

SCUACAC030MT22-A16V1. SOLUCIONARIO Ejercitación Operatoria de Logaritmos

ESTRUCTURA DEL EXAMEN DE MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES II PARA ALUMNOS DE BACHILLERATO

ÁREA: MATEMÁTICAS UNIDAD : 1 TEMPORALIZACIÓN: OCTUBRE 1ª QUINCENA OBJETIVOS CONTENIDOS CRITERIOS DE EVALUACIÓN

Estadística II Examen Final - Enero Responda a los siguientes ejercicios en los cuadernillos de la Universidad.

Estadística aplicada al Periodismo

MODELO DE REGRESIÓN LINEAL Y MÚLTIPLE ESTADÍSTICA APLICADA AL MEDIO AMBIENTE Grado en Ciencias Ambientales

UNIDAD 12.- Estadística. Tablas y gráficos (tema12 del libro)

2.- Tablas de frecuencias

a. Poisson: los totales marginales y el total muestral varían libremente.

Simulación I. Investigación Operativa, Grado en Estadística y Empresa, 2011/12

Transcripción:

Prácticas Tema 4: Modelo con variables cualitativas Ana J. López y Rigoberto Pérez Departamento de Economía Aplicada. Universidad de Oviedo PRACTICA 4.1- Se dispone de información sobre 16 familias sobre las que se han analizado la renta (en miles de euros), el gasto de alimentación (en miles de euros) y el ámbito de residencia Y, Gasto en alimentación X, Renta Ambito de residencia 1 10 30 Urbano 2 6 18 Rural 3 9 32 Rural 4 10 35 Urbano 5 8 20 Urbano 6 4 16 Rural 7 8 24 Rural 8 11 32 Urbano 9 12 30 Urbano 10 13 22 Urbano 11 9,5 25 Rural 12 1,5 5 Rural 13 7 10 Urbano 14 10 20 Urbano 15 11 25 Urbano 16 12 40 Urbano a) A partir de esta información estimar un modelo econométrico para explicar el gasto familiar en alimentación b) Analizar cuál es el efecto del ámbito de residencia sobre el gasto en alimentación c) Se ha propuesto un modelo logit para explicar el ámbito de la residencia familiar en función de los ingresos, estimándose los parámetros: ˆβ 1 = 1, 54 ˆβ 2 = 0, 088. Estudiar la proporción de aciertos de este modelo. 1

SOLUCIÓN: a) A partir de esta información estimar un modelo econométrico para explicar el gasto familiar en alimentación Para estimar un modelo mínimo cuadrático del gasto en alimentación se define una variable dicotómica con valor unitario para las familias con residencia en ámbito urbano y nula en los restantes casos. Con la información disponible se construyen las matrices y vectores siguientes: 16 384 10 X X = 384 10488 264 10 264 10 con determinante X X = 67104 0, 52432 0, 01788 0, 0522 X X) 1 = 0, 01788 0, 00089 0, 00572 0, 0522 0, 00572 0, 30329 142 X y = 3730 104 obteniéndose así los estimadores mínimo-cuadráticos 2, 32046 ˆβ = (X X) 1 X y = 0, 20064 2, 78255 según las cuales el efecto marginal del ingreso familiar sobre el gasto familiar en alimentación es de 0,2006, estimándose que las familias residentes en ámbito urbano gastan 2.782 euros más que las ubicadas en zona rural. Sobre este modelo es posible llevar a cabo un análisis de la varianza (ANOVA) calculando la Variación total, explicada y no explicada V T = y y nȳ 2 = 141, 25 V E = ˆβ X y nȳ 2 = 107, 0411 V NE = û û = 34, 2089 obteniéndose el coeficiente de determinación R 2 = 1 û û = 0, 7578 y y nȳ 2 Además, a partir de la variación no explicada se obtiene la varianza residual S 2 = û û = 2, 6315 n k Para analizar la significación de este modelo se construye la matriz de varianzas covarianzas que, a partir de los resultados anteriores, se obtiene como Ana J. López y Rigoberto Pérez 2

0, 52432 0, 01788 0, 0522 S 2ˆβ = S 2 X X 1 = 2, 6315 0, 01788 0, 00089 0, 00572 0, 0522 0, 00572 0, 30329 1, 3797 0, 0471 0, 1374 = 0, 0471 0, 0024 0, 0151 0, 1374 0, 0151 0, 7981 Teniendo en cuenta que la diagonal principal de esta matriz contiene las varianzas de los estimadores, sus raíces cuadradas proporcionan las correspondientes tipicas, y asi pues, el modelo estimado vendría dado por la expresión: Ŷ = 2, 32046 (1,1746) + 0, 2006 (0,0485) X + 2, 78255D (0,89336) Estos resultados permiten también contrastar directamente la significación de las dos variables explicativas Asi, en el caso del ingreso la hipótesis nula sería H 0 : β 2 = 0 frente a la alternativa H 1 : β 2 0 y el contraste se llevaria a través de la expresión ˆβ 2 β 2 t n k cuyo valor muestras es en este caso ˆβ 2 = 4, 1364 S ˆβ2 S ˆβ2 Como consecuencia se obtiene el nivel critico p = P ( t 13 > 4, 1364) = 0, 00117 que permite rechazar la nulidad del coeficiente y por tanto ratifica la validez de la variable ingresos familiares para explicar el gasto en alimentación. De modo análogo, para la variable dicotómica ligada al ámbito urbano se tendría el contraste de significación H 0 : β 3 = 0 frente a la alternativa H 1 : β 3 0 y el valor muestral del estadístico t de student seria en este caso ˆβ 3 S ˆβ3 = 3, 1147, cuyo nivel critico es p = P ( t 13 > 3, 1147) = 0, 0082 Asi pues, se rechaza la nulidad del parámetro β 3 y se confirma que el ámbito de residencia también es significativo para explicar el gasto familiar aunque no tanto como los ingresos. Como resultado concluiremos que el gasto estimado en alimentación vendria dado por las siguientes expresiones: { Hogares en ámbito rural (D=0) Ŷ = 2, 32046 + 0, 20064X Hogares en ámbito urbano (D=1) Ŷ = 5, 1030 + 0, 20064X cuya representacion gráfica es la siguiente Ana J. López y Rigoberto Pérez 3

b) Analizar cuál es el efecto del ámbito de residencia sobre el gasto en alimentación En el modelo anteriormente estimado se ha estimado el efecto del ámbito de residencia sobre el consumo fijo, pero sería posible ampliar el planteamiento mediante una variable de interacción, para permitir así estudiar el efecto del ámbito sobre el efecto marginal del ingreso. Así pues, generamos una variable de interacción que viene dada por el producto de la dummy ligada al ámbito urbano y los ingresos familiares, estimándose así un nuevo modelo mínimo cuadrático en el que las tres variables resultan significativas: Ŷ = 0, 03875 (1,49613) + 0, 318605 (0,06888) X + 7, 08699D 0, 191644 (2,1233) (0,0878) para el cual se obtendría una nueva descomposición ANOVA, donde lógicamente la variación total es la misma pero ha aumentado la variación explicada V T = 141, 25 V E = 116, 762 V NE = 24, 4881 Como consecuencia se obtiene un coeficiente de determinación más elevado que el anterior R 2 = 1 û û = 0, 826633 y y nȳ 2 Dado que este modelo tiene un parámetro más la comparación debería realizarse a través del coeficiente de determinación corregido o ajustado, que en Ana J. López y Rigoberto Pérez 4

este caso adopta resultado R 2 = 1 ( 1 R 2) n 1 = 0, 7832, superior al del n k modelo anterior (que con la misma expresión conduce al coeficiente 0,7205). Este nuevo modelo proporciona las siguientes expresiones para los hogares en ámbito rural y urbano: { Hogares en ámbito rural (D=0) Hogares en ámbito urbano (D=1) Ŷ = 0, 0387 + 0, 3186X Ŷ = 7, 0482 + 0, 1269X cuya representación gráfica es la siguiente c) Se ha propuesto un modelo logit para explicar el ámbito de la residencia familiar en función de los ingresos, estimándose los parámetros: ˆβ1 = 1, 54; ˆβ 2 = 0, 088.Estudiar la proporción de aciertos de este modelo. Con los parámetros estimados se llega a la expresión logit P i Log = 1, 54 + 0, 088X 1 P i pudiendo despejarse las probabilidades mediante la expresión P i = eli 1 + e, Li que proporciona los resultados de la tabla siguiente, donde la comparación entre el valor observado de D y la probabilidad estimada permite identificar los 11 casos correctamente clasificados (68,8 % del total), así como 4 falsos positivos y 1 falso negativo. Ana J. López y Rigoberto Pérez 5

X, Renta D Estimación P i 1 30 1 0,7503 OK 2 18 0 0,51099 Falso positivo 3 32 0 0,78181 Falso positivo 4 35 1 0,82351 OK 5 20 1 0,55478 OK 6 16 0 0,46702 OK 7 24 0 0,63924 Falso positivo 8 32 1 0,78181 OK 9 30 1 0,7503 OK 10 22 1 0,59774 OK 11 25 0 0,65928 Falso positivo 12 5 0 0,24968 OK 13 10 1 0,34069 Falso negativo 14 20 1 0,55478 OK 15 25 1 0,65929 OK 16 40 1 0,8787 OK PRACTICA 4.2- Sobre una muestra de 58 países se ha estimado un modelo para la proporción de población universitaria (Y, en %) en función de la tasa de paro (X 2, en %), la renta per cápita (X 3, en miles de euros) y una variable dicotómica con valor unitario para países de la Unión Europea (D UE ): Ŷ i = 1, 443 + 2, 74 X 2i + 11, 084 (2,93) (0,891) (3,294) D UE i 3, 245 X 2i Di UE + 0, 121X 3i Di UE (1,024) û û = 68, 13 ; R 2 = 0, 7331 (0,014) a) Se puede afirmar que la pertenencia a la UE afecta a la tasa de universitarios? Cómo? b) Calcular razonadamente el valor del estadístico F de Snedecor interpretando su resultado c) Cuál será la proporción de universitarios prevista para un país de la UE con tasa de paro del 5 % y renta per cápita de 26000 euros? SOLUCIÓN: a) Se puede afirmar que la pertenencia a la UE afecta a la tasa de universitarios? Cómo? Tal y como se observa en el modelo estimado, la pertenencia a la UE afecta a la tasa de universitarios por sí misma y al interaccionar con las variables Paro y Renta. Más concretamente, podemos expresar los modelos diferenciados para la proporción de universitarios según que los países pertenezcan o no a la UE: { Di UE = 0 Ŷi = 1, 443 + 2, 74X 2i = 1 Ŷi = 9, 641 0, 505X 2i + 0, 121X 3i D UE i b) Calcular razonadamente el valor del estadístico F de Snedecor interpretando su resultado Ana J. López y Rigoberto Pérez 6

El estadístico F permite analizar la validez global del modelo, contrastando la hipótesis nula H 0 : β 2 = β 3 = β 4 = β 5 = 0 mediante las expresiones: o alternativamente R 2 k 1 1 R 2 n k ˆβ X y nȳ 2 k 1 û û n k F k 1 n k F k 1 n k Con la información muestral disponible en nuestro caso se obtiene el resultado F = 42, 68 que lleva asociado un nivel critico p = P ( F 4 53 > 42, 68 ) 0 y por tanto permite rechazar la hipótesis nula, confirmando que el modelo propuesto tiene sentido. c) Cuál será la proporción de universitarios prevista para un país de la UE con tasa de paro del 5 % y renta per cápita de 26000 euros? Dado que el país pertenece a la UE, la variable dummy tomaría valor 1, y con los valores asumidos para las explicativas tasa de paro y renta per cápita se obtendría la predicción: Ŷi = 9, 641 0, 505(5) + 0, 121(26) = 10, 262. Ana J. López y Rigoberto Pérez 7