Estadística II Ejercicios Tema 5

Documentos relacionados
Estadística II Tema 4. Regresión lineal simple. Curso 2009/10

Estadística II Examen final junio - 17/06/16 Curso 2015/16 Soluciones Duración del examen: 2 h. y 45 min.

Tema 4. Regresión lineal simple

Estadística II Examen final enero 19/1/17 Curso 2016/17 Soluciones Duración del examen: 2 h y 15 min

Relación 3 de problemas

Estadística II Examen final junio 27/6/17 Curso 2016/17 Soluciones

Estadística II Examen Final 19/06/2015 Soluciones. Responda a las preguntas siguientes en los cuadernillos de la Universidad

Estadística II Ejercicios Tema 4

Primera práctica de REGRESIÓN.

LADE/LADE-DER. 229, , , , , ,333 y. 3 i 1. y ij /3

ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE

Prácticas Tema 4: Modelo con variables cualitativas

Estructura de este tema. Tema 4 Regresión lineal simple. Ejemplo: consumo de vino y dolencias cardíacas. Frecuencias

CALIFICACION: 287,33 218, sí 1 sí 1. Se especifica el siguiente modelo de regresión para el precio de las viviendas: G i =

Estadística aplicada al medio ambiente

TEMA 3 Modelo de regresión simple

Objetivo: Proponer modelos para analizar la influencia

Departamento de Estadística e Investigación Operativa Aplicadas y Calidad. Licenciado en Administración y Dirección de Empresas A.D.E. - U.P.V.

TEMA 4 Modelo de regresión múltiple

ANÁLISIS DE REGRESIÓN

T2. El modelo lineal simple

TEMA 2 Diseño de experimentos: modelos con varios factores

TEMA 10 Correlación y regresión. El modelo de regresión simple

= 15 CALIFICACION:

Estadística I Solución Examen Final- 19 de junio de Nombre y Apellido:... Grupo:...

ESTADÍSTICA. Tema 4 Regresión lineal simple

Tema 8: Regresión y Correlación

Regresión múltiple. Demostraciones. Elisa Mª Molanes López

Prácticas Tema 2: El modelo lineal simple

peso edad grasas Regresión lineal simple Los datos

EXAMEN DE ECONOMETRÍA

EXAMEN DE ESTADÍSTICA II Junio de 2002 SOLUCIÓN (tiempo:100 minutos)

1 Introducción. 2 Modelo. Hipótesis del modelo. MODELO DE REGRESIÓN MÚLTIPLE Julián de la Horra Departamento de Matemáticas U.A.M.

ANALISIS DE LA ESTATURA

TODO ECONOMETRIA. Bondad del ajuste Contraste de hipótesis

Se permite un folio escrito por las dos caras. Cada problema se realiza en hojas diferentes y se entregan por separado.

Unidad Temática 3: Estadística Analítica. Unidad 9 Regresión Lineal Simple Tema 15

Taller I Econometría I

Modelado y simulación en Ingeniería Química. Manuel Rodríguez

Multiple Linear Regression

Regresión Simple. Leticia Gracia Medrano. 2 de agosto del 2012

ASIGNATURA: ESTADISTICA II (II-055) Ing. César Torrez

EJERCICIO T1 NOMBRE: Correctas Incorrectas En Blanco Puntos

Regresión Lineal Simple y Múltiple Regresión Logística

Guía de taller de Economía Cuantitativa V. Profesor: ALBERTO REYES DE LA ROSA.

Métodos Estadísticos Multivariados

ESTADÍSTICA APLICADA. Tema 4: Regresión lineal simple

Estadística I Solución Examen Final - 28 Mayo de 2009

Método de cuadrados mínimos

Profesor: Hugo S. Salinas. Primer Semestre Tabla 1: Inteligencia y Rendimiento. X Y Figura 1: Inteligencia y Rendimiento.

con los supuestos clásicos, uno de ellos es que ninguna de las variables X 1, X 2,, X K es

Práctica 3: Regresión simple con R

Modelación estadística: La regresión lineal simple

ANEXO 3-A LA LECTURA DE UNA ESPECIE DE COMPUTADORA

Estadística I Examen Final - 19 de junio de Nombre:... Grupo:...

Escuela de Economía Universidad de Carabobo Profesor: Exaú Navarro Pérez.

Tema 10: Introducción a los problemas de Asociación y Correlación

TEMA N 1.- ANÁLISIS DE REGRESIÓN Y MÉTODO DE MÍNIMOS CUADRADOS

Modelo de Regresión Lineal

Tema 5. Análisis de regresión (segunda parte) Estadística II, 2010/11

Bioestadística. Curso Práctica: La recta de regresión

Tercera práctica de REGRESIÓN.

LEC/LADE/LECD/LADED CURSO 2006/07 HOJA DE PROBLEMAS 3 INTERVALOS DE CONFIANZA

Universidad Técnica de Babahoyo CORRELACIÓN DE VARIABLES Y REGRESIÓN LINEAL

Estadística II Curso 2010/11. Guión de la Práctica 2 El modelo de regresión lineal y su tratamiento en Statgraphics

Definición de Correlación

ASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN

TEMA 3: Contrastes de Hipótesis en el MRL

Matemática Aplicada y Estadística - Farmacia Soluciones del Primer Examen Parcial - Grupo 3

El Modelo de Regresión Lineal

El modelo de regresión múltiple

REGRESIÓN Y ESTIMACIÓN TEMA 1: REGRESIÓN LINEAL SIMPLE

Tema 3: Análisis de datos bivariantes

Regresión Lineal Múltiple

Regresión ponderada y falta de ajuste

Ajuste de Regresión Lineal Simple

CLAVE Lab 11 - Regresión Lineal Simple y Polinomial

Práctica 4 EJERCICIOS 1.- REGRESIÓN LINEAL SIMPLE 5.1 Regresión de Peso sobre Altura Datos en Encuesta.sgd a) Estudio descriptivo de ambas variables

Regresión múltiple. Efecto de varias variables ambientales sobre una especie de ganso migratorio. Luz

Vamos a estudiar: Relación entre variables. Cómo influye una variable X sobre otra variable Y

Modelo de Análisis de la Covarianza. Introducción al modelo de Medidas Repetidas

1 Introducción. 2 Modelo. Hipótesis del modelo. MODELO DE REGRESIÓN SIMPLE Julián de la Horra Departamento de Matemáticas U.A.M.

Unidad V: Estadística aplicada

Estimaciones puntuales. Estadística II

5-4 Modelos de Regresión

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA

REGRESIÓN LINEAL SIMPLE

Folleto de Estadísticas. Teoría del 2do Parcial

Sesgo y varianza del estimador de la razón. con el problema de presición vs. sesgo que ya discutimos. t y. ˆt x

Matemática Aplicada y Estadística - Grado en Farmacia Curso 2014/15 1er. Examen Parcial 6 de noviembre de 2014

Estadística Inferencial

Econometría II. Hoja de Problemas 1

Ejemplo de Regresión Lineal Simple

1. Conceptos de Regresión y Correlación. 2. Variables aleatorias bidimensionales. 3. Ajuste de una recta a una nube de puntos

TEMA 2: Propiedades de los estimadores MCO

Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.

Los datos siguientes contienen indicadores demográficos y criminales sobre 47

Grado en Finanzas y Contabilidad

Qué es? Primer paso Representación en un sistema de coordenadas. numéricos Cada punto muestra el valor de cada pareja de datos (X e Y)

Transcripción:

Estadística II Ejercicios Tema 5 1. Considera los cuatro conjuntos de datos dados en las transparencias del Tema 5 (sección 5.1) (a) Comprueba que los cuatro conjuntos de datos dan lugar a la misma recta de regresión. (b) Aplica los métodos de diagnóstico comentados en clase al conjunto de datos # 1, y comenta (c) Aplica los métodos de diagnóstico comentados en clase al conjunto de datos # 2, y comenta (d) Aplica los métodos de diagnóstico comentados en clase al conjunto de datos # 3, y comenta (e) En el conjunto de datos # 3, identifica el dato atípico. Obtén la recta de regresión tras eliminar este dato atípico, y comenta el resultado. 2. A partir de una muestra de 30 observaciones, se estimó el modelo de regresión lineal simple ŷ i = ˆβ 0 + ˆβ 1 x i, con ˆβ 0 = 10.1 y ˆβ 1 = 8.4. La variación cuadrática de la respuesta debida al modelo es i (ŷ i ȳ) 2 = 128, mientras que la variación cuadrática residual de la respuesta es i e2 i = 286. (a) Calcula e interpreta el coeficiente de determinación. (b) Qué puedes decir sobre el coeficiente de correlación entre las x i y las y i? (c) Construye la tabla ANOVA correspondiente a partir de estos datos. (d) Contrasta a un nivel de significación del 5% la hipótesis de que la respuesta y no depende de x. Repite el contraste a un nivel de significación del 1%. (e) Da un estimador insesgado de la varianza del error. 3. El gestor de un concesionario de automóviles está interesado en la relación entre el número de vendedores que trabajan en fin de semana y el número de coches vendidos. Se obtuvieron los siguientes datos para seis fines de semana consecutivos: x i (# de vendedores) y i (# de coches vendidos) 1 5 22 2 7 20 3 4 15 4 2 9 5 4 17 6 8 25 (a) Determina la recta de regresión de y (# de coches vendidos) sobre x (# de vendedores). (b) Construye la tabla ANOVA y comprueba la validez de la descomposición ANOVA SCT = SCM + SCR. (c) Calcula e interpreta el coeficiente de determinación. (d) Utiliza la tabla ANOVA para contrastar, al 1% y al 5% de significación, la hipótesis de que el número de vendedores no influye en las ventas. (e) Realiza los contrastes del apartado (d) mediante el método visto en el Tema 4. Comprueba que el estadístico T de tal contraste y el estadístico F del contraste del apartado (d) cumplen la relación F = T 2. 4. Linealiza las siguientes relaciones no lineales, aplicando las transformaciones vistas en clase: (a) y = ln(5 x). (b) y = 2 3 8x. 1

(c) y = 1/(4 x). (d) y = 5 4 x. 5. Supongamos que se han obtenido las siguientes observaciones para una variable respuesta y en función de la variable explicativa x: x i y i 1 5.47 2 7.54 3 9.13 4 10.47 5 11.65 6 12.72 (a) Dibuja el gráfico de puntos (x i, y i ). Parece adecuada una recta para describir la relación entre los datos? (b) Suponiendo que el modelo correcto sea de la forma y = ax b u, lleva a cabo las transformaciones adecuadas de las variables x e y, y estima los parámetros a y b a partir de una regresión lineal en las variables transformadas. (c) Construye la tabla ANOVA para las variables transformadas, y calcula e interpreta el coeficiente de determinación. 6. Para el conjunto de datos # 1 de los considerados en el ejercicio 1, calcula los estimadores de mínimos cuadrados de los coeficientes de regresión lineal empleando la formulación matricial. 7. Un análisis de regresión lineal múltiple a partir de n = 34 observaciones proporciona el modelo estimado ŷ = 2.50 + 6.8x 1 + 6.9x 2 7.2x 3. Los errores estándar de los coeficientes estimados de las variables explicativas son s( ˆβ 1 ) = 3.1, s( ˆβ 2 ) =3.7 y s( ˆβ 3 ) = 3.2. El coeficiente de determinación obtenido es R 2 = 0.85. (a) Calcula intervalos de confianza al 95% para los coeficientes de las variables explicativas. (b) Para cada variable explicativa, contrasta al 5% de significación la hipótesis de que la respuesta no depende de dicha variable. (c) Para cada variable explicativa, existe evidencia significativa al 1% de que el coeficiente correspondiente es positivo? 8. Supongamos que has estimado los coeficientes de un modelo de regresión lineal múltiple y i = β 0 + β 1 x 1 + + β k x k + u i. Contrasta al 5% de significación la hipótesis de que la respuesta no depende de las variables explicativas a partir de las siguientes tablas ANOVA parciales: (a) Modelo 4500 3 Residuos/Errores 500 26 (b) Modelo 9780 6 Residuos/Errores 2100 32 (c) Modelo 46000 8 Residuos/Errores 25000 27 9. Tenemos los siguientes datos de 10 viviendas unifamiliares, para las que se ha registrado el precio (en Me), la superficie (en m 2 ), la superficie del terreno (en Has.), y el número de cuartos de baño: 2

precio (Me) superficie (m 2 ) superf. terreno (Has.) # baños 170 120.90 0.10 1 177 134.85 0.12 1.5 191 148.80 0.12 2 194 172.05 0.18 2 202 195.30 0.16 2 210 186.00 0.16 2.5 214 195.30 0.20 2 228 223.20 0.20 2.5 240 251.10 0.20 2.5 252 241.80 0.28 3 Más abajo se dan los resultados (obtenidos con Statgraphics) de un análisis de regresión lineal múltiple de y (precio) sobre x 1 (superficie), x 2 (superficie del terreno), y x 3 (# de baños). (a) Calcula intervalos de confianza al 95% para los coeficientes del modelo de regresión y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + u. (b) Contrasta al 5% y al 10% de significación la hipótesis de que la respuesta no depende de la variable x j, para j = 1, 2, 3. (c) Calcula e interpreta el coeficiente de determinación múltiple. Estima la desviación típica del error. Multiple Regression Analysis Dependent variable: precio Standard T Parameter Estimate Error Statistic P-Value CONSTANT 100,985 7,86246 12,844 0,0000 superfi 0,354243 0,0975193 3,63255 0,0109 superfterreno 109,115 73,4594 1,48537 0,1880 WCs 10,3945 6,86311 1,51454 0,1807 Analysis of Variance Source Sum of Squares Df Mean Square F-Ratio P-Value Model 6158,96 3 2052,99 73,92 0,0000 Residual 166,635 6 27,7726 (Corr.) 6325,6 9 10. En el modelo de regresión lineal múltiple y i = b 0 + b 1 x 1i + b 2 x 2i + u i, donde se supone que se cumplen las hipótesis habituales, se tiene una muestra aleatoria simple de tamaño 4. Los datos, en la forma (y i, x 1i, x 2i ) son (y 1, 1, 2), (2, 2, 3), (y 3, 3, 5) y (y 4, 1, 3), es decir, no conocemos la variable y para los individuos 1, 3 y 4. Se sabe que los estimadores de mínimos cuadrados de los parámetros del modelo son ˆb 0 = 1.7, ˆb 1 = 0.3 y ˆb 2 = 0.1 y también se sabe que Se pide: (X X) 1 = (a) Calcular los valores desconocidos y 1, y 3, y 4. 2.9 0.9 1.3 0.9 1.9 1.3 1.3 1.3 1.1 (b) Estimar las varianzas de los estimadores de los parámetros Var(ˆb i ), para i {1, 2, 3}. (c) Construir la tabla de análisis de la varianza y contrastar al 95 por ciento la hipótesis de la validez del modelo, es decir, H 0 : b 1 = b 2 = 0.. 3

(d) Dado un modelo de regresión lineal simple y i = b 0 +b 1 x i +u i, donde se supone que se cumplen las hipótesis habituales, supongamos que tenemos una muestra aleatoria simple de tamaño n, dada por los pares (y 1, x 1 ),, (y n, x n ). Podemos expresar la varianza de ˆb 1 de dos formas, la primera es Var(ˆb 1 ) = σ2 ns 2 x, donde S 2 x = (1/n) n (x i x) 2, y la segunda es, utilizando el modelo en notación matricial, el elemento correspondiente de σ 2 (X X) 1. Se pide demostrar que las dos formas dan el mismo resultado. 11. La Consejería de Turismo de la Comunidad de Madrid ha realizado un estudio entre poblaciones de menos de 10000 habitantes para estudiar los gastos anuales en promoción turística con respecto al gasto en educación y al gasto en infraestructuras. Se seleccionaron 20 poblaciones en las que se midieron las siguientes variables: y = gasto anual en promoción turística (en millones de euros). x 1 = gasto anual en educación (en millones de euros). x 2 = gasto anual en infraestructuras (en millones de euros). De dicho estudio se conocen los siguientes datos: 52.63 18.22 17.70 (X T X) 1 = 6.49 6.01 6.04, X T Y = Sabemos también que la variabilidad no explicada toma un valor de y la variabilidad total de SCR = (y i ŷ i ) 2 = 0.034 SCT = (y i ȳ) 2 = 0.1 Se considera el modelo de regresión lineal multiple: para el que se pide que: y i = β 0 + β 1 x i1 + β 2 x i2 + u i i = 1..., 20, (a) Estimes e interpretes los coeficientes del modelo de regresión. 11.34 13.97 19.32 (b) Construyas la tabla ANOVA de la regresión y realices el contraste de significación general para el modelo de regresión. (c) Realices los contrastes de significación individual de los parámetros del modelo especificando en cada caso las hipótesis nula y altenativa. Qué observas respecto a la significación de los parámetros en comparación al resultado obtenido en el apartado anterior? (d) Calcules la predicción para el gasto anual en promoción turística de una población que tiene un gasto anual en educación de 1.3 (millones de euros) y un gasto en infraestructuras de 1.2 (millones de euros). 12. Te dan una muestra de 20 observaciones {x, z, y} de valores de tres variables, X, Y y Z. Para esta muestra se cumple que yi 2 = 10.08, ȳ = 0.488 Has calculado las estimaciones de mínimos cuadrados de los coeficientes del modelo de regresión lineal múltiple y = β 0 + β 1 x + β 2 z + u. Los valores obtenidos son: ˆβ 0 = 0.065, ˆβ1 = 0.358, ˆβ2 = 0.104, s( ˆβ 1 ) = 0.152, s( ˆβ 2 ) = 0.028,. e 2 i = 2.878 Si aceptamos que se cumplen las hipótesis del modelo de regresión lineal, contesta a las preguntas siguientes: 4

(a) Completa la tabla ANOVA para este modelo de regresión. (b) Calcula el coeficiente de determinación múltiple para este model y comenta el significado del mismo. (c) Contrasta si el modelo de regresión lineal múltiple es globalmente significativo, para un nivel de significación del 1%. (d) Contrasta si tienes suficiente evidencia para concluir que un incremento en los valores de la variable X implica un decrecimiento en los valores de la variable Y (si se mantiene constante Z), para un nivel de significación del 5%. 5