Estadística II Ejercicios Tema 4

Documentos relacionados
Estadística II Tema 4. Regresión lineal simple. Curso 2009/10

Tema 4. Regresión lineal simple

ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE

ANÁLISIS DE REGRESIÓN

Prácticas Tema 2: El modelo lineal simple

PROBLEMAS SOBRE V. ESTAD. BIDIMENSIONALES. PROFESOR: ANTONIO PIZARRO.

Regresión y Correlación

Estadística II Examen final junio - 17/06/16 Curso 2015/16 Soluciones Duración del examen: 2 h. y 45 min.

Tema 8: Regresión y Correlación

Universidad Técnica de Babahoyo CORRELACIÓN DE VARIABLES Y REGRESIÓN LINEAL

peso edad grasas Regresión lineal simple Los datos

Problemas deestadísticaii Cuaderno II: Regresión Multiple

Estructura de este tema. Tema 4 Regresión lineal simple. Ejemplo: consumo de vino y dolencias cardíacas. Frecuencias

Tema 2. Regresión Lineal

Capitulo. Describir la relación entre dos variables Pearson Prentice Hall. All rights reserved

Un modelo para representar una relación aproximadamente

Inferencia estadística Selectividad CCSS MasMates.com Colecciones de ejercicios

Tema 3: Análisis de datos bivariantes

Tema 10: Introducción a los problemas de Asociación y Correlación

Se permite un folio escrito por las dos caras. Cada problema se realiza en hojas diferentes y se entregan por separado.

ESTADÍSTICA. Tema 4 Regresión lineal simple

Análisis de los resultados de la evaluación del aprendizaje de procedimientos de análisis descriptivo en ingeniería informática

1. Ejercicios. 2 a parte

Definición de Correlación

MODELO DE RESPUESTAS Objetivos 2, 3, 4, 5, 6, 7, Y 8.

12. (SEPTIEMBRE 2004) Una muestra aleatoria de 9 tarrinas de helado proporciona los siguientes pesos en gramos

EXAMEN DE ESTADÍSTICA II Junio de 2002 SOLUCIÓN (tiempo:100 minutos)

EJERCICIOS DE SELECTIVIDAD

3. RELACION ENTRE DOS CONJUNTOS DE DATOS.

Estadísticas Elemental Tema 3: Describir la relación entre dos variables: Correlación y regresión 3.1-1

Tercera práctica de REGRESIÓN.

Estadística II Tema 4. Regresión lineal simple. Curso 2010/11

Lección 3. Análisis conjunto de dos variables

ASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN

TEMA 12 INFERENCIA ESTADÍSTICA. ESTIMACIÓN DE LA MEDIA

Prácticas Tema 4: Modelo con variables cualitativas

Tribunal de la Oposición al Cuerpo Superior de Estadísticos del Estado

ESTADÍSTICA APLICADA. Tema 4: Regresión lineal simple

UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS NATURALES Y MUSEO CÁTEDRA DE ESTADÍSTICA CLASE ESPECIAL. Tema:

Diplomatura en Ciencias Empresariales X Y

Método de cuadrados mínimos

7. ANÁLISIS DE VARIABLES CUANTITATIVAS: REGRESIÓN LINEAL SIMPLE

Tema 2: Análisis de datos bivariantes

R E S O L U C I Ó N. a) El intervalo de confianza de la media poblacional viene dado por: I. C. z

Tema 2: Análisis de datos bivariantes

Correlación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r)

4.1 Análisis bivariado de asociaciones

Regresión lineal. Marcelo Rodríguez Ingeniero Estadístico - Magíster en Estadística

Gráfico 1: Evolución del exceso de rentabilidad de la empresa y de la cartera de mercado

CALIFICACION: - P C: precio medio de los productos sustitutivos existentes en el mercado en euros.

Regresión lineal simple y correlación

Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia

CUESTIONES Y PROBLEMAS DE DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES PROPUESTOS EN EXÁMENES

Econometría II. Hoja de Problemas 1

Julio Deride Silva. 4 de junio de 2010

Ejercicios de Regresión Lineal

ESTADISTICA II. INGENIERIA INFORMATICA, 3 ER Curso

ANALISIS DE REGRESIÓN Y CORRELACIÓN LINEAL

ESTADÍSTICA Hoja 2

Profesor: Hugo S. Salinas. Primer Semestre Tabla 1: Inteligencia y Rendimiento. X Y Figura 1: Inteligencia y Rendimiento.

Segunda práctica de REGRESIÓN.

Intervalos de Confianza

PROBLEMAS RESUELTOS SELECTIVIDAD ANDALUCÍA 2016 MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES TEMA 6: TEORÍA DE MUESTRAS

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA

8. [ASTU] [SEP-A] Se ha entrevistado a 400 mujeres elegidas de forma aleatoria y se ha obtenido que el tiempo medio semanal que

Pruebas de Hipótesis H0 : μ = 6 H1 : μ 6 α = 0.05 zα/2 = 1.96 (6-1,96 0,4 ; 6+1,96 0,4) = (5,22 ; 6,78) 5,6 Aceptamos la hipótesis nula H 0 2.

(1 punto) (1.5 puntos)

Econometría II Grado en finanzas y contabilidad

ANALISIS DE LA ESTATURA

Inferencia 1. Solución: 60

TEMA 2 Diseño de experimentos: modelos con varios factores

CORRELACIÓN Y REGRESIÓN. Juan José Hernández Ocaña

Estadística. Convocatoria ordinaria. 23 de mayo de Nombre Grupo.. Titulación.Número de Examen..

Calculamos la covarianza. (La covarianza indica el sentido de la correlación entre las variables):

Hoja de Ejercicios 3 El modelo de regresión lineal múltiple

RELACIÓN DE EJERCICIOS Y PROBLEMAS SOBRE ANÁLISIS DE DOS VARIABLES (DISTRIBUCIONES BIDIMENSIONALES)

Inferencia estadística Selectividad CCSS Murcia. MasMates.com Colecciones de ejercicios

Inferencia estadística Selectividad CCSS Andalucía. MasMates.com Colecciones de ejercicios

VARIABLES ESTADÍSTICAS BIDIMENSIONALES

Multiple Linear Regression

ESTADÍSTICA. 1.- En una población de 25 familias se ha observado el número de vehículos que tienen obteniéndose los siguientes datos:

Ejercicio 1 (20 puntos)

Estadística. 3) (Sept-99) Una variable aleatoria tiene una distribución normal de media y desviación típica. Si se extraen

Información sobre Gastos de Consumo Personal y Producto Interno Bruto ( ) en miles de millones de dólares de 1992.

ESTADISTICA II. INGENIERIA INFORMATICA, 3 ER Curso Septiembre Primera Parte

TEMA 4: CONTROL POR VARIABLES Hoja de ejercicios (Entregar el 7 -problema de examen-)

EJERCICIOS PROBABILIDAD (1) 2. Sean A y S dos sucesos de un espacio muestral tales que P(A)=0 4; P(A S)=0 5 y P(S/A)= 0 5 Calcular P(S) y P(A/ S )

4. Regresión Lineal Simple

12 Estadística. bidimensional. 1. Distribuciones bidimensionales. Piensa y calcula. Aplica la teoría

Teoría de la decisión

Relación entre la altura y la distancia del suelo al ombligo

Distribuciones bidimensionales

Boletín 1. Estadística Descriptiva

REGRESIÓN LINEAL SIMPLE

Regresión Lineal. Rodrigo A. Alfaro. Rodrigo A. Alfaro (BCCh) Regresión Lineal / 16

Grado en Finanzas y Contabilidad

ESTADÍSTICA Y PROBABILIDAD

3 Regresión y correlación lineales

Estructura de este tema. Tema 3 Contrastes de hipótesis. Ejemplo

Análisis de Datos y Métodos Cuantitativos para la D.T. VI versión MGM

Transcripción:

Estadística II Ejercicios Tema 4 1. Los siguientes datos muestran la estatura (en cm.) y el peso (en Kg.) para una muestra de cinco alumnos de una clase: estatura (cm.) peso (Kg.) 154 60 158 62 162 61 171 66 176 84 a) Calcula e interpreta los coeficientes de covarianza y de correlación lineal muestrales entre la estatura y el peso. b) Calcula estimadores puntuales para los parámetros (pendiente y constante) de la recta de regresión del peso en función de la estatura, así como para la varianza del error de la respuesta. En cuántos Kg. aumenta el peso, en promedio, por cada 10 cm. adicionales de estatura? c) Calcula estimadores por intervalos al 10 % de confianza para los parámetros (pendiente y constante) de la recta de regresión del peso en función de la estatura, así como para la varianza del error de la respuesta. d) Aportan los datos evidencia significativa al 10 % para concluir que el peso depende linealmente de la estatura? Plantea y resuelve el contraste de hipótesis correspondiente, y acota su p-valor. Para qué niveles de significación puedes asegurar que el peso depende de la estatura? e) Supongamos que un alumno mide 174 cm. A partir de los datos dados, cuál es el peso medio estimado de los alumnos que miden 174 cm? Da un intervalo de confianza al 95 % para el peso medio de los alumnos que miden 174 cm. Supongamos que cierto alumno de la clase mide 174 cm. Calcula un intervalo de predicción al 95 % de confianza para su peso. 2. La siguiente tabla muestra información sobre la venta en 1998 de prensa diaria escrita en ejemplares diarios vendidos por cada mil habitantes para 8 comunidades autónomas españolas, relacionándola con su producción económica basada en el Producto Interior Bruto (PIB) por habitante en miles de euros (Fuente: INE. Anuario Estadístico). PIB 8,3 9,7 10,7 11,7 12,4 15,4 16,3 17,2 Ejemplares 57,4 106,8 104,4 131,9 144,6 146,4 177,4 186,9 a) Estimar por Mínimos Cuadrados un modelo de regresión simple para explicar el número de ejemplares vendidos en términos del PIB. b) Construir un intervalo de confianza al 95 % para la pendiente de la recta de regresión y contrastar la hipótesis de que dicho parámetro toma valor cero. Puede afirmarse que el número de ejemplares vendidos depende linealmente del PIB? c) Cuál será la venta de prensa que se podría predecir para una comunidad cuyo PIB por habitante fuese de 15000 euros? d) Si para una región cualquiera el valor del PIB aumentase en 2500 euros, cómo cabría esperar que variase la venta de prensa diaria? 3. Se pretende estimar la relación entre el número de habitantes (x) de cada ciudad de España (medidos en millones) y el número de ventas de ejemplares (y) de un cierto libro (medidos en miles de unidades) en dicha ciudad. Una muestra tomada sobre cinco ciudades arroja los siguientes datos: x = 1, ȳ = 22, x 2 i = 5,98, yi 2 = 3118, x i y i = 136. 1

a) Construye un modelo de regresión lineal simple que modele las ventas del libro en función del número de habitantes de cada ciudad. Interpreta los coeficientes del modelo desde un punto de vista económico. b) Si la población de Bilbao es aproximadamente de 350.000 habitantes, efectúa una predicción de cuántos libros se venderán en 2011 en dicha ciudad. Es razonable, a un 95 % de confianza, suponer que se venderán 12.000 libros? Puede utilizarse que 5 e2 i = 8,204, donde los e i son los residuos de la regresión. c) Contrasta mediante el p-valor si los habitantes producen un efecto lineal significativo en las ventas. Interpreta los resultados. d) Cómo cambiará el modelo de regresión si decidimos medir las ventas de libros en unidades y el número de habitantes en miles? 4. Uno de los administradores de una empresa argumenta que el uso de Internet es la principal causa del gasto en la factura telefónica. Para corroborar esta afirmación, se toman datos en distintos departamentos del gasto telefónico mensual en euros y los tiempos de conexión en minutos. Cuantía de la factura telefónica 55 100 118 120 142 Tiempo de conexión 200 500 700 800 1000 (a) Calcular el coeficiente de correlación entre ambas variables, existe una relación de tipo lineal entre ellas? (b) Estimar un modelo de regresión lineal que permita estimar la cuantía mensual de la factura telefónica en términos del tiempo de conexión. (c) De acuerdo a esta relación lineal, cuál sería la cuantía de la factura telefónica de un departamento que no se conectase a Internet? Calcular un intervalo de confianza al 95 % para dicha estimación. (d) Cuál sería el gasto telefónico estimado según esta relación lineal si el tiempo de conexión a Internet de un departamento fuera de 2000 minutos? Le parece aceptable tal predicción? 5. Con el objetivo de estudiar la relación lineal entre el precio de los automóviles y el número de unidades vendidas, se procedió a recoger datos sobre tales magnitudes durante el pasado mes en una determinada región. Los resultados obtenidos fueron los siguientes: Precio (miles de euros) Cantidad vendida (unidades mensuales) 7,5 450 9 425 10,5 400 12 350 14 325 16 300 18 290 20,5 280 23,5 260 27 200 (a) Calcular e interpretar el coeficiente de correlación lineal entre ambas variables. (b) Una empresa radicada en la región tiene previsto para el mes próximo aumentar el precio de su modelo más vendido en 500 euros. Si suponemos como válida la relación lineal entre las dos variables analizadas para los datos del pasado mes, cómo afectaría este hecho a las ventas de dicho modelo? (c) Si expresamos el precio en euros y las cantidades vendidas en 10 2 unidades, cuál sería el modelo lineal que explica las ventas en función del precio? Y el coeficiente de correlación? 6. Una gasolinera ha recogido información acerca de su recaudación diaria durante una semana, así como del número de clientes que acudieron a la misma en cada día: Recaudación (10 3 euros) 1.5 10 8 3 5 15 2 Número de clientes (10 2 ) 3 6 5 3,5 4 8 3,2 2

a) Realizar un ajuste lineal que exprese la recaudación en función del número de clientes. b) Determinar cuál sería la recaudación media prevista para aquellos días en los que lleguen a la gasolinera 720 clientes. Obtener un intervalo de confianza al 95 % para dicha predicción. c) Determinar cuál sería la recaudación prevista para un día en el que lleguen a la gasolinera 720 clientes. Obtener un intervalo de confianza al 95 % para dicha predicción. d) Obtener la recta de regresión si expresásemos la recaudación en euros y el número de clientes en unidades. 7. Un distribuidor de productos de droguería y limpieza reparte sus productos entre los comercios del sector de todos los pueblos de una comarca. Entre los artículos que distribuye, ha seleccionado una muestra de 6 de ellos, que son los que considera más importantes, debido a su demanda por parte de los comerciantes y del público en general. De esos 6 artículos se tienen los datos correspondientes al último mes de Abril correspondientes al precio unitario del artículo en euros y al volumen de ventas correspondientes a dicho artículo en miles de euros, que son los siguientes: Precio Volumen Lejía 0.65 2.50 Amoníaco perfumado 0.85 1.68 Estropajo fibra verde 1.25 4.23 Detergente concentrado 2.6 5.69 Suavizante 2.1 5.17 Detergente lavavajillas 2.5 5.50 (a) Construir la recta de regresión del volumen de ventas con respecto al precio unitario para el mes de Abril. (b) Contrastar la hipótesis de que el volumen de ventas depende linealmente del precio de los artículos. (c) Suponiendo que los precios durante el mes de Mayo no varíen con respecto al mes anterior, obtener una predicción para el volumen de ventas en el mes de Mayo de un artículo cuyo precio unitario es de 1 euro. Dar una medida de la fiabilidad de dicha predicción mediante un intervalo de confianza al 95 %. (d) El distribuidor está convencido de que el volumen de ventas sería el mismo si en el mes de Mayo se sube en 5 céntimos el precio de cada artículo. Obtener la ecuación de la recta de regresión en este caso y una predicción para las ventas en el mes de Mayo de un artículo cuyo precio unitario sea de 1 euro (incluyendo la subida de 5 céntimos). 8. Una aplicación importante del análisis de regresión en contabilidad es para estimar costos en función del volumen de ventas. A partir de una muestra de 8 pares de datos sobre volumen de ventas y costos, se obtiene mediante el método de mínimos cuadrados la recta de regresión de los costos con respecto al volumen de ventas, obteniéndose los siguientes residuos: e 1 e 2 e 3 e 4 e 5 e 6 e 7 e 8 10 3 2 1 1 1 2 a) Calcular el residuo número 8 b) Calcular la varianza residual. c) Calcular un intervalo de confianza al 95 % para la varianza de los errores. d) Si el modelo de regresión lineal construido es ŷ = 2 + 5x y la varianza de las observaciones de la variable independiente es s 2 X = 100, analizar si es significativa la relación lineal entre ambas variables. e) Cuál es la media de las observaciones de la variable dependiente, ȳ, si la media de las observaciones de la variable independiente es x = 3. 9. Se desea realizar un estudio entre el personal administrativo de una empresa que permita estimar el número de errores diarios cometidos por cada trabajador (variable Y ) en función del número de años contratados en la empresa (variable X). Con esta finalidad se controló el trabajo de 10 empleados seleccionados al azar obteniéndose la siguiente información: x 2 i = 296; x i = 50; y 2 i = 1036; y i = 86; x i y i = 331 3

a) Calcular e interpretar el coeficiente de correlación lineal entre ambas variables. b) Estimar la recta de regresión correspondiente indicando el significado de cada coeficiente. c) Estimar la cantidad promedio de errores que cometerá un trabajador que lleve cuatro años trabajando en la empresa. 10. Una empresa desea investigar la relación entre el número de días que faltan sin permiso los empleados por año (variable Y ) y la distancia en kilómetros desde su hogar a su trabajo (variable X). Al analizar una muestra de empleados se obtuvieron los siguientes resultados: cov(x, y) = 5,4; cor(x, y) = 0,7838; x = 25; s 2 x = 12 Además, para una distancia de 20 kilómetros del hogar al trabajo, se ha estimado que el número medio de días que faltan sin permiso es de 4. a) Estimar un modelo de regresión lineal. b) En término medio, cuál será el número de días sin permiso que faltará un trabajador que viva a 18 kilómetros del lugar de trabajo? c) Responder a los apartados anteriores expresando la distancia en metros. 11. A partir de una muestra de pares de datos, {(x 1, y 1 ),..., (x n, y n )}, se han obtenido los siguientes resultados: cor(x, y) = 0,9; x = 5; s 2 x = 1,44; ȳ = 10; s 2 y = 4,41 a) Determinar la recta de regresión de Y sobre X. b) Cuál sería la recta de regresión si cor(x, y) = 0? c) Responder a los apartados anteriores si el valor de cada una de las observaciones de la variable respuesta, y i, aumenta en 2 unidades. 12. Los siguientes datos corresponden a una muestra de 10 alumnos universitarios seleccionados al azar donde la variable X representa el número medio de hijos de sus abuelos y la variable Y el número de hijos de sus padres: Se pide: X : 6 4 3 4 6,5 2 4,5 3 5 1 Y : 4 3 4 4 8 1 4 5 4 2 a) Calcular el coeficiente de correlación entre las dos variables. Interpretar el resultado. b) Construir la recta de regresión que explique la variable Y en función de los valores de X e interpretar su significado. Cuáles son los valores de los parámetros del modelo de regresión lineal simple??cuál es el significado de la estimación del coeficiente de regresión (coeficiente de X)? c) Hacer un contraste a un nivel de significación del 1 % para ver si la relación entre las dos variables es significativa. 13. Los médicos están interesados en estudiar la relación entre la dosis de un medicamento y el tiempo que necesita un paciente para recuperarse. La siguiente tabla muestra, para una muestra de 5 pacientes, las dosis administradas (en gramos), x, y los tiempos de recuperación (en horas), y. Estos pacientes tenían características similares excepto por la dosis del medicamento que se les administró: Dosis (gr) 1,2 1,0 1,5 1,2 1,4 Tiempo de recuperación (horas) 25 40 10 27 16 Datos de interés: x i = 6,3, y i = 118, x 2 i = 8,09, yi 2 = 3310, x i y i = 139,8 e 2 i = 6,42105 4

a) Calcular e interpretar el coeficiente de correlación lineal entre ambas variables. b) Realizar un ajuste lineal que exprese el tiempo de recuperación en función de la dosis administrada. c) Contrastar la hipótesis de que el tiempo de recuperación depende linealmente de la dosis suministrada. d) Determinar cuál será el tiempo medio de recuperación previsto para aquellos pacientes similares a los que se les administren 135 centigramos de medicamento. Obtener un intervalo de confianza al 95 % para dicha predicción. e) Determinar cuál será el tiempo de recuperación para un paciente al que se le administren 135 centigramos de medicamento. Obtener un intervalo de confianza al 95 % para dicha predicción. f ) Obtener la ecuación de la recta de regresión si expresásemos la dosis en centigramos y el tiempo de recuperación en minutos. g) Después de responder a los apartados anteriores, completa la tabla que se obtendría como resultado de llevar a cabo este análisis utilizando software (completa los valores indicados con una interrogación): Regression Analysis - Linear model: Y = a + b*x Dependent variable: T_Recuperacion Independent variable: Dosis Standard T Parameter Estimate Error Statistic P-Value Intercept? 4,7732 20,3659 0,0003 Slope???? 5