b) (0.5 puntos) Dibuja un histograma para el Precio Promedio Industrial. Qué cola de la distribución es más larga, la derecha o la izquierda?

Documentos relacionados
UNIVERSIDAD CARLOS III DE MADRID Grado en Ingeniería Industrial Estadística 12 de mayo de 2015 (turno mañana)

1. Contesta las siguientes cuestiones rellenando los huecos.

UNIVERSIDAD CARLOS III DE MADRID Grado en Ingeniería Industrial Estadística 12 de mayo de 2015 (turno tarde)

UNIVERSIDAD CARLOS III DE MADRID Grado en Ingeniería Industrial Estadística 10 de mayo de 2016 (turno mañana)

UNIVERSIDAD CARLOS III DE MADRID Grado en Ingeniería Industrial Estadística 10 de mayo de 2016 (turno tarde)

Examen de Estadística. 2 de julio de Grupo... Titulación...

UNIVERSIDAD CARLOS III DE MADRID Grado en Ingeniería Industrial Estadística 15 de mayo de 2013

Estadística. Convocatoria extraordinaria. Junio de Nombre. Titulación Grupo

Estadística I Solución Examen Final - 28 Mayo de 2009

Estadística II Examen final junio 27/6/17 Curso 2016/17 Soluciones

UNIVERSIDAD CARLOS III DE MADRID Grado en Ingeniería Industrial Estadística 11 de mayo de 2017 (turno de mañana)

Estadística; 3º CC. AA. Examen final, 23 de enero de 2009

Estadística II Examen final enero 19/1/17 Curso 2016/17 Soluciones Duración del examen: 2 h y 15 min

Formulario. Estadística Administrativa. Módulo 1. Introducción al análisis estadístico

Estadística II Examen final junio - 17/06/16 Curso 2015/16 Soluciones Duración del examen: 2 h. y 45 min.

Cuaderno de prácticas de Estadística

Estadística. Convocatoria ordinaria

Bloque 5. Probabilidad y Estadística Tema 3. Distribuciones de Probabilidad Ejercicios resueltos

Estructura de este tema. Tema 4 Regresión lineal simple. Ejemplo: consumo de vino y dolencias cardíacas. Frecuencias

Estadística I Examen Final - 28 Mayo de 2009 Tiempo: 2.5h - Total: 40 puntos. Nombre:... Grupo:...

Intervalos de Confianza

Matemática Aplicada y Estadística - Grado en Farmacia Curso 2014/15 1er. Examen Parcial 6 de noviembre de 2014

Ejercicio Heterocedasticidad_2

1 Introducción. 2 Modelo. Hipótesis del modelo. MODELO DE REGRESIÓN MÚLTIPLE Julián de la Horra Departamento de Matemáticas U.A.M.

ASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN

PRÁCTICA: ESTADÍSTICA DESCRIPTIVA CON SPSS 1

Tercera práctica de REGRESIÓN.

Técnicas de Inferencia Estadística II. Tema 2. Contrastes de hipótesis en poblaciones normales

GUÍA DE STATGRAPHICS 5.1

Modelo Econométrico sobre el Turismo

SEMINARIO ECONOMETRIA 14 DE MAYO DEL CASO: Determinando un éstandar de productividad comercial en banca

Estadística Inferencial. Resúmen

METODOLOGÍA SEIS SIGMA A TRAVÉS DE EXCEL

Tema 8: Ejercicios de Comparación de poblaciones

Comparación de dos Muestras - SnapStat

ESTADÍSTICA APLICADA. Tema 4: Regresión lineal simple

TEMA Nº 2 CONTRASTE DE HIPÓTESIS EN LOS DISEÑOS DE UNA MUESTRA

Análisis de la Varianza (ANOVA).

Gráfico 1: Evolución del exceso de rentabilidad de la empresa y de la cartera de mercado

PREGUNTAS TIPO EXAMEN. 1. Cuál de las siguientes medidas es una medida de Centralización?

UNIVERSIDAD CARLOS III DE MADRID Grado en Ingeniería Industrial Estadística 11 de mayo de 2017 (turno de mañana)

TEMA 3 Modelo de regresión simple

TERCER EJERCICIO 13 DE SEPTIEMBRE DE 2018

Práctica 5 ANÁLISIS DE UNA MUESTRA INTERVALOS DE CONFIANZA CONTRASTE DE HIPÓTESIS

Ajustando Curva SnapStat

Intervalos de confianza con STATGRAPHICS

EXAMEN DE ESTADÍSTICA Junio 2011

DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS

Regresión Lineal Simple y Múltiple Regresión Logística

Caso particular: Contraste de homocedasticidad

CAPÍTULO 4 CAPACIDAD DEL PROCESO

Nota de los autores... vi

ENCUESTA CUATRIENAL DE ESTRUCTURA SALARIAL 2014

Una vez realizados estos procesos conviene verificar que han aparecido las dos nuevas variables (columnas) en el archivo de datos.

TEMA 14: PARAMETROS ESTADÍSTICOS

KIBBUTZ.ES. Si se pretende comprobar si la proporción de niños es igual a la de niñas en la población de la que proceden los datos:

EXAMEN DE ESTADÍSTICA II Junio de 2002 SOLUCIÓN (tiempo:100 minutos)

Técnicas de Inferencia Estadística II. Tema 2. Contrastes de hipótesis paramétricos. Parte II. Contrastes para dos muestras

Tema 10: Introducción a los problemas de Asociación y Correlación

Estadística aplicada al medio ambiente

MODELO DE RESPUESTAS Objetivos 2, 3, 4, 5, 6, 7, Y 8.

Pasos. i Aplicar la prueba X 2 para determinar la significación estadística de las proporciones entre ambas variables (no son iguales)

Tema 3: Análisis de datos bivariantes

MATEMÁTICAS 1º BI-NM Serie Estadística Unidimensional y Bidimensional

Qué es? Primer paso Representación en un sistema de coordenadas. numéricos Cada punto muestra el valor de cada pareja de datos (X e Y)

U ED Tudela Diseños de investigación y análisis de datos - Tema 2

Supuestos y comparaciones múltiples

Práctica 4 EJERCICIOS 1.- REGRESIÓN LINEAL SIMPLE 5.1 Regresión de Peso sobre Altura Datos en Encuesta.sgd a) Estudio descriptivo de ambas variables

ESTADISTICA II. INGENIERIA INFORMATICA, 3 ER Curso Septiembre Primera Parte

PRÁCTICA 3. REGRESIÓN LINEAL SIMPLE CON SPSS Ajuste de un modelo de regresión lineal simple Porcentaje de variabilidad explicado

Estadística I Solución Examen Final- 19 de junio de Nombre y Apellido:... Grupo:...

1. Caracteres estadísticos

Estadística II Curso 2010/11. Guión de la Práctica 2 El modelo de regresión lineal y su tratamiento en Statgraphics

Procedimiento "Explorar..."

TODO ECONOMETRIA. Bondad del ajuste Contraste de hipótesis

Elaborado por: Pelay, C. y Pérez, J. Prueba t para muestras independientes

Tema 3: Inferencia estadística. Estimación de la media y la proporción

1. Introducción. CEDEX - Curso de formación estadística. Práctica Cómo introducir datos en SPSS/PC?

EXAMEN DE ESTADÍSTICA Septiembre 2011

ANÁLISIS DE REGRESIÓN

ESTIMACIÓN Y PRUEBA DE HIPÓTESIS INTERVALOS DE CONFIANZA

Tema 15: Contrastes de hipótesis sobre algunos parámetros

ESTADÍSTICA. Tema 4 Regresión lineal simple

1. Conceptos de Regresión y Correlación. 2. Variables aleatorias bidimensionales. 3. Ajuste de una recta a una nube de puntos

Estrategia de análisis estadístico de los datos. Inferencia Estadística y contraste de hipótesis

T2. El modelo lineal simple

Tema 3: Inferencia estadística. Estimación de la media y la proporción

Lucila Finkel Temario

EXAMEN DE ESTADÍSTICA Junio 2012

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 4)

7. ANÁLISIS DE VARIABLES CUANTITATIVAS: REGRESIÓN LINEAL SIMPLE

Prof. Jose Jacobo Zubcoff Universidad de Alicante 1

Solución Práctica Grupal

Grado en Finanzas y Contabilidad

Introducción a la Inferencia Estadística

UNIVERSIDAD DE SONORA

1. Estadística. 2. Seleccionar el número de clases k, para agrupar los datos. Como sugerencia para elegir el k

Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.

Estadística Descriptiva Bivariante e Intervalos de Confianza

Grado en IIAA y Grado en IHJ Asignatura: Estadística Aplicada. Curso Examen de prácticas de FEBRERO 2013

Transcripción:

frecuencia El fichero electricidad.sgd contiene información sobre 14 variables relativas a la energía eléctrica consumida en los 50 estados de los EEUU, conjuntamente con Washington, D.C., durante los primeros 11 meses de 013 (entre Enero y Noviembre). El fichero contiene 51 * 11 = 561 filas. Las dos primeras variables representan el mes (a Enero le corresponde el 1 y a Noviembre el 11) y el estado, mientras que el significado de las otras 1 variables queda claro por su nombre y sus unidades están reflejadas debajo del mismo. 1. Contesta las siguientes cuestiones rellenando los huecos. a) (0.5 puntos) La media de los Ingresos Industriales mensuales considerando todos los estados y los 11 meses fue 107063 10 3 $, mientras que la media de los Ingresos Industriales mensuales en el estado de California (CA) fue 43778 10 3 $. b) (0.5 puntos) Dibuja un histograma para el Precio Promedio Industrial. Qué cola de la distribución es más larga, la derecha o la izquierda? Histogram a 300 50 00 150 100 50 0 0 10 0 30 40 Precio Prom edio Industrial La derecha.

c) (0.5 puntos) Considera el mes de Marzo (3er mes). Qué Precio Promedio Doméstico fue superado por el 80% de los estados? 9.6 céntimos/kwh. d) (0.5 puntos) Qué porcentaje de estados tuvieron un Precio Promedio Doméstico superior a los 15 céntimos/kwh en Marzo? 17.65 %.. (0.75 points) Considera la variable Precio Promedio Doméstico, se puede asumir Normalidad tanto en las 11 observaciones de New Hampshire (NH) como en las 11 de Hawái (HI) según el test de la Chi-cuadrado? Utiliza α = 0.05 y clases equiprobables. New Hampshire p-valor contraste Chi-cuadrado Conclusiones 0,1315 Como el p-valor es mayor que 0.05 sigue una distribución normal Hawái 0,5913 Como el p-valor es mayor que 0.05 sigue una distribución normal P(Precio Promedio Domestico >17) 0,041488 1 3. La gran distancia geográfica entre New Hampshire y Hawái y sus grandes diferencias climatológicas hacen que podamos considerar las muestras de precios de la energía en New Hampshire y Hawái independientes. Considera el Precio Promedio Doméstico, tiene la misma variabilidad en New Hampshire y Hawái? (α = 0.05) Datos de la muestra n NH = 11 s NH = 0,114385 n HW = 11 s HW = 0,195867 H0 H1 Tipo de contraste σ NH = σ HW σ NH σ HW Dos poblaciones Varianza (desviación) bilateral p-valor Conclusiones 0,409551 Como p-valor >0.05 no podemos rechazar H0 y por tanto podemos asumir igualdad de varianzas

4. (0.5 puntos) Construye un intervalo de confianza al 95% para la diferencia de medias entre el Precio Promedio Doméstico en Hawái y el Precio Promedio Doméstico en New Hampshire. Datos de la muestra Extremo inferior Extremo superior n NH = 11-0.95-0.516 X NH = 16.4136 s NH = 0,114385 n HW = 11 X HW = 37,0155 s HW = 0,195867 5. (0.5 puntos) Podemos afirmar que la media del Precio Promedio Domestico en New Hampshire es superior a 16, céntimos/kwh? (α = 0.05) Datos de la muestra n NH = 11 X NH = 16.4136 s NH = 0,114385 H0 H1 Tipo de contraste μ NH = 16, μ NH > 16, Una población Media Unilateral p-valor Conclusiones 0,0313187 Como p-valor <0.05 rechazamos H0 y por tanto podemos afirmar que el precio medio es superior a 16,. 6. El concentrado de zumo de naranja congelado se envasa en bricks de 6 onzas (fichero orangejuice.sdg). Una vez se han rellenado los bricks, debe comprobarse que no hay fisuras en la base para evitar fugas de líquido cuando se haya descongelado. Disponemos de datos relativos al número de bricks defectuosos en 30 muestras de 50 unidades (variable D_trial) que vamos a utilizar para construir un gráfico np que luego utilizaremos con otras 4 muestras. Importante: utiliza 5 cifras decimales a lo largo de este problema. a) (0.5 puntos) Escribe los límites de control del gráfico np definitivo y el las muestras que eliminaste, caso de que eliminaras alguna. Gráfico np Período #1-30 LSC: +3,0 19,019 sigma 6

Línea 10,407 Central 4 LIC: -3,0 1,795 sigma 0 fuera de límites Estimados Período #1-30 np 10,4074 Media Sigma,87074 Se han eliminado las muestras 15,1, y 3. b) (0.5 puntos) Cuál es la proporción de bricks defectuosos cuando el proceso trabaja en condiciones de control?. 10.4074/50=0.081 c) (0.5 puntos) Cuál es el máximo número de bricks defectuosos permitidos en una muestra bajo control? 19 d) (0.5 puntos) Las observaciones de la variable D new se utilizan para monitorizar el proceso a partir de nuevas muestras de tamaño 50. Qué muestras están fuera de control, caso de que haya alguna?. Ninguna. e) (0.5 puntos) Los bricks se empaquetan en cajas de 0, cuál es la probabilidad de que una caja tenga, al menos, 5 bricks defectuosos? Sea X~Bin(0, 0.081) P(X>=5)=0. 40583 7. El fichero regression1.sgd contiene los valores de una variable Y de desempeño de una empresa en función de 4 variables cuantitativas denominadas (INDICADOR 1, INDICADOR, INDICADOR 3 e INDICADOR 4). 1. (0 puntos) Es conveniente transformar los datos para construir un modelo de regresión? En caso afirmativo indica qué transformación realizas sobre cada variable.

Vemos que si es necesario transformar, ya que cuando no transformamos hay heterocedasticidad. Mirando los distintos gráficos de dispersión, la mejor transformación posible es utilizar logaritmos tanto en la variable independiente como en la dependiente. Para ello basta observar el segundo recuadro de la primera fila.. (1 punto) Realiza las cuatro regresiones simples a partir de las variables explicativas cuantitativas. Escribe los modelos correctamente con t- estadísticos, indica si las respectivas variables son significativas, el coeficiente R y cuál es el mejor modelo. INDICADOR 1 log(y) = 1,9416 + 0,80877*log(INDICADOR 1) T estadistico = 15,8087, como es mayor que en valor absoluto la variable es significativa. R-cuadrada = 66,3053 porciento

Rediduo Estudentizado Gráfico de Residuos log(y) = 1,9416 + 0,80877*log(INDICADOR 1) 4 0 - -4 3 3,4 3,8 4, 4,6 5 predicho log(y) El grafico de residuos es adecuado ya que no presenta ninguna estructura. INDICADOR log(y) =,537 + 0,41765*log(INDICADOR ). T estadistico = 7,07675, como es mayor que en valor absoluto la variable es significativa. R-cuadrada = 8,81 porciento. INDICADOR 3 log(y) = 0,933951 + 0,513491*log(INDICADOR 3). T estadistico = 9,71033, como es mayor que en valor absoluto la variable es significativa. R-cuadrada = 4,6094 porciento. INDICADOR 4 log(y) =,54 + 0,468169*log(INDICADOR 4). T estadistico = 6,18994, como es mayor que en valor absoluto la variable es significativa. R-cuadrada = 3,1771 porciento. El Mejor modelo es el primero porque todas las variables son significativas y presenta el R-cuadrado más alto. 3. (0.75 puntos) Realiza la regresión múltiple con las variables que sean significativas en los modelos simples. Escríbela correctamente con t- estadísticos e indica si el modelo es mejorable. En caso de que lo sea, explica qué problema aparece. log(y) = 1,1955 + 0,633866*log(INDICADOR 1) + 0,118*log(INDICADOR ) + 0,133796*log(INDICADOR 3) - 0,015851*log(INDICADOR 4)

Rediduo Estudentizado T-estadistico Indicador 1= 10,0794, es significativa T-estadistico Indicador = 0,8001, NO es significativa T-estadistico Indicador 3=,4968, es significativa T-estadistico Indicador 4= -0,089055, NO es significativa Tenemos un problema de multicolinealidad ya que todas las variables independientes eran significativas en la regresión simple y ahora dos de ellas (la y la 4) han dejado de serlo. El modelo es mejorable ya que presenta variables no significativas. 4. (0.75 puntos) A la vista de los resultados de los apartados anteriores, realiza la mejor regresión múltiple para explicar Y en función de las variables cuantitativas. Escríbela correctamente con t-estadísticos, realiza su diagnosis y analízala explicando el impacto de las variables independientes sobre la variable respuesta. log(y) = 1,17757 + 0,634488*log(INDICADOR 1) + 0,108388*log(INDICADOR ) + 0,13407*log(INDICADOR 3) T-estadistico Indicador 1= 10,194, es significativa T-estadistico Indicador =,9934, es significativa T-estadistico Indicador 3=,5156, es significativa La diagnosis es adecuada ya que el grafico de residuos contra predichos no presenta estructuras. Gráfico de Residuos 4 0 - -4,7 3, 3,7 4, 4,7 5, 5,7 predicho log(y) Cuando Indicador 1 aumenta un 1%, y los otros dos indicadores permanecen constantes, Y aumenta un 0.634488% Cuando Indicador aumenta un 1%, y los otros dos indicadores permanecen constantes, Y aumenta un 0.108388% Cuando Indicador 3 aumenta un 1%, y los otros dos indicadores permanecen constantes, Y aumenta un 0.13407%

5. (0.75 puntos) En el modelo que has ajustado en el apartado anterior introduce la variable Tipo que toma el valor 1 si la empresa está ubicada en España y 0 si está en el extranjero. Escribe la regresión correctamente con t- estadísticos. Indica si existen diferencias el desempeño debido a la ubicación y por qué. log(y) = 1,00537 + 0,44113*Tipo + 0,61956*log(INDICADOR 1) + 0,10894*log(INDICADOR ) + 0,140898*log(INDICADOR 3) Si existen diferencias significativas porque el valor T asociado a la variable tipo es 13,18. 6. (0.5 puntos) Cuánto mejor es el desempeño en España que en el extranjero? Un 4.41%