Univ. de Alcalá. Estadística 2014-15 Dpto. de Física y Matemáticas Grado en Biología. Examen final. Miércoles, 21 de Enero de 2015. Apellidos: Nombre: INSTRUCCIONES (LEER ATENTAMENTE). Puedes descargar este examen en pdf desde esta dirección (busca el enlace Dropbox en la parte inferior de la página): http://www2.uah.es/fsegundo/bioestad/14-15/iniciobioestad1415.html El profesor te dirá la clave que necesitas para la descarga. Este examen representa cuatro puntos (sobre 10) de la nota final. La parte escrita del examen vale dos puntos y el cuestionario los dos restantes. Parte escrita: Debes contestar a la parte escrita en las hojas aparte que te vamos a entregar. IMPORTANTE: Debes entregar cada pregunta de esta parte en una hoja (o varias) aparte, para que puedan corregirse por separado. No mezcles dos preguntas en la misma hoja. Tu respuesta debe ser detallada, explicando con claridad los pasos que te conducen al resultado. Las respuestas numéricas sin explicaciones claras no se puntuarán. Para poder optar a una matrícula de honor, debes elegir al menos uno de los apartados opcionales que se indican. Puedes hacer tantos de estos apartados como quieras. Cuestionario: anota en la tabla de esta hoja todas las respuestas del cuestionario. ANOTA AQUÍ TUS RESPUESTAS AL CUESTIONARIO. Si te equivocas, puedes tachar e indicar la respuesta correcta debajo de la tabla. Pregunta 1 2 3 4 5 Respuesta Pregunta 6 7 8 9 10 Respuesta
Cuestionario. 1. Los sucesos A y B, cumplen: ( ) 3 P (A) = 8 P (B) = ( ) 2 8 P (A B) = ( ) 4 8 Calcula la probabilidad del complementario de A B. Utiliza 4 cifras significativas en tu respuesta. 2. Los sucesos B 1,..., B n, donde n = 5 tienen estas propiedades: Son incompatibles dos a dos. Su unión es Ω, el espacio muestral completo. Además las probabilidades de los sucesos B i son, respectivamente: ( 21 77, 12 77, 6 77, 18 77, 20 ) 77 Mientras que las probabilidades condicionadas P (A B 1 ),..., P (A B n ) son: ( 28 36, 26 36, 23 36, 15 36, 4 ) 36 Calcula la probabilidad P (A). Utiliza 4 cifras significativas en tu respuesta. 3. La variable aleatoria discreta X toma estos valores: con estas probabilidades: -8, -3, 0, 1, 3, 5 7/31, 12/31, 2/31, 3/31, 1/31, 6/31. Calcula la varianza de X. Redondea el resultado con 4 cifras significativas. 4. La función de densidad f(x) de la variable aleatoria continua X es igual a si 2 (7 x + 2) 159 2 x 5 y es igual a 0 en otro caso (no es necesario que compruebes que f es una función de densidad). Calcula la probabilidad P (4.7 < X < 4.9) donde X es la variable aleatoria definida por f. Usa 4 cifras significativas en tu respuesta. 5. La variable aleatoria X es binomial, de tipo B(13, 0.6). Calcula la probabilidad P (X 3). Escribe tu respuesta con 4 cifras significativas.
6. Sea X una variable aleatoria que sigue una distribución t de Student con 20 grados de libertad. Calcula el valor x de X tal que 0.2 = P (X > x ) 7. La variable aleatoria X es normal (y se desconoce su varianza). Se ha obtenido una muestra de tamaño 15, con media muestral X = 21, y cuasidesviación típica muestral s = 2.12. Calcula el extremo inferior a de un intervalo de confianza (a, b) para la media µ X, con un nivel de confianza del 90 %. 8. La variable aleatoria X es normal (y se desconoce su varianza). Se ha obtenido una muestra de tamaño n = 58, con media muestral X = 27.28 y cuasidesviación típica muestral s = 4.747. Se desea contrastar la hipotesis nula: H 0 : µ X = µ 0 siendo µ 0 = 28.98. Hallar el p-valor de este contraste. Utiliza 4 cifras significativas en tu respuesta. 9. La variable aleatoria X es normal. Se ha obtenido una muestra de tamaño n=70 y cuasivarianza (varianza muestral) s 2 = 88.1721. Se desea contrastar la hipótesis nula: H 0 = {σ σ 0 } siendo σ 0 = 9.59. Hallar el p-valor de este contraste. 10. Calcula el coeficiente de correlación de Pearson r para el conjunto de puntos cuyas coordenadas x son: (2.6, 3.31, 3.43, 4.16, 5.93, 6.49, 9.03, 11.7) y cuyas respectivas coordenadas y son: (0.579, 1.71, 7.62, 17.3, 2.25, 1.17, 4.57, 11.8)
PARTE ESCRITA (RECUERDA QUE DEBES ELEGIR DOS EJERCICIOS) 1. a) Empezamos, como no podía ser de otra manera, con unos pajarillos. Se está estudiando la distribución según el tipo de bosque del número de territorios de Herrerillo Común (Parus Caeruleaus) y de Carbonero Garrapinos (Parus ater). Usa la siguiente información para completar la tabla de contingencia: Herrerillo Carbonero Total Bosque Caducifolio?????? Bosque Coníferas?????? Total?????? En total se han observado 88 territorios. De ellos la cuarta parte eran territorios de Herrerillo en bosque de coníferas. En total se observaron 20 territorios situados en bosques caducifolios. Si de entre los territorios de Carbonero observados se elige uno al azar, la probabilidad de que esté situado en un bosque caducifolio es 3/26. b) Supongamos que se eligen al azar, de forma independiente y con reemplazamiento, 10 territorios de esa muestra. Cuál es la probabilidad de que al menos 4 de ellos sean territorios de carbonero situados en bosques de coníferas? c) Vamos a pensar en lo que ocurriría si la especie y el tipo de bosque fueran independientes. Manteniendo los mismos valores marginales de la tabla, calcula la proporción de territorios de Carbonero que esperaríamos encontrar en los bosques de coníferas. Calcula un intervalo de confianza para esa proporción a partir de los datos de la muestra. Pertenece el valor anterior a este intervalo? Crees que la especie y el tipo de bosque son independientes? Qué contraste se te ocurre para poner a prueba esa hipótesis? En este apartado puedes suponer que los tamaños de las muestras son suficientemente grandes como para usar el Teorema Central del Límite. d) Opcional, se tendrá en cuenta para asignar las Matrículas de Honor. Vamos a usar el tipo de bosque como una prueba diagnóstica para predecir a qué especie corresponden los territorios que se observan. Cuál es la sensibilidad de esta prueba? Cuál es su especificidad? Calcula los valores predictivos positivo y negativo de la prueba, la probabilidad de cometer un falso positivo y un falso negativo y la razón de verosimilitud positiva de la prueba. Úsala para calcular las posibilidades (odds post-prueba) a favor de que un territorio situado en un bosque de coníferas sea de Carbonero. 2. Una compañía de seguros para automóviles asegura en su publicidad que los clientes que contratan sus seguros se ahorran, en promedio, 430 euros anuales en la poliza. Un investigador de una empresa comparadora de seguros quiere demostrar que ese valor es exageradamente alto. Para ello ha tomado una muestra al azar de 182 clientes de esa empresa y ha obtenido un ahorro medio de 416 euros, con una cuasidesviación muestral de 102 euros. a) Confirman estos datos las sospechas del investigador? Usa un nivel de significación del 90 % al hacer el contraste. Qué significa, en el contexto de este ejercicio, cometer un error de tipo I? Y un error de tipo II? b) Calcula un intervalo de confianza al 90 % para el ahorro medio de los clientes de esa compañía, a partir de los datos de la muestra. Contiene ese intervalo al valor 430 que afirmaba la compañia en su publicidad? Compara este resultado con el que has obtenido usando el contraste de hipótesis. c) Opcional, se tendrá en cuenta para asignar las Matrículas de Honor. Calcula la potencia del contraste del primer apartado, suponiendo que el efecto δ vale 20 euros. Y si el efecto vale 10 euros, la potencia será mayor o menor?
3. Dentro de un estudio sobre la influencia de una dieta rica en calcio sobre la presión arterial, los investigadores sometieron a un grupo de ratas a una dieta normal. Los pesos, en gramos, de las ratas de ese grupo (grupo A) al final del periodo de estudio fueron los siguientes: 328, 315, 343, 368, 353, 374, 356, 339, 343, 343, 334, 333, 313, 333, 372 Un segundo grupo de ratas fue sometido a una dieta rica en calcio. Los pesos finales, asimismo en gramos, de este grupo (grupo B) fueron estos: 342, 284, 334, 348, 315, 313, 301, 354, 346, 319, 289, 322, 308, 325 a) Analiza las posibles diferencias entre el peso medio de ambas poblaciones. b) Opcional, se tendrá en cuenta para asignar las Matrículas de Honor. En ese mismo estudio se han analizado otros dos grupos de ratas a las que, además de la dieta, se ha tratado con un fármaco para modificar su presión arterial. El grupo C está formado por ratas sometidas a dieta normal y tratadas con ese fármaco. Los pesos finales de las ratas de este grupo fueron, en gramos: 336, 346, 269, 346, 323, 309, 322, 316, 300, 309, 276, 306, 310, 302, 269, 311 El grupo D lo forman ratas que recibieron tanto la dieta rica en calcio como el tratamiento con el fármaco. Los pesos finales de este grupo fueron, en gramos: 304, 292, 299, 293, 277, 303, 303, 320, 324, 340, 299, 279, 305, 290, 300, 312 Utiliza un contraste Anova para ver si hay diferencias significativas entre los pesos medios de los cuatro grupos. 4. En este ejercicio vamos a usar un conjunto de medidas de velocidad (en millas por hora) y distancia de frenada (en pies) de un grupo de coches clásicos (de la década de 1920). Puedes generar esos datos en tu ordenador ejecutando estos comandos de R. data(cars) (velocidad = cars$speed) (distancia = cars$dist) Una vez ejecutados esos comandos, los vectores velocidad y distancia contienen los datos necesarios para este ejercicio. Los comandos deben funcionar en cualquier instalación de R. Si tienes problemas para generar los datos, avisa a tu profesor. (a) Con esos datos calcula la media, cuasidesviación típica, la mediana y el rango intercuartílico de cada una de las variables. Hay algún valor atípico? Calcula también la covarianza de ambas variables, y la recta de regresión, usando la velocidad como variable independiente x, y la distancia como variable dependiente y. Calcula el coeficiente de correlación. (b) A la vista del diagrama de dispersión, se ha propuesto una ecuación de la forma y = a x b para estos datos, donde a y b son constantes, y como antes x =velocidad, y =distancia. Puedes calcular el valor de a y b? Indicación: toma logaritmos en ambos lados de la ecuación y haz un cambio de variable, llamando x = ln(x), ỹ = ln(y) para obtener la ecuación de una recta. En R, la función log calcula el logaritmo neperiano. Cuál de los dos modelos produce un coeficiente de correlación más alto?
(c) Opcional, se tendrá en cuenta para asignar las Matrículas de Honor. Calcula un intervalo de confianza para la pendiente de la recta del apartado (a). Calcula también un intervalo de predicción para la distancia cuando la velocidad es de 21 millas por hora. 5. Este ejercicio tiene 2 apartados, cada uno con varios subapartados. Para conseguir la máxima puntuación debes completarlos todos. a) En una fábrica de turrón la cantidad de almendra de una tableta determina su calidad: Calidad normal: menos de 180 gramos de almendra. Calidad extra: entre 180 y 200 gramos. Calidad superior: más de 200 gramos de almendra. Supongamos que la cantidad de almendra en cada tableta sigue una distribución normal de tipo N(µ, σ). Sabemos que el 45 % de las tabletas son de calidad superior y el 15 % de calidad normal. 1) Encuentra los valores de µ y σ. 2) Cuál es la probabilidad de que una tableta tomada al azar de entre las de calidad superior tenga una cantidad de almendra inferior a 208 gramos? 3) Elegimos 150 tabletas al azar (independientemente unas de otras). Cuál es la probabilidad de que al menos dos tengan una cantidad de almendra inferior a 158 gramos? b) Una fábrica produce una pieza de dos calidades diferentes. El 60 % de la producción es de calidad A. La duración en años de una pieza de calidad A es una variable aleatoria continua con esta función de densidad: { e x si x > 0, f(x) = 0 en otro caso. El resto de la producción es de calidad B. En este caso su duración tiene esta función de densidad: { 2e 2x si x > 0, f(x) = 0 en otro caso. 1) Calcula la probabilidad de que una pieza dure más de un año. 2) Si tomamos una pieza al azar cuál es la probabilidad de que dure más de un año? Si una pieza elegida al azar ha durado más de un año, cuál es la probabilidad de que sea de calidad A? 3) Opcional, se tendrá en cuenta para asignar las Matrículas de Honor. Te animas a calcular la duración media de las piezas de esta fábrica? Cuál es la varianza de la duración de las piezas?