Estadística 1 ESTADÍSTICA 09-10. Hoja 1 1. Completar la siguiente tabla, en la cual se han resumido las calificaciones medias de 60 estudiantes de 2 o curso de bachillerato de un instituto: (L i 1, L i ] n i f i a i h i 1-3 0.1 2 1 2 4 6-8 0.4 2. Se sabe que el 4 % de los días de un mes de 25 días laborables un trabajador de cierta empresa utiliza menos de 15 minutos en salir a fumar. El 40 % de los días este tiempo no supera los 25 minutos. En 11 días supera los 30 minutos, y el 24 % de los días sale a fumar entre 30 y 35 minutos. Además, ningún día ha superado los 50 minutos. Construir la tabla de frecuencias de la distribución del tiempo para fumar consumido por este trabajador. 3. Dado el siguiente histograma de frecuencias absolutas y sabiendo que el número de datos de la primera clase es 12, 8 5 3 2 2 4 6 8 10 a) Cuál es el número total de datos? b) Determina las frecuencias relativas de cada clase.
Estadística 2 4. Se dispone del siguiente histograma correspondiente a una variable estadística X: h i 0,25 0,175 0,15 0,1 1 2 4 5 7 Se pide: a) Hallar la distribución de frecuencias relativas de la variable X. b) Calcular la media de X y una medida de dispersión relativa de X. c) Dibujar el polígono de frecuencias acumuladas de X y su mediana. 5. De un conjunto de 2n datos se conocen las medias y varianzas de los n primeros, x 1 y S 2 1, y de los n ltimos, x 2 y S 2 2. a) Obtener a partir de los datos anteriores, 2n x i y 2n x 2 i. b) Obtener x T, la media de los 2n datos. c) Probar que S 2 T = S2 1 +S2 2 2 + ( x 1 x 2 ) 2 4 6. Dados los datos resumidos en esta tabla de frecuencias: x i f i -1 0.3 2 0.4 3 0.4 Calcula x, s 2 y la mediana. 7. Los ingresos brutos mensuales (en miles de euros) de los inquilinos de una comunidad de 12 viviendas son: 3.5 3.5 3.9 4.5 4.75 4.9 5.0 5.2 7.4 9.8 10.4 más de 10.4 Justifica qué medidas de posición y dispersión no se pueden calcular con estos datos y cuáles sería razonable utilizar.
Estadística 3 8. (**)Completa: (L i 1, L i ] n i h i (-1,2] 4 12 (2,3] 18 (3,4] 1 9. Las cinco primeras desviaciones con respecto a la media muestral de un conjunto de seis observaciones de medición de resistencia son: 2, 3, 7, 4 y 1. Cuál es el valor de la sexta desviación con respecto a la media? Dar una muestra que tenga las desviaciones anteriores con respecto a la media. Cuántas muestras pueden construirse con esta característica? Razonar la respuesta. 10. (**)A los alumnos de una determinada asignatura se les ha preguntado sobre el número de horas semanales que dedican a su estudio, pidiéndoles que marquen una de estas opciones: 0, 1, 2, 3, 4, obteniéndose la siguiente información: Una quinta parte de los alumnos estudian 4 horas. El 30 % estudian 2 horas. Un 50 % estudian más de 2 horas. El 10 % no estudia (cero horas). Hacer un diagrama de cajas con estos datos. 11. (**)De una empresa con 1500 trabajadores se sabe que la media de los salarios es de 800 euros, con una desviación estándar de 100. Es posible que haya 150 trabajadores que cobren más de 1100 euros? 12. (**)Una población está dividida en dos subgrupos. En el primero, la media de edad es de 25 años y en el segundo grupo de 29. Será cierto que la media de la población total está en el intervalo (25,29)? Razonar la respuesta. 13. (**)La puntuación media obtenida por los alumnos en un examen fue de 5 con una desviación estándar de 1. Si la puntuación z (valor tipificado) de un estudiante en este examen fue de 1.8, cuál es su calificación en el examen? 14. (**)En una clase de preescolar 5 niños no tienen hermanos, 10 tienen un hermano, 12 tienen dos hermanos y 3 tienen tres hermanos. La mediana del número de hermanos es: 15. (**)Sea X una variable estadística con valores {x 1, x 2,..., x N }. Para qué valor de k es N (x i k) = 0?
Estadística 4 16. (**) Puede ser que un conjunto de datos x 1, x 2,..., x N tenga x = 3 y N x 2 i N = 8? 17. (**)Dadas dos variables estadísticas, X e Y, cuál tiene mayor dispersión/variabilidad, X con media 20 y varianza 64 ó Y con media 25 y varianza 81? Razonar la respuesta. 18. (**)Consideramos un conjunto de datos con media 7 y varianza 3. Entre ellos hay dos datos iguales a 7. Supongamos que eliminamos del conjunto uno de los datos iguales a 7. a) Cuál es la media del nuevo conjunto de datos? Justificar la respuesta. b) La varianza del nuevo conjunto de datos, aumenta, disminuye o sigue siendo igual a 3? Justificar la respuesta. 19. (**)Estamos interesados en la variable X= Tiempo de vida ( en semanas) de bombillas fabricadas con cierto filamento. a) En una muestra pequea de 11 bombillas, los resultados muestrales fueron: 20, 25, 13, 18, 32, 25, 20, 15, 28, 40, 27; hallar el tiempo medio me vida, que tiempo no superan el 50 % de las bombillas observadas y cuál es la desviación típica para esta muestra. b) En una muestra más grande se han obtenido resultados resumidos en la siguiente tabla: Percentil 30 50 70 100 Tiempo de Vida 18 22 26 30 Construir con estos datos una tabla de frecuencias relativas y hallar el tiempo medio de vida usando como dato la marca de clase. 20. (**)Se ha estudiado la edad de los excursionistas que visitan cierto parque natural en un domingo de primavera. Los datos obtenidos son: Edad 0-10 10-20 20-30 30-50 50-70 70-95 N Visitantes 50 270 400 220 50 6 10 a) Elaborar un histograma para representar estos datos. b) Hallar la edad media de los visitantes. c) Qué edad hay que tener para estar entre el 40 % más joven de los visitantes? 21. (**)En la fabricación de chips para circuitos integrados hay una variable, denominada amplitud de ventana que está relacionada con los procedimientos de interconexión netre los circuitos. Se desea estudiar el efecto que tiene sobre la amplitud de ventana una determinada reacción química que se produce durante el proceso de fabricación de los chips. Para ello se mide dicha variable (PHadke et al. 1983, Bell System Tech. J.) antes
Estadística 5 de la reacción química, en una muestra aleatoria de 10 lugares, obteniéndose los siguientes resultados ( en milimicras): x i : 2,52, 2,50, 2,66, 2,73, 2,71, 2,67, 2,06, 1,66, 1,78, 2,56 Se midieron también las amplitudes de ventana, después de la reacción química, en una nueva muestra independiente de la anterior, obteniéndose: y i : 3,21, 2,49, 2,94, 4,38, 4,02, 3,82, 3,30, 2,85, 3,34, 3,91 a) Para comparar las dos distribuciones, representa los dos diagramas de caja y bigotes en un mismo gráfico. A partir de estos diagramas, parece haber aumentado la amplitud de ventana después de la reacción? b) Cuáles on las medias y las desviaciones de los datos de ambos grupos? 22. (**)En una clase grande hay 150 estudiantes masculinos y 100 femeninos; los estudiantes promedian en altura 175 cm. con una desviación estandar de 25 cm y las estudiantes promedian 165 cm con desviación estandar de 25 cm. Tomando conjuntamente los hombres y las mujeres, a) La altura promedio sería: b) El desvío estndar de las alturas sería un poco mayor de 25 cm., menor que 25 cm, o exactamente 25 cm? 23. (**)Los salarios de los 20 empleados de una empresa son: 10 cobran 600 euros, 9 cobran 900 euros, uno cobra 9900 euros. Se pide: a) Construir la tabla de frecuencias y el diagrama de barras o el histograma de esta variable estaística Y, según proc3da. b) De terminar cuál de las medidas de centralización representa mejor a la variable Y. Calcular e interpretar las medidas de dispersión. c) Construir e interpretar el diagrama de caja de Y. Localizar los datos atípicos. d) Estudiar como incide en las medidas de Y una subida de 180 euros a cada empleado. e) Determinar cómo incide en dichas medidas una subida del 10 %. 24. (**)El salario de los 150 trabajadores de una empresa tiene media 1050 y desviación 6. Cuántos empleados, como máximo, tienen su salario fuera del intervalo [1038, 1062]? 25. Responde si las siguientes conclusiones son acertadas, justificando tu respuesta. a) Un agente de la propiedad observa que el precio medio de las casas del centro de Valladolid es de medio millón de euros y por tanto concluye que la mitad de las casas del centro cuestan menos de medio millón de euros. b) Un viajante calcula que el coste medio de los últimos 5 viajes ha sido de 60 euros y concluye que el coste total es de 300 euros.
Estadística 6 c) El contable de una empresa piensa que se ha confundido ya que ha llegado a la conclusión de que el 90 % de los empleados gana menos que el salario medio. d) Una vendedora de helados observa que el sabor preferido entre los 10 sabores disponibles es el de chocolate y concluye que más de la mitad de los helados vendidos son de chocolate. 26. Se ha observado que el número de clientes que acude diariamente a un determinado establecimiento es una variable estadística con media 200 y varianza 900. Cuál es el porcentaje máximo de días en los que acuden más de 235 clientes? y si sabemos que la distribución de los datos es, además, simétrica? 27. En un estudio publicado en el Journal of Performance of Constructed Facilities (febrero de 1990) sobre redes de distribución de agua, las lecturas de presión interna para una muestra de secciones de tubos tuvieron una media de 7.99 psi (libras por pulgada cuadrada) y una desviación estándar de 2.02 psi. a) Utiliza esa información para construir un intervalo en el que estén al menos el 95 % de las lecturas de la muestra. b) Esperarías encontrar una lectura de presión interna de 20 psi? Por qué? 28. En una Escuela hay matriculados 550 alumnos en primero, 300 en segundo y 150 en tercero. El número medio de asignaturas de los alumnos de primero es de 8,2. El número medio de asignaturas de los alumnos de segundo es de 12,4. El número medio de asignaturas de los alumnos de tercero es de 6,7. Hallar la media del número de asignaturas de los alumnos de toda la Escuela. 29. La recaudación media por persona en un cine el pasado martes fue de 3.9 euros. Si sabemos que el precio normal de la entrada es de 4.5 euros y el de la entrada reducida (carnet de estudiante, etc) es de 3.5 euros, cuántas personas de las 250 que asistieron al cine ese día adquirieron una entrada a precio reducido? 30. La recaudación media por persona en una tienda el pasado sábado fue de 39 euros. Si sabemos que la tienda tiene dos dependientas, que la primera hizo una recaudación media de 45 euros por persona que atendió y que la segunda hizo una recaudación media de 35 euros por persona que atendió, cuntas personas de las 50 que fueron atendidas ese día en la tienda, lo fueron por la primera dependienta? 31. En un conjunto de 27 valores de una muestra, aumentamos 5 unidades a los 3 valores más altos. Responder, razonadamente, cuáles de las siguientes medidas sufrirán variación a) La media aritmética b) El percentil 80 c) La mediana d)el percentil 95 32. Una empresa multinacional tiene dos oficinas en España, una en Madrid y otra en Barcelona; un estudio realizado sobre los salarios de los empleados (en euros) arroja los siguientes resultados:
Estadística 7 Salario número empleados (500,1000] 42 (1000,1500] 103 (1500,2000] 35 (2000,3000] 25 (3000,4000] 12 (4000,5000] 3 a) Qué porcentaje de empleados cobran más de 3250 euros? b) Qué salario es superado por el 80 % de los empleados? c) Qué salario no supera el 70 % de los empleados? 33. En la siguiente tabla se presentan las puntuaciones obtenidas por los ocho participantes en la prueba de paralelas y por los 6 de la prueba de anillas en una competición gimnástica: Paralelas 9.45 9.55 9.05 9.65 9.25 9.85 9.70 9.40 Anillas 9.50 9.60 9.10 9.45 9.00 9.05 En cuál de las dos pruebas tiene mejor nivel el participante con puntuación en negrita? En qué grupo de puntuaciones existe mayor variación?. 34. Dos revistas especializadas en empleo, A y B, han publicado una media de ofertas de trabajo, que requieren alta cualificación, de x A = 10 y x B = 16, con varianzas, respectivamente s 2 A = 4 y s2 B mayor dispersión relativa? = 9. Qué revista presenta 35. De un conjunto de datos numéricos cuyos valores x 1, x 2,..., x k con frecuencias absolutas n 1, n 2,..., n k respectivamente y cuya distribución es simétrica y unimodal, se sabe que Se pide: k N = n i = 40, k n i (x i a) = 0, para a = 10 y k n i x 2 i = 5 000. a) Hallar, de forma razonada, la media, la mediana y la moda del conjunto de datos. Calcular la varianza. b) Si se sabe que IQR= 12 y el menor de los datos es 1, dibujar el diagrama de caja del conjunto de datos. 36. De un conjunto de datos x 1, x 2,..., x n se conocen Q 1 = 3, Q 2 = 4,5, Q 3 = 5, x (n) = 10 y el resto de los datos están entre los datos 1 y 6. Los datos anteriores se transforman mediante Y = 2X + 1. Dibujar el diagrama de caja o box-plot de los datos transformados. La tranformación afectará a la asimetría del conjunto de datos? Y a la dispersión? Cómo?
Estadística 8 37. Sea X una variable estadística cuyo coeficiente de variación es 0.15 y x= 2; calcula el coeficiente de variación de Y=2X-3. 38. De un conjunto x 1, x 2,..., x N se conocen x, Q 1 y s; cuáles de las siguientes medidas conoces también si la distribución es simétrica? Razona la respuesta. Me Mo Q 3 s 2 IQR CV Recorrido 39. La Corner Convenience Store siguió la pista del número de clientes que pagaron a mediodía durante 100 días. A continuación se presentan las medidas resultantes, redondeados al entero más próximo: Media=95, Mediana=97, Moda=98, Rango Medio (semisuma del máximo y del mínimo)=93, Desviación estándar=12, Primer Cuartil=85, Tercer cuartil=107, Rango=56. a) A cuántos clientes atendió la Corner Convenience Store durante el mediodía, más a menudo que cualquier otro número? Explicar cómo determinó su respuesta. b) En cuántos días hubo entre 85 y 107 clientes que pagaron al mediodía? Explicar cómo determinó su respuesta. c) Cuál fue el mayor número de clientes que pagaron durante cualquier hora del mediodía? Explicar cómo determinó su respuesta. d) Para cuántos de los 100 días el número de clientes que pagaron está a menos de tres desviaciones estándar de la media? Explicar cómo determinó su respuesta. e) Construir, si es posible, el diagrama de caja de este conjunto de datos, comentando a partir de él la simetría de los datos.