Estadística 200-20 Problemas del Tema. Se sabe que el 4 % de los días de un mes de 25 días laborables un trabajador de cierta empresa utiliza menos de 5 minutos en salir a fumar. El 40 % de los días este tiempo no supera los 25 minutos. En días supera los 30 minutos, y el 24 % de los días sale a fumar entre 30 y 35 minutos. Además, ningún día ha superado los 50 minutos. Construir la tabla de frecuencias de la distribución del tiempo para fumar consumido por este trabajador. 2. En una encuesta realizada a 00 familias se ha obtenido la siguiente distribución de frecuencias relativas acumuladas de X= N o de miembros que componen la unidad familiar. X i 2 3 4 5 6 7 F i 0.5 0.32 0.57 0.74 0.87 0.6 a) Determina la proporción de familias con un máximo de cuatro miembros. b) Determina el n o de familias en la muestra con exactamente 4 miembros. c) Determina el tamaño mínimo que debe tener una familia para estar entre las 0 familias con más miembros. d) Las 32 familias menos numerosas tienen menos de qué número de miembros? 3. Dados los datos resumidos en esta tabla de frecuencias: x i f i - 0.3 2 0.3 3 0.4 Calcula x, s 2 y la mediana. 4. Las cinco primeras desviaciones con respecto a la media muestral de un conjunto de seis observaciones de medición de resistencia son: 2, 3, 7, 4 y. Cuál es el valor de la sexta desviación con respecto a la media? Dar una muestra que tenga las desviaciones anteriores con respecto a la media. Cuántas muestras pueden construirse con esta característica? Razonar la respuesta. 5. De una empresa con 500 trabajadores se sabe que la media de los salarios es de 800 euros, con una desviación estándar de 00. Es posible que haya 50 trabajadores que cobren más de 00 euros? 6. Una población está dividida en dos subgrupos. En el primero, la media de edad es de 25 años y en el segundo grupo de 2. Será cierto que la media de la población total está en el intervalo (25,2)? Razonar la respuesta.
Estadística 200-20 2 7. La puntuación media obtenida por los alumnos en un examen fue de 5 con una desviación estándar de. Si la puntuación z (valor tipificado) de un estudiante en este examen fue de.8, cuál es su calificación en el examen? 8. Sea X una variable estadística con valores {x, x 2,..., x N }. Para qué valor de k es N (x i k) = 0?. Puede ser que un conjunto de datos x, x 2,..., x N tenga x = 3 y N x 2 i N = 8? 0. Dadas dos variables estadísticas, X e Y, cuál tiene mayor dispersión/variabilidad, X con media 20 y varianza 64 ó Y con media 25 y varianza 8? Razonar la respuesta.. Consideramos un conjunto de datos con media 7 y varianza 3. Entre ellos hay dos datos iguales a 7. Supongamos que eliminamos del conjunto uno de los datos iguales a 7. a) Cuál es la media del nuevo conjunto de datos? Justificar la respuesta. b) La varianza del nuevo conjunto de datos, aumenta, disminuye o sigue siendo igual a 3? Justificar la respuesta. 2. Estamos interesados en la variable X= Tiempo de vida (en semanas) de bombillas fabricadas con cierto filamento. En una muestra grande se han obtenido resultados resumidos en la siguiente tabla: Percentil 30 50 70 00 Tiempo de Vida 8 22 26 30 Construir con estos datos una tabla de frecuencias relativas y hallar el tiempo medio de vida usando como dato la marca de clase. 3. Los salarios de los 20 empleados de una empresa son: 0 cobran 600 euros, cobran 00 euros, uno cobra 00 euros. Se pide: a) De terminar cuál de las medidas de centralización representa mejor a la variable Y. Calcular e interpretar las medidas de dispersión. b) Construir e interpretar el diagrama de caja de Y. Localizar los datos atípicos. c) Estudiar como incide en las medidas de Y una subida de 80 euros a cada empleado. d) Determinar cómo incide en dichas medidas una subida del 0 %. 4. En una clase grande hay 50 estudiantes masculinos y 00 femeninos; los estudiantes promedian en altura 75 cm. con una desviación estandar de 25 cm y las estudiantes promedian 65 cm con desviación estandar de 25 cm. Tomando conjuntamente los hombres y las mujeres, a) La altura promedio sería:
Estadística 200-20 3 b) La desviación estándar de las alturas sería un poco mayor de 25 cm., menor que 25 cm, o exactamente 25 cm? 5. Se ha observado que el número de clientes que acude diariamente a un determinado establecimiento es una variable estadística con media 200 y varianza 00. Cuál es el porcentaje máximo de días en los que acuden más de 235 clientes? y si sabemos que la distribución de los datos es, además, simétrica? 6. Una empresa multinacional tiene dos oficinas en España, una en Madrid y otra en Barcelona; un estudio realizado sobre los salarios de los empleados (en euros) arroja los siguientes resultados: Salario número empleados (500,000] 42 (000,500] 03 (500,2000] 35 (2000,3000] 25 (3000,4000] 2 (4000,5000] 3 a) Qué porcentaje de empleados cobran más de 3250 euros? b) Qué salario es superado por el 80 % de los empleados? c) Qué salario no supera el 70 % de los empleados? 7. En la siguiente tabla se presentan las puntuaciones obtenidas por los ocho participantes en la prueba de paralelas y por los 6 de la prueba de anillas en una competición gimnástica: Paralelas.45.55.05.65.25.85.70.40 Anillas.50.60.0.45.00.05 En cuál de las dos pruebas tiene mejor nivel el participante con puntuación en negrita? En qué grupo de puntuaciones existe mayor variación?. 8. De un conjunto de datos numéricos cuyos valores x, x 2,..., x k con frecuencias absolutas n, n 2,..., n k respectivamente y cuya distribución es simétrica y unimodal, se sabe que N = n i = 40, n i (x i a) = 0, para a = 0 y n i x 2 i = 5 000. Se pide: a) Hallar, de forma razonada, la media, la mediana y la moda del conjunto de datos. Calcular la varianza. b) Si se sabe que IQR= 2 y el menor de los datos es, dibujar el diagrama de caja del conjunto de datos.
Estadística 200-20 4. De un conjunto de datos x, x 2,..., x n se conocen Q = 3, Q 2 = 4,5, Q 3 = 5, x (n) = 0 y el resto de los datos están entre los datos y 6. Los datos anteriores se transforman mediante Y = 2X +. Dibujar el diagrama de caja o box-plot de los datos transformados. La tranformación afectará a la asimetría del conjunto de datos? Y a la dispersión? Cómo? 20. La Corner Convenience Store siguió la pista del número de clientes que pagaron a mediodía durante 00 días. A continuación se presentan las medidas resultantes, redondeados al entero más próximo: Media=5, Mediana=7, Moda=8, Rango Medio (semisuma del máximo y del mínimo)=3, Desviación estándar=2, Primer Cuartil=85, Tercer cuartil=07, Rango=56. a) A cuántos clientes atendió la Corner Convenience Store durante el mediodía, más a menudo que cualquier otro número? Explicar cómo determinó su respuesta. b) En cuántos días hubo entre 85 y 07 clientes que pagaron al mediodía? Explicar cómo determinó su respuesta. c) Cuál fue el mayor número de clientes que pagaron durante cualquier hora del mediodía? Explicar cómo determinó su respuesta. d) Para cuántos de los 00 días el número de clientes que pagaron está a menos de tres desviaciones estándar de la media? Explicar cómo determinó su respuesta. e) Construir, si es posible, el diagrama de caja de este conjunto de datos, comentando a partir de él la simetría de los datos. 2. Sean X e Y variables estadísticas con distribución conjunta: X\Y 0 2 - b 0 c 0 a 0 3 g d e f 2 a) Completar la tabla y obtener las distribuciones marginales de X e Y. b) Calcular x y s X. Cuál será la mediana de Y? c) Son X e Y independientes? d) Obtener la distribución de frecuencias de X condicionada a Y = 2 y la de Y condicionada a X 0. e) Obtener la distribución de la variable Z = X + Y. f ) Calcular fr(x < 4, Y < 0) y fr(xy < 3 2 ). 3
Estadística 200-20 5 22. La variable X toma los valores 0 y con f X (0) = 0,4; la variable Y toma los valores y 2 y se conocen: f Y/(X=0) () = 0,5 y f Y/(X=) () = 0,4. Obtener la tabla de doble entrada para (X,Y) y obtener la recta de regresión de Y respecto de X. 23. A los alumnos de determinada asignatura del Grado se les ha preguntado sobre el número de horas semanales que dedican a la asignatura (X) y el número de convocatorias consumidas (Y), obteniéndose la siguiente información: Una quinta parte de los alumnos que estudian 6 horas han consumido 2 convocatorias. El número medio de convocatorias consumidas por los alumnos que estudian 4 horas es.25. el número medio de convocatorias consumidas es 0.75. El 0 % de los alumnos estudian 2 horas a la semana y han consumido una sola convocatoria. El resto de los datos se encuentran resumidos en la siguiente tabla: Y \X 0 2 4 6 0 0 c 0 2 b 7 4 2 a 4 d Obtener a, b, c y d. 24. Obtener la distribución conjunta de frecuencias absolutas de (X,Y) sabiendo que son independientes y que X 2 3 n i 5 5 0 Y 4 5 n j 2 8 25. A los visitantes de un museo se les clasifica en Rápidos, Normales y Lentos, siendo los lentos la tercera parte de los normales, pero 4 de cada 5 visitantes son rápidos. Ahora bien, del 63 % de los visitantes que compran en la tienda del museo, los lentos son los menos compradores, pues solo el 3 % de ellos compra, mientras que de los normales compra el %. Completar la tabla de frecuencias relativas conjuntas. Qué porcentaje de los que compran son rápidos? Compra No compra Rápido Normal Lento