UNIVERSIDAD DE VALPARAÍSO Ingeniería Civil, primer semestre 2016 GUIA N 1: Estadistica descriptiva. EJERCICIO 1 Clasificar cada una de las siguientes variables: si es cualitativa (nominal u ordinal) o cuantitativa (discreta o continua) a) Distancia diaria recorrida por cada estudiante para ir de su casa a la universidad. b) Nivel educacional. c) Tiempo que requiere un estudiante para responder a un examen. d) Llamadas que llegan a la central telefónica en un día. e) Marcas de refresco. f) Color del cabello de las estudiantes que toman el curso de bioestadística en el segundo semestre. g) Temperatura promedio diaria. h) Grado alcanzado en la institución de Carabineros. i) Número de acciones vendidas en un día en la Bolsa de Valores. j) Empresa de celulares elegida por los consumidores. EJERCICIO 2 Se ha hecho un estudio para determinar la preferencia de una marca especial de detergente por parte de las amas de casa. La obtención de la muestra se realizó llamando a teléfonos red fija en la región metropolitana. De la guía telefónica, se llamó al primer y último número de cada página impar. a) Quiénes constituyen la población? b) Qué tipo de muestreo se realizó? Fundamente. EJERCICIO 3 En la región de Antofagasta, ha ocurrido un derrame de petróleo frente a las costas de Tocopilla. Frente a esto, diversas autoridades han requerido la ayuda de ingenieros ambientales para poder medir las consecuencias en la fauna de esta catástrofe. Para ello, se requiere monitorear a los animales de las distintas especies presentes en ese lugar (lobos marinos, pelícanos, gaviotas, etc.) a) Indique claramente quienes constituyen la población. b) Qué tipo de muestreo propone usted para poder analizar de la mejor manera las distintas especies presentes en el lugar? Fundamente. EJERCICIO 4 La siguiente tabla indica los pesos de alumnos de 50 alumnos de la carrera de Medicina que cursan tercer año: Clase Marca de clase absoluta absoluta acumulada relativa relativa acumulada 45 47,5 0,04 5 19 0,38 45 72,5 0,08 1 a) Complete la tabla de frecuencias. b) Responde verdadero o falso según corresponda. Justifique las falsas:
1. El 76% de los alumnos pesan entre 60 y 65 kg. 2. 19 alumnos pesan entre 55 y 65 gr. 3. El 24% de los pesos de los alumnos varía entre 50 y 60 kg. 4. 45 personas pesan a lo mas 70 kg. 5. El 90% de los alumnos de la carrera de medicina pesa entre 45 y 70 kg. 6. 12 alumnos pesan como mínimo 65 kg. 7. 38 alumnos pesan a lo más 60 kg. 8. El 14% de los alumnos pesan entre 65 y 70 kg. c) Calcular la clase modal, la media, la varianza de la variable peso. EJERCICIO 5 El siguiente gráfico muestra el número semanal de minutos que pasan viendo la televisión estudiantes de secundaria. Observe detenidamente la información que entrega: 300 400 500 600 700 800 900 1000 1100 1200 a) Colóquele un título adecuado al gráfico. b) Qué nombre lleva este tipo de gráfico? c) Lleve los datos del gráfico a una tabla de frecuencias. d) Responda las siguientes preguntas: 1. Cuántos alumnos ven a lo mas 600 minutos de televisión? 2. Cuántos alumnos ven más de 900 minutos de televisión? 3. Qué porcentaje de alumnos ven entre 500 y 800 minutos de televisión? 4. Qué proporción de alumnos ven a lo más 500 minutos de televisión? 5. Si un estudio revela que los alumnos no deben ver más de 700 minutos semanales de televisión, qué porcentaje de alumnos sobrepasan lo permitido? e) Calcular la clase modal, la media, la varianza de la variable minutos semanales viendo televisión. EJERCICIO 6 Se seleccionaron de un proceso de fabricación, aleatoriamente 12 baterías y se llevó a cabo una prueba para determinar la duración de éstas. Los siguientes datos representan el tiempo de duración, en horas, para las 12 baterías: 48,8 49,3 52,5 52,7 53,1 54,9 56,8 57,3 58,1 58,7 58,9 59,0 a) Calcular la media, la varianza, la mediana, la moda, los cuartíles b) Calcule el coeficiente de variación.
EJERCICIO 7 Una empresa realiza un estudio de la resistencia de un tipo de cuerda. En la siguiente tabla se resumen los resultados obtenidos al medir la resistencia, en Kg, para 100 cuerdas fabricadas en la empresa bajo las mismas condiciones y los mismos materiales. Resistencia (Kg) Clase Marca de clase c i Frec. Absoluta n i Frec. Relativa 160-170 0.03 195 235 Total - f i Frec. Abs. Acumulada N i 11 Frec. Rel. Acumulada F i 0.23 24 0.66 0.16 92 a. Completar la tabla de frecuencias. b. Calcular el porcentaje de cuerdas cuya resistencia está comprendida entre 180 y 210 Kg. c. Encuentre los percentiles 10 y 50. d. Calcule la resistencia media muestral de las cuerdas. e. Grafique el Histograma de s Relativas y el Polígono de Relativas. EJERCICIO 8 Los datos siguientes representan en centímetros las longitudes de 50 artículos producidos por una máquina. 4.15 4.27 4.62 4.68 4.68 4.80 4.86 4.92 4.98 5.15 5.15 5.27 5.27 5.33 5.33 5.33 5.39 5.45 5.51 5.51 5.57 5.63 5.63 5.63 5.63 5.74 5.86 5.86 5.86 6.02 6.02 6.04 6.10 6.33 6.66 6.66 6.66 6.75 6.92 6.98 6.98 7.10 7.14 7.22 7.22 7.30 7.38 7.54 7.70 7.94 a) Construya una tabla de frecuencias completa para los datos. b) Construir el histograma asociado. c) Si el 25% de los artículos de menor longitud y el 75% de los artículos de mayor longitud son considerados defectuosos por el Departamento de Control de Calidad, entre qué longitudes los artículos serán considerados aceptables? EJERCICIO 9 Los siguientes datos indican el número de trabajadores que faltan a una empresa en 50 días de trabajo: 13 5 13 37 10 16 2 11 6 12 8 19 21 12 11 7 7 9 16 18 3 11 19 6 15 10 14 10 7 24 10 11 3 6 10 4 6 32 9 12 7 29 12 9 10 8 20 15 5 17 a) Construir una tabla de frecuencias. b) Graficar su correspondiente histograma y polígono de frecuencias. c) Graficar el diagrama acumulativo de frecuencias relativas. d) Trazar la ojiva. e) Calcular la media muestral, mediana, moda, varianza, desviación estándar y cuartiles.
EJERCICIO 10 Los siguientes datos corresponden al número de vehículos particulares que pasaron por cierta arteria de la provincia de Valparaíso durante cada uno de los días del mes de marzo. 130 125 157 138 170 137 160 128 112 159 148 136 173 158 153 145 127 119 143 120 148 118 163 141 151 169 136 119 137 129 175 a) Elaborar una tabla de frecuencias de 7 intervalos. b) Durante cuantos días el transito de autos fue superior a 148 vehículos. c) Qué porcentaje de días el número de vehículos fue mayor a 129 y menor a 168? d) Graficar; histograma, polígono de frecuencia. e) Calcular, mediana, moda, desviación estándar, desviación media, rango intercuartil. EJERCICIO 11 Considere los siguientes datos que representan a estatura de un grupo de estudiantes, 1.65, 1.67, 1.82, 1.68, 1.58, 1.63, 1.75, 1.81, 1.68, 1.75, 1.82, 1.80, 1.51, 1.76, 1.92, 1.65, 1.88, 1.69, 1.70, 1.63. a) Usando las clases [1.50, 1.60), [1.60, 1.70) [1.90, 2.00), construya una tabla de frecuencias y dibuje un histograma. b) Calcule la media, la mediana y determine por observación la clase modal. c) Qué medida de tendencia central representa mejor la muestra, de acuerdo a los resultados obtenidos? EJERCICIO 12 Un negocio de venta (en miles de pesos) de ropa para adultos, dispone de dos establecimientos en Santiago. El gerente de este negocio, quiere hacer un ana lisis descriptivo de las ventas por cliente, en cada uno de sus dos locales y hacer comparaciones que permitan tomar algunas decisiones referentes a ofertas u otros. Las ventas por clientes tomadas de un registro en cada uno locales son: Local A 42 56 102 56 80 96 78 96 56 23 36 45 89 99 102 Local B 36 59 58 36 23 69 85 78 102 123 45 88 60 56 45 a) Calcule la media, la mediana y la moda para las ventas, en cada uno de los locales. En cua l de los locales las ventas son mejores? Justifique su respuesta. b) Se quiere categorizar a los clientes segu n sus compras, tomando como una sola muestra las ventas de los dos locales. La categorizacio n se quiere hacer de la siguiente forma: Categorıá C, al 25% de los clientes con compras ma s bajas. Categorıá B, al siguiente 50% de los clientes con compras ma s altas. Categorıá A, el resto. De aproximaciones de los lı mites de cada una de las categorı as. EJERCICIO 13 Un estudio publicado en Chemosphere (Febrero 2003) tuvo como objetivo conseguir información acerca de los niveles de fondo de la sustancia tóxica bifenilo policlorado (PCB) en muestras de suelo del Reino Unido. La concentración de PCB se mide en 0,0001 gramos por kilogramo se suelo. En una primera instancia se observaron 50 muestras con las que se obtuvieron las siguientes estadísticas: ;. Posteriormente, por alguna razón, se sabe que se han eliminado dos valores se la muestra original de manera que las nuevas estadísticas quedan como: ;. Determine los dos valores que se han eliminado.
EJERCICIO 14 Reconstruya una tabla de frecuencias de variable continua, formada por 5 intervalos de clase de amplitud constante igual a 10, a partir de la siguiente información: x = 70,N 3 =12,N 5 = 20, f 1 = 0.15, f 2 = 0.25, f 4 = 0.30. EJERCICIO 15 El Banco Crédito Internacional (BCI) quiere analizar el tiempo de espera para los clientes que asisten a sus sucursales en Santiago diferenciando dos turnos: M, turno de mañana (9 a 12) y T, turno de tarde (12 a 14). Para cada turno, M y T, se recogió en un día cualquiera, información referente al tiempo de espera (en minutos) de 3.000 clientes y 2.700 clientes respectivamente. Se entiende por tiempo de espera el tiempo que se demora un cliente en entrar y salir del banco. Se obtuvo la siguiente información: TURNO M TURNO T Media 10.25 Media 7.60 Mediana 10.28 Mediana 7.69 Moda 10.1 Moda 3.74 Desviación Estándar 2.22 Desviación Estándar 3.83 Varianza muestral 4.93 Varianza muestral 14.7 Rango 16.05 Rango 13.35 Mínimo 2.69 Mínimo 1.0 Máximo 18.75 Máximo 14.35 Q1 6.92 Q1 1.16 Q3 13.58 Q3 13.43 a) Construya un diagrama de caja (o boxplot). b) Cuál es la forma de la distribución de los tiempos de espera en cada turno? c) Basándose en estos resultados, si usted fuera cliente de este banco, en qué horario iría a hacer sus trámites bancarios en alguna sucursal del BCI en Santiago? Justifique su respuesta. EJERCICIO 16 Se tiene una muestra de 15 datos que corresponden a la presión de rotura (en Pascal) de una herramienta de uso masivo en una cierta constructora: 10,2; 14,1; 14,4; 14,4; 14,4; 14,5; 14,5; 14,6; 14,7; 14,7; 14,7; 14,9; 15,1; 15,9; 16,4 A partir de estos datos se obtuvo el siguiente resumen: datos Media 14,5 Mediana 14,6 Moda 14,4 Desviación estándar 1,33363092 Varianza de la muestra 1,77857143 Rango 6,2 Mínimo 10,2 Máximo 16,4 Q1 14,4 Q3 14,9 Cuenta 15 a) Construya un diagrama de caja (o boxplot). b) Según el criterio del diagrama de caja, existen valores atípicos (outliers) en los datos? Si existen, indique cuáles son y de qué tipo. c) Que se puede decir sobre la simetría o asimetría de los datos?
EJERCICIO 17 La tabla siguiente muestra las distribuciones de frecuencias de las calificaciones finales de matemática y física: Calificaciones en física Calificaciones en matemática 40-49 50-59 60-69 70-79 80-89 90-99 Total 90-99 2 4 4 10 80-89 1 4 6 5 16 70-79 5 10 8 1 24 60-69 1 4 9 5 2 21 50-59 3 6 6 2 17 40-49 3 5 4 12 Total 7 15 25 23 20 10 100 Refiérase a la tabla y determine: a) El número de estudiantes que obtuvieron calificaciones de 70-79 en matemática y 80-89 en física. b) El porcentaje de estudiantes con calificaciones en matemática por debajo de 70. c) El número de estudiantes que obtuvieron una calificación de 70 o más en física y menos de 80 en matemática. d) El porcentaje de estudiantes que pasaron al menos una de las materias, considerando que la mínima calificación para pasar es 60. e) Cree usted que existe una relación entre las calificaciones obtenidas por los estudiantes en ambas asignaturas? Cuál es aquel valor? Es el resultado obtenido lógico para usted? Fundamente. f) Obtenga a partir de la tabla dada las tablas marginales tanto para matemática como para física. g) A partir de las tablas obtenidas en el punto anterior, calcule la varianza y desviación estándar de las calificaciones en matemática, la varianza y desviación estándar de las calificaciones en física, y la covarianza. Qué indica esta última medida? EJERCICIO 18 La tabla siguiente muestra las distribuciones de frecuencias del nivel educacional y opinión sobre el matrimonio: Opinión sobre matrimonio Mala Regular Buena Muy Buena Total Preparatoria 72 25 112 98 307 Nivel Educacional Secundaria 65 20 90 120 295 Profesional 50 30 103 245 428 Total 187 75 305 463 1030 a) Calcular las frecuencias relativas marginales. b) Calcular las frecuencias relativas condicionales. c) Son las variables independientes?