ENCUENTRO # 48 TEMA: Distribución Normal CONTENIDOS: 1. Distribución Normal. Elementos históricos y definición. 2. Uso de las tablas de valores Z 3. Uso de estandarización a valores Z. 4. Ejercicios propuestos 5. Ejercicios de Entrenamiento PAES Ejercicio Reto Un estudiante que se somete al examen de admisión de una universidad, sin haberse preparado, contesta al azar 30 preguntas de selección múltiple donde de cuatro opciones solo una es correcta. Cuál es la probabilidad de que conteste correctamente 18 de las 30 y poder aprobar con la nota mínima el examen? A) 2.90 x 10-2 B) 8.05 x 10-2 C) 3.98 x 10-5 D) 6.07 x 10-6 1. Distribución Normal. Elementos históricos y definición. La Distribución Normal también conocida como la curva campana, curva de Gauss o campana de Gauss en honor a Carl Friedrich Gauss (1777 1855), famoso matemático alemán. Aunque reconocida anteriormente por el estadístico francés Abraham de Moivre (1667 1754) quien además era consultor de para temas de juegos de azar. Al estudiar el resultado del experimento aleatorio lanzamiento de una moneda, obtuvo que la probabilidad de obtener cara (o corona ) se amolda perfectamente a la distribución binomial. Y al elaborar la gráfica de los resultados, esta iba tomando un forma suavizada conforme se aumentaba el número de lanzamientos de la moneda (la moneda al no estar alterada, presenta una probabilidad del 50% (p=0.5) como probabilidad de éxito.) Lanzamiento de una moneda seis veces: N de probabilidad éxitos 0 0.01563 1 0.09375 2 0.23438 3 0.31250 4 0.23438 5 0.09375 6 0.01563
Lanzamiento de una moneda diez veces: N de probabilidad éxitos 0 0.00098 1 0.00977 2 0.04395 3 0.11719 4 0.20508 5 0.24609 6 0.20508 De Moivre manifestó que si era posible hallar una función para esta curva, calcular la probabilidad de que aparezca corona o cara a lanzar n veces una moneda, se nos haría mucho más fácil. Un dato muy interesante es que Galileo Galilei (1564 1642), hizo un análisis de errores de medición de observaciones astronómicas, ya sea por errores instrumentales o humanos, y notó que eran simétricos de donde nace la curiosidad sobre la forma que tiene esa distribución de los errores de medición y fue hasta el siglo XIX que se descubrió que seguía una distribución normal. Gauss en 1809, estudio más a profundidad y formuló la ecuación de la curva; de ahí que también se la conozca, más comúnmente, como la "campana de Gauss". 2 1 x 2 1 f ( x) 2 La distribución de una variable normal está completamente determinada por dos parámetros, su media y su desviación estándar, denotadas generalmente por y. Y es de las más famosas distribuciones estadísticas ya que numerosos fenómenos naturales se ajustan a ella y que presenta unas propiedades sumamente interesantes. Al observar el histograma, notamos que cada rectángulo se vuelve proporcional al número de datos en el rango de valores correspondiente. También podemos observar que si en el eje horizontal se levantan perpendiculares en dos puntos a y b, el área bajo la curva delimitada por esas líneas indica la probabilidad de que la variable que estemos estudiando. Además, la curva alcanza su mayor altura en torno a la media aritmética, mientras que sus "colitas" se extienden asintóticamente hacia el eje x. La distribución normal posee ciertas propiedades importantes que conviene destacar: 1. Tiene una única moda, que coincide con su media y su mediana. 2. La curva normal es asintótica al eje de abscisas. Por ello, cualquier valor entre y es teóricamente posible. El área total bajo la curva es, por tanto, igual a 1. 3. Es simétrica con respecto a su media. Según esto, para este tipo de variables existe una probabilidad de un 50% de observar un dato mayor que la media, y un 50% de observar un dato menor. 4. La distancia entre la línea trazada en la media y el punto de inflexión de la curva es igual a una desviación típica o estándar ( ). Cuanto mayor sea, más aplanada será la curva. 5. El área bajo la curva comprendida entre los valores situados aproximadamente a dos desviaciones estándar de la media es igual a 0.95. En concreto, existe un 95% de posibilidades de observar un valor comprendido en el intervalo.
6. La forma de la campana de Gauss depende de los parámetros y. La media indica la posición de la campana, de modo que para diferentes valores de la gráfica es desplazada a lo largo del eje horizontal. Por otra parte, la desviación estándar determina el grado de apuntamiento de la curva. Cuanto mayor sea el valor de, más se dispersarán los datos en torno a la media y la curva será más plana. Un valor pequeño de este parámetro indica, por tanto, una gran probabilidad de obtener datos cercanos al valor medio de la distribución. 7. Como se deduce de este último apartado, no existe una única distribución normal, sino una familia de distribuciones con una forma común, diferenciadas por los valores de su media y su varianza. De entre todas ellas, la más utilizada es la distribución normal estándar, que corresponde a una distribución de media 0 y varianza 1. N,, se 8. Es importante conocer que, a partir de cualquier variable X que siga una distribución puede obtener otra característica Z con una distribución normal estándar, sin más que efectuar la transformación z x. 2. Uso de las tablas de valores Z. Esta última propiedad permite hacer uso de las tablas para valores Z, a partir de las que se puede obtener de modo sencillo la probabilidad de observar un dato menor o igual a un cierto valor z, y que permitirán resolver preguntas de probabilidad acerca del comportamiento de variables de las que se sabe o se asume que siguen una distribución aproximadamente normal. Ejemplo de una tabla para valores Z: Tabla de valores para p( x) Z z 0.00.01.02.03.04.05.06.07.08.09 0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359 0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753 0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141 0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517 0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879 0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224 0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549 0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852 0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133 0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389 1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621 1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830 1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015 1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177 1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319 1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441 1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545 1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633 1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706 1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767
2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817 2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857 2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.4878 0.9881 0.9884 0.9887 0.9890 2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916 2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936 2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952 2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964 2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974 2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981 2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986 3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990 3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993 3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995 3.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997 3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998 2.1 Ejemplo de uso de la tabla: Se sabe que el peso de unas personas de determinada población, se aproxima a la distribución normal, con media de 80 kg. y una desviación típica de 10 kg. Cuál es la probabilidad de que al escoger una persona al azar, tenga un peso inferior a 100 kg? Primero procederemos a estandarizar la distribución para poder aplicar la tabla anterior y calcular la probabilidad que nos interesa: x 10080 p( x 100) p 10 p( x 100) pz 2 Esta última probabilidad puede ser fácilmente obtenida a partir de la Tabla de valores z, resultando ser 0. 9772. Lo que puede interpretarse que el 97.7% es la probabilidad de que una persona elegida sea menor que 100 kg. 2.2 Manejo de la tabla normal. Casos frecuentes 1) Cuando la probabilidad pedida se encuentra directamente en la tabla: a. Encontrar la probabilidad de p(z<0.45). i. En la 1ª columna z buscamos el valor de las unidades y las décimas. ii. En la fila correspondiente al valor de la columna buscamos el valor de las centésimas. iii. Basta buscar 0.4 en la columna y 0.05 en la fila. Su intersección nos da la probabilidad. Al leer el número de la tabla nos aparece el 0.6736, entonces p(z<0.45)=0.6736 2) Probabilidad de un valor positivo mayor que Z a. Encontrar la probabilidad de p (z >1.24) i. En la 1ª columna z buscamos el valor de las unidades y las décimas. ii. En la fila correspondiente al valor de la columna buscamos el valor de las centésimas. iii. Basta buscar 1.2 en la columna y 0.04 en la fila. Su intersección nos da la probabilidad menor que z, por tanto hay que aplicar una resta para obtener la probabilidad mayor que z: p (z >1.24)=1 p (z <1.24)
3) Probabilidad de un valor negativo menor que Z: a. Encontrar la probabilidad de p ( z 0.72 ) i. En la primera columna z buscamos el valor de las unidades y las décimas. ii. En la fila correspondiente al valor de la columna buscamos el valor de las centésimas. iii. Buscamos 0.7 en la columna y 0.02 en la fila. Su intersección nos da la probabilidad. Esto nos da la respuesta directamente al leerla de la tabla. 4) Probabilidad entre dos valores positivos p(0.5 z 1.76) a. Leemos directamente en la tabla la p ( z 1.76 ) y la p ( z 0.5 ). b. La diferencia entre ellas es la probabilidad que nos piden. c. p ( 0.5 z 1.76 ) = p ( z 1.76 ) p ( z 0.5 ) = 0.9608 0.6915 = 0.269 5) Probabilidad entre dos valores negativos p( 1.76 z 0.5) a. Por simetría cambiamos los dos valores negativos a positivos y calculamos sus probabilidades. b. p( 1.76 z 0.5) = p(0.5 z 1.76) = 0.9608 0.6915 = 0.2693 c. Observa que el área sombreada es la misma que en el caso 4. 6) Probabilidad entre un valor positivo y uno negativo p( 0.53 z 2.46) a. Leemos directamente en la tabla el valor del número positivo: p(z 2.46) = 0.9931 b. Por simetría cambiamos el valor negativo a positivo y leemos la probabilidad: p( z 0.53) = 0.7019 c. p( 0.53 z 2.46) = p( z 0.53) + p(z 2.46) 1 = 0.9931 +0.7019 1 = 0.6950 7) Uso de la tabla de forma inversa. P( z w) = 0.9599 (percentil 95) a. Buscamos en la tabla el valor de 0.9599 b. Leemos la cabecera de la fila en donde se encuentra el valor dado. Fila 1.7 c. Leemos la cabecera de la columna donde se encuentra el valor dado. Columna 0.06. d. El valor w = 1.76 3. Uso de estandarización a valores Z. 1) El colesterol en la población tiene distribución normal, con media 200 y desviación 10. a. Qué porcentaje de individuos tiene colesterol inferior a 210? p( x 210) x 210 200 p 10 10 p z 10 p z 1 0.8413
b. Qué valor del colesterol sólo es superado por el 10% de los individuos?. Al leer en la tabla el valor de 0.8997 el valor z que le corresponde es 1.28, por tanto: x z x z x z x 20010(1.28) x 20012.8 x 212.8 4. Ejercicios propuestos 1) Sea Z N(0, 1). Utilizando las tablas calcular: a) P(Z 2) b) P(Z 1.03) c) P(Z 1.03) d) P(Z 4) e) P(Z 4) f) P(Z 2.1) g) P(Z 2.2) h) P(Z 1.13) i) P(Z 1.96) j) P(Z 2.33) 2) Sea Z N(0, 1). Utilizando las tablas calcular: a) P(1 Z 2) b) P(0.5 Z 1.5) c) P( 1.96 Z 1.96) d) P( 2.58 Z 2.58) 3) Suponiendo que Z N(0, 1), calcular utilizando la tabla de valores z: a) El percentil 25 (o primer cuartil) es... b) El percentil 50 (o mediana) es... c) El percentil 75 (o tercer cuartil) es... d) El percentil 95 es... e) El percentil 99 es... f) Entre qué dos valores de Z simétricos respecto del 0 se encuentran el 95% de las g) Entre qué dos valores de Z simétricos respecto del 0 se encuentran el 90% de las h) Entre qué dos valores de Z simétricos respecto del 0 se encuentran el 99% de las 4) En un estudio realizado se obtuvo que la variable altura de las mujeres X N(163, 49). Calcular: a) El percentil 25 (o primer cuartil) es b) El percentil 50 (o mediana) es... c) El percentil 75 (o tercer cuartil) es... d) El percentil 95 es... e) El percentil 99 es...
f) Entre qué dos valores de X simétricos respecto de µ = 163 se encuentran el 95% de las g) Entre qué dos valores de X simétricos respecto de µ = 163 se encuentran el 90% de las h) Entre qué dos valores de X simétricos respecto de µ = 163 se encuentran el 99% de las 5) Supongamos que al hacer un estudio estadístico se obtiene que la altura de las mujeres de la ciudad de San Salvador es una variable aleatoria con distribución normal de media 163 cm y desviación 7 cm. Se pide calcular: a) La probabilidad que una mujer seleccionada al azar mida menos de 172 cm. b) La probabilidad que una mujer seleccionada al azar mida menos de 160 cm. c) La probabilidad que una mujer seleccionada al azar mida más de 155 cm. d) La probabilidad que una mujer seleccionada al azar mida más de 175 cm. e) La probabilidad que una mujer seleccionada al azar mida entre 158 cm y 166 cm. 6) La empresa El granero ubicada en Usulután, produce paquetes de arroz de una libra de peso. El peso de los paquetes se distribuye según una normal de media 1 lb y desviación 0.05 lb. Se dispone de una maquina que controla que los pesos sean entre 0.9 lb y 1.1 lb, de lo contrario los retira automáticamente para que no salgan a la venta. a) Qué porcentaje de los paquetes producidos se retiran por el mecanismo de control? b) Si un paquete pasa el control, Cuál es la probabilidad que tenga un peso superior a 1.05 libras? 7) En el hospital de maternidad se estima que el peso en el momento del nacimiento de los bebés se comporta como una distribución normal de media 2.6 kg y desviación 0.5 kg. a) Si los bebés de menos de 1.7 kg necesitan pasar por un periodo de incubación artificial, cuál es el porcentaje de bebés que necesitan pasar por este periodo? b) Qué porcentaje de bebés pesa más de 3.5 kg? c) A partir de qué peso se encuentra el 10% de los bebés que más pesan? d) Cuál es el intervalo centrado en la media que contiene el peso del 90% de los bebés? 8) Un ingeniero eléctrico ha determinado que la fiabilidad de cierto tipo de fusible eléctrico, es la probabilidad que un fusible escogido al azar entre los fusibles recién producidos, funcione correctamente bajo las condiciones para las cuales fue diseñado. En una comprobación rutinaria, se probaron 1000 fusibles y se encontró que 27 eran defectuosos. Suponiendo que la fiabilidad del fusible es de 0.98, Cuál es la probabilidad de observar 27 o más fusibles defectuosos? 9) En el banco Sombrerito Azul, los montos del dinero que se solicitan en calidad de préstamos tienen distribución normal, con media de $70,000 y una desviación estándar de$ 20,000. Don Chamba ha llegado ha llenado un solicitud de préstamo. Cuál es la probabilidad de que el monto solicitado sea entre $65,000 y $80,000?
5. Ejercicios de entrenamiento PAES... 1) Una enfermera tomó diariamente y durante 8 días la presión arterial sistólica y diastólica de un paciente. Los datos registrados se resumen para la presión sistólica en una media aritmética de 105 mm Hg con una desviación estándar de 6 mm Hg. Para la presión diastólica, la media fue de 72 mm Hg y desviación estándar de 6 mm Hg. Cuál de las presiones sanguíneas del paciente presenta mayor dispersión relativa? (PAES 2011) a) La presión sistólica. b) La presión diastólica. c) Iguales. d) No se puede determinar 2) Según una revista especializada en temáticas infantiles, los niños actualmente dedican un porcentaje considerable de horas del día para ver televisión. Suponga que la distribución del tiempo que los niños pasan frente a la televisión por año, se distribuye normalmente con una media igual a 1500 horas y una desviación estándar de 100 horas. Qué porcentaje de niños aproximadamente ve televisión entre 1400 y 1600 horas por año? (PAES 2014) a) 31.74% b) 34.13% c) 68.26% d) 84.13% 3) El peso medio de los salvadoreños es de 80 kg con una desviación estándar de 14 kg, cuál es la probabilidad de que al tomar el peso de una persona esta se encuentre entre 73 y 87 kg? (PAES 2015) a) 0.1915 b) 0.3830 c) 0.5000 d) 0.5890 4) Cuánto vale el área bajo la curva normal estandarizada para un valor de z entre 0.56 y 0.56? (PAES 2015) a) 0.1120 b) 0.2123 c) 0.2877 d) 0.4246