Distribuciones de Probabilidad Parte 3: La Distribución Normal La campana de Gauss La campana de Gauss, curva de Gauss o curva normales una función de probabilidad continua, simétrica, cuyo máximo coincide con la media µ Esta curva fue descrita por el matemático alemán Carl F. Gauss al estudiar los errores que se producen al medir reiteradamente cierta magnitud 1
La campana de Gauss La gran importancia de esta distribución se debe a la enorme frecuencia con que aparecen en las situaciones más variadas. Entre las muchas variables que se distribuyen normalmente están: Caracteres morfológicos: tallas, pesos, envergaduras,. Caracteres fisiológicos: efectos de medicamentes, o del abono Caracteres sociológicos: Consumo de productos Caracteres físicos: resistencia a rotura de un material Y, en general, cualquier característica que se obtenga comuna suma de muchos factores La función de densidad Para cada valor de µ (media) y de σ (desviación típica) hay una curva normal que se representa por N (µ,σ) N(0,1) N(1,0.5) 2
Distribución de probabilidad bajo la curva normal En una primera aproximación, el reparto de probabilidades en una distribución normal cualquiera se realiza del siguiente modo Esto significa que si, por ejemplo el cociente intelectual de una grupo de personas se distribuye N(110, 10) El 68,26% tiene un CI entre 100 y 120 El 95,44% tiene un CI entre 90 y 130 El 97,74% tiene un CI entre 80 y 140 Distribución de probabilidad bajo la curva normal N(110, 10) El 68,26% tiene un CI entre 100 y 120 El 95,44% tiene un CI entre 90 y 130 El 97,74% tiene un CI entre 80 y 140 90 100 110 120 130 Con estos datos y debido a la simetría de la gráfica podemos calcular probabilidades como por ejemplo: p (x > 130) Sabemos que p (90 < x < 130) = 0. 9544 Luego, el suceso contrario tendrá probabilidad de 1-0.9544 = 0.0456 El suceso contrario sería p (x < 90) + p(x > 130) Debido a la simetría de la gráfica, nuestra probabilidad sería la mitad p (x > 130) = 1 0.0456 = 0.0228 2 3
Normal Estándar Como habrás comprobado no resulta fácil hacerlo de esa manera para todas las distribuciones normales y además, quéocurre si nos interesa números más complicados como por ejemplo p (x > 115.4) Como ya se ha mencionado, la probabilidad estárelacionada con el área bajo la función de densidad, que en el caso de la normal es bastante complicada. Por eso existen unas tablas que nos ayudarán a calcular dichas áreas en tanto que ya están calculadas algunas. Solo tenemos que usar criterios de simetría y de suma y resta de áreas Es muy conveniente que imprimas el archivo TABLA_DE_LA_NORMAL Te hará falta para resolver los problemas incluso en los exámenes MANEJO DE LA TABLA NORMAL ESTÁNDAR http://www.vadenumeros.es/sociales/manejo-tabla-normal.htm El link de arriba te explica cómo utilizar la tabla de normal, es conveniente que lo mires bien para que puedas preguntar exactamente lo que no te quede claro y poder trabajar los ejercicios en clase Tengan cuidado porque la página tiene un error (al menos desde mi ordenador) en la parte de los ejercicios utiliza el símbolo = cuando en realidad quiere decir Habrannotado que, además utiliza la variable z en lugar de la x. Esto se hace siempre para distinguir las normales estándar, N(0,1), del resto 4
TIPIFICACIÓN DE UNA VARIABLE Para calcular la probabilidad de una variable normal cualquiera N (µ,σ) vamos a relacionarla con la conocida N(0,1) porque si no, tendríamos que tener millones de tablas. Este proceso se conoce con el nombre de TIPIFICACIÓN Es decir, lo que vamos a hacer es dada una variable X εn(µ,σ) la vamos a convertir en otra variable Z εn(0,1) Solo tenemos que cambiar cualquier valor k, por k µ Ejemplo: Supongamos que X εn (6,4) y que nos pidan calcular p(x 3) σ p(x 3) 3 6 = p z 4 Cambiamos 3 por 3 6 4 = p(z 0.75) Esto ya lo podemos hacer con la tabla de N(0,1) INTERVALOS CARACTERÍSTICOS Si una variable tiene una distribución de media µ, se llama intervalo característico correspondiente a una probabilidad p a un intervalo centrado en la media (µ-k, µ+k) tal que la probabilidad de que x pertenezca a dicho intervalos es p: p (µ-k < x < µ+k) = p Veámoslo con números a ver si es más claro. Supongamos una variable X ε N (0,1). Vamos a calcular el intervalo característico a la probabilidad p = 0.90 Hemos de encontrar un valor de k para que: p (0-k < x < 0+k) = 0.90 Si en el interior tiene que haber 0.9, fuera tiene que ser 0.1 y debido a la simetría, 0.05 por cada lado 5
Intervalos característicos Entonces, nos damos cuenta que: P(-k < x < k) = 0.9 es lo mismo que: p (x 0.95) p (x > k) = 0.05 Si miramos en las tablas, nos encontramos con el 0.9495 y con el0.9505 Que se corresponden con el 1.64 y 1.65. Entonces elegiremos el valore intermedio k = 1.645 Intervalos característicos Es decir, el valor de k que queríamos encontrar es 1,465 En resumen el intervalo característico es (-1.465, 1.465) En otras palabras, el intervalo (-1.465, 1.465) es simétrico con respecto a la media de la distribución y la probabilidad de que la variable se encentre en el interior es de 0.9 ( o también se puede decir 90%) K suele llamarse también valor crítico correspondiente a p. Por lo general, la probabilidad se designa en lugar de la letra p, por 1-α y al valor crítico correspondiente z α 2 La relación antes recuadrada en gris se pondría: p(z α 2 < z < z α 2 ) = 1 α p(z > z α 2 ) = α 2 6
Intervalo característico si no fuera normal 0,1 Si no fuera la variable N(0,1) sino por ejemplo N(66,8) cómo se obtendría el intervalo característico para p = 90%? Intenta averiguarlo tu para que en clase podamos resolver este problema entre todos Intervalo característico si no fuera normal 0,1 En una distribución N(66,8) obtener el intervalo característico para el 90% Esto significa lo mismo que decir, en quéintervalo centrado en 66, estaráel 90% de los individuos de la población 1-α= 0.10 α = 0.05 p(z > z α 2 ) = 0. 05 Pero al no ser la variable x 66 normal, sería p( x > k) = 0.05 p( > z α 2 ) = 0. 05 8 tipificamos En la página anterior vimos que z α 2 =1. 465 x 66 > 1.465 6 7