Estadística Aplicada Distribuciones de Probabilidad Variables aleatorias Toman un valor numérico para cada resultado de un espacio muestral Discretas. Sus valores posibles constituyen un conjunto discreto. Se tiene una separación entre un valor y el otro. Función de distribución. Se representa con diagrama dibujando una recta vertical para cada uno de los valores posibles. La altura de las rectas son iguales a las probabilidades de los valores correspondientes. Da la probabilidad de que una variable aleatoria tome un valor dado. Continuas. Sus valores siempre están contenidos en un intervalo, es decir son todos los números entre puntos. Función de distribución. Sus valores se concentran bajo una curva continua, de tal forma que las probabilidades están dadas por áreas bajo la curva. a<<b)= a b f()d Dado que f() es la función de densidad de probabilidades.
Variables aleatorias Toman un valor numérico para cada resultado de un espacio muestral Discretas. Función de distribución acumulada. Consiste en sumar las frecuencias de las variables. Especifica la probabilidad de que una variable sea menor o mayor a un valor dado. Continuas. Función de distribución. Sus valores se concentran bajo una curva continua, de tal forma que las probabilidades están dadas por áreas bajo la curva. a<<b)= ab f()d Dado que f() es la función de densidad de probabilidades. Parámetros: Media µ = Σ i *X= i ) µ = *X= )+ *X= ) Varianza σ =Σ( i *X= i ))- µ Parámetros Media µ = *f()d Varianza σ = ( i *f())- µ Distribución Binomial Si se realiza un eperimento en una población finita tal que los elementos presenten dos atributos, éitos y fracasos, entonces en este ensayo el número de éitos es una variable aleatoria. Si una población finita contiene elementos de dos tipos, éitos y fracasos, si se etrae una muestra aleatoria simple que no altere la probabilidad de los elementos de la población o si el tamaño de la muestra no es mayor al 5% de la población, la distribución binomial sirve para modelar el número de éitos. X=)=(Combinación de arreglos de en n ensayos).p.(-p) n- Donde: p = probabilidad de tener éito -p = probabilidad de fracaso = q n n!!( n )! Número de combinaciones de cantidad de éitos deseados en un grupo de n elementos Nota: 0! =
Entonces la probabilidad dada por la distribución binomial es: Distribución Binomial n X ) p q n n! p!( n )! q n Si se lanzan monedas cuál es la probabilidad de sacar caras: En este caso: X=) en Bin(;0,5) N= X= p=0,5 q=-p=0,5 X ) 0,5 0,5! 0,5.0,5!( )! 0,75 Distribución Binomial Parámetros de la distribución Binomial: Media: µ=n.p Varianza: σ =n.p.q Ajuste de una distribución de frecuencias al modelo Binomial: Se lanzan 4 monedas 80 veces y el número de caras que se obtuvo fue: Recordando que: Media: µ=n.p Varianza: σ =n.p.q No. de caras Frecuencias X i Fi 0 5 Como no se conoce p, se calcula mediante la obtención de la media muestral: Ẋ = (0*5+*5+*0+*0+4*0)/80 =, p = Ẋ/(n-) =,/(5-) = 0,55 q = - p = 0,55 = 0,45 El modelo resultante es: 5 0 0 4 0 4 X ) 0,55.0,45 4
Distribución de Poisson Cuando n es muy grande y p pequeño se usa la distribución de Poisson. Una forma de usarla es como una aproimación de la Binomial, considerando: p 0 n La función de probabilidad viene dada por: ) X ) e, si 0! Donde: λ = n.p y además λ<5 Parámetros de la distribución de Poisson Media: µ=n.p=λ Varianza: σ =λ=n.p Si se lanza 4 monedas 60 veces y se desea conocer las probabilidades de obtener veces 4 caras. Distribución de Poisson Si se lanza 4 monedas 60 veces y se desea conocer X=). n=60, p=/6=0,065, q=-p=0,975 λ=n.p = 60/6=,75<5 Solución aplicando Binomial X 60 ) 0,065.0,95 58 60! 0,065.0,95!(58)! 58 0,40 Solución aplicando Poisson,75 ) X ) e!,75 0,65 4
Distribución de Poisson Ajuste de una distribución de frecuencias a un modelo de Poisson. Consideración de los accidentes de trabajo ocurridos en una cierta fábrica durante un año: Número de accidentes Número de trabajadores En la distribución de Poisson: Media: µ=n.p=λ = ẋ Xi fi 0,87 0 6 0 * 6 * *9 * 4 * 0,87 6 9 9 4 Modelo: ) X 0,87 )! e 0,87 Número de accidentes Xi 0 4 Probabilidad Frecuencia esperada i) fi 0,490 5 0,645 0,586 0 0,0460 0,000 Distribución Hipergeométrica En el caso de una población finita que contiene tipos de elementos: éitos y fracasos, si se etrae una muestra aleatoria la proporción de éitos en la población restante podría variar dependiendo de la composición de la muestra etraída. En este caso los ensayos no son independientes, por lo que el número de éitos en la muestra no sigue la distribución Binomial. La distribución que describe adecuadamente el número de éitos en este caso es la distribución hipergeométrica. Número de combinaciones de n unidades que contiene R unidades X ) Número de combinaciones de n unidades que pueden seleccionarse de N Donde: - N: Población - R: Unidades clasificadas como éitos - n: Muestra etraída de la población R N R n P ( X ) N n 5
Distribución Hipergeométrica De 50 edificios, no cumplen con algunas especificaciones del código eléctrico nacional, si seleccionan 0 edificios para inspeccionarlos Cuál es la probabilidad de que no cumplan con la normativa? - N: Población= 50 - R: Unidades clasificadas como éitos = - n: Muestra etraída de la población = 0 - : Éitos en la muestra = 50! 8! 0!( )! 7!(8 7)! ( ) P X 50 50! 0 0!(50 0)!!!*9! 8! 7!*! 50! 0!*40! **0 8 * 7 * 6 * 5 * 4 * * X ) 6 0,7 50 * 49 * 48 * 47 * 46 * 45 * 44 * 4 * 4 * 4 0 * 9 * 8 **0 * 9! 8 * 7 *..*!!*9! 7!*! 50 * 49 * 48 *...* 40! 0 * 9 * 8 * 7!*40! Distribución Normal En la mayoría de la distribuciones los datos presentan una mayor frecuencia en la parte central de la distribución y haciéndose manor la frecuencia a medida que los valores se alejan del centro. Esto fue observado por Laplace y Gauss, al estudiar la distribución de los errores en las mediciones, llegando a la conclusión que todas las distribuciones estadísticas se aproimarían a una curva que llamarían Curva Normal de Errores. Hoy se conoce esa curva como Curva Normal o Campana de Gauss. f ( ) e La distribución normal es continua. La media de cualquier variable puede tener cualquier valor y la varianza cualquier valor positivo. Su posición o localización varía con el valor de su media y su forma varía con el valor de su desviación típica. 6
Distribución Normal La curva normal es simétrica respecto a un eje vertical que pasa por el punto =µ, donde toma su máimo valor. Otra característica importante es la forma como se distribuyen los valores de la población dentro de la curva normal El 68,6% se encuentra en el intervalo µ σ El 95,45% se encuentra en el intervalo µ σ El 99,7% se encuentra en el intervalo µ σ Distribución Normal Curva Normal Estándar Un caso particular de la curva normal es cuando su media toma el valor de 0 y su desviación típica el valor de, lo cual se consigue haciendo un cambio de variable: z i Esto es particularmente útil para comparar distribuciones de frecuencia con la curva normal La estandarización de valores de la curva normal se realiza de la siguiente forma, usando la ecuación anterior: Valores de i Valores de Z µ 0 µ+σ µ+σ µ+σ µ-σ - µ-σ - µ-σ - 7
Distribución Normal Ventajas del uso de la Curva Normal Cuando se trabaja con poblaciones normales, conviene pasar las unidades en las cuales se midió originalmente la variable a unidades estándar. Así se puede saber a cuántas desviaciones estándar se encuentra un dato de la media poblacional. Por ejemplo: Láminas de aluminio que son usadas para fabricar recipientes tienen espesor de mm y desviación estándar de 0, mm, siguiendo un comportamiento normal. si una lámina tiene un espesor de,08 mm cuál será su valor Z? z i,08,00 0, 0,654 Distribución Normal Uso de la tabla de áreas bajo la Curva Normal Estándar. Del total de lámina fabricada, qué porcentaje de la población está comprendida entre 0,9 mm y, mm? 0,9,) 0,9,00,,00 z 0,77 z 0, 77 0, 0, A B -0,77 0,77 0,9,) = A) + B) Z =-0,77; Z =0,77; A)=0,794 B)=0,794 0,9,) = 0,794+0,794=0,5588 55,88% 8
Distribución Normal Ajuste de una distribución de frecuencias al modelo de la curva normal. Se trata de ajustar una distribución de frecuencias empírica a la distribución normal. Esto ayuda a determinar el porcentaje de observaciones o frecuencias que caen entre valores dados de la variable estudiada. Se usan las tablas de áreas de la distribución normal. En el siguiente caso se tiene una tabla de distribución de frecuencias donde se conoce que Ẋ=70 y S = 5. Clases 5-45 45 55 55 65 65 75 75 85 85 95 95 05 Fi 0 5 0 5 Ls 5 45 55 65 75 85 95 05 i z i S -, -,67 -,00-0, 0,,00,67, Áreas en la tabla 0,490 0,455 0,4 0,9 0,9 0,4 0,455 0,490 Áreas cada clase i ) 0,076 0, 0,0 0,586 0,0 0, 0,076 Frecuencia esperada: 80* i ) 9 7 7 9 Distribución Eponencial Es una distribución continua que puede usarse para modelar el tiempo que transcurre antes de que ocurra un evento. Es útil para modelar el tiempo de vida de un componente. Eiste una relación cercana entre la distribución eponencial y la de Poisson. La probabilidad de ocurrencia antes del valor es: ) Función de distribución acumulada: e F ( ) e Parámetros: Media: Varianza: 9
Distribución Eponencial ) e Distribución Eponencial La vida media de un circuito integrado es de años, siguiendo el tiempo de vida un distribución eponencial. Cuál es la probabilidad de que dure más de años? En este caso se determina: µ = años, λ=/=0,5 una falla cada años. t>) = t<) t>) = ( e -0,5* ) = e -0,5* = 0, Si este dispositivo tiene 4 años, cuál es la probabilidad de que dure otros años? t 7 t 4) t 7 / t 4) t 4) Pero p>7 incluye p>4, entonces: t t 7 / t 4) t 7) e 4) e 0,5*7 0,5*4 e 0,5. 0, Conclusión: característica de falta de memoria de la distribución eponencial. 0
Distribución Eponencial La duración en kilómetros (km) de un motor diesel sigue una ley eponencial con vida media de 00.000 km. Se requiere saber si es necesario rediseñar los equipos actuales para mantener la garantía de 0.000 km bajo una hipótesis de que solo el 5% de los motores fallen en ese periodo. µ = 00.000 km, λ=/µ = /00.000 = 0-6 fallas/km λ = 0-6 fallas/km ó fallas por cada millón de kilómetros, tasa de fallas. Probabilidad de que falle antes de los 0.000 km <0.000)=-e -0.000/00.000 = 0,0645 6,45% de los motores fallan durante el periodo de la garantía (antes de los 0.000 km.) Cuál es el valor (k) en kilómetros al que debe fijarse la garantía para que falle únicamente el 5% de los motores? 0,05 = -e -k/00.000-0,95 = - e -k/00.000 Ln(0,95)=-k/00.000 k = 5.88 km La garantía debe ser de 5.88 km para tratar que solo un 5% de los motores fallen durante este periodo. Para etender la garantía hasta 0.000 km debe rediseñarse el sistema. Distribución de Weibull El investigador sueco Walodi Weibull propuso en 99 esta distribución. Tiene aplicación para modelar el tiempo de vida de elementos como cojinetes, cerámicas, capacitores y dieléctricos. Weibull consideró la siguiente distribución de parámetros: Donde: k es un parámetro de posición inicial. η es un parámetro de escala β parámetro de forma que describe el grado de variación de la tasa de fallas. En el caso de β: β < tasa de fallas decreciente, β = tasa de fallas constante, periodo de operación normal. β > tasa de fallas creciente, periodo de desgaste o envejecimiento. Cuando β= y k=0 se tiene como modelo la distribución eponencial con λ = /η k ) e k
Distribución de Weibull Distribución de Weibull k e p ) ( Tasa de fallas ) ( ) ( k t r k e k p ) (