Distribución de Probabilidad Variables continuas Álvaro José Flórez 1 Escuela de Ingeniería Industrial y Estadística Facultad de Ingenierías Febrero - Junio 2012
Distribuciones de probabilidad continuas Sea X una variable aleatoria continua. Entonces una función de densidad de X es una función f(x) tal que para dos números cualesquiera a y b con a b, P (a X b) = b a f(x)dx Es decir, la probabilidad de que X tome un valor en el intervalo (a,b) es el área bajo la curva de la función de densidad. Además f(x) debe cumplir: f(x) 0 f(x)dx = 1
Ejemplo Sea X la variable aleatoria continua que denota el diámetro de un orificio perforado en una pieza de un componente metálico. Los datos históricos muestran que la distribución de X (en mm) puede ser modelada por la siguiente función de densidad: f(x) = 20e 20(x 12,5) x 12,5 Densidad 0 5 10 15 20 12.5 12.6 12.7 12.8 12.9 13.0 Si una pieza con un diámetro superior a 12.6 mm se desecha, Cuál es la probabilidad de que una pieza sea desechada? mm
Valor esperado y varianza Sea X una variable aleatoria continua con función de densidad f(x). La media o el valor esperado de X, denotado como µ o E(X), es: E(X) = xf(x)dx La varianza de X, denotada como V (X) o σ 2, es: V (X) = (x E(X)) 2 f(x)dx = La desviación estándar de X es igual a V (X) x 2 f(x)dx E(X) 2
Ejercicio La proporción de cierto aditivo en la gasolina determina su peso específico, lo que, a su vez, determina el precio. Suponga que en la producción de gasolina la proporción de aditivo es una variable aleatoria X con función de densidad: f(x) = 6x(1 x), 0 x 1 Si X < 0,5 se tendrá gasolina del tipo I a $1800 el litro, si 0,5 X 0,8 se tendrá gasolina de tipo II a $2000 el litro; y, si X > 0,8 se tendrá gasolina de tipo III a $2200 el litro. Calcule el valor esperado y la varianza de la proporción de aditivo. Cual es el porcentaje de producción de cada tipo de gasolina. Calcular el precio medio por litro.
Distribuciones de probabilidad Existen varias distribuciones especificas de probabilidad que se ha demostrado, empíricamente, ser modelos útiles para diversos problemas prácticos. La elección de la distribución de probabilidad para representar un fenómeno de interés debe ser motivada tanto por la comprensión de la naturaleza del fenómeno, como por la verificación de la distribución seleccionada a través de la evidencia empírica. En el caso discreto algunas de estas distribuciones son: Exponencial Normal Weibull Uniforme Gamma
Distribución exponencial La variable aleatoria X que describe la distancia entre dos suceso sucesivos de un proceso poisson es una variable aleatoria exponencial con parámetro λ. La función de densidad X esta dada por: f(x) = λe λx 0 x < Densidad 0.0 0.2 0.4 0.6 0.8 1.0 λ=2 λ=1 λ=0.5 0 2 4 6 8 Si la variable aleatoria X tiene una distribución exponencial con parámetro λ, entonces: x E(X) = 1 λ V (X) = 1 λ 2
Ejemplo En una oficina de reclamos de una empresa de servicio público, se tiene que el tiempo (en minutos) que dura el empleado en atender un reclamo de un usuario, es una variable aleatoria con distribución exponencial con media 15 minutos. Si usted llega a la oficina de reclamos y en ese momento no hay cola de espera, pero el empleado está atendiendo a un usuario Cuál es la probabilidad de que tenga que esperar menos de 5 minutos en ser atendido? Suponga que el número de kilómetros que puede recorrer un automóvil antes de que se le acabe la batería está distribuido exponencialmente con un valor promedio de 10000km. Si una persona quiere realizr un viaje de 5000km, Cuál es la probabilidad de que llegue al final de su viaje sin tener que cambiar la batería?
Distribución Normal La distribución normal es una de las distribuciones más importantes y de uso más frecuente en la estadística, puesto que gran parte de la teoría fue desarrollada inicialmente para variables con esta distribución. La gran mayoría de variables aleatorias que se estudian en experimentos físicos (alturas, pesos) son aproximadamente modelados por una distribución normal. Muchas distribuciones de probabilidad, incluyendo discretas, pueden ser aproximadas por esta distribución (si se cumplen ciertas condiciones). Aunque una variable no se distribuya normal, las sumas y promedios de las variables, si se cumplen ciertas condiciones, tendrán una distribución normal aproximada (Teorema Central del Límite)
Distribución Normal Una variable aleatoria X tiene distribución normal con parámetros µ (media) y σ 2 (varianza) si su función está dada por: f(x) = σ > 0, 1 2πσ 2 e 1 2σ 2 (x µ)2 < x < Densidad 0.0 0.1 0.2 0.3 0.4 N(0,1) N(0,2) N(3,1) 6 4 2 0 2 4 6 x
Ejemplo La resistencia a la compresión de muestras de cemento puede ser modelada por una distribución normal con media de 6000Kg/cm 2 y una desviación estándar de 100Kg/cm 2. Cuál es la probabilidad de que la resistencia a la compresión de una muestra sea inferior a 6250Kg/cm 2? P (X < 6250) = 6250 1 2π(100) 2 e 1 2(100) 2 (x 6000)2 dx
Ejemplo La resistencia a la compresión de muestras de cemento puede ser modelada por una distribución normal con media de 6000Kg/cm 2 y una desviación estándar de 100Kg/cm 2. Cuál es la probabilidad de que la resistencia a la compresión de una muestra sea inferior a 6250Kg/cm 2? P (X < 6250) = 6250 1 2π(100) 2 e 1 2(100) 2 (x 6000)2 dx Ninguna de las técnicas estándar se pueden usar para evaluar la expresión anterior. En vez de eso, para µ = 0 y σ = 1 (normal estándar) se han evaluado numéricamente y tabulado ciertos valores. A partir de estas tablas se puede usar para calcular probabilidades para cualquier µ y σ
Distribución normal Si X tiene una distribución normal con media µ y desviación estándar σ, entonces: Z = X µ σ Tiene una distribución normal estándar. Así, P (a X b) = P ( a µ σ Z b µ σ ) = P (Z < b µ σ ) P (Z < a µ σ ) Al estandarizar, cualquier probabilidad en la que interviene X se puede expresar como una probabilidad asociada a una variable aleatoria Z (Normal Estándar)
Ejercicio Una prestigiosa universidad de la región tiene como estrategia de selección la aplicación de una prueba de conocimientos, sobre cuyos resultados escoge al 20 % de los estudiantes, quienes deben tener los mayores puntajes en dicho examen. Si las calificaciones de este examen siguen una distribución normal con media 65 y desviación estándar 20. Determine: La calificación mínima que debe obtener un estudiante para ser seleccionado. Si se decide otorgar una beca a los estudiantes que presentan un puntaje superior a 98 puntos, que proporción de estudiantes serian becados? Cuál es la probabilidad de que una calificación se encuentre alejada de su media en mas de dos desviaciones estándar?
Ejemplo Una empresa productora está interesada en conocer el gasto promedio semanal en cierto tipo de alimento de las familias de estrato socioeconómico medio, con el fin de diseñar una estrategia de mercado para promover la demanda en el mercado. Para ello toma una muestra de tamaño 30 y observa el gasto semanal del tipo de alimento. densidad 0.00 0.01 0.02 0.03 0.04 30 40 50 60 70 80 90 gasto (miles de pesos)
Ejemplo Una empresa productora está interesada en conocer el gasto promedio semanal en cierto tipo de alimento de las familias de estrato socioeconómico medio, con el fin de diseñar una estrategia de mercado para promover la demanda en el mercado. Para ello toma una muestra de tamaño 30 y observa el gasto semanal del tipo de alimento. densidad 0.00 0.01 0.02 0.03 0.04 Normal(µ=61.73,σ=10.3) 30 40 50 60 70 80 90 gasto (miles de pesos)
Ejemplo Una empresa productora está interesada en conocer el gasto promedio semanal en cierto tipo de alimento de las familias de estrato socioeconómico medio, con el fin de diseñar una estrategia de mercado para promover la demanda en el mercado. Para ello toma una muestra de tamaño 30 y observa el gasto semanal del tipo de alimento. Si se supone que el gasto promedio semanal en cierto tipo de alimento de las familias de estrato socioeconómico medio se distribuye Normal con media 61.73 y desviación estándar 10.3. Cuál es la probabilidad de que una familia gaste más de $75000 en ese tipo de alimento? Si la empresa quiere determinar el valor de su producto teniendo en cuenta que mínimo el 60 % de la población tenga capacidad de comprarlo. Basandose en la distribución de probabilidad de los datos Cuál debería ser el valor del nuevo producto?
Aproximación Binomial-Normal 0.0 0.1 0.2 0.3 0.4 n=10, p =0.1 0.00 0.05 0.10 0.15 0.20 0.25 n=10, p =0.5 0 2 4 6 8 10 0 2 4 6 8 10 n=50, p =0.9 n=50, p =0.5 0.00 0.05 0.10 0.15 0.00 0.04 0.08 0 10 20 30 40 50 0 10 20 30 40 50
Aproximación Binomial-Normal 0.0 0.1 0.2 0.3 0.4 n=10, p =0.1 0.00 0.05 0.10 0.15 0.20 0.25 n=10, p =0.5 0 2 4 6 8 10 0 2 4 6 8 10 n=50, p =0.9 n=50, p =0.5 0.00 0.05 0.10 0.15 0.00 0.04 0.08 0 10 20 30 40 50 0 10 20 30 40 50 para valores de p cercanos a 0.5 y para valores de n más o menos grandes, las probabilidades acumuladas de una binomial se parezcan mucho a los valores que se obtendrían si se usa una distribución normal
Aproximación Binomial-Normal Si X se distribuye binomial con n grande y p 0.5. Entonces se puede hacer la siguiente aproximación: X Normal(µ = np, σ 2 = np(1 p))
Aproximación Binomial-Normal Si X se distribuye binomial con n grande y p 0.5. Entonces se puede hacer la siguiente aproximación: X Normal(µ = np, σ 2 = np(1 p)) Estadísticas publicadas por un periódico local muestran que en una noche de fin de semana, en promedio, el 20 % de los conductores está ebrio. Si se verifican 400 conductores en forma aleatoria la siguiente noche de sábado, Cuál es la probabilidad de que el número de conductores ebrios sea: 1 Menos de 70? 2 Más de 97? 3 Entre 70 y 97?
Aproximación Poisson-Normal λ=1 λ=2 0.0 0.1 0.2 0.3 0.00 0.10 0.20 0 2 4 6 8 10 0 2 4 6 8 10 λ=10 λ=50 0.00 0.04 0.08 0.12 0.00 0.02 0.04 0 5 10 15 20 20 30 40 50 60 70 80
Aproximación Poisson-Normal λ=1 λ=2 0.0 0.1 0.2 0.3 0.00 0.10 0.20 0 2 4 6 8 10 0 2 4 6 8 10 λ=10 λ=50 0.00 0.04 0.08 0.12 0.00 0.02 0.04 0 5 10 15 20 20 30 40 50 60 70 80 El histograma de la distribución Poisson tiende a ser simétrico cuando λ crece
Aproximación Poisson-Normal Si X se distribuye poisson con λ grande. Entonces se puede hacer la siguiente aproximación: X Normal(µ = λ, σ 2 = λ)
Aproximación Poisson-Normal Si X se distribuye poisson con λ grande. Entonces se puede hacer la siguiente aproximación: X Normal(µ = λ, σ 2 = λ) Un banco recibe en promedio 6 cheques falsos al día, suponiendo que el número de cheques falsos sigue una distribución Poisson, Cuál es la probabilidad de que se reciban más de 40 cheques falsos en una semana?
Bibliografía Canavos, G. (1988). Probabilidad y Estadística: Aplicaciones y métodos. Mc Graw Hill, México, vol. 1 edition. Devore, J. L. (2008). Probabilidad y estadística para ingeniería y ciencias. Thomson Paraninfo, México, vol. 7 edition. Montgomery, D. and Runger, G. (2004). Probabilidad y estadística aplicadas la ingeniería. Limusa-Wiley, México, 2 edition.