Universidad Tecnológica de Pereira - 1/27 Mantenimiento Eléctrico Intervalos estadísticos, pruebas de hipótesis Mauricio Holguín Londoño Programa de Ingeniería Eléctrica 2016
Universidad Tecnológica de Pereira - 2/27 Presentación Objetivos Objetivos Realizar la presentación de la distribución normal estandarizada y su aplicación para el cálculo de intervalos de confianza para la media de una variable aleatoria que representa el resultado promedio sobre repeticiones. Se introduce el concepto de prueba de hipótesis, donde se requiere aceptar o rechazar una sentencia sobre el valor de parámetros.
Universidad Tecnológica de Pereira - 3/27 Presentación Contenido Contenido I 1 Presentación Objetivos Contenido Bibliografía 2 La distribución normal Introducción Los parámetros Variable aleatoria normal estándar Ejemplo 3 Intervalos de confidencia Introducción Media y varianza de un promedio Intervalo de confidencia Selección tamaño de muestra 4 Pruebas de Hipótesis
Universidad Tecnológica de Pereira - 4/27 Presentación Contenido Contenido II Introducción Tipos de Error Procedimiento general Prueba de hipótesis sobre la media
Universidad Tecnológica de Pereira - 5/27 Presentación Bibliografía Bibliografía [1] Applied Statistics and Probability for Engineers. Third Edition. Douglas C. Montgomery, George C. Runger. 2003, John Wiley & Sons, Inc. ISBN 0-471-20454-4. [2] Engineering Maintenance:A Modern Approach. B.S. Dhillon, Ph.D. CRC Press. ISBN 1-58716-142-7 [3] Life cycle reliability engineering. Guangbin Yang, Ford Motor Company. 2007, John Wiley & Sons. ISBN-13: 978-0-471-71529-0 [4] Reliability, Maintainability and Risk. Practical methods for engineers. Sixth Edition. David J Smith. 2001, Butterworth-Heinemann. ISBN 0 7506 5168 7.
Universidad Tecnológica de Pereira - 6/27 La distribución normal Introducción Teorema de De Moivre Conocido como teorema del ĺımite central, en 1733 De Moivre dijo que cuando un experimento aleatorio se repite de forma sucesiva, la variable aleatoria que representa el resultado promedio sobre las repeticiones tiende a tener una distribución normal a medida que el número de repeticiones crece. Este resultado permaneció perdido cerca de 100 años, y de forma independiente Gauss desarrolló luego la conocida distribución normal. f (x) = 1 exp 1 2 ( x µ σ ) 2 2πσ La notación N ( µ, σ 2) (media y varianza) también se emplea como forma simplificada de la distribución normal.
Universidad Tecnológica de Pereira - 7/27 La distribución normal Los parámetros Los parámetros I
Universidad Tecnológica de Pereira - 8/27 La distribución normal Los parámetros Los parámetros II La media µ determina la centralidad de la distribución, la desviación σ determina la forma de la campana. P(µ σ < X < µ + σ) = 0,6827 P(µ 2σ < X < µ + 2σ) = 0,9545 P(µ 3σ < X < µ + 3σ) = 0,9973 P(X > µ) = P(X < µ) = 0,5
Universidad Tecnológica de Pereira - 9/27 La distribución normal Variable aleatoria normal estándar Variable aleatoria normal estándar Variable normal donde µ = 0 y σ = 1. Se denota como Z y es una variable normal centrada en cero y con desviación de 1. Φ(z) = P(Z z) = ˆx 1 2πσ exp 1 2 ( x µ σ ) 2 dx = ˆz 1 2π exp 1 2 u2 du Una variable aleatoria normal X, se puede transformar en una variable aleatoria normal estándar Z con la estandarización: Z = X µ σ P(X x) = P( X µ σ x µ ) = P(Z z) σ
Universidad Tecnológica de Pereira - 10/27 La distribución normal Variable aleatoria normal estándar Distribución cumulativa normal estándar I Φ(z) = P(Z z) = ˆx 1 2πσ exp 1 2 ( x µ σ ) 2 dx = ˆz 1 2π exp 1 2 u2 du
Universidad Tecnológica de Pereira - 11/27 La distribución normal Variable aleatoria normal estándar Distribución cumulativa normal estándar II
Universidad Tecnológica de Pereira - 12/27 La distribución normal Ejemplo Ejemplo En una señal digital, el ruido sigue una normal con µ = 0V y σ = 0,45V. Se toma 1 lógico cuando el voltaje excede 0.9V. Cuál es la probabilidad de detectar 1 si no se realiza su envío? P(N > 0,9) = P( N 0 0,45 > 0,9 0 ) = P(Z 2) = 0,022750 = 1 0,97725 0,45 Determinar los ĺımites simétricos alrededor de 0 que abarquen el 99 % de todas las lecturas de ruido. P( x < N < +x) = P( x 0,45 < N 0,45 < x 0,45 ) = 0,99 Como el área cubierta es del 0.99, el área no cubierta es 0,01, y por ser áreas simétricas a cada lado hay un 0,005 no cubierto. P( x < N < +x) = P( z < Z < +z) = P( 2,58 < Z < +2,58) = 0,99
Universidad Tecnológica de Pereira - 13/27 Intervalos de confidencia Introducción La precisión de un estimado En una piscina llena de millones de balones blancos y negros perfectamente mezclados se debe estimar el porcentaje de balones negros. Se inicia con una muestra de 10 balones y se estimó que 40 % son negros. Se regresan los balones, se repite y da una estimación del 60 %. A medida que se repite el experimento la estimación está entre los ĺımites X1 y X2 con X1<X2, asignándose un porcentaje al número de veces que la estimación cae dentro de esos ĺımites. Por ejemplo, el 90 % de las veces la estimación está entre el 35 % y el 70 %. Se repite el experimento con 1000 balones. Ahora el 90 % de las veces la estimación está entre 50 % y 60 %. A mayor tamaño de muestra, menor intervalo de certidumbre. A mayor porcentaje de estimación, mayor intervalo de certidumbre.
Universidad Tecnológica de Pereira - 14/27 Intervalos de confidencia Media y varianza de un promedio Media y varianza de un promedio La variable aleatoria que representa el resultado promedio de variables aleatorias con medias y varianzas iguales es: X = (X 1 + X 2 +... + X n)/n Donde E(X i ) = µ y E(X ) = µ, además si V (X i ) = σ 2, entonces V (X ) = σ 2 /n Entonces la media muestral se puede normalizar como sigue: Z = X µ σ/ n
Universidad Tecnológica de Pereira - 15/27 Intervalos de confidencia Intervalo de confidencia Intervalo de confidencia Un intervalo de confidencia para la media de una variable aleatoria normalizada que representa el resultado promedio de variables aleatorias en un intervalo con ĺımites superior (S) e inferior (I ) S µ I y un porcentaje de estimación 1 α es: P(S µ I ) = P( z α/2 < X µ σ/ n < +z α/2) = 1 α σ σ = P(X z α/2 n < µ < X + z α/2 n ) = 1 α
Universidad Tecnológica de Pereira - 16/27 Intervalos de confidencia Intervalo de confidencia Ejemplo Se realiza un experimento 10 veces, consistente en determinar la energía de impacto al corte (J) en especímenes de acero a 60ºC con los siguientes resultados: 64.1, 64.7, 64.5, 64.6, 64.5, 64.3, 64.6, 64.8, 64.2 y 64.3. La energía de impacto se distribuye normalmente con una desviación de 1J. Encontrar un intervalo de confidencia del 95 % para la media de la energía de impacto. De los datos: z α/2 = z 0,025 = 1,96, n = 10, σ = 1, y x = 64,46. σ σ P(S µ I ) = P(X z α/2 n < µ < X + z α/2 n ) = 1 α = P(64,46 1,96 1 10 < µ < 64,46 + 1,96 1 10 ) = 0,95 = P(63,84 < µ < 65,08) = 0,95
Universidad Tecnológica de Pereira - 17/27 Intervalos de confidencia Selección tamaño de muestra Selección tamaño de muestra σ La precisión del intervalo de confidencia es de 2z α/2 n, lo cual quiere decir que el error al estimar la media σ E = x µ z α/2 n con una confiabilidad del 100 %(1 α). Al despejar n ( zα/2 σ n = E ) 2
Universidad Tecnológica de Pereira - 18/27 Intervalos de confidencia Selección tamaño de muestra Ejemplo Continuando con el ejemplo anterior, el máximo error admisible es medio intervalo de confidencia, por lo que E = 0,5. ( ) 1,96 1 2 n = = 15,37 0,5 = 16
Universidad Tecnológica de Pereira - 19/27 Pruebas de Hipótesis Introducción Introducción I Se requiere aceptar o rechazar una sentencia sobre el valor de parámetros La sentencia se denomina Hipótesis Estadística El procedimiento para la toma de la decisión se denomina Prueba de Hipótesis Las pruebas de hipótesis estadística y la estimación de intervalos de confidencia de parámetros son el fundamento para el procedimiento de análisis en la comparación de experimentos. Una hipótesis estadística puede ser una sentencia sobre la distribución de probabilidad de una variable aleatoria. Se puede involucrar uno o más parámetros de la distribución.
Universidad Tecnológica de Pereira - 20/27 Pruebas de Hipótesis Introducción Introducción II Las hipótesis son sentencias sobre la población o la distribución, o sobre la muestra. Prueba bilateral Prueba unilateral Hipótesis nula H 0 : µ =21 años H 0 : µ =21 años Hipótesis alterna H 1 : µ 21 años H 1 : µ <21 años Para la prueba de hipótesis se emplea la información de la muestra aleatoria desde la población de interés. Si la información es consistente con la hipótesis se dice que esta es verdadera, de lo contrario se concluye que es falsa.
Universidad Tecnológica de Pereira - 21/27 Pruebas de Hipótesis Tipos de Error Tipos de Error Se hace muestreo de 10 alumnos. 19,6 x 22,4 y se rechaza hipótesis alterna en favor de la nula. x < 19,6. Se rechaza hipótesis nula en favor de la alterna. Existirá Región de Aceptación con ĺımites en Valores Críticos. Por fuera está la Región Crítica. Se puede entonces caer en dos conclusiones erróneas: Error tipo I: cuando se rechaza la hipótesis nula, pero era verdadera. La edad media es 21 años, pero en la muestra se observó valor en la región crítica. Nivel de significancia: α = P(ErrorI ) = P(rechazarH 0 cuando H 0 Verdadero) Error tipo II: cuando no se rechaza la hipótesis nula, pero era falsa. Edad media 23 años, pero se observó valor en la región de aceptación. β = P(ErrorII ) = P(NorechazarH 0 cuando H 0 Falsa)
Universidad Tecnológica de Pereira - 22/27 Pruebas de Hipótesis Tipos de Error Ejemplo Error Tipo I α = P(x < 19,6 cuando µ = 21) + P(x > 22,4 cuando µ = 21) Normalizando, con n = 10, σ = 2,5, σ/ n = 0,7906 z 1 = 19,6 21 0,7906 = 1,771 z 2 = 22,4 21 0,7906 = 1,771 α = P(Z < 1 771) + P(Z > 1,771) = 0,038364 + 0,038364 = 0,077 Con lo cual el 7.7 % de muestreos rechazarán H 0 siendo cierta. La significancia mejora (se reduce) al incrementar Valores Críticos o n.
Universidad Tecnológica de Pereira - 23/27 Pruebas de Hipótesis Tipos de Error Ejemplo Error Tipo II β = P(19,6 X 22,4 cuando µ = 23) 19,6 23 22,4 23 z 1 = = 4,301 z 2 = = 0,7589 0,7906 0,7906 β = P( 4,301 Z 0,7589) = P(Z 0,7589) P(Z 4,301) β = 0,223627 0 = 0,223627 Si H 0 : µ = 21 y H 1 : µ 21 y µ = 23, la probabilidad de fallar en rechazar H 0 es 22.36 %. β aumenta rápidamente si el valor real se acerca a la hipótesis y decrece con el tamaño de muestra.
Universidad Tecnológica de Pereira - 24/27 Pruebas de Hipótesis Procedimiento general Procedimiento general 1 Identificar los parámetros de interés 2 Establecer la hipótesis nula H 0. 3 Establecer una hipótesis alterna adecuada, H 1. 4 Seleccionar un nivel de significancia, α. 5 Determinar un adecuado test estadístico. 6 Establecer la región de rechazo para la estadística. 7 Evaluar la cantidad de muestras necesarias, substituirlas en la ecuación del test estadístico y calcular el valor. 8 Decidir si se debe rechazar o no H 0 y contextualizarlo con el problema.
Universidad Tecnológica de Pereira - 25/27 Pruebas de Hipótesis Prueba de hipótesis sobre la media Prueba de hipótesis sobre la media I La velocidad de combustión del propelente es vital en su selección. Para cierta aeronave la combustión media del propelente debe ser de 50 centímetros por segundo con una desviación estándar de 2 centímetros por segundo. El encargado de experimentar decide especificar una probabilidad para el error tipo I (nivel de significancia) de 0.05 y selecciona un tamaño muestral de n = 25 para obtener su tasa media de combustión muestral de x = 51,3. Qué conclusión se debe tomar? 1 El parámetro de interés es la media, µ. 2 H 0 : µ = 50 centímetros por segundo. 3 H 1 : µ 50 centímetros por segundo. 4 α = 0,05. Límites región crítica: z 0,025 = 1,96, z 0,025 = 1,96
Universidad Tecnológica de Pereira - 26/27 Pruebas de Hipótesis Prueba de hipótesis sobre la media Prueba de hipótesis sobre la media II 5 La prueba estadística es: z 0 = x µ 0 σ/ n 6 Límites región crítica: z 0,025 = 1,96, z 0,025 = 1,96. Rechazar H 0 si z 0 < 1,96 o z 0 > 1,96. 7 Cálculos z 0 = 51,3 50 2/ 25 = 3,25
Universidad Tecnológica de Pereira - 27/27 Pruebas de Hipótesis Prueba de hipótesis sobre la media Prueba de hipótesis sobre la media III 8 Conclusiones: Ya que z 0 = 3,25 > 1,96 se rechaza H 0 : µ = 50 para un nivel de significancia de 0.05. Se concluye que la tasa media de combustión difiere de 50 centímetros por segundo con base en una muestra de 25 mediciones. Existe fuerte evidencia que la tasa media de combustión excede los 50 centímetros por segundo.