FIABILIDAD (IV): ANÁLISIS NO PARAMÉTRICO DE LOS TIEMPOS DE FALLO

Documentos relacionados
FIABILIDAD (VI): TESTS DE VIDA ACELERADA

FIABILIDAD (VII): MODELOS DE REGRESIÓN PARA OBSERVACIONES CENSURADAS

FIABILIDAD (III): ANÁLISIS PARAMÉTRICO DE LOS TIEMPOS DE FALLO

FIABILIDAD (II): IDENTIFICACIÓN Y DESCRIPCIÓN GRÁFICA DE LOS DATOS

Simulación y evaluación de la confiabilidad de un proceso de sistema de producción

Abril 23 al 26 Cd.Juárez, México Vol. 5, No. 1, 2013

Análisis de supervivencia: el estimador de Kaplan-Meier. Miguel Rodríguez Barranco Granada, 27 de marzo de 2017

ACTIVIDAD 2: La distribución Normal

Intervalos de confianza con STATGRAPHICS

Estadística y sus aplicaciones en Ciencias Sociales 5. Estimación. Facultad de Ciencias Sociales, UdelaR

ACTIVIDAD 3: Intervalos de Confianza para 1 población

ATV - Análisis de Tiempo de Vida

FIABILIDAD (VIII): ANÁLISIS PROBIT (ÉXITO / FRACASO)

Mantenimiento Eléctrico

Aspectos probabilísticas de la fiabilidad. Modelos de fiabilidad. Análisis de datos de tiempos de fallo. Fiabilidad de sistemas.

Estadística II Tema 4. Regresión lineal simple. Curso 2009/10

Facultad de Ingeniería ISSN: Universidad Pedagógica y Tecnológica de Colombia. Colombia

Estadísticas Pueden ser

Prácticas de Fiabilidad

Inferencia Estadística

El modelo de azar proporcional: la regresión de Cox

Parte de las notas tomadas de: Prof. Edgar Acuña UNIVERSIDAD DE PUERTO RICO RECINTO UNIVERSITARIO DE MAYAGUEZ

Gráfico Arrhenius. Ejemplo StatFolio: arrhenius.sgp

Remuestreo Bootstrap y Jackknife en confiabilidad: Caso Exponencial y Weibull

Práctica 5 ANÁLISIS DE UNA MUESTRA INTERVALOS DE CONFIANZA CONTRASTE DE HIPÓTESIS

Métodos estadísticos en estudios de supervivencia


Comparación de dos Muestras - SnapStat

Estimación de Parámetros. Jhon Jairo Padilla A., PhD.

Estimación de Parámetros. Jhon Jairo Padilla A., PhD.

RESPUESTAS BREVES A LA PRÁCTICA 6

Aplicación del Análisis de la Varianza para estudiar el tiempo de acceso en las aulas informáticas

Intervalos de Confianza

GUIA DOCENTE DE LA ASIGNATURA ANÁLISIS ESTADÍSTICO CON ORDENADOR DE DATOS MÉDICOS Curso (Fecha última actualización: 28/06/16)

Fiabilidad. Estadística Industrial

UNIVERSIDAD DE PUERTO RICO EN HUMACAO DEPARTAMENTO DE BIOLOGÍA PRONTUARIO DEL CURSO DE BIOMETRÍA BIOL Preparado por PROF. IVÁN DÁVILA MARCANO

Selección de distribuciones de probabilidad

Juan Carlos Colonia INFERENCIA ESTADÍSTICA

INDICE. Prólogo a la Segunda Edición

Técnicas de Muestreo Métodos

Planificaciones Probabilidad y Estadística B. Docente responsable: GRYNBERG SEBASTIAN PABLO. 1 de 6

UN TAMAÑO DE MUESTRA PRELIMINAR EN LA ESTIMACION DE LA MEDIA, EN POBLACIONES CON DISTRIBUCIONES UNIFORMES Y TRIANGULARES

Estadística Inferencial. Resúmen

U n i v e r s i d a d A u t ó n o m a d e S a n L u i s P o t o s í

Selección de un modelo para el análisis de datos de una prueba acelerada

Ajustando Distribución (Datos Censurados)

La Función de Disponibilidad en Procesos de Renovación y aproximaciones útiles de ella.

TESTS DE BONDAD DE AJUSTE: CRITERIOS DE DECISIÓN EN BASE AL P-VALOR Y SU APLICACIÓN A LAS MEDICIONES DE AUDIENCIA.

BIOSESTADÍSTICA AMIGABLE

Lucila Finkel Temario

07 Estimación puntual e introducción a la estadística inferencial

PROGRAMA DE CURSO. Horas de Trabajo Personal Horas de Cátedra. Básica. Resultados de Aprendizaje

Facultad de Ciencias del Mar, Curso 2011/12 Estadística Convocatoria Extraordinaria de Diciembre. 7/12/11

Centro de Nanociencias y Nanotecnología Licenciatura en Nanotecnología

PRÁCTICA 5: CONTRASTES DE HIPÓTESIS PARAMÉTRICOS

Calculo del tiempo de vida con datos de degradación MC. Manuel Jesús Reyes Méndez (ITCJ) 1, Dr. Manuel A. Rodríguez Medina (ITCJ)

Estimación por intervalo del parámetro de la distribución de Poisson con una sola observación

INFERENCIA ESTADÍSTICA MUESTRAL TEMA 2: ESTIMACIÓN POR INTERVALO

MÉTODOS ANALÍTICO- MATRICIALES EN EL AJUSTE DE TIEMPOS OBSERVADOS DE FALLO

Ventanas de SPSS 1 y resultados de los análisis estadísticos descriptivos

UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN FACULTAD DE CIENCIAS BIOLÓGICAS SUBDIRECCIÓN DE POSGRADO

MANTENIMIENTO CENTRADO EN CONFIABILIDAD (MCC) DR. JORGE ACUÑA 1

1. Si se lanza una vez un dado no cargado, cuál es la probabilidad de que el resultado sea 1, dado que se obtuvo un número impar?

Tema 4. Regresión lineal simple

CONTRASTES NO PARAMÉTRICOS: ALEATORIEDAD Y LOCALIZACIÓN

Universidad Central del Este UCE Facultad de Ciencias de la Salud Escuela de Medicina

Tests de Hipótesis. Métodos no paramétricos ESTADÍSTICA (Q) Algunas consideraciones sobre las inferencias sobre la media de una población Normal

Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia

Prueba del % de defectuosos para 1 muestra

ANÁLISIS DE REGRESIÓN

Tema 7. Introducción Metodología del contraste de hipótesis Métodos no paramétricos

Investigación: Métodos paramétricos para la comparación de dos medias. t de Student 1/9

Métodos de estimación para el Conteo Rápido.

Tema: ESTADÍSTICA DESCRIPTIVA BÁSICA CON SPSS 8.0

Parámetros Estadísticos básicos, Resumen y Presentación de datos. Jhon Jairo Padilla, PhD.

Microeconometría. Karoll GOMEZ Segundo semestre 2017

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

ACTIVIDAD 1: Estadística descriptiva + distribución binomial

TESIS DE MAESTRIA EN ESTADISTICA APLICADA

7. ANÁLISIS DE VARIABLES CUANTITATIVAS: REGRESIÓN LINEAL SIMPLE

Ciencia UANL Universidad Autónoma de Nuevo León ISSN (Versión impresa): MÉXICO

AJUSTE DE DATOS POR UNA DISTRIBUCIÓN TEÓRICA CON MINITAB

norma española UNE-EN DOCUMENTO UNE-EN EXTRACTO DEL Análisis de Weibull Diciembre 2012 TÍTULO CORRESPONDENCIA OBSERVACIONES ANTECEDENTES

INGENIERÍA EN MANTENIMIENTO INDUSTRIAL

Cap 7 Intervalos de Confianza

Cómo se hace la Prueba t a mano?

INGENIERÍA INDUSTRIAL EN COMPETENCIAS PROFESIONALES ASIGNATURA DE ESTADÍSTICA APLICADA A LA INGENIERÍA

Análisis Multivariante de Datos

Anota aquí tus respuestas para esta sección Distribución Z

Comparación por intervalos

PROGRAMA DE CURSO. Código Nombre MA3402 Estadística Nombre en Inglés Statistics SCT Requisitos. DIM Resultados de Aprendizaje

para asegurar que la prueba exacta tenga suficiente potencia para detectar diferencias prácticamente importantes en el porcentaje de defectuosos.

Distribuciones de Probabilidad.

Universidad de Puerto Rico Recinto de Río Piedras Facultad de Ciencias Naturales Departamento de Matemáticas

ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE

Comparación de intervalos de confianza para la función de supervivencia con censura a derecha

Gráficos de Probabilidad

Caso 105. Tamaño de muestra y potencia de una prueba. Diseño de experimentos. Jesús López Fidalgo

ESTADÍSTICA INFERENCIAL

PONTIFICIA UNIVERSIDAD CATÓLICA DE PUERTO RICO DEPARTAMENTO DE FÍSICA MATEMÁTICAS. Sec. Repaso EX III MAT. 298 Núm.

Transcripción:

FIABILIDAD (IV): ANÁLISIS NO PARAMÉTRICO DE LOS TIEMPOS DE FALLO Autores: Ángel A. Juan Pérez (ajuanp@uoc.edu), Rafael García Martín (rgarciamart@uoc.edu). RELACIÓN CON OTROS MATH-BLOCS Este math-block forma parte de una serie de 8 documentos relacionados todos ellos con la Fiabilidad de componentes desde un punto de vista estadístico: Conceptos Básicos (I). Identificación y descripción gráfica de los datos (II). Análisis paramétrico de los tiempos de fallo (III). Análisis no paramétrico de los tiempos de fallo (IV). Comparación no paramétrica de muestras (V). Tests de vida acelerada (VI). Modelos de regresión para observaciones censuradas (VII). Análisis Probit (Éxito / fracaso) (VIII). MAPA CONCEPTUAL Observaciones con censura arb. simple Observaciones con censura arb. múltiple Fiabilidad (IV): Análisis no paramétrico de los tiempos de fallo Estimador Kaplan-Meier Bandas de confianza Análisis no paramétrico con Minitab Análisis no paramétrico con Statistica Proyecto e-math 1

INTRODUCCIÓN En ocasiones puede resultar ventajoso, o incluso necesario, comenzar el análisis de las observaciones con métodos analíticos y gráficos que no requieran de grandes supuestos previos sobre el modelo. Tales métodos no paramétricos permiten interpretar los datos obtenidos sin la distorsión que podría causar la elección de un modelo subyacente no demasiado acertado. En algunos casos, estos métodos no paramétricos serán suficientes para realizar el análisis de los datos. En otras ocasiones, sin embargo, supondrán un paso intermedio hacia un modelo más estructurado (paramétrico) que permita profundizar más en el análisis de las observaciones. En la primera parte de este math-block se proporcionan un conjunto de fórmulas a partir de las cuales se podrán calcular estimadores no paramétricos e intervalos de confianza para la función de distribución F(t), tanto en el caso de observaciones con censura arbitraria simple como en el caso de observaciones con censura arbitraria múltiple. Se usará la hoja de cálculo Excel para ilustrar el uso de dichas fórmulas. Como referencia bibliográfica, se recomienda consultar Lawless (1982) [13] y Nelson (1982) [18]. De forma análoga a como se enfocó el análisis paramétrico (en el math-block Fiabilidad III), las partes segunda y tercera del presente math-block contienen ejemplos prácticos de análisis no paramétrico desarrollados con ayuda de los programas MINITAB y STATISTICA. OBSERVACIONES CON CENSURA ARBITRARIA SIMPLE Notación: La mayoría de las investigaciones sobre tiempos de fallo comienzan en el instante t = 0 con una muestra inicial de n dispositivos. Al final de cada intervalo temporal, se suele disponer de información sobre el estado de dichos dispositivos. En lo que sigue, se denotará por d i al número de dispositivos que han fallado en el intervalo (t i-1, t i ]. Parece lógico pensar que un buen estimador no paramétrico de F(t i ) será: Fˆ ( ti) = nº de fallos en n ( 0, t ] i = i dj j= 1 n Se puede demostrar que este Fˆ ( t i ) es el EMV de F(ti ). Observar, además, que este estimador está definido para todos los valores de ti (extremos superiores de los intervalos): Si d i = 0, entonces: F ˆ( t) = Fˆ( t i 1) t [ t i- 1, t i ] Si d i > 0, F ˆ( t ) Fˆ( t) Fˆ( t ) ( t, t ] i 1 i t i 1 i, siendo F( ) creciente y F ˆ( ti 1) < Fˆ( ti) ˆ t Proyecto e-math 2

~ ~ Un intervalo de confianza para F(t i ) a nivel 1-α vendrá dado por: F ( ti), F( t i ), siendo: F ~ (t i (n nfˆ + 1) Φ ) = 1 + nfˆ ( α / 2;2n 2nFˆ + 2,2nFˆ ) 1 n nfˆ F ~ (t i ) = 1 + (nfˆ + 1) Φ ( α / 2;2nFˆ + 2,2n 2nFˆ ) 1 donde Fˆ Fˆ( t i ) y Φ ( p; v1, v2 ) es aquel valor que, en una distribución F con (v 1,v 2 ) grados de libertad, deja a su derecha un área p. Ejemplo (censura arbitraria simple): Supongamos que se parte de una muestra de 100 dispositivos que comienzan a funcionar en el instante t = 0. Se sabe que, transcurrido un año, ha fallado 1 dispositivo. Otros dos dispositivos fallan entre el primer y segundo año, y 2 más dejan de funcionar entre el segundo y tercer año. Usando las ecuaciones anteriores, y con ayuda de EXCEL, se calcularán y representarán gráficamente los estimadores de F(t i ) así como sus intervalos de confianza asociados (archivo Censura_simple.xls): A la hora de construir la hoja de cálculo, se han usado las siguientes fórmulas: F5 = E5/$B$11 G5 = (1+(($B$11-$B$11*F5+1)*DISTR.F.INV($B$13/2;2*$B$11-2*$B$11*F5+2;2*$B$11*F5))/($B$11*F5))^(-1) H5 = (1+($B$11-$B$11*F5)/(($B$11*F5+1)*DISTR.F.INV($B$13/2;2*$B$11*F5+2;2*$B$11-2*$B$11*F5)))^(-1)... Etc. Observar que, una vez construída esta hoja de cálculo, es inmediata la obtención obtener de intervalos de confianza a nivel 1-α (para ello sólo es necesario cambiar la casilla B13). Proyecto e-math 3

OBSERVACIONES CON CENSURA ARBITRARIA MÚLTIPLE Notación: Supóngase que se dispone de una muestra inicial de n dispositivos, los cuales han comenzado a funcionar en el instante t = 0. Si una unidad no ha fallado en del intervalo i-ésimo (t i-1, t i ], o bien se habrá perdido su pista en dicho intervalo (con lo que sería una observación censurada por intervalo), o bien se sabrá que ha continuado funcionando en el intervalo siguiente. En caso de ser una observación censurada, supondremos que el instante de censura coincide con el extremo superior del intervalo (t i ). Se denotará por: d i = número de unidades que han fallado en el intervalo (t i-1, t i ], r i = número de unidades censuradas en el intervalo (t i-1, t i ], n i = número de unidades entrantes en el intervalo (t i-1, t i ], i.e., aquellas que funcionen correctamente al inicio del mismo: i 1 i 1 n i = n dj rj, i = 1,..., m j= 0 j= 0 donde m es el número de intervalos, y se sobreentiende que d 0 = 0, y r 0 = 0. Según se vio al presentar la tabla de supervivencia (en el math-block Fiabilidad I), un buen estimador no paramétrico para la función de supervivencia sería: i S ˆ ( t i ) = ( 1 pˆ j ), i = 1,...,m j= 1 Por tanto, un estimador no paramétrico para la función de distribución F(t i ) será: Fˆ( ti) = 1 Sˆ( t i ), i = 1,...,m Se puede comprobar que F ˆ( t i ) es el EMV de F(t i ). Observar, además, que este último estimador está definido para todos los valores de t i (extremos superiores de los intervalos): Si d i = 0, entonces: F ˆ( t) = Fˆ( t i 1) t [ t i- 1, t i ] Si d i > 0, F ˆ( t ) Fˆ( t) Fˆ( t ) ( t, t ] t siendo ˆ ( t ) creciente i 1 i i 1 i F y F ˆ( ti 1) < Fˆ( ti ) El siguiente resultado, conocido como Fórmula de Greenwood, proporciona un buen estimador para la varianza de F ˆ( t i ) : Var F i 2 ( ˆ( ti) ) = Var( Sˆ( ti) ) ( Sˆ ( ti ) j= pˆ j nj(1 pˆ 1 j) La raíz cuadrada de la fórmula anterior es un estimador de sˆ, el error estándar de F ˆ( t ) F i. Proyecto e-math 4

~ ~ Un intervalo de confianza para F(t i ) a nivel 1-α vendrá dado por: F ( ti), F( t i ), siendo: Fˆ F ~ Fˆ (t i ) = F ~ (t i ) = Fˆ + (1 Fˆ ) w Fˆ + (1 Fˆ ) / w donde F ˆ = Fˆ( t i ) y z( w = exp Fˆ1 α / 2) ˆs Fˆ ( ) Fˆ, siendo z α/2 el percentil 1 - α/2 en una N(0,1). Ejemplo Censura Arb. Múltiple: Supongamos que se parte de una muestra de 300 dispositivos que comienzan a funcionar en el instante t = 0. Transcurrido un año han fallado 4 dispositivos, y hay 99 observaciones censuradas (no se sabe qué ha ocurrido con dichas unidades). Durante el segundo año han fallado 5 dispositivos, y el número de observaciones censuradas es de 95. Finalmente, durante el tercer año, han fallado otros dos dispositivos, siendo 95 el número de observaciones censuradas. Usando las ecuaciones anteriores, y con ayuda de EXCEL, se calcularán y representarán gráficamente los estimadores de F(ti) así como sus intervalos de confianza asociados (archivo Censura_multiple.xls): F6 = D11-D5-E5 H6 = 1-G6 I6 = H5*H6 K6 = I6^2*(G5/(F5*H5)+G6/(F6*H6)) L6 = J6/(J6+(1-J6)*(EXP(DISTR.NORM.INV(1-$D$13/2;0;1)*RAIZ(K6)/(J6*(1-J6))))) M6 = J6/(J6+(1-J6)/(EXP(DISTR.NORM.INV(1-$D$13/2;0;1)*RAIZ(K6)/(J6*(1-J6))))) Etc. Proyecto e-math 5

ESTIMADOR DE KAPLAN-MEIER Hasta ahora, se ha supuesto que los tiempos de fallo exactos no eran conocidos, ya que para ello hubiera sido necesario realizar un proceso de inspección continuo. En cualquier caso, es obvio que conforme se vaya aumentando el número de inspecciones realizadas, irá disminuyendo la longitud de los intervalos, con lo que la mayoría de éstos no contendrán fallo alguno, pues todos los fallos se hallarán concentrados en sólo unos pocos intervalos. Notar que la función F(t) será constante en todos aquellos intervalos sin fallos, incrementándose sólo en los intervalos en que haya uno o más fallos. Si el tamaño de los intervalos es suficientemente pequeño, cada intervalo registrará a lo sumo un único fallo, con lo que se obtendrá una función F(t) escalonada: será constante en todos los intervalos sin fallos, y dará un salto en aquellos intervalos que contengan un fallo. En el límite, conforme la longitud de los intervalos tienda a 0, el estimador F ˆ( t) que se obtiene se conoce como estimador de Kaplan-Meier o estimador Producto-límite. BANDAS DE CONFIANZA PARA MUESTRAS GRANDES En las páginas anteriores, se han proporcionado fórmulas con las cuales es posible hallar intervalos de confianza para el valor de la función F(t) en un instante concreto t i. Sin embargo, en ocasiones puede resultar conveniente disponer de intervalos de confianza para F(t) en todo un rango continuo de posibles valores de t. Cuando el tamaño de la muestra sea suficientemente grande, la mayoría de paquetes estadísticos actuales permiten obtener estas bandas de confianza, las cuales serán especialmente útiles a la hora de determinar si las observaciones se alejan significativamente de un determinado modelo paramétrico. Lógicamente, para cualquier valor de t, la amplitud de estas bandas será mayor que la del correspondiente intervalo de confianza (puesto que las bandas deberán contener a los intervalos de confianza puntuales, siendo su precisión menor que la de estos últimos). TIEMPOS DE CENSURA NO CONOCIDOS Al desarrollar los métodos anteriores, se ha supuesto que todas las censuras ocurren en el extremo superior de cada intervalo. En tal sentido, se puede equiparar el conjunto de observaciones que entra en cada intervalo con el conjunto de observaciones en riesgo. Al hacer esta hipótesis no se está restando generalidad al modelo siempre que los tiempos de censura sean conocidos, ya que en tal caso, bastará con tomar los extremos de los intervalos de forma que coincidan con tales tiempos. Sin embargo, si en vez de conocer de forma exacta los tiempos de censura, lo único que se supiese es que dichos tiempos están contenidos en una serie de intervalos temporales, ya no sería posible identificar el conjunto de observaciones entrantes con el conjunto de observaciones en riesgo, ya que este último va disminuyendo a lo largo del intervalo (debido a que se producen en él censuras). En tal caso, se optaría por tomar el número de observaciones en riesgo como el número de observaciones entrantes en un intervalo menos la mitad de las censuradas en dicho intervalo (tal y como se hizo en el math-block Fiabilidad I cuando se presentó la tabla de supervivencia). Proyecto e-math 6

ANÁLISIS NO PARAMÉTRICO CON MINITAB Cuando no resulte posible ajustar los tiempos de fallo observados por ninguna distribución conocida, no se podrá recurrir a los métodos paramétricos, vistos el math-block "Fiabilidad III", para describir la distribución de los datos, por lo que deberemos utilizar otros métodos que no se basen en ninguna distribución teórica (métodos no paramétricos). La opción Non-Parametric Dist. Analysis de MINITAB ofrece el estimador de Kaplan-Meier, la tabla de supervivencia (que ya se explicó en el math-block "Fiabilidad I"), y la tabla de Turnbull. Se mostrarán a continuación sendos ejemplos de análisis no paramétrico según los datos contengan observaciones censuradas a derecha o por intervalos. EJEMPLO ANÁLISIS NO PARAMÉTRICO CON CENSURA A DERECHA. Se pretende realizar un análisis no paramétrico de los datos pertenecientes al caso de las cubiertas para motores visto en el math-block Fiabilidad II (observaciones censuradas sólo a derecha). Entrada de datos (input): Se deberán indicar las variables de interés así como las columnas de censura: Se opta por el estimador de Kaplan-Meier para este ejemplo (otra opción sería la tabla de supervivencia) y se requiere el gráfico de la función de supervivencia: Proyecto e-math 7

Salida de datos (output): a continuación se muestran los resultados: Análisis no paramétrico de los tiempos de fallo Distribution Analysis: Tiemp80 Variable: Tiemp80 Censoring Information Count Uncensored value 37 Right censored value 13 Censoring value: Comp80 = 0 Nonparametric Estimates Characteristics of Variable Standard 95,0% Normal CI Mean(MTTF) Error Lower Upper 55,7000 2,2069 51,3746 60,0254 Median = 55,0000 IQR = * Q1 = 48,0000 Q3 = * Kaplan-Meier Estimates Number Number Survival Standard 95,0% Normal CI Time at Risk Failed Probability Error Lower Upper 23,0000 50 1 0,9800 0,0198 0,9412 1,0000 24,0000 49 1 0,9600 0,0277 0,9057 1,0000 27,0000 48 2 0,9200 0,0384 0,8448 0,9952 31,0000 46 1 0,9000 0,0424 0,8168 0,9832..................... 59,0000 22 1 0,4200 0,0698 0,2832 0,5568 60,0000 21 1 0,4000 0,0693 0,2642 0,5358 61,0000 20 1 0,3800 0,0686 0,2455 0,5145 62,0000 19 1 0,3600 0,0679 0,2270 0,4930 64,0000 18 1 0,3400 0,0670 0,2087 0,4713 66,0000 17 1 0,3200 0,0660 0,1907 0,4493 67,0000 16 2 0,2800 0,0635 0,1555 0,4045 74,0000 13 1 0,2585 0,0622 0,1366 0,3803 Distribution Analysis: Tiemp100 La tabla de Kaplan-Meier nos ofrece Variable: Tiemp100 información (para cada intervalo) sobre: Censoring Information Count Uncensored value 34 nº de unidades en riesgo, nº de Right censored value 6 observaciones que han fallado, Censoring value: Comp100 = 0 probabilidad de sobrevivir hasta ese Nonparametric Estimates instante, etc. Characteristics of Variable Standard 95,0% Normal CI Mean(MTTF) Error Lower Upper 41,6563 3,4695 34,8561 48,4564 Median = 38,0000 IQR = 30,0000 Q1 = 24,0000 Q3 = 54,0000 Kaplan-Meier Estimates Number Number Survival Standard 95,0% Normal CI Time at Risk Failed Probability Error Lower Upper 6,0000 40 1 0,9750 0,0247 0,9266 1,0000 10,0000 39 1 0,9500 0,0345 0,8825 1,0000 11,0000 38 1 0,9250 0,0416 0,8434 1,0000 14,0000 37 1 0,9000 0,0474 0,8070 0,9930..................... 54,0000 11 1 0,2500 0,0685 0,1158 0,3842 68,0000 8 1 0,2187 0,0667 0,0881 0,3494 69,0000 7 1 0,1875 0,0640 0,0620 0,3130 72,0000 6 1 0,1563 0,0605 0,0376 0,2749 76,0000 5 1 0,1250 0,0559 0,0154 0,2346 Distribution Analysis: Tiemp80; Tiemp100 Comparison of Survival Curves Test Statistics Method Chi-Square DF P-Value Log-Rank 7,7152 1 0,0055 Además, MINITAB realiza dos test para contrastar la hipótesis nula de que todos los grupos muestrales son iguales Wilcoxon 13,1326 1 0,0003 Proyecto e-math 8

De los resultados se concluye que el tiempo de fallo mediano para una temperatura de 80º C es de 55 meses, y de 38 meses en el caso de una temperatura de 100º C. Así que el incremento de temperatura conlleva a una disminución del tiempo mediano de fallo de aproximadamente 17 meses. Las estimaciones sobre supervivencia están registradas en la tabla de Kaplan-Meier. Por ejemplo, a 80º C, un 90% de las cubiertas seguirán funcionando correctamente tras 31 meses, mientras que a 100º C dicho porcentaje de cubiertas sólo sobrevivirían unos 14 meses. La última parte del output anterior contiene los resultados de dos test distintos que contrastan la hipótesis nula de que todos los grupos de muestras son similares en cuanto a sus tiempos de fallo. En el ejemplo de las cubiertas para motores, se obtiene un p-valor significativo tanto para el test Log-Rank como para el test de Wilcoxon (considerando α = 0,05), por lo que se confirma la existencia de diferencias sensibles entre los tiempos de fallo a 80º C y a 100º C. Además de los informes anteriores, el programa proporciona también el siguiente gráfico no paramétrico de la función de supervivencia de cada grupo, en el cual se aprecian las mencionadas variaciones entre ambos por cuanto al tiempo de fallo se refiere: Nonparametric Survival Plot for Tiemp80-Tiemp100 Kaplan-Meier Method Censoring Column in Comp80-Comp100 1,0 0,9 Tiemp80 Tiemp100 0,8 0,7 Probability 0,6 0,5 0,4 0,3 0,2 0,1 0 10 20 30 40 50 Time to Failure 60 70 80 Proyecto e-math 9

EJEMPLO ANÁLISIS NO PARAMÉTRICO CON CENSURA ARBITRARIA Para mostrar cómo llevar a cabo un análisis no paramétrico cuando las observaciones están censuradas a derecha, izquierda y/o por intervalos (censura arbitraria), se recurrirá nuevamente el ejemplo de los neumáticos introducido en el math-block Fiabilidad III: Entrada de datos (input): como siempre, en primer lugar se deben indicar las variables que contienen los tiempos de fallo y las columnas de censura: Salida de datos (output): a continuación se muestran e interpretan los resultados: Distribution Analysis, Start = Inicio and End = Fin Variable Start: Inicio End: Fin Frequency: Frec Censoring Information Count Right censored value 71 Interval censored value 694 Left censored value 8 Turnbull Estimates Interval Probability Standard Lower Upper of Failure Error * 10000,00 0,0103 0,0036 10000,00 20000,00 0,0129 0,0041 20000,00 30000,00 0,0181 0,0048 30000,00 40000,00 0,0323 0,0064 40000,00 50000,00 0,0479 0,0077 Aquí aparecen el nº de obs. censuradas a derecha, el nº de obs. censuradas por intervalos, y el nº de obs. censuradas Probabilidad condicional de que la unidad falle en cada intervalo bajo el supuesto de que ha llegado hasta él en buen estado 50000,00 60000,00 0,1125 0,0114 Proyecto e-math 10

60000,00 70000,00 0,1876 0,0140 70000,00 80000,00 0,2988 0,0165 80000,00 90000,00 0,1876 0,0140 90000,00 * 0,0918 * Análisis no paramétrico de los tiempos de fallo Survival Standard 95,0% Normal CI Time Probability Error Lower Upper 10000,00 0,9897 0,0036 0,9825 0,9968 20000,00 0,9767 0,0054 0,9661 0,9873 30000,00 0,9586 0,0072 0,9446 0,9726 40000,00 0,9263 0,0094 0,9078 0,9447 50000,00 0,8784 0,0118 0,8554 0,9014 60000,00 0,7658 0,0152 0,7360 0,7957 70000,00 0,5783 0,0178 0,5435 0,6131 80000,00 0,2794 0,0161 0,2478 0,3111 90000,00 0,0918 0,0104 0,0715 0,1122 Función de Supervivencia La tabla de Turnbull muestra en primer lugar las probabilidades de fallo para cada intervalo. Así, por ejemplo, la probabilidad de que un neumático que haya llegado en buen estado hasta los 60.000 km. falle en los próximos 10.000 km. es de 0,1876. Además, esta tabla también proporciona la función de supervivencia: se aprecia, en la columna correspondiente, que un 92,63% de los neumáticos pasaron en buen estado los 40.000 km. Proyecto e-math 11

ANÁLISIS NO PARAMÉTRICO CON STATISTICA Volviendo al ejemplo de los portátiles, introducido en el math-block Fiabilidad III (archivo fiabilidad.sta), y sobre el cual ya se llevó a cabo un análisis paramétrico, se construirá ahora una tabla de supervivencia (Life Table): Entrada de datos (input): Dentro del módulo Survival Analysis, seleccionar la opción Life Tables & Distributions : Pulsar ahora sobre el botón Variables y seleccionar las primeras seis variables en la lista de la izquierda. Después, seleccionar la variable Censur? como el indicador de censura en la lista de la derecha: Salida de datos (output): se obtendrá la siguiente pantalla: Proyecto e-math 12

Ya sólo falta pulsar sobre el botón Life Table para obtener una completa tabla de supervivencia: EJEMPLO ESTIMADOR DE KAPLAN- MEIER Como alternativa a clasificar los tiempos de fallo observados en una tabla de supervivencia, se podría estimar la función de supervivencia directamente de los datos. Intuitivamente, se trata de crear una tabla de supervivencia de forma que cada intervalo temporal contenga una única observación. Así, sería posible estimar la función de supervivencia en cada intervalo sin más que multiplicar las probabilidades de supervivencia de los intervalos (observaciones) anteriores. Este estimador de la función de supervivencia se llama estimador producto-límite o estimador de Kaplan-Meier. La ventaja del método Kaplan-Meier respecto a la tabla de supervivencia es que las estimaciones resultantes no dependen de cómo se agrupan los datos en los intervalos. De hecho, Kaplan-Meier se podría considerar como un caso particular de la tabla de supervivencia. Entrada de datos (input): Para aplicar Kaplan-Meier al ejemplo de los ordenadores portátiles, se debe elegir la opción Kaplan & Meier product-limit method : Nuevamente, se pulsará sobre el botón Variables y se seleccionarán las primeras seis variables en la lista de la izquierda, así como la variable Censur? como el indicador de censura en la lista de la derecha. Proyecto e-math 13

Salida de datos (output): se obtendrá la siguiente pantalla: Análisis no paramétrico de los tiempos de fallo Para obtener el estimador Kaplan-Meier, pulsar sobre el botón Product-limit survival analysis : Es posible obtener una representación gráfica de la función de supervivencia pulsando sobre Graph of survival times vs. cum. proportion surviving : Survival Function Complete Censored 1,0 0,9 Cumulative Proportion Surviving 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0 500 1000 1500 2000 Survival Time Proyecto e-math 14

Con este gráfico se aprecian mejor las características de la función de supervivencia: dicha función decrece rápidamente durante, aproximadamente, los 100 días posteriores a la reparación. Después, la función va decreciendo de forma mucho menos acentuada. Así, parece lógico concluir que los primeros 100 días después de la reparación configuran un período crítico en la supervivencia de los portátiles. Por último, también es posible obtener los percentiles de la función de supervivencia sin más que pulsar sobre Percentiles of survival function : A partir de este último output, se puede afirmar que el 25% de todos los portátiles fallarán antes de los primeros 64 días tras la reparación. El 50% de todos los portátiles sobrevivirán más de 679 días (casi dos años). El percentil 75 no pudo calcularse debido a que tan sólo las observaciones censuradas mostraban períodos de duración largos según se aprecia en la tabla de supervivencia anterior (están representadas con el signo +). Proyecto e-math 15

BIBLIOGRAFÍA [1]. Aitchison, J., Jr. and Brown, J.A.C., The Lognormal Distribution, Campbridge University Press New York, 176 pp., 1957. [2]. Cramer, H., Mathematical Methods of Statistics, Princeton University Press,Princeton, NJ, 1946. [3]. Davis, D.J., An Analysis of Some Failure Data, J. Am.Stat. Assoc., Vol. 47, p. 113, 1952. [4]. Dudewicz, E.J., An Analysis of Some Failure Data, J. Am.Stat. Assoc., Vol. 47, p. 113, 1952. [5]. Dudewicz, E.J., and Mishra, Sataya N., Modern Mathematical Statistics, John Wiley & Sons Inc., New York, 1988. [6]. Hahn, Gerald J., and Shapiro, Samuel S., StatisticalModels in Engineering, John Wiley & Sons, Inc., NewYork, 355 pp., 1967. [7]. Hald, A., Statistical Theory with Engineering Applications,John Wiley & Sons, Inc., New York, 783 pp., 1952. [8]. Johnson, Leonard G., The Median Ranks of Sample Values in their Population With an Application to CertainFatigue Studies, Industrial Mathematics, Vol. 2, 1951. [9]. Johnson, Leonard G., The Statistical Treatment of Fatigue Experiment, Elsevier Publishing Company, NewYork, 144 pp., 1964. [10]. Kapur, K.C., and Lamberson, L.R., Reliability in Engineering Design, John Wiley & Sons, Inc.,New York, 586 pp., 1977. [11]. Kececioglu, Dimitri, Reliability Engineering Handbook,Prentice Hall, Inc., Engelwood Cliffs, New Jersey, Vol. 1,1991. [12]. Kececioglu, Demitri, Reliability & Life Testing Handbook,Prentice Hall, Inc., Engelwood Cliffs, New Jersey, Vol. 1and 2, 1993 and 1994. [13]. Lawless, J.F., Statistical Models And Methods for Lifetime Data,John Wiley & Sons, Inc., New York, 1982. [14]. Leemis Lawrence M., Reliability- Probabalistic Models and Strategical Methods, Prentice Hall, Inc., Engelwood Cliffs, New Jersey, 1995. [15]. Lloyd, David K., and Lipow Myron, Reliability: Management, Methods, and Mathematics, 1962,Prentice Hall, Englewood Cliffs, New Jersey. [16]. Mann, Nancy R., Schafer, Ray E., and Singpurwalla,Nozer D., Methods for Statistical Analysis of Reliability and Life Data, John Wiley & Sons, Inc., New York, 1974. [17]. Meeker, W.Q., and Escobar, L.A., Statistical Methods for Reliability Data, John Wiley & Sons, Inc., New York, 1998. [18]. Nelson, Wayne, Applied Life Data Analysis, John Wiley & Sons, Inc., New York, 1982. Proyecto e-math 16

ENLACES [W1] Desde la página de la empresa Relia Soft podemos consultar la revista Reliability Edge o bien subcribirnos gratuitamente a ella. Se trata de una publicación cuatrimestral relacionada con la Ingenieria de la Fiabilidad, que contiene artículos desde un nivel de introducción hasta el nivel más alto posible. [W2] También desde esa página podemos consultar, o bien subcribirnos, la revista Reliability Hot Wire, una revista eléctronica con artículos sumamente interesantes. Proyecto e-math 17