TESIS DE MAESTRIA EN ESTADISTICA APLICADA INDICADORES MULTIDIMENSIONALES DE CAPACIDAD DE PROCESOS REGIONES DE CONFIANZA MEDIANTE BOOTSTRAP 1 Noemí María Ferreri Facultad de Ciencias Exactas, Ingeniería y Agrimensura, Universidad Nacional de Rosario Contacto:nferreri@fceia.unr.edu.ar Directora: Dra. Marta B. Quaglino Co-director: MSc Gonzalo Marí La evaluación de la capacidad de un proceso constituye el tema central de esta tesis. En ella, la capacidad se presenta como un concepto multidimensional, por lo cual un único número resulta insuficiente para reflejar todos los aspectos presentes. Se propone un vector de tres componentes asociados a variabilidad, centrado y proporción de producción no conforme, lo que constituye una instancia superadora de los tradicionales indicadores unidimensionales. Los dos primeros componentes están implícitamente asociados a una única variable de calidad cuantitativa continua, no así el tercero, que puede aplicarse para una o más variables cualitativas o cuantitativas. Los objetivos que se plantearon en esta tesis fueron llevar adelante un exhaustivo relevamiento bibliográfico para encontrar, las expresiones más apropiadas para cada componente y elegir un estimador a partir de la consideración de sus propiedades estudiadas por simulación. Finalmente, dado que no puede asumirse un modelo para la distribución conjunta del estimador del Indicador Multivariado, se propone construir una región de confianza mediante Bootstrap, la cual se presenta a través de una herramienta gráfica denominada cuadrantes de capacidad para facilitar la interpretación al usuario. Para llegar a la expresión más apropiada para cada componente del vector y a la definición de un estimador con propiedades estadísticas adecuadas, se efectuó un estudio sistemático que consideró en primer lugar un conjunto de expresiones tomadas del relevamiento bibliográfico, estudió su sensibilidad y especificidad para señalar la capacidad de 1 Defendida en Rosario el 9/5/2012
los procesos frente a diferentes especificaciones (bilaterales simétricas y asimétricas) y distintas distribuciones de probabilidad de la variable de calidad (normal, normal contaminada en diferentes proporciones, lognormal con diferentes coeficientes de asimetría). Luego planteó estimadores, estudiando sus propiedades por simulación. La metodología empleada se aplicó en forma independiente para cada componente del vector. Del análisis conjunto de las conclusiones de estas dos etapas surgió, para cada componente, la expresión que resultaba más apropiada para la variedad de situaciones considerada y para la cual, además, se podía plantear un estimador con buenas propiedades. Para los indicadores en la población, las dos propiedades requeridas se refieren a la posibilidad de que ellos adviertan sobre la falta de capacidad de los procesos cuando esta se produce (sensibilidad) y a la de no dar falsas alarmas, advirtiendo falta de capacidad, cuando el proceso realmente es capaz (especificidad). El cumplimiento de ambas propiedades depende tanto de la expresión matemática del indicador como de la propia definición adoptada para identificar a un proceso como capaz o no capaz en cada dimensión considerada. Para evaluar la bondad de los estimadores de cada expresión las propiedades analizadas son el error cuadrático medio, el sesgo relativo y la cobertura. Propuesta una expresión para cada componente del vector y su estimador correspondiente se consideró la incertidumbre a la hora de estimar los parámetros de interés y se propuso la construcción de una región de confianza para el vector de capacidad de proceso. La obtención de una expresión analítica para dicha región es un problema complejo: por un lado, la variable de calidad puede ser modelada por diferentes distribuciones de probabilidad y por el otro, las componentes del vector propuesto son funciones de la media, la variancia y la proporción de producción no conforme del proceso y no existe una manera simple de obtener su distribución muestral conjunta, ni siquiera suponiendo normalidad. Para la construcción de la región de confianza se consideró la propuesta de varios autores de aplicar el método Bootstrap para obtener una nube de puntos y ajustar a estos una función de densidad bivariada por el método Kernel. Para esta función de densidad se buscó un contorno que abarque un cierto porcentaje de los puntos obtenidos, el cual constituye el borde de la región multiparámetro. Dado que los gráficos en dos dimensiones son más fáciles de interpretar que los tridimensionales, se propuso un gráfico denominado cuadrantes de capacidad para los dos primeros componentes del vector: el asociado a problemas en la variabilidad del proceso y el
asociado a problemas en el centrado. En dicho gráfico se considera un sistema cartesiano para el cual la ecuación correspondiente al eje de las abscisas es y = b, siendo b el mínimo definido para considerar a un proceso capaz en relación al centrado, y la correspondiente al eje de las ordenadas es x = a, siendo a el mínimo definido para considerar a un proceso capaz en relación a la variabilidad. Ambos ejes se cortan en el punto O, de coordenadas (a,b). La región de confianza Bootstrap construida para los dos componentes mencionados se ubica en el gráfico y según su localización en alguno de los cuadrantes se concluye sobre la capacidad del proceso: si se ubica en el primer cuadrante se dice que el proceso resulta capaz tanto en relación al centrado como a la variabilidad, si lo hace en el segundo cuadrante, el proceso resulta capaz en relación al centrado pero no a la variabilidad y lo contrario ocurre en el tercer cuadrante; si se ubica en el cuarto cuadrante, el proceso no resulta capaz ni en relación al centrado ni a la variabilidad. La información sobre el tercer componente, asociado a la proporción de producción no conforme del proceso, se presenta al pie del gráfico a través de un intervalo de confianza Bootstrap. En la Figura 1 se muestra, a modo de ejemplo, un gráfico de cuadrantes de capacidad que permite concluir que el proceso no es capaz en relación al centrado; pero sí en relación a la variabilidad. Respecto de la proporción de proporción no conforme, los intervalos no son informativos puesto que el valor de referencia (1, en este caso) pertenece a cada uno de los intervalos obtenidos. Niveles de confianza.. 50 % ----- 95 % 99 % Intervalos de confianza (Bootstrap Percentile) para la Componente 3 50% (0.9813, 1.0014) 95% (0.9713, 1.0014) 99% (0.9613, 1.0014) Figura 1 Capacidad de un proceso a partir de una muestra de n = 100
Esta herramienta gráfica permite superar el mero uso de estimaciones puntuales para tomar decisiones sobre la capacidad de un proceso y lo hace de una manera sencilla para el usuario: este sólo debe observar la localización de las regiones de confianza en relación a los cuadrantes y concluir. Además permite incorporar información propia del proceso y de los objetivos de la empresa en relación a dicho proceso, ya que los valores a y b, que delimitan a los cuadrantes, deben ser definidos por el usuario en función de dicha información. Los resultados obtenidos permiten contar con un indicador de capacidad de proceso que no sólo indica si el proceso es capaz o no, sino que informa en qué aspectos se detecta la falta de capacidad. Las expresiones utilizadas amplían el campo de aplicación de estos indicadores a una gran variedad de situaciones como procesos no normales y especificaciones unilaterales o asimétricas. El uso de la región de confianza, permite considerar la incertidumbre propia de la información muestral, lo cual no siempre es tenido en cuenta en la práctica en las industrias y, además, la localización de la región en el cuadrante de capacidad facilita la interpretación para el usuario no experto. La forma de construcción de las regiones no es única. Se presentan otras alternativas, no exploradas en esta tesis, como líneas futuras de investigación; sin embargo, se encuentra que el mecanismo Bootstrap, tal y como está presentado en los programas que se aplican, constituye una aproximación valiosa y adecuada que supera ampliamente a la práctica usual. REFERENCIAS Davison, A. and Hinkley, D. (1997) Bootstrap Methods and their Application, Estados Unidos: Cambridge University Press. Efron, B. and Tibshirani, R. (1993) An Introduction to the Bootstrap, New York: Chapman & Hall. Forester, J. D. (2008, Marzo, 17), Plotting contours, [Mensaje de blog] Recuperado de http://www.r-bloggers.com Gunter, B. H. (1989), The Use and Abuse of Cpk, Parts 1-4, Quality Progress, 22, 72-73, 79-80, 86-87, 108-109.
Kane, V. E. (1986), Process Capability Indices, Journal of Quality Technology, 18, 41-52. Kotz, S. and Johnson, N. L. (2002), Process Capability Indices- A Review, 1992-2000, (with discussion), Journal of Quality Technology, 34, 2-19. Pearn, W. L. and Kotz, S. (2006), Encyclopedia and Handbook of Process Capability Indices. A Comprehensive Exposition of Quality Control Measures. (Series on Quality, Reliability and Engineering Statistics. Vol 12), Singapur: World Scientific. Perakis, M. and Xekalaki, E. (2001), On an Improvement in Confidence Limits for the Proportion of Conformance, Technical Report Nº 128, Athens University of Economics and Business, Department of Statistics. Shahriari, H. and Abdollahzadeh, M. (2009), A new multivariate process capability vector, Quality Engineering, 21, 290-299. Shore, H. (1998), A new approach to analyzing non-normal quality data with applications to process capability analysis, International Journal of Production Research, 36, 1917-1933. Wang, F. K., Hubele, N. F., Lawrence, F. P., Miskulin, J. D. and Shahriari, H. (2000), Comparison of Three Multivariate Process Capability Indices, Journal of Quality Technology, 32, 263-275.