UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS. Métodos multivariantes en control estadístico de la calidad

UNIVERIDAD NACIONAL MAYOR DE AN MARCO FACULTAD DE CIENCIA MATEMÁTICA E.A.P. DE ETADÍTICA Métodos ultivariantes en control estadístico de la calidad Capítulo III. Gráficos de control T de Hotelling TRABAJO MONOGRÁFICO Para optar el Título Profesional de Licenciado en Estadística AUTOR Anchiraico Agudo, Willia Richard LIMA PERÚ 003

CAPITULO III GRAFICO DE CONTROL T DE HOTELLING

CAP. III GRAFICO DE CONTROL T DE HOTELLING El gráfico T de Hotelling se puede considerar coo la etensión ultivariante del gráfico de control hewhart univariante. El estadístico T es un escalar que cobina inforación para la dispersión y edia de las variables que estaos analizando. i asuios una distribución noral ultivariante y se conocen los verdaderos paráetros de la distribución, es decir, conoceos el vector de edias y la atriz de varianzas y covarianzas, el estadístico T sigue una distribución chi-cuadrado. En el caso bivariante, este estadístico tendría la siguiente fora: n [ σ µ ) + σ ( µ ) σ ( µ )( )] 0 = ( µ σσ σ donde y son las edias uéstrales de las respectivas variables, µ y µ sus edias poblacionales,σ y σ las desviaciones típicas yσ es la covarianza. i estaos analizando ás de dos variables, el estadístico chi-cuadrado toa la siguiente fora: r = n( i µ ) ( )...(3.) 0 i µ donde µ es el vector de edias, es la atriz de varianzas y covarianzas y n es el taaño uestral. El líite superior de control se va a situar para un nivel de significación dado por X, y el líite inferior está situado en cero, ya que el ( n, p) estadístico es no negativo. Cuando los valores poblacionales no son conocidos, es necesaria su estiación, dando origen al gráfico T de Hotelling. Con p variables y uestras de taaño n, la edia y cuasivarianza uestral se calculan coo: jk jk k = n j =,,..., p k =,,..., ijk i= = ( n j =,,..., p k =,,..., k ijk ijk ) i=...(3.) 7

donde ijk es la i-ésia observación en la j-ésia característica de calida en la uestra k. La cuasicovarianza entre dos características de calidad j y h se calcula para la uestra k coo: ijhk k = ( n )( k =,,..., ) j ijk jk ihk hk i= h...(3.3) Con las epresiones anteriores podeos deterinar la edia y varianza para las uestras y para las variables a través de las epresiones: = jk k j =,,..., p j = jk k j =,,..., p...(3.4) = jk jhk k j h ustituyendo en la epresión (3.), el estadístico T queda: = = r Ti = n( i ) ( i )...(3.5) Para datos agrupados, el estadístico T sigue una distribución F de nedecor, por lo que los líites de control bajo los supuestos usuales van a venir dados coo: p( )( n ) LC α n p + = F, p, n p+...(3.6) LIC = 0 Así, podeos analizar si el proceso se encuentra bajo control ediante la representación de los valores T junto a dicho líite de control. Cuando el valor T para todas las uestras sea inferior al LC, el proceso se considera bajo control y, en caso contrario, que eiste una anoalía que nos lleva a una situación fuera de control. 8

i bien la interpretación de los resultados era bastante sencilla en el caso univariante, en el caso ultivariante la interpretación de estas señales fuera de control va a ser ás copleja. El fin que perseguios es detectar situaciones en las que el proceso presenta cabios oderados y una vez detectadas, deterinar sus causas. En las técnicas ultivariantes, deterinar esa situación fuera de control es relativaente fácil, ya que el análisis es siilar al caso univariante; pero deterinar las causas que han provocado ese cabio será ás coplicado. e han desarrollado algunas técnicas para ayudar en la interpretación de esas señales fuera de control, si bien, las ás utilizada consiste en analizar gráficos de control univariantes correspondientes a cada una de las características de calidad y así intentar deterinar qué característica de calidad provoca esa situación. Este caino presenta ciertos inconvenientes; el priero es que hay uchas variables y estas técnicas tienden a ser tediosas por la cantidad de gráficos de control que analizar. La segunda, ás iportante, es que noralente una señal fuera de control no es causada por una variable, sino ás bien por la interacción entre varias variables. Así por ejeplo, si estaos analizando dos características de calidad con una alta correlación positiva, debeos suponer que las edias en cada uestra para cada una de las características deben tener una relación parecida, si no igual, respecto a la edia del proceso ( ) para cada variable. Es decir, si la edia de la priera variable en una uestra supera a la edia de dicha variable para el conjunto del proceso, debeos esperar que en esa uestra, la edia de la segunda variable tabién eceda a su edia global. i se observan oviientos en distinta dirección vaos a sospechar que el proceso probableente se encuentre en una situación fuera de control, ya qué habrá cabiado la correlación entre las variables. Esta anoalía no se detectaría con gráficos univariantes ya que no es debida a ninguna de las variables consideradas individualente sino a la relación eistente entre ellas. i las dos desviaciones son en la isa dirección y una es ayor, esta situación se reflejara en el gráfico ultivariante coo una situación fuera de control y si analizaos los correspondientes gráficos univariantes podreos deterinar a que variable es debida esa situación. Por lo tanto hay que desarrollar otra alternativa que sea ás efectiva que el análisis univariante. En este sentido, Alt (985) desarrolló gráficos de edias individuales con un control tipo Bonferroni que consiste básicaente sustituir en los líites de control establecidos para dichos gráficos Z α por Z α P lo que nos va a peritir reducir el 9

núero de falsas alaras que ocurren cuando utilizaos siultáneaente uchos gráficos de control univariantes. Hayter y Tsui (994) utilizaron un procediiento de intervalos de confianza siultáneos tipo Bonferroni para cada una de las características de calidad. Estos intervalos de confianza son esencialente unos sustitutos de los gráficos de control de edia individuales y suelen ser ás efectivos en la identificación de la característica de calidad que causa la señal fuera de control en los gráficos ultivariantes. La idea general es construir p intervalos (uno para cada característica de calidad) para cada uestra que produce una señal fuera de control en el gráfico de control ultivariante. Este intervalo para el subgrupo j-ésio y la característica de calidad i-ésia tendrá la siguiente fora: i ϖ tα pi i i + t n( n ) α n( n ) pi...(3.7) p n p n donde: i es la edia de la característica de calidad i-ésia para el conjunto del proceso. pi es la cuasidesviación típica uestral para la característica i-ésia. es el núero de uestras que teneos y n es el taaño de cada uestra. ϖ es la edia de la característica i-ésia en la uestra j-ésia en la que se ha i detectado una situación fuera de control. i el valor de la edia de la variable en esa uestra no se encuentra dentro de ese intervalo, entonces el valor de la característica de calidad debe ser investigado para las uestras. i se detecta una causa asignable, la uestra debe ser eliinada para todas las variables y habrá que volver a calcular el líite superior de control correspondiente. El problea de este procediiento aparece a la hora de deterinar el nivel de significación que vaos a utilizar para esos intervalos de confianza. Cuando el núero de variables que anejaos no es uy elevado, es conveniente utilizar un nivel de confianza de 0,0. i la edia uestral no se sale de ningún intervalo habrá que sospechar que el otivo de la variación esta en la estructura de correlación de las variables. 30

Otro procediiento para interpretar esas señales fuera de control consiste en la descoposición del estadístico T de fora que nos ida la influencia de cada una de las variables. i T es el valor del estadístico, y T (i ) es su valor para todas las variables del proceso ecepto la i-ésia, podeos calcular un indicador de la contribución de la variable i-ésia sobre el conjunto de la siguiente fora: d i = T T ( i) Cuando aparece una situación fuera de control en un gráfico de control ultivariante es conveniente calcular esta contribución para cada una de las variables y centrar nuestra atención en aquellas variables cuya contribución sea superior. Eisten tabién otras técnicas, enos usuales en la práctica, para interpretar la señal de fuera de control. Por ejeplo, Jackson (980) propone una basada en representar coponentes principales en lugar de las variables originales, con el posible problea de interpretación de esos resultados cuando no sea fácil encontrar el significado de dichas coponentes. Murphy (987) recoienda un étodo que consiste en desarrollar un procediiento basado en un análisis discriinatorio que nos perite agrupar las observaciones en grupos; y en Mason, Tracy y Young (996) se propone una descoposición del estadístico T de una fora ás copleja que la anterior. Por lo tanto es conveniente no utilizar estas técnicas de control ultivariantes de fora aislada sino ás bien copleentadas por alguna de estas técnicas de análisis de señales fuera de control descritas que nos van a peritir una interpretación ás clara de los resultados obtenidos. Este gráfico, igual que el hewhart univariante, es sensible a grandes cabios en los datos, pero cuando la salida de control provoca una acuulación de variaciones de agnitud oderada, esta técnica no es eficaz. Habría que recurrir a la etensión ultivariante de otras técnicas de control desarrolladas para solucionar este iso problea en el caso univariante. Dentro de éstas cabe destacar lo que se conoce coo MCUUM y MEWMA, que son la etensión ultivariante de los gráficos de control CUUM y MEWMA respectivaente. 3