PROPIEDADES ESTADÍSTICAS DE PROCEDIMIENTOS DE MONITORIZACIÓN DE RESIDUOS EN UN PROCESO REGULADO

27 Congreso Nacional de Estadística e Investigación Operativa Lleida, 8-11 de abril de 2003 PROPIEDADES ESTADÍSTICAS DE PROCEDIMIENTOS DE MONITORIZACIÓN DE RESIDUOS EN UN PROCESO REGULADO J.M. Prats, C. Capilla Departamento de Estadística e Investigación Operativa Aplicadas y Calidad Universidad Politécnica de Valencia, España E-mail: jopramon@eio.upv.es, ccapilla@eio.upv.es Se analiza la utilización de gráficos de control estadístico para control y mejora de la calidad en un proceso regulado. La componente de regulación consiste en un controlador de mínima varianza para los ajustes en una variable de proceso. La monitorización se realiza mediante gráficos de control sobre los errores de predicción de una variable de calidad, para la detección de perturbaciones. Se investigan las propiedades estadísticas de estos gráficos frente a distintas situaciones de falta de control, comparando la eficiencia de métodos alternativos. Palabras y frases clave: control estadístico de procesos, controlador SISO, series temporales. Clasificación AMS: 62P30, 62M10. 1. Preámbulo Tradicionalmente, en los procesos continuos industriales, donde dominan las técnicas de regulación automática, Engineering Process Control (EPC), el control de los mismos se basa en unos ajustes continuados de las variables de entrada, con el fin de mantener la variable de salida en el nominal deseado. El problema que se presenta es que estos ajustes se llevan a cabo frecuentemente por medio de controladores diseñados en laboratorios off-line, aislados de los factores de ruido de la línea real de producción, de manera que el componente de control diseñado no se ajusta al proceso lo bien que debería. Debido a este continuo ajuste de las variables de entrada, y unido a la necesidad de una mayor preparación estadística de los ingenieros de proceso, las empresas desconocen el porqué de sus índices de calidad, y cuáles son los puntos que deberían mejorar o cambiar, con el objeto de erradicar de manera permanente causas de variabilidad. Es ahí donde las técnicas estadísticas pueden desempeñar un trabajo importante, puesto que pueden ser capaces, a partir de los datos del proceso, de transformarlos en

información y disgregar la variabilidad en aquélla debida a causas comunes y aquélla debida a causas especiales, y que por tanto hay que cuantificar y eliminar. Se trata por tanto de integrar los campos de EPC, cuyo punto fuerte es el diseño de algoritmos y componentes de control que permitan operar sobre las variables ajustables de un proceso para conseguir el comportamiento deseado del mismo, reduciendo la dispersión debida a causas comunes; y por medio del Control Estadístico de Procesos (SPC), detectar las causas especiales que provocan variaciones en la calidad y en el proceso. El objetivo es aprovechar las ventajas de cada uno de ellos, y conseguir una herramienta más potente de detección de variaciones y predicción de los valores a establecer en las variables de entrada, para conseguir la mejor salida posible en el proceso. Esta idea ya ha sido desarrollada por diferentes autores, como Montgomery et al. (1994), Vander Wiel et al. (1992), quienes han ilustrado por medio de ejemplos cómo es posible llevar a la práctica dicha integración. Una cuestión importante a resolver es cuándo hay que manipular el proceso, y cuándo dejarlo solo, con el fin de no producir sobreajustes innecesarios, lo cual lleva a situaciones de falta de calidad en el producto final. El presente trabajo pretende estudiar esta filosofía de integración de EPC y SPC, planteando para el segundo métodos basados en la monitorización de los errores de predicción. Se investigan las propiedades estadísticas de estos procedimientos, con el fin de evaluar su eficiencia como métodos que permitan detectar cambios y/o situaciones de falta de control en los procesos, y facilitar su identificación y posterior eliminación. Para ello, se va a partir de un controlador SISO de mínima varianza. La componente SPC que se integra con este controlador se aplica sobre los errores de predicción a un paso en el output o variable de calidad a controlar. El procedimiento de monitorización de estos errores se va a llevar a cabo por medio de diferentes gráficos de control, tales como CUSUM, y Shewhart, comparándolos y estableciendo la adecuación de los mismos en cada caso. 2. Relación dinámica del proceso Se plantea la relación dinámica unidireccional entre las variables output e input de un proceso con el modelo: Y t = ω 0 /(1-τB) X t-1 + N t N t = (1-θB) a t 2

Se ha llevado un estudio sobre este tipo de ecuación dado que es muy común en procesos reales, a pesar de su aparente sencillez. En cualquier caso, se pueden plantear modelos más complejos, llegando a diferentes ecuaciones de control, si bien la utilización de éste no conlleva una pérdida de generalidad. 3. Ecuación de control Cuando el coste asociado a los ajustes que se realizan sobre los procesos es pequeño o nulo, se puede establecer un control que minimice la variabilidad en la salida. Este es el criterio empleado por el Controlador de Mínima Varianza, CMV, el cual, a partir del modelo ARMAX estimado Y t = ν * (B) X t + N t determina que el valor óptimo de X t es aquél que hace nulo en valor esperado de Y t+1. La aplicación del criterio MV conduce en alguno casos a ecuaciones de control para los ajustes en la entrada, que coinciden con las que se utilizan en los controladores Integrados o Progresivos Integrados, pero con valores de sus parámetros estimados de forma óptima a partir de la información del proceso. En el caso de que el modelo para el ruido sea un IMA(1,1), es decir, N t = (1 - θb)a t Y t = ω 0 /(1-τB) X t-1 + N t * Si tenemos en cuenta que la predicción debe tener media nula, dado que la salida son desviaciones respecto del nominal, tenemos que E(Y t Y t-1 ) = 0 0 = ω 0 /(1-τB) X t-1 + N t * N * t = N t-1 - θ a t-1 = N t-1 - θ (N t-2 N * t-2 ) =... = (1-θ)/(1-θB)N t-1 Al ser la predicción a un paso, y sustituir el valor de a t por su media De esta manera X t-1 = -1/ω 0 (1-θ) [τa t-1 + (1-τ) a t-1 ] Ecuación que se corresponde con el conocido Controlador Progresivo Integrado, P.I. 3

En el caso que estudiamos, el cual presenta un modelo de ruido MA(1), para hallar el controlador de mínima varianza, CMV, se desarrolla la fórmula, que queda de la siguiente manera Y t = ω 0 /(1-τB) X t-1 + (1-θB) a t Si tenemos en cuenta que la predicción debe tener media nula, dado que la salida son desviaciones respecto del nominal, tenemos que E(Y t Y t-1 ) = 0 de donde 0 = ω 0 /(1-τB) X t-1 + (1-θB) a t X t-1 = -1/ω 0 (1-τB) (1-θB) a t = -1/ω 0 (a t - θa t-1 ) Como la predicción es a un paso, no conocemos la perturbación en el instante siguiente, por lo que nuestro controlador queda como: o lo que es lo mismo X t-1 = -1/ω 0 (1-τB) θ a t-1 X t = θ/ω 0 (1-τB) a t = θ/ω 0 (a t -τa t-1 ) Una vez obtenida la ecuación de control de mínima varianza correspondiente a nuestro modelo, se pasó a estudiar la distribución de los errores de predicción a t cuando se aplica dicha ecuación y en un intervalo t 0 tienen lugar las perturbaciones de tipo impulso o bien de tipo escalón, con el objeto de conocer si éstos seguían distribuyéndose según una normal. 4. Distribución de los errores de predicción a t 4.1. Estudio de las distribuciones a) Para el caso del impulso, tenemos que: N t = (1-θB) a t + δi t to = a t - θa t-1 + δi t to 4

Sea Z = a t - θa t-1 + δi t to a t = N(0,σ a ) a t-1 = N(0,σ a ) I t to = 1 t=t 0 = 0 t t 0 Si aplicamos a la variable Z su función característica, y teniendo en cuenta que si Z está formada por 3 variables independientes, X 1, X 2 y X 3 De esta manera, como E(δI t t0 ) =0 ϕ Z (t) = ϕ X1 (t) ϕ X2 (t) ϕ X3 (t) ϕ Z (t) = E[exp(itm 1 - σ 1 2 t 2 /2) exp(itθm 2 - θ 2 σ 2 2 t 2 /2) exp(itδi t t0 )] ϕ Z (t) = E[exp(itm 1 - σ 1 2 t 2 /2) exp(itθm 2 - θ 2 σ 2 2 t 2 /2)] ϕ Z (t) = E[exp(it(m 1 +θm 2 ) (σ 1 2 + θ 2 σ 2 2 )t 2 /2)] que es la función característica de una variable normal, que en este caso será 2 Z = N(m 1 +θm 2, σ 1 + θ 2 σ 2 2 2 ) = N(0, σ 1 + θ 2 σ 2 2 ) b) Para el caso del escalón, y actuando de manera análoga, N t = (1-θB) a t + δi to to t = a t - θa t-1 + δi t to Sea Z = a t - θa t-1 + δi t a t = N(0,σ a ) a t-1 = N(0,σ a ) I t to = 1 t t 0 = 0 t < t 0 5

Antes de t 0 N t = a t - θa t-1 ϕ Nt (t) = ϕ X1 (t) ϕ X2 (t) ϕ Nt (t) = E[exp(itm 1 - σ 2 1 t 2 /2) exp(itθm 2 - θ 2 σ 2 2 t 2 /2)] 2 ϕ Nt (t) = E[exp(it(m 1 +θm 2 ) (σ 1 + θ 2 σ 2 2 )t 2 /2)] que es la función característica de una distribución normal, que en este caso es 2 Z = N t = N(m 1 +θm 2, σ 1 + θ 2 σ 2 2 2 ) = N(0, σ 1 + θ 2 σ 2 2 ) A partir de t 0 N t = a t - θa t-1 + δ De esta manera la función característica queda ϕ Z (t) = ϕ Nt (t) = ϕ X1 (t) ϕ X2 (t) ϕ X3 (t) ϕ Z (t) = E[exp(itm 1 - σ 1 2 t 2 /2) exp(itθm 2 - θ 2 σ 2 2 t 2 /2) exp(iδt)] ϕ Z (t) = E[exp(it(m 1+ θm 2 ) (σ 1 2 +θ 2 σ 2 2 t 2 )/2) exp(iδt)] ϕ Z (t) = E[exp(it(m 1+ θm 2 +δ) (σ 1 2 +θ 2 σ 2 2 t 2 )/2))] que se corresponde con la función característica de una Distribución Normal. Como la suma de v.a. normales es otra v.a. normal, en el caso de escalón tenemos también una distribución normal. Una vez comprobado que los errores de predicción se siguen distribuyendo según una normal, cuando se introduce una perturbación tipo impulso o bien de tipo escalón, se pasa a estudiar cuáles son los valores de las medias y varianzas de los errores de predicción, presentándose los resultados a continuación. 6

4.2. Estudio de las medias y las varianzas Impulso Media Hemos visto que la ecuación de la respuesta era Y t = υ(b) X t-1 +a t (1-θB) a t (1-θB) = Y t - υ(b) X t-1 Redefinimos la perturbación a t como ε t, con el objeto de poder introducir dentro de la misma una perturbación adicional a la distribución normal de media cero y desviación típica σ a. La ecuación queda entonces como ε t (1-θB) = Y t - υ(b) X t-1 Si introducimos una perturbación tipo impulso, to ε t (1-θB) = Y t - υ(b) X t-1 + δi t to ε t (1-θB) = (1-θB)a t + δi t Aplicando esperanzas E[ε t (1-θB)] = E[(1-θB)a t ] + E[δI to t ] = δe[i to t ] Puesto que la esperanza de a t es cero. Entonces, para t=t 0 E[ε to - θε to-1 ] = E[δI to t ] = δe(i to t ) = δ Y como E[ε to-1 ] = E[a to-1 ] + δe[i to to-1 ] = 0 queda 7

E[ε to ] = δ Para t = t o+1 E[ε to+1 - θε to ] = E[ε to+1 ] - θ E[ε to ] = E[(1-θB)a to+1 ] + δe[i t to ] = 0 De donde E[ε to+1 ] = θ E[ε to ] = θδ Y así, para t = t o+n E[ε to+n ] = θ E[ε to+n -1 ] = θ n δ = θ t-to δ Varianza Al igual que en el estudio de la media, la ecuación que debemos estudiar es ε t (1-θB) = (1-θB)a t + δi t to Del desarrollo anterior para la media, ε t = a t+n + θ n δ σ ε 2 = E(ε 2 t0+n) E(ε t0+n ) 2 Donde E(ε t0+n ) 2 = (θ n δ) 2 E(ε 2 to+n) = E(a to+n + θ n δ) 2 = E(a 2 to+n) + 2θ n δe(a to+n ) + δ 2 (θ n ) 2 E(ε 2 to+n) = σ 2 a + δ 2 (θ n ) 2 Y de aquí se obtiene que σ 2 ε = E(ε 2 t0+n) E(ε t0+n ) 2 = σ 2 a + δ 2 (θ n ) 2 - (θ n δ) 2 2 = σ a Escalón Medias 8

Y t = υ(b) X t-1 +a t (1-θB) Mediante razonamiento análogo al anterior, to ε t (1-θB) = (1-θB)a t + δi t ε t = a t + δi to t (1+θB+θ 2 B 2 +θ 3 B 3 +...+θ n B n ) para t = t o ε to = a to + δi to to (1+θB+θ 2 B 2 +θ 3 B 3 +...+θ n B n ) = a to + δ E(ε to ) = E(a to ) + δe(i to to )(1+θB+θ 2 B 2 +θ 3 B 3 +...+θ n B n ) = δ Para t = t o+1 E(ε to+1 ) = E(a to+1 ) + δe(i to+1 to )(1+θB+θ 2 B 2 +θ 3 B 3 +...+θ n B n ) = δ + θδ = δ(1+θ) De esta manera, para t = t o+n E(ε to+n ) = E(a to+n ) + δe(i to to )(1+θB+θ 2 B 2 +θ 3 B 3 +...+θ n B n ) = δ(1+θ+θ 2 +θ 3 +...+θ n ) En el límite, cuando n, E[ε to+n ] = δ/(1-θ) Varianza σ 2 ε = E(ε 2 t0+n) E(ε t0+n ) 2 Sabemos que ε to+n = a to+n + δi to+n to (1+θB+θ 2 B 2 +θ 3 B 3 +...+θ n B n ) cuyo límite o cota máxima es, cuando n, ε to+n = a to+n + δ/(1-θ) de aquí tenemos que E(ε t0+n ) 2 = [δ/(1-θ)] 2 E(ε 2 t0+n) = E(a to+n + δ/(1-θ)) 2 = E(a 2 to+n) + 2δ/(1-θ) E(a to+n ) + (δ/(1-θ)) 2 Y así, σ 2 ε = E(ε 2 t0+n) E(ε t0+n ) 2 = E(a 2 to+n) + (δ/(1-θ)) 2 - (δ/(1-θ)) 2 = E(a 2 2 to+n) = σ a 9

5. Conclusiones del estudio Como conclusión de estas demostraciones, podemos ver que el hecho de introducir este tipo de perturbaciones en nuestro proceso no afecta a la varianza de los errores de predicciones, sino tan solo al valor medio de los mismos. Cuando introducimos un impulso, el valor esperado va decreciendo de manera exponencial, desde δ en el instante de introducción de la perturbación, hasta 0, conforme va aumentando el número de pasos. Cuando se introduce un escalón, obtenemos un valor esperado del error de predicción que crece de manera logarítmica desde δ en el instante de introducción de la perturbación, hasta δ/(1-θ), conforme va aumentando el número de pasos. Por ello, los gráficos que vamos a emplear para determinar cuándo el proceso está fuera de control, van a estar centrados en el control de la media, de manera que cuando el controlador no sea capaz de neutralizar la perturbación introducida, el error en la predicción a un paso será mayor de lo estadísticamente razonable, para los límites establecidos, y aparecerá una señal de falta de control. 5.1. Resultados de la simulación Para finalizar, se llevan a cabo, a partir de la elaboración de un programa de simulación, estudios sobre la influencia de los distintos parámetros, tipos de perturbación y valor de las mismas, así como de los tipos de gráficos utilizados (gráfico de medidas individuales y gráfico CUSUM), sobre el error cuadrático medio a la salida, los valores de la variable de entrada (medidos como diferencia respecto del valor de referencia) y sobre el porcentaje de situaciones de falta de control detectadas por cada uno de los dos gráficos. Para ello, se ha diseñado un experimento en el que tenemos: Parámetro ω, asociado a la ganancia, a dos niveles Parámetro τ, asociado a los valores pasados en la entrada, a dos niveles Parámetro θ, asociado al ruido y sus valores pasados, a dos niveles Tipo de gráfico, CUSUM o Shewhart Tipo de perturbación, impulso o escalón Valor de la perturbación, como 0.5, 1.5 o 3 veces la desviación típica 10

Se trata pues de un diseño factorial completo de 5 factores a 2 niveles y 1 factor a tres niveles, llevándose por tanto a cabo un total de 96 pruebas. Los resultados obtenidos, de manera gráfica, son los siguientes: Comparación de los dos tipos gráficos frente a distintas situaciones y valores de la perturbación Para la perturbación de Impulso, En cuanto al Error Cuadrático Medio, los dos tipos de gráficos de control se muestran bastante similares, si bien CUSUM es lago mejor para pequeños valores de la perturbación, igualándose su poder de detección para el valor de 3 sigma. A mayor perturbación, mayor ECM Los ajustes a la entrada muestran una evolución decreciente con el valor de la perturbación, mostrando CUSUM mayores valores que Shewhart para las perturbaciones de 1,5 y 3 sigma. En cuanto al % de detección de fallos, ambos gráficos se muestran prácticamente iguales para la situación de impulso, aumentando el % con el valor de la perturbación. Para finalizar, el ARL de ambos gráficos se muestra también prácticamente igual para la ambos gráficos, evolucionando de manera inversa al valor de la perturbación. Para la perturbación de tipo Escalón El Error Cuadrático Medio de los dos tipos de gráficos de control se muestra bastante similar, al igual que en el caso anterior, siendo de nuevo CUSUM algo mejor para pequeños valores de la perturbación. Los ajustes a la entrada muestran una evolución ligeramente decreciente con el valor del escalón, mostrando ambos gráficos valores prácticamente iguales para cada valor de las perturbaciones. En cuanto al % de detección de fallos, CUSUM se muestra bastante mejor que Shewhart para pequeños valores del escalón, igualándose el poder de detección conforme aumentamos el valor de la perturbación. Para finalizar, el ARL de ambos gráficos se muestra también prácticamente igual para la ambos gráficos, evolucionando de manera inversa al valor de la perturbación. Si comparamos la perturbación de tipo Impulso vs escalón 11

En cuanto al ECM, éste es mayor con escalón que con impulso, siendo mayor para Shewhart que para CUSUM. Los ajustes a la entrada son algo mayores con CUSUM que con Shewhart, aumentando ligeramente para escalón. El % de situaciones detectadas de falta de control es mucho mayor cuando tenemos escalón que cuando tenemos impulso, mostrándose grandes diferencias de comportamiento: mientras que para impulso ambos gráficos son muy similares, para escalón CUSUM se muestra mucho mejor. El ARL es más o menos el mismo con ambos métodos y con ambos tipos de perturbación. En las siguientes páginas se muestran unos gráficos explicativos de los comentarios realizados. 250 MECM 200 150 MECM CUSUM M max Input M max Input CUSUM 100 %Fallos %Fallos CUSUM 50 ARL 0 0,5 IMPULSO 1,5 IMPULSO 3 IMPULSO ARL CUSUM Tabla 1: Comparación de los ECM medios, porcentaje de situaciones de falta de control detectadas y ARL para los dos tipos de gráficos, frente a una perturbación de tipo impulso 12

250 200 150 100 50 0 0,5 ESCALON 1,5 ESCALON 3 ESCALON MECM MECM CUSUM M max Input M max Input CUSUM %Fallos %Fallos CUSUM ARL ARL CUSUM Tabla 2: Comparación de los ECM medios, porcentaje de situaciones de falta de control detectadas y ARL para los dos tipos de gráficos, frente a una perturbación de tipo escalón 120 100 MECM MECM CUSUM 80 60 40 M max Input M max Input CUSUM %Fallos %Fallos CUSUM 20 ARL 0 Media IMPULSO Media ESCALON ARL CUSUM Tabla 3: Comparación de los ECM medios, porcentaje de situaciones de falta de control detectadas y ARL para los dos tipos de gráficos, entre los valores medios de los dos tipos de perturbaciones 13

Referencias Box, G.E.P., Kramer, T. Statistical Process Monitoring and Feedback Adjustment A Discussion Technometrics, Volumen 34, Nº 3, Agosto 1992, págs. 251-285 Capilla, C., Ferrer, A., Romero, R. y Hualda, A. (1999) Integration os Statistical and Engineering Process Control in a Continuous Polymerization Process Technometrics, Volumen 40, Nº 4, Noviembre 1998, págs. 14-28 Hoerl, Roger W., Palm, Andrew C. (1992). Statistical Process Monitoring and Feedback Adjustment A Discussion. Discussion: Integrating SPC and APC Technometrics, Agosto1992, Vol. 34, Nº 3, págs. 268-272 Janakiram, M, Keats, J.B. Combining SPC and EPC in a Hybrid Industry Journal of Quality Technology, Volumen 30, Nº 3, Julio 1998, págs. 189-200 MacGregor, J.F. (1988) Interfaces between Process Control and On Line Statistical Process Control Chemical Engineering Progress, Volumen 84, págs. 21-31 Montgomery, D.C., Keats, J.B., Runger, G.C., Messina, W.S. Integrating Statistical Process Control and Engineering Process Control Journal of Quality Technology, Volumen 26, Nº 2, Abril 1994, págs. 79-87 Vander Wiel, Scott A., Tucker, W.T., Faltin, F.W., Doganaksoy, N. (1992) Algoritmic Statistical Process Control: Concepts and an Application Technometrics, Agosto1992, Vol. 34, Nº 3, págs. 286-297. Yang, Jianbig, Makis, Viliam. (2000) Dynamic Response of Residuals to External Deviationes in a Controlled Production Process Technometrics, Volumen 42, Nº 3, Agosto 2000, págs. 290-299 14