APLICACIÓN DE LA ESTADÍSTICA Y QUIMIOMETRÍA EN EL TRATAMIENTO QUÍMICO DE RESIDUOS Esperanza Mateos*. Ana Elïas, Gabriel Ibarra Universidad del País Vasco *iapmasae@lg.ehu.es Tfno.946014343; Fax.944441625 1. RESUMEN El objetivo de la presente comunicación es dar a conocer los estudios realizados sobre la utilización de métodos estadísticos elementales y avanzados en la enseñanza práctica de las ciencias analíticas. En este artículo se aplica el análisis estadístico de datos aplicado en el análisis químico de una serie de muestras de residuo lignocelulósico sometidas a tratamiento químico bajo diferentes condiciones de operación, con el propósito de incorporar la experiencia adquirida al diseño de clases prácticas que complementen y sirvan de soporte a las asignaturas Química Industrial II y Control de Calidad de Procesos y Productos químicos. Dichas asignaturas se imparten actualmente en el quinto cuatrimestre a los alumnos de la especialidad Química Industrial en la Escuela de Ingeniería Técnica Industrial de Bilbao de la Universidad del País Vasco. Mediante el desarrollo de las clases prácticas propuestas se pretende que el alumnado adquiera unos conocimientos iniciales básicos en el tratamiento estadístico de datos. 2. INTRODUCCIÓN De todos es conocido que la química analítica moderna es una ciencia cuantitativa y el principio guía que la acompaña es que no existen resultados de interés si no van acompañados de alguna estimación de los errores inherentes a los mismos. Este principio básico se aplica no sólo en el análisis químico sino en cualquier ámbito de estudio donde se obtengan resultados experimentales numéricos (1). Los estudiantes de ingeniería química que opten al finalizar su carrera por el trabajo de laboratorio o investigación se van a encontrar con que todas las actividades asociadas con el diseño y la realización de tratamiento analítico tienen implicaciones estadísticas, por lo que resulta especialmente interesante que se les inicie, ya en su etapa formativa en estas técnicas quimiométricas de forma que adquieran unos conocimientos básicos iniciales sobre esta materia. 2.1. Errores en el análisis cuantitativo Hay un principio fundamental para todo analista químico, según el cual no existen resultados cuantitativos de interés si no van acompañados de alguna estimación de los errores inherentes a los mismos (2). Los errores cometidos en el trabajo analítico se pueden clasificar en tres tipos: Errores accidentales o groseros Errores sistemáticos Errores aleatorios
Los errores accidentales o groseros aquellos errores tan importantes que, en el caso de producirse, dan resultados no válidos por lo que necesariamente se debe repetir el trabajo analítico. Ejemplo de este tipo de errores puede ser cualquier vertido accidental de muestra, contaminación de reactivos, etc. Los errores aleatorios provocan que los resultados individuales difieran entre sí de forma significativa afectando a la precisión o reproducibilidad de un experimento. La existencia de errores sistemáticos provocas que los resultados obtenidos sean erróneos en un sentido y es lo que se lama sesgo de la medida. Ambos conceptos: precisión y sesgo definen de forma simultánea la exactitud o proximidad al verdadero valor de los resultados obtenidos tras el análisis. 3. PLANIFICACIÓN Y DISEÑO EXPERIMENTAL Los métodos estadísticos se utilizan no sólo para evaluar los resultados obtenidos en el análisis químico de muestras, sino que son igualmente adecuados en las etapas previas de planificación y diseño de experimentos. Para optimizar el trabajo de laboratorio y como etapa previa a los ensayos, resultará imprescindible identificar los errores dominantes para poder minimizarlos conduciendo a mejorar la calidad de los resultados obtenidos. En muchas técnicas analíticas la respuesta del sistema de medida depende de una variedad de factores experimentales bajo el control del operador. Por ejemplo, la solubilidad de un cierto componente de una muestra puede depender de factores tales como la relación sólido/líquido, temperatura y concentración de reactivo. Para una aplicación concreta será importante establecer los niveles de estos factores para optimizar el rendimiento de operación. El proceso de búsqueda de estos niveles óptimos del factor se conoce como optimización. Como paso previo al proceso de optimización se determinarán los factores y las interacciones que afectan de manera significativa al proceso Estos estudios utilizan un diseño factorial en el que cada factor tenga dos niveles, conocidos como alto y bajo. En un experimento de tres factores habrá 2 3 combinaciones posibles de niveles de factores. Un signo positivo indica que el factor está en el nivel alto y un signo menos que esté en el nivel bajo. Los cálculos estadísticos necesarios para el correcto análisis de los datos se han simplificado enormemente en los últimos tiempos con el empleo del ordenador, ya que éste permite el manejo rápido de grandes cantidades de datos y una rápida aplicación de métodos matemáticos. Existen en el mercado abundantes programas estadísticos que incluyen todo tipo de funciones estadísticas y que son capaces de realizar cualquier cálculo o contraste estadístico seleccionado por el usuario. 4. ANÁLISIS DE VARIANZA EN EL TRATAMIENTO QUÍMICO DE RESIDUOS Se procede a realizar el análisis de resultados obtenidos en diferentes parámetros tras el tratamiento químico de un residuo agropecuario constituido por paja de cereal. La razón por la que se optó por este sustrato es por su abundancia, ya que anualmente se generan en España en torno a 1.6. 10 10 kg/año Informes sobre la producción agrícola en el estado español indican que
el 44.5% corresponde a cereales (FAO, 2000), produciéndose anualmente más de diez millones de toneladas de paja, de los que sólo una fracción se utiliza actualmente como lecho o alimento de animales, la mayor parte de la paja es quemada en el campo, lo que origina un grave impacto medioambiental. Se conocen muchos tratamientos (Físicos, Químicos, Físico-Químicos Biológicos) de estos subproductos agrícolas que hidrolizan la celulosa, lignina y otros azúcares poco solubles contenidos en la paja de cereal, con el fin de aumentar su digestibilidad o de facilitar su manejo y consumo por los animales. Los tratamientos químicos más eficaces -en cuanto al aumento del valor nutritivo y digestibilidad de la paja-, son los que se basan en el empleo de álcalis, destacando los tratamientos con sosa caústica (3). En este trabajo se estudia la influencia de las variables las variables de operación (concentración de NaOH, relación gr.paja/litro disolución alcalina y temperatura) sobre la digestibilidad de la fracción hemicelulósica de muestras de paja de cebada. Mediante regresión lineal múltiple se obtiene la ecuación general que reproduce los valores experimentales obtenidos respecto a la variable dependiente Y (porcentaje de hemicelulosa digerida tras el tratamiento) en los intervalos de variación de las variables independientes X g/l ( relación gr. residuo por litro de disolución alcalina), X s (concentración de disolución de NaOH), y X T (temperatura). El objetivo de este trabajo es que los alumnos obtengan una ecuación mediante la cual se determine la variable más significativa del proceso. 4.1. Diseño experimental utilizado para el estudio de las condiciones de tratamiento Para el estudio de la influencia de las variables de operación se utiliza un diseño factorial de experimentos 2 n, con las variables independientes para las que se prevea una mayor influencia. Se consideran dos niveles de las variables y se aplica un análisis estadístico de regresión lineal múltiple. Para un número de tres variables, serán 8 los experimentos necesarios. La Tabla I muestra las condiciones de operación correspondiente a los 8 tipos de experimentos Tabla I: Valores de las variables X g/l, X s y X T X G/L X S X T 200 1 90 1000 1 90 200 2 90 1000 2 90 200 1 50 1000 1 50 200 2 50 1000 2 50 Condiciones de operación de los 8 tipos de tratamiento
Se ha decidido correr dos réplicas en este diseño factorial de tres factores, como cada ensayo se realiza por duplicado se dispone de 16 muestras tratadas bajo diferentes condiciones. Los datos correspondientes a este diseño factorial así como los valores obtenidos en las 16 muestras tratadas están representados en la Tabla II. Todas las muestras tratadas han sido sometidas a análisis por triplicado y los resultados experimentales (media de tres determinaciones) se expresan en esta Tabla que incluye los valores de las variables independientes normalizadas. Tabla II. Datos del diseño factorial y niveles de las variables independientes estudiadas en el tratamiento alcalino de paja de cereal con NaOH Factores codificados % E-hem* Niveles del factor Corrida X g/l X s X T Réplica 1 Réplica 2 Bajo (-1) Alto (+1) 1-1 -1-1 56,8 51,7 2 1-1 -1 14,81 12,17 3-1 1-1 59,1 63,4 4 1 1-1 44,5 43,2 X g/l (grl -1 ) 200 1000 X s [NaOH] 1.0N 2.0N X T (ªC) 50ºC 90ºC 5-1 -1 1 60,1 56,8 6 1-1 1 12,7 11,3 7-1 1 1 59,4 66,7 8 1 1 1 42,2 39,7 *Los valores expresados en esta columna corresponden a los resultados medios obtenidos en el porcentaje de solubilización de la fracción hemicelulósica (%E-hem). Los coeficientes de variación no superan en ningún caso el 2% Para obtener modelos matemáticos que relacionen la variable dependiente estudiada Y (ó porcentaje de solubilización de la hemicelulosa de la muestra tras el tratamiento) con las tres variables independientes analizadas: X g/l, X s y X T, se procede a normalizar los valores de estas variables independientes asignando los valores respectivos de +1 y 1 para el nivel superior e inferior de dichas variables. En el análisis de regresión lineal múltiple se relacionan las variables independientes que tengan un coeficiente estadísticamente significativo, según los criterios de no superar un nivel de significación de 0.05 para el test de Student y con un intervalo de confianza (95%) que no incluya el cero.los modelos polinómicos obtenidos son del tipo: Y = a 0 + 3 i= 1 b i X ni
En la ecuación anterior, Y representa la variable dependiente analizada, o porcentaje de hermicelulosa eliminada por el tratamiento químico, mientras que X ni representa a las variables independientes respectivas : X g/l, X s y X T, (gr. paja L -1, concentración de NaOH y temperatura). Estas variables están normalizadas adquiriendo los valores (+1-1) para el mayor y menor valor de las mismas. Los parámetros a 0 y b 0 son los coeficientes que se obtienen en el análisis de regresión múltiple. 4.2. Resultados del análisis de regresión lineal múltiple El análisis de regresión lineal múltiple para la variables dependiente considerada Y (%E-hem) en función de las variables independientes permite obtener la siguiente ecuación: 5. CONCLUSIONES Y = 43,9 15,9 X g/l + 8,9 X s + 0,2 X T (1) r 2 = 0,86 F = 31,7 Los valores de los coeficientes de la ecuación (1) permiten observar la influencia positiva de las variables concentración de sosa (X s ) y temperatura (X T ) y la influencia negativa de la relación gr paja L -1 (X g/l ) en la eficacia de los tratamientos relativa a la mayor degradación de la hemicelulosa ( Y ). Analizando los valores obtenidos en la ec. (1) se concluye que el efecto de la relación gr paja L -1 (X g/l ) es un 80,5 % mayor que la concentración de sosa (X s ) no teniendo apenas influencia la temperatura (X T ) en la eficiencia de los tratamientos, ya que el coeficiente que aparece multiplicando a esta variable en la ecuación (1) es muy pequeño comparado con los de las restantes variables. Mediante la aplicación de este análisis de regresión lineal, los alumnos se inician de una forma práctica en los métodos estadísticos de análisis de datos. 6. REFERENCIAS (1) Miller, M.J and Miller, C.J. Estadística y Quimiometría para Química Analítica, Prentice Hall (2002) (2) Massart, D.L., Vandeginste, B.G.M., Smeyers-Verbeke, J., Lewi, P.J. y de Jomg, S. Chemometrics and Qualimetrics, Elservier (1998) (3) Lázaro, L., Mastral, J., J.Arauzo. Pretratamiento con NaOH de paja de cereal para su transformación por hidrólisis enzimática. Química e Industria, 3: 13-18 (1994)