Visualización y distribución de conocimiento en ambientes automatizados con Sistemas de Gestión de Workflow Juan J. Moreno Quinteros. Universidad Pontificia de Salamanca, Campus de Madrid, Facultad de Informática, Madrid, España, 28220 Universidad Católica del Uruguay, Facultad de Ingeniería y Tecnologías. Montevideo, Uruguay, 11600. jmoreno@ucu.edu.uy Adrián Miguel López Boccassino. Universidad Católica del Uruguay, Facultad de Ingeniería y Tecnologías Montevideo, Uruguay, 11600 adlopez@ucu.edu.uy Luis Joyanes Aguilar. Universidad Pontificia de Salamanca, Campus de Madrid, Facultad de Informática, Madrid, España, 28220 ljoyanes@fpablovi.org ABSTRACT The applications of workflow, do not manage the knowledge hidden in their instances of process and they either do not distribute it to the participants at the moment and place they need it. This work applies knowledge management to workflow, particularly to visualize the knowledge previously extracted from workflow management systems. We try to answer two big questions from a point of view of visualization: first, is possible to suggest a decision to a workflow participant on the basis of the good decisions taken before, and second, if the suitable participant can be identified to act in a certain stage of a process instance. Six visualization techniques are proposed which show patterns of knowledge previously extracted and represented. In order to be able to make these visualizations some workflow interfaces and the extraction and representation of patterns interfaces provided by the other members of the investigation equipment are needed. Also a prototype is displayed to show some of the visualization techniques. Keywords: Workflow, Knowledge Management, Visualization, Pattern, Decision, Participant. RESUMEN Las aplicaciones de workflow, no gestionan adecuadamente el conocimiento embebido en sus instancias de proceso y tampoco lo distribuyen a los participantes en el momento y en el lugar que lo precisen. El trabajo consiste en aplicar la gestión del conocimiento a workflow, en particular consiste en como visualizar el conocimiento previamente extraído del workflow y representado de forma adecuada. Se busca responder a dos grandes preguntas desde un punto de vista de visualización: la primera, es si se puede sugerir una decisión a un participante del workflow en base a las buenas decisiones tomadas antes y la segunda, si se puede identificar el participante idóneo para actuar en una determinada etapa de una instancia de proceso. Se proponen seis técnicas de visualización las cuales muestran patrones de conocimiento previamente extraídos y representados. Para poder realizar dichas visualizaciones se necesitan algunas interfaces de workflow y las interfaces de extracción y representación de patrones provistas por los otros miembros del equipo de investigación. También se presenta un prototipo para mostrar algunas de las técnicas de visualización. Palabras claves: Workflow, Gestión del Conocimiento, Visualización, Patrón, Decisión, Participante. 1
1. INTRODUCCIÓN El trabajo consiste en aplicar la gestión del conocimiento a workflow, en particular en como visualizar el conocimiento previamente extraído del workflow y representado de forma adecuada. En términos generales, el modelo consiste en visualizar patrones de conocimiento (casos) los cuales son extraídos y representados usando tecnología de CBR (razonamiento basado en casos). Por más información sobre la extracción y representación de patrones dirigirse a [18] y [19]. La ilustración 1 muestra un esquema de cómo interactúa el modelo de visualización propuesto en este trabajo con los modelos de extracción y representación de patrones de conocimiento. El repositorio de casos contiene todos los patrones de conocimiento y el motor de CBR es el que crea patrones y los fortalece a medida que transcurre el tiempo. El componente de visualización muestra los patrones que se ajustan a la instancia de proceso actual. Ilustración 1 Modelo de visualización interactuando con otros modelos 2. MODELO DE VISUALIZACION PROPUESTO El modelo de visualización propuesto contiene seis técnicas de visualización: Trazas de colores Sugerencias visuales de decisiones Mapas de conocimiento de los participantes Aplicación de técnicas de visualización de datamining a workflow Retroalimentación visual Visualización en aplicación workflow cliente Casi todas las técnicas propuestas muestran patrones de conocimiento que ya fueron extraídos y representados. En las siguientes secciones se explican cada una de ellas. Interfaces En el modelo se usaron interfaces de workflow y de extracción de patrones. Las interfaces de workflow usadas fueron: Interfaz 1 XPDL: interfaz de definición del proceso de workflow Interfaz 2: interfaz necesaria por ejemplo para obtener la worklist Interfaz 5: interfaz para acceder al historial del workflow Además se necesita la interfaz de extracción de patrones provista por [18]. Trazas de colores Las trazas de colores muestran con flechas rojas, verdes y amarillas, cuales son las mejores decisiones a tomar en el diagrama del proceso de workflow. Además pueden haber distintos tonos de colores, por ejemplo distintos tonos de color verde representando diferentes decisiones buenas. La ilustración 2 muestra un ejemplo de dicha visualización, en la cual aprobar es una buena decisión y denegar una mala decisión 2
Características Ilustración 2 Traza de Colores Esta visualización requiere mucha interacción con la interfaz 1 de workflow: XPDL. Se necesitan extraer los nombres, colores y coordenadas de las actividades a dibujar: actividad actual y actividades destino. La actividad actual es la actividad en la que hay que tomar una decisión mientras que las actividades destino son las posibles decisiones a tomar. También se interactúa con la interfaz 2 de workflow para acceder a la worklist y a la actividad actual en la que se quiere la sugerencia. La última interfaz necesaria y no en importancia, es la interfaz de patrones para acceder al patrón de sugerencias. La firma de la función de dibujo de las trazas es: dibujartrazas(patron,idactividad,idpaquete,idproceso) También recibe como parámetro un identificador de paquete y proceso los cuales son necesarios en XPDL. En las trazas se dibujan: Actividades Flechas Los colores de las flechas están basados en los porcentajes del patrón (con previa transformación de puntaje a porcentaje). Por más información sobre los puntajes de un patrón dirigirse a [18]. Además, el rango de los colores de las flechas es parametrizable. Es decir, se puede definir que cuando el porcentaje de sugerencia es menor que 10% entonces se dibuja una flecha de color rojo fuerte y si es mayor que 50% entonces se dibuja una flecha de color verde fuerte. Sugerencias visuales de decisiones Esta visualización es muy simple, consiste en graficar o hacer tablas con las sugerencias patrón. Muestran la misma información que las trazas pero no están contextualizadas en el workflow, no aportan mucho más que las trazas de colores. Se necesita interfaz 2 de workflow e interfaz de patrones. Mapa de conocimiento de los participantes El mapa de conocimiento de los participantes muestra quienes son los participantes una determinada etapa del workflow según los datos del negocio en ese momento. Una manera adecuada de hacer dicho mapa es mediante una gráfica de torta que involucrados y sus porcentajes. La firma de la función de dibujo de dicha gráfica de torta es: dibujartortaparticipantes(patron,idactividad) 3
Otra vez, es necesaria la interfaz 2 de workflow y la interfaz de patrones. Al igual que con las trazas, se transforman los puntajes de los participantes del patrón Una vez que se tienen los participantes para la actividad en curso, con los nombres se visualizan mediante una gráfica de torta usando una determinada herramienta. Aplicación de técnicas de visualización de datamining a workflow Hasta ahora, las técnicas de visualización vistas mostraban patrones de conocimiento. En esta sección se presenta otro enfoque de visualización utilizando metodologías de visualización que se usan con datamining. La técnica de datamining que más se aplica al problema es la de clasificación. Dicha técnica consiste en asignar una clase a un ítem de datos. En nuestro problema hay que asignar una decisión a un conjunto de valores de variables de interés representando los datos del proceso de workflow. Las técnicas de visualización de datamining que más se aplican al problema son parallel coordinates y el modelo RuleViz (el cual contiene a su vez parallel coordinates) Se proponen entonces, adaptaciones de las técnicas anteriores a workflow. El modelo RuleViz adaptado a workflow. El modelo RuleViz consta de 4 etapas: Visualización de datos originales Visualización de reducción de datos Visualización del conjunto de datos discretizado Visualización de las reglas La etapa más interesante es la última. La ilustración 3 muestra un ejemplo de dicha etapa. Supongamos que en una etapa del workflow hay tres variables de interés: edad, puntaje y color. Y también que hay 2 posibles decisiones buena y mala (aunque buena y mala no significa que sea una decisión buena o mala) En la figura se muestran 2 reglas. Una de ellas dice que si edad está entre 30 y 60 y puntaje entre 1.5 y 3.5 y el color es rojo entonces la decisión es mala. Se está mostrando conocimiento estadístico, es decir, en todas las instancias de proceso que cayeron en esos rangos de valores se tomó una decisión mala. Ilustración 3 Visualización de las reglas con RuleViz Las reglas anteriores se obtienen con el algoritmo ELEM2 descrito en [16]. Se dibujan con otro algoritmo propuesto por el mismo autor. Se necesitan las interfaces: 2 de workflow: para acceder a las variables de interés 1 de workflow: para acceder a las posibles decisiones 5 de workflow: para acceder a todas las instancias de proceso previas. Con dicha información, se infieren las reglas. Retroalimentación visual Esta técnica consiste en visualizar que tantas veces toma una sugerencia del sistema cada usuario y que tantas veces lo hacen en promedio todos los participantes. La ilustración 4 muestra una manera de realizar dicha visualización. Al final de cada instancia de proceso se comparan las actividades seguidas y los participantes que actuaron con las decisiones sugeridas y se va actualizando una tabla de porcentajes de uso individuales y de promedios. Se necesita interfaz 5 de workflow e interfaz de patrones. 4 Ilustración 4 Porcentaje de uso de las sugerencias
Está técnica es útil para usuarios y analistas. A un usuario le interesaría ver como se usa en promedio el sistema y un analista podría analizar que tanto usa el sistema cada participante y descubrir irregularidades como por ejemplo que un participante use siempre el sistema y nunca tome decisiones por si mismo. Otra técnica de retroalimentación visual es visualizar la relación entre fortalecimientos y debilitamientos de un patrón. Los patrones se fortalecen o debilitan según si las instancias de proceso que clasificaron en dichos patrones fueron exitosas o no. Por más información, dirigirse a [18]. Mostrar dicha relación equivale a mostrar la relación entre instancias de proceso exitosas y no exitosas con un patrón. El valor a visualizar se calcula sumando los puntajes de: Decisiones de una actividad del patrón Participantes de una actividad del patrón Valores positivos y altos serán bien vistos porque hubieron muchos más fortalecimientos que debilitamientos aunque pueden haber valores positivos y bajos pero igualmente buenos. Es el caso en el cual los patrones se clasifican poco debido a que los datos del negocio no ocurren frecuentemente. En ese caso, el patrón no se clasifica seguido y por lo tanto no se harán muchos fortalecimientos. Sin embargo, a pesar de que el valor de fortalecimientos puede ser mas bajo que con otros patrones, puede ser muy bueno para el patrón que se clasifica poco. Visualización en aplicación workflow cliente Esta técnica consiste en visualizar la decisión óptima en la propia aplicación workflow cliente. Es decir, se podría enmarcar con negrita el botón correspondiente a la decisión que se sugiere. Para esto es necesario interactuar nuevamente con la interfaz 2 de workflow y con la interfaz de patrones. La ilustración 5 muestra un ejemplo de dicha visualización. Ilustración 5 Visualización en aplicación Workflow Cliente 3. PROTOTIPO El prototipo se construyó de manera de validar los conceptos del modelo teórico. Las técnicas implementadas en el mismo fueron las trazas de colores, mapa de conocimiento de los participantes y retroalimentación visual (fortalecimientos) Se usó Enhydra Shark y Enhydra JaWE. Shark es un motor de workflow open source que cumple bastante bien con las interfaces de la WfMC. JaWE es un editor de procesos de workflow totalmente compatible con XPDL y el cual es también open source. El lenguaje utilizado fue JAVA, el mismo utilizado en Shark y JaWE. También se utilizaron librerías de visualización para poder dibujar las trazas de colores y las gráficas de torta JGraph y 5
JFreeChart. Algunas otras características son: Colores y posiciones de las actividades exactamente iguales que en JaWE Distintos tonos de colores de las flechas. Parametrizable Visualización de fortalecimientos y número del patrón de sugerencias En la ilustración 6 se presenta un esquema de los componentes del prototipo. Como se ve en la figura anterior, se crean o se extraen patrones y luego esos patrones son enviados al módulo de visualización. Además se le pasa la actividad actual. Con toda esta información se visualizan decisiones y participantes idóneos y fortalecimientos. Ilustración 6 Componentes del prototipo Para ello es necesario interactuar en gran medida con la interfaz 1 XPDL del motor de workflow. Además se interactúa con las librerías gráficas JGraph (para dibujar grafos) y JFreeChart (para dibujar gráficas de torta). Imágenes del prototipo A continuación se muestran algunas imágenes del prototipo, puntualmente la visualización de las sugerencias. Cuando el sistema empieza desde cero, aún no se tiene conocimiento, por lo que no se sugiere nada. La ilustración 7 muestra dicha situación. Cuando ocurre más de una instancia de proceso, y los patrones fueron balanceados, se puede ver una imagen como la de la ilustración 8. Se puede ver debajo de cada ventana, la relación entre fortalecimientos y debilitamientos y el número de patrón que se usó para las sugerencias, para permitir si así se desea la lectura manual del patrón en formato XML. Además, puede haber distintos tonos de colores como se muestra en las ilustraciones 9 y 10. Ilustración 7 Sistema inicialmente Ilustración 8 Visualización de una decisión óptima Ilustración 9 Color amarillo en las trazas. Por último, el prototipo permite ver los participantes ideales en cada etapa (ilustración 11). Ilustración 10 Distintos tonos verdes en las trazas 6
Ilustración 11 Participantes ideales 4. CONCLUSIONES Todas las técnicas de visualización apoyan a la gestión del conocimiento del workflow, se recomienda el uso de la mayor cantidad de ellas. De las visualizaciones de decisiones, la de mejor internalización es la de trazas de colores ya que está contextualizada en el proceso de workflow. Con la mayoría de las visualizaciones propuestas se logró un modelo de gestión de conocimiento y workflow integrado con componentes de otros miembros del equipo de investigación. Sin embargo, hay otras visualizaciones propuestas como por ejemplo las técnicas de visualización de datamining aplicadas a workflow que no dependen de estos componentes externos. Dichas técnicas son más adecuadas para analistas y no tanto para usuarios finales ya que muestran un conjunto de reglas pero no la regla a elegir. Por último, también se construyó un prototipo que validó y verificó el modelo propuesto. 5. TRABAJOS FUTUROS Se plantean los siguientes trabajos futuros con enfoque en visualización: Desarrollar la técnica de visualización de datamining aplicada a workflow con una herramienta de visualización que se estime conveniente y que permita dibujar polígonos Desarrollar la técnica de visualización del porcentaje de uso de las sugerencias con alguna herramienta que permita dibujar relojes (semicírculos con los porcentajes) Desarrollar la visualización en la aplicación workflow cliente Además, se propone estudiar otros posibles motores de workflow que permitan realizar visualizaciones muy difíciles o imposibles de realizar con el motor usado en este trabajo. Es el caso de la visualización en la aplicación workflow cliente y la visualización de datamining aplicada a workflow. El motor usado no permite definir botones en la aplicación cliente y en cuánto a la visualización de datamining, Enhydra Shark no implementa completamente la interfaz 5 de workflow. Por último, se propone profundizar en estudios de datamining aplicado a workflow y en tecnologías de inteligencia artificial que se puedan aplicar a workflow para apoyar a la gestión del conocimiento. Es decir, el modelo se basó en la tecnología CBR, sin embargo hay muchas otras técnicas y algoritmos de inteligencia artificial. 6. REFERENCIAS 1. Domingo Valhondo. Gestión del conocimiento. Del mito a la realidad. 2003 2. Eppler. Making Knowledge visible through Intranet Knowledge Maps: Concepts, Elements, Cases. IEEE Computer Society. 2001 7
3. Charles Plesums. Introduction to Workflow. Workflow handbook 2002. 4. Rob Allen. Workflow, an introduction. Workflow handbook 2001. 5. Workflow Management Coalition. The Workflow Reference Model Document Number TC00-1003 Version 1.1 Año 1995 6. Workflow Management Coalition. Workflow Process Definition Interface. XML Process Definition Language - Document Number TC-1025 - Version 1.0 Año 2002 7. Workflow Handbook 2002 8. Workflow Handbook 2003 9. J. Leon Zhao. Knowledge Management and Organizational Learning in Workflow Systems. Department of Information and Systems Management. Hong Kong University of Science and Technology. 1999. 10. Dr. Marvin L. Manheim. J.L. Kellogg Graduate School of Management, Northwestern University. BEYOND GROUPWARE AND WORKFLOW The theory of cognitive informatics and its implications for a people-based enterprise information architecture. 1998 11. Beate List, Josef Schiefer, Robert M. Bruckner. Measuring Knowledge with Workflow Management Systems. IEEE Computer Society. 2001 12. Ferreira de Oliveira, Levkowitz. From Visual Data Exploration to Visual Data Mining: A Survey. IEEE Computer society. 2003 13. Davenport, Thomas y Prusak, Laurence. Conocimiento en acción. 2001 14. Ikujiro Nonaka, Hirotaka Takeuchi. La organización creadora de conocimiento. Como las compañías japonesas crean la dinámica de la innovación. 1995 15. Juan J. Moreno, Luis Joyanes Aguilar. Gestión del conocimiento en la automatización de procesos de negocios. 16. Universidad Pontifica de Salamanca. Universidad Católica del Uruguay. 2003 17. J. Han, N. Cercone. RuleViz: A model for visualizing knowledge discovery process. ACM digital library. 2000 18. Uwe M. Borghoff. Information Technology for Knowledge Management pag. 46-47, 1998 19. Guillermo Aldaz. Algoritmos de extracción de conocimiento para procesos automatizados. Universidad Católica del Uruguay. 2004 20. Diego Soler. Representación del conocimiento extraído de instancias de proceso de workflow. Universidad Católica del Uruguay. 2004 21. www.e-workflow.org (Visitado en Noviembre 2004) 22. www.wfmc.org (Visitado en Noviembre 2004) 23. www.ictnet.es/ictnet/cv/comunidad.jsp?area=tecinf&cv=workflow (Visitado en Noviembre 2004) 24. www.waria.com/ (Visitado en Noviembre 2004) 25. http://shark.objectweb.org/ (Visitado en Noviembre 2004) 26. http://jawe.objectweb.org/ (Visitado en Noviembre 2004) 27. http://www.jgraph.com/ (Visitado en Noviembre 2004) 28. http://www.jfree.org/jfreechart/ (Visitado en Noviembre 2004) 8