METODOLOGÍA PARA ORGANIZAR, RECUPERAR Y COMPARTIR RECURSOS DE INFORMACIÓN Y CONOCIMIENTO EN UN CENTRO I+D+I EN LA PLATAFORMA SURICATA Marrero, S.R; Nelson, J.C; Galán, M; Ocón, A.; Rubio, E. sonia@cicei.com; jnelson@cicei.com; mgalan@cicei.com; ocon@cicei.com; rubio@cicei.com CICEI (Centro de Innovación en las Tecnologías de la Información). ULPGC RESUMEN: Los trabajadores de un centro I+D+i se encaran al reto de recuperar, indexar y transformar la información de grandes y heterogéneas bases de datos desorganizadas. Presentamos un prototipo que resuelve el problema con un diseño basado en el marco conceptual de una arquitectura de información dentro de la plataforma Suricata. La metodología utilizada se encuentra integrada dentro de una estrategia de gestión del conocimiento orientada a los procesos. En esta plataforma no consideraremos el contenido de los documentos sino una capa de metainformación. Las tecnologías que usamos integran sistemas multiagentes y ontologías como lenguaje controlado PALABRAS CLAVE: Gestión del conocimiento orientada a procesos, Metadatos, Ontologías, Suricata. 1. INTRODUCCIÓN En la nueva sociedad del conocimiento una organización sólo será sostenible si incorpora estrategias de productividad e innovación que mejore su eficiencia y creatividad. Con estas estrategias podrá conseguir un conocimiento diferencial que la haga fuerte frente a sus competidores. Contando con que en los últimos años las fuentes de información que han surgido son de una magnitud insospechada, los empleados de los centros de I+D+i deben afrontar el reto de recuperar, indexar y transformar la cada vez más creciente y cambiante cantidad de información. Un sistema de búsqueda y recuperación de la información eficiente no tiene por qué estar determinado por el tamaño de su base de datos, ya que ésta suele estar integrada por documentos heterogéneos, donde la información disponible puede estar formada por documentos que no tienen una estructura común, expresados en lenguaje natural y sin semántica, en la mayoría de los casos. Además, otro problema que se puede dar dentro de las bases de datos es la de encontrar documentos en el momento en que se necesitan, cosa que muchas veces no es una tarea sencilla puesto que la información está clasificada sin criterio. Los centros de I+D+i poseen como activo fundamental el conocimiento de sus miembros, que puede ser realmente grande y complejo. Es necesario explotarlo para proporcionar a sus miembros (trabajadores del conocimiento) una mejora de la productividad tanto a nivel personal como a nivel corporativo. Para ello, estas personas han de disponer de herramientas que les permitan manejar los recursos de información y conocimiento de manera más eficiente y efectiva, resolviendo la falta de tiempo y recursos en estos entornos. A fin de lograr esos objetivos nuestro grupo de investigación ha desarrollado un modelo, modelo Suricata, que se materializa en un producto, aun en construcción, Plataforma Suricata. A continuación se hará una breve descripción del modelo y sus características, profundizando sobre todo en dos de sus pilares que son el fundamento del prototipo realizado y que intenta demostrar la efectividad del modelo.
2. SURICATA El centro de I+D+i CICEI de la Universidad de Las Palmas de Gran Canaria ha desarrollado el modelo Suricata (6), implementándolo en un entorno de trabajo en colaboración llamado Idesktop. La materialización de los conceptos que suponen el modelo en la plataforma de trabajo, es lo que llamamos plataforma Suricata. El objetivo del modelo consiste en desarrollar métodos y herramientas de apoyo a los trabajadores del conocimiento, en su vertiente personal y corporativa, que les permita aumentar su productividad y capacidad de innovación, en el contexto de una estrategia global de gestión del conocimiento orientada a procesos 2.1 Descripción de Suricata La arquitectura de la información que pensamos que proporciona estos requerimientos está compuesta por la superposición de capas, tal como se muestra en la Figura 1 y se describe a continuación: Una capa, más básica que soporta al resto, donde se encuentran todas las infraestructuras de hardware, software y comunicaciones con una filosofía Open Source. A partir de ella se conseguirá los soportes con los que trabajar a continuación. La siguiente capa ha de contener la memoria corporativa, es decir la base de conocimiento de la organización y el soporte de su conocimiento. Figura 1. Modelo Suricata La gestión de la misma es esencial en este punto debido a que cualquier usuario debe tener muy fácil la creación, edición, publicación y búsqueda de cualquier documento a partir de su portal. En este sentido, nos planteamos una gestión del conocimiento orientada a procesos (pkm) para la extracción de los mismos y un sistema basado en una tecnología multi-agente con el objetivo principal de facilitar la recuperación y evaluación de conocimiento personal y corporativo a nivel interno y externo, de esta manera cada uno recibirá justo lo que necesita, en el momento en que lo necesite. Es en esta capa donde el mantenimiento de las ontologías es clave. Para llevar a cabo una adecuada gestión del conocimiento, y ya desde el punto de vista del individuo, debe existir una capa que permita la colaboración entre todos los miembros, permitiendo compartir y, en definitiva, mejorar el conocimiento de todos. Como consecuencia de lo anterior se deben perfeccionar, y nuestra arquitectura ha de tener el soporte para la creación de comunidades virtuales que permitan la transacción de conocimientos y no sólo la transmisión de los mismos entre diferentes usuarios con un objetivo común. La nueva economía del conocimiento impone nuevas habilidades y aptitudes que participan en el proceso de creación del conocimiento. Aparece así un nuevo concepto de aprendizaje en función de cada persona, se percibe la necesidad de un aprendizaje permanente para mantener la posición que se posee y aparecen nuevos perfiles profesionales. Con esta capa logramos un modelo web para aprender en la organización, de manera que el aprendizaje forme parte de la vida laboral diaria. Estas y otras herramientas de comunicación estarán a disposición de los usuarios por medio de un portal (portal del trabajador del conocimiento), personalizado, para que pueda interactuar con todas las capas de la arquitectura de un modo transparente y fácil, y que soporta tanto su vertiente personal como corporativa.
3. METODOLOGÍA PARA GESTIÓN DOCUMENTAL A PARTIR DEL PKM Tal como se dijo al principio, este artículo quiere mostrar la forma en que a partir de una estrategia de gestión del conocimiento orientada a los procesos (3) se puede obtener información esencial para el desarrollo de las estrategias globales de productividad e innovación de la organización. Esta información esencial se puede materializar (5), en el contenido necesario de la base de conocimiento, las fuentes de información externas, las comunidades virtuales, los indicadores de calidad, la configuración de la base de procedimientos, los perfiles de los miembros y las ontologías necesarias para recuperar, indexar y transformar la cada vez más creciente y cambiante cantidad de información. Figura 2. Metodología para la creación y mantenimiento de la base de procedimientos según una estrategia de gestión del conocimiento orientada a los procesos La metodología a seguir se concreta (ver figura 2) en el estudio de los procesos de cada individuo mediante una aproximación de la metodología CommonKADS (7), utilizando para ello los modelos implicados en el análisis del contexto: modelo de la organización, modelo de las tareas y modelo de los agentes. A partir de este análisis inicial, se llevará a cabo un rediseño de los procesos considerando estrategias de productividad, innovación, gestión del conocimiento orientada a procesos (pkm), gestión de la calidad total (TQM) y estrategias de especialización y coordinación (4). Así se obtendrán la base de procedimientos, disponibles para todos, en cualquier momento, que tras su análisis permitirá el diseño del portal del k-worker, en su vertiente personal y corporativa. Pensamos que un individuo, ante cualquier necesidad (duda, problema, etc.) debe acudir a esta base de procedimientos para obtener la respuesta, pero también puede buscar el consejo de expertos por medio de las redes sociales de comunicación, e incluso proponer una forma de solución, aportando su propia visión. De cualquier manera, esa pregunta ha de obtener una respuesta que, tras un control para su verificación, integrará igualmente la base de procedimientos, actualizándola en el tiempo. En los modelos de recuperación de información tradicional el contenido de los documentos se tratan por medio de técnicas de significado basadas en vectores generalizados. En la plataforma Suricata no se consideran los contenidos de los documentos sino que se construye una capa de meta-información. De esa manera los documentos usarán las meta-etiquetas dentro del conjunto de la meta-información. Nosotros usamos las plantillas de Metadatos proporcionadas por Dublín Core, de acuerdo con el estándar ISO, y los RSS y RDF, de acuerdo con la recomendación de W3C. En la figura 3 muestra un ejemplo de esta capa de meta-información a un proyecto de fin de carrera, en la que se han incluido algunos metadatos. Figura 3. Capa de meta-información
En el desarrollo de los sistemas de información, para la recuperación de los datos dentro de las bases de datos heterogéneas, tales como la memoria corporativa o los documentos que se generan normalmente en las actividades de nuestro centro, otra característica, básica para la gestión de los documentos, es tener un lenguaje controlado por medio de una ontología. Ésta define los términos básicos y las relaciones dentro de un vocabulario de un área concreta, así como las reglas de combinación de términos y sus relaciones de inferencia. La ontología permite catalogar los contenidos de la memoria corporativa, los documentos generados y la asignación semántica de atributos para la representación de varios elementos de información. Por ello, nosotros hemos creado una ontología de dominio específico para proporcionar el vocabulario de conceptos necesarios dentro del dominio de un Centro de I+D+i y sus relaciones en función de las actividades de dicho dominio. Usando la Web Semántica (2) como modelo que incluye documentos o partes de documentos, describiendo relaciones explicitas entre entidades e información semántica enfocadas al procesamiento automático por máquinas, podemos usar agentes inteligentes (8) que conduzcan a la extracción de conocimiento en lugar de una simple recuperación de información. Los agentes se implementan en el lenguaje Java usando una plataforma de sistemas multiagentes tal como JADE (Java Agent DEvelopment Framework) que cumple las especificaciones FIPA. Las ontologías a desarrollar se clasifican (1) en ontologías de dominio y ontologías de aplicación Se desarrollaran varias ontologías, entre ellas las de dominio que se usaran como vocabularios sobre los conceptos dentro del Centro I+D+i y las relaciones referentes a las actividades que tienen lugar en el mismo. Por otro lado, las ontologías de aplicación describen el vocabulario relacionado con una tarea o actividad. El uso que haremos de ellas es doble, uno es la anotación semántica de los documentos y la otra finalidad es el intercambio de las mismas entre los agentes para extraer conocimiento. 4. EJEMPLO DESARROLLADO Para justificar el método mostramos en este apartado el desarrollo de un ejemplo concreto que afecta a muchos de los miembros del CICEI. Se trata de la ontología de dominio que proporciona el procedimiento de Dirección de Proyectos de Fin de Carrera. Este procedimiento ha sido escogido entre otros porque, si bien es uno de los más utilizados, cada uno lo hacía siguiendo un criterio propio. El estudio de los procesos de cada individuo se realizará utilizando los mapas conceptuales (Figura 4) y una aproximación de la metodología CommonKads. A partir de este análisis inicial, se estará en disposición de realizar un rediseño del mismo. Es el momento de considerar las estrategias globales de la organización. Así se obtendrán los procesos orientados a la gestión del conocimiento que se instalarán dentro de la base de procedimientos, disponibles para todos, en cualquier momento. Figura 4. Mapa Conceptual de Dirección de PFC Pensamos que un individuo, ante cualquier necesidad (duda, problema, etc.) debe acudir a esta base de procedimientos para obtener la respuesta, pero también puede buscar el consejo de expertos por medio de las redes sociales de comunicación, e incluso proponer una forma de solución, aportando su propia visión. De cualquier manera, esa pregunta ha de obtener una respuesta que, tras un control para su verificación, integrará igualmente la base de procedimientos, actualizándola en el tiempo. Con toda esta información obtenemos las clases y subclases utilizadas, determinando sus atributos y relaciones que nos permite, utilizando Protege (versión 3.0), conseguir la ontología que estamos buscamos.
Así pues, el procedimiento Dirección de los Proyectos de Fin de Carrera (PFC) se descompone en procesos más sencillos que integran actividades o tareas. Dentro de la Dirección de PFC podemos distinguir tres procesos principales: El proceso de Inicio del PFC, supone las tareas de la aceptación de proyecto por parte de la Dirección del Centro y la asignación del proyecto a un alumno concreto. Para llevar a cabo esta actividad, el sistema mantiene relaciones con el alumno, con otros tutor/es, con la dirección del centro, con las páginas amarillas, con las fuentes documentales externas, con la base de conocimiento interna, con las comunidades de afines, con las comunidades de expertos, con la página web del centro y con el agente para las búsquedas con sentido. El proceso de Desarrollo del PFC, supone todas las actividades de realización del proyecto y mantiene las mismas relaciones con el exterior que el proceso de inicio y además consulta con el agente para la identificación de los alumnos. El proceso de Finalización del PFC, supone la aceptación de la defensa y evaluación del proyecto. Sólo se relaciona con el alumno, con los otros tutor/es, con la página web del centro y con la dirección del mismo. A lo largo de la vida del proyecto se va generando una documentación que llamaremos Documentación PFC y que contiene: un Calendario compartido, la Documentación administrativa (Formularios, respuestas de la Comisión, Acta de la lectura), Documentos utilizados-(documentos específicos del tema del proyecto, documentos tecnológicos y documentos metodológicos), Versiones del PFC, Actas de las reuniones, Presentación de la Defensa PFC y el Expediente del alumno. Por medio de las relaciones y la documentación generada creamos la ontología de dominio del proyecto de fin de carrera (Figura 5) que nos servirá para que los agentes inteligentes puedan realizar sus tareas. Figura 5. Ontología para la Dirección de PFC 5. CONCLUSIONES Así pues, las ontologías, y ésta diseñada especialmente, nos permiten, además de las búsquedas y organización de los documentos con sentido, alcanzar los siguientes puntos: Compartir estructuras de información de forma que las entiendan las personas y los agentes software (términos comunes para personas diferentes) La reutilización del dominio del conocimiento ( a partir de diferentes ontologías especificas se crea una ontología mayor) Usar conocimiento en una aplicación, así como que múltiples máquinas compartan su conocimiento Entender a todos los miembros de la organización un área de conocimiento determinada REFERENCIAS 1. Gómez-Pérez, at al. 2004. Ontological Engineering.Springer. 2. Hendler, J. 2001. Agents and the Semantic Web IEEE Intelligent Systems. Vol. March-April. 3. Maier R, Remus U. 2002. Defining process-oriented knowledge management strategies. Knowledge and Process Management, Vol 9, Nº 2, pp 103 118 4. Malone,T; Crowston, K y Herman, G, 2003. Organizing Business knowledge. The MIT Process Handbook, Massachusetts Institute of Technology. USA
5. Marrero, S; Ocón, A; Galán, M; Rubio, E, 2005. Methodology for the generation and maintenance of a base of procedures in process-oriented knowledge management strategy. Eunis 6. Rubio, E., at al. 2004. A personal an corporative process-oriented knowledge manager: suricata model. Eunis 7. Schreiber, G. et al, 1999. Knowledge Engineering and Management. The CommonKADS Methodology. Massachusetts Institute of Technology. USA 8. Wooldridge, M. 2001. An introduction to MultiAgent Systems. Wiley.