EVALUACIÓN DE LA CALIDAD DE DATOS USANDO ONTOLOGÍAS EVALUATION DATA QUALITY USING ONTOLOGIES

Tamaño: px
Comenzar la demostración a partir de la página:

Download "EVALUACIÓN DE LA CALIDAD DE DATOS USANDO ONTOLOGÍAS EVALUATION DATA QUALITY USING ONTOLOGIES"

Transcripción

1 EVALUACIÓN DE LA CALIDAD DE DATOS USANDO ONTOLOGÍAS EVALUATION DATA QUALITY USING ONTOLOGIES Rosa Gajardo Abarza Regina Motz Angélica Urrutia Facultad de Ingeniería Facultad de Ingeniería Facultad de Ingeniería Universidad Católica del Maule Universidad de la República Universidad Católica del Maule Chile Uruguay Chile RESUMEN La integración de datos permite ampliar el escenario sobre el cuál tomar decisiones, sin embargo un aspecto crítico que posee es determinar el nivel de calidad de los datos fuentes. Resulta en este sentido relevante contar con un mecanismo automático para medir el nivel de calidad de la fuente de datos, donde el nivel de calidad depende de la cantidad de datos con anomalías técnicas que existan. En este artículo se presenta un trabajo para proveer un proceso de determinación automática de datos anómalos. Se propone desarrollar un proceso flexible, independiente del dominio de aplicación y con una especificación declarativa, basado en el uso de ontologías de dominio y ontologías de métricas. Se describe el uso de estas ontologías y las métricas a utilizar. Palabras clave: Calidad de Datos, Ontologías, Métricas de Calidad. ABSTRACT Data integration allows to extend the scenario upon which to make decisions, a critical aspect is to determine the quality of the source data. Inportant is to have an automatic mechanism to measure quality of the data source, where levels of quality depends on the amount of data with technical anomalies. This paper presents the work developed automatic to provide determination of data anomalies. Aims to develop a flexible process, separate application domain and with declarative specification this proposal is based on the use of domain ontology and ontology of process metrics. This work shows the use of such ontologies and describes the proposed metrics. Keywords: Data Quality, Ontology, Quality Metrics. INTRODUCCIÓN Las bases de datos fuente presentan, generalmente, un conjunto de anomalías las que son detectadas cuando se realizan procesos de migración, integración o ETL, entre otros. Entiéndase por ETL a la extracción, transformación y/o carga de datos desde fuentes heterogéneas a un DataWarehouse [12]. Un data Warehouse es un conjunto de datos orientados por temas y que dan soporte a la toma de decisiones [13]. Es frecuente que el proceso de toma de decisiones se vea retrasado para limpiar anomalías de los datos fuente. Este trabajo propone monitorear el nivel de calidad de las bases de datos y aplicar metodologías de detección automática de datos con errores, para proceder a su posterior limpieza. La calidad de los datos, es uno de los problemas más difíciles de resolver. Pyle en [1] hace una estimación aproximada del subproceso de preparación de los datos que puede tomar hasta un 90% del tiempo y dinero disponible para el proceso completo de descubrimiento del conocimiento. Resulta en este sentido relevante contar con una medida del nivel de calidad de la fuente de datos que sea posible de obtener de forma automática. Redman en [22] evalúa el impacto de la pobre calidad de los datos en las organizaciones y que a menos que las empresas hagan esfuerzos extraordinarios, se esperará una tasa de error aproximada de un 1-5%. La pobre calidad de los datos tiene efectos adversos en los niveles operacionales, estratégicos y tácticos de la organización. Friedman en [23] declara que la calidad deficiente de los datos fuente ocasiona malas estrategias en las decisiones comerciales. La calidad de los datos debe ser vista como un problema del negocio, no como un problema de los encargados de las Tecnologías de la Información. A partir de estos autores, es claro que es necesario contar con herramientas que permitan evaluar el estado de los datos fuente. Si un dato es correcto o incorrecto depende de lo que los expertos en la organización definan y debe ser considerado en el criterio de evaluación. Para ello esta investigación utiliza métricas de calidad que midan el estado de ellos. Según Piattinni, García, Garzás, y Genero en [2]: Las métricas de software constituyen la base necesaria para llevar a cabo un proceso de evaluación y posteriormente, una mejora de los procesos de software, por esto evaluada la calidad de los datos y si es necesario, se debe establecer un proceso de mejora de ellos, para propender a contar con datos de calidad.

2 El nivel de calidad de la fuente de datos depende de la cantidad de datos con anomalías técnicas que se tenga. En este artículo se centra en el desarrollo que permita proveer un proceso de determinación automática de datos anómalos. Estableciendo el desarrollo de un proceso flexible, independiente del dominio de aplicación y con una especificación declarativa. La propuesta se basa en el uso de ontologías de dominio y ontologías de métricas para la detección de datos anómalos. La siguiente sección presenta la literatura revisada, luego se encuentra las anomalías técnicas y típicas que pueden ocurrir con los datos, esto es, problemas de Unicidad, Existencia y Consistencia. Seguidamente se ilustra el proceso de detección de anomalías utilizando las ontologías de dominio y de métricas. Finalmente se tiene algunas conclusiones y trabajos futuros. TRABAJOS RELACIONADOS Algunos trabajos muestran que se puede usar herramientas de la web semántica y ontologías para el análisis de la calidad de los datos, a continuación se discuten algunos de ellos: Wang, Hamilton y Bither en [4] describen un enfoque basado en ontologías para la limpieza de datos. Los autores definen la limpieza de datos como el proceso de detectar y corregir errores en bases de datos. Utilizan la ontología para clasificar los tipos de errores sintácticos y algunos semánticos, como errores tipográficos y de valores en códigos postales de ciudades. La ontología que utilizan es una ontología de dominio donde definen una clase por cada tipo de error y otra por cada tipo de valor válido por atributo posible. En un trabajo más reciente, Zhu, Chen y Quach en [5] generan un marco de trabajo haciendo uso de la semántica, para asegurar la calidad de los datos en los registros médicos. A través de una ontología, muestran que los modelos semánticos son más explícitos que los algoritmos para generar reglas de validación y proponen la utilización de reglas SWRL (Semantic Web Rule Language, que es la especificación de un lenguaje formal de reglas lógicas [14]) para controlar la completitud y la consistencia de datos. Füber y Heep en [8] desarrollan consultas SPARQL (lenguaje de consultas para RDF que es la estructura para representar información en la web [15][16]) genéricas para identificar problemas de valores ilegales en los datos. Tales como: valores fuera de rangos, con errores de sintaxis o ausencia de ellos, problemas con violaciones de dependencias funcionales y problemas de violación a la unicidad. Argumentan que el uso de conjuntos de datos de la Web Semántica reduce sustancialmente el esfuerzo para la gestión de calidad de los datos. Como un caso de uso emplean Nombres geográficos tomados de DBpedia, un recurso a disposición del público de la Web Semántica, como una referencia de confianza para la gestión de la calidad de otras fuentes de datos. Del análisis de los diferentes trabajos revisados, surge una clara tendencia a la utilización de Ontologías de Dominio para describir la sintaxis y la semántica válida de los datos. Dependiendo de los modelos, métodos o enfoques utilizados para dotar de semántica a los términos, puede alcanzarse diferentes niveles semánticos, es así que se tiene cuatro tipos básicos de construcciones abstractas para representar la semántica: vocabularios controlados, un conjunto de términos acotado referidos a un dominio de conocimiento donde la comunicación se establece utilizando este conjunto de términos; taxonomías, que agregan a lo anterior estructura y relaciones jerárquicas entre los términos, relaciones del tipo padre-hijo; tesauros que escalan un nivel más en el aporte semántico, permitiendo relaciones más complejas (equivalencia entre términos), homográfica (igual símbolo pero distinto significado) y asociativa (relativo a); finalmente las ontologías alcanzan el máximo nivel de abstracción, incorporando relaciones lógicas complejas entre los términos. Por definición Gruber en [10] expresa que una Ontología es una especificación formal y explícita de una conceptualización compartida. Conceptualización se refiere a una forma de entender y describir un dominio de conocimiento, compartida porque es consensuada por el conjunto de interesados relevantes en ese dominio, explícita porque está descrita en un lenguaje y formal, porque el lenguaje es comprensible por un computador. Se tiene, entonces, una forma de describir el significado de los entes de un dominio, entendible por un computador, precisamente lo que se necesita para dotar de semántica a la descripción de los datos. Por otro lado, el problema de especificar la calidad de datos, ha sido trabajado desde hace tiempo por numerosos autores. Una primera clasificación de las dimensiones de calidad es presentada por Strong, Lee y Wang en [6], donde las clasifican respecto a su importancia para el usuario en: relevancia, exactitud, accesibilidad, unicidad, consistencia, frescura y credibilidad. Otras definiciones expresadas en taxonomías organizadas por niveles de granularidad de ocurrencia son presentadas por Oliveira, Rodríguez y Enriques en [7]. Estas definiciones más rigurosas que las definiciones textuales utilizadas en otros trabajos, son útiles para el desarrollo de una herramienta de calidad de datos que detecte automáticamente los problemas identificados. Un trabajo más reciente de Zaveri, Rula, Maurino, Pietrobon, Lehmann, Auer y Hitzler en [9] presenta un relevamiento del estado del arte en la detección de anomalías en datos publicados como Linked Data y provee una clasificación de errores según

3 los que pueden ser reparados de forma automática, semiautomática o de forma manual. Del análisis de estos trabajos se encuentra que la tipología de los problemas de calidad de datos puede analizarse desde diversos puntos de vista. En esta investigación interesa la detección automática de los problemas técnicos que disminuyen la calidad de datos en sus dimensiones de: Unicidad, Existencia y Consistencia, por ser ellas las dimensiones que son mayoritariamente mencionadas en la literatura revisada. Parafraseando a Tom De Marco [11]: No se puede controlar lo que no se puede medir, interesa especialmente tener un modelo que permita definir métricas sobre los niveles de calidad de los datos. En la siguiente sección se presenta algunas métricas para las dimensiones de Unicidad, Existencia y Consistencia. Para que estas métricas sean especificadas de forma declarativa se propone trabajar con una Ontología de Dimensiones de Calidad que las modele. ONTOLOGÍA DE DIMENSIONES DE CALIDAD Se estudian tres dimensiones de calidad: Existencia, Unicidad, y Consistencia de Dominio. Dimensión de Calidad Existencia. Para que una instancia cumpla con la dimensión de calidad existencia, debe tener valores no nulos en todos los atributos definidos como relevantes para esta dimensión en el dominio. En el caso un esquema pacientes, se definieron como atributos relevantes de la instancia: Nombre, Fecha de Nacimiento y Sexo, lo que significa que son consideradas instancias anómalas aquellas que tienen valor nulo, en alguno de estos tres atributos. Dimensión de Calidad Unicidad. Para algunos conceptos de la ontologia de dominio es necesario que se cumpla para todas sus instancias la restricción de existencia de valor sobre algún atributo y que este valor sea único en el conjunto de todas sus tuplas. Esto es lo que en base de datos se conoce como Clave Primaria, y trabajando con OWL (Ontology Web Language, utilizado para procesar contenido de información de la web haciendo uso de ontologías [17]) es definir reglas SWRL que verifiquen esta restricción. Dimensión de Calidad Consistencia de Dominio. Para que una instancia cumpla con la consistencia de dominio sobre algunos atributos, es necesario que los valores de esos atributos pertenezcan a un dominio definido. Ejemplos: el valor del atributo Sexo debe ser F o M, o la Fecha de Nacimiento no debe ser superior al día de hoy. También, trabajando con ontologías modeladas con OWL se puede definir los valores sinónimos, por ejemplo el Sexo puede ser F o M, 0 y 1, u otros valores utilizados de forma similar. Otro tipo de verificación podría ser validar que el -nombre del médico tratante corresponda a un profesional titulado MÉDICO-, para este caso alcanza con tener modelado en la ontología de dominio los profesionales médicos como una clase y así el mecanismo de razonamiento de la ontología, clasificaría a los médicos tratantes como MÉDICOS. La restricción expresada anteriormente es de tipo semántica ya que se refiere al grado en que los datos representan el mundo real. Para medir está dimensión, es necesario hacer una comparación de los datos con el mundo real que puede representarse por una referencia de confianza, llamado oráculo, considerado siempre como correcta. En el ejemplo de los pacientes atendidos por médicos, el oráculo puede ser, por ejemplo, el Colegio Médico o la nómina de médicos contratados por la institución de Salud. La ontología de dimensiones de calidad ilustrada en la Figura 1 muestra esta taxonomía de dimensiones de calidad (Existencia, Unicidad y Consistencia del dominio) y las métricas utilizadas para evaluarla el conjunto de datos. La clase métrica (Metrica) está relacionada con tres componentes básicos que modelan los principales temas a especificar respecto de las métricas: (1) la componente attrelevantes que permite especificar los atributos relevantes en los que se centra la propuesta de evaluación; (2) la componente Criterios que permite especificar los criterios aplicados en las valorizaciones que se realicen, por ejemplo: distinto de nulo, perteneciente a un dominio, etc. y (3) la componente Funciones que permite especificar cómo se llega al Resultado de la métrica describiendo la función que la calcula. En el ejemplo anteriormente usado de médico tratante, el criterio es que sea un profesional titulado Médico, mientras que la función podría ser más de una, por ejemplo: (i) está en la lista de los profesionales médicos emitida por el Colegio médico, o (ii) está en la lista de médicos contratados por la institución de salud, entre otras. La medida de la calidad de la base de datos es el resultado de la Función de la Métrica. Un indicador es una expresión cuantitativa o cualitativa que describe características, comportamientos o fenómenos de la realidad a través de la evolución de una variable, la que comparada con períodos anteriores, permite evaluar el desempeño y su evolución en el tiempo. Un indicador debe cumplir con tres características [2]: ser simple, medible, y entregar un resultado. En esta propuesta el indicador de nivel de calidad de los datos de la base de datos fuente está medido a través de las funciones que implementan las métricas utilizadas para cada una de las dimensiones consideradas (Existencia, Unicidad y Consistencia de Dominio).

4 attrelevante Criterio Funciones Existencia Aplican Tienen Tienen Métricas Ofrecen-un Unicidad Dimensiones Calidad Medidas-por Tienen peso Evaluados-por Resultado Consistencia Figura1: Ontología de dimensiones de calidad. La función generalizada para la métrica que proponemos se especifica con la fórmula siguiente (1), siendo MD métrica de dimensión I el conjunto de datos a evaluar, Count y CumpleRestricción las funciones que implementan la métrica: MD(I) = Count(I`) donde, I`= {i ϵ I / cumplerestriccion(i.attrelevante)} Count(I) También se define una métrica global, asociada a un grado de importancia por cada MD, donde su sumatoria puede tomar valores entre 0 y 1. 0 MDE(I)*ratio1+MDU(I) *ratio2+ MDCD(I) *ratio3 1 donde: ratio1+ratio2+ratio3 = 1 Se asigna una ponderación ratio a cada una de las métricas de dimensión, en este caso tres, que conforman la métrica global. La mayor o menor ponderación depende del problema y de la importancia que posee la dimensión de calidad dentro del conjunto de datos disponible. Los valores más cercanos a 1 indican mejor calidad de los datos evaluados. A partir del resultado de la métrica, el experto puede definir rangos aceptables de calidad (λ-corte) y de acuerdo a ellos, tomar la decisión de qué hacer con los datos que no cumplen con los requisitos mínimos requeridos. Una idea que puede ser útil, es el uso de una gama de valores más significativos que simplemente booleana para representar la gravedad del error. Sin embargo, la medida de la gravedad del error varía entre las diferentes situaciones dependiendo del uso que se le dará a los datos, el dominio de los intereses y los puntos de vista del usuario; por lo que es imposible establecer este rango de valores de forma genérica. Usar la ontología de dimensiones de calidad permite variar estos valores (ratios) de forma flexible. Al utilizarse una ontología llamada de dominio por ser generada a partir de los requerimientos del problema, se hace necesaria la intervención de un experto o usuario líder en la Ratio Datos (1) (2) organización para definir qué atributos se evaluarán y que ratios de relevancia se asignará a cada uno. La investigación de Lee, Y. W., Strong, D. M., Kahn, B. K., & Wang, R. Y. [24], habla sobre la importancia de los expertos y usuarios líderes en la definición de las dimensiones de calidad de los datos a considerar. A modo de ejemplo se utiliza el siguiente caso: Se tiene una pequeña porción de la base de datos, como caso práctico de la Ficha Clínica, y se define que: todas las personas deben tener un identificador y este debe ser único, siempre debe existir el nombre, y fecha de nacimiento, además el sexo debe ser F o M, de acuerdo a los atributos presentes en el caso estudio. Las instancias tienen el siguiente esquema: (Rut, Nombre, Fecha de Nacimiento, Sexo). La Tabla 1 muestra la aplicación estudio de la siguiente forma: la columna dimensión (en este caso Existencia, Unicidad y Consistencia de Dominio), la ponderacion dada por un experto según la definición (2); los atributos analizados ; y la métrica utilizada en cada caso según la definición (1). Dimensión TABLA 1. MÉTRICAS DE EVALUACIÓN DE CALIDAD DE LOS DATOS. Atributo Métrica Ponderación Nombre 0.5 Fecha Existencia Nacimien to Sexo Unicidad 0.3 Identifica dor Consistencia 0.2 Sexo Total Métrica 1 Nº instancias nombre no nulo / Nº instancias fecha nacimiento no nulo / Nº de instancias sexo no nulo / Nº de Identificadores únicos / Nº de instancias sexo validas / ONTOLOGÍA DE DOMINIO La ontología de dominio permite evaluar propiedades de tipo sintácticas y semánticas de los atributos. Propiedades sintácticas son, por ejemplo, un dato escrito de diferente forma, reconociendo cada uno de ellas como equivalentes, valores de atributos en mayúsculas y minúsculas, nombres con tilde o sin tilde, y nombres con distintas abreviaciones. Las propiedades semánticas son aquellas que reflejan restricciones del mundo real, por ejemplo que un médico no puede ser atendido como paciente por sí mismo o un

5 médico no puede atender pacientes en una institución si no está contratado por esa institución. La correctitud sintáctica de los datos se refiere a que estén libres de errores sintácticos, tales como errores de mecanografía o formato. Los datos se consideran sintácticamente correctos si cumplen reglas o restricciones definidas por el usuario. Ejemplos de reglas son: una fecha representada por el formato "dd/mm/aaaa", donde dd, mm y aaaa, son números enteros tales que 00<dd<= 31, 00<mm<13, teniendo en cuenta también el número diferente de días en función de cada mes y el año (31, 30 o 28). En este ejemplo, la corrección sintáctica verifica que la fecha sea válida, sin verificar la relación que la fecha puede tener con la realidad. Por ejemplo, que una fecha determinada es realmente la fecha de mi cumpleaños. El último tipo de corrección es lo que se llama corrección semántica. El valor de los resultados de la métrica que mide la corrección sintáctica toma valores verdadero o falso. Sin embargo, cuando las restricciones involucran valores de más de un atributo, se hace necesario escribir la restricción en SWRL, por ejemplo para verificar que la fecha de nacimiento no sea mayor a la fecha del día de hoy, la regla SWRL sería de la siguiente forma: Regla FechaNacimiento; (?x) ^ System(?y) => swrlb: GreaterThan(FechaNacimiento(?x),sysDate(?y)) Cuando (3) evalúa True, es que corresponde a una instancia anómala por causa de la restricción de Fecha de Nacimiento mayor a la fecha de hoy, en este caso la acción a ejecutarse es la de clasificar a esa instancia como una instancia de la clase Anómalas. Para identificar el tipo de anomalía, esta instancia es anotada con un metadato correspondiente al nombre de la regla que detectó su error. PROCESO DE EVALUACIÓN DE LA CALIDAD El proceso de evaluación de la calidad de datos propuesto se ilustra en la Figura 2. El proceso inicia con la carga de datos desde la base de datos fuente a la ontología de dominio (Figura 2(d)). Sobre la ontología de dominio se aplican las métricas especificadas en la Ontología de Dimensiones de Calidad (Figura 2(e)), con esto se obtiene la medida de calidad en la aplicación de la métrica (Figura 2(c)). Las instancias anómalas detectadas por violación a las restricciones especificadas en OWL (Figura 2(a)) y por violación a las reglas SWRL (Figura 2(b)), son almacenadas en un repositorio de Data (3) errónea para que posteriormente el experto limpie los datos y los corrija en la base de datos fuente. Monitoreo BASE DE DATOS FUENTE Cargar datos para la Ontología Arreglo de errores por experto (e) ONTOLOGIA de DIMENSIONES DE CALIDAD (d) ONTOLOGIA de DOMINIO (a) Clases con restriccion es OWL Instancias no validadas según Ontologías de Dimensión de calidad (c) MEDIDA DE LA CALIDAD DE LA BASE DE DATOS SEGÚN LA METRICA (b) Validación de Reglas in SWRL Data errónea Figura 2: Proceso de detección de anomalías a partir de métricas de calidad usando Ontologías. La propuesta de evaluación de los datos, considera: 1. Trabajar con una ontología del dominio. Esto permite tener conceptos ya pre-definidos de forma estándar, por ejemplo en caso del dominio ser el área Salud, en este contexto existen ya varias ontologías estándar que pueden ser re-utilizadas, por ejemplo UMLS (lenguaje de terminologías médicas) [18], ICD-10 (codificación internacional de enfermedades décima versión) [19]. 2. Definir la ontología de dimensiones de calidad. Selección de las dimensiones de calidad, las anomalías que estas involucran, y las métricas con los criterios y funciones de evaluación. A partir de estos componentes se definen las restricciones de la ontología de dominio (esto es incorporar en TBox y ABox los axiomas necesarios para detectar las anomalías), teniendo que los TBox y ABox son componentes de la lógica descriptiva. Los TBox contienen las definiciones de los roles y los ABox las definiciones de las instancias [21]. Véase Figura 2(a). 3. Cargar la ontología con instancias desde la base de datos fuente. 4. Para aquellos atributos que no se pueda verificar la calidad con OWL en las dimensiones a estudiar (en el caso estudio las dimensiones: Unicidad, Existencia y Consistencia), se generan las reglas de validación con SWRL, véase Figura 2(b). Esto quiere decir que, la ontología verifica la calidad de los datos de un esquema dado y genera la

6 validación de las dimensiones de calidad: Unicidad, Existencia y Consistencia, para este caso. 5. Usando un razonador en la ontología (por ejemplo, Pellet [20]), se detectan los datos anómalos a partir de las restricciones definidas en el TBox y el ABox de la ontología. Aplicando las reglas SWRL se detectan las anomalías correspondientes a problemas de valores no verificadas por el razonador (por ejemplo, problemas de máxima / mínima cardinalidad, entre otras.) 6. Terminado el proceso de razonamiento y de la aplicación de las reglas SWRL, se obtiene un conjunto de datos anómalos y un indicador global que mide la calidad de la base de datos fuente. La Figura 2, ilustra el proceso de detección de anomalías utilizando ontologías lo que permite una mejora continua en la calidad de los datos de la base de datos fuente. Este proceso se puede realizar en períodos predefinidos y según valores límites obtenidos con las métricas. Los valores de las métricas se ubican en un intervalo entre 0 y 1 definiendo un λ-corte de aceptación. Este modelo permite especificar en forma explícita y formal los elementos relevantes en la evaluación de calidad de los datos de un esquema y sus restricciones basado en métricas de calidad. La arquitectura definida será trabajada en la herramienta Protégé (desarrollada por la Universidad de Stanford para la creación y aplicación de Ontologías, (véase Figura 3), por ser una herramienta de uso y acceso fácil. CONCLUSIONES Y TRABAJOS FUTUROS Este trabajo presenta una propuesta en desarrollo para determinar automáticamente a través de ontologías instancias con anomalías. Se establecen, también, métricas de calidad de datos y se evalúa las instancias de la base de datos fuente requeridas para la mejora continua de la calidad. De esta forma los procesos de extracción, migración o integración, minimizan los trabajos de limpieza de datos haciéndose más eficientes. Las ontologías son una herramienta que permite evaluar las métricas de calidad de forma global, permitiendo instanciarlas, luego, para cada dominio específico, convirtiéndose así en un proceso flexible y fácilmente escalable. La importancia de incorporar, en las organizaciones, el problema de la calidad de los datos fuente. Es un tema que debe ser considerado por todas las áreas. Se debe crear un entorno de trabajo colaborativo en que el área directiva entregue los lineamientos principales de la empresa y en que el sector productivo y de tecnologías de las información desarrollen estrategias en común para lograr el objetivo que es contar con datos de calidad que soporten una buena toma de decisiones. Trabajos futuros planificados son: implementar el conjunto de reglas SWRL para detectar y limpiar los tipos de anomalías técnicas relacionadas a Unicidad, Existencia y Consistencia para el caso de estudio de Ficha Clínica de s. Ampliar el diseño de otras métricas de calidad de datos y evaluar el proceso de "ontology engineering" con verificación del experto del dominio. REFERENCIAS [1] Pyle, Dorian: Data Preparation for Data Mining, Morgan Kaufamann Publishers, Inc. San Francisco California, USA, [2] Piattini, García, Garzás y Genero. Medición y Estimación del Software. Técnicas y métodos para mejorar la calidad y la productividad, Alfaomega- Ra-Ma, Figura3: Ontología Ficha Clínica en Protégé. En el contexto del trabajo colaborativo es necesario contar con expertos de las disciplinas asociados al caso de la ontologia. Ellos deben entregar desde su experiencia la información necesaria para la creacion de los dominios y reglas. [3] Xin Wang, Howrd J. Hamilton, Yashu Bither, An Ontology Based Approach to Data Cleaning. Technical Report University Regina Canada. ISSN: , [4] Xin Wang, Howrd J. Hamilton, Yashu Bither, An Ontology Based Approach to Data Cleaning. Technical Report University Regina Canada. ISSN: , 2005.

7 [5] Zhu Lingkai, Chen Helen, Quach Kevin. A Semantic Framework for Data Quality Assurance in Medical Research, University Waterloo, Ontario, Canada, Proceedings of the 4 th Canadian Semantic Web Symposium, [6] D.M. Strong, Y.W. Lee, and R. Y. Wang, Data Quality in Context Communications of the ACM, vol.40,no.5 pp , May [7] Oliveira P., Rodrigues F., Enriques P. A Formal Definition of Data Quality Problems. International Conference on Information Quality, [8] Fürber C., Hepp M. Using Semantic Web resuorces for data Quality Management. Proceeding EKAW 10 Proceedings of the 17th international conference on Knowledge engineering and management by the massas. Springer-Verlag Berlin, Heidelberg. pp , [9] Zaveri, A., Rula, A., Maurino, A., Pietrobon, R., Lehmann, J., Auer, S., & Hitzler, P. Quality assessment methodologies for linked open data. Submitted to Semantic Web Journal, [10] Gruber, Tom R. A translation approach to portable ontologies. Knowledge Acquisition, 5(2), [11] Tom De Marco. Controlling Software Projects. Yourdon Press, [17] McGuinness, Deborah L., and Frank Van Harmelen. "OWL web ontology language overview." W3C recommendation 10.10, [18] Bodenreider, Olivier. "The unified medical language system (UMLS): integrating biomedical terminology." Nucleic acids research 32.suppl 1, D267-D270, [19] World Health Organization. "The ICD-10 classification of mental and behavioural disorders: clinical descriptions and diagnostic guidelines.", [20] Sirin, Evren, et al. "Pellet: A practical owl-dl reasoner." Web Semantics: science, services and agents on the World Wide Web 5.: 51-53, [21] Gómez-Pérez, A., and M. Fernández-López. Corcho; O. " Ontological engineering, [22] Redman, T. C. The impact of poor data quality on the typical enterprise.communications of the ACM, 41(2), , [23] Friedman, T. A Strategic Approach to Improving Data Quality. Gartner, June, 19, [24] Lee, Y. W., Strong, D. M., Kahn, B. K., & Wang, R. Y. IMQ: a methodology for information quality assessment. Information & management,40(2), , [12] E, L. Muñoz, J. N. Mazón and J. Trujillo, ETL Process Modeling Conceptual for Data Warehouses: A Systematic Mapping Study, IEEE LatinAmerica Transactions, Vol. 9, No. 3, June [13] Inmon, William H.; Hachathorrn, Richard D. Using the data warehouse. Wiley-QED Publishing, [14] Bailey, James, et al. "Web and semantic web query languages: A survey."proceedings of the First international conference on Reasoning Web. Springer-Verlag, [15] Prud Hommeaux, Eric, and Andy Seaborne. "SPARQL query language for RDF." W3C recommendation 15, [16] Klyne, Graham, and Jeremy J. Carroll. "Resource description framework (RDF): Concepts and abstract syntax.", 2006.

Búsqueda sobre catálogos basada en ontologías

Búsqueda sobre catálogos basada en ontologías Búsqueda sobre catálogos basada en ontologías Alianis Pérez Sosa, Yuniel Eliades Proenza Arias Universidad de las Ciencias Informáticas. Carretera a San Antonio Km 2 ½, Reparto Torrens, La Lisa, Ciudad

Más detalles

Ontología para Criterios de Clasificación

Ontología para Criterios de Clasificación Ontología para Criterios de Clasificación Mónica Martínez 1, Regina Motz 1 1 Instituto de Computación Universidad de la República(UdelaR) Montevideo Uruguay {mmartine,rmotz}@fing.edu.uy Abstract. Almost

Más detalles

PERFIL INTELIGENTE DE ONTOLOGÍAS PARA LA RECUPERACIÓN DE INFORMACIÓN. NORMA

PERFIL INTELIGENTE DE ONTOLOGÍAS PARA LA RECUPERACIÓN DE INFORMACIÓN. NORMA 155 PERFIL INTELIGENTE DE ONTOLOGÍAS PARA LA RECUPERACIÓN DE INFORMACIÓN. NORMA Antonio Martín, Sonsoles Celestino, Adela Valdenebro, Julia Mensaque. Biblioteca Universidad de Sevilla, España, toni@us.es

Más detalles

DBOWL: Persistencia y Escalabilidad de Consultas y Razonamientos en la Web Semántica

DBOWL: Persistencia y Escalabilidad de Consultas y Razonamientos en la Web Semántica DBOWL: Persistencia y Escalabilidad de Consultas y Razonamientos en la Web Semántica Maria del Mar Roldán-García, Jose F. Aldana-Montes Universidad de Málaga, Departamento de Lenguajes y Ciencias de la

Más detalles

Anotación de contenidos Web

Anotación de contenidos Web Anotación de contenidos Web Distintos tipos de anotación según el vocabulario utilizado Basada en Dublin Core The contributor and creator is the flight booking service www.flightbookings.com. The date

Más detalles

Organizaciones Virtuales e Integración de Información. José Abásolo Prieto

Organizaciones Virtuales e Integración de Información. José Abásolo Prieto Organizaciones Virtuales e Integración de Información José Abásolo Prieto Universidad de los Andes Objetivo de la charla Mostrar que aunque la problemática de integración de información distribuida y heterogénea

Más detalles

CAMINO HACIA LA WEB SEMÁNTICA. Jorge Alejandro Castillo Morales Universidad de Edimburgo

CAMINO HACIA LA WEB SEMÁNTICA. Jorge Alejandro Castillo Morales Universidad de Edimburgo INVESTIGACIÓN & DESARROLLO, No 5: 115 120 (2005) ISSN 1814-6333 RESUMEN CAMINO HACIA LA WEB SEMÁNTICA Jorge Alejandro Castillo Morales Universidad de Edimburgo El rápido crecimiento de la Word Wide Web

Más detalles

El XBRL y sus aportes al intercambio de información financiera

El XBRL y sus aportes al intercambio de información financiera Universidad ORT Uruguay Facultad de Ingeniería El XBRL y sus aportes al intercambio de información financiera Entregado como requisito para la obtención del título de Licenciado en Sistemas Carlos Rial

Más detalles

ONTOLOGÍAS E INTELIGENCIA ARTIFICIAL PARA LA RECUPERACIÓN EFICIENTE DEL CONOCIMIENTO

ONTOLOGÍAS E INTELIGENCIA ARTIFICIAL PARA LA RECUPERACIÓN EFICIENTE DEL CONOCIMIENTO ONTOLOGÍAS E INTELIGENCIA ARTIFICIAL PARA LA RECUPERACIÓN EFICIENTE DEL CONOCIMIENTO Antonio Martín*, Sonsoles Celestino, Adela Valdenebro, Julia Mensaque. Biblioteca Universidad de Sevilla, C/ San Fernando

Más detalles

Ontologías ECSDI. Curso 2014/2015. LSI-FIB-UPC cbea. ECSDI (LSI-FIB-UPC cbea) Ontologías Curso 2014/2015 1 / 36

Ontologías ECSDI. Curso 2014/2015. LSI-FIB-UPC cbea. ECSDI (LSI-FIB-UPC cbea) Ontologías Curso 2014/2015 1 / 36 Ontologías ECSDI LSI-FIB-UPC cbea Curso 2014/2015 ECSDI (LSI-FIB-UPC cbea) Ontologías Curso 2014/2015 1 / 36 Índice 1 Introducción 2 Ontologias 3 Proyectos de Ontologías 4 Elementos de un ontología ECSDI

Más detalles

GLOSARIO. Análisis Bottom-Up: Técnica utilizada en tareas de ingeniería inversa la cual parte de

GLOSARIO. Análisis Bottom-Up: Técnica utilizada en tareas de ingeniería inversa la cual parte de GLOSARIO Análisis Bottom-Up: Técnica utilizada en tareas de ingeniería inversa la cual parte de una descripción de bajo nivel (código fuente) para generar descripciones con un mayor grado de abstracción.

Más detalles

FOG: ARQUITECTURA FLEXIBLE PARA LA GENERACIÓN AUTOMÁTICA DE ONTOLOGÍAS

FOG: ARQUITECTURA FLEXIBLE PARA LA GENERACIÓN AUTOMÁTICA DE ONTOLOGÍAS FOG: ARQUITECTURA FLEXIBLE PARA LA GENERACIÓN AUTOMÁTICA DE ONTOLOGÍAS Emilio F. Viñas 1, Jesús Serrano-Guerrero 2, José A. Olivas 2, Javier de la Mata 2, Andrés Soto 3, Departamento de Tecnologías y Sistemas

Más detalles

Calidad de Datos como Valor Estratégico de la Información en E-Business

Calidad de Datos como Valor Estratégico de la Información en E-Business Calidad de Datos como Valor Estratégico de la Información en E-Business Marta E. Cabrera Villafañe, Germán Antonio Montejano, Mario Berón Departamento de Informática Universidad Nacional de San Luis Ejército

Más detalles

Arquitectura de Empresa. Visión General

Arquitectura de Empresa. Visión General IX Congreso de Ingeniería de Organización Gijón, 8 y 9 de septiembre de 2005 de Empresa. Visión General Llanos Cuenca González 1, Ángel Ortiz Bas 1, Andrés Boza García 1 1 Centro de Investigación Gestión

Más detalles

Análisis comparativo entre CIMOSA (CIM-Open System Architecture) y DEM (Dynamic Enterprise Modelling)

Análisis comparativo entre CIMOSA (CIM-Open System Architecture) y DEM (Dynamic Enterprise Modelling) 3rd International Conference on Industrial Engineering and Industrial Management XIII Congreso de Ingeniería de Organización Barcelona-Terrassa, September 2nd-4th 2009 Análisis comparativo entre CIMOSA

Más detalles

Modelado de relaciones existentes en un equipo de proyecto de software Modeling relationships in a software project team

Modelado de relaciones existentes en un equipo de proyecto de software Modeling relationships in a software project team Modelado de relaciones existentes en un equipo de proyecto de software Modeling relationships in a software project team Rafael Rodríguez-Puente 1, Eliana B. Ril-Valentin 2 1 Departamento de Técnicas de

Más detalles

Clase 10. Ingeniería de ontologías. Mg. A. G. Stankevicius. Segundo Cuatrimestre

Clase 10. Ingeniería de ontologías. Mg. A. G. Stankevicius. Segundo Cuatrimestre Ingeniería de Aplicaciones para la Web Semántica Clase 10 Ingeniería de ontologías Mg. A. G. Stankevicius Segundo Cuatrimestre 2005 Copyright 2 Copyright 2005 A. G. Stankevicius. Se asegura la libertad

Más detalles

Web Semántica: un nuevo enfoque hacia la Organización de Información en los Sistemas de Gestión de Contenidos.

Web Semántica: un nuevo enfoque hacia la Organización de Información en los Sistemas de Gestión de Contenidos. Web Semántica: un nuevo enfoque hacia la Organización de Información en los Sistemas de Gestión de Contenidos. Autor: Lic. Keilyn Rodríguez Perojo. Licenciado en Bibliotecologías y Ciencias de la Información.

Más detalles

Seminario Web Semántica y Ontologías

Seminario Web Semántica y Ontologías Seminario Web Semántica y Ontologías Inteligencia Artificial 5 o Informática IA curso 2012-2013 CCIA Noviembre 2012 IA 1112 (CCIA) Seminario Web Semántica Noviembre-2012 1 / 15 Web Semántica vs. Web Actual

Más detalles

Proyecto de trabajo de iniciación a la investigación

Proyecto de trabajo de iniciación a la investigación Proyecto de trabajo de iniciación a la investigación Título: Aplicación de tecnologías de la Web Semántica en el dominio sanitario. Sistemas de Información Sanitarios Semánticos (SISS). Autor: Tutor: Propuesta

Más detalles

Linked Open Data: Datos abiertos para la Web Semántica Día virtual de Datos Abiertos - CUDI. Dr. Hector G. Ceballos (ceballos@itesm.

Linked Open Data: Datos abiertos para la Web Semántica Día virtual de Datos Abiertos - CUDI. Dr. Hector G. Ceballos (ceballos@itesm. + Linked Open Data: Datos abiertos para la Web Semántica Día virtual de Datos Abiertos - CUDI Dr. Hector G. Ceballos (ceballos@itesm.mx) Marzo 2014 + Agenda 2 n Interoperabilidad en Datos Abiertos n Web

Más detalles

Capítulo 1. Introducción

Capítulo 1. Introducción Capítulo 1. Introducción El WWW es la mayor fuente de imágenes que día a día se va incrementando. Según una encuesta realizada por el Centro de Bibliotecas de Cómputo en Línea (OCLC) en Enero de 2005,

Más detalles

Ontología para un Sistema de Calidad para la Industria Automotriz basado en la Norma ISO/TS 16949

Ontología para un Sistema de Calidad para la Industria Automotriz basado en la Norma ISO/TS 16949 Ontología para un Sistema de Calidad para la Industria Automotriz basado en la Norma ISO/TS 16949 Francisco E. Castillo 1 y Héctor L. Duran 2 (1) Universidad de Guadalajara, CUCEA, Doctorado en Tecnologías

Más detalles

Computing, nuevos horizontes para. Guía a de temas a desarrollar

Computing, nuevos horizontes para. Guía a de temas a desarrollar Acuerdo de Bibliotecas Universitarias de Córdoba Seminario 27 y 28 de septiembre de 2012 Web semántica ntica,, Web 3.0 y entornos Cloud Computing, nuevos horizontes para bibliotecarios, documentalistas

Más detalles

METODOLOGÍA PARA ORGANIZAR, RECUPERAR Y COMPARTIR

METODOLOGÍA PARA ORGANIZAR, RECUPERAR Y COMPARTIR METODOLOGÍA PARA ORGANIZAR, RECUPERAR Y COMPARTIR RECURSOS DE INFORMACIÓN Y CONOCIMIENTO EN UN CENTRO I+D+I EN LA PLATAFORMA SURICATA Marrero, S.R; Nelson, J.C; Galán, M; Ocón, A.; Rubio, E. sonia@cicei.com;

Más detalles

Propuesta de un modelo de análisis para estimación del tamaño del software y gestión de costos y riesgos a partir de requerimientos funcionales

Propuesta de un modelo de análisis para estimación del tamaño del software y gestión de costos y riesgos a partir de requerimientos funcionales Propuesta de un modelo de análisis para estimación del tamaño del software y gestión de costos y riesgos a partir de requerimientos funcionales S.Forigua, O.Ballesteros Abstract. This paper describes the

Más detalles

Metodología ETL para el procesamiento de datos en repositorios de proyectos de software usando ontologías

Metodología ETL para el procesamiento de datos en repositorios de proyectos de software usando ontologías Metodología ETL para el procesamiento de datos en repositorios de proyectos de software usando ontologías Moises Gonzalez García Departamento de ingeniería en software CENIDET Cuernavaca Morelos moises@cenidet.edu.mx

Más detalles

Introducción a las Ontologías

Introducción a las Ontologías Introducción a las Ontologías Gtión del Conocimiento Dr. Ariel Monterin ISISTAN Facultad de Ciencias. Exactas- UNICEN Conceptos principal Lenguaj para la construcción de Razonamiento con Conclusion Conceptos

Más detalles

Bibliografía Anotada

Bibliografía Anotada Maestría en Ingeniería de Sistemas y Computación Universidad Nacional de Colombia Bogotá D.C. June 2, 2006 Contenido Tema Amplio 1 Tema Amplio 2 3 4 5 Tema Tema Amplio Extracción de información y obtención

Más detalles

Ontologías en las IDEs

Ontologías en las IDEs 2 Jornadas IDE(s) de La República Argentina Ontologías en las IDEs Indalecio Fructuoso Bezos Cibulsky Universidad de La Punta San Luis 3 y 4 de Octubre de 2007 Evolución e la Organización de la Información

Más detalles

Modelo de Procesos para la Gestión de Requerimientos en Proyectos de Explotación de Información

Modelo de Procesos para la Gestión de Requerimientos en Proyectos de Explotación de Información Modelo de Procesos para la Gestión de Requerimientos en Proyectos de Explotación de Información Pollo-Cattaneo, M. F. 1,2, Mansilla, D 2,Vegega, C 2, Pesado, P. 3, García-Martínez, R. 4, P. Britos, P.

Más detalles

SET (Software Engineering Tutor). Una herramienta para la construcción guiada de modelos de dominio

SET (Software Engineering Tutor). Una herramienta para la construcción guiada de modelos de dominio SET (Software Engineering Tutor). Una herramienta para la construcción guiada de modelos de dominio Arturo Cepeda Pérez, Sergio Bravo Martín, Francisco José García Peñalvo Universidad de Salamanca, Facultad

Más detalles

Gestión de la Información Multimedia en Internet Gestión del conocimiento DAML y ontologías consensuadas

Gestión de la Información Multimedia en Internet Gestión del conocimiento DAML y ontologías consensuadas Gestión de la Información Multimedia en Internet Gestión del conocimiento DAML y ontologías consensuadas Autor: Pablo Barrera González Profesor: Carlos Delgado Kloos Fecha de presentación: 7 de Febrero

Más detalles

Ingeniería de Software I. Sebastián Uchitel y Víctor Braberman 1er Cuatrimestre 2009

Ingeniería de Software I. Sebastián Uchitel y Víctor Braberman 1er Cuatrimestre 2009 Ingeniería de Software I Sebastián Uchitel y Víctor Braberman 1er Cuatrimestre 2009 Quienes somos? 2 Quienes son? 3 Objetivos del Curso Entender el rol fundamental que juega la construcción y análisis

Más detalles

Mantenimiento del Software

Mantenimiento del Software Mantenimiento del Software S3 Francisco Ruiz, Macario Polo Grupo Alarcos Dep. de Informática ESCUELA SUPERIOR DE INFORMÁTICA UNIVERSIDAD DE CASTILLA-LA MANCHA http://alarcos.inf-cr.uclm.es/doc/mso/ Ciudad

Más detalles

Problemas y consecuencias de la mala calidad. Necesidades en distintas áreas de aplicación. Gestión de la calidad en Sistemas de Información

Problemas y consecuencias de la mala calidad. Necesidades en distintas áreas de aplicación. Gestión de la calidad en Sistemas de Información Conceptos Problemas Causas Necesidades Gestión Tema 1: Introducción Concepto de calidad de datos Problemas y consecuencias de la mala calidad Causas de la mala calidad Necesidades en distintas áreas de

Más detalles

BPEMM: Procesos de Negocio implementados por servicios

BPEMM: Procesos de Negocio implementados por servicios : un modelo de medidas de ejecución para Procesos de Negocio implementados por servicios Dra. Ing. Andrea Delgado, InCo, FING, UdelaR Montevideo, Uruguay, Octubre 2013 Agenda 2 Motivación Medición de la

Más detalles

ESPECIFICACIÓN Y TRAZABILIDAD DE REQUERIMIENTOS EN EL DESARROLLO DE APLICACIONES WEB

ESPECIFICACIÓN Y TRAZABILIDAD DE REQUERIMIENTOS EN EL DESARROLLO DE APLICACIONES WEB ESPECIFICACIÓN Y TRAZABILIDAD DE REQUERIMIENTOS EN EL DESARROLLO DE APLICACIONES WEB Ferraro, Maria de los Angeles a ; Medina, Yanina a* ; Dapozo, Gladys a ; Estayno, Marcelo b a Facultad de Ciencias Exactas

Más detalles

Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI)

Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI) Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI) OFERTAS TECNOLÓGICAS 1) GESTIÓN ORGANIZACIONAL Y LOGÍSTICA INTEGRADA: TÉCNICAS Y SISTEMAS DE INFORMACIÓN 2) GESTIÓN

Más detalles

WEB SEMÁNTICA (PARTE I): VISTA GENERAL DE RDF

WEB SEMÁNTICA (PARTE I): VISTA GENERAL DE RDF WEB SEMÁNTICA (PARTE I): VISTA GENERAL DE RDF Por M.A. Ing. Sergio José Rodríguez Méndez, srodriguez142857@gmail.com RESUMEN Este artículo tiene como objetivo presentar una introducción general al Marco

Más detalles

AUTOMATIZACION DE PROCESOS DE DESARROLLO DE SOFTWARE DEFINIDOS CON SPEM

AUTOMATIZACION DE PROCESOS DE DESARROLLO DE SOFTWARE DEFINIDOS CON SPEM AUTOMATIZACION DE PROCESOS DE DESARROLLO DE SOFTWARE DEFINIDOS CON SPEM Fabio A. Zorzan y Daniel Riesco Resumen Esta línea de investigación propone una alternativa para lograr la automatización de la gestión

Más detalles

CONCEPTOS DE CALIDAD Y CALIDAD DEL SOFTWARE

CONCEPTOS DE CALIDAD Y CALIDAD DEL SOFTWARE CONCEPTOS DE CALIDAD Y CALIDAD DEL SOFTWARE INTRODUCCIÓN El avance informático actual es muy alto comparado con lo se tenía en los años 90, al hablar de desarrollo de software se hace más notable, en el

Más detalles

Adaptación y Configuración de Procesos de Software Tailoring and Configuration of Software Processes

Adaptación y Configuración de Procesos de Software Tailoring and Configuration of Software Processes Adaptación y Configuración de Procesos de Software Tailoring and Configuration of Software Processes Rodolfo Villarroel Acevedo 1* 1 Pontificia Universidad Católica de Valparaíso. Avenida Brasil 2241,

Más detalles

Recuperación y clasificación automática de información, resultados actuales y perspectivas futuras

Recuperación y clasificación automática de información, resultados actuales y perspectivas futuras Marisa Raquel De Giusti 1, Gonzalo Luján Villarreal 2, Ariel Sobrado 3, Agustín Vosou 4 Recuperación y clasificación automática de información, resultados actuales y perspectivas futuras Abstract - En

Más detalles

La Web Semántica como herramienta para e-learning

La Web Semántica como herramienta para e-learning La Web Semántica como herramienta para e-learning Lidia Marina López llopez@uncoma.edu.ar Departamento de Ciencias de la Computación Universidad Nacional del Comahue Buenos Aires 1400 8300 Neuquén Tel.

Más detalles

Diagrama de Clases. Diagrama de Clases

Diagrama de Clases. Diagrama de Clases Diagrama de Clases 1 Diagrama de Clases El propósito de este diagrama es el de representar los objetos fundamentales del sistema, es decir los que percibe el usuario y con los que espera tratar para completar

Más detalles

Conexión de Reglas de Negocios con Aspectos: estrategias y herramienta

Conexión de Reglas de Negocios con Aspectos: estrategias y herramienta Conexión de Reglas de Negocios con Aspectos: estrategias y herramienta Sandra Casas y Cecilia Fuentes Zamorano UARG, Universidad Nacional de la Patagonia Austral Campus Universitario, Piloto Riversa s/n

Más detalles

El almacén de indicadores de proceso de negocio en ejecución

El almacén de indicadores de proceso de negocio en ejecución X Congreso de Ingeniería de Organización Valencia, 7 y 8 de septiembre de 2006 El almacén de indicadores de proceso de negocio en ejecución Andrés Boza García 1, Angel Ortiz Bas 1, Llanos Cuenca Gonzalez

Más detalles

ARMONIZACIÓN DE MODELOS DE CALIDAD DEL SOFTWARE

ARMONIZACIÓN DE MODELOS DE CALIDAD DEL SOFTWARE DESDE LA ACADEMIA ARMONIZACIÓN DE MODELOS DE CALIDAD DEL SOFTWARE GABRIEL ALBERTO GARCÍA MIRELES, FÉLIX ÓSCAR GARCÍA RUBIO La tendencia actual entre las organizaciones que desarrollan software es la adopción

Más detalles

Aplicación de una Metodología basada en Mediciones para la Gestión de Calidad de Software

Aplicación de una Metodología basada en Mediciones para la Gestión de Calidad de Software Aplicación de una Metodología basada en Mediciones para la Gestión de Calidad de Software Jorge Bozo jbozo@inf.ucv.cl Escuela de Ingeniería Informática Universidad Católica de Valparaíso Valparaíso, Chile

Más detalles

CLASIFICACIÓN TEXTUAL BASADA EN TÉRMINOS JERÁRQUICOS

CLASIFICACIÓN TEXTUAL BASADA EN TÉRMINOS JERÁRQUICOS XXV Jornadas de Automática Ciudad Real, del 8 al 10 de septiembre de 2004 CLASIFICACIÓN TEXTUAL BASADA EN TÉRMINOS JERÁRQUICOS Francisco Javier Panizo, José R. Villar, Ángel Alonso Área de Ingeniería de

Más detalles

CAMINANDO HACIA LA WEB SEMÁNTICA

CAMINANDO HACIA LA WEB SEMÁNTICA CAMINANDO HACIA LA WEB SEMÁNTICA Jesualdo Tomás Fernández Breis Universidad de Murcia jfernand@um.es Web actual La información que vemos nosotros... Lugares para viajar y precio Ofertas de Viajes Viajes

Más detalles

OWL DESCRIPCION DE LA ONTOLOGÍA. Alberto Gómez López

OWL DESCRIPCION DE LA ONTOLOGÍA. Alberto Gómez López OWL DESCRIPCION DE LA ONTOLOGÍA Alberto Gómez López INDICE Introducción Utilidades de las ontologías para la Web OWL conceptos 3 Sub-lenguajes Sinopsis Lite Sinopsis Dl y Completo Descripción de la lengua

Más detalles

David Jordi Vallet Weadon.

David Jordi Vallet Weadon. <david.vallet@uam.es> David Jordi Vallet Weadon 1 Introducción Durante las últimas décadas, la personalización ha sido aplicada en diferentes campos de la informática, tanto en la rama científica como

Más detalles

Proceso de Arquitectura de Software. Segunda. Semana. Dr. Cuauhtémoc Lemus Olalde. Noviembre 7, 2002. Informática

Proceso de Arquitectura de Software. Segunda. Semana. Dr. Cuauhtémoc Lemus Olalde. Noviembre 7, 2002. Informática Segunda Semana de Informática Proceso de Arquitectura de Software Dr. Cuauhtémoc Lemus Olalde Noviembre 7, 2002 Desarrollo Tradicional Requerimientos Diseño Codificación e Integración Prueba y Aceptación

Más detalles

Administración de Conocimiento como soporte al Mantenimiento de Software

Administración de Conocimiento como soporte al Mantenimiento de Software Administración de Conocimiento como soporte al Mantenimiento de Software Oscar M. Rodríguez 1, Ana I. Martínez 1, Jesús Favela 1, Aurora Vizcaíno 2 1 CICESE, Departamento de Ciencias de la Computación,

Más detalles

FACULTAD DE INGENIERÍA UNIVERSIDAD DE LA REPÚBLICA. Un caso de estudio en Calidad de Datos para Ingeniería de Software Empírica

FACULTAD DE INGENIERÍA UNIVERSIDAD DE LA REPÚBLICA. Un caso de estudio en Calidad de Datos para Ingeniería de Software Empírica FACULTAD DE INGENIERÍA UNIVERSIDAD DE LA REPÚBLICA Un caso de estudio en Calidad de Datos para Ingeniería de Software Empírica INFORME PROYECTO DE GRADO Bruno Bianchi Gallo María Carolina Valverde Corrado

Más detalles

1. Definición de valor ganado. 2. Administración del valor ganado

1. Definición de valor ganado. 2. Administración del valor ganado Revista de la Facultad de Ingeniería Industrial Vol. 11(1): pp 47-52(2008) UNMSM ISSN: 1560-9146 (Impreso) / ISSN: 1410-9993 (Electrónico) Administración del valor ganado aplicado a proyectos de tecnología

Más detalles

1.1 Aseguramiento de la calidad del software

1.1 Aseguramiento de la calidad del software 1.1 Aseguramiento de la calidad del software El propósito del Aseguramiento de la Calidad (Software Quality Assurance, SQA) es entregar a la administración una visibilidad adecuada del proceso utilizado

Más detalles

MEJORAMIENTO DEL PROCESO DE SCM: MARCO DE REFERENCIA Y APLICACIÓN PRÁCTICA. Abstract

MEJORAMIENTO DEL PROCESO DE SCM: MARCO DE REFERENCIA Y APLICACIÓN PRÁCTICA. Abstract MEJORAMIENTO DEL PROCESO DE SCM: MARCO DE REFERENCIA Y APLICACIÓN PRÁCTICA Rodolfo Villarroel 1 Departamento de Computación e Informática Universidad Católica del Maule, Chile rvillarr@spock.ucm.cl Marcello

Más detalles

Temas Selectos de Programación II

Temas Selectos de Programación II Temas Selectos de Programación II Métricas de Procesos de Software Jorge Moisés Trejo Vargas Maestría en Ciencias de la Computación Outline Introducción Procesos de Software Definición Métricas Programas

Más detalles

Evaluación de una Metodología para la construcción de Data Warehouses

Evaluación de una Metodología para la construcción de Data Warehouses Instituto de Computación Facultad de Ingeniería Universidad de la República Evaluación de una Metodología para la construcción de Data Warehouses Data Warehouse para la plataforma EVA Agustín Mullin Proyecto

Más detalles

SISTEMA INFORMÁTICO PARA LA GESTIÓN DEL CONOCIMIENTO Y SU REPRESENTACIÓN. EL LENGUAJE +GBIT

SISTEMA INFORMÁTICO PARA LA GESTIÓN DEL CONOCIMIENTO Y SU REPRESENTACIÓN. EL LENGUAJE +GBIT SISTEMA INFORMÁTICO PARA LA GESTIÓN DEL CONOCIMIENTO Y SU REPRESENTACIÓN. EL LENGUAJE +GBIT Javier Alfonso Cendón javier.alfonso@unileon.es Francisco Rodríguez Sedano francisco.sedano@unileon.es Carmen

Más detalles

Conciencia Tecnológica ISSN: 1405-5597 contec@mail.ita.mx Instituto Tecnológico de Aguascalientes México

Conciencia Tecnológica ISSN: 1405-5597 contec@mail.ita.mx Instituto Tecnológico de Aguascalientes México Conciencia Tecnológica ISSN: 1405-5597 contec@mail.ita.mx Instituto Tecnológico de Aguascalientes México García Merayo, Félix; Luna Ramírez, Enrique El proceso Data Warehousing y los meta datos Conciencia

Más detalles

ELEARNING-ONT: ONTOLOGÍA PARA SERVICIOS DE INTERMEDIACIÓN EN EL DOMINIO DEL E-LEARNING

ELEARNING-ONT: ONTOLOGÍA PARA SERVICIOS DE INTERMEDIACIÓN EN EL DOMINIO DEL E-LEARNING ELEARNING-ONT: ONTOLOGÍA PARA SERVICIOS DE INTERMEDIACIÓN EN EL DOMINIO DEL E-LEARNING Juan M. Santos, Martín Llamas, Luis Anido, Alberto Freire, César Lojo Departamento de Enxeñería Telemática ETSE Telecomunicación,

Más detalles

Cómo citar el artículo Número completo Más información del artículo Página de la revista en redalyc.org

Cómo citar el artículo Número completo Más información del artículo Página de la revista en redalyc.org REICIS. Revista Española de Innovación, Calidad e Ingeniería del Software E-ISSN: 1885-4486 reicis@ati.es Asociación de Técnicos de Informática España Mesquida, Antoni Lluís; Mas, Antònia; Amengual, Esperança;

Más detalles

4. SUMILLA 1. CMMI v 1.2 2. People Software Process & Team Software Process 3. Estándares ISO/IEC 4. Técnicas de Prueba de Software

4. SUMILLA 1. CMMI v 1.2 2. People Software Process & Team Software Process 3. Estándares ISO/IEC 4. Técnicas de Prueba de Software Universidad Católica San Pablo Facultad de Ingeniería y Computación Programa Profesional de Ciencia de la Computación SILABO CS391. Calidad de Software (Obligatorio) 2014-2 1. DATOS GENERALES 1.1 CARRERA

Más detalles

Ontologias: una tecnica de representacion de conocimiento. Ontologies: a technical of knowledge representation

Ontologias: una tecnica de representacion de conocimiento. Ontologies: a technical of knowledge representation Ontologias: una tecnica de representacion de conocimiento Ontologies: a technical of knowledge representation Torcoroma Velásquez Pérez 1, M.Sc, Andrés Mauricio Puentes Velásquez 1, Ing, Jaime Alberto

Más detalles

http://swoogle.umbc.edu/

http://swoogle.umbc.edu/ Sistemas de Representación y Procesamiento Automático del Conocimiento http://swoogle.umbc.edu/ ://swoogle.umbc.edu Consuelo Barberá Mercé Millet Emiliano Torres Valencia, 22 de mayo de 2006 Qué es? Un

Más detalles

Tema 1 Introducción a los Sistemas Basados en el Conocimiento

Tema 1 Introducción a los Sistemas Basados en el Conocimiento Tema 1 Introducción a los Sistemas Basados en el Conocimiento Sistemas Basados en el Conocimiento Grado en Ingeniería Informática 1 Referencias Ingeniería del Conocimiento. A. Gómez, N. Juristo, C. Montes,

Más detalles

PROPUESTA METODOLOGICA PARA LA EDUCCIÓN DE REQUISITOS EN PROYECTOS DE EXPLOTACIÓN DE INFORMACIÓN

PROPUESTA METODOLOGICA PARA LA EDUCCIÓN DE REQUISITOS EN PROYECTOS DE EXPLOTACIÓN DE INFORMACIÓN PROPUESTA METODOLOGICA PARA LA EDUCCIÓN DE REQUISITOS EN PROYECTOS DE EXPLOTACIÓN DE INFORMACIÓN Paola Britos 1,2, Enrique Fernandez 1,2, Ramón García-Martinez 1,2 Centro de Ingeniería del Software e Ingeniería

Más detalles

Mejora en la Administración de Procesos de Desarrollo de Software Tipo SPEM Automatizados Bajo Workflow

Mejora en la Administración de Procesos de Desarrollo de Software Tipo SPEM Automatizados Bajo Workflow Mejora en la Administración de Procesos de Desarrollo de Software Tipo SPEM Automatizados Bajo Workflow Fabio A. Zorzan 1 y Daniel Riesco 2 Resumen Esta línea de investigación pretende aportar a la mejora

Más detalles

Towards Semantic Web Mining

Towards Semantic Web Mining Bettina Berendt, Andreas Hotho, Gerd Stumme Rodríguez Maestría en Ingeniería de Sistemas y Computación Universidad Nacional de Colombia Bogotá D.C. April 28, 2006 Contenido 1 Resumen 2 Introducción El

Más detalles

WEBBER: USO DE COMPONENTES PARA LA ARMONIZACIÓN DE CONTENIDOS Y METADATOS

WEBBER: USO DE COMPONENTES PARA LA ARMONIZACIÓN DE CONTENIDOS Y METADATOS WEBBER: USO DE COMPONENTES PARA LA ARMONIZACIÓN DE CONTENIDOS Y METADATOS Autores: Introducción Diego R. López RedIRIS diego.lopez@rediris.es El trabajo necesario para mantener un servidor de información

Más detalles

The Web Semantic approach like tool for the e-learning

The Web Semantic approach like tool for the e-learning The Web Semantic approach like tool for the e-learning Ana Vanessa Leguízamo León Universidad Central de Venezuela. Apdo. 47002, Los Chaguaramos 1041A, Caracas Venezuela Universidad de Salamanca Paseo

Más detalles

Software Architecture Assesment. Rosa Virginia Icedo Ojeda Jorge Moisés Trejo Vargas Mayo 2003

Software Architecture Assesment. Rosa Virginia Icedo Ojeda Jorge Moisés Trejo Vargas Mayo 2003 Software Architecture Assesment Rosa Virginia Icedo Ojeda Jorge Moisés Trejo Vargas Mayo 2003 Outline Software Architecture Assesment Arquitectura de Sofwtare (AS) Por qué evaluar una AS? Qué evaluamos

Más detalles

Herramienta de gestión de trazabilidad de requerimientos en proyectos de software

Herramienta de gestión de trazabilidad de requerimientos en proyectos de software Herramienta de gestión de trazabilidad de requerimientos en proyectos de software Alfredo Villafañe 1, María de los A. Ferraro 1, Yanina Medina 1, Cristina Greiner 1, Gladys Dapozo 1, Marcelo Estayno 2

Más detalles

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos Guía docente

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos Guía docente Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos Guía docente Impartido por: Juan Alfonso Lara Torralbo 1. Datos del docente NOMBRE Juan Alfonso Lara Torralbo FORMACIÓN

Más detalles

Buscadores basados en agentes inteligentes

Buscadores basados en agentes inteligentes Buscadores basados en agentes inteligentes Los buscadores de contenido Estos han sido esenciales a lo largo de todo el desarrollo de la web. Basados en coincidencias de palabras o frases. Desventajas Escasa

Más detalles

Introducción a la Web Semántica

Introducción a la Web Semántica Taller de Producción de Software 2007 Introducción a la Web Semántica Taller de Producción de Software 2º Semestre 2008 Indice Visión de la Web Semántica Arquitectura de la Web Semántica RDF Ontologías

Más detalles

Programación Orientada a Objetos: Clases versus Prototipos 1

Programación Orientada a Objetos: Clases versus Prototipos 1 Programación Orientada a Objetos: Clases versus Prototipos 1 Pedro Cuesta Morales (pcuesta@uvigo.es) Departamento de Lenguajes y Sistemas Informáticos Universidad de Vigo Resumen: En este artículo se introducen

Más detalles

Fábrica de Software. Documento de Proceso de la Gerencia de SQA

Fábrica de Software. Documento de Proceso de la Gerencia de SQA PONTIFICIA UNIVERSIDAD CATÓLICA DE CHILE ESCUELA DE INGENIERÍA DEPARTAMENTO DE CIENCIA DE LA COMPUTACIÓN Fábrica de Software Documento de Proceso de la Gerencia de SQA Escrito de acuerdo a la norma PSS-05,

Más detalles

Modelado multidimensional para la visualización integrada de Big Data en plataformas de Inteligencia de Negocio

Modelado multidimensional para la visualización integrada de Big Data en plataformas de Inteligencia de Negocio Modelado multidimensional para la visualización integrada de Big Data en plataformas de Inteligencia de Negocio Roberto Tardío 1, Elisa de Gregorio 1, Alejandro Maté 1, Rafa Muñoz-Terol 1, David Gil 1,2,

Más detalles

Metodologías híbridas para desarrollo de software: una opción factible para México Eréndira Miriam Jiménez Hernández y Sandra Dinora Orantes Jiménez

Metodologías híbridas para desarrollo de software: una opción factible para México Eréndira Miriam Jiménez Hernández y Sandra Dinora Orantes Jiménez Revista Digital Universitaria 1 de enero 2012 Volumen 13 Número 1 ISSN: 1067-6079 Metodologías híbridas para desarrollo de software: una opción factible para México Eréndira Miriam Jiménez Hernández y

Más detalles

Generación semiautomática de una ontología para una red de ONG

Generación semiautomática de una ontología para una red de ONG Generación semiautomática de una ontología para una red de ONG Natalia Chiaro nchiaro@internet.com.uy Pablo Damonte pdamonte@montevideo.com.uy Diego Garat dgarat@fing.edu.uy Facultad de Ingeniería Universidad

Más detalles

Evaluación, limpieza y construcción de los datos: un enfoque desde la inteligencia artificial

Evaluación, limpieza y construcción de los datos: un enfoque desde la inteligencia artificial Universidad del Cauca Facultad de Ingeniería Electrónica y Telecomunicaciones Programas de Maestría y Doctorado en Ingeniería Telemática Seminario de Investigación Evaluación, limpieza y construcción de

Más detalles

<TITULO DEL PROYECTO DE DESARROLLO DE SW > Diana Milena Pérez Riveros 1 Diana Milena Pérez Riveros Pagina de

Más detalles

La gestión de objetos digitales: una aplicación para la e-ciencia

La gestión de objetos digitales: una aplicación para la e-ciencia La gestión de objetos digitales: una aplicación para la e-ciencia PONENCIAS Digital object management: an application for e-science Luis Zorita Vicente y Alicia López Medina Resumen El nuevo entorno de

Más detalles

Universidad Autónoma Metropolitana

Universidad Autónoma Metropolitana Universidad Autónoma Metropolitana Unidad Azcapotzalco División de Ciencias Básicas e Ingeniería Licenciatura en Ingeniería en Computación Propuesta de Proyecto Terminal Composición de servicios web para

Más detalles

Diseño e Implementación de un Sistema de Administración de la Calidad del Software para una Institución Financiera

Diseño e Implementación de un Sistema de Administración de la Calidad del Software para una Institución Financiera Diseño e Implementación de un Sistema de Administración de la Calidad del para una Institución Financiera Marcelo Jenkins Escuela de Ciencias de la Computación e Informática Universidad de Costa Rica San

Más detalles

ASEGURAMIENTO DE LA CALIDAD PARA PROYECTOS DE EXPLOTACIÓN DE INFORMACIÓN

ASEGURAMIENTO DE LA CALIDAD PARA PROYECTOS DE EXPLOTACIÓN DE INFORMACIÓN WICC 2012 212 ASEGURAMIENTO DE LA CALIDAD PARA PROYECTOS DE EXPLOTACIÓN DE INFORMACIÓN Diez, E., Pytel, P., Rodríguez, D., García, R., Lacabanne, M., Leonardis, L., Martins, S., Cartanilica, A., García-Martínez,

Más detalles

ADAPTE Method: Tool Catalog, Measures Definition, and Process Configuration

ADAPTE Method: Tool Catalog, Measures Definition, and Process Configuration ADAPTE Method: Tool Catalog, Measures Definition, and Process Configuration Giovanni Giachetti 1, Pablo Cruz 1, Daniel Fredes 2, Hernán Astudillo 1 1 Universidad Técnica Federico Santa María, Av. España

Más detalles

Centro de Investigación en Matemáticas, A.C.

Centro de Investigación en Matemáticas, A.C. Centro de Investigación en Matemáticas, A.C. Temas Selectos de Programación Avanzada II (Temas Selectos de Ingeniería de Software) Reporte Final Métricas de Procesos de Software Maestría en Ciencias de

Más detalles

Análisis del Sistema de Información

Análisis del Sistema de Información Análisis del Sistema de Información ÍNDICE DESCRIPCIÓN Y OBJETIVOS... 2 ACTIVIDAD ASI 1: DEFINICIÓN DEL SISTEMA... 6 Tarea ASI 1.1: Determinación del Alcance del Sistema... 6 Tarea ASI 1.2: Identificación

Más detalles

SCOPE PLANNING IN SOFTWARE PROJECTS PLANIFICACIÓN DEL ALCANCE EN PROYECTOS DE SOFTWARE

SCOPE PLANNING IN SOFTWARE PROJECTS PLANIFICACIÓN DEL ALCANCE EN PROYECTOS DE SOFTWARE Recibido: 23 de febrero de 2011 Aceptado: 29 de marzo de 2011 SCOPE PLANNING IN SOFTWARE PROJECTS PLANIFICACIÓN DEL ALCANCE EN PROYECTOS DE SOFTWARE MSc. Ailin Orjuela, MSc. Luis Alberto Esteban, MSc.

Más detalles

Scientia Et Technica ISSN: 0122-1701 scientia@utp.edu.co Universidad Tecnológica de Pereira Colombia

Scientia Et Technica ISSN: 0122-1701 scientia@utp.edu.co Universidad Tecnológica de Pereira Colombia Scientia Et Technica ISSN: 0122-1701 scientia@utp.edu.co Universidad Tecnológica de Pereira Colombia LEÓN MARTÍNEZ, NELSON ENRIQUE; GÓMEZ FLÓREZ, LUIS CARLOS; PIMENTEL RAVELO, JORGE IVAN HERRAMIENTA COMPUTACIONAL

Más detalles

BASES DE DATOS. Ivon Tarazona Oriana Gomez

BASES DE DATOS. Ivon Tarazona Oriana Gomez BASES DE DATOS Ivon Tarazona Oriana Gomez Introducción Introducción Ventajas e (Unified Modeling Language) Es un lenguaje usado para especificar, visualizar y documentar los diferentes aspectos relativos

Más detalles

BAXSET: RECOVERY SYSTEM OF WEB SERVICES BASED ON A MODEL OF NAVIGATION TAXONOMY

BAXSET: RECOVERY SYSTEM OF WEB SERVICES BASED ON A MODEL OF NAVIGATION TAXONOMY Recibido: 21 de julio de 2009 Aceptado: 15 de septiembre de 2009 BAXSET: RECOVERY SYSTEM OF WEB SERVICES BASED ON A MODEL OF NAVIGATION TAXONOMY BAXSET: UN SISTEMA DE RECUPERACIÓN DE SERVICIOS WEB BASADO

Más detalles

Capítulo 3 - Aseguramiento de la calidad del software

Capítulo 3 - Aseguramiento de la calidad del software Capítulo 3 - Aseguramiento de la calidad del software 3.1 Introducción La calidad es el conjunto de propiedades inherentes a una entidad, que permiten juzgar su valor. Está cuantificada por el valor que

Más detalles

Construcción basada en ontologías del Léxico Extendido del Lenguaje

Construcción basada en ontologías del Léxico Extendido del Lenguaje Construcción basada en ontologías del Léxico Extendido del Lenguaje Héctor J. Ruidías 1,2, María Laura Caliusco 2, and María R. Galli 3 1 Departamento de Ingeniería y Ciencias de la Producción, Universidad

Más detalles