EVALUACIÓN DE LA CALIDAD DE DATOS USANDO ONTOLOGÍAS EVALUATION DATA QUALITY USING ONTOLOGIES

Tamaño: px
Comenzar la demostración a partir de la página:

Download "EVALUACIÓN DE LA CALIDAD DE DATOS USANDO ONTOLOGÍAS EVALUATION DATA QUALITY USING ONTOLOGIES"

Transcripción

1 EVALUACIÓN DE LA CALIDAD DE DATOS USANDO ONTOLOGÍAS EVALUATION DATA QUALITY USING ONTOLOGIES Rosa Gajardo Abarza Regina Motz Angélica Urrutia Facultad de Ingeniería Facultad de Ingeniería Facultad de Ingeniería Universidad Católica del Maule Universidad de la República Universidad Católica del Maule Chile Uruguay Chile RESUMEN La integración de datos permite ampliar el escenario sobre el cuál tomar decisiones, sin embargo un aspecto crítico que posee es determinar el nivel de calidad de los datos fuentes. Resulta en este sentido relevante contar con un mecanismo automático para medir el nivel de calidad de la fuente de datos, donde el nivel de calidad depende de la cantidad de datos con anomalías técnicas que existan. En este artículo se presenta un trabajo para proveer un proceso de determinación automática de datos anómalos. Se propone desarrollar un proceso flexible, independiente del dominio de aplicación y con una especificación declarativa, basado en el uso de ontologías de dominio y ontologías de métricas. Se describe el uso de estas ontologías y las métricas a utilizar. Palabras clave: Calidad de Datos, Ontologías, Métricas de Calidad. ABSTRACT Data integration allows to extend the scenario upon which to make decisions, a critical aspect is to determine the quality of the source data. Inportant is to have an automatic mechanism to measure quality of the data source, where levels of quality depends on the amount of data with technical anomalies. This paper presents the work developed automatic to provide determination of data anomalies. Aims to develop a flexible process, separate application domain and with declarative specification this proposal is based on the use of domain ontology and ontology of process metrics. This work shows the use of such ontologies and describes the proposed metrics. Keywords: Data Quality, Ontology, Quality Metrics. INTRODUCCIÓN Las bases de datos fuente presentan, generalmente, un conjunto de anomalías las que son detectadas cuando se realizan procesos de migración, integración o ETL, entre otros. Entiéndase por ETL a la extracción, transformación y/o carga de datos desde fuentes heterogéneas a un DataWarehouse [12]. Un data Warehouse es un conjunto de datos orientados por temas y que dan soporte a la toma de decisiones [13]. Es frecuente que el proceso de toma de decisiones se vea retrasado para limpiar anomalías de los datos fuente. Este trabajo propone monitorear el nivel de calidad de las bases de datos y aplicar metodologías de detección automática de datos con errores, para proceder a su posterior limpieza. La calidad de los datos, es uno de los problemas más difíciles de resolver. Pyle en [1] hace una estimación aproximada del subproceso de preparación de los datos que puede tomar hasta un 90% del tiempo y dinero disponible para el proceso completo de descubrimiento del conocimiento. Resulta en este sentido relevante contar con una medida del nivel de calidad de la fuente de datos que sea posible de obtener de forma automática. Redman en [22] evalúa el impacto de la pobre calidad de los datos en las organizaciones y que a menos que las empresas hagan esfuerzos extraordinarios, se esperará una tasa de error aproximada de un 1-5%. La pobre calidad de los datos tiene efectos adversos en los niveles operacionales, estratégicos y tácticos de la organización. Friedman en [23] declara que la calidad deficiente de los datos fuente ocasiona malas estrategias en las decisiones comerciales. La calidad de los datos debe ser vista como un problema del negocio, no como un problema de los encargados de las Tecnologías de la Información. A partir de estos autores, es claro que es necesario contar con herramientas que permitan evaluar el estado de los datos fuente. Si un dato es correcto o incorrecto depende de lo que los expertos en la organización definan y debe ser considerado en el criterio de evaluación. Para ello esta investigación utiliza métricas de calidad que midan el estado de ellos. Según Piattinni, García, Garzás, y Genero en [2]: Las métricas de software constituyen la base necesaria para llevar a cabo un proceso de evaluación y posteriormente, una mejora de los procesos de software, por esto evaluada la calidad de los datos y si es necesario, se debe establecer un proceso de mejora de ellos, para propender a contar con datos de calidad.

2 El nivel de calidad de la fuente de datos depende de la cantidad de datos con anomalías técnicas que se tenga. En este artículo se centra en el desarrollo que permita proveer un proceso de determinación automática de datos anómalos. Estableciendo el desarrollo de un proceso flexible, independiente del dominio de aplicación y con una especificación declarativa. La propuesta se basa en el uso de ontologías de dominio y ontologías de métricas para la detección de datos anómalos. La siguiente sección presenta la literatura revisada, luego se encuentra las anomalías técnicas y típicas que pueden ocurrir con los datos, esto es, problemas de Unicidad, Existencia y Consistencia. Seguidamente se ilustra el proceso de detección de anomalías utilizando las ontologías de dominio y de métricas. Finalmente se tiene algunas conclusiones y trabajos futuros. TRABAJOS RELACIONADOS Algunos trabajos muestran que se puede usar herramientas de la web semántica y ontologías para el análisis de la calidad de los datos, a continuación se discuten algunos de ellos: Wang, Hamilton y Bither en [4] describen un enfoque basado en ontologías para la limpieza de datos. Los autores definen la limpieza de datos como el proceso de detectar y corregir errores en bases de datos. Utilizan la ontología para clasificar los tipos de errores sintácticos y algunos semánticos, como errores tipográficos y de valores en códigos postales de ciudades. La ontología que utilizan es una ontología de dominio donde definen una clase por cada tipo de error y otra por cada tipo de valor válido por atributo posible. En un trabajo más reciente, Zhu, Chen y Quach en [5] generan un marco de trabajo haciendo uso de la semántica, para asegurar la calidad de los datos en los registros médicos. A través de una ontología, muestran que los modelos semánticos son más explícitos que los algoritmos para generar reglas de validación y proponen la utilización de reglas SWRL (Semantic Web Rule Language, que es la especificación de un lenguaje formal de reglas lógicas [14]) para controlar la completitud y la consistencia de datos. Füber y Heep en [8] desarrollan consultas SPARQL (lenguaje de consultas para RDF que es la estructura para representar información en la web [15][16]) genéricas para identificar problemas de valores ilegales en los datos. Tales como: valores fuera de rangos, con errores de sintaxis o ausencia de ellos, problemas con violaciones de dependencias funcionales y problemas de violación a la unicidad. Argumentan que el uso de conjuntos de datos de la Web Semántica reduce sustancialmente el esfuerzo para la gestión de calidad de los datos. Como un caso de uso emplean Nombres geográficos tomados de DBpedia, un recurso a disposición del público de la Web Semántica, como una referencia de confianza para la gestión de la calidad de otras fuentes de datos. Del análisis de los diferentes trabajos revisados, surge una clara tendencia a la utilización de Ontologías de Dominio para describir la sintaxis y la semántica válida de los datos. Dependiendo de los modelos, métodos o enfoques utilizados para dotar de semántica a los términos, puede alcanzarse diferentes niveles semánticos, es así que se tiene cuatro tipos básicos de construcciones abstractas para representar la semántica: vocabularios controlados, un conjunto de términos acotado referidos a un dominio de conocimiento donde la comunicación se establece utilizando este conjunto de términos; taxonomías, que agregan a lo anterior estructura y relaciones jerárquicas entre los términos, relaciones del tipo padre-hijo; tesauros que escalan un nivel más en el aporte semántico, permitiendo relaciones más complejas (equivalencia entre términos), homográfica (igual símbolo pero distinto significado) y asociativa (relativo a); finalmente las ontologías alcanzan el máximo nivel de abstracción, incorporando relaciones lógicas complejas entre los términos. Por definición Gruber en [10] expresa que una Ontología es una especificación formal y explícita de una conceptualización compartida. Conceptualización se refiere a una forma de entender y describir un dominio de conocimiento, compartida porque es consensuada por el conjunto de interesados relevantes en ese dominio, explícita porque está descrita en un lenguaje y formal, porque el lenguaje es comprensible por un computador. Se tiene, entonces, una forma de describir el significado de los entes de un dominio, entendible por un computador, precisamente lo que se necesita para dotar de semántica a la descripción de los datos. Por otro lado, el problema de especificar la calidad de datos, ha sido trabajado desde hace tiempo por numerosos autores. Una primera clasificación de las dimensiones de calidad es presentada por Strong, Lee y Wang en [6], donde las clasifican respecto a su importancia para el usuario en: relevancia, exactitud, accesibilidad, unicidad, consistencia, frescura y credibilidad. Otras definiciones expresadas en taxonomías organizadas por niveles de granularidad de ocurrencia son presentadas por Oliveira, Rodríguez y Enriques en [7]. Estas definiciones más rigurosas que las definiciones textuales utilizadas en otros trabajos, son útiles para el desarrollo de una herramienta de calidad de datos que detecte automáticamente los problemas identificados. Un trabajo más reciente de Zaveri, Rula, Maurino, Pietrobon, Lehmann, Auer y Hitzler en [9] presenta un relevamiento del estado del arte en la detección de anomalías en datos publicados como Linked Data y provee una clasificación de errores según

3 los que pueden ser reparados de forma automática, semiautomática o de forma manual. Del análisis de estos trabajos se encuentra que la tipología de los problemas de calidad de datos puede analizarse desde diversos puntos de vista. En esta investigación interesa la detección automática de los problemas técnicos que disminuyen la calidad de datos en sus dimensiones de: Unicidad, Existencia y Consistencia, por ser ellas las dimensiones que son mayoritariamente mencionadas en la literatura revisada. Parafraseando a Tom De Marco [11]: No se puede controlar lo que no se puede medir, interesa especialmente tener un modelo que permita definir métricas sobre los niveles de calidad de los datos. En la siguiente sección se presenta algunas métricas para las dimensiones de Unicidad, Existencia y Consistencia. Para que estas métricas sean especificadas de forma declarativa se propone trabajar con una Ontología de Dimensiones de Calidad que las modele. ONTOLOGÍA DE DIMENSIONES DE CALIDAD Se estudian tres dimensiones de calidad: Existencia, Unicidad, y Consistencia de Dominio. Dimensión de Calidad Existencia. Para que una instancia cumpla con la dimensión de calidad existencia, debe tener valores no nulos en todos los atributos definidos como relevantes para esta dimensión en el dominio. En el caso un esquema pacientes, se definieron como atributos relevantes de la instancia: Nombre, Fecha de Nacimiento y Sexo, lo que significa que son consideradas instancias anómalas aquellas que tienen valor nulo, en alguno de estos tres atributos. Dimensión de Calidad Unicidad. Para algunos conceptos de la ontologia de dominio es necesario que se cumpla para todas sus instancias la restricción de existencia de valor sobre algún atributo y que este valor sea único en el conjunto de todas sus tuplas. Esto es lo que en base de datos se conoce como Clave Primaria, y trabajando con OWL (Ontology Web Language, utilizado para procesar contenido de información de la web haciendo uso de ontologías [17]) es definir reglas SWRL que verifiquen esta restricción. Dimensión de Calidad Consistencia de Dominio. Para que una instancia cumpla con la consistencia de dominio sobre algunos atributos, es necesario que los valores de esos atributos pertenezcan a un dominio definido. Ejemplos: el valor del atributo Sexo debe ser F o M, o la Fecha de Nacimiento no debe ser superior al día de hoy. También, trabajando con ontologías modeladas con OWL se puede definir los valores sinónimos, por ejemplo el Sexo puede ser F o M, 0 y 1, u otros valores utilizados de forma similar. Otro tipo de verificación podría ser validar que el -nombre del médico tratante corresponda a un profesional titulado MÉDICO-, para este caso alcanza con tener modelado en la ontología de dominio los profesionales médicos como una clase y así el mecanismo de razonamiento de la ontología, clasificaría a los médicos tratantes como MÉDICOS. La restricción expresada anteriormente es de tipo semántica ya que se refiere al grado en que los datos representan el mundo real. Para medir está dimensión, es necesario hacer una comparación de los datos con el mundo real que puede representarse por una referencia de confianza, llamado oráculo, considerado siempre como correcta. En el ejemplo de los pacientes atendidos por médicos, el oráculo puede ser, por ejemplo, el Colegio Médico o la nómina de médicos contratados por la institución de Salud. La ontología de dimensiones de calidad ilustrada en la Figura 1 muestra esta taxonomía de dimensiones de calidad (Existencia, Unicidad y Consistencia del dominio) y las métricas utilizadas para evaluarla el conjunto de datos. La clase métrica (Metrica) está relacionada con tres componentes básicos que modelan los principales temas a especificar respecto de las métricas: (1) la componente attrelevantes que permite especificar los atributos relevantes en los que se centra la propuesta de evaluación; (2) la componente Criterios que permite especificar los criterios aplicados en las valorizaciones que se realicen, por ejemplo: distinto de nulo, perteneciente a un dominio, etc. y (3) la componente Funciones que permite especificar cómo se llega al Resultado de la métrica describiendo la función que la calcula. En el ejemplo anteriormente usado de médico tratante, el criterio es que sea un profesional titulado Médico, mientras que la función podría ser más de una, por ejemplo: (i) está en la lista de los profesionales médicos emitida por el Colegio médico, o (ii) está en la lista de médicos contratados por la institución de salud, entre otras. La medida de la calidad de la base de datos es el resultado de la Función de la Métrica. Un indicador es una expresión cuantitativa o cualitativa que describe características, comportamientos o fenómenos de la realidad a través de la evolución de una variable, la que comparada con períodos anteriores, permite evaluar el desempeño y su evolución en el tiempo. Un indicador debe cumplir con tres características [2]: ser simple, medible, y entregar un resultado. En esta propuesta el indicador de nivel de calidad de los datos de la base de datos fuente está medido a través de las funciones que implementan las métricas utilizadas para cada una de las dimensiones consideradas (Existencia, Unicidad y Consistencia de Dominio).

4 attrelevante Criterio Funciones Existencia Aplican Tienen Tienen Métricas Ofrecen-un Unicidad Dimensiones Calidad Medidas-por Tienen peso Evaluados-por Resultado Consistencia Figura1: Ontología de dimensiones de calidad. La función generalizada para la métrica que proponemos se especifica con la fórmula siguiente (1), siendo MD métrica de dimensión I el conjunto de datos a evaluar, Count y CumpleRestricción las funciones que implementan la métrica: MD(I) = Count(I`) donde, I`= {i ϵ I / cumplerestriccion(i.attrelevante)} Count(I) También se define una métrica global, asociada a un grado de importancia por cada MD, donde su sumatoria puede tomar valores entre 0 y 1. 0 MDE(I)*ratio1+MDU(I) *ratio2+ MDCD(I) *ratio3 1 donde: ratio1+ratio2+ratio3 = 1 Se asigna una ponderación ratio a cada una de las métricas de dimensión, en este caso tres, que conforman la métrica global. La mayor o menor ponderación depende del problema y de la importancia que posee la dimensión de calidad dentro del conjunto de datos disponible. Los valores más cercanos a 1 indican mejor calidad de los datos evaluados. A partir del resultado de la métrica, el experto puede definir rangos aceptables de calidad (λ-corte) y de acuerdo a ellos, tomar la decisión de qué hacer con los datos que no cumplen con los requisitos mínimos requeridos. Una idea que puede ser útil, es el uso de una gama de valores más significativos que simplemente booleana para representar la gravedad del error. Sin embargo, la medida de la gravedad del error varía entre las diferentes situaciones dependiendo del uso que se le dará a los datos, el dominio de los intereses y los puntos de vista del usuario; por lo que es imposible establecer este rango de valores de forma genérica. Usar la ontología de dimensiones de calidad permite variar estos valores (ratios) de forma flexible. Al utilizarse una ontología llamada de dominio por ser generada a partir de los requerimientos del problema, se hace necesaria la intervención de un experto o usuario líder en la Ratio Datos (1) (2) organización para definir qué atributos se evaluarán y que ratios de relevancia se asignará a cada uno. La investigación de Lee, Y. W., Strong, D. M., Kahn, B. K., & Wang, R. Y. [24], habla sobre la importancia de los expertos y usuarios líderes en la definición de las dimensiones de calidad de los datos a considerar. A modo de ejemplo se utiliza el siguiente caso: Se tiene una pequeña porción de la base de datos, como caso práctico de la Ficha Clínica, y se define que: todas las personas deben tener un identificador y este debe ser único, siempre debe existir el nombre, y fecha de nacimiento, además el sexo debe ser F o M, de acuerdo a los atributos presentes en el caso estudio. Las instancias tienen el siguiente esquema: (Rut, Nombre, Fecha de Nacimiento, Sexo). La Tabla 1 muestra la aplicación estudio de la siguiente forma: la columna dimensión (en este caso Existencia, Unicidad y Consistencia de Dominio), la ponderacion dada por un experto según la definición (2); los atributos analizados ; y la métrica utilizada en cada caso según la definición (1). Dimensión TABLA 1. MÉTRICAS DE EVALUACIÓN DE CALIDAD DE LOS DATOS. Atributo Métrica Ponderación Nombre 0.5 Fecha Existencia Nacimien to Sexo Unicidad 0.3 Identifica dor Consistencia 0.2 Sexo Total Métrica 1 Nº instancias nombre no nulo / Nº instancias fecha nacimiento no nulo / Nº de instancias sexo no nulo / Nº de Identificadores únicos / Nº de instancias sexo validas / ONTOLOGÍA DE DOMINIO La ontología de dominio permite evaluar propiedades de tipo sintácticas y semánticas de los atributos. Propiedades sintácticas son, por ejemplo, un dato escrito de diferente forma, reconociendo cada uno de ellas como equivalentes, valores de atributos en mayúsculas y minúsculas, nombres con tilde o sin tilde, y nombres con distintas abreviaciones. Las propiedades semánticas son aquellas que reflejan restricciones del mundo real, por ejemplo que un médico no puede ser atendido como paciente por sí mismo o un

5 médico no puede atender pacientes en una institución si no está contratado por esa institución. La correctitud sintáctica de los datos se refiere a que estén libres de errores sintácticos, tales como errores de mecanografía o formato. Los datos se consideran sintácticamente correctos si cumplen reglas o restricciones definidas por el usuario. Ejemplos de reglas son: una fecha representada por el formato "dd/mm/aaaa", donde dd, mm y aaaa, son números enteros tales que 00<dd<= 31, 00<mm<13, teniendo en cuenta también el número diferente de días en función de cada mes y el año (31, 30 o 28). En este ejemplo, la corrección sintáctica verifica que la fecha sea válida, sin verificar la relación que la fecha puede tener con la realidad. Por ejemplo, que una fecha determinada es realmente la fecha de mi cumpleaños. El último tipo de corrección es lo que se llama corrección semántica. El valor de los resultados de la métrica que mide la corrección sintáctica toma valores verdadero o falso. Sin embargo, cuando las restricciones involucran valores de más de un atributo, se hace necesario escribir la restricción en SWRL, por ejemplo para verificar que la fecha de nacimiento no sea mayor a la fecha del día de hoy, la regla SWRL sería de la siguiente forma: Regla FechaNacimiento; (?x) ^ System(?y) => swrlb: GreaterThan(FechaNacimiento(?x),sysDate(?y)) Cuando (3) evalúa True, es que corresponde a una instancia anómala por causa de la restricción de Fecha de Nacimiento mayor a la fecha de hoy, en este caso la acción a ejecutarse es la de clasificar a esa instancia como una instancia de la clase Anómalas. Para identificar el tipo de anomalía, esta instancia es anotada con un metadato correspondiente al nombre de la regla que detectó su error. PROCESO DE EVALUACIÓN DE LA CALIDAD El proceso de evaluación de la calidad de datos propuesto se ilustra en la Figura 2. El proceso inicia con la carga de datos desde la base de datos fuente a la ontología de dominio (Figura 2(d)). Sobre la ontología de dominio se aplican las métricas especificadas en la Ontología de Dimensiones de Calidad (Figura 2(e)), con esto se obtiene la medida de calidad en la aplicación de la métrica (Figura 2(c)). Las instancias anómalas detectadas por violación a las restricciones especificadas en OWL (Figura 2(a)) y por violación a las reglas SWRL (Figura 2(b)), son almacenadas en un repositorio de Data (3) errónea para que posteriormente el experto limpie los datos y los corrija en la base de datos fuente. Monitoreo BASE DE DATOS FUENTE Cargar datos para la Ontología Arreglo de errores por experto (e) ONTOLOGIA de DIMENSIONES DE CALIDAD (d) ONTOLOGIA de DOMINIO (a) Clases con restriccion es OWL Instancias no validadas según Ontologías de Dimensión de calidad (c) MEDIDA DE LA CALIDAD DE LA BASE DE DATOS SEGÚN LA METRICA (b) Validación de Reglas in SWRL Data errónea Figura 2: Proceso de detección de anomalías a partir de métricas de calidad usando Ontologías. La propuesta de evaluación de los datos, considera: 1. Trabajar con una ontología del dominio. Esto permite tener conceptos ya pre-definidos de forma estándar, por ejemplo en caso del dominio ser el área Salud, en este contexto existen ya varias ontologías estándar que pueden ser re-utilizadas, por ejemplo UMLS (lenguaje de terminologías médicas) [18], ICD-10 (codificación internacional de enfermedades décima versión) [19]. 2. Definir la ontología de dimensiones de calidad. Selección de las dimensiones de calidad, las anomalías que estas involucran, y las métricas con los criterios y funciones de evaluación. A partir de estos componentes se definen las restricciones de la ontología de dominio (esto es incorporar en TBox y ABox los axiomas necesarios para detectar las anomalías), teniendo que los TBox y ABox son componentes de la lógica descriptiva. Los TBox contienen las definiciones de los roles y los ABox las definiciones de las instancias [21]. Véase Figura 2(a). 3. Cargar la ontología con instancias desde la base de datos fuente. 4. Para aquellos atributos que no se pueda verificar la calidad con OWL en las dimensiones a estudiar (en el caso estudio las dimensiones: Unicidad, Existencia y Consistencia), se generan las reglas de validación con SWRL, véase Figura 2(b). Esto quiere decir que, la ontología verifica la calidad de los datos de un esquema dado y genera la

6 validación de las dimensiones de calidad: Unicidad, Existencia y Consistencia, para este caso. 5. Usando un razonador en la ontología (por ejemplo, Pellet [20]), se detectan los datos anómalos a partir de las restricciones definidas en el TBox y el ABox de la ontología. Aplicando las reglas SWRL se detectan las anomalías correspondientes a problemas de valores no verificadas por el razonador (por ejemplo, problemas de máxima / mínima cardinalidad, entre otras.) 6. Terminado el proceso de razonamiento y de la aplicación de las reglas SWRL, se obtiene un conjunto de datos anómalos y un indicador global que mide la calidad de la base de datos fuente. La Figura 2, ilustra el proceso de detección de anomalías utilizando ontologías lo que permite una mejora continua en la calidad de los datos de la base de datos fuente. Este proceso se puede realizar en períodos predefinidos y según valores límites obtenidos con las métricas. Los valores de las métricas se ubican en un intervalo entre 0 y 1 definiendo un λ-corte de aceptación. Este modelo permite especificar en forma explícita y formal los elementos relevantes en la evaluación de calidad de los datos de un esquema y sus restricciones basado en métricas de calidad. La arquitectura definida será trabajada en la herramienta Protégé (desarrollada por la Universidad de Stanford para la creación y aplicación de Ontologías, (véase Figura 3), por ser una herramienta de uso y acceso fácil. CONCLUSIONES Y TRABAJOS FUTUROS Este trabajo presenta una propuesta en desarrollo para determinar automáticamente a través de ontologías instancias con anomalías. Se establecen, también, métricas de calidad de datos y se evalúa las instancias de la base de datos fuente requeridas para la mejora continua de la calidad. De esta forma los procesos de extracción, migración o integración, minimizan los trabajos de limpieza de datos haciéndose más eficientes. Las ontologías son una herramienta que permite evaluar las métricas de calidad de forma global, permitiendo instanciarlas, luego, para cada dominio específico, convirtiéndose así en un proceso flexible y fácilmente escalable. La importancia de incorporar, en las organizaciones, el problema de la calidad de los datos fuente. Es un tema que debe ser considerado por todas las áreas. Se debe crear un entorno de trabajo colaborativo en que el área directiva entregue los lineamientos principales de la empresa y en que el sector productivo y de tecnologías de las información desarrollen estrategias en común para lograr el objetivo que es contar con datos de calidad que soporten una buena toma de decisiones. Trabajos futuros planificados son: implementar el conjunto de reglas SWRL para detectar y limpiar los tipos de anomalías técnicas relacionadas a Unicidad, Existencia y Consistencia para el caso de estudio de Ficha Clínica de s. Ampliar el diseño de otras métricas de calidad de datos y evaluar el proceso de "ontology engineering" con verificación del experto del dominio. REFERENCIAS [1] Pyle, Dorian: Data Preparation for Data Mining, Morgan Kaufamann Publishers, Inc. San Francisco California, USA, [2] Piattini, García, Garzás y Genero. Medición y Estimación del Software. Técnicas y métodos para mejorar la calidad y la productividad, Alfaomega- Ra-Ma, Figura3: Ontología Ficha Clínica en Protégé. En el contexto del trabajo colaborativo es necesario contar con expertos de las disciplinas asociados al caso de la ontologia. Ellos deben entregar desde su experiencia la información necesaria para la creacion de los dominios y reglas. [3] Xin Wang, Howrd J. Hamilton, Yashu Bither, An Ontology Based Approach to Data Cleaning. Technical Report University Regina Canada. ISSN: , [4] Xin Wang, Howrd J. Hamilton, Yashu Bither, An Ontology Based Approach to Data Cleaning. Technical Report University Regina Canada. ISSN: , 2005.

7 [5] Zhu Lingkai, Chen Helen, Quach Kevin. A Semantic Framework for Data Quality Assurance in Medical Research, University Waterloo, Ontario, Canada, Proceedings of the 4 th Canadian Semantic Web Symposium, [6] D.M. Strong, Y.W. Lee, and R. Y. Wang, Data Quality in Context Communications of the ACM, vol.40,no.5 pp , May [7] Oliveira P., Rodrigues F., Enriques P. A Formal Definition of Data Quality Problems. International Conference on Information Quality, [8] Fürber C., Hepp M. Using Semantic Web resuorces for data Quality Management. Proceeding EKAW 10 Proceedings of the 17th international conference on Knowledge engineering and management by the massas. Springer-Verlag Berlin, Heidelberg. pp , [9] Zaveri, A., Rula, A., Maurino, A., Pietrobon, R., Lehmann, J., Auer, S., & Hitzler, P. Quality assessment methodologies for linked open data. Submitted to Semantic Web Journal, [10] Gruber, Tom R. A translation approach to portable ontologies. Knowledge Acquisition, 5(2), [11] Tom De Marco. Controlling Software Projects. Yourdon Press, [17] McGuinness, Deborah L., and Frank Van Harmelen. "OWL web ontology language overview." W3C recommendation 10.10, [18] Bodenreider, Olivier. "The unified medical language system (UMLS): integrating biomedical terminology." Nucleic acids research 32.suppl 1, D267-D270, [19] World Health Organization. "The ICD-10 classification of mental and behavioural disorders: clinical descriptions and diagnostic guidelines.", [20] Sirin, Evren, et al. "Pellet: A practical owl-dl reasoner." Web Semantics: science, services and agents on the World Wide Web 5.: 51-53, [21] Gómez-Pérez, A., and M. Fernández-López. Corcho; O. " Ontological engineering, [22] Redman, T. C. The impact of poor data quality on the typical enterprise.communications of the ACM, 41(2), , [23] Friedman, T. A Strategic Approach to Improving Data Quality. Gartner, June, 19, [24] Lee, Y. W., Strong, D. M., Kahn, B. K., & Wang, R. Y. IMQ: a methodology for information quality assessment. Information & management,40(2), , [12] E, L. Muñoz, J. N. Mazón and J. Trujillo, ETL Process Modeling Conceptual for Data Warehouses: A Systematic Mapping Study, IEEE LatinAmerica Transactions, Vol. 9, No. 3, June [13] Inmon, William H.; Hachathorrn, Richard D. Using the data warehouse. Wiley-QED Publishing, [14] Bailey, James, et al. "Web and semantic web query languages: A survey."proceedings of the First international conference on Reasoning Web. Springer-Verlag, [15] Prud Hommeaux, Eric, and Andy Seaborne. "SPARQL query language for RDF." W3C recommendation 15, [16] Klyne, Graham, and Jeremy J. Carroll. "Resource description framework (RDF): Concepts and abstract syntax.", 2006.

Búsqueda sobre catálogos basada en ontologías

Búsqueda sobre catálogos basada en ontologías Búsqueda sobre catálogos basada en ontologías Alianis Pérez Sosa, Yuniel Eliades Proenza Arias Universidad de las Ciencias Informáticas. Carretera a San Antonio Km 2 ½, Reparto Torrens, La Lisa, Ciudad

Más detalles

Capítulo 1. Introducción

Capítulo 1. Introducción Capítulo 1. Introducción El WWW es la mayor fuente de imágenes que día a día se va incrementando. Según una encuesta realizada por el Centro de Bibliotecas de Cómputo en Línea (OCLC) en Enero de 2005,

Más detalles

Planeación del Proyecto de Software:

Planeación del Proyecto de Software: Apéndice A. Cuestionarios del Sistema Evaluador Nivel2. Requerimientos de Administración: Goal 1: Los requerimientos del sistema asociados a software están bien controlados y existe un estándar para los

Más detalles

Organizaciones Virtuales e Integración de Información. José Abásolo Prieto

Organizaciones Virtuales e Integración de Información. José Abásolo Prieto Organizaciones Virtuales e Integración de Información José Abásolo Prieto Universidad de los Andes Objetivo de la charla Mostrar que aunque la problemática de integración de información distribuida y heterogénea

Más detalles

GLOSARIO. Análisis Bottom-Up: Técnica utilizada en tareas de ingeniería inversa la cual parte de

GLOSARIO. Análisis Bottom-Up: Técnica utilizada en tareas de ingeniería inversa la cual parte de GLOSARIO Análisis Bottom-Up: Técnica utilizada en tareas de ingeniería inversa la cual parte de una descripción de bajo nivel (código fuente) para generar descripciones con un mayor grado de abstracción.

Más detalles

Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI)

Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI) Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI) OFERTAS TECNOLÓGICAS 1) GESTIÓN ORGANIZACIONAL Y LOGÍSTICA INTEGRADA: TÉCNICAS Y SISTEMAS DE INFORMACIÓN 2) GESTIÓN

Más detalles

Diagrama de Clases. Diagrama de Clases

Diagrama de Clases. Diagrama de Clases Diagrama de Clases 1 Diagrama de Clases El propósito de este diagrama es el de representar los objetos fundamentales del sistema, es decir los que percibe el usuario y con los que espera tratar para completar

Más detalles

METODOLOGÍA PARA ORGANIZAR, RECUPERAR Y COMPARTIR

METODOLOGÍA PARA ORGANIZAR, RECUPERAR Y COMPARTIR METODOLOGÍA PARA ORGANIZAR, RECUPERAR Y COMPARTIR RECURSOS DE INFORMACIÓN Y CONOCIMIENTO EN UN CENTRO I+D+I EN LA PLATAFORMA SURICATA Marrero, S.R; Nelson, J.C; Galán, M; Ocón, A.; Rubio, E. sonia@cicei.com;

Más detalles

Aplicación de una Metodología basada en Mediciones para la Gestión de Calidad de Software

Aplicación de una Metodología basada en Mediciones para la Gestión de Calidad de Software Aplicación de una Metodología basada en Mediciones para la Gestión de Calidad de Software Jorge Bozo jbozo@inf.ucv.cl Escuela de Ingeniería Informática Universidad Católica de Valparaíso Valparaíso, Chile

Más detalles

Ontologías en las IDEs

Ontologías en las IDEs 2 Jornadas IDE(s) de La República Argentina Ontologías en las IDEs Indalecio Fructuoso Bezos Cibulsky Universidad de La Punta San Luis 3 y 4 de Octubre de 2007 Evolución e la Organización de la Información

Más detalles

Clase 10. Ingeniería de ontologías. Mg. A. G. Stankevicius. Segundo Cuatrimestre

Clase 10. Ingeniería de ontologías. Mg. A. G. Stankevicius. Segundo Cuatrimestre Ingeniería de Aplicaciones para la Web Semántica Clase 10 Ingeniería de ontologías Mg. A. G. Stankevicius Segundo Cuatrimestre 2005 Copyright 2 Copyright 2005 A. G. Stankevicius. Se asegura la libertad

Más detalles

Anotación de contenidos Web

Anotación de contenidos Web Anotación de contenidos Web Distintos tipos de anotación según el vocabulario utilizado Basada en Dublin Core The contributor and creator is the flight booking service www.flightbookings.com. The date

Más detalles

MEJORAMIENTO DEL PROCESO DE SCM: MARCO DE REFERENCIA Y APLICACIÓN PRÁCTICA. Abstract

MEJORAMIENTO DEL PROCESO DE SCM: MARCO DE REFERENCIA Y APLICACIÓN PRÁCTICA. Abstract MEJORAMIENTO DEL PROCESO DE SCM: MARCO DE REFERENCIA Y APLICACIÓN PRÁCTICA Rodolfo Villarroel 1 Departamento de Computación e Informática Universidad Católica del Maule, Chile rvillarr@spock.ucm.cl Marcello

Más detalles

Modelado de relaciones existentes en un equipo de proyecto de software Modeling relationships in a software project team

Modelado de relaciones existentes en un equipo de proyecto de software Modeling relationships in a software project team Modelado de relaciones existentes en un equipo de proyecto de software Modeling relationships in a software project team Rafael Rodríguez-Puente 1, Eliana B. Ril-Valentin 2 1 Departamento de Técnicas de

Más detalles

1.1 Aseguramiento de la calidad del software

1.1 Aseguramiento de la calidad del software 1.1 Aseguramiento de la calidad del software El propósito del Aseguramiento de la Calidad (Software Quality Assurance, SQA) es entregar a la administración una visibilidad adecuada del proceso utilizado

Más detalles

Seminario Web Semántica y Ontologías

Seminario Web Semántica y Ontologías Seminario Web Semántica y Ontologías Inteligencia Artificial 5 o Informática IA curso 2012-2013 CCIA Noviembre 2012 IA 1112 (CCIA) Seminario Web Semántica Noviembre-2012 1 / 15 Web Semántica vs. Web Actual

Más detalles

CAMINO HACIA LA WEB SEMÁNTICA. Jorge Alejandro Castillo Morales Universidad de Edimburgo

CAMINO HACIA LA WEB SEMÁNTICA. Jorge Alejandro Castillo Morales Universidad de Edimburgo INVESTIGACIÓN & DESARROLLO, No 5: 115 120 (2005) ISSN 1814-6333 RESUMEN CAMINO HACIA LA WEB SEMÁNTICA Jorge Alejandro Castillo Morales Universidad de Edimburgo El rápido crecimiento de la Word Wide Web

Más detalles

Linked Open Data: Datos abiertos para la Web Semántica Día virtual de Datos Abiertos - CUDI. Dr. Hector G. Ceballos (ceballos@itesm.

Linked Open Data: Datos abiertos para la Web Semántica Día virtual de Datos Abiertos - CUDI. Dr. Hector G. Ceballos (ceballos@itesm. + Linked Open Data: Datos abiertos para la Web Semántica Día virtual de Datos Abiertos - CUDI Dr. Hector G. Ceballos (ceballos@itesm.mx) Marzo 2014 + Agenda 2 n Interoperabilidad en Datos Abiertos n Web

Más detalles

Ontología para Criterios de Clasificación

Ontología para Criterios de Clasificación Ontología para Criterios de Clasificación Mónica Martínez 1, Regina Motz 1 1 Instituto de Computación Universidad de la República(UdelaR) Montevideo Uruguay {mmartine,rmotz}@fing.edu.uy Abstract. Almost

Más detalles

Análisis comparativo entre CIMOSA (CIM-Open System Architecture) y DEM (Dynamic Enterprise Modelling)

Análisis comparativo entre CIMOSA (CIM-Open System Architecture) y DEM (Dynamic Enterprise Modelling) 3rd International Conference on Industrial Engineering and Industrial Management XIII Congreso de Ingeniería de Organización Barcelona-Terrassa, September 2nd-4th 2009 Análisis comparativo entre CIMOSA

Más detalles

PROPUESTA METODOLOGICA PARA LA EDUCCIÓN DE REQUISITOS EN PROYECTOS DE EXPLOTACIÓN DE INFORMACIÓN

PROPUESTA METODOLOGICA PARA LA EDUCCIÓN DE REQUISITOS EN PROYECTOS DE EXPLOTACIÓN DE INFORMACIÓN PROPUESTA METODOLOGICA PARA LA EDUCCIÓN DE REQUISITOS EN PROYECTOS DE EXPLOTACIÓN DE INFORMACIÓN Paola Britos 1,2, Enrique Fernandez 1,2, Ramón García-Martinez 1,2 Centro de Ingeniería del Software e Ingeniería

Más detalles

El XBRL y sus aportes al intercambio de información financiera

El XBRL y sus aportes al intercambio de información financiera Universidad ORT Uruguay Facultad de Ingeniería El XBRL y sus aportes al intercambio de información financiera Entregado como requisito para la obtención del título de Licenciado en Sistemas Carlos Rial

Más detalles

Modelo de Procesos para la Gestión de Requerimientos en Proyectos de Explotación de Información

Modelo de Procesos para la Gestión de Requerimientos en Proyectos de Explotación de Información Modelo de Procesos para la Gestión de Requerimientos en Proyectos de Explotación de Información Pollo-Cattaneo, M. F. 1,2, Mansilla, D 2,Vegega, C 2, Pesado, P. 3, García-Martínez, R. 4, P. Britos, P.

Más detalles

Metodología ETL para el procesamiento de datos en repositorios de proyectos de software usando ontologías

Metodología ETL para el procesamiento de datos en repositorios de proyectos de software usando ontologías Metodología ETL para el procesamiento de datos en repositorios de proyectos de software usando ontologías Moises Gonzalez García Departamento de ingeniería en software CENIDET Cuernavaca Morelos moises@cenidet.edu.mx

Más detalles

Proyecto de trabajo de iniciación a la investigación

Proyecto de trabajo de iniciación a la investigación Proyecto de trabajo de iniciación a la investigación Título: Aplicación de tecnologías de la Web Semántica en el dominio sanitario. Sistemas de Información Sanitarios Semánticos (SISS). Autor: Tutor: Propuesta

Más detalles

PERFIL INTELIGENTE DE ONTOLOGÍAS PARA LA RECUPERACIÓN DE INFORMACIÓN. NORMA

PERFIL INTELIGENTE DE ONTOLOGÍAS PARA LA RECUPERACIÓN DE INFORMACIÓN. NORMA 155 PERFIL INTELIGENTE DE ONTOLOGÍAS PARA LA RECUPERACIÓN DE INFORMACIÓN. NORMA Antonio Martín, Sonsoles Celestino, Adela Valdenebro, Julia Mensaque. Biblioteca Universidad de Sevilla, España, toni@us.es

Más detalles

DBOWL: Persistencia y Escalabilidad de Consultas y Razonamientos en la Web Semántica

DBOWL: Persistencia y Escalabilidad de Consultas y Razonamientos en la Web Semántica DBOWL: Persistencia y Escalabilidad de Consultas y Razonamientos en la Web Semántica Maria del Mar Roldán-García, Jose F. Aldana-Montes Universidad de Málaga, Departamento de Lenguajes y Ciencias de la

Más detalles

Ingeniería de Software I. Sebastián Uchitel y Víctor Braberman 1er Cuatrimestre 2009

Ingeniería de Software I. Sebastián Uchitel y Víctor Braberman 1er Cuatrimestre 2009 Ingeniería de Software I Sebastián Uchitel y Víctor Braberman 1er Cuatrimestre 2009 Quienes somos? 2 Quienes son? 3 Objetivos del Curso Entender el rol fundamental que juega la construcción y análisis

Más detalles

Arquitectura de Empresa. Visión General

Arquitectura de Empresa. Visión General IX Congreso de Ingeniería de Organización Gijón, 8 y 9 de septiembre de 2005 de Empresa. Visión General Llanos Cuenca González 1, Ángel Ortiz Bas 1, Andrés Boza García 1 1 Centro de Investigación Gestión

Más detalles

PROYECTO CALIDAD DE DATOS CURSO 2011

PROYECTO CALIDAD DE DATOS CURSO 2011 PROYECTO CALIDAD DE DATOS CURSO 2011 GRUPO 4 1A. PARTE: MEDICIÓN DE CALIDAD EN LAS FUENTES DE DATOS Estela Pratto C.I. 3.267.004-3 Alexander Llanes C.I. 4.587.761-0 Fernando Plachicoff C.I. 4.611.006-9

Más detalles

Conexión de Reglas de Negocios con Aspectos: estrategias y herramienta

Conexión de Reglas de Negocios con Aspectos: estrategias y herramienta Conexión de Reglas de Negocios con Aspectos: estrategias y herramienta Sandra Casas y Cecilia Fuentes Zamorano UARG, Universidad Nacional de la Patagonia Austral Campus Universitario, Piloto Riversa s/n

Más detalles

La Web Semántica como herramienta para e-learning

La Web Semántica como herramienta para e-learning La Web Semántica como herramienta para e-learning Lidia Marina López llopez@uncoma.edu.ar Departamento de Ciencias de la Computación Universidad Nacional del Comahue Buenos Aires 1400 8300 Neuquén Tel.

Más detalles

ONTOLOGÍAS E INTELIGENCIA ARTIFICIAL PARA LA RECUPERACIÓN EFICIENTE DEL CONOCIMIENTO

ONTOLOGÍAS E INTELIGENCIA ARTIFICIAL PARA LA RECUPERACIÓN EFICIENTE DEL CONOCIMIENTO ONTOLOGÍAS E INTELIGENCIA ARTIFICIAL PARA LA RECUPERACIÓN EFICIENTE DEL CONOCIMIENTO Antonio Martín*, Sonsoles Celestino, Adela Valdenebro, Julia Mensaque. Biblioteca Universidad de Sevilla, C/ San Fernando

Más detalles

El almacén de indicadores de proceso de negocio en ejecución

El almacén de indicadores de proceso de negocio en ejecución X Congreso de Ingeniería de Organización Valencia, 7 y 8 de septiembre de 2006 El almacén de indicadores de proceso de negocio en ejecución Andrés Boza García 1, Angel Ortiz Bas 1, Llanos Cuenca Gonzalez

Más detalles

Gerencia de Procesos de Negocio (Business Process Management, BPM). Lic. Patricia Palacios Zuleta

Gerencia de Procesos de Negocio (Business Process Management, BPM). Lic. Patricia Palacios Zuleta Gerencia de Procesos de Negocio (Business Process Management, BPM). Lic. Patricia Palacios Zuleta (Business Process Management, BPM). La Gerencia de los Procesos del Negocio: Se define como: "integración

Más detalles

1. Definición de valor ganado. 2. Administración del valor ganado

1. Definición de valor ganado. 2. Administración del valor ganado Revista de la Facultad de Ingeniería Industrial Vol. 11(1): pp 47-52(2008) UNMSM ISSN: 1560-9146 (Impreso) / ISSN: 1410-9993 (Electrónico) Administración del valor ganado aplicado a proyectos de tecnología

Más detalles

OWL DESCRIPCION DE LA ONTOLOGÍA. Alberto Gómez López

OWL DESCRIPCION DE LA ONTOLOGÍA. Alberto Gómez López OWL DESCRIPCION DE LA ONTOLOGÍA Alberto Gómez López INDICE Introducción Utilidades de las ontologías para la Web OWL conceptos 3 Sub-lenguajes Sinopsis Lite Sinopsis Dl y Completo Descripción de la lengua

Más detalles

BPEMM: Procesos de Negocio implementados por servicios

BPEMM: Procesos de Negocio implementados por servicios : un modelo de medidas de ejecución para Procesos de Negocio implementados por servicios Dra. Ing. Andrea Delgado, InCo, FING, UdelaR Montevideo, Uruguay, Octubre 2013 Agenda 2 Motivación Medición de la

Más detalles

ANEXO 4 - REQUERIMIENTOS DE GESTIÓN DE PROYECTOS PMO DE INFORMATICA

ANEXO 4 - REQUERIMIENTOS DE GESTIÓN DE PROYECTOS PMO DE INFORMATICA ANEXO 4 - REQUERIMIENTOS DE GESTIÓN DE PROYECTOS PMO DE INFORMATICA ETB requiere que el CONTRATISTA cumpla los lineamientos para la Dirección y Gestión de proyectos, éstos últimos definidos a nivel corporativo

Más detalles

Elementos requeridos para crearlos (ejemplo: el compilador)

Elementos requeridos para crearlos (ejemplo: el compilador) Generalidades A lo largo del ciclo de vida del proceso de software, los productos de software evolucionan. Desde la concepción del producto y la captura de requisitos inicial hasta la puesta en producción

Más detalles

Buscadores basados en agentes inteligentes

Buscadores basados en agentes inteligentes Buscadores basados en agentes inteligentes Los buscadores de contenido Estos han sido esenciales a lo largo de todo el desarrollo de la web. Basados en coincidencias de palabras o frases. Desventajas Escasa

Más detalles

ISO 19103. Lenguaje de Esquema Conceptual

ISO 19103. Lenguaje de Esquema Conceptual ISO 19103 Lenguaje de Esquema Conceptual La ISO 19103 establece normas y guías para la adopción y uso de un Lenguaje de Esquema Conceptual (CSL) para desarrollar modelos o esquemas de información geográfica,

Más detalles

FACULTAD DE INGENIERÍA UNIVERSIDAD DE LA REPÚBLICA. Un caso de estudio en Calidad de Datos para Ingeniería de Software Empírica

FACULTAD DE INGENIERÍA UNIVERSIDAD DE LA REPÚBLICA. Un caso de estudio en Calidad de Datos para Ingeniería de Software Empírica FACULTAD DE INGENIERÍA UNIVERSIDAD DE LA REPÚBLICA Un caso de estudio en Calidad de Datos para Ingeniería de Software Empírica INFORME PROYECTO DE GRADO Bruno Bianchi Gallo María Carolina Valverde Corrado

Más detalles

ITIL FOUNDATION V3 2011

ITIL FOUNDATION V3 2011 ITIL FOUNDATION V3 2011 Examen de Certificación Instrucciones 1. Revise su Hoja de Respuesta, debe contener espacio para responder 40 preguntas y una sección para incorporar su Nombre 2. Espere por la

Más detalles

Ontologías ECSDI. Curso 2014/2015. LSI-FIB-UPC cbea. ECSDI (LSI-FIB-UPC cbea) Ontologías Curso 2014/2015 1 / 36

Ontologías ECSDI. Curso 2014/2015. LSI-FIB-UPC cbea. ECSDI (LSI-FIB-UPC cbea) Ontologías Curso 2014/2015 1 / 36 Ontologías ECSDI LSI-FIB-UPC cbea Curso 2014/2015 ECSDI (LSI-FIB-UPC cbea) Ontologías Curso 2014/2015 1 / 36 Índice 1 Introducción 2 Ontologias 3 Proyectos de Ontologías 4 Elementos de un ontología ECSDI

Más detalles

SERVICE ORIENTED ARCHITECTURE (SOA) CONTENIDO

SERVICE ORIENTED ARCHITECTURE (SOA) CONTENIDO SERVICE ORIENTED ARCHITECTURE (SOA) CONTENIDO Introducción:...1 Service Oriented Architecture...2 Elementos de una Service Oriented Architecture...2 Application frontends...2 Servicios...2 Contrato:...3

Más detalles

Describir una metodología sistemática de análisis de los procesos organizacionales y cómo estos pueden ser apoyados por las TI.

Describir una metodología sistemática de análisis de los procesos organizacionales y cómo estos pueden ser apoyados por las TI. Procesos de Negocio Objetivos Describir una metodología sistemática de análisis de los procesos organizacionales y cómo estos pueden ser apoyados por las TI. Identificar y analizar los procesos de negocios,

Más detalles

Evaluación, limpieza y construcción de los datos: un enfoque desde la inteligencia artificial

Evaluación, limpieza y construcción de los datos: un enfoque desde la inteligencia artificial Universidad del Cauca Facultad de Ingeniería Electrónica y Telecomunicaciones Programas de Maestría y Doctorado en Ingeniería Telemática Seminario de Investigación Evaluación, limpieza y construcción de

Más detalles

Gestión y Desarrollo de Requisitos en Proyectos Software

Gestión y Desarrollo de Requisitos en Proyectos Software Gestión y Desarrollo de Requisitos en Proyectos Software Ponente: María Jesús Anciano Martín Objetivo Objetivo Definir un conjunto articulado y bien balanceado de métodos para el flujo de trabajo de Ingeniería

Más detalles

SOFTWARE PLANNING PROJECTS UNDER THE PMI GUIDELINES PLANEACION DE PROYECTOS DE SOFTWARE BAJO LINEAMIENTOS DEL PMI. MSc. Mauricio Rojas Contreras

SOFTWARE PLANNING PROJECTS UNDER THE PMI GUIDELINES PLANEACION DE PROYECTOS DE SOFTWARE BAJO LINEAMIENTOS DEL PMI. MSc. Mauricio Rojas Contreras Recibido: 06 de agosto de 2009 Aceptado: 21 de octubre de 2009 SOFTWARE PLANNING PROJECTS UNDER THE PMI GUIDELINES PLANEACION DE PROYECTOS DE SOFTWARE BAJO LINEAMIENTOS DEL PMI MSc. Mauricio Rojas Contreras

Más detalles

Fábrica de Software. Documento de Proceso de la Gerencia de SQA

Fábrica de Software. Documento de Proceso de la Gerencia de SQA PONTIFICIA UNIVERSIDAD CATÓLICA DE CHILE ESCUELA DE INGENIERÍA DEPARTAMENTO DE CIENCIA DE LA COMPUTACIÓN Fábrica de Software Documento de Proceso de la Gerencia de SQA Escrito de acuerdo a la norma PSS-05,

Más detalles

Glosario. actividad. 1. (tarea) 2. es un subproceso que no requiere mas descomposición.

Glosario. actividad. 1. (tarea) 2. es un subproceso que no requiere mas descomposición. Glosario Aclaraciones Los conceptos del glosario están ordenados alfabéticamente. Un concepto puede ser un único término como meta o una frase como ambiente de ingeniería de software centrado en procesos.

Más detalles

Alicia Iriberri Dirección de Tecnologías de Información. I.- Definición del foco estratégico

Alicia Iriberri Dirección de Tecnologías de Información. I.- Definición del foco estratégico Alicia Iriberri Dirección de Tecnologías de Información I.- Definición del foco estratégico II.- Establecimiento de mediciones a través del Balanced Scorecard (Tablero de Comando) III.- Despliegue del

Más detalles

Departamento de Informática y Automática INGENIERÍA DEL SOFTWARE PARTE I: TEST EXAMEN FINAL

Departamento de Informática y Automática INGENIERÍA DEL SOFTWARE PARTE I: TEST EXAMEN FINAL Departamento de Informática y Automática INGENIERÍA DEL SOFTWARE PARTE I: TEST EXAMEN FINAL DNI Apellidos y nombre 1. Cuál de las siguientes afirmaciones no es una causa de los problemas del software?

Más detalles

CAMINANDO HACIA LA WEB SEMÁNTICA

CAMINANDO HACIA LA WEB SEMÁNTICA CAMINANDO HACIA LA WEB SEMÁNTICA Jesualdo Tomás Fernández Breis Universidad de Murcia jfernand@um.es Web actual La información que vemos nosotros... Lugares para viajar y precio Ofertas de Viajes Viajes

Más detalles

Integrando Información de Fuentes Relevantes para un Sistema Recomendador

Integrando Información de Fuentes Relevantes para un Sistema Recomendador Integrando Información de Fuentes Relevantes para un Sistema Recomendador Silvana Aciar, Josefina López Herrera and Javier Guzmán Obando Agents Research Laboratory University of Girona {saciar, jguzmano}@eia.udg.es,

Más detalles

Capítulo 1. Introducción

Capítulo 1. Introducción Capítulo 1. Introducción 1.1. Propósito de la Guía BABOK El propósito principal de la Guía BABOK Guide es definir la profesión del Análisis de Negocio y proveer un conjunto de prácticas comúnmente aceptadas.

Más detalles

Proceso de Arquitectura de Software. Segunda. Semana. Dr. Cuauhtémoc Lemus Olalde. Noviembre 7, 2002. Informática

Proceso de Arquitectura de Software. Segunda. Semana. Dr. Cuauhtémoc Lemus Olalde. Noviembre 7, 2002. Informática Segunda Semana de Informática Proceso de Arquitectura de Software Dr. Cuauhtémoc Lemus Olalde Noviembre 7, 2002 Desarrollo Tradicional Requerimientos Diseño Codificación e Integración Prueba y Aceptación

Más detalles

Computing, nuevos horizontes para. Guía a de temas a desarrollar

Computing, nuevos horizontes para. Guía a de temas a desarrollar Acuerdo de Bibliotecas Universitarias de Córdoba Seminario 27 y 28 de septiembre de 2012 Web semántica ntica,, Web 3.0 y entornos Cloud Computing, nuevos horizontes para bibliotecarios, documentalistas

Más detalles

Temas Selectos de Programación II

Temas Selectos de Programación II Temas Selectos de Programación II Métricas de Procesos de Software Jorge Moisés Trejo Vargas Maestría en Ciencias de la Computación Outline Introducción Procesos de Software Definición Métricas Programas

Más detalles

Resumen General del Manual de Organización y Funciones

Resumen General del Manual de Organización y Funciones Gerencia de Tecnologías de Información Resumen General del Manual de Organización y Funciones (El Manual de Organización y Funciones fue aprobado por Resolución Administrativa SBS N 354-2011, del 17 de

Más detalles

RESUMEN DE COBIT 4.1. Los recursos de TI identificados en COBIT se pueden definir como sigue [2]:

RESUMEN DE COBIT 4.1. Los recursos de TI identificados en COBIT se pueden definir como sigue [2]: RESUMEN DE COBIT 4.1 COBIT es un marco de trabajo y un conjunto de herramientas de Gobierno de Tecnología de Información (TI) que permite a la Gerencia cerrar la brecha entre los requerimientos de control,

Más detalles

Bibliografía Anotada

Bibliografía Anotada Maestría en Ingeniería de Sistemas y Computación Universidad Nacional de Colombia Bogotá D.C. June 2, 2006 Contenido Tema Amplio 1 Tema Amplio 2 3 4 5 Tema Tema Amplio Extracción de información y obtención

Más detalles

Arquitectura de Aplicaciones

Arquitectura de Aplicaciones 1 Capítulo 13: Arquitectura de aplicaciones. - Sommerville Contenidos del capítulo 13.1 Sistemas de procesamiento de datos 13.2 Sistemas de procesamiento de transacciones 13.3 Sistemas de procesamiento

Más detalles

RUP. Rational Unified Process

RUP. Rational Unified Process RUP Rational Unified Process Rational Unified Process Basado en 6 mejores prácticas de la industria de software: Desarrollo incremental Administración de requisitos Uso de arquitecturas basadas en componentes

Más detalles

Software Architecture Assesment. Rosa Virginia Icedo Ojeda Jorge Moisés Trejo Vargas Mayo 2003

Software Architecture Assesment. Rosa Virginia Icedo Ojeda Jorge Moisés Trejo Vargas Mayo 2003 Software Architecture Assesment Rosa Virginia Icedo Ojeda Jorge Moisés Trejo Vargas Mayo 2003 Outline Software Architecture Assesment Arquitectura de Sofwtare (AS) Por qué evaluar una AS? Qué evaluamos

Más detalles

<TITULO DEL PROYECTO DE DESARROLLO DE SW > Diana Milena Pérez Riveros 1 Diana Milena Pérez Riveros Pagina de

Más detalles

Tema 1 Introducción a los Sistemas Basados en el Conocimiento

Tema 1 Introducción a los Sistemas Basados en el Conocimiento Tema 1 Introducción a los Sistemas Basados en el Conocimiento Sistemas Basados en el Conocimiento Grado en Ingeniería Informática 1 Referencias Ingeniería del Conocimiento. A. Gómez, N. Juristo, C. Montes,

Más detalles

UNIDAD 2: Abstracción del Mundo real Al Paradigma Orientado a Objetos

UNIDAD 2: Abstracción del Mundo real Al Paradigma Orientado a Objetos 2.1. Principios básicos del Modelado de Objetos UNIDAD 2: Abstracción del Mundo real Al Paradigma Orientado a Objetos Hoy en día muchos de los procesos que intervienen en un negocio o empresa y que resuelven

Más detalles

Análisis Comparativo de Modelos de Calidad

Análisis Comparativo de Modelos de Calidad Análisis Comparativo de Modelos de Calidad Identificación de Mejores Prácticas para la Gestión de Calidad en Pequeños Entornos Vianca Vega Zepeda Departamento de Ingeniería de Sistemas y Computación Universidad

Más detalles

calidad brochure Software Quality Assurance/Project Management IDEOLOGY INTELLIGENCE INFORMATION IMPR INNOVATION ISO 9001:2000

calidad brochure Software Quality Assurance/Project Management IDEOLOGY INTELLIGENCE INFORMATION IMPR INNOVATION ISO 9001:2000 calidad 2009 brochure Software Quality Assurance/Project Management IDEOLOGY INTELLIGENCE INFORMATION IMPR INNOVATION Software Quality Assurance Project Management Dos de los factores que más positivamente

Más detalles

FOG: ARQUITECTURA FLEXIBLE PARA LA GENERACIÓN AUTOMÁTICA DE ONTOLOGÍAS

FOG: ARQUITECTURA FLEXIBLE PARA LA GENERACIÓN AUTOMÁTICA DE ONTOLOGÍAS FOG: ARQUITECTURA FLEXIBLE PARA LA GENERACIÓN AUTOMÁTICA DE ONTOLOGÍAS Emilio F. Viñas 1, Jesús Serrano-Guerrero 2, José A. Olivas 2, Javier de la Mata 2, Andrés Soto 3, Departamento de Tecnologías y Sistemas

Más detalles

Web Semántica: un nuevo enfoque hacia la Organización de Información en los Sistemas de Gestión de Contenidos.

Web Semántica: un nuevo enfoque hacia la Organización de Información en los Sistemas de Gestión de Contenidos. Web Semántica: un nuevo enfoque hacia la Organización de Información en los Sistemas de Gestión de Contenidos. Autor: Lic. Keilyn Rodríguez Perojo. Licenciado en Bibliotecologías y Ciencias de la Información.

Más detalles

Data Mining Técnicas y herramientas

Data Mining Técnicas y herramientas Data Mining Técnicas y herramientas Introducción POR QUÉ? Empresas necesitan aprender de sus datos para crear una relación one-toone con sus clientes. Recogen datos de todos lo procesos. Datos recogidos

Más detalles

LINQ TO AMAZON PLAN DE PROYECTO. Versión 1.2

LINQ TO AMAZON PLAN DE PROYECTO. Versión 1.2 LINQ TO AMAZON PLAN DE PROYECTO Versión 1.2 Historia de revisiones Fecha Versión Descripción Autor 23/08/2008 1.0 Creación del documento. Martín Rivadavia 20/08/2008 1.1 Correcciones. Martín Rivadavia

Más detalles

Introducción. Metadatos

Introducción. Metadatos Introducción La red crece por momentos las necesidades que parecían cubiertas hace relativamente poco tiempo empiezan a quedarse obsoletas. Deben buscarse nuevas soluciones que dinamicen los sistemas de

Más detalles

Ontología para un Sistema de Calidad para la Industria Automotriz basado en la Norma ISO/TS 16949

Ontología para un Sistema de Calidad para la Industria Automotriz basado en la Norma ISO/TS 16949 Ontología para un Sistema de Calidad para la Industria Automotriz basado en la Norma ISO/TS 16949 Francisco E. Castillo 1 y Héctor L. Duran 2 (1) Universidad de Guadalajara, CUCEA, Doctorado en Tecnologías

Más detalles

INSTRUCTIVO PARA LLENAR EL MANUAL DE PROCESOS V 1.0

INSTRUCTIVO PARA LLENAR EL MANUAL DE PROCESOS V 1.0 INSTRUCTIVO PARA LLENAR EL MANUAL DE PROCESOS V 1.0 Página 1 de 12 FIRMAS DE REVISIÓN Y APROBACIÓN Nombre / Cargo Firma Fecha Elaborado por: Equipo de Proyectos 26/08/2013 Revisado por: Aprobado por: Dirección

Más detalles

Desarrollo de Ontologías

Desarrollo de Ontologías Desarrollo de Ontologías ECSDI LSI-FIB-UPC cbea Curso 2014/2015 ECSDI (LSI-FIB-UPC cbea) Desarrollo de Ontologías Curso 2014/2015 1 / 31 Índice 1 Introducción 2 Metodologías de desarrollo ECSDI (LSI-FIB-UPC

Más detalles

Tecnología de la Información. Administración de Recursos Informáticos

Tecnología de la Información. Administración de Recursos Informáticos Tecnología de la Información Administración de Recursos Informáticos 1. Recursos informáticos: Roles y Responsabilidades 2. Áreas dentro del Departamento de Sistemas 3. Conceptos asociados a proyectos

Más detalles

Clientes Donantonio. Especificación de requisitos software. Juan José Amor David Escorial Ismael Olea

Clientes Donantonio. Especificación de requisitos software. Juan José Amor David Escorial Ismael Olea Especificación de requisitos software Tabla de contenidos Juan José Amor David Escorial Ismael Olea 1. Introducción...3 1.1. Propósito...3 1.2. Ámbito del sistema...3 1.3. Definiciones, acrónimos y abreviaturas...3

Más detalles

Introducción a las Ontologías

Introducción a las Ontologías Introducción a las Ontologías Gtión del Conocimiento Dr. Ariel Monterin ISISTAN Facultad de Ciencias. Exactas- UNICEN Conceptos principal Lenguaj para la construcción de Razonamiento con Conclusion Conceptos

Más detalles

Transformación de modelos en el proceso de obtención de Modelos Conceptuales partiendo de BPMN

Transformación de modelos en el proceso de obtención de Modelos Conceptuales partiendo de BPMN Transformación de modelos en el proceso de obtención de Modelos Conceptuales partiendo de BPMN Fernández Taurant, Juan Pablo Marciszack, Marcelo Martín Universidad Tecnológica Nacional, Facultad Regional

Más detalles

ASIGNATURA: Tecnologías de Información y Comunicación II

ASIGNATURA: Tecnologías de Información y Comunicación II ASIGNATURA: Tecnologías de Información y Comunicación II 53 HORAS DESCRIPCIÓN DE LA ASIGNATURA: Esta asignatura proporciona al alumno las competencias y herramientas teóricas necesarias para la aplicación

Más detalles

Centro de Investigación en Matemáticas, A.C.

Centro de Investigación en Matemáticas, A.C. Centro de Investigación en Matemáticas, A.C. Temas Selectos de Programación Avanzada II (Temas Selectos de Ingeniería de Software) Reporte Final Métricas de Procesos de Software Maestría en Ciencias de

Más detalles

Desarrollo de Aplicaciones Web 3.0

Desarrollo de Aplicaciones Web 3.0 #SGWeb3.0 Presentación de Desarrollo de Aplicaciones Web 3.0 Linked Data + BPM + Cloud Agenda 1 Quién es INFOTEC? 2 Evolución de la Web 2 La Web SemánMca 3 Linked Data 4 Desarrollo Dirigido por Ontologías

Más detalles

Mantenimiento del Software

Mantenimiento del Software Mantenimiento del Software S3 Francisco Ruiz, Macario Polo Grupo Alarcos Dep. de Informática ESCUELA SUPERIOR DE INFORMÁTICA UNIVERSIDAD DE CASTILLA-LA MANCHA http://alarcos.inf-cr.uclm.es/doc/mso/ Ciudad

Más detalles

WEBBER: USO DE COMPONENTES PARA LA ARMONIZACIÓN DE CONTENIDOS Y METADATOS

WEBBER: USO DE COMPONENTES PARA LA ARMONIZACIÓN DE CONTENIDOS Y METADATOS WEBBER: USO DE COMPONENTES PARA LA ARMONIZACIÓN DE CONTENIDOS Y METADATOS Autores: Introducción Diego R. López RedIRIS diego.lopez@rediris.es El trabajo necesario para mantener un servidor de información

Más detalles

Especificación de Requisitos del Sistema de Registro y Control de Bienes Muebles de la ULA (ULA_SRCBM, versión 1.0)

Especificación de Requisitos del Sistema de Registro y Control de Bienes Muebles de la ULA (ULA_SRCBM, versión 1.0) Proyecto: Actualización del Sistema de Información de Muebles Documento: Especificación de s del Sistema de Registro y Control de Muebles ULA (ULA_SRCBM, versión 1.0) Elaborado por: William J. Montilva

Más detalles

EPB 603 Sistemas del Conocimiento!"#$ %& $ %'

EPB 603 Sistemas del Conocimiento!#$ %& $ %' Metodología para el Desarrollo de Proyectos en Minería de Datos CRISP-DM EPB 603 Sistemas del Conocimiento!"#$ %& $ %' Modelos de proceso para proyectos de Data Mining (DM) Son diversos los modelos de

Más detalles

Escenarios. Diapositiva 1. Ingeniería de Requerimientos: Escenarios

Escenarios. Diapositiva 1. Ingeniería de Requerimientos: Escenarios Escenarios Diapositiva 1. Ingeniería de Requerimientos: Escenarios Diapositiva 2. Uso de lenguaje natural Debido a que uno de los objetivos de la Ingeniería de Requisitos es aumentar el conocimiento del

Más detalles

Calidad de Datos como Valor Estratégico de la Información en E-Business

Calidad de Datos como Valor Estratégico de la Información en E-Business Calidad de Datos como Valor Estratégico de la Información en E-Business Marta E. Cabrera Villafañe, Germán Antonio Montejano, Mario Berón Departamento de Informática Universidad Nacional de San Luis Ejército

Más detalles

Evaluación de una Metodología para la construcción de Data Warehouses

Evaluación de una Metodología para la construcción de Data Warehouses Instituto de Computación Facultad de Ingeniería Universidad de la República Evaluación de una Metodología para la construcción de Data Warehouses Data Warehouse para la plataforma EVA Agustín Mullin Proyecto

Más detalles

DISEÑO DE UN CURSO INTERACTIVO Y ADAPTATIVO DE PROCESADORES DE LENGUAJES

DISEÑO DE UN CURSO INTERACTIVO Y ADAPTATIVO DE PROCESADORES DE LENGUAJES Alfonseca, M., Carro, R.M., Pulido, E. and Rodríguez, P. (2000): Diseño de un curso interactivo y adaptativo de procesadores de lenguajes. Proceedings of JENUI 2000: VI Jornadas sobre la Enseñanza Universitaria

Más detalles

CONCEPTOS DE CALIDAD Y CALIDAD DEL SOFTWARE

CONCEPTOS DE CALIDAD Y CALIDAD DEL SOFTWARE CONCEPTOS DE CALIDAD Y CALIDAD DEL SOFTWARE INTRODUCCIÓN El avance informático actual es muy alto comparado con lo se tenía en los años 90, al hablar de desarrollo de software se hace más notable, en el

Más detalles

APOYO PARA LA TOMA DE DECISIONES

APOYO PARA LA TOMA DE DECISIONES APOYO PARA LA TOMA DE DECISIONES Cátedra: Gestión de Datos Profesor: Santiago Pérez Año: 2006 Bibliografía: Introducción a las Bases de Datos. DATE - 1 - 1. INTRODUCCION APOYO PARA LA TOMA DE DECISIONES

Más detalles

4. SUMILLA 1. CMMI v 1.2 2. People Software Process & Team Software Process 3. Estándares ISO/IEC 4. Técnicas de Prueba de Software

4. SUMILLA 1. CMMI v 1.2 2. People Software Process & Team Software Process 3. Estándares ISO/IEC 4. Técnicas de Prueba de Software Universidad Católica San Pablo Facultad de Ingeniería y Computación Programa Profesional de Ciencia de la Computación SILABO CS391. Calidad de Software (Obligatorio) 2014-2 1. DATOS GENERALES 1.1 CARRERA

Más detalles

Arquitectura para análisis de información. Zombi es una arquitectura que proporciona de manera integrada los componentes

Arquitectura para análisis de información. Zombi es una arquitectura que proporciona de manera integrada los componentes Capítulo 4 Arquitectura para análisis de información propuesta 4.1 Arquitectura Zombi es una arquitectura que proporciona de manera integrada los componentes necesarios para el análisis de información

Más detalles

SISTEMA INFORMÁTICO PARA LA GESTIÓN DEL CONOCIMIENTO Y SU REPRESENTACIÓN. EL LENGUAJE +GBIT

SISTEMA INFORMÁTICO PARA LA GESTIÓN DEL CONOCIMIENTO Y SU REPRESENTACIÓN. EL LENGUAJE +GBIT SISTEMA INFORMÁTICO PARA LA GESTIÓN DEL CONOCIMIENTO Y SU REPRESENTACIÓN. EL LENGUAJE +GBIT Javier Alfonso Cendón javier.alfonso@unileon.es Francisco Rodríguez Sedano francisco.sedano@unileon.es Carmen

Más detalles

Administración de Conocimiento como soporte al Mantenimiento de Software

Administración de Conocimiento como soporte al Mantenimiento de Software Administración de Conocimiento como soporte al Mantenimiento de Software Oscar M. Rodríguez 1, Ana I. Martínez 1, Jesús Favela 1, Aurora Vizcaíno 2 1 CICESE, Departamento de Ciencias de la Computación,

Más detalles