Ontologias. 2 Marcelo A. Soria Maestria en Data Mining. DC-FCEN

Documentos relacionados
Sistemas de Conocimiento para la Recuperación de Información

Programación orientada a objetos. Capítulo 8 Mejora de las estructuras mediante herencia

Construcción de un modelo conceptual para gramáticas formales y máquinas abstractas con ontologías usando Protégé

Qué es una ontología?

Las redes semánticas intentan trasladar esa afirmación a un formalismo Una red semántica será un grafo donde:

Programación Orientada a Objetos (POO)

Desarrollando una ontología sencilla Curso de Doctorado: Sistemas Multiagente Dpt. Informática Curso

Introducción a Protégé

Herencia. Hay clases que comparten gran parte de sus características.

CLA. Diagramas de clases en Métrica V3

HERENCIA Y TIPOS. Articulo. Video Audio Altavoces. Amplificador

Bases de Datos OTROS ASPECTOS MODELO E-R

Mapa Curricular: Funciones y Modelos

Diseño Web Avanzado con HTML5 y CSS3

UML (Lenguaje de Modelado Unificado) y Diagramas de Casos de Uso

El Modelo Relacional. Carlos A. Olarte BDI

Tablas Hash y árboles binarios

Cristian Blanco

El Modelo Relacional. Carlos A. Olarte BDI


MAPA DE CONCEPTOS DR. LAMBERTO VERA VÉLEZ DEPARTAMENTO DE EDUCACIÓN Y CIENCIAS SOCIALES UNIVERSIDAD INTERAMERICANA DE PUERTO RICO RECINTO DE PONCE

Prof. Mariano Mancuso. Sistemas de información y control diagrama de clases

Base de Datos. Docente: Ing. Francisco Rodríguez BASE DATOS. Resultados. Internet. Requerimientos

La función, definida para toda, es periódica si existe un número positivo tal que

Relaciones. Estructuras Discretas. Relaciones. Relaciones en un Conjunto. Propiedades de Relaciones en A Reflexividad

ESPACIOS VECTORIALES

Elementos Diagramas de Clases Clase:

Reporte de la prueba de habilidad

Materia: Matemáticas de 4to año. Tema: Logaritmos naturales y base 10. Marco Teórico

Enfoque de Desarrollo de software OO

BASES DE DATOS TEMA 2 MODELOS DE DATOS

20483 Programación en C#

Tema 11.- Autovalores y Autovectores.

TABLA DE CONTENIDOS. Dedicatoria. Agradecimientos. Tabla de Contenidos. Índice de Figuras. Índice de Tablas. Resumen

Capítulo 16. Diagrama de Clases UML

Diagramas De Casos De Uso

EJERCICIOS DE EXCEL BASICO

Análisis y modelado de sistemas de software. Diseño Persistencia de objetos. Blanca A. Vargas Govea

crédito. Por ejemplo si la institución ha fijado que los clientes buenos son aquellos que tienen 500 puntos o más, este cliente sería rechazado.

Conceptos básicos de Geometría

Profra. Mejía Villegas Dalia REDE -03 Grupo: 106

Tipos algebraicos y abstractos. Algoritmos y Estructuras de Datos I. Tipos algebraicos

como el número real que resulta del producto matricial y se nota por:

CL 12 CLASE 12 SIG 7: GEOPROCESOS Y ANÁLISIS VECTORIAL CONTENIDO

INTRODUCCIÓN AL PARADIGMA DE LA PROGRAMACIÓN ORIENTADA A OBJETOS CON JAVA

Java Avanzado Facultad de Ingeniería. Escuela de computación.

Álgebra Lineal Ma1010

1 Representación por superficies de polígonos

PERSISTENCIA DE OBJETOS EN BASE DE DATOS RELACIONALES FRANCISCO LEÓN NAJERA CÓDIGO: CEDULA:

Alícuotas y Bases de Cálculo

Capítulo 6. Relaciones. Continuar

UML Unifield Modeling Languaje

NÚCLEO DE BOLÍVAR CÓDIGO: Horas Teóricas Horas para Evaluaciones Horas Perdidas Horas Efectivas

Liderando Proyectos de software para dispositivos de Apple. Creatividapps

CC BASES DE DATOS PRIMAVERA Clase 4: Modelo Relacional (III) Aidan Hogan

Tema 7. El sistema de clases

UNIDAD 1: NÚMEROS NATURALES OBJETIVOS

Mapa Curricular: Funciones y Modelos

Modificación Valuación Unidades de PH

Trigonometría y Análisis Vectorial

Aplicación del modelo de frontera estocástica de producción para analizar la eficiencia técnica de la industria eléctrica en México

PROCEDIMIENTO ACCIONES PREVENTIVAS, CORRECTIVAS Y DE MEJORA

Espacios Vectoriales

Ejemplo: El problema de la mochila. Algoritmos golosos. Algoritmos y Estructuras de Datos III. Segundo cuatrimestre 2013

NÚMEROS COMPLEJOS: C

Cátedra de Bases de Datos

Límites de funciones de varias variables.

UNIVERSIDAD ALAS PERUANAS FACULTAD DE CIENCIAS DE LA COMUNICACIÓN SILABO POR COMPETENCIA

UD.3. Tema 11. Costes en bibliotecas y centros de información

Teoría de Conjuntos y Conjuntos Numéricos

Guía de Ejercicios: Funciones

Representación del Conocimiento Otros formalismos. Licenciatura en Ciencias de la Computación. Introducción a la Inteligencia Artificial.

Tutorial MT-b11. Matemática Tutorial Nivel Básico. Inecuaciones e intervalos

Conjuntos y funciones convexas

Minería de Datos Web. 1 er Cuatrimestre Página Web. Prof. Dra. Daniela Godoy.

Números reales. Valor absoluto. Desigualdades. Distancias entre la recta real. Intervalos y entornos.

Unidad 5: MODELO DE COMPORTAMIENTO - ESQUEMA DE DATOS CARACTERÍSTICAS DEL ESQUEMA DE DATOS DIAGRAMA ENTIDAD RELACIÓN (D.E.R.)

Algebra Lineal y Geometría.

Transformaciones entre el modelo Relacional y el modelo de Clases.

Casos de Uso. Introducción. Actores

CURSO DE EXCEL -INTERMEDIO

Curso de Java POO: Programación orientada a objetos

Universidad de Managua

1.2 Definición de una ecuación diferencial

Sistemas de Información II Requerimientos. Análisis de Requisitos

5to. ESTANDARES MATEMATICOS COMUNES FUNDAMENTALS

UNIVERSIDAD DE EL SALVADOR FACULTAD DE JURISPRUDENCIA Y CIENCIAS SOCIALES ESCUELA DE CIENCIAS JURIDICAS

Las Funciones Trigonométricas. Sección 5.3 Funciones Trigonométricas de números reales

Análisis de imágenes digitales

Análisis del Costo Riesgo Beneficio y el Ciclo de Vida de los Activos de una Empresa

Aprendizaje Automatizado

Introducción a los espacios vectoriales

La eficiencia de los programas

Fundamentos de Ingeniería de Software [Etapas II]

Suma de números enteros

Diseño lógico de. Bases de Datos. Modelo. Entidad - Relación

Técnicas de modelado. Problemas adicionales

Patrones Creacionales Builder. Patrones Creacionales Abstract Factory. Patrones Creacionales Singleton. Patrones Creacionales Prototype

Entidad Formadora: Plan Local De Formación Convocatoria 2010

Bloque 2. Geometría. 2. Vectores. 1. El plano como conjunto de puntos. Ejes de coordenadas

Transcripción:

Aplicaciones de Data Mining en ciencia y tecnología Ontologias. 2

Desarrollo de ontologías Clases Clases slots slots Clases facetas o restricciones de rol Clases

Desarrollo de ontologías Clases Slots Facetas Las clases son el centro de las ontologías Describen conceptos de un dominio Se relacionan jerárquicamente con superclases y subclases Describen las propiedades de las clases y sus instancias Son los tipos de datos y rangos de valores que puede tomar un slot

Metodología de desarrollo de ontologías 1. Cuál es el dominio y alcance de la ontología? Quién va a usar la ontología? Para qué? Quién la va a mantener? Formular preguntas de competencia Son ejemplos de las preguntas típicas que haría un usuario de la ontología 2. Existe alguna ontología que se pueda reutilizar? http://owl.cs.manchester.ac.uk/repository/ http://www.daml.org/ontologies/ http://olp.dfki.de/ontoselect/

Metodología de desarrollo de ontologías 3. Enumerar términos importantes para la ontología Preparar una lista de sustantivos y acciones que describan los conceptos que debería incluir la ontología Se pueden establecer propiedades para los términos? 4. Definir las clases y las relaciones jerárquicas entre ellas Se utilizan metodologías top-dow, bottom-up o combinadas Este proceso es iterativo 5. Definir los slots Determinar el tipo de propiedades: intrínsecas, extrínsecas, partes-de, relaciones con otros individuos Las clases heredan todos los slots de las superclases

Metodología de desarrollo de ontologías 6. Definir las restricciones de rol de los slots Determinar el tipo de valor de los slots: String, Number, Boolean, Enumerated (listas de valores permitidos), Instance (relaciones con otras clases) Establecer el rango y dominio de los slots de tipo Instance: el rango es el conjunto de clases admitidas y el dominio son las clases que incluyen al slot 7. Crear instancias

Algunos puntos importantes durante el desarrollo. 1 Prestar atención a las relaciones entre clases qué es más conveniente: is-a, has-a, kind-of, otra? Verificar que las clases hermanas no sean subclases is-a ocultas Una subclase sólo se justifica si agrega información a la clase parental Usar sólo plurales o singulares para nombrar clases. Ayuda a evitar el problema anterior Las relaciones de transitividad tienen sentido? Evitar los ciclos en las jerarquías

Algunos puntos importantes durante el desarrollo. 2 La profundidad de la jerarquía es excesiva? O la jerarquía es muy plana? Las relaciones de herencia múltiple son claras? Son suficientes? Recordar que las ontologías son dinámicas y se modifican con el uso y al adquirir experiencia Al modificar una ontología, preguntar(se) Se debe crear una clase nueva o agregar una propiedad a una clase existente? agregar una clase, o una instancia?

Similitud semántica entre nodos de una ontología La similitud semántica entre dos términos en una medida del parecido entre dos términos que pertenecen a una lista Se puede pensar una ontología como una estructura donde los nodos (términos) cercanos son más similares entre si que otros más alejados

Cómo se puede medir la similitud semántica?

Tres familias de medidas de similitud semántica: Medidas que usan el contenido de la información (IC): IC(t i ) = -log(p(t i )) p(t i ): probabilidad de ocurrencia del término t i en el corpus*. Para calcular p(t i ) debemos tener en cuenta la frecuencia de t i y todos sus términos relacionados corpus: en análisis de textos es una colección de documentos; en bioinformática, la totalidad de términos GO asignados a un genoma

Cálculo de la probabilidad de ocurrencia de t i freq t i = citas t i c desc t i citas c La frecuencia del término t i es la cantidad de veces que éste aparece citado, más todas las citas de sus descendientes p t i =freq t i / freq raiz La probabilidad de t i es el cociente entre su frecuencia y la frecuencia de la raíz de la ontología, o sea, la suma de todas las citas.

IC(t i ) = -log(p(t i )) entonces, un término poco frecuente tiene un contenido de información mayor que uno más frecuente Similitud semántica entre nodos de una ontología sim Re s t 1, t 2 =IC MAC medida de Resnik MAC: menor ancestro común 2 log p MAC sim t 1, t 2 = Li log p t 1 log p t 2 medida de Li

Extensión a objetos con más de un término ontológico asignado (p.ej., dos genes con varios GO cada uno) 1. Realizar todas las comparaciones pareadas entre los términos de un objeto con los términos del otro. 2. Si en la comparación pareada los dos términos son idénticos, ese el MAC entre ellos. 3. Para términos diferentes, determinar el MAC 4. La similitud entre objetos es la media de los IC o el máximo IC

Medidas de similitud de superposición de términos sim st g 1, g 2 = citas g1 citas g2 sim stn g 1, g 2 = citas g1 citas g2 min citas g1, citas g2 En ambas medidas se determina la intersección entre los conjuntos de términos a cada objeto, incluyendo los ancestros y excluyendo la raíz. La segunda es una medida normalizada.

Medidas de similitud en el modelo de espacio vectorial sim cos g 1, g 2 = v 1.v 2 v 1 v 2 similitud coseno v 1 y v 2 son los vectores de atributos (p.ej., los términos GO compartidos) v 1.v 2 es el producto escalar entre los dos vectores v es la norma del vector (raíz cuadrada del producto escalar del vector consigo mismo) Esta medida no depende de las relaciones ontológicas