EVALUACIÓN DE LA INTEGRACIÓN SEMÁNTICA EN REPRESENTACIONES MULTIESCALA



Documentos relacionados
Elementos requeridos para crearlos (ejemplo: el compilador)

Sistemas de Información Geográficos (SIG o GIS)

Ingeniería del Software I Clase de Testing Funcional 2do. Cuatrimestre de 2007

Estas visiones de la información, denominadas vistas, se pueden identificar de varias formas.

Introducción. Metadatos

Base de datos en Excel

Ecuaciones de primer grado con dos incógnitas

Resumen ÁREA DE FACTURACIÓN::INFORMES::Pedidos Detalle Resumen ÁREA DE

Gestión de la Configuración

Caso práctico de Cuadro de Mando con Tablas Dinámicas

Syllabus Geomarketing. Master Universitario en Gestión Comercial y Máster en Dirección de Marketing

QUÉ ES LA RENTABILIDAD Y CÓMO MEDIRLA. La rentabilidad mide la eficiencia con la cual una empresa utiliza sus recursos financieros.

PARTE 3 ECUACIONES DE EQUIVALENCIA FINANCIERA T E M A S

1.2 Qué es un Sistemas de Información Geográfica?

Mesa de Ayuda Interna

de la empresa Al finalizar la unidad, el alumno:

Servicio de administración de pautas publicitarias en Internet

GUÍA PARA LA PRESENTACIÓN DE PROPUESTAS UIS INGENIUM 2015

FASES DEL PROCESO DE RESOLUCIÓN DE PROBLEMAS

Capítulo 5: METODOLOGÍA APLICABLE A LAS NORMAS NE AI

Indicadores para la generación de conocimiento acerca de la evaluación de la calidad de las instituciones educativas

GUÍA TÉCNICA PARA LA DEFINICIÓN DE COMPROMISOS DE CALIDAD Y SUS INDICADORES

CAPÍTULO VI CONCLUSIONES Y RECOMENDACIONES

TABLA DE DECISION. Consideremos la siguiente tabla, expresada en forma genérica, como ejemplo y establezcamos la manera en que debe leerse.

PERFIL DEL PUESTO POR COMPETENCIAS Sepa cómo construirlo y evitar bajos desempeños posteriores

2O21 METAS EDUCATIVAS LA EDUCACIÓN QUE QUEREMOS PARA LA GENERACIÓN DE LOS BICENTENARIOS

CAPITULO V. SIMULACION DEL SISTEMA 5.1 DISEÑO DEL MODELO

CONSTRUCCIÓN DEL PROCESO MESA DE AYUDA INTERNA. BizAgi Process Modeler

Unidad 1. Fundamentos en Gestión de Riesgos

Parte I: Introducción

Ejercicio de estadística para 3º de la ESO

Capítulo VI. Diagramas de Entidad Relación

Para optimizar este proceso lo dividiremos en etapas y deberemos tener bien claro el objetivo que debemos alcanzar en cada una de ellas:

Transformación de modelos en el proceso de obtención de Modelos Conceptuales partiendo de BPMN

Indicaciones específicas para los análisis estadísticos.

El plan estratégico de sistemas de información

ARQUITECTURA DE DISTRIBUCIÓN DE DATOS

El almacén de indicadores de proceso de negocio en ejecución

2.2 Política y objetivos de prevención de riesgos laborales de una organización

Funciones, x, y, gráficos

Sistema de Gestión de la Seguridad de la Información, UNE-ISO/IEC 27001

Capítulo 2. Metodologías de selección de personal

ISO 9001:2000 DOCUMENTO INFORMATIVO DOCUMENTO ELABORADO POR CHRISTIAN NARBARTE PARA EL IVECE

DESARROLLO DE HABILIDADES DEL PENSAMIENTO LÓGICO

TEMA 3: EN QUÉ CONSISTE?

Fórmulas y enfoques utilizados para calcular el Tasa Efectiva de Interés (TEI) o Costo Anual Total (CAT)

3.1 INGENIERIA DE SOFTWARE ORIENTADO A OBJETOS OOSE (IVAR JACOBSON)

INTRODUCCIÓN: Una Visión Global del Proceso de Creación de Empresas

PRODUCTIVIDAD DE PROYECTOS DE DESARROLLO DE SOFTWARE: FACTORES DETERMINANTES E INDICADORES

UNIDAD 2: Abstracción del Mundo real Al Paradigma Orientado a Objetos

1. INTRODUCCIÓN 1.1 INGENIERÍA

Criterios de Selección de Inversiones: El Valor Actual Neto y sus derivados *.

K2BIM Plan de Investigación - Comparación de herramientas para la parametrización asistida de ERP Versión 1.2

CONCILIACIÓN BANCARIA

Un primer acercamiento a la CMDB.

COMPARACIÓN DE ÁREAS DE FIGURAS POR ESTUDIANTES DE PRIMERO DE MAGISTERIO

SEGURIDAD DE LA INFORMACIÓN

Fundación Universitaria San. Direccionamiento IP

Cómo preguntarle a Internet? (tutorial)

5- Uso de sentencias avanzadas

Modelos y Bases de Datos

Correspondencias entre taxonomías XBRL y ontologías en OWL Unai Aguilera, Joseba Abaitua Universidad de Deusto, EmergiaTech

GUÍA METODOLÓGICA PARA LA FORMACIÓN CON E-LEARNING DIRIGIDA A COLECTIVOS SIN ALTA CUALIFICACIÓN CAPÍTULO 4. Dirección Técnica:

Gestión de la Prevención de Riesgos Laborales. 1

CAPITULO I. Introducción. En la actualidad, las empresas están tomando un papel activo en cuanto al uso de sistemas y

1.- Introducción. 2.- Origen de las diferencias bancarias.

CAPITULO 1 INTRODUCCIÓN. Puesta en Evidencia de un circulo virtuoso creado por los SRI entre los Mercados Financieros y las Empresas

Enfoque del Marco Lógico (EML)

ÁRBOL DE PROBLEMA Y ÁREAS DE INTERVENCIÓN

Tecnologías en la Educación Matemática. Expresiones. Datos. Expresiones Aritméticas. Expresiones Aritméticas 19/08/2014

Es de aplicación a todas aquellas situaciones en las que se necesita desplegar un objetivo para obtener una visión clara de cómo debe ser alcanzado.

INTRODUCCIÓN CAPITULO I 1.1 PLANTEAMIENTO DEL PROBLEMA.

POR QUE ES IMPORTANTE ESTABLECER OBJETIVOS EN LA PLANIFICACIÓN DE UN CURSO?

Gestión de Oportunidades


App para realizar consultas al Sistema de Información Estadística de Castilla y León

Módulo 7: Los activos de Seguridad de la Información

Tema 3. Medidas de tendencia central Introducción. Contenido

Estudio sobre el comportamiento de java en las plataformas windows xp y mac-os x usando un prototipo multimedia

QUÉ ES UN PLAN DE EXPORTACIÓN?

2) Se ha considerado únicamente la mano de obra, teniéndose en cuenta las horas utilizadas en cada actividad por unidad de página.

CAPÍTULO VI PREPARACIÓN DEL MODELO EN ALGOR. En este capítulo, se hablará acerca de los pasos a seguir para poder realizar el análisis de

Guía para el diseño y creación de mapas web Una experiencia académica

IMPLANTACIONES DE ERP. CÓMO CONSEGUIR EL ÉXITO? MasEmpresa

Lección 1-Introducción a los Polinomios y Suma y Resta de Polinomios. Dra. Noemí L. Ruiz Limardo 2009

Enginyeria del Software III

Créditos académicos. Ignacio Vélez. Facultad de Ingeniería Industrial. Politécnico Grancolombiano

CRITERIOS BÁSICOS PARA IDENTIFICAR PROBLEMAS (Caballero, 2000)

Licenciatura en CONTADURIA. Tema: APLICACIÓN GENERAL DEL CPM

PUBLICACIÓN INFORMATIVA DE LA ASOCIACIÓN ESPAÑOLA DE FINANCIEROS DE EMPRESA N 64. MARZO

La Formulación de los Antecedentes del Problema de Investigación Científica. (The Formulation of the Scientific Research Problem Background)

1.0 Planteamiento del problema

CAPÍTULO 2 DEFINICIÓN DEL PROBLEMA

Segmentación del Mercado

EL MODELO DE DATOS RASTER

Security Health Check

Jose Mª Cervera Casanovas

I. RENTABILIDAD FINANCIERA

ANÁLISIS DE DATOS NO NUMERICOS

Transcripción:

EVALUACIÓN DE LA INTEGRACIÓN SEMÁNTICA EN REPRESENTACIONES MULTIESCALA SERGIO E. SOLANO PINEDO 1 ; MARCO A. MORENO IBARRA 2 ; MIGUEL J. TORRES RUIZ 3 Centro de Investigación en Computación Instituto Politécnico Nacional C.P. 07738, México D.F. 1 spinedob09@sagitario.cic.ipn.mx, 2 marcomoreno@cic.ipn.mx, 3 mtorres@cic.ipn.mx RESUMEN Hoy en día existe un creciente interés por el uso de Sistemas de Información Geográfica así como una gran variedad de datos geográficos, los cuales tienen características muy diversas. Frecuentemente se desarrollan bases de datos espaciales en donde se integran diversas representaciones de un mismo fenómeno geográfico, llamadas representaciones múltiples, pero al trabajar con ellas es común que se originen redundancias e inconsistencias. Por tal motivo, se propone una metodología basada en ontologías para identificar las inconsistencias que se generan al integrar representaciones múltiples. Dado el alto costo de los datos geográficos es mejor emplear los ya existentes, siempre y cuando sean consistentes entre sí. Además, proponemos una medición que permita cuantificar y calificar qué tan factible será una integración semántica y espacial al trabajar datos a diferentes escalas. Palabras Clave: semántica, representaciones múltiples, consistencia, interoperabilidad. ABSTRACT Nowadays there exists a growing interest in the use of Geographic Information Systems and a great variety of geographical data, which have very diverse characteristics. Spatial databases are used to integrate different representations about a geographic phenomena (known as multiple representations) are been frequently developed, but in including multiple scale data, it is very common that redundancy and inconsistency is generated. For this reason, an ontology-based methodology is proposed to identify the inconsistencies that may appear in multiple representations. Due to the high cost of obtaining geospatial data it is better to use existing data, whenever they can be consistently handled together. Besides, we propose a measure to assess how plausible a semantic and spatial integration will be with data at different scales. Keywords: semantics, multiple representations, consistency, interoperability. 1

1 Introducción Frecuentemente cuando se desarrolla un Sistema de Información Geográfica (GIS por sus siglas en inglés), uno de los costos más elevados es la obtención de los datos que compondrán la base de datos espacial (BDE) [1]. Es por eso que resulta muy conveniente integrar datos existentes, ya que los costos disminuyen considerablemente. La integración de datos no es un problema sencillo, pues se pueden presentar dificultades como: contar con datos a diferente escala, que los datos manejen diferentes conceptos, que cuenten con diferentes atributos y relaciones, que tengan diferente resolución temática y espacial o que se origine redundancia o inconsistencias. Asimismo, cada representación es una descripción de la realidad con un nivel de detalle en particular que contiene las características espaciales y temáticas de la información [2]. En este artículo se describen los problemas que se originan al integrar, bajo un esquema común de BDE, datos de diversas escalas, que corresponden a la misma área geográfica, comúnmente denominadas bases de datos de representación múltiple (MRDB) o simplemente representaciones múltiples [3]. Los problemas para integrar representaciones múltiples es que se requiere de datos que sean interoperables entre sí, esto es, que entre representaciones los datos no se contradigan. Recientemente la interoperabilidad de los datos geoespaciales ha ganado importancia y atención de las comunidades académica, científica y profesional [4], importancia propiciada por la gran diversidad de fuentes de datos y aplicaciones disponibles, en especial por el desarrollo de las tecnologías geoespaciales como la percepción remota, GPS y otras tecnologías de geoposicionamiento. Además, en este artículo se propone un método para identificar sí son generadas inconsistencias al utilizar, de forma conjunta, datos de diferente escala, lo que permite medir el grado de integración semántica y espacial que poseen la MRDB. El grado de integración se refiere a la viabilidad de trabajar las diferentes representaciones de forma indistinta. Se propone una metodología basada en ontologías para identificar el grado de integración de datos a nivel semántico y espacial (en particular nos enfocaremos en las relaciones topológicas). Se utilizan las ontologías geoespaciales como descripción formal y consensada del dominio, representando las restricciones, entidades y relaciones que son relevantes y válidas [5, 6]. Así, las ontologías capturan la semántica del dominio [7] y describen formalmente un fenómeno del mundo real, permitiendo la integración de información con un enfoque semántico. El uso de ontologías mejora en general la interoperabilidad entre diferentes sistemas de información [7, 8] y GIS [9]. Podemos decir que en nuestro enfoque la identificación de inconsistencias consiste en verificar que los datos geográficos cumplan las reglas, restricciones, axiomas de la ontología [10], comprobando la consistencia semántica entre las representaciones [11]. El resto del documento se encuentra organizado de la siguiente manera, en la Sección 2 se hace una descripción de trabajos relacionados, la descripción del caso de estudio se realiza en la Sección 3. En la Sección 4 se plantea una metodología donde se describen los procedimientos para lograr la descripción del grado de integración y las conclusiones se encuentran en la Sección 5, aquí se describe el trabajo futuro, ventajas y desventajas del proyecto. 2 Antecedentes En esta sección se presentarán términos utilizados en el desarrollo del proyecto, así como algunos trabajos relacionados. Mientras que el mundo real se asume único, el modo de representarlo depende de la intención de la aplicación, así, las representaciones múltiples son representaciones sobre el mismo fenómeno espacial desde puntos de vista diferentes o con un diferente nivel de resolución [2]. Diferentes aplicaciones que comparten interés sobre el mismo fenómeno del mundo 2

real pueden tener diferentes percepciones, necesitando diferentes representaciones, donde cada una es una descripción de la realidad que con un nivel de detalle particular que contiene las características espaciales y temáticas de la información [3]. Las representaciones simples o sencillas es el enfoque tradicional de un GIS donde se maneja la información como un mapa, con resolución y contenido estático, más que como un reflejo del mundo real [12]. Las representaciones múltiples ofrecen una solución a esta limitante, permiten compartir la misma base de datos geográfica entre aplicaciones que perciben la realidad espacial en modos diferentes [13] y dan paso a un análisis de interoperabilidad entre las diferentes representaciones. La interoperabilidad da la oportunidad de localizar información adicional sobre un tema (o temas relacionados) en diferentes fuentes (o representaciones múltiples) que se han desarrollado independientemente [ 2 ]. El Open GIS Consortium define la interoperabilidad como la capacidad de comunicar, ejecutar programas, o transferir datos entre diferentes unidades en un modo que requiere al usuario poco o nulo conocimiento sobre las características particulares de esas unidades [14]. Por otro lado, la interoperabilidad semántica es difícil de conseguir pues el conocimiento (relacionado) probablemente está descrito en términos diferentes en diferentes estructuras de datos [3]. El primero paso hacia logra la interoperabilidad semántica es identificar el conocimiento relacionado, encontrar qué datos describen el mismo fenómeno y analizar si entre ellos existe consistencia. La consistencia se refiere a la falta de contradicciones lógicas en un modelo de la realidad [15], pero no tiene relación con una correcta representación de la realidad. En sí mismo, cada nivel de representaciones puede ser consistente, pero al integrar y comparar diferentes niveles, se puede detectar inconsistencia si las representaciones se contradicen [15]. 3 Caso de estudio Como caso de estudio para este trabajo se consideran representaciones múltiples de estados y poblaciones de la República Mexicana. De una representación se tomará la información de los estados, mientras que de la otra la información de las poblaciones. Se desea saber qué tan factible es manejar estos datos en conjunto, esto es, conocer las inconsistencias que existen entre estas diferentes representaciones. A continuación se muestra un ejemplo del caso de estudio donde la representación de las poblaciones del estado de Hidalgo genera al menos una inconsistencia con respecto a la representación de los estados. En la Figura 1 se muestran dos representaciones, sobre estados y poblaciones a la misma escala. En este caso no se presenta inconsistencia espacial, las dos poblaciones (pertenecientes a Hidalgo) se encuentran dentro del área superior que delimita a Hidalgo. 3

Figura 1 Representación múltiple espacialmente consistente Mientras que en la Figura 2 se muestra la misma representación de las poblaciones pero con otra representación para los estados, en este caso se muestra en la figura una inconsistencia espacial, la población Tepeji de Ocampo se encuentra fuera del estado de Hidalgo. Este es un ejemplo del tipo de inconsistencias que se buscarán para la definición del grado de integración. Figura 2 Representación múltiple espacialmente inconsistente. 4 Metodología La metodología del proyecto se divide en tres fases: Datos de Entrada, Análisis Semántico, Análisis Espacial y Datos de Salida. En la fase de Datos de Entrada se procesan las representaciones multiescala de la MRDB para obtener un par de ontologías que serán analizadas en 4

la siguiente fase, denominada Análisis Semántico y Análisis Espacial. En estas fases se realiza el análisis para identificar las inconsistencias entre las ontologías (inconsistencia semántica) y un análisis para identificar inconsistencias topológicas entre los datos, esto ya a nivel de instancias. Finalmente la fase de Datos de Salida se encarga del procesamiento de los resultados obtenidos para proponer grado de integración semántica y espacial que ayude a conocer la coherencia de trabajar las representaciones multiescala indiferentemente. Figura 3 Metodología propuesta El grado de integración semántica entre las representaciones será un reflejo de qué tan factible es una integración semántica entre las representaciones, mientras que el grado de integración geográfica será el reflejo de qué tan similar es el espacio geográfico que definen. 4.1 Datos de Entrada En esta fase se realiza una adaptación de los datos de entrada para el análisis semántico y espacial. El dato de entrada al sistema será una MRDB donde se tendrán diferentes representaciones sobre el mismo fenómeno. A partir de estas representaciones se obtendrán ontologías, cada ontología describirá explícitamente las reglas, restricciones y axiomas de su representación. Del mismo modo cada ontología será poblada con las instancias respectivas de su representación. Con el objeto de estandarizar la forma en la que se definen las ontologías se utilizará la metodología GEONTOMET [16], la cual define los procedimientos y reglas para conceptualizar el dominio. El caso de estudio será sobre una MRDB, donde las ontologías se obtendrán de manera manual a partir del esquema de base de datos pero podemos aplicarlo a otro tipo de base de datos. Las inconsistencias que se pretenden detectar tienen origen al mezclar datos con diferente nivel de detalle, así, hacemos la suposición de que los datos se encuentran referenciados utilizando los mismos parámetros geográficos (proyección, unidades, datum, elipsoide). 5

4.2 Análisis semántico y espacial La fase de Integración Semántica realiza un procesamiento con base en el trabajo de Fonseca, Camara y Monteiro [7] y se aplicará un procesamiento similar al operador Match de Bernstein [15]. El operador Match realiza asociaciones de similitud y generalización entre los conceptos de ambas ontologías. Toma el concepto más específico en una ontología y busca su correspondencia en la otra, en caso de encontrarla forma una tupla con ambos conceptos y el valor similitud. En caso de no encontrar la correspondencia busca una generalización del concepto, formando ahora la tupla de conceptos y el valor generalización. El proceso continua hasta tener a todos los conceptos relacionados [7]. 4.2.1 Análisis semántico Se seleccionará el concepto más específico de una ontología y se buscará el equivalente en la otra ontología, si es encontrado se forma una tupla del tipo <concepto1, concepto2, similitud>, donde concepto1 es el concepto de una ontología y concepto2 es el concepto equivalente en la otra ontología. En caso de no encontrar la equivalencia del concepto, se buscará una generalización, formando una tupla del tipo <concepto1, concepto2, generalización>, donde el concepto1 no encontró equivalencia pero fue relacionado con un concepto más general en la otra ontología. El conjunto de tuplas obtenido representará la cantidad de objetos relacionados por similitud y generalización. La cantidad y tipo de relaciones servirán para decir qué tan factible es trabajar semánticamente ambos datos en conjunto y a partir de las tuplas propondremos un grado de integración semántica entre las dos representaciones. 4.2.2 Análisis Espacial Una vez que se cuente con los conceptos semánticamente consistentes, se podrá realizar sobre ellos un análisis espacial, para esto será necesario revisar los datos de la ontología en un nivel de instancias. El Análisis Espacial se divide en dos partes, la primera denominada Consistencia Topológica (CT) y la segunda Refinamiento Métrico de Consistencia Topológica. La primera se encarga del análisis topológico mientras que la segunda ayuda a dar mayor detalle sobre el grado de interoperabilidad de las representaciones. Coincidencia Topológica (CT) Es un filtro que seleccionará los datos que se considerarán topológicamente equivalentes. Esta equivalencia topológica se trabaja de este modo para permitir una tolerancia, es decir, considerar a datos parecidos (no iguales) como equivalentes y no tener un criterio tan estricto al comparar las diferentes representaciones. Para el análisis espacial, de acuerdo al tipo de datos de las representaciones, se generarán diferentes casos. Cada representación podrá tener datos de tipo punto, línea o área. Así, las posibles combinaciones (o casos generados) son: punto-punto, punto-línea, punto-área, línea-línea, líneaárea y área-área. Actualmente, para la evaluación espacial se consideran únicamente tres casos: punto-punto, punto-área y área-área. Al final de esta sección se hace una descripción de por qué no se consideran datos de tipo línea. En la Figura 4 se muestran ejemplos de los tipos de datos trabajos y de ejemplos de posibles instancias. 6

Figura 4 Coincidencia Topológica. Ejemplo de tipos de datos e instancias. El análisis de coincidencia topológica ofrece un primer acercamiento al grado de interoperabilidad de las representaciones que será enriquecido con base en las métricas de las representaciones. Los casos propuestos son: CT Punto-punto En este caso, la coincidencia topológica se analizará de la siguiente manera: se creará un área alrededor de cada punto en la representación 2 y si el punto correspondiente en la representación 1 se encuentra dentro del área, se considerarán los datos equivalentes. La elección del tamaño del área a crear se realizará de acuerdo a la definición del radio de coincidencia. Radio de coincidencia Es una medida o margen de tolerancia a errores. Esta medida será propuesta a partir de los datos de la representación y sus métricas. En base a la menor medida de proximidad entre todos los datos de la representación se propondrá un margen de tolerancia. Este margen ayudará a relacionar espacialmente a objetos, esto es, el radio de coincidencia dará el límite para una zona de relación con el objeto indicado (decidir que son espacialmente equivalentes) y al mismo tiempo el exterior de esa zona implica la inconsistencia espacial de los objetos. CT Punto-área 7

Aquí, la consistencia puede verse como un paso del caso anterior. Esta vez, únicamente se revisará que el punto de la representación 2 se encuentre dentro del área de la representación 1. En caso de que el punto se encuentre dentro del área, se considerará una equivalencia, de lo contrario los datos serán filtrados. CT Área-área La coincidencia topológica será nula si las áreas no se encuentran sobrepuestas, esto es, si las áreas se encuentran disjuntas o sólo se tocan se considerará que las representaciones no son equivalentes. En caso contrario, si las áreas se traslapan, sobreponen o son iguales, sí se considerarán equivalentes. Refinamiento métrico de Consistencia Topológica El refinamiento métrico (RM) será tomado en cuenta ya que un análisis únicamente topológico podría resultar insuficiente y arrojar resultados poco precisos. Lo que se busca con el RM es mejorar el criterio de decisión y mejorar la respuesta del sistema para no sólo decir que las representaciones son consistentes, sino decir qué tan consistentes son las representaciones. En la Figura 5 se muestra un ejemplo para cada una de las posibles combinaciones de acuerdo al tipo de dato. Figura 5 Refinamiento Métrico. Modo de considerar las métricas de acuerdo al tipo de dato. 8

El RM será una variable de mucho peso para la definición del grado de integración espacial. En el refinamiento métrico se consideran, al igual que en la consistencia topológica, tres casos: RM Punto-punto Hasta este punto, los datos que hayan resultado equivalentes cuentan con un valor de interoperabilidad igual a 1. Estos valores serán sumados al final del procesamiento para generar el grado de integración espacial. Ahora, de acuerdo a la distancia entre los dos puntos se asignará un valor a la relación, dicho valor será inversamente proporcional al grado de integración espacial, esto es, mientras menor sea la distancia entre los puntos, más interoperables serán las representaciones. Como se observa en la Figura 5, se tienen dos radios: el del radio de coincidencia y el de la distancia entre los puntos. El valor de 1 será sustituido por el resultado de la fórmula: =1 r R Donde r es la distancia entre los puntos, R es el valor del radio de coincidencia y es el valor de interoperabilidad que será utilizado para generar el grado de integración espacial. Este cambio de valores es el que ofrece mayor detalle, antes de la métrica se tenían valores de 0 y 1, lo que puede observarse como verdadero y falso. La métrica ayuda a generar una descripción más flexible de las relaciones entre los objetos. RM Punto-área Actualmente la propuesta para el refinamiento métrico en este caso es considerar qué tan al centro se encuentra el punto del área. A modo de estándar, se considerarán como áreas los rectángulos circundantes mínimos (minimum bounding rectangles) [17] del área real. Y como radio se tomará la mitad de la arista mayor del rectángulo circundante mínimo. RM Área-área Del mismo modo que con el caso anterior, se trabajará con los rectángulos circundantes mínimos, con base en el trabajo de Godoy y Rodriguez [18] se obtendrá el porcentaje del área que se intersecta. En este caso el valor de la métrica será la división del área que se intersecta entre el área de la union de los dos objetos. A diferencia del caso punto-punto, esta vez la relación entre la métrica será proporcional al grado de integración espacial, así, a mayor área en la intersección, mayor será el grado de integración espacial. Es importante observar que el refinamiento métrico se realizará únicamente al resultado del filtro de la consistencia topológica, esto es, sólo los datos que se consideren topológicamente consistentes pasarán por el proceso de refinamiento métrico. Esto resulta lógico cuando recordamos que el refinamiento métrico dirá qué tan consistentes son los datos. Para representaciones con tipo de dato línea, se necesita un trabajo más extenso [19]. Al revisar la relación del dato tipo línea con datos de tipo punto y área, se observa que sólo algunos 9

problemas se pueden solucionar aplicando un radio de coincidencia o buffer. Otra solución contemplada es trabajar con la topología arco-nodo de las representaciones, de este modo se podrían analizar nodos consistentes y a partir de ellos realizar un estudio de sus arcos. Pero se tiene que observar que esto es una solución con enfoque topológico, esta propuesta no contempla aún una refinación métrica para datos de tipo línea. 4.3 Datos de Salida De la fase de Análisis Semántico y Espacial se obtendrán dos conjuntos de tuplas que reflejen las viabilidad de trabajar los datos en conjunto, semántica y espacialmente. 4.3.1 Grado de integración semántica El conjunto de tuplas obtenido en la Integración Semántica podrá ser utilizado para definir un grado de integración semántica entre las representaciones multiescala analizadas. Esto puede evaluarse considerando el número y tipo de relaciones entre conceptos de las representaciones de datos geográficos. 4.3.2 Grado de integración espacial El conjunto de tuplas obtenido en el Análisis Espacial será utilizado para identificar las propiedades espaciales de las diferentes representaciones y proponer un grado de integración espacial que defina en qué tan similares son los espacios descritos. Esto puede identificarse por el número de relaciones consistentes en relación a las instancias que existen entre los conceptos de las ontologías. 5 Conclusiones Debido a que la tendencia es utilizar los datos geoespaciales ya existentes, por su alto costo, es necesario revisar qué tan factible es integrarlos. Ya que se pueden presentar inconsistencias entre las diferentes representaciones. En este trabajo se propone un método para evaluar el grado de integración semántica, así como el grado de integración espacial para cuantificar y calificar la integración de las representaciones. A diferencia de otros trabajos que normalmente definen la integración a nivel de categoría de objetos, en el presente se enfocó en analizar la integración a nivel de objeto geográfico y sus relaciones con otros. Para el análisis se propuso una metodología basada en ontologías, donde se buscaron inconsistencias entre las representaciones, identificando los casos donde se pierde la semántica definida en la ontología. La búsqueda de inconsistencias se procesaró a dos niveles: conceptos e instancias. El procesamiento a nivel de conceptos define el grado de integración semántica, mientras que para el grado de integración espacial es necesario un procesamiento a nivel de instancias. El grado de integración espacial se trabaja analizando las instancias de los conceptos en la ontología y se refina mediante una métrica. Con dicha métrica se gana descripción en la comparación de las representaciones pero no se debe olvidar que es una descripción subjetiva, en efecto brinda mayor información sobre qué tan interoperables son las representaciones pero esta 10

información va atada al diseño de la solución, de modo que su efectividad dependerá de la naturaleza del problema a manejar y en particular de las representaciones de sus datos. La ventaja de este trabajo es un acercamiento a la interoperabilidad entre representaciones múltiples y su limitante principal es el enfoque basado en MRDB, ya que para integrar diferentes representaciones con esquemas de base de datos diferentes, se tendrá que hacer mayor análisis en la fase de Análisis Semántico. Referencias [1] Tomlinson, R. F. Thinking about GIS: Geographic information systems planning for managers. Redlands, CA: ESRI Press. 2003. [2] C. Vangenot, C. Parent, C. Spaccapietra, Modelling and Manipulation Multiple Representations of Spatial Data, Symposium on Geospatial Theory, Processing and Applications, Ottawa, 2002. [3] S. Spaccapietra, C. Parent, C. Vangenot, GIS Databases: From Multiscale to MultiRepresentation, Proceedings 4th International Symposium, SARA-2000, Horseshoes Bay, Texas, USA, 2000. [4] Goodchild, M. F. (2009). Geographic information systems and science: today and tomorrow. Annals of GIS, 15(1), 3-9. doi: 10.1080/19475680903250715 [5] Smith, B., & Mark, D. Ontology and Geographic Kinds. International Symposium on Spatial Data Handling, Vancouver, Canadá, 1998. [6] Chandrasekaran, B.; Josephson, John R.; & Benjamins, V. Richard (1999). What Are Ontologies,and Why Do We Need Tem?. IEEE Intelligent Systems, 14, 1. [7] F. Fonseca, G. Camara, A. M. Monteiro. A Framework for Measuring the Interoperability of Geo-Ontologies, Spatial Cognition and Computation. 6(4),307-329, pre-print version. 2006 [8] E. Mena, V. Kashyap, A. Sheth and A. Illarramendi. OBSERVER: An approach for query processing in global information systems based on interoperation across pre-existing ontologies", In Proceedings of the First IFCIS International Conference on Cooperative Information Systems (CoopIS 96), Junio 1996. [9] Fonseca, F. & Egenhofer, M. Ontology-Driven Geographic Information Systems. 7th ACM Symposium on Advances in Geographic Information Systems, Kansas City, MO. 1999. [10] B. C. Grau, B. Parsia, E. Sirin. Working with Multiple Ontologies on the Semantic Web. 3rd International Semantic Web Conference (ISWC2004), 2004. [11] K, Baclawski, M. Kokar, R, Waldinger, P. Kogut. Consistency Checking of Semantic Web Ontologies. First International Semantic Web Conference (ISWC 2002), Sardinia, Italia (2002) Clodoveu A. Davis Jr. & Alberto H.F. Laender [12] A. Ruas, Map Generalization. en Shekar, S., Xiong, H. (Eds.) Encyclopedia of GIS. Springer- Verlag, New York. 2008 pp. 660-661 [13] OpenGIS. The OpenGIS Guide-Introduction to Interoperable Geoprocessing and the OpenGIS Specification. Wayland, MA: Open GIS Consortium, Inc. 1996. [14] M.J. Egenhofer,, E. Clementini, P. DiFelice, Evaluating inconsistencies among multiple representations. Proceedings of the 6th International Symposium on Spatial Data Handling (SDH 94), pp. 901 920. 1994. [15] Bernstein, P. Applying Model Management to Classical Meta Data Problems. Paper presented at the Conference on Innovative Database Research, Asilomar, CA. 2003. [16] Torres M. Levachkine. Ontological representation based on semantic descriptors applied to geographic objects. Computación y Sistemas. Revista Iberoamericana [17] Papadias, D., Theodoridis, Y., Sellis, T., y Egenhofer, M. J. 1995. Topological relations in the world of minimum bounding rectangles: A study with R-trees. In Proceedings of the ACM SIGMOD International Conference on Management of Data, 92 103. 11

[18] Godoy, F. and Rodriguez, A. (2004) Defining and Comparing Content Measures of Topological Relations. GeoInformatica 8(4): pp. 347-371. [19] Nedas, K., Egenhofer, M., y Wilmsen, D. Metric Details of Topological Line-Line Relations. International Journal of Geographical Information Science. http://www.spatial.maine.edu/~max/rj53.html. 12