Integración de técnicas de visualización científica en SIG para el análisis de grandes volúmenes de datos.

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Integración de técnicas de visualización científica en SIG para el análisis de grandes volúmenes de datos."

Transcripción

1 Universidad Central Marta Abreu de Las Villas. Facultad de Matemática, Física y Computación Ciencia de la Computación Trabajo de Diploma Integración de técnicas de visualización científica en SIG para el análisis de grandes volúmenes de datos. Autor: Ruperto Aguila Delgado Tutor: MSc. Romel Vázquez Rodríguez. Santa Clara 2013 I

2 Hago constar que el presente trabajo fue realizado en la Universidad Central Marta Abreu de Las Villas como parte de la culminación de los estudios de la especialidad de Ciencia de la Computación, autorizando a que el mismo sea utilizado por la institución, para los fines que estime conveniente, tanto de forma parcial como total y que además no podrá ser presentado en eventos ni publicado sin la autorización de la Universidad. Firma del autor Los abajo firmantes, certificamos que el presente trabajo ha sido realizado según acuerdos de la dirección de nuestro centro y el mismo cumple con los requisitos que debe tener un trabajo de esta envergadura referido a la temática señalada. Firma del tutor Firma del jefe del Laboratorio I

3 La ciencia no sirve sino para darnos una idea de cuan vasta es nuestra ignorancia. Félecité de Lamennais II

4 Dedicatoria A mi papá que tanto me apoyó durante mis cinco años de carrera y no pudo ver el resultado de sus sacrificios. III

5 Agradecimientos A mi mamá y mi papá por la educación que me ofrecieron y su apoyo en todo momento. A mi hermana por haberme ayudado a superar los momentos más tristes. A Romel por haber sido mi guía durante esta etapa. A los estudiantes y profesores de Computación Gráfica. A los profesores de la carrera en general que me han guiado y enseñado todo lo que sé. A toda mi familia por estar siempre al tanto de lo que acontece en mi vida y gracias a ella pude llegar hasta aquí. A Edel por la ayuda que nos ha brindado. A mis amigos de la carrera por el apoyo y los momentos divertidos que hemos pasado. Ruperto Aguila Delgado. IV

6 RESUMEN 2013 Resumen El análisis de secuencias temporales de datos en forma de mallas regulares constituye un reto para científicos y analistas de diferentes disciplinas. Estos datos comúnmente contienen información en todo el dominio espacial y representan mediciones de diferentes variables. Diversas problemáticas deben resolverse para procesar y analizar toda esta información de manera consistente y efectiva. La mayoría de los métodos y herramientas actuales no permiten un análisis espacio-temporal de múltiples variables a la vez de manera efectiva. En este trabajo se aborda la problemática del análisis visual de secuencias temporales de variables climáticas en forma de mallas regulares que ocupan todo el espacio de análisis. Se propone una solución que posibilita la visualización espacio-temporal de múltiples variables a la vez. Mediante la utilización de técnicas de visualización científica para datos multiparamétricos se logra analizar eficazmente toda la información almacenada en las secuencias de datos. Los conceptos y métodos elaborados en este trabajo se implementaron como una extensión al Sistema de Información Geográfica gvsig, demostrándose así la viabilidad de este enfoque para la extracción de información y conocimiento a partir de los datos originales. Se muestra un caso de estudio con datos climáticos mundiales que contienen 9 variables con 1224 registros mensuales de , la información está dada para las celdas que corresponden a la superficie terrestre del planeta, cada una de las celdas ocupa un área de 25km por 25km. Los datos fueron suministrados por la unidad de investigación climática de la Universidad del Este de Anglia, en el Reino Unido, el uso de las herramientas desarrolladas con estos datos posibilitó extraer importantes tendencias, correlaciones, y patrones relacionados con el cambio climático mundial. Se desarrolló además un módulo para la manipulación de formatos de datos científicos en gvsig que permitió el almacenamiento de toda la información de forma compactada para una lectura efectiva. V

7 ABSTRACT 2013 Abstract The analysis of temporal sequences of data in regular grids is a challenge for scientists and analysts from different disciplines. These data typically contain information throughout the spatial domain and represent measurements of different variables. Several problems must be solved to process and analyze all this information consistently and effectively. Most current methods and tools do not allow space-time analysis of multiple variables at once effectively. This paper addresses the problem of visual analysis of temporal sequences of weather variables in the form of regular grids that occupy the entire space of analysis. We propose a solution that enables space-time visualization of multiple variables at once. Throw the use of scientific visualization techniques for multiparameter data analysis all the information stored in data sequences is analyzed effectively. The concepts and methods developed in this paper were implemented as an extension to gvsig GIS, thus demonstrating the feasibility of this approach for extracting information and knowledge from the original data. It shows a case study with global climate data containing 9 variables with 1224 monthly records from , information is given for the 67,420 cells that correspond to the Earth's land surface, each cell occupies an area of 25km by 25km. Data were provided by the Climatic Research Unit at the University of East Anglia in the UK, using developed tools with those data allowed extract important trends, correlations, and patterns related to global climate change. Also, a module for handling scientific data formats was developed for gvsig, that allow storing all information in compact form for effective reading. VI

8 ÍNDICE 2013 Tabla de contenido Introducción... 1 CAPÍTULO 1. VISULIZACIÓN CIENTÍFICA Y SISTEMAS DE INFORMACIÓN GEOGRÁFICA Visualización Científica Técnicas de Visualización Científica Técnicas de visualización para datos multiparamétricos Técnicas geométricas Técnicas basadas en iconos Técnicas orientadas a píxel Otros tipos de técnicas Sistemas de Información Geográfica ArcGIS Grass GIS Quantum GIS gvsig Integración de VisCi con SIG Snap-Together Visualization GeoVista Studio VIS- STAMP GAV Flash tools ArcView - xgobi Formatos de datos científicos utilizados en la Visualización Científica Conclusiones parciales CAPÍTULO 2. DISEÑO E IMPLEMENTACIÓN DEL MÓDULO DE VISUALIZACIÓN Análisis de actores y casos de uso Arquitectura general e interacción Usuario-Software Diseño de la extensión realizada a gvsig VII

9 ÍNDICE Diagramas de transición de estados Diagramas de clases Implementación de la extensión Selección de las tecnologías necesarias para la implementación Consideraciones sobre las técnicas implementadas Guía para la adición de nuevas técnicas al paquete de visualización coordinada del módulo de visualización de gvsig Conclusiones parciales CAPÍTULO 3. Uso y validación del sistema Uso del sistema General Matrices de Dispersión Caras de Chernoff Mapas Auto-organizados Caso de estudio: Análisis visual de datos climáticos mundiales Datos climáticos mundiales Validación del sistema. Detectar lo esperado Validación del sistema. Descubrir lo inesperado Conclusiones Parciales CONCLUSIONES RECOMENDACIONES BIBLOGRAFÍA VIII

10 LISTA DE FIGURAS 2013 Lista de Figuras Figura 1 Ejemplos de Técnicas de Visualización Geométricas Figura 2 Ejemplos de Técnicas de Visualización basadas en Iconos Figura 3 Ejemplos de Técnicas de Visualización orientadas a píxel Figura 4 Ejemplos de otras Técnicas de Visualización Figura 5 Arquitectura del SOM Figura 6. Diagramas de casos de usos Figura 7 Arquitectura general Figura 8 Interacción del usuario con el software Figura 9 Modelo de dato, seleccionado para nuestro problema Figura 10 Diagrama de transición de estados para el caso de uso visualizar de forma coordinada Figura 11 Diagrama de clases de la vista para la visualización coordinada Figura 12 Integración del paquete de visualización coordinada como una extensión de gvsig Figura 13 Diagrama de las clases de configuración de las técnicas Figura 14 Diagrama de clases de las técnicas de visualización para la visualización coordinada Figura 15 Relación de los paneles de configuración y los paneles de las técnicas Figura 16 Estructura del fichero HDF IX

11 LISTA DE FIGURAS 2013 Figura 17 Clases que intervienen en la lectura de los ficheros y el manejo de los datos para la visualización coordinada Figura 18 Creación de una vista de visualización coordinada Figura 19 Opciones para la adición de un proyecto de visualización coordinada a una vista de visualización Figura 20 Vista de visualización Figura 21 Obtención de muestras del conjunto de datos Figura 22 Visualización con Matriz de Dispersión Figura 23 Panel Configuración Matriz de Dispersión Figura 24 Leyenda de los valores de los atributos Figura 25 Visualización con Caras de Chernoff Figura 26 Panel Configuración Caras de Chernoff Figura 27 Panel para la reasignación de variables a facciones de las caras Figura 28 Visualización con Mapas Auto-organizados Figura 29 Panel de configuración de Mapas Auto-organizados Figura 30 Panel para establecer nuevos pesos Figura 31 Visualización de diferentes puntos utilizando Patrón Recursivo Figura 32 Gráfico de Matrices de Dispersión asociado al Himalaya Figura 33 Visualización de diferentes puntos del territorio nacional utilizando Patrón Recursivo Figura 34 Visualización de Mapas Auto-organizados y Coordenadas Paralelas asociados a diferentes puntos del territorio nacional Figura 35 Visualización de Mapas Auto-organizados y Coordenadas Paralelas asociados al occidente X

12 INTRODUCCIÓN 2013 Introducción En los últimos años las tecnologías de captura de datos espaciales han permitido contar con un volumen muy importante de información de excelente calidad y bajo costo: imágenes satelitales de alta resolución, navegadores GPS para realizar relevamientos de campo geo-referenciados, herramientas de software que administran, procesan y analizan esta información en forma gráfica y alfanumérica. Todo este conjunto de tecnologías, sumado a un equipo interdisciplinario de profesionales en las temáticas a abordar, más un diseño conceptual de la estructura de información a implementar, podemos denominarlo como un SIG (Sistemas de Información Geográfica) o GIS (por sus siglas en inglés). Existen definiciones variadas sobre: qué es un SIG, y en muchas se ha visto cierto nivel de confusión, ya que definen a un SIG en función del tipo de datos que administra o a la temática que aborda; es muy importante tener presente que un SIG sólo agrega la componente espacial de los datos, que probablemente ya tenemos sistematizados en un sistema de información tradicional. Existen muchas y variadas definiciones acerca de qué son los SIG. De hecho, podría afirmarse que hay casi tantas definiciones como autores que escriben sobre el mundo de los SIG (Puebla et al., 1994). En dependencia del contexto en que se utilicen, se sentirán más identificados con unas u otras. Así, mientras que para algunos los SIG son simplemente el medio para automatizar la producción de mapas, para otros esta aplicación parece banal en comparación con su complejidad asociada a la solución de problemas geográficos y el soporte a la toma de decisiones (Longley et al., 2005). Encontrar la forma más adecuada para referirse a ellos no es tarea fácil. Según el Centro Nacional de Información Geográfica y Análisis (NCGIA, por sus siglas en inglés), un SIG es un sistema de hardware, software y procedimientos elaborados para facilitar la obtención, gestión, manipulación, análisis, modelado, representación y salida de datos espacialmente referenciados, para resolver problemas complejos de planificación y gestión. Sin duda, se trata de una 1

13 INTRODUCCIÓN 2013 definición funcionalista en la que se reflejan, aparte de la tecnología, todos aquellos aspectos y partes que conforman un SIG. La Visualización Científica ha sido un área de interés creciente en los últimos años. El incremento constante de los volúmenes de datos generados en muchos campos de aplicación crea la necesidad de elaborar herramientas que permitan extraer información de estos datos de manera eficiente, así como generar imágenes cada vez más sofisticadas por el aumento sostenido de la potencia de las interfaces gráficas modernas. Junto al desarrollo de nuevas técnicas de visualización se han creado numerosas utilidades que emplean estas técnicas, tanto en forma de bibliotecas como de programas. En los últimos años, los avances en la tecnología han facilitado la obtención de grandes cantidades de información. Mediante imágenes de satélite, estaciones de medición de alta precisión, supercomputadoras o cualquier otra fuente de este tipo, se generan a diario volúmenes de datos muy grandes y complejos. Investigadores de la Universidad de Berkeley estimaron que cada año se genera cerca de 1 Exabyte (un millón de Terabytes) de datos, de los cuales la mayor parte está disponible en forma digital. Para el estudio de estos datos es necesario el uso de técnicas avanzadas debido a que no pueden ser analizados suficientemente bien en forma numérica. De todos los datos generados por entes especializados, solo una cuarta parte se almacena, y de éstos solo una cuarta parte realmente se analiza. Como se puede ver se pierden datos valiosos, de muchas informaciones importantes solamente se utiliza un pequeño por ciento. La ciencia siempre ha tratado de entender los fenómenos de la naturaleza. Sin embargo, estos fenómenos son a veces muy grandes, o muy pequeños, muy rápidos o muy lentos para ser estudiados con los métodos tradicionales. La visualización científica es una herramienta que permite a los científicos computacionales analizar, entender y comunicar los datos numéricos generados durante una investigación. La VisCi (Visualización Científica) según (MORELL et al., 2006) significa encontrar una representación visual apropiada para un conjunto de datos que permita mayor efectividad en el análisis y evaluación de los mismos. Según (Rhyne, 1997b) permite la transformación de los datos numéricos o simbólicos y la información en imágenes geométricas generadas por 2

14 INTRODUCCIÓN 2013 computadora. Es una metodología para interpretar, a través de una imagen en la computadora, tanto datos de mediciones como los generados por modelos computacionales. La investigación y el desarrollo de la VisCi se han centrado en cuestiones relacionadas con el renderizado de gráficos en tres dimensiones, animaciones de series temporales y visualización interactiva en tiempo real. Una clase especial de datos son los datos multiparamétricos (datos multidimensionales o datos multivariados). Los datos multiparamétricos son los que poseen m variables o dimensiones de datos escalares distribuidos sobre puntos en el espacio de observación. Estas variables pueden ser cuantitativas o cualitativas y a su vez ordinales o nominales (Hansen et al., 2005). La VisCi ofrece grandes ventajas sobre otros métodos de análisis de datos cuando los mismos poseen más de dos dimensiones o variables, puesto que permite la visualización de todas las variables que se deseen al mismo tiempo. A este tipo de visualización se le conoce como visualización de datos multiparamétricos. Por las ventajas señaladas anteriormente de los SIG y del VisCi en la visualización y análisis de grandes volúmenes de datos, una integración de estas dos tecnologías es muy provechosa para el trabajo con datos multiparamétricos. Con este trabajo se desea analizar datos multiparamétricos mediante técnicas de visualización científica que se agregarán a un SIG, el cual está desarrollado con software libre, lo que permite la reutilización de códigos. El mundo real no es estático, tanto componentes espaciales como no espaciales tienen que ver con el tiempo. Especialistas de muchas áreas de la ciencia visualizan, consultan y analizan la información recopilada a partir del mundo real para ayudar a la toma de decisiones. Esta información existe en el dominio espacial, el dominio temporal y en el dominio temático (Hogeweg, 2000). El dominio espacial es el encargado de analizar qué se mide o se encuentra en algún lugar. El dominio temporal se encarga de analizar qué se produce en algún momento o qué existe durante un cierto tiempo. El dominio temático es el que tiene que ver con el área de aplicación que se va a analizar en el espacio y el tiempo. Una de las ciencias que mejor se ajusta a la integración de los dominios espacial, temporal y temático es la meteorología. El análisis espacio-temporal en esta área se ha realizado históricamente mediante el uso de SIG, 3

15 INTRODUCCIÓN 2013 herramientas para el análisis de series temporales, paquetes estadísticos y geo-estadísticos y la animación en sistemas de visualización. En el laboratorio de Computación Gráfica del Centro de Estudios de Informática de la Universidad Central Marta Abreu de Las Villas se cuenta con series temporales de múltiples variables en forma de mallas regulares. Por ejemplo: la secuencia de datos climáticos mundiales publicada en la unidad de investigaciones climáticas de la universidad del Este de Anglia, en el Reino Unido (Mitchell et al., 2005), que contiene 9 variables climáticas con 1224 registros mensuales de , la información está dada para las celdas que corresponden a la superficie terrestre del planeta, cada una de las celdas ocupa un área de 25km por 25km. Planteamiento del problema El análisis exploratorio de grandes volúmenes de datos almacenados en múltiples variables con forma de mallas regulares constituye un reto. Se necesita visualizarlos con el objetivo de realizar comparaciones, identificar patrones, encontrar correlaciones, detectar anomalías, variabilidad y las diferentes tendencias que se pueden presentar en las variables a lo largo del tiempo, teniendo en cuenta su ubicación espacial. Dado que existen múltiples formatos para el almacenamiento de grandes volúmenes de datos, la cantidad de técnicas de VisCi existentes y las particularidades de los SIG, se formularon varias Preguntas de Investigación: Cuál es el formato de datos científicos más adecuado para almacenar grandes volúmenes de datos espacio-temporales? Cuáles son las técnicas de VisCi (Visualización Científica) para datos multiparamétricos que brindan un mejor análisis visual de datos espacio-temporales? Qué modificaciones se deben realizar a las aplicaciones desarrolladas con anterioridad para la solución de esta problemática? Qué hipótesis o correlaciones se pueden extraer de los datos a través de las técnicas de visualización seleccionadas? 4

16 INTRODUCCIÓN 2013 Cuáles son las mejores situaciones en las que se pueden utilizar las herramientas desarrolladas para demostrar la efectividad de usar las técnicas seleccionadas? Teniendo en cuenta la problemática planteada y las preguntas de investigación se plantearon los siguientes objetivos: Objetivo general Implementar nuevas técnicas de visualización científica al Sistema de Información Geográfica gvsig para el análisis de grandes volúmenes de datos multiparamétricos amplios en el tiempo y en el espacio, como es el caso de los datos climáticos mundiales publicados en la unidad de investigaciones climáticas de la universidad del Este de Anglia, en el Reino Unido (Mitchell et al., 2005). Objetivos Específicos Analizar los distintos formatos de datos científicos para el almacenamiento de grandes volúmenes de datos y seleccionar el formato más adecuado para añadir al gvsig. Analizar las técnicas de visualización de grandes volúmenes de datos espaciotemporales y seleccionar las más adecuadas para añadirlas al gvsig. Implementación de las técnicas de visualización espacio-temporales seleccionadas para su incorporación en el módulo de visualización de datos multiparamétricos de gvsig. Extraer información de los datos analizados mediante las técnicas de visualización científica. Justificación de la investigación Actualmente existen diversos formatos de datos científicos para almacenar grandes volúmenes de información, lo cual obliga a realizar una investigación para ver sus ventajas y desventajas y seleccionar entre todos el que más se adapte al propósito descrito. Además es necesario elegir las técnicas de visualización que faciliten el análisis espacio-temporal de los datos existentes. 5

17 INTRODUCCIÓN 2013 Estas técnicas seleccionadas se visualizarán sobre el lugar que se quiere analizar y en caso de que la técnica no pueda ser visualizada sobre el mapa, podrán ser mostradas de manera independiente, siempre y cuando se sepa a qué localización corresponden. Estas ideas podrán ser aplicadas en cualquier tipo de problemas que contengan información multivariada de datos puntuales en el espacio. Viabilidad de la investigación El estado actual de las técnicas de VisCi y el desarrollo de los SIG ofrece una amplia gama de ideas a exponer en este trabajo. Para el desarrollo de esta investigación se cuenta con los recursos necesarios para acometer las tareas propuestas, que incluyen los datos meteorológicos, los códigos fuentes de los SIG, la información cartográfica y la capacidad de procesamiento de datos y de gráficos. Por otro lado se cuenta con el apoyo del grupo de investigación Computación Gráfica del Centro de Estudios de Informática, que tiene suficiente experiencia en el área. Hipótesis general La utilización de un formato de dato científico para almacenar grandes volúmenes de datos multiparamétricos permite reducir su tamaño en disco y mejorar el trabajo con estos. La integración de técnicas de VisCi con SIG en una misma aplicación permite visualizar una gran cantidad de información multivariada amplia en el tiempo e interactuar con la misma a través de las diferentes técnicas, asociándolas a lugares puntuales en el espacio. 6

18 CAPÍTULO I 2013 CAPÍTULO 1. VISULIZACIÓN CIENTÍFICA Y SISTEMAS DE INFORMACIÓN GEOGRÁFICA 1.1 Visualización Científica La visualización es la formación de imágenes visuales. Como lo define J. Foley (Foley, 1999), es la disposición de datos en representaciones que pueden ser percibidas. Los tipos de disposiciones pueden ser visuales, auditivos, táctiles, etc, o una combinación de estos. La visualización por computadora es un proceso de distribución de las representaciones hechas por la computadora a representaciones preceptúales, eligiendo técnicas de codificación para maximizar el entendimiento y comunicación con los seres humanos. Hay tres partes importantes en un sistema de visualización. Construcción de un modelo empírico de los datos: Este modelo puede tener consideraciones sobre teoría del muestreo y esquemas de interpolación matemática. También se debe tomar en cuenta la probabilidad de que haya errores en los datos. Selección de esquemas: Significa tomar como modelo un objeto de visualización abstracta (un mapa por ejemplo). La representación de la imagen en un ambiente gráfico. La visualización científica es un área de gran importancia en la computación. Al igual que en otras áreas, gracias al avance del software y al abaratamiento del hardware, se han hecho grandes avances en visualización. La ciencia ha desarrollado diversos métodos para la obtención de información, y uno de ellos se basa en la creación de imágenes a partir de los datos. Este método, conocido como visualización, ha sido utilizado como vía natural para mostrar información (Hansen et al., 2005). Recientes investigaciones han impulsado en gran medida este campo mediante el uso de la computación, motivado fundamentalmente por el incremento constante de los volúmenes de datos generados en muchos campos de aplicación, así como por el aumento sostenido de la potencia de las interfaces gráficas modernas, que permiten generar imágenes cada vez más sofisticadas. 7

19 CAPÍTULO I 2013 La visualización científica es la transformación de datos científicos y abstractos en imágenes. Es una forma especial de la visualización que procura encontrar una representación visual apropiada para un conjunto de datos que permita mayor efectividad en el análisis y evaluación de los mismos. Simplifica el análisis, comprensión y la comunicación de modelos, conceptos y datos en la ciencia y la ingeniería. Usualmente cuando se almacenan los datos se incluyen varios parámetros, resultando datos multidimensionales con un alto nivel de dimensionalidad. Buscar información valiosa en ellos es una tarea difícil. Con los sistemas actuales de administración de datos solo es posible ver porciones muy pequeñas de estos. Si los datos son presentados textualmente la cantidad de estos que pueden ser mostrados está en el rango de algunos cientos de ítems de datos, pero es como una "aguja en un pajar" cuando se trata con conjuntos de datos que contengan millones de ítems de datos. No teniendo la posibilidad de explorar adecuadamente las grandes cantidades de datos que han sido coleccionadas debido a su utilidad potencial, se tornan inservibles y las bases de datos en "almacenes" de datos". La visualización facilita el entendimiento a pequeña y gran escala de características de los datos. Simplifica el análisis y la comunicación de modelos y conceptos. Emplea las potencialidades del sistema visual que es un buscador de patrones de extrema fuerza y sutileza. El hecho de que el resultado sea una imagen posibilita una mayor comprensión, claridad y aprovechamiento de este. Se estima que el 50% de las neuronas está dedicado a la visión. Además, la densidad de información por unidad de área en una imagen es notablemente mayor a la de un texto. Por otro lado, la visualización nos permite observar lo que "no es posible ver directamente", debido, entre otras razones, al gran volumen de los datos o a que estos no tengan una representación gráfica asociada. Posibilita a las personas la interacción directa con los datos. La visualización puede ser hecha sin mayor dificultad en datos no homogéneos o que no se conozca detalladamente su estructura. La exploración visual es intuitiva, no requiere de complicados conocimientos matemáticos, estadísticos o de otra índole. Otra gran ventaja consiste de la visualización de datos es la gran cantidad de conocimiento que puede ser rápidamente interpretado. 8

20 CAPÍTULO I 2013 La visualización de datos permite alcanzar diferentes metas. La naturaleza del objetivo que se desee está en relación directa al conocimiento que se tenga sobre los datos iniciales. Los objetivos pueden ser los siguientes (Theisel, 2000; Abello et al., 2002) Análisis exploratorio. Análisis confirmativo. Presentación de información. El Análisis exploratorio: se tiene un conjunto de datos sin una hipótesis específica. Estos se someten a un proceso de búsqueda interactiva de información que va a arrojar como resultado una visualización que soporte una hipótesis sobre el conjunto de datos. El Análisis confirmativo: se tiene un conjunto de datos sobre los que se plantea una hipótesis. Se realiza un procesamiento de los mismos que genera una visualización mediante la cual se pueda validar o refutar la hipótesis que se tenía de ellos. La Presentación de información: parte de hechos que son fijos a priori y que se desean enfatizar y mostrar con extrema calidad. El análisis exploratorio y el confirmatorio incluyen el análisis estadístico de los datos, la simulación y la educación. Dentro del área del análisis existen aplicaciones para el control de calidad, análisis y proyecciones financieras, análisis de esfuerzos, etc. Esta última podría considerarse dentro del área de simulaciones, junto con la de modelos atmosféricos. En cuanto a la educación, se tienen desde demostraciones matemáticas, hasta modelos de física cuántica y planetarios. El análisis visual de datos es un nuevo enfoque que se puede utilizar con cualquiera de los objetivos anteriores. Como se ha mencionado anteriormente, integra tanto la percepción humana como los métodos computacionales automáticos, lo que permite una mejor comprensión y análisis de grandes y complejos conjuntos de datos. 9

21 CAPÍTULO I Técnicas de Visualización Científica Diversos enfoques se han empleado para agrupar y clasificar las diversas técnicas de VisCi existentes. Un enfoque establecido para clasificar las técnicas es a través del tipo de dato sobre el que opera. Por el tipo de dato se refiere al tipo al que pertenecen los atributos o variables. Atendiendo a este criterio se encuentran las siguientes categorías (Theisel, 2000; Hansen et al., 2005): Técnicas de visualización para datos volumétricos. Técnicas de visualización para fluidos. Técnicas de visualización para datos multiparamétricos. Técnicas de visualización de la información. Existen diversos enfoques para especificar los datos. Estos permiten definir una serie de características de los datos como son la dimensionalidad, la estructura y el nivel de medición. En este trabajo se utiliza un enfoque sencillo para definir los datos. Los datos volumétricos representan una malla de tres dimensiones donde cada punto tiene asociado un valor. En general los datos se definen como un conjunto S de muestras, en que cada elemento s Є S es un vector de la forma (x, y, z, v) que contiene las coordenadas espaciales y un elemento que es un escalar (Theisel, 2000; Hansen et al., 2005). Los campos vectoriales representan una malla de dimensión menor o igual que tres donde cada punto está relacionado con un vector. Una de las áreas de mayor uso de los campos vectoriales es para representar datos de fluidos (Hansen et al., 2005). Los datos multiparamétricos son aquellos en que el número de variables relacionadas con cada observación es mayor o igual que dos. Estas variables pueden ser cuantitativas o cualitativas y a su vez ordinales o nominales (Hansen et al., 2005). En algunas aplicaciones los datos presentan una estructura que no concuerda con ninguna de las anteriores o que sencillamente no puede ser definida con exactitud. A estos datos se les suele 10

22 CAPÍTULO I 2013 llamar información y entre las principales se identifican estructuras como árboles, grafos e hipertexto (Theisel, 2000; Keim, 2002b; Hansen et al., 2005). Este trabajo se centró en el desarrollo de técnicas de visualización de datos multiparamétricos. Es por ello que se hace mayor énfasis en este tipo de técnicas, las cuales son descritas a continuación. 1.3 Técnicas de visualización para datos multiparamétricos Existen una serie de problemas en que cada punto de dato contiene más de un atributo, estos atributos pueden ser fechas, precios o valores descriptivos. A este tipo de datos se les llama multiparamétricos y se encuentran generalmente en aplicaciones de minería de datos, estadísticas e inteligencia artificial (Keim, 2002b). Los datos multiparamétricos, también llamados multidimensionales o datos n-dimensionales, consisten en un número de n registros donde cada uno está definido por un vector de d valores. Estos datos pueden ser vistos como una matriz de nxd, donde cada fila representa un registro y cada columna representa una observación, variable o dimensión (Ward, 2008). El objetivo fundamental de los métodos de visualización para datos multiparamétricos es lograr que las representaciones revelen correlaciones o patrones entre los atributos (Theisel, 2000; Eick, 2000; Keim, 2002b). Con este fin existe actualmente una amplia gama de técnicas de visualización, para las cuales se han creado además diversas mejoras. Las técnicas pueden ser clasificadas en geométricas, basadas en iconos, basadas en píxel y proyecciones (Theisel, 2000; Keim, 2002b) entre otras Técnicas geométricas Las técnicas geométricas son aquellas que utilizan elementos como puntos, líneas o curvas como propiedades visuales para representar los datos (Theisel, 2000; Keim, 2002b). Existe un gran número de ellas, las visualizaciones geométricamente transformadas pretenden encontrar patrones "interesantes" en conjuntos de datos multidimensionales. Esta clase de métodos incluyen: las técnicas de exploración estadísticas (por ejemplo, ver,(theus, 2005)) tales como matrices de Diagramas de Dispersión (Andrews, 1972; Cleveland, 1993) Figura 1-D y las 11

23 CAPÍTULO I 2013 técnicas que pueden incluirse bajo el término projection pursuit (Huber, 1985). Otras de las técnicas geométricas son Prosections Views (Furnas et al., 1994; Spence et al., 1995) Figura 1-A, Hyper Slices (Wijk et al., 1993) Figura 1-B, Parahistogramas(Ong et al., 1996), Landscapes (Wright, 1995) Figura 1-C, Star Coordinates (Kandogan, 2000), pero hay tres que sobresalen por su generalidad y gran uso, estas son los anteriormente mencionados Diagramas de Dispersión, Coordenadas Paralelas (Inselberg et al., 1990; Cleveland, 1993; Keim, 2002b; Cui et al., 2006) Figura 1-E y Gráfico de Andrews (Andrews, 1972) Figura 1-F. Figura 1 Ejemplos de Técnicas de Visualización Geométricas. Diagramas de Dispersión El Diagrama de Dispersión es una técnica sencilla muy utilizada. Su forma más simple se manifiesta cuando los datos poseen solo dos dimensiones. Con dos dimensiones la técnica 12

24 CAPÍTULO I 2013 consiste en trazar dos ejes de coordenadas y utilizar los valores de las dimensiones como puntos (x, y) de R 2, resultando un gráfico donde se encuentran dispersos los puntos de datos. Para visualizar datos de más de dos dimensiones pueden utilizarse proyecciones, que provocan pérdida de información debido a la reducción de la dimensión (Theisel, 2000; Keim, 2002b; Hansen et al., 2005). Para datos multiparamétricos es muy frecuente utilizar matrices de diagramas de dispersión. Las matrices resultantes son cuadradas y el elemento (i, j) de la matriz es un diagrama de dispersión de la dimensión i y la j. El diseño evita la pérdida de información pero en cambio los análisis complejos son engorrosos. Una deficiencia adicional es que la diagonal principal de la matriz es subutilizada. Algunos trabajos actuales están encaminados a aprovechar mejor esta región de la representación (Cui et al., 2006) Técnicas basadas en iconos Las técnicas basadas en iconos visualizan datos multidimensionales mediante la asignación de cada objeto de datos sobre valores de los parámetros en pequeñas gráficas primitivas. Normalmente, los valores de los atributos están representados por la x e y posición del icono así como la longitud, el ángulo o forma de algún componente cónico. Para lograr un buen resultado, los componentes dentro de un icono deben ser distinguibles, iconos separados deben ser claramente identificables y los iconos deben ser percibidos como distintos si difieren en algunos de los componentes. Las técnicas basadas en iconos tienen dos parámetros que la caracterizan. El primero es el tipo de figura que representará cada observación, o sea, la forma del icono; el segundo parámetro es la forma en que se definirá la posición de cada icono en la imagen (Theisel, 2000; Ward, 2002). Estas técnicas no sufren de pérdida de información. Se logra evitar la pérdida de información al realizar una proyección de las dimensiones a los diferentes rasgos del icono (Theisel, 2000). Las técnicas basadas en iconos son recomendadas cuando el número de dimensiones oscila entre diez y quince y el número de mediciones de las mismas es alto. Estas técnicas se pueden utilizar con una referencia espacial. 13

25 CAPÍTULO I 2013 Ejemplos de técnicas de basadas en icono son: Caras de Chernoff (Chernoff, 1973) Figura 2-A, los Iconos de Flechas o Needle Icons (Keim, 2000; Abello et al., 2002), Iconos de Estrellas (Ward, 1994), Figuras con Palitos Stick Figure Icons (Pickett, 1970; Pickett et al., 1988) Figura 2-B, Iconos de Colores (Levkowitz, 1991; Keim et al., 1994) Figura 2-C, Iconos de Barras TileBars (Hearst, 1995), Shape Coding (Beddow, 1990) Figura 2-F, Profile Glyphs (Chen et al., 2008) Figura 2-E y Starfield (Eick, 2000; Keim, 2002a; Ward, 2002; Xie et al., 2006) Figura 2- D. Figura 2 Ejemplos de Técnicas de Visualización basadas en Iconos. Caras de Chernoff Este tipo de diagrama surge como respuesta a la facilidad que tiene las personas para reconocer y clasificar a otras personas por sus rostros, gracias a la capacidad de percepción se tiene. Esta capacidad de percepción es la que se desea explotar con los diagramas de Chernoff, los que usan 14

26 CAPÍTULO I 2013 representaciones de rostros de tipo trazos, los cuales a través del tamaño de los ojos, nariz, orejas y boca, agregándosele su forma o curvatura, incluso de la misma cabeza, permiten combinar los diferentes atributos de los datos multivariados en un único símbolo Técnicas orientadas a píxel La visualización de un conjunto de datos de gran tamaño resulta un reto para técnicas geométricas y basadas en iconos. Al graficarlos suele surgir desorden en la imagen, que está originado por el tamaño de la figura que representa una observación simple. Partiendo de esta idea resulta lógico concluir que minimizando el espacio que ocupa un solo punto de dato en la imagen se mejoraría la percepción visual (Hansen et al., 2005; Andrews, 2005). La idea básica de las técnicas orientadas a pixel es para asignar cada valor de atributo a un píxel coloreado y para presentar los valores de los atributos que pertenecen a cada uno de los atributos en regiones separadas de la pantalla (Keim, 1995; Keim, 1996). El color de un píxel se calcula mediante la asignación del valor de atributo correspondiente en una escala de color generado por el modelo de color HSI, que es una ligera variación del modelo de color HSV. Las primeras técnicas se han centrado en el apoyo a la exploración de datos y análisis de datos, proporcionando consulta dependientes de visualizaciones de los datos. Los retos fundamentales en estos métodos son la elección del color para cada elemento y el modo de posicionamiento de los píxeles (Keim, 2000; Keim, 2002a) El procedimiento en las técnicas basadas en píxel consiste en relacionar cada valor de una dimensión a un color y agrupar los píxeles de cada dimensión en áreas adyacentes. Puesto que este método utiliza un píxel simple por cada valor de dato, la técnica permite mostrar hasta más de un millón de valores (Keim, 2002a). Este tipo de técnicas utilizan diferentes modos de posicionamiento de los píxeles para lograr diferentes objetivos. Colocar los píxeles en la forma apropiada ofrece la posibilidad de observar información sobre correlaciones, dependencias y regiones trascendentales. Dos de los modos de posicionamiento de los píxeles son los Patrones Recursivos (Keim et al., 1995) Figura 3-A y los Segmentos de Círculo(Ankerst et al., 1996; Keim, 2000; Hansen et al., 2005) Figura 3-B. 15

27 CAPÍTULO I 2013 Otros ejemplos de técnicas orientadas a píxel son Spiral Technique (Keim et al., 1994) Figura 3- C, y Axes Technique (Keim et al., 1994) Figura 3-D. Figura 3 Ejemplos de Técnicas de Visualización orientadas a píxel Otros tipos de técnicas. 16

28 CAPÍTULO I 2013 Existen muchas otras formas de visualizar datos que permitan extraer información relevante de estos. Ejemplo de estas son las técnicas basadas en ejes como la Rueda de Tiempo (Time Wheel) (Tominski et al., 2004; Aigner et al., 2008) Figura 4-A, su idea básica es presentar el eje de referencia (tiempo en este caso) en el centro de la pantalla, y circularmente organizar los ejes en función a su alrededor. Parcelas Múltiples (Multi Comb) (Abello et al., 2002) Figura 4-B, su objetivo básico es alinear los datos por parcelas de manera circular. Las parcelas de datos están formadas por la información de una variable con respecto al tiempo. Otros ejemplos son la visualización de Río Temático (Figura 4-C) que es de gran utilidad para ver la variación de datos en una gran colección de información. Los cambios son mostrados en el contexto de una línea de tiempo. Los cambios en la imagen permiten al usuario discernir patrones más fácilmente y analizar la relación entre los datos. 17

29 CAPÍTULO I 2013 Figura 4 Ejemplos de otras Técnicas de Visualización. Mapas Auto-organizados Los mapas auto-organizados (Figura 4-D) o redes de Kohonen (SOM por sus siglas en inglés, Self-Organizing Map ) fueron introducidos por el profesor finlandés Teuvo Kohonen en los artículos(kohonen, 1982, 1990; Kaski et al., 1998). Un Mapa Auto-organizado es una 18

30 CAPÍTULO I 2013 herramienta que analiza datos en muchas dimensiones con relaciones complejas entre ellos y los presenta en una visualización sencilla en sólo dos dimensiones. La propiedad más importante de SOM es que preserva las propiedades topológicas de los datos, es decir, que datos próximos aparecen próximos en la visualización. Este tipo de red posee un aprendizaje no supervisado competitivo. La red auto-organizada debe descubrir rasgos comunes, regularidades, correlaciones o categorías en los datos de entrada, e incorporarlos a su estructura interna de conexiones. Se dice, por tanto, que las neuronas deben auto-organizarse en función de los estímulos (datos) procedentes del exterior. En el aprendizaje competitivo las neuronas compiten unas con otras con el fin de llevar a cabo una tarea dada. Se pretende que cuando se presente a la red un patrón de entrada, sólo una de las neuronas de salida (o un grupo de vecinas) se active. Por tanto, las neuronas compiten por activarse, quedando finalmente una como neurona vencedora y el resto anuladas, que son forzadas a sus valores de respuesta mínimos. Arquitectura del SOM Un modelo SOM está compuesto por dos capas de neuronas. La capa de entrada (formada por N neuronas, una por cada variable de entrada) se encarga de recibir y transmitir a la capa de salida la información procedente del exterior. La capa de salida (formada por M neuronas) es la encargada de procesar la información y formar el mapa de rasgos. Normalmente, las neuronas de la capa de salida se organizan en forma de mapa bidimensional como se muestra en la Figura 5. 19

31 CAPÍTULO I 2013 Figura 5 Arquitectura del SOM Las conexiones entre las dos capas que forman la red son siempre hacia delante, es decir, la información se propaga desde la capa de entrada hacia la capa de salida. 1.4 Sistemas de Información Geográfica Un Sistema de Información Geográfica (SIG o GIS, en su acrónimo inglés Geographic Information System) es una integración organizada de hardware, software y datos geográficos diseñada para capturar, almacenar, manipular, analizar y desplegar en todas sus formas la información geográficamente referenciada con el fin de resolver problemas complejos de planificación y gestión geográfica (Chrisman et al., 1989). También puede definirse como un modelo de una parte de la realidad referido a un sistema de coordenadas terrestre y construido para satisfacer unas necesidades concretas de información. En el sentido más estricto, es cualquier sistema de información capaz de integrar, almacenar, editar, analizar, compartir y mostrar la información geográficamente referenciada. En un sentido más genérico, los SIG son herramientas que permiten a los usuarios crear consultas interactivas, analizar la información espacial, editar datos, mapas y presentar los resultados de todas estas operaciones. Los SIG son herramientas cartográficas que permiten la creación de mapas en tiempo real y el análisis de los impactos de los cambios en el mapa de forma interactiva (Rhyne, 1997a). 20

32 CAPÍTULO I 2013 El SIG funciona como una base de datos con información geográfica (datos alfanuméricos) que se encuentra asociada por un identificador común a los objetos gráficos de un mapa digital. De esta forma, señalando un objeto se conocen sus atributos e, inversamente, preguntando por un registro de la base de datos se puede saber su localización en la cartografía. La razón fundamental para utilizar un SIG es la gestión de información espacial. El sistema permite separar la información en diferentes capas temáticas y las almacena independientemente, permitiendo trabajar con ellas de manera rápida y sencilla, facilitando al profesional la posibilidad de relacionar la información existente a través de la topología de los objetos, con el fin de generar otra nueva que no podríamos obtener de otra forma. Las principales cuestiones que puede resolver un Sistema de Información Geográfica, ordenadas de menor a mayor complejidad, son: Localización: preguntar por las características de un lugar concreto. Condición: el cumplimiento o no de unas condiciones impuestas al sistema. Tendencia: comparación entre situaciones temporales o espaciales distintas de alguna característica. Rutas: cálculo de rutas óptimas entre dos o más puntos. Pautas: detección de pautas espaciales. Modelos: generación de modelos a partir de fenómenos o actuaciones simuladas. Son muchas las ventajas que se pueden obtener de los SIG por las múltiples aplicaciones en que se pueden emplear. A continuación se abordan un conjunto de SIG que son los más utilizados ArcGIS ArcGIS es el nombre de un conjunto de productos de software en el campo de los Sistemas de Información Geográfica o SIG. Producido y comercializado por ESRI, bajo el nombre genérico ArcGIS se agrupan varias aplicaciones para la captura, edición, análisis, tratamiento, diseño, publicación e impresión de información geográfica. Estas aplicaciones se engloban en familias temáticas como ArcGIS Server, para la publicación y gestión web, o ArcGIS Móvil para la 21

33 CAPÍTULO I 2013 captura y gestión de información en campo. Este es un software propietario y para su utilización es necesario pagar una licencia. Es un software GIS para visualizar, crear, manipular y gestionar información geográfica, estos corresponden a lugares, direcciones, posiciones en terreno, áreas urbanas y rurales; regiones y cualquier tipo de ubicaciones en terrenos determinados. Esta información es trabajada de manera sistémica, lo que representa una diferencia sustancial a lo relacionado al trabajo con información planos y mapas, permitiendo explorar, ver y analizar los datos según parámetros, relaciones y tendencias que presenta la información, teniendo como resultado nuevas capas de información, mapas y nuevas bases de datos. Tiene una interfaz gráfica amigable, en la cual se puede desplegar de manera rápida la información geográfica. El aprendizaje del software es rápido, teniendo algunos conocimientos de Sistemas de Información Geográfica previos, junto a lo anterior, contiene una gran ayuda en línea. Con ArcView GIS se puede construir los mapas dinámicos e inteligentes que permiten visualizar patrones, tendencias y singularidades en sus datos. Arc View GIS incluye formas fáciles de levantar mapas, formatos predefinidos de mapas y una librería de elementos extensa, que permiten elaborar mapas de calidad rápidos y como el usuario desee Grass GIS GRASS GIS, comúnmente conocida como GRASS (Geographic Resources Analysis Support System), es un sistema libre de Información Geográfica (SIG) utilizado para la gestión y el análisis de datos geoespaciales, procesamiento de imágenes, producción de gráficos y mapas, modelado espacial y visualización. GRASS GIS se utiliza actualmente en los ambientes académicos y comerciales en todo el mundo, así como por muchas agencias gubernamentales y empresas de consultoría ambiental. GRASS GIS es un proyecto oficial de la Open Source Geospatial Foundation (OSGeo). GRASS es un programa completamente modular, es decir se basa en más de 350 módulos y herramientas que ejecutan tareas concretas y simples. Cuando se ejecuta GRASS no se carga un gran programa en memoria, sino que simplemente se cargan una serie de nuevas variables de 22

34 CAPÍTULO I 2013 entorno que permiten el acceso a los datos y a los módulos de GRASS. Estos incluyen herramientas para el manejo de información en formatos raster y vectorial así como mapas de puntos, herramientas para el análisis de imágenes de satélite, para el enlace a bases de datos y paquetes estadísticos GIS, así como para la de gráficos(theisel, 2000; Keim, 2002b; Hansen et al., 2005). Existe embargo una Interfaz Gráfica de Usuario basada en Tcl-Tk. Existe también una versión experimental de GRASS para Windows NT/2000 corriendo Cygwin. La ventaja del trabajo en línea de comando es que los diferentes módulos de GRASS pueden integrarse en scripts utilizando la shell, lo que permite a usuarios y programadores crear nuevas aplicaciones y enlazar GRASS con otros paquetes de software. Existe además una API para C, incluyendo más de 800 librerías, completamente documentada que permite el desarrollo de nuevos módulos directamente en lenguaje C. Puesto que GRASS se encuentra disponible bajo licencia GNU GPL, el usuario recibe el código fuente así como una completa librería de desarrollo de SIG que puede utilizarse para crear nuevos programas. Se dispone también de un Manual del programador de GRASS Quantum GIS Quantum GIS (o QGIS) es un Sistema de Información Geográfica (SIG) tipo escritorio, muy intuitivo y fácil de utilizar. Su licencia es GNU, y por tanto se trata de código libre. Es multiplataforma y se puede encontrar versiones para diferentes sistemas operativos: GNU/Linux, Unix, Mac OS y Microsoft Windows. Era uno de los primeros ocho proyectos de la Fundación OSGeo y en 2008 oficialmente graduó de la fase de incubación. Permite manejar formatos raster y vectoriales a través de las bibliotecas GDAL y OGR, así como bases de datos. Una de sus mayores ventajas es la posibilidad de usar Quantum GIS como GUI del SIG GRASS, utilizando toda la potencia de análisis de este último en un entorno de trabajo más amigable. QGIS está desarrollado en C++, usando la biblioteca Qt para su interfaz gráfica de usuario gvsig gvsig (Generalitat Valenciana SIG) surge como un proyecto amparado por la Generalitat Valenciana de España a finales de 2003, es un Sistema de Información Geográfica (SIG) 23

35 CAPÍTULO I 2013 conocido por tener una interfaz amigable. Cuenta con una amplia gama de herramientas para trabajar con información geográfica como herramientas de consulta, la creación de diseño, geoprocesamiento, redes, etc, lo que convierte gvsig en la herramienta ideal para usuarios que trabajan en el reino de la tierra. gvsig es conocido por: La integración en la misma vista datos tanto locales como remotos a través de estándares OGC. Siendo diseñado para ser fácilmente extensible, lo que permite la mejora continua de las aplicaciones, así como permitir el desarrollo de soluciones a medida. Es un programa informático para el manejo de información geográfica con precisión cartográfica que se distribuye bajo licencia GNU GPL v2. Permite acceder a información vectorial y rasterizada así como a servidores de mapas que cumplan las especificaciones del OGC. Esta es una de las principales características de gvsig respecto a otros Sistema de Información Geográfica, la importante implementación de servicios OGC: WMS (Web Map Service), WFS (Web Feature Service), WCS (Web Coverage Service), Servicio de Catálogo y Servicio de Nomenclátor. Este SIG posee las aplicaciones traducidas a veinte idiomas; toda la documentación está disponible en 5 idiomas, incluyendo español e inglés, por lo que se ha convertido en un SIG muy popular en el mundo hispano (Anguix, 2009) 1.5 Integración de VisCi con SIG A finales de los años ochenta y principio de los noventa la VisCi y los SIG se desarrollaron en paralelo y de forma independiente (Rhyne, 1997b). Los esfuerzos para desarrollar estándares de datos espaciales rara vez consideraron la forma en que estos se visualizaban. Las bibliotecas gráficas y los estándares evolucionaron independientemente de los modelos de datos. Como resultado de esto se evidenciaron muchas ineficiencias asociadas con la visualización de datos geográficos. Entre ellas se incluyen dificultades con el registro de los datos espaciales dentro de Sistemas de Visualización Científica, engorrosas producciones de secuencias de animaciones en 24

36 CAPÍTULO I 2013 SIG y quizás la más importante, la falta de conexión entre bases de datos y los ambientes de visualización que soportaban la visualización de datos espaciales (Hearnshaw et al., 1994). Los desarrolladores de herramientas SIG y de VisCi hicieron esfuerzos para ampliar e integrar sus sistemas (Rhyne et al., 1994). Los desarrolladores de SIG estudiaron la forma de incorporar las capacidades de la animación de series de tiempo en tres dimensiones en su software. Los desarrolladores de herramientas de VisCi comenzaron la construcción de lectores de datos que soportaban los formatos de datos espaciales como modelos digitales de elevación, así como formatos de SIG comerciales. Al examinar estos esfuerzos fueron definidos cuatro niveles de métodos de integración entre SIG y VisCi: rudimentario, operacional, funcional y mezclado (Rhyne, 1997a). El enfoque rudimentario utiliza una mínima integración de datos e intercambio entre las dos tecnologías. El nivel operacional proporciona coherencia entre los datos mientras se eliminan las redundancias entre las dos tecnologías (Cook et al., 1997). La forma funcional intenta proporcionar una comunicación transparente entre los entornos de software correspondientes (Mitas et al., 1997). El enfoque mezclado se refiere al desarrollo de sistemas donde los conceptos de cartografía, SIG y VisCi se funden en una única herramienta. El nivel rudimentario de intercambiar datos en formatos de SIG hacia las herramientas de VisCi se ha logrado en casos puntuales. Algunos ambientes de VisCi se han aproximado en el nivel operacional permitiendo accesos directos a bases de datos de SIG; sin embargo esto suele ser en un solo sentido, una vez que la herramienta de VisCi genera la imagen tridimensional o la animación, generalmente no es posible activar las funciones de consulta de los SIG desde la pantalla de visualización. Lograr la integración funcional de SIG y herramientas de VisCi requiere de estándares abiertos de datos de SIG, enlaces a programas que permitan que las herramientas de VisCi realicen análisis de datos espaciales y funciones de extracción de información. También es factible el uso de sistemas expertos o una arquitectura basada en reglas con agentes inteligentes para facilitar la comunicación transparente entre SIG y herramientas de VisCi (Rogowitz et al., 1993). 25

37 CAPÍTULO I 2013 Los sistemas que implementan el enfoque mezclado replantean el proceso de desarrollo de herramientas SIG-VisCi. En este sentido la cartografía está bien posicionada como puente entre ambas tecnologías. Algunos de los primeros intentos del enfoque mezclado entre los SIG y la VisCi se han materializado a través de herramientas como GeoVista Studio y Snap-Together Visualization. Ambas herramientas están basadas en redes de componentes que permiten la construcción de complejos flujos de trabajos que vinculan componentes para el manejo de formatos de datos geográficos y de diferentes técnicas de VisCi Snap-Together Visualization Snap-Together Visualization es una herramienta Web que permite que los datos de los usuarios sean mezclados y correlacionados de forma dinámica en visualizaciones coordinadas para la construcción personalizada de interfaces de exploración sin necesidad de programación. El modelo conceptual de Snap-Together se basa en un modelo de base de datos relacional. Este permite que las relaciones sean cargadas durante la visualización y se coordinen basándose en las características que las unen. Los usuarios pueden crear diferentes tipos de coordinaciones tales como: barridos, vistas de detalles, vistas globales y desplazamientos sincronizados. Los desarrolladores de visualización pueden integrar al sistema sus visualizaciones independientes con un API simple. La evaluación de esta herramienta reveló beneficios en cuanto a aspectos cognitivos y su usabilidad, mejorando el rendimiento de los usuarios entre un 30 y un 80 por ciento, dependiendo de la tarea realizada (North et al., 2000). Algunas de las técnicas de visualización que están incluidas en esa herramienta son los Diagramas de Dispersión y los TreeMap (North et al., 2000) GeoVista Studio GeoVista Studio(GAHEGAN et al., 2002; TAKATSUKA et al., 2002; MacEachren et al., 2003) es una herramienta de código abierto que implementa un ambiente de desarrollo basado en componentes. Suministra una interfaz de programación visual como muchos sistemas de VisCi, a través de la cual los usuarios pueden construir aplicaciones de forma rápida utilizando 26

38 CAPÍTULO I 2013 JavaBeans. El ambiente de programación visual permite a los analistas empaquetar funcionalidades dentro de un programa de trabajo. GeoVista soporta el desarrollo de aplicaciones geográficas y no geográficas. Para soportar la interoperabilidad de datos OpenGIS, los desarrolladores de GeoVista han comenzado a adaptar y extender la biblioteca GeoTools en cuanto al acceso a datos y los métodos de visualización. GeoTools es una biblioteca complementaria de código abierto desarrollada en Java para el desarrollo de soluciones OpenGIS que permite el acceso a datos geoespaciales, el análisis y la representación de tareas. El principal objetivo de GeoVista Studio es soportar la fusión de diversas capacidades visuales y analíticas en una herramienta de análisis que posibilite la multiperspectiva. GeoVista incluye además un conjunto de técnicas de visualización clásicas como Diagramas de Dispersión, Coordenadas Paralelas y Mapas Auto-Organizados(Kohonen, 1990; GAHEGAN et al., 2002; TAKATSUKA et al., 2002). La herramienta Exploratory Spatio-Temporal Analysis Tollkit(ESTAT) fue incluida al GeoVista Studio y constituye una buena herramienta para analizar datos espacio-temporales asociados a mapas vectoriales de áreas en formato ESRI shape VIS- STAMP Es un paquete de software para explorar los datos espacio-temporales multivariables, descubrir interesantes y complejos patrones desconocidos, y presentarlos en una forma fácil de entender para apoyar la interpretación humana, el razonamiento analítico, y / o la toma de decisiones. VIS- STAMP(Guo et al., 2006; Keim et al., 2010; Aigner, 2011) ha sido usado para estudiar el cambio climático como se puede ver en (Jin et al., 2009). Es capaz de integrar: Un Mapa Auto-organizado para realizar la agrupación de variables múltiples, la clasificación, y la asignación de colores. Un gráfico de Coordenadas Paralelas para visualizar los patrones multivariados y servir como una "leyenda" en el sistema integrado. Una Matriz Reordenable para organizar patrones multivariables en el espacio-tiempo, y para revelar la variación espacial. 27

39 CAPÍTULO I GAV Flash tools Las herramientas GAV Flash(Andrienko et al., 2010; Ho et al., 2011) del término en inglés Geovisual Analytics Visualization comparten aplicaciones basadas en los principios del análisis visual de datos. Contienen una colección de componentes visuales, algoritmos de análisis de datos, herramientas que conectan los componentes con otros componentes y suministradores de datos que pueden cargar datos desde varias fuentes. El sistema está completamente integrado con el framework de Adobe Flex (Van Ho et al., 2012) ArcView - xgobi En la geovisualzación, un buen ejemplo de integración es el enlace bidireccional entre ArcView y XGobi (Symanzik et al., 2000), trabajo donde se integran los gráficos interactivos de XGobi para manipular datos con muchas dimensiones con las herramientas de manipulación de datos espaciales de ArcView. El ArcView - XGobi - Xplore permite que los datos recogidos en lugares espaciales que se almacenan en ArcView pasen dinámicamente a XGobi y Xplore y ser explorados y analizados. El vínculo entre los datos de XGobi y Xplore y los lugares de los que fueron recogidos se mantienen a través de marcado y enlace (linking and brushing). El marcado y enlazado, tal como se utiliza en este contexto, es la capacidad de cambiar el tamaño / color de los puntos, ya sea en ArcView, XGobi o Xplore y para ver que los puntos correspondientes de las otras aplicaciones cambian simultáneamente Formatos de datos científicos utilizados en la Visualización Científica Otra forma de integración de VisCi-SIG es mediante la incorporación a los SIG de formatos de datos científicos. Se han desarrollado intentos de integrar algunos de los formatos de datos científicos más comúnmente utilizados en la visualización científica, -como Common Data Format (CDF) (Atkinson et al., 1995), Network Common Data Format (NetCDF) (Rew et al., 1990), Hierarchical Data Format (HDF) (Zhao et al., 2010), y Flexible Image Transport System (FITS) (Hanisch et al., 2001)-, con sistemas de información geográfica, por ejemplo actualmente la suite de ArcGIS permite la manipulación de algunos de estos formatos, como NetCDF y HDF. 28

40 CAPÍTULO I 2013 HDF HDF significa Hierarchical Data Format y es desarrollado por el Centro Nacional de Aplicaciones de Supercómputo (National Center for Supercomputing Applications, NCSA) en la Universidad de Illinois. HDF es una biblioteca y un formato de fichero multiobjeto para la transferencia de datos gráficos y numéricos entre máquinas. Los principales rasgos que caracterizan los ficheros HDF son: Es versátil. HDF suporta muchos tipos diferentes de modelos de datos. Cada modelo de dato define un conjunto específico de tipo de dato y provee una API para lectura, escritura y organización de datos y metadatos del tipo correspondiente. Los modelos de datos soportados incluyen arreglos multidimensionales, imágenes de puntos, y tablas. Es auto-descriptivo. Permitiendo una aplicación para interpretar la estructura y contenidos de un fichero sin ninguna información proveniente del exterior. Es flexible. Con HDF, se pueden mezclar y asociar objetos relacionados agrupados en un fichero y acceder a ellos como un grupo o como objetos individuales. Los usuarios pueden además crear sus propias estructuras de agrupamiento utilizando un rasgo de HDF llamado vgroups. Es extensible. Puede acomodar fácilmente nuevos modelos de datos, sin tener en cuenta si fueron adicionados por el equipo de desarrolladores de HDF o por los usuarios de HDF. Es portable. Los ficheros HDF pueden ser compartidos a través de la mayoría de las plataformas comunes, incluyendo muchas estaciones de trabajo y computadoras de alto desempeño. Un fichero HDF creado en una computadora puede ser leído en un sistema diferente sin modificación alguna. Es comprimible. Los datos pueden estar compactados permitiendo un ahorro en la capacidad de almacenamiento, sobre todo cuando no se necesita tener cargada toda la información en memoria. 29

41 CAPÍTULO I 2013 CDF El Common Data Format (CDF) es un formato de datos auto-descriptivo para el almacenamiento y manipulación de datos escalares y multidimensionales en una forma independiente de la plataforma y el campo de especialidad. A pesar de que CDF tiene su propio formato interno auto-descriptivo, éste consiste en algo más que sólo un formato de datos. CDF es un paquete de administración de datos científicos (conocido como la Biblioteca CDF") la cual permite a los programadores y desarrolladores de aplicaciones administrar y manipular arreglos de datos escalares, vectoriales y multidimensionales. El fichero dotcdf (Fichero de datos CDF) contiene un número mágico y dos o más registros internos (RIs) que son utilizados para organizar los contenidos de un CDF. Diferentes tipos de registros internos son utilizados para almacenar información sobre varios aspectos y/u objetos en el CDF. Todos los ficheros dotcdf contienen un CDF Descriptor Record (CDR) y un Global Descriptor Record (GDR). Otros registros internos estarán presentes dependiendo de los contenidos del CDF. El único registro interno en una localización fija en el fichero dotcdf es el CDR. Todos los otros registros internos (incluyendo el GDR) pueden estar presentes en cualquier orden (el cual depende, generalmente, del orden en que fueron creados por la aplicación los contenidos del CDF). netcdf The Network Common Data Form o netcdf, es una interfaz a una biblioteca de funciones de acceso a datos diseñada para el almacenamiento y recuperación de datos en forma de arreglos, donde cada arreglo es una estructura rectangular n-dimensional (con n 0,1,2 ) en la que todos sus elementos son del mismo tipo de dato (ejemplo: caracteres de 8-bit, entero de 32-bit) y un escalar (un solo valor) equivale a un arreglo 0-dimensional. La biblioteca netcdf implementa un tipo de datos abstracto, por lo que todas las operaciones para acceder y manipular datos en un conjunto de datos de netcdf, deben usar sólo las funciones que provee la interfaz. La representación de los datos está oculta para aplicaciones que 30

42 CAPÍTULO I 2013 usen la interfaz, así que la forma en la cual estos se encuentran almacenados puede ser cambiada sin afectar los programas existentes. La representación física de los datos de formato netcdf está diseñada para ser independiente de la computadora en que se almacenen. Los datos son vistos como una colección de objetos portables y auto-descriptibles que pueden ser accedidos a través de una simple interfaz. Se puede acceder directamente a sus valores, sin conocer detalles sobre la forma en que se encuentran almacenados. Las informaciones auxiliares sobre los datos, tales como, las Units que utilizaron, se pueden almacenar conjuntamente con los datos. Las Utilidades Genéricas (Generic Utilities) y los programas de aplicación pueden acceder a conjuntos de datos en netcdf y transformar, combinar, analizar o mostrar campos específicos de los datos. El desarrollo de tales aplicaciones ha dado lugar a una mejor accesibilidad de datos y una mejor reutilización de software para la administración, análisis y visualización de datos orientados a arreglos. La biblioteca netcdf está soportada para varios sistemas operativos UNIX y tiene también disponible un puerto de Microsoft Windows. El programa fue también portado hacia otros sistemas operativos y probado en los mismos, asistidos por usuarios con acceso a esos sistemas, antes de cualquier lanzamiento mayor. FITS o Flexible Image Transport System Es el formato de archivo más utilizado comúnmente en el mundo de la astronomía. Es a menudo utilizado para almacenar también datos que no son imágenes, como espectros electromagnéticos, listas de fotones, cubos de datos y muchos más. Un fichero FITS podría contener varias extensiones, y cada una de ellas podría contener datos de un objeto. Por ejemplo, es posible almacenar imágenes de rayos X y también imágenes pertenecientes al infrarrojo en el mismo archivo FITS. La mayor ventaja de FITS para datos científicos es que la información de las cabeceras es legible en ASCII, de modo que un usuario puede examinar las cabeceras para investigar un archivo de procedencia desconocida. Cada archivo FITS consiste en una o más cabeceras que contienen secuencias de 80 cadenas de caracteres fijos que llevan pares de valores, interpolados entre los bloques de datos. Los pares de valores proveen información (metadatos) como son el tamaño, origen, formato binario de los datos, comentarios, historia de los datos y cualquier otra 31

43 CAPÍTULO I 2013 información que el creador desee: mientras varias palabras están restringidas para FITS, el estándar permite el uso arbitrario de todas las palabras. FITS está soportado mediante bibliotecas disponibles en los lenguajes más utilizados en el ámbito científico, incluyendo C, FORTRAN, Perl, PDL, Python, e IDL. La Oficina de Soporte de FITS de la NASA/GSFC mantiene una lista de bibliotecas y plataformas que actualmente soportan FITS. 1.6 Conclusiones parciales En este capítulo se presentaron los principales elementos teóricos sobre la VisCi, profundizando en las técnicas de visualización de datos multiparamétricos. Además se analizaron características generales de los SIG más utilizados. Se analizaron los esfuerzos de integración entre estas dos disciplinas y se mostraron ejemplos de integración mediante el enfoque mezclado. Se concluye que las técnicas de visualización de datos multiparamétricos constituyen valiosas herramientas para el análisis visual de datos, por lo que se escogerán algunas de ellas para ser implementadas en un módulo de visualización e incorporarlas al gvsig. La integración de este tipo de técnicas en gvsig constituye un esfuerzo más en el acercamiento entre estas dos disciplinas. En el siguiente capítulo se presentan los aspectos de diseño e implementación relacionados con la integración de las técnicas de visualización de datos multiparamétricos en gvsig. 32

44 CAPÍTULO II 2013 CAPÍTULO 2. DISEÑO E IMPLEMENTACIÓN DEL MÓDULO DE VISUALIZACIÓN. En el capítulo actual se presentarán los cambios que serán necesarios hacer sobre el módulo de visualización científica para soportar la lectura de grandes volúmenes de datos y la implementación de las nuevas técnicas de visualización. Se mostrarán los principales elementos de diseño e implementación de cada técnica seleccionada. 2.1 Análisis de actores y casos de uso Los modelos de casos de uso muestran el conjunto de casos de uso, actores y sus relaciones. Cubren la vista de casos de uso estática de un sistema. Estos diagramas son especialmente importantes en el modelado y organización del comportamiento de un sistema. La extensión implementada está destinada a un solo tipo de actor que es el especialista o investigador de cualquier rama que desee explorar sus datos de manera visual y que sean capaces de interpretar de forma correcta los resultados que brinda la herramienta. Figura 6. Diagramas de casos de usos 33

45 CAPÍTULO II 2013 La visualización coordinada significa visualizar, mediante técnicas de visualización científica, múltiples conjuntos de datos correspondientes a varios puntos en el espacio. Es coordinada porque todas las visualizaciones se realizan normalizando los valores de las variables teniendo en cuenta los mínimos y máximos en todos los conjuntos de datos para cada variable. La visualización coordinada permite obtener información sobre el origen de los datos visualizados, referenciando los gráficos generados por las técnicas a la localización de los datos en un mapa; esta referencia puede realizarse emplazando los gráficos sobre el punto de origen de los datos o visualizando los gráficos en ventanas independientes y relacionarlas con sus respectivas localizaciones en el mapa. Como instancias de este caso de uso el Especialista puede visualizar los datos con Matriz de Dispersión, Cara de Chernoff, Matriz Auto-Organizada y como complemento de la técnica anterior se muestra también un gráfico de Coordenadas Paralelas, el cual permite visualizar los datos que pertenecen a cada cluster seleccionado por el usuario en la técnica de Mapas Auto- Organizados. Estas dos últimas técnicas están enlazadas con el objetivo de proporcionar un mejor análisis de los datos visualizados. Por supuesto también se pueden seleccionar las técnicas que existían anteriormente en el módulo que son Coordenadas Paralelas, Gráfico de Andrews, Segmentos de Círculo, Patrones Recursivos y técnicas basadas en iconos. 2.2 Arquitectura general e interacción Usuario-Software Los SIG no están diseñados para trabajar de forma óptima con grandes conjuntos de información, por lo tanto se quiere modificar la forma en que se cargan los datos para poder ser utilizados por la extensión para la visualización. 34

46 CAPÍTULO II 2013 Figura 7 Arquitectura general La figura anterior muestra la arquitectura propuesta, en la cual se implementaron dos nuevos módulos al SIG, el módulo de visualización científica con todas las posibilidades de mostrar diferentes técnicas e interactuar con ellas y el módulo para la lectura de datos con formato científico que permite manejar grandes volúmenes de datos, como por ejemplo HDF. El usuario tiene la posibilidad de seleccionar las técnicas de visualización que desea usar para luego mostrar los datos asociados a las regiones del mapa donde este de clic. Además permite escoger cuál de las técnicas seleccionadas será mostrada sobre el mapa de fondo y cuales estarán en paneles independientes. Esta arquitectura permite al usuario mostrar con las mismas técnicas de visualización los datos asociados a distintas localidades del mapa y así poder analizar los resultados para sacar conclusiones. Para una mejor comprensión se muestra a continuación cómo será la interacción del usuario con el software. 35

47 CAPÍTULO II 2013 Figura 8 Interacción del usuario con el software 2.3 Diseño de la extensión realizada a gvsig El proceso de desarrollo de técnicas de visualización para algún sistema tiene como punto de partida natural la estructura y tipos de datos que serán utilizados. Con el objetivo de aumentar las posibilidades de análisis del módulo de visualización de datos multiparamétricos se seleccionaron las siguientes técnicas: Matrices de Dispersión. Caras de Chernoff. Mapas Auto-organizados. Antes de explicar en detalle el diseño de las herramientas implementadas se hace necesario seleccionar además de las técnicas, un formato de datos adecuado para el procesamiento de grandes volúmenes de datos espacio temporales. 36

48 CAPÍTULO II 2013 Está claro que cualquier conjunto de referencia continua puede ser discretizado de diferentes maneras. Por ejemplo, un espacio geográfico de dos dimensiones (territorio) puede ser dividido en unidades administrativas de varios niveles (países, provincias o estados, los municipios o condados, etc.) o en celdas normales, con una elección arbitraria del tamaño de la celda y el origen de la cuadrícula (Andrienko et al., 2006). De esta manera después de discretizar, los datos estarán relacionados en forma de mallas regulares. En este sentido, antes de llevar al enfoque, se tiene que seleccionar un modelo de datos que se ajuste al problema. En (Andrienko et al., 2006) los modelos de datos se muestran como una función que usa a la referencia R como argumento y provee características C. No existe una división explícita de datos en componentes referenciales y característicos en la literatura sobre cartografía y GIS. De acuerdo con (Andrienko et al., 2006), el espacio y el tiempo son normalmente tratados como referentes y los componentes de datos restantes como referencia al espacio y el tiempo. Este modelo de datos después de los modelos descritos en (Andrienko et al., 2006), utiliza como referencia el espacio y el tiempo, y el resto de variables como las características, aunque el tiempo puede ser visto como otra variable de las características. La Figura 9 muestra un ejemplo del modelo de datos seleccionado para este enfoque. 37

49 CAPÍTULO II 2013 Figura 9 Modelo de dato, seleccionado para nuestro problema. HDF (Hierarchical Data Format) fue el formato de los datos científicos seleccionado para el estudio. HDF es una biblioteca y un formato de archivo para la transferencia de datos gráficos y numéricos entre máquinas. Se propone la integración de un módulo para gvsig que permite manipular estos formatos de datos. Hay dos versiones de HDF - HDF4 y HDF5 - y el último de éstos se propone para este estudio. Con el fin de proporcionar a gvsig la capacidad para acceder a los archivos de HDF se construyó un módulo en Java utilizando HDF-JAVA, una biblioteca gratuita desarrollada por el grupo de HDF (McGrath et al., 1997). El proceso de lectura de los datos después de una petición de usuario sobre una celda está ligado a la estructura de un archivo de HDF específico que contiene múltiples variables de enormes cantidades de datos espacio-temporales. 38

50 CAPÍTULO II 2013 Se propone la siguiente estructura para crear el HDF: crear un conjunto de datos índice que tiene la misma extensión del mapa de fondo (matriz de M filas por N columnas) con el número de la celda si contiene información y 0 en la posición si hay no hay información. Almacenar un conjunto de datos de P filas por Q columnas para cada una de las variables V, donde P es el número de celdas con la información, y Q el número de registros temporales para cada variable. También se puede crear para cada variable de un conjunto de datos de 2 por 1, para almacenar los valores extremos de los datos por variable Diagramas de transición de estados A continuación en la Figura 10 se muestran los estados por lo que pasa el sistema durante el proceso de visualización coordinada. 39

51 CAPÍTULO II 2013 Figura 10 Diagrama de transición de estados para el caso de uso visualizar de forma coordinada. Inicialmente el sistema pasa al estado Cargando Proyecto de Visualización Científica en el cual se carga el mapa de fondo. De este estado pasa a Seleccionando Técnicas de Visualización científica, momento en el cual el usuario es capaz de seleccionar las técnicas que desea visualizar, especificando cuál de ellas se mostrará sobre el mapa y cuáles en paneles independientes. 40

52 CAPÍTULO II 2013 Luego se pasa al estado Seleccionando Localizaciones y Mostrando Representación Visual de los Datos, durante este estado el usuario puede seleccionar los lugares del mapa de fondo de donde desea cargar los datos. Cuando el usuario presiona clic sobre un lugar del mapa se pasa al estado Cargar Datos de Archivo HDF. El proceso de lectura de los datos dada una petición en una celda realizada por un usuario es el siguiente: Abrir el conjunto de datos que almacena los índices (Matriz de M por N) y cargarlo en memoria. Al acceder a esta matriz en (fila, columna), se devuelve el número de la celda si contiene información, si no contiene información el valor en el escaque dado es 0. Luego se abre cada uno de los conjuntos de datos que almacenan las variables climáticas y se lee solo los Q valores de cada conjunto de datos, accediendo por las filas al número de celda devuelto restándole 1 y leyendo en cada conjunto de datos los Q valores de la fila correspondiente, de esta forma se seleccionan V*Q valores. Además se lee los mínimos y máximos global de cada variable. Luego se pasa nuevamente al estado Seleccionando Localizaciones y Mostrando Representación Visual de los Datos y la información obtenida en el estado anterior se le pasa a cada técnica para que se visualice sobre la celda correspondiente en el mapa de fondo o en paneles independientes dependiendo de la configuración seleccionada. Si el usuario hace clic en otra localización se repite el proceso para esa nueva celda. Si el usuario desea modificar los parámetros de visualización pasa al estado Opciones de Filtrado de los Datos y Configuración de las Técnicas. Durante este estado se puede seleccionar las variables que se quieren visualizar, el porcentaje de los datos que se quiere mostrar, seleccionar de acuerdo a un rango de valores de un atributo (hace un subejemplo de los datos en un rango de valores seleccionados para un atributo dado), entre otras opciones. Además cada técnica tiene un panel de configuración independiente que permite personalizar las características específicas de cada una de ellas. Luego de realizar los cambios deseados se retorna al estado Seleccionando Localizaciones y Mostrando Representación Visual de los Datos para mostrar los cambios realizados. En este estado el usuario puede interactuar con las técnicas. 41

53 CAPÍTULO II Diagramas de clases Durante este epígrafe se mostrará la estructura de clases necesarias para la implementación de las técnicas de visualización agregadas al módulo Paquete para la visualización coordinada Uno de los objetivos del paquete para la visualización coordinada de varios conjuntos de datos es poder obtener una percepción sobre la localización de los datos visualizados. Para ello se hace necesario contar con una ventana o vista donde se puedan cargar los mapas para la localización de los gráficos y permitir la visualización de las técnicas. La siguiente figura muestra un diagrama de clases simplificado donde se observa la representación interna de la vista añadida a gvsig para realizar la visualización coordinada. A partir del modelo extensible de documentos definido en gvsig se ha definido un nuevo tipo de documento llamado ProjectSV a través de una clase base ProjectViewBase. El nuevo tipo documento tiene su propia factoría ProjectSVFactory, que se registra como factoría de documentos de gvsig. ProjectSV hereda de la clase base ProjectViewBase que contiene un MapContext con una instancia de FLayers, quien a su vez contiene implementaciones alternativas de algunos métodos (por ejemplo para añadir o borrar una capa). Figura 11 Diagrama de clases de la vista para la visualización coordinada. 42

54 CAPÍTULO II 2013 La metodología a seguir para agregar nuevas extensiones a gvsig se explica a continuación. Las extensiones que se deseen añadir a gvsig deben heredar de Extension, que implementa la interfaz IExtension y deben implementar los siguientes métodos: public void initialize(): Una vez que se leen y se ordenan todas las extensiones presentes en los módulos, se llama a este método para cada una de las extensiones, de forma secuencial, siguiendo el orden definido en la prioridad de las mismas. public boolean isvisible(): Este método permite definir la visibilidad de la extensión haciendo chequeos de las condiciones bajo las cuales se desea que la extensión esté activa o visible. public boolean isenable(): Estando la extensión activa puede a su vez estar habilitada o no. Mediante este método se pueden definir las condiciones bajo las cuales se le permite al usuario hacer uso de la extensión. public void execute(string actioncommand): En el config.xml de cada módulo añadido como una extensión a gvsig se definen elementos de la interfaz de usuario (botones, menús, etc.). Cuando el usuario pulsa en uno de estos elementos de la interfaz, se busca en la extensión asociada y se llama a este método. Los elementos de la interfaz pueden tener asociado una cadena que actúa como identificador de comando (actioncommand). Cuando se llama al método execute, se pasa como parámetro el actioncommand asociado al botón o menú que fue pulsado. De esta forma, si se tienen varios botones o menús en una extensión, se puede decidir cuál acción ejecutar comprobando el actioncommand generado. Utilizando la metodología para la adición de extensiones a gvsig, el nuevo tipo de documento creado puede ser registrado como documento de gvsig. La clase ExtensionSV, que hereda de Extension, se encarga de registrar el nuevo tipo de documento llamando al método register() de la clase ProjectSVFactory. El diagrama de la Figura 12 muestra esta relación. 43

55 CAPÍTULO II 2013 Figura 12 Integración del paquete de visualización coordinada como una extensión de gvsig. El método createwindow() de la clase ProjectSV devuelve en cada llamada una nueva instancia de la clase ViewSV, que es la vista en sí. Cada instancia de ViewSV contiene una instancia de la clase TSC2Raster1 (Techniques Selection and Configuration) cuya función es permitir la utilización de las técnicas de visualización. La Figura 13 muestra la relación de esta clase con los paneles de configuración de las técnicas. Figura 13 Diagrama de las clases de configuración de las técnicas. 44

56 CAPÍTULO II 2013 La clase TSC2Raster1 permite al usuario seleccionar cuál de las técnicas se va a visualizar y de ellas cual se mostrará sobre el mapa. Luego se utiliza la metodología para la adición de extensiones a gvsig, ya que la clase MyInfoExtension hereda de Extension tiene como objetivo poner al gvsig en espera hasta que el usuario realice un clic sobre el mapa de fondo. Cuando se produce este evento se activa el método execute el cual crea un objeto de la clase MyInfoListener pasándole el punto sobre el cual se hizo clic. Luego utilizando la clase Load_HDF que a su vez utiliza la biblioteca ncsa.hdf.hdf5lib se leen los contenidos de los dataset que pertenecen al archivo hdf donde se encuentran los datos. Los métodos necesarios para realizar la lectura son: H5Fopen el cual dado el nombre del archivo con formato HDF lo abre para luego leer los dataset mediante el método H5Dread. A este método se le pasa el id del dataset y una matriz de enteros o doble dependiendo del tipo de datos que se quiere leer. Cuando se hayan realizado todas las operaciones necesarias se tiene que cerrar el fichero HDF con el método H5Fclose, al cual se le pasa el id del fichero que se obtuvo cuando se abrió el archivo. Luego de haber cargado todos los datos asociados a las variables en la celda seleccionada se procede a crear un objeto de la clase Generico1 con todos los datos necesarios para poder visualizar las técnicas escogidas. Esta clase es la encargada de agrupar las características globales de todas las técnicas como son el porciento de datos a visualizar, las variables que se quieren visualizar, etc. Dentro de la clase Generico1 se tiene un arreglo de ConfigPanelFlotante, donde cada elemento de la estructura es un panel de configuración de cada técnica con sus características específicas. Mediante el panel de configuración ScatterPlotMatrix1Ind se puede especificar el tamaño del gráfico, la dispersión de los datos, el tamaño de los puntos y la variable por la cual se le asignará los colores a los gráficos. Mediante el panel de configuración ChernoffFaceConfigPanel1Ind se puede especificar el tamaño de las caras y la asignación de las variables a cada facción de la cara para su visualización. 45

57 CAPÍTULO II 2013 Mediante el panel de configuración SOMConfigPanel1Ind se puede seleccionar la variable por la cual se le asignará los colores a los gráficos y los pesos que se le asignaran a cada variable. El diagrama de clases para la visualización en paneles independientes se muestra en la Figura 14. Figura 14 Diagrama de clases de las técnicas de visualización para la visualización coordinada. En la Figura 14 se puede observar la clase DataSourceManager1 que tiene los datos de las variables a visualizar. La clase DataSourceForGisCoordRaster1 hereda de VisualizationDataSourceCoord1 y son las encargadas de administrar el porciento de datos a mostrar, las variables que se quieren visualizar, etc. Las clases que heredan de MultiparametricVisualizationPanel1, que son las técnicas que se visualizan coordinadamente en paneles independientes. Se escogió como nomenclatura de las clases asignarles _pi al final, para enfatizar que se trata de paneles independientes. El siguiente diagrama muestra la relación entre los paneles de configuración y las clases de visualización de las técnicas. 46

58 CAPÍTULO II 2013 Figura 15 Relación de los paneles de configuración y los paneles de las técnicas. Los paneles de configuración de las técnicas son los encargados de gestionar los gráficos que son visualizados sobre el mapa y en paneles independientes. En el caso de SOMConfigPanel1Ind es el encargado de manipular dos gráficos SOMPanel_pi1 y HDClusterViewer_New, puesto que el segundo que es Coordenadas Paralelas está enlazado al primero y permite realizar un mejor análisis de los resultados Jerarquía de clases para la lectura de datos En los subepígrafes anteriores se expuso la estructura de clases para la visualización coordinada. El objetivo del presente subepígrafe es mostrar cómo se realiza la lectura de los datos para su posterior visualización. Los datos con que se cuenta están disponibles en formatos de dato HDF. En la Figura 16 se muestra con mayor claridad la estructura de estos ficheros. Para su utilización es necesario utilizar bibliotecas para el trabajo con estos ficheros, en nuestro caso fue HDF-JAVA. 47

59 CAPÍTULO II 2013 Figura 16 Estructura del fichero HDF. La Figura 14 del subepígrafe muestra la relación existente entre la clase VisualizationDataSourceCoord1 y la clase para la visualización de las técnicas en paneles independientes, MultiparametricVisualizationPane11, del paquete para la visualización coordinada. Como se ha explicado en epígrafes anteriores, la visualización coordinada implica visualizar todos los datos de manera tal que todos los gráficos generados por las técnicas muestren la variación de las variables para todos los conjuntos de datos, de ahí que sea necesaria una estructura donde se controlen todos los valores de las variables de manera global. Para ello se creó la clase DataSourceManager1 que contiene varios VisualizationDataSourceCoord1 y se encarga de controlar la homogeneidad de cuantos conjuntos de datos sean insertados. Ver la Figura

60 CAPÍTULO II 2013 Figura 17 Clases que intervienen en la lectura de los ficheros y el manejo de los datos para la visualización coordinada. La figura anterior muestra la clase MyInfoListener que usa la clase Load_HDF para la lectura de los ficheros de datos HDF. Luego pasa los datos a la clase DataSourceForGisCoordRaster1 que hereda de VisualizationDataSourceCoord1. La clase VisualizationDataSourceCoord1 define un conjunto de métodos abstractos que serán usados por MultiparametricVisualizationPanel1 para realizar la visualización de los datos, además contiene métodos abstractos como getglobalmin() y getglobalmax(), que deben devolver los valores extremos de las variables con respecto a todos los conjuntos de datos. Cada objeto de la clase DataSourceForGisCoordRaster1 se incluye en la clase DataSourceManager1 para luego poder visualizar las técnicas con todos los juegos de datos. 2.4 Implementación de la extensión En este epígrafe se exponen los temas referentes a la implementación de la extensión teniendo en cuenta las tecnologías utilizadas para la implementación y algunas consideraciones sobre las técnicas implementadas Selección de las tecnologías necesarias para la implementación Durante el desarrollo o extensión de un sistema deben tomarse decisiones de implementación como la plataforma objetivo y el lenguaje de desarrollo. En cada proyecto hay que puntualizar en determinadas áreas específicas de la aplicación. En el caso particular de este proyecto debe fijarse la API (Application Programming Interface) gráfica a utilizar. 49

61 CAPÍTULO II 2013 Elección del lenguaje de desarrollo El objetivo de este proyecto es adicionar nuevas técnicas de visualización para datos multiparamétricos al módulo existente de visualización científica del gvsig. Esta herramienta está construida con el lenguaje Java. El proceso de integración de las técnicas de visualización con el sistema actual inevitablemente tendrá que interactuar y utilizar el código fuente de gvsig. Esto hace al lenguaje Java la mejor elección para mantener la mayor compatibilidad posible con el sistema actual. A las razones descritas anteriormente se puede agregar que este proyecto necesita de un lenguaje potente en la implementación de interfaz gráfica, lo que se puede conseguir con la plataforma Java. Por otra parte la implementación del módulo de visualización científica en este lenguaje permite la fácil reutilización y adaptación de varias de sus componentes, facilitando su integración con otros sistemas, producto de la flexibilidad y potencialidades de Java. Elección de la API gráfica Las técnicas que se decidieron implementar no requieren de gran complejidad en la API gráfica. En particular no necesitan de una API 3D. Por esto se decidió utilizar la tecnología Java 2D que brinda un excelente desempeño y potencialidad para la programación gráfica en dos dimensiones. Esta decisión facilita a los usuarios la utilización del sistema ya que no necesitan paquetes adicionales a los de la plataforma Java. La API Java 2D está constituida por un conjunto de clases que pueden ser usadas para crear gráficos de elevada calidad. Esto incluye técnicas como: transformaciones geométricas, disminución de curvas o líneas causadas por una baja resolución del gráfico, dibujado de mapas de píxeles, procesamiento de imágenes, diseño bidireccional de texto, además de excelentes vías para el uso del color, solo por mencionar algunos. Se utiliza esta API para crear las representaciones visuales de las técnicas de visualización. Elección del Entorno de Desarrollo Integrado Existe un conjunto de Entornos de Desarrollo Integrado (IDE, de sus siglas en inglés) que permiten el desarrollo de proyectos en Java. El IDE Eclipse versión 3.4 fue el seleccionado como 50

62 CAPÍTULO II 2013 ambiente de programación de esta extensión, debido a que resulta cómodo y fácil de usar para depurar programas. Además la estructura de proyectos de gvsig está diseñada para ser compilado con mayor facilidad utilizando este IDE. Elección de la versión de gvsig a utilizar como sistema base El progresivo desarrollo de gvsig por parte de una comunidad de desarrolladores hace posible que con cierta regularidad se actualice su versión. Actualmente la versión estable de gvsig es la 1.12 sin embargo el módulo fue compilado con la versión 1.10 y funciona para las versiones 1.10, 1.11 y Consideraciones sobre las técnicas implementadas Las técnicas seleccionadas presentan una estructura general, la cual contiene parámetros que pueden variar de una implementación a otra. A continuación se establecen las consideraciones realizadas en cada método para la implementación realizada. Matrices de Dispersión La técnica Matrices de Dispersión fue implementada para ser visualizada en paneles independientes. El panel de configuración se puede ver a través de la clase ScatterPlotMatrix1Ind del paquete para la visualización coordinada y el gráfico lo genera la clase ScatterPlotMatrixPanel_pi. Este gráfico muestra como resultado una matriz cuadrada donde cada elemento (i,j) es un Diagrama de Dispersión. Además muestra los nombres de las variables por cada fila y columnas para una mejor comprensión de la visualización. Caras de Chernoff La técnica Caras de Chernoff fue implementada para ser visualizada en paneles independientes. El panel de configuración se puede ver a través de la clase ChernoffFaceConfigPanel1Ind del paquete para la visualización coordinada y el gráfico lo genera la clase ChernoffFacePanel_pi1. Este gráfico muestra como resultado un conjunto de caras (una por cada fila de datos). Estos rostros están divididos en 16 características: radio de la cabeza, radio del ojo, alineación a la derecha e izquierda del ojo, alineación vertical del ojo, radio de la pupila, la posición vertical de 51

63 CAPÍTULO II 2013 las cejas, 4 parámetros para trazar la curvatura de las cejas, el ápice derecho e izquierdo de la nariz, el ancho y alto de la nariz y la posición vertical de la boca. A cada elemento anteriormente mencionado se le asigna el valor de una variable para que este se dibuje dependiendo del dato que esta posea. Mapas Auto-organizados La técnica Mapas Auto-organizados fue implementada para ser visualizada en paneles independientes. El panel de configuración se puede ver a través de la clase ScatterPlotMatrix1Ind del paquete para la visualización coordinada y el gráfico lo genera la clase SOMPanel_pi1. Este gráfico representa el mapa como una rejilla regular de neuronas, el tamaño y topología del mapa se puede observar en el gráfico donde cada elemento representa una neurona. Cuando se genera la matriz U (matriz unificada de distancias) se calcula, a su vez, una matriz de distancias entre los vectores de referencia de neuronas adyacentes en el mapa bidimensional. Después se selecciona algún tipo de representación gráfica, por ejemplo una escala de grises. Los colores en la figura se seleccionan de modo que cuanto más oscuro es el color entre dos neuronas, mayor es la distancia entre ellas. Cada neurona de entrada i está conectada con cada una de las neuronas de salida j mediante un peso w ij. De esta forma, las neuronas de salida tienen asociado un vector de pesos W j llamado vector de referencia (o codebook), debido a que constituye el vector prototipo (o promedio) de la categoría representada por la neurona de salida j. Las topologías más frecuentes son la rectangular y la hexagonal. Las neuronas adyacentes pertenecen a una vecindad N j de la neurona j. La topología y el número de neuronas permanecen fijos desde el principio. Durante la fase de entrenamiento, el SOM forma una red elástica que se pliega dentro de la nube de datos originales. El algoritmo controla la red de modo que tiende a aproximar la densidad de los datos. Los vectores de referencia del codebook se acercan a las áreas donde la densidad de datos es alta. 52

64 CAPÍTULO II Guía para la adición de nuevas técnicas al paquete de visualización coordinada del módulo de visualización de gvsig. El objetivo del presente epígrafe es mostrar una guía para la adición de nuevas técnicas al módulo de visualización para datos multiparamétricos de gvsig. La adición de una nueva técnica al paquete de visualización coordinada consta de tres pasos. El primero es la creación de las subclases de MultiparameticVisualizationPanel1 y MultiparameticVisualizationGraphic1, que deben localizarse en el paquete org.gvsig.scientificvisualization.coordinatedvisualization.multiparametric, que son las encargadas de implementar las técnicas de visualización, para visualizar de manera coordinada en paneles independientes y sobre el mapa, respectivamente. El segundo paso es crear una subclase de ConfigpanelFlotante, que debe localizarse en el paquete org.gvsig.scientificvisualization.coordinatedvisualization.multiparametric.config_panels, para el manejo de los parámetros de las técnicas que sean visualizadas sobre el mapa y en paneles independientes. Luego hay que agregar la clase que implementa a ConfigpanelFlotante como otra opción para seleccionar en la clase Generico1 que a su vez hereda de ConfigPanel1Gener. El último paso es la adición de una opción de selección de la técnica a la clase TSC2Raster1. Las clases MultiparameticVisualizationPanel1, que hereda de java.swing.jpanel, y MultiparameticVisualizationGraphic1, que hereda de la clase FGraphic del paquete com.iver.cit.gvsig.fmap.rendering, tienen las operaciones necesarias para acceder a la fuente de datos. Deben permitir realizar la representación visual deseada, manejar las interacciones del usuario y ofrecer un conjunto de operaciones que permita cambiar los parámetros de la visualización como selección de atributos, conjunto de trabajo, entre otros. La clase ConfigPanel1Gener y ConfigpanelFlotante heredan de java.swing.jpanel. Cada subclase de ConfigpanelFlotante está asociada con varias subclases de MuliparametricVisualizationPanel1 y MuliparametricVisualizationGraphic1, en dependencia de la selección realizada por el usuario; las responsabilidades de ConfigPanel1Gener y cualquier subclase de ConfigpanelFlotante deben ser: ofrecer operaciones que permitan establecer los 53

65 CAPÍTULO II 2013 parámetros iniciales de la técnica de visualización y transformar la fuente de datos de los archivos a la fuente de datos del paquete de visualización. La clase TSC2Raster1 está integrada a la clase ViewSV, que representa una vista de visualización. Permite la selección y visualización de las técnicas implementadas. Para añadirle la nueva técnica se le agrega una nueva caja de chequeo cuya selección cargue el panel de configuración y muéstrele técnica según el modo de visualización seleccionado. En caso de poder visualizarse sobre el mapa se agrega un botón de selección para poder seleccionar si se visualizará en paneles independientes o sobre el mapa. 2.6 Conclusiones parciales La integración de técnicas de VisCi para datos multiparamétricos en el SIG gvsig permite al usuario visualizar uno o varios conjuntos de datos, de forma coordinada, obteniendo una percepción espacial del origen de los datos visualizados. Se seleccionaron un conjunto de técnicas de visualización de datos multiparamétricos que fueron incorporadas a gvsig. Las técnicas incluidas en el módulo de visualización ofrecen un amplio número de beneficios. Se incluyeron algunas de las técnicas tradicionales, con ciertas mejoras, lo que permite mostrar conjuntos de datos con disímiles características. Se presentó el análisis de los actores y casos de uso del sistema. Se mostró la arquitectura general del sistema y el formato de dato que se utilizará. Se diseñaron e implementaron las nuevas funcionalidades para el módulo de visualización y se mostraron los cambios que fue necesario realizar en la estructura de clases para poder brindar las nuevas funcionalidades. Además el proceso de diseño del nuevo módulo admite la realización de futuras extensiones y modificaciones, quedando propuesta una guía para la adición de nuevas técnicas. 54

66 CAPÍTULO III 2013 CAPÍTULO 3. Uso y validación del sistema. En el presente capítulo se realiza una presentación al usuario de las facilidades y funcionalidades del módulo de visualización. Se efectúa un análisis detallado de las opciones y modo de uso de cada una de las formas de visualización implementadas, que constituye una guía para explotar los beneficios de la extensión realizada. También se presenta como caso de estudio el análisis visual de los datos climáticos mundiales recolectados por la unidad de investigación climática de la Universidad del Este de Anglia, en el Reino Unido con la herramienta desarrollada. 3.1 Uso del sistema. La extensión realizada a gvsig no trajo como consecuencias nuevos requerimientos del sistema para su ejecución. Para utilizar la extensión basta copiar el módulo compilado para el directorio de extensiones de gvsig. Se recomienda utilizar la versión 1.12 de gvsig, ya sea la versión portable o instalable. El análisis visual de datos multiparamétricos utilizando las técnicas de visualización con que cuenta la extensión implementada, requiere un conocimiento previo de cómo aplicarlas de forma adecuada para lograr una correcta comprensión de los resultados que se obtengan. La extensión realizada a gvsig permite la exploración y análisis visual de datos multiparamétricos mediante las técnicas: Coordenadas Paralelas, Gráfico de Andrews, técnicas basadas en iconos, Segmentos de Círculo, Patrones Recursivos, Caras de Chernoff, Matriz de Dispersión y Mapas Auto-organizados. Permite visualizar coordinadamente varios conjuntos de datos donde los atributos de la visualización representan el comportamiento global de las variables para la totalidad de los datos. Para la correcta utilización de la herramienta de visualización integrada a gvsig se requiere el desarrollo de un manual de usuario. 3.2 General El usuario del sistema tiene la posibilidad de realizar el análisis visual de varios conjuntos de datos de forma coordinada, teniendo una percepción del origen de los datos que están siendo 55

67 CAPÍTULO III 2013 visualizados referenciando las técnicas a un mapa. Para realizar esta operación es necesario tener un proyecto de visualización de este tipo que contiene: uno mapa en formato raster y el archivo de datos asociados a las localizaciones del mapa en formato hdf. Este tipo de proyectos se almacenan en archivos con extensión svp que contiene el nombre del mapa de fondo y el archivo de los datos se tiene que encontrar en la misma dirección. Cuando se dispone de un proyecto previamente creado el primer paso para realizar la visualización lo constituye crear una vista de visualización. Figura 18 Creación de una vista de visualización coordinada. La Figura 18 muestra los pasos para la creación de una vista de visualización coordinada, los cuales son: seleccionar el tipo de documento de visualización, identificado en la figura con el número uno, crear un nuevo documento de visualización oprimiendo el botón Nuevo (número 56

68 CAPÍTULO III 2013 dos), seleccionar el documento creado (número tres) y abrirlo oprimiendo el botón Abrir con numeración cuatro. Realizados estos pasos se muestra una vista como la resaltada con el número cinco. Al estar activa una vista de visualización se habilita una opción de menú Visualización/Cargar proyecto SVP raster y un botón en la barra de herramientas, como lo muestra la Figura 19 Figura 19 Opciones para la adición de un proyecto de visualización coordinada a una vista de visualización. Cuando se selecciona una de las opciones anteriores, se muestra un diálogo para la selección del fichero svp, que constituye el proyecto de visualización coordinada con el que se desea trabajar. Una vez seleccionado el archivo, se carga el proyecto en la vista de visualización activa y automáticamente se carga el mapa que esté en el archivo de configuración. 57

69 CAPÍTULO III 2013 Figura 20 Vista de visualización. La Figura 20 muestra los diferentes componentes que conforman una vista de visualización. Marcado con el número uno se muestra la opción de selección de la técnica de visualización a utilizar, esta opción consta de tres tipos de componentes: una caja de chequeo por cada técnica implementada, un botón de selección por cada técnica que se pueda visualizar en el mapa o no y por último el botón Visualizar para realizar la visualización de las técnicas seleccionadas. Al visualizarse alguna técnica se muestra en el área dos el panel de configuración general de las técnicas con que se está realizando la visualización de los datos. La región cuatro constituye el área de visualización de los mapas y de las técnicas que pueden ser visualizadas sobre los mapas. El componente tres muestra el mapa de fondo con el que cuenta el proyecto, además permite algunas configuraciones como son cambiar el color de fondo y la simbología de los mapas. 58

70 CAPÍTULO III 2013 Panel de configuración general de las técnicas Un elemento común en todas las técnicas, independientemente que la visualización sea en paneles independientes o sobre el mapa, es la opción de obtener muestras del conjunto de datos. Ver la Figura 21. Figura 21 Obtención de muestras del conjunto de datos. Mediante este panel se pueden realizar las siguientes operaciones: 1. Botón Seleccionar atributos: Selección de los atributos de interés para la visualización. 2. Botón Submuestra %: Obtención de una muestra para cada conjunto de datos dado el porciento insertado en el campo de texto. 3. Botón Rango de atributos: Obtención de una muestra para cada conjunto de datos dado el rango de un atributo; el atributo se selecciona en la caja de selección y el rango de valores se inserta en los campos etiquetados desde y hasta Matrices de Dispersión La técnica Matrices de Dispersión, accesible desde la opción de selección de las técnicas, no es visualizada sobre el mapa. La visualización de cada conjunto de datos se realiza en paneles independientes y se agrega el nombre de la técnica y número de la localización que le corresponde en el mapa. Esta técnica permite ordenar las observaciones según los valores de un atributo seleccionado, cambiar el tamaño de los puntos visualizados, cambiar el tamaño de las 59

71 CAPÍTULO III 2013 celdas de la matriz, modificar la dispersión de los datos en el gráfico y mostrar la leyenda de todas las variables. La siguiente figura muestra un ejemplo de lo anteriormente expuesto. Figura 22 Visualización con Matriz de Dispersión. La técnica Matrices de Dispersión en este tipo de visualización posee además opciones de configuración como muestra la Figura

72 CAPÍTULO III 2013 Figura 23 Panel Configuración Matriz de Dispersión. A continuación se enumeran las opciones disponibles en el panel de configuración de la técnica: 1. Ordenar por: Esta opción permite que las observaciones de los conjuntos de datos sean ordenadas por los valores de un atributo que sea seleccionado. 2. Tamaño del punto: Con esta opción se puede aumentar o disminuir el tamaño de los puntos al pintarlos sobre el gráfico. 3. Tamaño de celda: A través de esta opción se pueden modificar las dimensiones de cada Diagrama de Dispersión. 4. Dispersión: Esta opción permite dispersar los datos en el gráfico para poder realizar un análisis más detallado de cada punto. 5. Mostrar leyenda: Muestra un diálogo para la leyenda. La leyenda muestra la escala en colores de los valores de los atributos. Ver la Figura

73 CAPÍTULO III 2013 Figura 24 Leyenda de los valores de los atributos Caras de Chernoff La técnica Caras de Chernoff, accesible desde la opción de selección de las técnicas, no es visualizada sobre el mapa. La visualización de cada conjunto de datos se realiza en paneles independientes y se agrega el nombre de la técnica y número de la localización que le 62

74 CAPÍTULO III 2013 corresponde en el mapa. Esta técnica muestra la asignación de las variables a cada rasgo de los rostros, permite modificar esa asignación y además permite cambiar el tamaño de las caras. La siguiente figura muestra un ejemplo de lo anteriormente expuesto. Figura 25 Visualización con Caras de Chernoff La técnica Caras de Chernoff en este tipo de visualización posee además opciones de configuración como muestra la Figura

75 CAPÍTULO III 2013 Figura 26 Panel Configuración Caras de Chernoff A continuación se enumeran las opciones disponibles en el panel de configuración de la técnica: 1. Asignación actual: Permite observar las variables que están asignadas a cada parte de los rostros. Esta opción permite al usuario interpretar el comportamiento de cada rostro. 2. Tamaño del gráfico: Permite controlar el tamaño de las caras con el objetivo de detallar, si se desea, algún rasgo específico. 3. Nueva asignación: Con esta opción se puede cambiar la asignación actual de cada característica del rostro. Permitiéndole al usuario personalizar la visualización. Cuando se acciona el botón tres se muestra un diálogo para la reasignación de las variables a cada facción de la cara como muestra la Figura 27 Error! No se encuentra el origen de la referencia.. 64

76 CAPÍTULO III 2013 Figura 27 Panel para la reasignación de variables a facciones de las caras. El componente uno es una lista que contiene todas las facciones de los rostros. Cuando se selecciona un elemento de la lista uno se activan en la región tres las cajas de selección dependiendo de la cantidad de variables necesarias para caracterizar al rasgo seleccionado. Cada elemento de la región tres contiene todas las variables que están visualizándose en ese momento. Luego que el usuario haya seleccionado las variables que va a definir el comportamiento del rasgo seleccionado presiona el botón dos para completar la asignación. Al terminar de realizar todos los cambios deseados presiona el botón cuatro, el cual cierra el diálogo y actualiza la visualización de la técnica Mapas Auto-organizados La técnica Mapas Auto-organizados, accesible desde la opción de selección de las técnicas, no es visualizada sobre el mapa. La visualización de cada conjunto de datos se realiza en paneles independientes y se agrega el nombre de la técnica y número de la localización que le corresponde en el mapa. Esta técnica tiene la particularidad que muestra por cada juago de dato visualizado dos gráficos enlazados entre sí, uno es Mapas Auto-organizados y el otro es Coordenadas Paralelas. Esta opción se brinda con el objetivo de mejorar la comprensión de los 65

77 CAPÍTULO III 2013 resultados, pues cuando se selecciona uno o más cluster en Mapas Auto-organizados, se muestran los datos que pertenecen a estos en Coordenadas Paralelas. Además permite seleccionar la variable que se utilizará para dar color a cada cluster, muestra una leyenda de la gama de colores de la variable por la cual se está coloreando y permite cambiar el peso asociado a cada variable para luego entrenar nuevamente la red neuronal. La siguiente figura muestra un ejemplo de lo anteriormente expuesto. Figura 28 Visualización con Mapas Auto-organizados La técnica anterior en este tipo de visualización posee además opciones de configuración como muestra la Figura

78 CAPÍTULO III 2013 Figura 29 Panel de configuración de Mapas Auto-organizados. A continuación se enumeran las opciones disponibles en el panel de configuración de la técnica: 1. Color: Permite seleccionar la variable por la cual se dará color a cada cluster. El color se obtiene realizando una normalización del valor de la variable seleccionada y luego según el valor obtenido se le asigna un color. 2. Muestra la gama de colores y los extremos de la variable seleccionada en uno. 3. Establecer pesos: permite establecer nuevos pesos a cada variable para luego entrenar nuevamente la red neuronal. Al presionar el botón tres se muestra un diálogo para establecer nuevos pesos a las variables que se desee. La Figura 30 muestra el panel. 67

79 CAPÍTULO III 2013 Figura 30 Panel para establecer nuevos pesos. La lista uno contiene todas las variables que se están visualizando actualmente. Al seleccionar un elemento de la lista uno, poner el nuevo valor de su peso en la caja de texto dos y presionar el botón tres, se le asigna el valor deseado. Este proceso se realiza para cada variable que se le quiera alterar el peso y cuando termine se presiona el botón cuatro para cerrar el diálogo, entrenar nuevamente la red neuronal con los nuevos pesos y mostrar los resultados en la visualización. 3.3 Caso de estudio: Análisis visual de datos climáticos mundiales. El presente epígrafe tiene como objetivo presentar un caso de estudio donde se realiza el análisis visual de datos climáticos mundiales. Para ello se ha dividido en tres subepígrafes. En el primero se describen los datos climáticos utilizados para el caso de estudio, en el segundo y el tercero se muestran algunos resultados obtenidos al aplicar las técnicas de visualización a los datos climáticos Datos climáticos mundiales En esta investigación se trabajó con el conjunto de datos CRU(Climatic Research Unit) TS (time series) 2.1 (Mitchell et al., 2005). Este conjunto de datos comprende 1224 registros mensuales en forma de malla, de 9 variables climáticas en el período 1901 al 2002 y cubre la superficie terrestre mundial con una resolución de 0.5 grados. Las 9 variables climáticas son: el promedio 68

1.2 Qué es un Sistemas de Información Geográfica?

1.2 Qué es un Sistemas de Información Geográfica? 1.1 Introducción En los últimos años, se ha desarrollado software especializado que permite el manejo de cartografía por computadora, favoreciendo a diferentes áreas, en el proceso de toma de decisiones.

Más detalles

Caso práctico de Cuadro de Mando con Tablas Dinámicas

Caso práctico de Cuadro de Mando con Tablas Dinámicas 1 Caso práctico de Cuadro de Mando con Tablas Dinámicas Luis Muñiz Socio Director de SisConGes & Estrategia Introducción Hay una frase célebre que nos permite decir que: Lo que no se mide no se puede controlar

Más detalles

Introducción. Ciclo de vida de los Sistemas de Información. Diseño Conceptual

Introducción. Ciclo de vida de los Sistemas de Información. Diseño Conceptual Introducción Algunas de las personas que trabajan con SGBD relacionales parecen preguntarse porqué deberían preocuparse del diseño de las bases de datos que utilizan. Después de todo, la mayoría de los

Más detalles

Actividades para mejoras. Actividades donde se evalúa constantemente todo el proceso del proyecto para evitar errores y eficientar los procesos.

Actividades para mejoras. Actividades donde se evalúa constantemente todo el proceso del proyecto para evitar errores y eficientar los procesos. Apéndice C. Glosario A Actividades de coordinación entre grupos. Son dinámicas y canales de comunicación cuyo objetivo es facilitar el trabajo entre los distintos equipos del proyecto. Actividades integradas

Más detalles

Sistemas de Información Geográficos (SIG o GIS)

Sistemas de Información Geográficos (SIG o GIS) Sistemas de Información Geográficos (SIG o GIS) 1) Qué es un SIG GIS? 2) Para qué sirven? 3) Tipos de datos 4) Cómo trabaja? 5) Modelos de datos, Diseño Conceptual 6) GeoDataase (GD) 7) Cómo evaluamos

Más detalles

1.2 Concepto de un Sistema de Información Geográfica (SIG)

1.2 Concepto de un Sistema de Información Geográfica (SIG) Capítulo 1. Sistema de Información Geográfica (SIG) 1.1 Introducción Un Sistema de Información Geográfica (SIG) ha tomado relevancia en distintas disciplinas que convergen en el área geográfica. Mediante

Más detalles

CAPÍTULO III 3. MÉTODOS DE INVESTIGACIÓN. El ámbito de los negocios en la actualidad es un área donde que cada vez más

CAPÍTULO III 3. MÉTODOS DE INVESTIGACIÓN. El ámbito de los negocios en la actualidad es un área donde que cada vez más CAPÍTULO III 3. MÉTODOS DE INVESTIGACIÓN El ámbito de los negocios en la actualidad es un área donde que cada vez más se requieren estudios y análisis con criterios de carácter científico a fin de poder

Más detalles

MODULO 1. DESCARGA E INTERFAZ QGIS

MODULO 1. DESCARGA E INTERFAZ QGIS MODULO 1. DESCARGA E INTERFAZ QGIS Bienvenidos a la publicación de tutoriales sobre QGIS. Se trata de un software libre con el que podemos buscar, almacenar, analizar, editar y divulgar información geoespacial.

Más detalles

Correspondencias entre taxonomías XBRL y ontologías en OWL Unai Aguilera, Joseba Abaitua Universidad de Deusto, EmergiaTech

Correspondencias entre taxonomías XBRL y ontologías en OWL Unai Aguilera, Joseba Abaitua Universidad de Deusto, EmergiaTech Correspondencias entre taxonomías XBRL y ontologías en OWL Unai Aguilera, Joseba Abaitua Universidad de Deusto, EmergiaTech Resumen Todo documento XBRL contiene cierta información semántica que se representa

Más detalles

Su éxito se mide por la pertinencia y la oportunidad de la solución, su eficacia y eficiencia.

Su éxito se mide por la pertinencia y la oportunidad de la solución, su eficacia y eficiencia. APUNTES PARA EL CURSO PROCESOS COGNITIVOS: RESOLUCIÓN DE PROBLEMAS Y TOMA DE DECISIONES Elaborado por Vicente Sisto Campos. Se trata de la confluencia de la capacidad analítica del equipo de identificar

Más detalles

Diseño y desarrollo de una aplicación informática para la gestión de laboratorios

Diseño y desarrollo de una aplicación informática para la gestión de laboratorios Diseño y desarrollo de una aplicación informática para la gestión de laboratorios M. Francisco, P. Vega, F. J. Blanco Departamento de Informática y Automática. Facultad de Ciencias. Universidad de Salamanca

Más detalles

Gestión de Proyectos en Bibliotecas Universitarias bajo el Enfoque de Marco Lógico. Alejandra M. Nardi anardi@eco.unc.edu.ar

Gestión de Proyectos en Bibliotecas Universitarias bajo el Enfoque de Marco Lógico. Alejandra M. Nardi anardi@eco.unc.edu.ar Gestión de Proyectos en Bibliotecas Universitarias bajo el Enfoque de Marco Lógico Alejandra M. Nardi anardi@eco.unc.edu.ar Qué es el Marco Lógico? Es una herramienta para facilitar el proceso de conceptualización,

Más detalles

Centro de Capacitación en Informática

Centro de Capacitación en Informática Fórmulas y Funciones Las fórmulas constituyen el núcleo de cualquier hoja de cálculo, y por tanto de Excel. Mediante fórmulas, se llevan a cabo todos los cálculos que se necesitan en una hoja de cálculo.

Más detalles

TEMA 3: EN QUÉ CONSISTE?

TEMA 3: EN QUÉ CONSISTE? Módulo 7 Sesión 3 5/16 TEMA 3: EN QUÉ CONSISTE? La metodología seguida para aplicar correctamente la técnica de RGT se basa en cuatro fases (Figura 1). En la primera de ellas, se seleccionan los elementos

Más detalles

CAPÍTULO I. Sistemas de Control Distribuido (SCD).

CAPÍTULO I. Sistemas de Control Distribuido (SCD). 1.1 Sistemas de Control. Un sistema es un ente cuya función es la de recibir acciones externas llamadas variables de entrada que a su vez provocan una o varias reacciones como respuesta llamadas variables

Más detalles

METODOLOGÍA E IMPLEMENTACIÓN DEL SIGGA (SISTEMA DE INFORMACION GEOGRAFICA: GOBERNANZA DEL AGUA)

METODOLOGÍA E IMPLEMENTACIÓN DEL SIGGA (SISTEMA DE INFORMACION GEOGRAFICA: GOBERNANZA DEL AGUA) METODOLOGÍA E IMPLEMENTACIÓN DEL SIGGA (SISTEMA DE INFORMACION GEOGRAFICA: GOBERNANZA DEL AGUA) I.1 Definición de SIG Es un sistema compuesto por hardware, software y procedimientos para capturar, manejar,

Más detalles

4 Teoría de diseño de Experimentos

4 Teoría de diseño de Experimentos 4 Teoría de diseño de Experimentos 4.1 Introducción En los capítulos anteriores se habló de PLC y de ruido, debido a la inquietud por saber si en una instalación eléctrica casera que cuente con el servicio

Más detalles

Colección de Tesis Digitales Universidad de las Américas Puebla. Morales Salcedo, Raúl

Colección de Tesis Digitales Universidad de las Américas Puebla. Morales Salcedo, Raúl 1 Colección de Tesis Digitales Universidad de las Américas Puebla Morales Salcedo, Raúl En este último capitulo se hace un recuento de los logros alcanzados durante la elaboración de este proyecto de tesis,

Más detalles

Uso de las tecnologias de la informacion en las PyMES de los municipios de Comalcalco y Cunduacán

Uso de las tecnologias de la informacion en las PyMES de los municipios de Comalcalco y Cunduacán Uso de las tecnologias de la informacion en las PyMES de los municipios de Comalcalco y Cunduacán M.A. María del Carmen Vásquez García M.C. Marbella Araceli Gómez Lemus Pasante Edwin Fabián Hernández Pérez

Más detalles

Itinerario Formativo en Innovación Docente

Itinerario Formativo en Innovación Docente Módulo I: Los Mapas Conceptuales Los Mapas Conceptuales Itinerario Formativo en Innovación Docente Los mapas conceptuales son una herramienta muy poderosa para organizar, analizar y sintetizar información

Más detalles

Análisis y cuantificación del Riesgo

Análisis y cuantificación del Riesgo Análisis y cuantificación del Riesgo 1 Qué es el análisis del Riesgo? 2. Métodos M de Análisis de riesgos 3. Método M de Montecarlo 4. Modelo de Análisis de Riesgos 5. Qué pasos de deben seguir para el

Más detalles

GUÍA TÉCNICA PARA LA DEFINICIÓN DE COMPROMISOS DE CALIDAD Y SUS INDICADORES

GUÍA TÉCNICA PARA LA DEFINICIÓN DE COMPROMISOS DE CALIDAD Y SUS INDICADORES GUÍA TÉCNICA PARA LA DEFINICIÓN DE COMPROMISOS DE CALIDAD Y SUS INDICADORES Tema: Cartas de Servicios Primera versión: 2008 Datos de contacto: Evaluación y Calidad. Gobierno de Navarra. evaluacionycalidad@navarra.es

Más detalles

Construcción de Escenarios

Construcción de Escenarios Construcción de Escenarios Consiste en observar los diferentes resultados de un modelo, cuando se introducen diferentes valores en las variables de entrada. Por ejemplo: Ventas, crecimiento de ventas,

Más detalles

NORMA TÉCNICA DE AUDITORÍA SOBRE CONSIDERACIONES RELATIVAS A LA AUDITORÍA DE ENTIDADES QUE EXTERIORIZAN PROCESOS DE ADMINISTRACIÓN

NORMA TÉCNICA DE AUDITORÍA SOBRE CONSIDERACIONES RELATIVAS A LA AUDITORÍA DE ENTIDADES QUE EXTERIORIZAN PROCESOS DE ADMINISTRACIÓN Resolución de 26 de marzo de 2004, del Instituto de Contabilidad y Auditoría de Cuentas, por la que se publica la Norma Técnica de Auditoría sobre consideraciones relativas a la auditoría de entidades

Más detalles

LINEAMIENTOS PARA LA ELABORACIÓN DEL PROGRAMA ANUAL DE TRABAJO

LINEAMIENTOS PARA LA ELABORACIÓN DEL PROGRAMA ANUAL DE TRABAJO LINEAMIENTOS PARA LA ELABORACIÓN DEL PROGRAMA ANUAL DE TRABAJO Junio 2012 INDICE 1. INTRODUCCIÓN 2. ANTECEDENTES 3. SITUACIÓN ACTUAL A) Daños a la Salud Principales características sociodemográficas Principales

Más detalles

:: Definiendo los SIG :: :: IMPLAN :: Coordinación de Geoestadística e Informática ISC Carlos A. Martínez Mar

:: Definiendo los SIG :: :: IMPLAN :: Coordinación de Geoestadística e Informática ISC Carlos A. Martínez Mar :: Definiendo los SIG :: :: IMPLAN :: Coordinación de Geoestadística e Informática ISC Carlos A. Martínez Mar CONTENIDO Qué es la información geográfica? Qué es un SIG? Cuáles son sus componentes? Cuáles

Más detalles

_ Antología de Física I. Unidad II Vectores. Elaboró: Ing. Víctor H. Alcalá-Octaviano

_ Antología de Física I. Unidad II Vectores. Elaboró: Ing. Víctor H. Alcalá-Octaviano 24 Unidad II Vectores 2.1 Magnitudes escalares y vectoriales Unidad II. VECTORES Para muchas magnitudes físicas basta con indicar su valor para que estén perfectamente definidas y estas son las denominadas

Más detalles

CAPÍTULO 2 ANTECEDENTES

CAPÍTULO 2 ANTECEDENTES CAPÍTULO 2 ANTECEDENTES 2.1 Educación y las Nuevas Tecnologías. La introducción en la sociedad de las llamadas "Nuevas Tecnologías" (como las redes de computadoras, los sistemas de Chat, los sistemas de

Más detalles

Aplicación de los SIG. a la Gestión del Medio Natural. Datos y temario del taller

Aplicación de los SIG. a la Gestión del Medio Natural. Datos y temario del taller Aplicación de los SIG a la Gestión del Medio Natural. Datos y temario del taller ÍNDICE APLICACIÓN DE LOS SIG A LA GESTIÓN... 1 PRESENTACIÓN...1 OBJETIVOS...1 REQUISITOS...2 DIRIGIDO A...2 DURACIÓN ESTIMADA...2

Más detalles

Módulo 9: Aplicaciones Administrativas y Financieras de la Hoja de Cálculo. Guía del formador por cada módulo formativo

Módulo 9: Aplicaciones Administrativas y Financieras de la Hoja de Cálculo. Guía del formador por cada módulo formativo Módulo 9: Aplicaciones Administrativas y Financieras de la Hoja de Cálculo Guía del formador por cada módulo formativo Módulo 9 1. DENOMINACIÓN DEL MÓDULO MÓDULO 9: APLICACIONES ADMINISTRATIVAS Y INANCIERAS

Más detalles

Unidad VI: Supervisión y Revisión del proyecto

Unidad VI: Supervisión y Revisión del proyecto Unidad VI: Supervisión y Revisión del proyecto 61. Administración de recursos La administración de recursos es el intento por determinar cuánto, dinero, esfuerzo, recursos y tiempo que tomará construir

Más detalles

SUPLEMENTO EUROPASS AL TÍTULO

SUPLEMENTO EUROPASS AL TÍTULO SUPLEMENTO EUROPASS AL TÍTULO DENOMINACIÓN DEL TÍTULO Técnico de Artes Plásticas y Diseño en Asistencia al Producto Gráfico Interactivo --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

Más detalles

EL MODELO DE DATOS RASTER

EL MODELO DE DATOS RASTER EL MODELO DE DATOS RASTER El modelo de datos raster, como señala Bosque (1992), es el modelo de datos complementario al modelo vectorial presentado anteriormente. Tiene como principal característica el

Más detalles

CURSO SIG Jueves 19 y Viernes 20 de Noviembre 2009 Dictado por la Ing. María del Huerto Mancilla, Ing. Marcelo Ledesma y Téc.

CURSO SIG Jueves 19 y Viernes 20 de Noviembre 2009 Dictado por la Ing. María del Huerto Mancilla, Ing. Marcelo Ledesma y Téc. Trabajando con Quantum Gis También conocido como QGIS, es un programa de Sistemas de Información Geográfica (SIG) de tipo escritorio (Desktop), muy intuitivo y fácil de utilizar. Su licencia es GNU, y

Más detalles

El Sistema de Actualización Dinámica del Mapa Acústico de Madrid

El Sistema de Actualización Dinámica del Mapa Acústico de Madrid paper ID: A085 /p.1 El Sistema de Actualización Dinámica del Mapa Acústico de Madrid P. Perera a & J.S. Santiago b a Bauman Consultoría Técnica, c/ Santa Isabel 19, Pozuelo de Alarcón, 28224 Madrid, placidop@telefonica.net

Más detalles

FICHA DE REGISTRO DE TRABAJOS INSTITUCIÓN PÚBLICA

FICHA DE REGISTRO DE TRABAJOS INSTITUCIÓN PÚBLICA FICHA DE REGISTRO DE TRABAJOS Nombre del trabajo : SISTEMA INTEGRAL DE ADMINISTRACIÓN (SIA) Elija el tipo de participante: Institución pública Categoría en la que se inscribe el trabajo: Elija la temática

Más detalles

4. METODOLOGÍA. 4.1 Materiales. 4.1.1 Equipo

4. METODOLOGÍA. 4.1 Materiales. 4.1.1 Equipo 4. METODOLOGÍA 4.1 Materiales 4.1.1 Equipo Equipo de cómputo. Para el empleo del la metodología HAZOP se requiere de un equipo de cómputo con interfase Windows 98 o más reciente con procesador Pentium

Más detalles

DIGITALIZACIÓN DE DOCUMENTOS: PROYECTO DIGISAN

DIGITALIZACIÓN DE DOCUMENTOS: PROYECTO DIGISAN DIGITALIZACIÓN DE DOCUMENTOS: PROYECTO DIGISAN Francisco Belmonte Díaz Diseño e implementación de Sistemas Informáticos. Coordinación de Tareas de Programación Servicio de Gestión Informática. Consejería

Más detalles

Sistema de base de datos para la gestión del fondo documental de la Biblioteca de la Facultad Enrique Cabrera.

Sistema de base de datos para la gestión del fondo documental de la Biblioteca de la Facultad Enrique Cabrera. Sistema de base de datos para la gestión del fondo documental de la Biblioteca de la Facultad Enrique Cabrera. Lic. Vilma Álvarez Benítez 1, Tec. David Calderín Álvarez 2 1 Facultad de Ciencias Médicas

Más detalles

MOTORES VERSUS DIRECTORIOS: EL DILEMA DE LA BÚSQUEDA

MOTORES VERSUS DIRECTORIOS: EL DILEMA DE LA BÚSQUEDA MOTORES VERSUS DIRECTORIOS: EL DILEMA DE LA BÚSQUEDA José Raúl Vaquero Pulido Presidente Asociación Hispana de Documentalistas en Internet http://www.documentalistas.com "La indización automática es la

Más detalles

BASES DE DATOS TEMA 3 MODELO ENTIDAD - RELACIÓN

BASES DE DATOS TEMA 3 MODELO ENTIDAD - RELACIÓN BASES DE DATOS TEMA 3 MODELO ENTIDAD - RELACIÓN 3.3 Aplicaciones Definición de Aplicación (Application). Programa informático que permite a un usuario utilizar una computadora con un fin específico. Las

Más detalles

Métricas, Estimación y Planificación en Proyectos de Software

Métricas, Estimación y Planificación en Proyectos de Software Métricas, Estimación y Planificación en Proyectos de Software Cuando se planifica un proyecto se tiene que obtener estimaciones del costo y esfuerzo humano requerido por medio de las mediciones de software

Más detalles

Capítulo 4. GESTIÓN DE LA INTEGRACIÓN DEL PROYECTO

Capítulo 4. GESTIÓN DE LA INTEGRACIÓN DEL PROYECTO Capítulo 4. GESTIÓN DE LA INTEGRACIÓN DEL PROYECTO Dante Guerrero Piura, 2013 FACULTAD DE INGENIERÍA Área Departamental de Ingeniería Industrial y de Sistemas Capítulo 4. GESTIÓN DE LA INTEGRACIÓN DEL

Más detalles

Introducción a Visual Studio.Net

Introducción a Visual Studio.Net Introducción a Visual Studio.Net Visual Studio es un conjunto completo de herramientas de desarrollo para la generación de aplicaciones Web ASP.NET, Servicios Web XML, aplicaciones de escritorio y aplicaciones

Más detalles

Programa de trabajo para Escuelas Asociadas

Programa de trabajo para Escuelas Asociadas Programa de trabajo para Escuelas Asociadas Qué es la CONAE? La Comisión Nacional de Actividades Espaciales es un organismo del Estado Nacional que se encarga de diseñar, ejecutar, controlar, gestionar

Más detalles

La ventana de Microsoft Excel

La ventana de Microsoft Excel Actividad N 1 Conceptos básicos de Planilla de Cálculo La ventana del Microsoft Excel y sus partes. Movimiento del cursor. Tipos de datos. Metodología de trabajo con planillas. La ventana de Microsoft

Más detalles

UML, ejemplo sencillo sobre Modelado de un Proyecto

UML, ejemplo sencillo sobre Modelado de un Proyecto UML, ejemplo sencillo sobre Modelado de un Proyecto Normal &DOLILFDU 0L3DQRUDPD 626 (VFULEHSDUD1RVRWURV Por Armando Canchala Contenido Introducción Objetivo Requerimientos Casos de Uso Subcasos de Uso

Más detalles

FP BÁSICA Ofimática y archivo de Documentos

FP BÁSICA Ofimática y archivo de Documentos FP BÁSICA Ofimática y archivo de Documentos ÍNDICE Introducción. Licencias de Software 1. Introducción Qué es hardware y qué es software? El término hardware (hw) hace referencia a las partes tangibles

Más detalles

1. Generalidades. Nombre de la asignatura o unidad de aprendizaje. Apertura de negocios. Clave asignatura. Ciclo LA945. Modulo tercero (integración)

1. Generalidades. Nombre de la asignatura o unidad de aprendizaje. Apertura de negocios. Clave asignatura. Ciclo LA945. Modulo tercero (integración) Nombre de la asignatura o unidad de aprendizaje Apertura de negocios Ciclo Modulo tercero (integración) Clave asignatura LA945 Objetivo general de la asignatura: El alumno analizará las bases para la apertura

Más detalles

ORIENTACIONES SIMCE TIC

ORIENTACIONES SIMCE TIC ORIENTACIONES SIMCE TIC Sistema Nacional de Medición de Competencias TIC en Estudiantes ORIENTACIONES SIMCE TIC Sistema Nacional de Medición de Competencias TIC en Estudiantes INDICE Introducción 7 Prueba

Más detalles

GESTIÓN Y CONTROL DEL DESARROLLO E IMPLANTACIÓN DE APLICACIONES

GESTIÓN Y CONTROL DEL DESARROLLO E IMPLANTACIÓN DE APLICACIONES Ciclo Formativo: Módulo: Desarrollo de Aplicaciones Informáticas Análisis y Diseño Detallado de Aplicaciones Informáticas de Gestión Unidad de Trabajo 10: GESTIÓN Y CONTROL DEL DESARROLLO E IMPLANTACIÓN

Más detalles

SUPLEMENTO EUROPASS AL TÍTULO DE TÉCNICO SUPERIOR DE ARTES PLÁSTICAS Y DISEÑO

SUPLEMENTO EUROPASS AL TÍTULO DE TÉCNICO SUPERIOR DE ARTES PLÁSTICAS Y DISEÑO SUPLEMENTO EUROPASS AL TÍTULO DE TÉCNICO SUPERIOR DE ARTES PLÁSTICAS Y DISEÑO TÉCNICO SUPERIOR DE ARTES PLÁSTICAS Y DISEÑO EN GRÁFICA INTERACTIVA --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

Más detalles

Servicio de estadísticas de Alojamiento Fecha de revisión: 19/09/2005

Servicio de estadísticas de Alojamiento Fecha de revisión: 19/09/2005 Servicio de estadísticas de Alojamiento Fecha de revisión: 19/09/2005 1. Acerca de este documento Este documento describe el servicio de estadísticas del que actualmente disfrutan algunas de las páginas

Más detalles

Google Calendar. Google Calendar

Google Calendar. Google Calendar Google Calendar Tabla de contenido Tabla de contenido... 2 Introducción... 3 Qué es Google Calendar?... 3 Acceder y crear una cuenta de Google Calendar... 4 Creación de eventos... 11 Envío de invitaciones...

Más detalles

Mapas colaborativos en línea

Mapas colaborativos en línea MÓDULO: COMUNIDADES DE APRENDIZAJE Universidad Nacional de Córdoba Mapas colaborativos en línea La propuesta que le presentamos se basa en la realización de un mapa colaborativo en línea. La idea es que

Más detalles

Por qué es importante la planificación?

Por qué es importante la planificación? Por qué es importante la planificación? La planificación ayuda a los empresarios a mejorar las probabilidades de que la empresa logre sus objetivos. Así como también a identificar problemas claves, oportunidades

Más detalles

PLANES DE EMPRESA ICEX CONSOLIDA. Manual de Usuario

PLANES DE EMPRESA ICEX CONSOLIDA. Manual de Usuario PLANES DE EMPRESA ICEX CONSOLIDA Manual de Usuario INDICE 1. INTRODUCCIÓN... 3 2. VISIÓN GENERAL DEL PROCESO... 3 3. REQUISITOS TÉCNICOS... 4 3.1. Sistema Operativo y Navegador web... 4 3.2. Firma Digital

Más detalles

MATERIAL 2 EXCEL 2007

MATERIAL 2 EXCEL 2007 INTRODUCCIÓN A EXCEL 2007 MATERIAL 2 EXCEL 2007 Excel 2007 es una planilla de cálculo, un programa que permite manejar datos de diferente tipo, realizar cálculos, hacer gráficos y tablas; una herramienta

Más detalles

Introducción a la estadística y SPSS

Introducción a la estadística y SPSS Introducción a la estadística y SPSS Marcelo Rodríguez Ingeniero Estadístico - Magister en Estadística Universidad Católica del Maule Facultad de Ciencias Básicas Pedagogía en Matemática Estadística I

Más detalles

ADMINISTRACIÓN DE BASES DE DATOS DISTRIBUIDAS

ADMINISTRACIÓN DE BASES DE DATOS DISTRIBUIDAS 5 ADMINISTRACIÓN DE BASES DE DATOS DISTRIBUIDAS Contenido: 5.1 Conceptos Generales Administración de Bases de Datos Distribuidas 5.1.1 Administración la Estructura de la Base de Datos 5.1.2 Administración

Más detalles

Índice QUÉ ES QUALITAS ESCUELA FAMILIA? Escuela Familia. Qué es Qualitas Escuela Familia? 3. Secciones 4. Usuario y Contraseña 4. Página Principal 5

Índice QUÉ ES QUALITAS ESCUELA FAMILIA? Escuela Familia. Qué es Qualitas Escuela Familia? 3. Secciones 4. Usuario y Contraseña 4. Página Principal 5 Escuela Familia Índice Qué es Qualitas Escuela Familia? 3 Secciones 4 Usuario y Contraseña 4 Página Principal 5 Información Personal 9 Calendario 10 Mensajería 11 Documentación 11 Sección Alumno 12 SMS

Más detalles

ANÁLISIS DE PROPUESTAS CURRICULARES. El planteamiento curricular presenta varios aspectos interesantes, como por ejemplo:

ANÁLISIS DE PROPUESTAS CURRICULARES. El planteamiento curricular presenta varios aspectos interesantes, como por ejemplo: ANÁLISIS DE PROPUESTAS CURRICULARES Ontario Resumen La propuesta curricular de Canadá presenta la Literatura integrada con el curso de Inglés, articulándola a través de sus cuatro componentes: Comunicación

Más detalles

VAST: Manual de usuario. Autores: Francisco J. Almeida-Martínez Jaime Urquiza-Fuentes

VAST: Manual de usuario. Autores: Francisco J. Almeida-Martínez Jaime Urquiza-Fuentes VAST: Manual de usuario Autores: Francisco J. Almeida-Martínez Jaime Urquiza-Fuentes Índice general Índice general 2 1. Introducción 4 2. Representación intermedia del AST 5 2.1. Funcionamiento del VAST

Más detalles

Menús. Gestor de Menús

Menús. Gestor de Menús Menús Para dar acceso a las categorías, artículos y generar espacio para los módulos se deben crear menús, éstos son enlaces a determinado recurso en el portal Web, sin ellos no es posible visualizar ninguno

Más detalles

Licenciatura en Computación

Licenciatura en Computación Res. CFI 21/06/2012 Res. CDC 25/09/2012 Pub. DO 31/10/2012 Plan de Estudios Licenciatura en Computación Facultad de Ingeniería 1 Antecedentes y fundamentos 1.1 Antecedentes En la Facultad de Ingeniería,

Más detalles

INTRODUCCIÓN A LOS SISTEMAS GESTORES DE BASE DE DATOS

INTRODUCCIÓN A LOS SISTEMAS GESTORES DE BASE DE DATOS INTRODUCCIÓN A LOS SISTEMAS GESTORES DE BASE DE DATOS AUTORÍA JOSEFA PÉREZ DOMÍNGUEZ TEMÁTICA NUEVAS TECNOLOGIAS ETAPA CICLOS FORMATIVOS DE GRADO SUPERIOR DE INFORMÁTICA Resumen En esta publicación se

Más detalles

PRESENTACIONES CON POWERPOINT

PRESENTACIONES CON POWERPOINT PRESENTACIONES CON POWERPOINT Rafael Carreres Paredes y Daniel Codina Ripoll Técnicos en microinformática Fecha: 18 de noviembre de 2005 INTRODUCCIÓN Veremos en esta breve apartado una aproximación a la

Más detalles

Experiencia en la IMPLANTACIÓN DE UN SISTEMA DE CALIDAD en la Facultad de Ciencias Agrotecnológicas de la Universidad Autónoma de Chihuahua

Experiencia en la IMPLANTACIÓN DE UN SISTEMA DE CALIDAD en la Facultad de Ciencias Agrotecnológicas de la Universidad Autónoma de Chihuahua 46 SynthesiS PUNTO DE VISTA Experiencia en la IMPLANTACIÓN DE UN SISTEMA DE CALIDAD en la Facultad de Ciencias Agrotecnológicas de la Universidad Autónoma de Chihuahua AÍDA RODRÍGUEZ ANDUJO, JULIO CÉSAR

Más detalles

El alumno conocerá el diseño y la planificación de estrategias corporativa y competitiva, para proyectar a la empresa en una posición de ventaja

El alumno conocerá el diseño y la planificación de estrategias corporativa y competitiva, para proyectar a la empresa en una posición de ventaja SESIÓN 9 PLANEACIÓN ESTRATÉGICA OBJETIVO El alumno conocerá el diseño y la planificación de estrategias corporativa y competitiva, para proyectar a la empresa en una posición de ventaja DISEÑO Y PLANIFICACIÓN

Más detalles

LUIS GALINDO PÉREZ DE AZPILLAGA HÉCTOR JOSÉ GARCÍA FERNÁNDEZ. Instituto Cibernos. Master Sistemas de Información Geográfica de Sevilla

LUIS GALINDO PÉREZ DE AZPILLAGA HÉCTOR JOSÉ GARCÍA FERNÁNDEZ. Instituto Cibernos. Master Sistemas de Información Geográfica de Sevilla APLICABILIDAD DE UN SISTEMA DE INFORMACIÓN GEOGRÁFICA PARA EL ESTUDIO DE LA IMPLANTACIÓN DE NUEVAS INFRAESTRUCTURAS EN UN ESPACIO INTERIOR DE LA CIUDAD DE SEVILLA. LUIS GALINDO PÉREZ DE AZPILLAGA HÉCTOR

Más detalles

Acciones Correctivas y Preventivas. Universidad Autónoma del Estado de México

Acciones Correctivas y Preventivas. Universidad Autónoma del Estado de México Acciones Correctivas y Preventivas Universidad Autónoma del Estado de México Mejora Continua La mejora continua del desempeño global de la organización debería ser un objetivo permanente de ésta. Mejora

Más detalles

Instructivo Asesoría Básica Comunidad Virtual SharePoint 2010

Instructivo Asesoría Básica Comunidad Virtual SharePoint 2010 Instructivo Asesoría Básica Comunidad Virtual SharePoint 2010 CONTENIDO 1. Qué es? 2. Cómo crear y acceder a la Comunidad Virtual en Microsoft SharePoint 2010? Ejemplo. 3. Qué tengo en la página de inicio

Más detalles

FORMACIÓN DE EQUIPOS DE E-LEARNING 2.0 MÓDULO DE DISEÑO Y PRODUCCIÓN DE MATERIALES UNIDAD 6 B

FORMACIÓN DE EQUIPOS DE E-LEARNING 2.0 MÓDULO DE DISEÑO Y PRODUCCIÓN DE MATERIALES UNIDAD 6 B 141 1 FORMACIÓN DE EQUIPOS DE E-LEARNING 2.0 Unidad 6 B 142 2 Índice SEGUIMIENTO DE PERSONAS 1 INFORMES 2 143 3 SEGUIMIENTO DE PERSONAS E INFORMES EN MOODLE El seguimiento de los participantes en Moodle

Más detalles

www.fundibeq.org Es de aplicación a aquellos estudios o situaciones en que es necesario priorizar entre un conjunto de elementos.

www.fundibeq.org Es de aplicación a aquellos estudios o situaciones en que es necesario priorizar entre un conjunto de elementos. GRAÁFICOS DE GESTIÓON (LINEALES, BARRAS Y TARTAS) 1.- INTRODUCCIÓN Este documento introduce los Gráficos de Gestión de uso más común y de mayor utilidad: Gráficos Lineales, Gráficos de Barras y Gráficos

Más detalles

Introducción INFORMÁTICA PARA LAS ARTES

Introducción INFORMÁTICA PARA LAS ARTES INFORMÁTICA PARA LAS ARTES Introducción Desde la aparición del primer ordenador, hace unos cincuenta años, la Informática se ha venido introduciendo en innumerables ámbitos de nuestra sociedad. Si en sus

Más detalles

Resumen de la Tesina. Autor: Adrià Batet López. Tutor: Víctor Pascual Ayats

Resumen de la Tesina. Autor: Adrià Batet López. Tutor: Víctor Pascual Ayats Inventario y geolocalización de las actividades comerciales en las plantas bajas de los edificios de L Hospitalet de Llobregat. Aplicación web de recursos para el ciudadano. Resumen de la Tesina. Autor:

Más detalles

ANALISIS MULTIVARIANTE

ANALISIS MULTIVARIANTE ANALISIS MULTIVARIANTE Es un conjunto de técnicas que se utilizan cuando se trabaja sobre colecciones de datos en las cuáles hay muchas variables implicadas. Los principales problemas, en este contexto,

Más detalles

Índice 1 Instalación de la herramienta 2 Descripción de la herramienta 2 Arranque de la aplicación 3 Proyecto 4 Diagrama de clases 5

Índice 1 Instalación de la herramienta 2 Descripción de la herramienta 2 Arranque de la aplicación 3 Proyecto 4 Diagrama de clases 5 Índice Índice 1 Instalación de la herramienta 2 Descripción de la herramienta 2 Arranque de la aplicación 3 Proyecto 4 Diagrama de clases 5 Crear diagrama de clases 5 Crear elementos 7 Editar elementos

Más detalles

Representaciones Gráficas

Representaciones Gráficas Representaciones Gráficas Gráficos para variables cualitativas Los gráficos más usuales para representar variables de tipo nominal son los siguientes: Diagramas de barras: Se representa en el eje de ordenadas

Más detalles

RECOMENDACIONES DE INVESTIGACIÓN FUTURA.

RECOMENDACIONES DE INVESTIGACIÓN FUTURA. Capítulo 6 CONCLUSIONES Y RECOMENDACIONES DE INVESTIGACIÓN FUTURA. 212 METODOLOGÍA PARA LA DETECCIÓN DE REQUERIMIENTOS SUBJETIVOS EN EL DISEÑO DE PRODUCTO. CAPÍTULO 6. CONCLUSIONES, APORTACIONES Y RECOMENDACIONES.

Más detalles

Monitorización de Equipos y Redes [NAGIOS ] VIRTUALITY

Monitorización de Equipos y Redes [NAGIOS ] VIRTUALITY Monitorización de Equipos y Redes [NAGIOS ] VIRTUALITY [INTRODUCCIÓN. QUÉ ES NAGIOS?] Nagios es un sistema de monitorización de equipos y de servicios de red, creado para ayudar a los administradores a

Más detalles

Sistemas de Calidad Empresarial

Sistemas de Calidad Empresarial Portal Empresarial Aljaraque Empresarial Sistemas de Calidad Empresarial 1 ÍNDICE 1. INTRODUCCIÓN. 2. CONCEPTO DE CALIDAD Y SU SISTEMA. 3. MÉTODO PARA IMPLANTAR UN SISTEMA DE GESTIÓN DE LA CALIDAD. 4.

Más detalles

RESUMEN EJECUTIVO. La gestión de riesgos corporativos incluye las siguientes capacidades:

RESUMEN EJECUTIVO. La gestión de riesgos corporativos incluye las siguientes capacidades: RESUMEN EJECUTIVO La premisa subyacente en la gestión de riesgos corporativos es que las entidades existen con el fin último de generar valor para sus grupos de interés. Todas se enfrentan a la ausencia

Más detalles

GLOSARIO DE TÉRMINOS

GLOSARIO DE TÉRMINOS MINISTERIO DE EDUCACIÓN, CULTURA Y DEPORTE SECRETARÍA DE ESTADO DE EDUCACIÓN Y FORMACIÓN PROFESIONAL DIRECCIÓN GENERAL DE FORMACIÓN PROFESIONAL INSTITUTO NACIONAL DE LAS CUALIFICACIONES GLOSARIO DE TÉRMINOS

Más detalles

Instituto Tecnológico de Costa Rica

Instituto Tecnológico de Costa Rica Instituto Tecnológico de Costa Rica Escuela de Ingeniería en Computación Proyecto Programado: Revisión de Utilización Médica: Aplicación Web para el control de pacientes en hospitales de Puerto Rico Práctica

Más detalles

Metodología de trabajo

Metodología de trabajo El objetivo de este apéndice es describir brevemente la metodología de trabajo que aplico para realizar el proceso de de los poemas. Esta metodología de se compone de tres fases, que se dividen, a su vez,

Más detalles

Presentación realizada por Juan Carlos Camus el 28 de junio de 2007, para un evento realizado por la empresa Inter-Media Ltda. En Santiago de Chile.

Presentación realizada por Juan Carlos Camus el 28 de junio de 2007, para un evento realizado por la empresa Inter-Media Ltda. En Santiago de Chile. Juan C. Camus Web 2.0 Presentación realizada por Juan Carlos Camus el 28 de junio de 2007, para un evento realizado por la empresa Inter-Media Ltda. En Santiago de Chile. 1 Con esta imagen quiero reprsentar

Más detalles

UF0320: Aplicaciones informáticas de tratamiento de textos

UF0320: Aplicaciones informáticas de tratamiento de textos UF0320: Aplicaciones informáticas de tratamiento de textos TEMA 1. Conceptos generales y características fundamentales del programa de tratamiento de textos TEMA 2. Introducción, desplazamiento del cursor,

Más detalles

FASES DEL PROCESO DE RESOLUCIÓN DE PROBLEMAS

FASES DEL PROCESO DE RESOLUCIÓN DE PROBLEMAS FASES DEL PROCESO DE RESOLUCIÓN DE PROBLEMAS Varios autores han tratado de identificar y describir las distintas fases en el proceso de resolución de problemas. Polya (1945), en su modelo descriptivo,

Más detalles

Manual de usuario de Solmicro BI. Página 1

Manual de usuario de Solmicro BI. Página 1 Manual de usuario de Solmicro BI Página 1 Índice 1. Estructura general del sistema, 2. Estructura de presentación de la información, 3. Acceso a Solmicro BI y los diferentes cuadros de mando, 4. Partes

Más detalles

Servicios Administrados al Cliente

Servicios Administrados al Cliente Dell Administrados al Cliente Los servicios administrados le pueden ayudar. Al aplicar un proceso de administración consistente a través de los imprevistos en la vida de su computadora, usted puede minimizar

Más detalles

Evaluación de la capacidad óptima de medida y alcance de la acreditación de un laboratorio de calibración

Evaluación de la capacidad óptima de medida y alcance de la acreditación de un laboratorio de calibración Evaluación de la capacidad óptima de medida y alcance de la acreditación de un laboratorio de calibración Fernández Pareja, Mª Teresa te_fer@topografia.upm.es Departamento de Ingeniería Topográfica y Cartografía

Más detalles

Los estados financieros proporcionan a sus usuarios información útil para la toma de decisiones

Los estados financieros proporcionan a sus usuarios información útil para la toma de decisiones El ABC de los estados financieros Importancia de los estados financieros: Aunque no lo creas, existen muchas personas relacionadas con tu empresa que necesitan de esta información para tomar decisiones

Más detalles

Instalación del programa PSPP y obtención de una distribución de frecuencias.

Instalación del programa PSPP y obtención de una distribución de frecuencias. Práctica 2. Instalación del programa PSPP y obtención de una distribución de frecuencias. Con esta práctica instalaremos el programa PSPP. El programa es un software específico para el análisis estadístico

Más detalles

CAPITULO VI CONCLUSIONES. Al haber analizado los conceptos presentados en este trabajo, pudimos llegar a la

CAPITULO VI CONCLUSIONES. Al haber analizado los conceptos presentados en este trabajo, pudimos llegar a la CAPITULO VI CONCLUSIONES 6.1 Conclusión Al haber analizado los conceptos presentados en este trabajo, pudimos llegar a la conclusión de que la comunicación organizacional, es el flujo de información que

Más detalles

SELECCIÓN N Y DISEÑO DEL PRODUCTO Y SERVICIO

SELECCIÓN N Y DISEÑO DEL PRODUCTO Y SERVICIO SELECCIÓN N Y DISEÑO DEL PRODUCTO Y SERVICIO Administración n de Operaciones II 1 El desarrollo consistente y la introducción n de nuevos productos que valoren los clientes es muy importante para la prosperidad

Más detalles

Desarrollo de un Sistema de Gestión de Proyectos mediante el framework GWT

Desarrollo de un Sistema de Gestión de Proyectos mediante el framework GWT Proyecto de Fin de Carrera Universidad Politécnica de Valencia Escuela Técnica Superior de Informática Desarrollo de un Sistema de Gestión de Proyectos mediante el framework GWT Realizado por: Dirigido

Más detalles

Proyectos de Innovación Docente

Proyectos de Innovación Docente Proyectos de Innovación Docente Manual de Usuario Vicerrectorado de Docencia y Profesorado Contenido INTRODUCCIÓN... 3 DATOS PERSONALES... 6 Modificar email... 6 Modificar contraseña... 7 GESTIÓN PROYECTOS...

Más detalles

Capitulo VII. Editor de Mapa de Tareas. Como hemos hablado en los capítulos anteriores, sabemos que parte del éxito

Capitulo VII. Editor de Mapa de Tareas. Como hemos hablado en los capítulos anteriores, sabemos que parte del éxito Capitulo VII Editor de Mapa de Tareas. Como hemos hablado en los capítulos anteriores, sabemos que parte del éxito que puede tener un ambiente de aprendizaje, consiste en el impacto que de primera instancia

Más detalles

Mezcla de Mercadotecnia

Mezcla de Mercadotecnia Mezcla de Mercadotecnia MEZCLA DE MERCADOTECNIA 1 Sesión No. 5 Nombre: Colocación de productos Contextualización Te has preguntado cómo es que los productos que consumen llegan hasta las tiendas en las

Más detalles