Sistemas de Data Warehousing



Documentos relacionados
Capítulo 2 Tecnología data warehouse

MOLAP REALIZADO POR: JOSE E. TABOADA RENNA

Definición. Data Warehousing: almacenamiento, transformación y distribución de datos útiles para los responsables de tomar decisiones 9/29/2006 4

DATA WAREHOUSE DATA WAREHOUSE

Sistema de análisis de información. Resumen de metodología técnica

Sistemas de Información 12/13 La organización de datos e información

Presentación de Pyramid Data Warehouse

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 5 -

CAPÍTULO 2 DATA WAREHOUSES

Aplicaciones e implicaciones de las bases de datos. Introducción a la Informática

INTELIGENCIA DE NEGOCIOS. Business Intelligence. Alumno: Toledo Paucar Jorge

Sistemas de Información para la Gestión. Unidad 3 Aplicaciones de Sistemas

Tecnologías de Información y Comunicación II CLASE 10

DISEÑO E IMPLEMENTACIÓN DE SOLUCIONES BUSINESS INTELLIGENCE CON SQL SERVER 2012

SISTEMAS DE INFORMACION GERENCIAL LIC.PATRICIA PALACIOS ZULETA

Unidad III. Software para la administración de proyectos.

Universidad acional Experimental Del Táchira Decanato de Docencia Departamento de Ingeniería en Informática

APOYO PARA LA TOMA DE DECISIONES

BUSINESS INTELLIGENCE

Oracle vs Oracle por Rodolfo Yglesias Setiembre 2008

ANEXO A - Plan de Proyecto EDT de la solución EDT GENERAL DEL PROYECTO1

Resumen General del Manual de Organización y Funciones

3.3.3 Tecnologías Mercados Datos

El almacén de indicadores de proceso de negocio en ejecución

Business Intelligence

E-data. Transformando datos en información con Data Warehousing

Quienes Somos? Valor. Estrategia

Día :00h Lugar: Obra Social Ibercaja, Sala De actos, Rambla Ferran 38, 3º, Lleida

Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI)

Facultad de Ciencias Económicas. Departamento de Sistemas. Asignatura: INTELIGENCIA DE NEGOCIOS. Plan 1997

Licencia GNU FDL. Detalle del cambio. Ing. Bernabeu Ricardo Dario, Ing. García Mattío Mariano Alberto. Versión incial. 05/11/2009

Arquitectura de desarrollo Fomento.Net

UN PASEO POR BUSISNESS INTELLIGENCE

Informática II Ing. Industrial. Data Warehouse. Data Mining

Fundamentos de la Inteligencia de Negocios

OLAP 2 OLAP 1 OLAP 4 OLAP 3 OLAP 5 OLAP 6

Comunicación para Tecnimap Contenido: 1. Itourbask como elemento de un Sistema de Gestión de Destino Turístico 2. El Data Mart de Itourbask

SISTEMA DE INFORMACION GERENCIAL. Lic.Patricia Palacios Zuleta

Workflow, Gestión Documental y Tecnologías Web.

1 GLOSARIO. Actor: Es un consumidor (usa) del servicio (persona, sistema o servicio).

SQL Server Business Intelligence parte 1

CONSTRUCCION DE INDICADORES DE GESTION Y HERRAMIENTAS OLAP PARA PEQUEÑAS Y MEDIANAS EMPRESAS

Arquitectura para análisis de información. Zombi es una arquitectura que proporciona de manera integrada los componentes

Concepción - Chile Marcela Varas Universidad de Concepción Chile

REPOSITORIO COR O P R OR O A R T A I T VO V

Fundamentos de la Inteligencia de Negocios

Monitoreo de Plataformas TI. de Servicios

Estrategias de Mercadeo y Negocios en Internet para PYMES. Intranets

Consultoría en Automatización de Procedimientos

Inteligencia de Negocios Introducción. Por Elizabeth León Guzmán, Ph.D. Profesora Ingeniería de Sistemas Grupo de Investigación MIDAS

Integración de sistemas de información: Factores tecnológicos, organizativos y estratégicos

Innovación para su Contact Center

SUPLEMENTO EUROPASS AL TÍTULO

Materia: Inteligencia de negocios

DATA WAREHOUSE PARA LA PRESTACIÓN DEL SERVICIO PÚBLICO DE INFORMACIÓN ESTADÍSTICA

CREACIÓN DE PROYECTOS DE BUSINESS INTELLIGENCE CON SQL SERVER. 40 horas 60 días

INTEGRACION DE BASES DE DATOS EN LA WEB

Convertimos lo complicado en sencillo, lo fácil en operativo y eliminamos lo ineficaz

ORIENTACIONES SIMCE TIC

Data Mining Técnicas y herramientas

UNIVERSIDAD DE SANTIAGO DE CHILE INGENIERIA COMERCIAL APLICACIÓN COMPUTACIONAL I INTELIGENCIA DE NEGOCIOS


3.2 Utiliza las TIC para mantener una orientación y desempeño profesional que refleje el esfuerzo por hacer sus tareas con eficiencia y calidad

Data Warehousing - Marco Conceptual

Capítulo 5. Cliente-Servidor.

SISTEMA DE PRODUCCION. Pág. 1

Business Intelligence

Unidad I: Sistemas Gestores de Bases de Datos. 1.1 Objetivo de las Bases de Datos

La Pirámide de Solución de TriActive TRICENTER

Quality Software ERP Red de Aplicaciones Dinámicas (RAD). RAD

Proyecto CAT Centro Atención al Trabajador

UNIVERSIDAD AUTONOMA DE GUADALAJARA ACP06 ALUMNO: JOSE ANGEL DEHESA JIMENEZ REGISTRO: C R M

FICHEROS Y BASES DE DATOS (E44) 3º INGENIERÍA EN INFORMÁTICA. Tema 5. Sistemas de Bases de Datos. frente a Sistemas de Ficheros

JASPER SERVER BI INTRODUCCION

Sistemas de Gestión de Documentos Electrónicos de Archivo (SGDEA)

Servicio de Gestión de TI

Bases de Datos Heterogéneas

CAPÍTUL07 SISTEMAS DE FILOSOFÍA HÍBRIDA EN BIOMEDICINA. Alejandro Pazos, Nieves Pedreira, Ana B. Porto, María D. López-Seijo

Business Intelligence (Inteligencia de Negocios) Bases de Datos Masivas (11088) Universidad Nacional de Luján

Estos documentos estarán dirigidos a todas las personas que pertenezcan a equipos de implementación de Oracle BI, incluyendo a:

1. Instala sistemas operativos en red describiendo sus características e interpretando la documentación técnica.

Aproximación práctica a ITIL. Proyecto VeredaCS. F r00

10778 Implementing Data Models and Reports with Microsoft SQL Server 2012

Fundamentos de Ingeniería del Software. Capítulo 2. Introducción a los sistemas de información

Business Intelligence

1. Gestionar el ciclo de vida de las solicitudes de servicio que se reciben de los usuarios de los servicios de TIC.

Parte I: Introducción

"Diseño, construcción e implementación de modelos matemáticos para el control automatizado de inventarios

El Software. Es lo que se conoce como el ciclo de vida del software.

MINING SOLUTIONS LIMITADA

Sistema de Gestión de Proyectos Estratégicos.

SUPLEMENTO EUROPASS AL TÍTULO

Plan de estudios Maestría en Sistemas de Información y Tecnologías de Gestión de Datos

SAP BusinessObjects Edge BI Standard Package La solución de BI preferida para. Empresas en Crecimiento

Ventajas del software del SIGOB para las instituciones

GESTIÓN DE CLÍNICAS COLEGIO OFICIAL DE VETERINARIOS DE BIZKAIA

Sistema de gestión de procesos institucionales y documental.

ESCUELA SUPERIOR POLITÉCNICA DEL LITORAL Facultad de Ingeniería en Electricidad y Computación SYLLABUS DEL CURSO Sistemas De InformaciÓn (iit95)

Transcripción:

Federación Médica del Interior (FEMI) Sociedad Uruguaya de Informática en la Salud (SUIS) Información en Salud Edición 2009 Sistemas de Data Warehousing Dr. Ing. Adriana Marotta (In.Co - F.Ing - UDELAR) amarotta@fing.edu.uy Abril 2009

Temas Temario: Introducción. n. Los Sistemas de Data Warehousing. Organización n de los Sistemas de DW. Usando los Sistemas de DW. Factores de éxito, errores y beneficios. Conclusiones, Tendencias y Perspectivas.

Motivaciones Problemática planteada: Acceso a Información n para la toma de decisiones. Stock Farmacia Diagnósticos Gestión RRHH? Factores críticos: Tiempo de acceso. Integración Calidad de información.?

Motivaciones Los datos existen, pero... No siempre se acceden fácilmente. f No siempre se utilizan. La información n suele ser difícil de obtener: Deben obtenerse los datos: A partir de los cuales se construye la información. n. Que definen el contexto de los anteriores. En un cierto contexto, un ítem puede ser información: n: Dependiendo del tipo de decisiones a tomar. Dependiendo de la persona encargada. Dependiendo de la calidad de su valor.

Motivaciones Y los sistemas de información n tradicionales... Orientados a sistemas operacionales. Asociados a procesos productivos. Procesan grandes cantidades de transacciones. Pueden resolver estas necesidades?

Motivaciones Sistema orientado a la Producción: Prioridad: tiempo de respuesta a transacciones read-write write. Se manejan datos actuales muy detallados. Estables y de larga vida útil. Sistema orientado a la Decisión: Prioridad: expresividad y eficiencia en consultas complejas. Datos actuales+históricos resumidos. En constante evolución.

Conclusión. n. Motivaciones Se trata de sistemas con objetivos diferentes. Se construyen para ser eficientes en sus objetivos. No es posible usarlos para las tareas de otro.

Sistemas de Data Warehousing Abordan la problemática planteada: Generar Información n para toma de decisiones. siguiendo los principios: Construir Información n desde datos de la empresa. Integrar diferentes fuentes de datos. Ofrecer al usuario final mecanismos flexibles para el acceso a la información: n: Pre-programada. Libre, exploratoria. A través s de los objetos de su negocio. Observando los datos en formatos especializados.

Estructura de Sistemas de DW Pacientes Patología - Construcción interactiva. - Agregación/Desagregación. M E T A D A T A Fecha Analisis Multidimensional (OLAP) Consultas y reportes complejos Data Warehouse Herramientas ETL Búsqueda de correlaciones entre datos. Data Mining Herramientas de exploración y análisis Carga automatizada. Control de Calidad de Datos. Integración de BDs. Históricos Archivos BD-Rel BD-Geo BD-Texto... Bases de datos fuentes

Estructura de Sistemas de DW Las Bases de Datos Fuente. Almacenan datos brutos para construir la información. Pueden ser heterogéneas neas. Almacenan ítems de datos detallados. El Data Warehouse. Base (o bases) de datos con el conjunto de información n requerida para toma de decisiones. Incluye tablas con valores tomados de las BD Fuente así como con valores calculados.

Estructura de Sistemas de DW Herr. de Extracción n y Transformación n de datos (ETL). Construyen el DW, transformando datos en BD Fuente. Deben resolver problemas técnicos importantes: Acceso a sistemas heterogéneos neos. Ejecución de consultas complejas. Operación n de carga global, combinando el conjunto de las operaciones. La Calidad de los Datos. Es s un aspecto fundamental credibilidad sistema. Se basa en: La consistencia y corrección n clásica de datos. Noción n de PertinenciaP y Relevancia de los datos.

Estructura de Sistemas de DW Herramientas de acceso a Información. n. Usadas para explorar la información. n. Tipos de herramientas: Planillas electrónicas. Reportes y consultas interactivas. OLAP (On-Line Analytic Processing): Representan datos como Dimensiones y Medidas. Data Mining: Descubrimiento de correlaciones y patrones en datos.

Propiedades de los Sist. DW Un Sistema de DW debería a : Acceder a Bases Fuentes heterogéneas y multiplataforma. Soportar múltiples m tipos de usuarios. Funcionar en forma independiente a los Sistemas de Producción. Soportar configuraciones en red. Ofrecer Interfaces a usuario avanzadas. Soportar Diccionarios de Datos y Metadata.

Interfaces avanzadas a usuario Interfaces a usuario especializadas. Por qué? Optimizar el tiempo del usuario. Principio: A cada tipo de usuario o aplicación n se le ofrece la interfaz más m s adecuada.

Espacio de Metadata OLAP MDD/DBs DW Metadata BD-Fuentes Directorio Metadata/Repository

Organización n de los Sist. DW Cómo se organizan los sistemas DW en la organización n? DW a nivel de la organización n (o conjunto de áreas). Almacena información n con alcance global. Información n integrada y limpia de la organización. n. Centraliza la carga (y controles) desde bases fuentes. Data Marts por área o aplicación. Resuelven requerimientos concretos de áreas o aplicaciones. Basado en datos del DW. Tiene administración n y evolución n relativamente autónoma. P.ej. : Gestión n de Farmacia, Análisis de casos ingresados.

Organización n de los Sist. DW Cómo se organizan los sistemas DW en la organización n? Interfaz usuario Data Marts MOLAP... ROLAP Tecnologías de extracción y almacenamiento de info. DW global ETL BDs Fuentes

Usando el Sistema de DW Cómo se usa un Sistema de DW? A través s de herramientas de exploración n y análisis de información: n: BDs Escritorio. Planillas Electrónicas. Herramientas de consulta y reportes. OLAPs. Herramientas Estadísticas sticas y de Data Mining. Modelización de Negocios y Simulación.

Usando el Sistema de DW Pacientes Patología - Construcción interactiva. - Agregación/Desagregación. M E T A D A T A Fecha Analisis Multidimensional (OLAP) Consultas y reportes complejos Data Warehouse Herramientas ETL Búsqueda de correlaciones entre datos. Data Mining Herramientas de exploración y análisis Carga automatizada. Control de Calidad de Datos. Integración de BDs. Históricos Archivos BD-Rel BD-Geo BD-Texto... Bases de datos fuentes

Herramientas de Consultas y Funcionalidades base: Reportes Construir fácilmente f consultas/reportes complejos. Muy buenos para construir reportes no previstos. Incorporan lenguajes para manejo de datos. Incluyen funciones de todo tipo. Ofrecen diferentes niveles de complejidad orientada a diferentes tipos de usuario: Construcción n de reporte complejo desde cero. Construcción n de reporte en base a moldes. Ejecución n de reportes con variables a llenar. Ejecución n fija de reporte.

Funcionalidades base: OLAPs Permiten consultar datos : Interactivamente y en forma eficiente. Usando mecanismos comprensibles para usuarios. Una consulta corresponde a cruzar dimensiones y elegir la medida en el cruzamiento. Funcionalidades adicionales: Visualización n gráfica. Operaciones en línea. l Funcionalidades de herramientas: Integración n con BDs Relacionales. Integración n con herramientas de escritorio y otros sistemas.

Motivaciones: Modelos OLAP (o multidimensionales) Facilitar y optimizar la realización n de consultas de tipo cruzamientos. Representar los datos en forma más m s cercana a la intuición n del usuario. Principios generales: La información n se representa como: cuadros de doble o triple entrada. cubos de "n" dimensiones. Una BD-MD incluye varias dimensiones.

Modelos OLAP : Ejemplo Análisis de ventas de autos Tabla: MODELO COLOR VOLUME -Ventas MINI VAN BLUE 6 MINI VAN RED 5 MINI VAN WHITE 4 SPORTS COUPE BLUE 3 SPORTS COUPE RED 5 SPORTS COUPE WHITE 5 SEDAN BLUE 4 SEDAN RED 3 SEDAN WHITE 2 Cuadro: M O D E L O Mini Van Coupe Sedan 6 5 4 3 5 5 4 3 2 Blue Red White COLOR

Modelos OLAP : Ejemplo Agregando una 3a. dimensión: n: M O D E L O Mini Van Coupe Sedan Carr Gleason Clyde VENDEDOR Blue Red White COLOR

Modelos OLAP : Ejemplo Agregando una 4a. dimensión: n: M O D E L O Mini Van Coupe Sedan Blue Red White Color Carr Gleason Clyde... Mini Van Coupe Sedan Blue Red White Color Carr Gleason Clyde VENDEDOR Enero... Diciembre

Modelos OLAP Los Modelos OLAP constan de: Dimensiones: Dimensiones en el hipercubo. Macro-objetos objetos del problema. Criterios de análisis de los datos. Medidas: Valores en los cruzamientos de las dimensiones. Datos asociados a relaciones entre los objetos del problema. Valores o Indicadores a analizar.

Jerarquías: as: Dimensiones Los valores se organizan en jerarquías as (categorías). as). Dimensión: Vendedores REGION Midwest CIUDAD Chicago St. Louis Gary VENDEDOR Clyde Gleason Carr Levi Lucas Bolton

Operaciones: Roll-up Consolidación n (Roll-Up). Calcula las medidas en función n de agrupamientos. 10 5 15 Mini Van Coupe Roll-up (Suma) Sobre Vendedor Mini Van Coupe Sedan Carr Gleason Clyde Sedan Chicago St.Louis Blue Red White White Red Blue

Operaciones Multidimensionales Resumen: Slice. Dice. Selecciona dimensiones (y medidas) de trabajo. Selecciona valores en las dimensiones. Rotación. Selecciona el orden de visualización n de las dimensiones. Drill-up/ up/drill-down. Selecciona un nivel de agregación n superior para una o más m dimensiones.

Data Mining Objetivos: Explorar BDs buscando relaciones desconocidas entre los datos. Por ejemplo: Relaciones entre enfermedades y decesos. Algunas candidatas a nuevas causas de decesos. Otras podrían ser datos erróneos. Qué incluye? Un conjunto muy amplio y heterogéneo de técnicas t y herramientas.

Data Mining Los programas de Data Mining: Analizan un conjunto de datos y generan Modelos. Reglas. Árboles de Decisión. Clusters. Ecuaciones. Pueden estudiar varias dimensiones de datos simultáneamente y descubrir los que tienen comportamiento especial. La iniciativa es del algoritmo y no del usuario.

Factores de éxito Un proyecto DW se considera exitoso si: Integra información n heterogénea. De diferentes tipos. De diferentes orígenes. Hace visible y manejable la información útil. Incluye datos de calidad validada. Ofrece acceso directo a usuarios. La cantidad de usuarios y de acceso aumenta.

Se debe evitar: Errores a evitar Establecer expectativas demasiados altas. Cargar el DW con todo lo disponible. Elegir un DW manager sin orientación n al negocio. Diseñar el DW igual que un sistema de producción. Ignorar fuentes de datos externas. Ignorar la evolutividad del sistema.

Beneficios esperables Se obtiene: Acceso interactivo e inmediato a información estratégica de un área de negocios. Permite toma de decisiones basadas en datos objetivos. Los beneficios aumentan : cuanto más m s importantes son las decisiones. cuanto más m s crítico es el factor tiempo. Capitalización n de datos en bases heterogéneas: Archivos, dbf,, etc.

Conclusiones Los Sistemas de DW resultan un aporte importante para la toma de decisiones: Acercan la información n al usuario. Los Sistemas DW permiten revalorizar los datos en la empresa: Integran datos en diferentes formatos. Los Sistemas DW no son productos monolíticos sino composición n de soluciones técnicas. t Construcción n del Diccionario de Datos, Diseño o de Base de Datos, Conectividad, Control de calidad de datos, etc.

Tendencias y Perspectivas Área en evolución: Sistemas, Metodologías, etc. Acceso a Sistemas DW por Web. Tanto por Internet como Intranet. Integración n de información n heterogénea: Geográfica, Texto, Imágenes.

Muchas gracias