CI2355 Almacenes de datos y OLAP

Documentos relacionados
Unidad 10. Almacenes de Datos

ARQUITECTURA DE UNA BODEGA DE DATOS

Sistemas de Información 12/13 La organización de datos e información

Business Intelligence

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS (Universidad del Perú, DECANA DE AMÉRICA) SYLLABO

Bodegas de Datos y OLAP. Introducción a la Bodegas de Datos

Inteligencia de Negocios

DIPLOMADO EN MICROSOFT SQL SERVER 2008

CC Inteligencia de Negocios

Data Warehousing. Arquitectura de procesos en un sistema de data warehousing. Facultad de Ingeniería Escuela de Ingeniería de Sistemas y Computación

Resumen Inteligencia de Negocios

APOYO PARA LA TOMA DE DECISIONES

ANEXO C Documento de Extracción. 1. Objetivo. 2. Alcance. 3. Arquitectura de la Extracción

Inteligencia de Negocios Introducción. Por Elizabeth León Guzmán, Ph.D. Profesora Ingeniería de Sistemas Grupo de Investigación MIDAS

Sistema de análisis de información. Resumen de metodología técnica

Data Warehousing. Introducción. Facultad de Ingeniería Escuela de Ingeniería de Sistemas y Computación

2796 Designing an Analysis Solution Architecture Using Microsoft SQL Server 2005 Analysis Services

REPOSITORIO COR O P R OR O A R T A I T VO V

Sumario Prólogo Unidad didáctica 1. Introducción a business intelligence Objetivos de la Unidad... 12

Inteligencia de Negocios (Introducción)

Definición. Data Warehousing: almacenamiento, transformación y distribución de datos útiles para los responsables de tomar decisiones 9/29/2006 4

CAPÍTULO 2 DATA WAREHOUSES

Capacitación SAP BW Plataforma Tecnológica Única

Botón menú Objetivo de la Minería de datos.

Tecnología aplicada a la toma de decisiones o malas decisiones en tecnología?

Introducción al Data Warehouse La Factoría de la Información Corporativa. Àngels Rius Gavidia

Implantación de Datawarehouse Open Free

Extracción de datos. Involucra técnicas para la extracción de información en las fuentes.

Aux 2. Introducción a la Minería de Datos

APLICACION DE LA MINERIA DE DATOS SOBRE BASES DE DATOS TRANSACCIONALES. Alvaro Troche Clavijo

Inteligencia de Negocios

Bases de datos 1. Teórico: Introducción

Inteligencia de Negocio

Datawarehouse. Ing. Adan Jaimes Jaimes. Datawarehouse

SISTEMA DE INFORMACION DE GESTION DE TARJETAS DE CREDITO USANDO DATA MART E INTELIGENCIA DE NEGOCIOS PARA EL AREA COMERCIAL DEL BANCO RIPLEY PERU

MSc. Francisco García

Sistemas de Información

Inteligencia de Negocios

Unidad 5 INTELIGENCIA DE NEGOCIOS Por: Wendy Esmeralda Salazar Castillo.

Bases de Datos Otoño 2012 Maestría en Ingeniería de Software L.I Yessica Sugeidy Morales Mateo. 22/09/2012 Bases de Datos

Apoyo para la Toma de Decisiones

Prueba de autoevaluación 2

Tecnologías de la Información en la Gestión Empresarial

MÓDULO MATERIA CURSO SEMESTRE CRÉDITOS TIPO

DATA WAREHOUSE PARA LA PRESTACIÓN DEL SERVICIO PÚBLICO DE INFORMACIÓN ESTADÍSTICA

Servicio Business Intellingence integrado con Data Management & Big Data Del dato al conocimiento

Licencia GNU FDL. Detalle del cambio. Ing. Bernabeu Ricardo Dario, Ing. García Mattío Mariano Alberto. Versión incial. 05/11/2009

DATA WAREHOUSE DATA WAREHOUSE

DATA WAREHOUSING (ENERO DE 2003) Documento creado por Ing. Héctor H. Martínez Orpinel

SpagoBI Open Source Business Intelligence

Facultad de Ingeniería Escuela de Ingeniería Informática. Período Teoría Práctica Laboratori De crédito


MOLAP REALIZADO POR: JOSE E. TABOADA RENNA

ABD - Administración de Bases de Datos

INTRODUCCIÓN AL DATAWAREHOUSING

UNIVERSIDAD NACIONAL DEL CALLAO

Almacén de datos - concepto. Arquitectura de un sistema de almacén de datos

Título: Data Mart de Gestión Económico - Financiera de la Empresa de Proyectos de Arquitectura e Ingeniería (EMPAI).

Panorama de los Sistema de Soporte a la toma de Decisiones

Plantillas Empresariales de ibaan Decision Manager. Guía del usuario de BAAN IVc Inventory 2.0

Área Académica: Sistemas Computacionales. Tema: Introducción a almacén de datos. Profesor: Mtro Felipe de Jesús Núñez Cárdenas

Sistemas de Inteligencia de Negocios

BUSINESS INTELLIGENCE.

INTRODUCCION ANTECEDENTES:

Soluciones Big Data & Analytics Miércoles 4 de junio de 2014 Estadio Santiago Bernabeu

Cuáles son algunos de los padecimientos que enfrentan las empresas hoy día?

GESTIÓN DE ARCHIVOS. Presentado por: Alba Arosemena Alma Vargas Hospicia Mendoza Roselvira Fernández Ahías Arosemena

Operational Data Store (ODS)

Sistemas de Información para la Gestión. UNIDAD 2: RECURSOS DE TI Información y Aplicaciones

conjunto de elementos que se interrelacionan para producir un resultado. Ejem. Sistema endocrino, óseo, sistema digestivo, sistema nervioso central.

Facultad de Ingeniería Escuela de Ingeniería Informática

FACULTAD DE INGENIERÍA. Bases de Datos Avanzadas

Programa Inducción a Inteligencia de Negocios Banco BICE BICE Inversiones

TECNOLOGÍA SOFTWARE PARA EL DESARROLLO DE SISTEMAS DE INFORMACIÓN. Sistemas Informacionales (BI Business Intelligence) Sonia Marrero Cáceres

PROGRAMA DE CURSO. Horas Docencia Horas de Trabajo SCT. Horas de Cátedra Docentes. Personal

Integración de Datos y ETL con Oracle Warehouse Builder

Soluciones OLAP con Microsoft Analysis Services

Administración de Bases de Datos

Ingeniería de Requerimientos. requiere de un Sistema de Software.

Soluciones Big Data & Analytics Martes 10 de junio de 2014 Museu Nacional d'art de Catalunya

Ingeniería en Informática. Data WareHouse

Inteligencia de Negocios Experiencia Banco Central de Nicaragua. Oriel Soto Jefe División Tecnología de Información

RECOMENDACIONES PARA LA IMPLEMENTACIÓN DE LA NUEVA ARQUITECTURA DE SISTEMAS DE INFORMACIÓN

Tema I: Introducción a las bases de datos. Curso Introducción a las bases de datos.

Concepción - Chile Marcela Varas Universidad de Concepción Chile

Datawarehousing : fundamentos

More than 500,000 software licenses, 125,000 plants & facilities, Supported in 181 countries, across every vertical market

Web Warehousing. Robert Cercós Brownell Ingeniería Industrial - U. de Chile

Business Information Warehouse Manual SAP BW Business Information Warehouse

Diseño de un Datawarehouse, para análisis de información en ciencia y tecnología, en el estado de Baja California, México.

FUNDAMENTOS DE DATA WAREHOUSE

CICLO DE VIDA DEL DESARROLLO DE SISTEMAS

Tecnologías de Información y Comunicación II.

Facultad de Ciencias Económicas. Departamento de Sistemas. Asignatura: INTELIGENCIA DE NEGOCIOS. Plan 1997

ASIGNATURA: Tecnologías de Información y Comunicación II

BUSINESS INTELLIGENCE

MS_10777 Implementing a Data Warehouse with Microsoft SQL Server 2012

PLATAFORMA TECNOLOGICA PARA LA TOMA DE DECISIONES INTEGRADA EN LA PYME.

Transcripción:

CI2355 Almacenes de datos y OLAP

Arquitectura 2012/03/12 CI2355 - Almacenes de datos y OLAP 2

Propiedades esenciales Separación El procesamiento transaccional y el analítico deben mantenerse lo más separados posible Escalabilidad Las arquitecturas de hardware y software deben ser fáciles de actualizar cuando aumentan el volumen de datos, que tienen que ser administrados y procesados, o aumentan los requerimientos de los usuarios, requerimientos que deben ser atendidos 2012/03/12 CI2355 - Almacenes de datos y OLAP 3

Propiedades esenciales (2) Extensibilidad Seguridad La arquitectura debe ser capaz de alojar nuevas aplicaciones y tecnologías sin tener que rediseñar todo el sistema Monitorear accesos es esencial porque lo que se guarda en los almacenes de datos es estratégico Administrabilidad La gestión del almacén de datos no debe ser particularmente difícil 2012/03/12 CI2355 - Almacenes de datos y OLAP 4

Clasificación de las arquitecturas Orientada a la estructura Una capa Dos capas Tres capas Empleo de las capas Orientada a la empresa Orientada a departamentos 2012/03/12 CI2355 - Almacenes de datos y OLAP 5

Arquitectura de una capa 2012/03/12 CI2355 - Almacenes de datos y OLAP 6

Arquitectura de dos capas 2012/03/12 CI2355 - Almacenes de datos y OLAP 7

Ventajas Información de calidad siempre disponible en el AD, aunque tengamos el acceso a las fuentes temporalmente denegado Las consultas al AD no afectan el rendimiento de la BD AD están lógicamente estructurados de acuerdo con el modelo multidimensional Se evitan las diferencias de tiempo y granularidad entre sistemas OLTP y sistemas OLAP AD pueden diseñarse para optimizar para aplicaciones de análisis y reportes 2012/03/12 CI2355 - Almacenes de datos y OLAP 8

Arquitectura de tres capas 2012/03/12 CI2355 - Almacenes de datos y OLAP 9

Data marts independientes 2012/03/12 CI2355 - Almacenes de datos y OLAP 10

Hub-and-spoke 2012/03/12 CI2355 - Almacenes de datos y OLAP 11

Arquitectura federada 2012/03/12 CI2355 - Almacenes de datos y OLAP 12

Capa de preparación de datos Preparación de datos (data staging) Extracción o captura Limpieza (cleansing, cleaning o scrubbing) Rectificación y homogenización de datos Transformación Normalización de formatos Carga (loading) ETL 2012/03/12 CI2355 - Almacenes de datos y OLAP 13

ETL 2012/03/12 CI2355 - Almacenes de datos y OLAP 14

ETL (cont.) 2012/03/12 CI2355 - Almacenes de datos y OLAP 15

Extracción Obtener datos desde las fuentes Estática Incremental Calidad de los datos a ser extraídos Exactitud de las restricciones Formatos adecuados Claridad del esquema 2012/03/12 CI2355 - Almacenes de datos y OLAP 16

Cleansing Errores e inconsistencias Datos duplicados Misma persona, diferente ID Valores inconsistentes asociados lógicamente Dirección y código postal Datos faltantes Dirección de trabajo Uso inesperado de los campos Número telefónico en lugar de número de ID 2012/03/12 CI2355 - Almacenes de datos y OLAP 17

Cleansing (2) Errores e inconsistencias (cont.) Valores erróneos o imposibles 30 de febrero, 2012 Valores inconsistentes con una única entidad porque se usan diferentes prácticas Estados Unidos EE.UU. U.S.A. Valores inconsistentes para una entidad individual por errores de transcripción Costarricense costarricence 2012/03/12 CI2355 - Almacenes de datos y OLAP 18

Transformación Formato operacional de las fuentes Formato del almacén de datos Texto libre podría esconder datos valiosos Pérez e Hijos, S.R.L Diferentes formatos para datos individuales 2012-03-12 Año: 2012, mes: 3, día: 12 2012/03/12 CI2355 - Almacenes de datos y OLAP 19

Tareas de transformación Conversión y normalización Formatos de almacenaje y unidades de medida para uniformar los datos Pareo (matching) Selección Campos equivalentes en diferentes fuentes Reducir el número de campos y registros en la fuente 2012/03/12 CI2355 - Almacenes de datos y OLAP 20

Ejemplo 2012/03/12 CI2355 - Almacenes de datos y OLAP 21

Carga Refrescar Actualizar Datos son reescritos completamente Datos anteriores son reemplazados Normalmente utilizada en combinación con la extracción estática para poblar el AD Sólo se agregan al AD los datos que cambiaron en las fuentes Normalmente, no se borran ni modifican datos Utilizada en combinación con la extracción incremental 2012/03/12 CI2355 - Almacenes de datos y OLAP 22

Referencias Matteo Golfarelli, Stefano Rizzi. Data Warehouse Design: Modern Principles and Methodologies. McGraw-Hill, 2009 2012/03/12 CI2355 - Almacenes de datos y OLAP 23