Ingeniería en Informática. Data WareHouse

Documentos relacionados
Inteligencia de Negocios (Introducción)

Decision Support System (DDS)

Prueba de autoevaluación 2

BASE DE DATOS. Qué es una base de datos?

8 horas semanales 32 horas semestral. Suficientable

Resumen Inteligencia de Negocios

Base de Datos. Docente: Ing. Francisco Rodríguez. Universidad Nacional de Trujillo Ingeniería Industrial BASE DATOS. Resultados.

Objetivos y Temario CURSO SQL SERVER 2012

Procesamiento Analítico con Minería de Datos

EN QUÉ CONSISTE UN SISTEMA DE GESTIÓN DE LA INNOVACIÓN?

Definimos un Sistema Gestor de Bases de Datos o SGBD, también llamado DBMS (Data Base Management System) como una colección de datos relacionados entr

Conceptos de Inteligencia Empresarial

Soporte a la toma de decisiones

EVALUACIÓN INTERNA LA INVESTIGACIÓN HISTÓRICA

BASE DE DATOS_I Qué son las bases de datos?

Modelo Cliente / Servidor. Gerardo Grinman 5D

Informática Básica. Definiciones. Conceptos generales e historia

Su empresa Está preparada para un ERP?

1.1. Resumen Introducción Objetivos del resumen automático

Introducción a la Geometría Computacional

OLAP. (OnLine Analytical Processing) I.S.C. Zoraya Catalina Flores Juárez Bases de Datos Otoño, 2012.

INTRODUCCION A LAS BASES DE DATOS. Tecnología de la Información

Sesión 9.Compras y suministro

4.1 Dispositivos y manejadores de dispositivos: device drivers

Instrumentos de Control de Gestión en el Presupuesto. Indicadores de Desempeño.

ADMINISTRACION DE OPERACIONES

Análisis y Diseño de Sistemas Departamento de Sistemas - Facultad de Ingeniería

Auditoría Financiera.

BASES DE DATOS DOCUMENTOS O INSTRUMENTOS? DEBEN SOMETERSE A VALORACIÓN?

A continuación mostramos un ejemplo de una portada y los espacios necesarios

COMO INICIARSE EN LOS NEGOCIOS ELECTRONICOS

El Ciclo de Vida del Software

REGLAS DE CODD DEL MODELO RELACIONAL

La dimensión de la empresa La localización de la empresa La estructura organizativa de la empresa: los recursos humanos

METADATOS Y CATALOGOS DE DATOS

BASES DE DATOS TEMA 2 MODELOS DE DATOS

Introducción al Data Warehouse La Factoría de la Información Corporativa. Àngels Rius Gavidia

Estudio de Mercado. La Sucursal Bancaria del Futuro

LINEAMIENTOS DE CONTENIDOS

Arquitectura y Diseño de Software

Excel 2007 Completo. Duración: Objetivos: Contenido: 75 horas

Bloque 1. La sociedad de la información y el ordenador

Terminología Equivalente

Lenguajes de Cuarta Generación (4GL)

Explican las características de el modelo entidad relación. Utilizar la simbología del modelo entidad relación. Resolver problemas utilizando el

Sistemas Operativos. Clase 2: Administración de procesos.

:Universidad Salesiana de Bolivia. :Ingeniería de Sistemas PLAN DE DISCIPLINA GESTIÓN II

METODOLOGÍA COMMONKADS.

MS_20467 Designing Business Intelligence Solutions with Microsoft SQL Server 2014

Aplicación de los códigos 2D para la lectura y exploración de metadatos y mapas con dispositivos móviles.

Contabilidad de Costos. Sesión 4: Control y Evaluación de los Elementos del Costo

Estructuras de Datos

CICLO FORMATIVO DE GRADO SUPERIOR TRANSPORTE Y LOGÍSTICA. (R.D.: 1572/2011, de 4 de noviembre) PROGRAMACIÓN DIDÁCTICA DEL MÓDULO PROFESIONAL:

MASTER UNIVERSITARIO EN DIRECCIÓN DE ORGANIZACIONES E INSTALACIONES DE LA ACTIVIDAD FÍSICA Y DEL DEPORTE

MICROSOFT ACCESS 2007

Normas para escribir un artículo científico o de investigación

Selección y administración de un canal

UT 5 CONTROL DE INVENTARIOS

BASES DE DATOS Fuente:

INFORME TÉCNICO SOBRE ESTUDIO DE SATISFACCIÓN UNIVERSIDAD DE LAS PALMAS DE GRAN CANARIA INFORME GLOBAL ESTUDIANTES DE PRIMER INGRESO.

Monografías. Matemáticas. Directrices monografía de matemáticas 2 Estructura de la monografía 4 Criterios de evaluación 6

Unidad de Promoción y Desarrollo Guadiana OBJETIVO GENERAL

Conceptos de bases de datos para Mercadeo

Configuración de traducción de dirección de red: Introducción

Tema 3. Análisis de riesgo. Tema 3. Análisis de riesgo

Glosario Evolución (Filenet) Versión 3.0

Índice Consigna.3 Definición de Organigrama y modelos.4 Organigramas empresariales con area de RR.PP...12 Bibliografía..14

El Modelo Relacional de Bases de Datos

La solución de análisis predictivo de StatSoft para la banca se integra en repositorios y bases de datos existentes.

Puertas lógicas NAND, NOR y OR exclusiva Práctica # 10

ELABORADO POR: REVISADO POR:

TRABAJO DE GRADO DE MAESTRÍA

INSTITUTO DE NUTRICIÓN DE CENTRO AMERICA Y PANAMA INCAP CONSIDERACIONES TECNICAS PARA ANÁLISIS DE FUENTES INFORMACIÓN

SISTEMA AMHS CENTROAMERICANO DESARROLLADO POR COCESNA. (Nota presentada por COCESNA) Resumen

AUDITORIAS DEL SISTEMA DE GESTION AMBIENTAL

3.6.6 Requerimientos del Sistema

CAPÍTULO II LA CADENA DE SUMINISTRO

APROVECHAR LA CADENA DE VALOR VIRTUAL.

Diseño de Bases de Datos (TEMAS 1 Y 2)

Unidad 1 : Sistemas de Información. Ing. Carlos OROZCO

Transcripción:

Ingeniería en Informática Data WareHouse NOMBRE: Héctor Durán Katherine Zumelzu CARRERA: Ingeniería en Informática ASIGNATURA: TIC II PROFESOR: Rodrigo Tapia Santis FECHA: 14 de Septiembre 2015

Índice Introducción:... 3 Data WareHouse:... 4 Objetivo:... 4 Qué es un Data WareHouse?... 4 Importancia:... 5 Ventajas Data WareHouse:... 5 Desventajas Data WareHouse:... 5 Los procesos básicos del Data WareHouse (ETL):... 6 Los elementos básicos de un Data WareHouse:... 6 Arquitectura Data WareHouse:... 7 Estructura data WareHouse:... 8 Empresas que utilizan Data WareHouse:... 9 Conclusión:... 10 Bibliografía:... 11 2

Introducción: En la actualidad, el dinámico mundo de los negocios plantea la necesidad de disponer de un acceso rápido y sencillo a la información para la toma de decisiones. El Data WareHouse permite a los gerentes tomas decisiones siguiendo un enfoque racional, basados en información confiable y oportuna. Consiste básicamente en la transformación de los datos operaciones en información útil. 3

Data WareHouse: El Data WareHouse es una colección de datos orientados al tema, integrados, no volátiles e historiados, organizados para el apoyo de un proceso de ayuda a la decisión. Objetivo: El objetivo del DW se expresa en términos puramente de negocio como mantener la fidelidad de la clientela. Qué es un Data WareHouse? Es un repositorio de datos de muy fácil acceso, alimentado de numerosas fuentes, transformadas en grupos de información sobre temas específicos de negocios, para permitir nuevas consultas, análisis y decisiones. Se caracteriza: Integrado: los datos almacenados en el Data WareHouse deben integrarse en una estructura consistente, por lo que las inconsistencias existentes entre los diversos sistemas operacionales deben ser eliminadas. La información suele estructurarse también en distintos niveles de detalle para adecuarse a las distintas necesidades de los usuarios. Temático: sólo los datos necesarios para el proceso de generación del conocimiento del negocio se integran desde el entorno operacional. Los datos se organizan por temas para facilitar su acceso y entendimiento por parte de los usuarios finales. Por ejemplo, todos los datos sobre clientes pueden ser consolidados en una única tabla del Data WareHouse. De esta forma, las peticiones de información sobre clientes serán más fáciles de responder dado que toda la información reside en el mismo lugar. Histórico: el tiempo es parte implícita de la información contenida en un Data WareHouse. En los sistemas operacionales, los datos siempre reflejan el estado de la actividad del negocio en el momento presente. Por el contrario, la información almacenada en el Data WareHouse sirve, entre otras cosas, para realizar análisis de tendencias. Por lo tanto, el Data WareHouse se carga con los distintos valores que toma una variable en el tiempo para permitir comparaciones. 4

No volátil: el almacén de información de un Data WareHouse existe para ser leído, y no modificado. La información es por tanto permanente, significando la actualización del Data WareHouse la incorporación de los últimos valores que tomaron las distintas variables contenidas en él sin ningún tipo de acción sobre lo que ya existía. Importancia: Un sistema de Data WareHouse permite transformar datos o información bruta en información con sentido y extremadamente útil. Uno de los valores más importantes de una organización es la información. Estos valores normalmente son guardados por la empresa de dos formas: Los sistemas operacionales de registros (de donde el Data WareHouse obtiene los datos) y nuestro almacén de datos. Ventajas Data WareHouse: a) Datos de toda la compañía, organizados para facilitar las consultas más analíticas que transaccionales. b) Los procesos de transformación han sido aplicados a los datos para permitir un tiempo de respuesta mínimo a las consultas. c) Modelo de datos multidimensional para hacer más fácil la navegación y explotación de datos d) La administración de la seguridad está centralizada para garantizar la necesidad de información dependiendo del perfil de los usuarios. Desventajas Data WareHouse: a) No es muy útil para la toma de decisiones en tiempo real debido al largo tiempo de procesamiento que puede requerir. b) Requiere de continua limpieza, transformación e integración de datos. c) En un proceso de implantación puede encontrarse dificultades ante los diferentes objetivos que pretende una organización. d) Una vez implantado puede ser complicado añadir nuevas fuentes de datos. 5

Los procesos básicos del Data WareHouse (ETL): a) Extracción: este es el primer paso de obtener la información hacia el ambiente del Data WareHouse. b) Transformación: una vez que la información es extraída hacia el área de tráfico de datos, hay posibles paso de transformación como; limpieza de la información, tirar la basura que no nos sirve, seleccionar únicamente los campos necesarios para el Data WareHouse, combinar fuentes de datos, haciéndolas coincidir por los valores de las llaves, creando nuevas llaves para cada registro de una dimensión. c) Carga: al final del proceso de transformación, los datos están en forma para ser cargados. Los elementos básicos de un Data WareHouse: a) Sistema fuente: sistemas operacionales de registros donde sus funciones son capturar las transacciones del negocio. A los sistemas fuentes también se le conoce como Legacy System. b) Área de tráfico de datos: Es un área de almacenamiento y grupo de procesos, que limpian transforman, combinan, remover los duplicados, guardan, archivan y preparan los datos fuente para ser usados en el Data WareHouse. c) Servidor de presentación: La máquina física en donde los datos del Data WareHouse son organizados y almacenados para querys directos por los usuarios finales, reportes y otras aplicaciones. d) Modelo dimensional: Una disciplina específica para el modelado de datos que es una alternativa para los modelos de entidad relación. e) OLAP: Actividad general de búsquedas para presentación de texto y números del Data WareHouse, también un estilo dimensional especifico de búsquedas y presentación de información. f) ROLAP: Un grupo de interfaces de usuarios y aplicaciones que le dan a la base de datos relacional un estilo dimensional. g) MOLAP: Un grupo de interfaces de usuarios, aplicaciones y propietarios de tecnología de bases de datos que tienen un fuerte estilo dimensional. h) Aplicaciones para usuarios finales: Colección de herramientas que hacen los querys, analizan y presentan la información objetivo para el soporte de las necesidades del negocio. 6

Arquitectura Data WareHouse: Base de datos operacional / Nivel de base de datos externo Nivel de acceso a la información Nivel de acceso a los datos Nivel de directorio de datos (Metadata) Nivel de gestión de proceso Nivel de mensaje de la aplicación Nivel de data WareHouse Nivel de organización de datos 7

Estructura data WareHouse: a) Datos antiguos: La data antigua es aquella que se almacena sobre alguna forma de almacenamiento masivo. No es frecuentemente accesada y se almacena a un nivel de detalle, consistente con los datos detallados actuales. b) Datos Actuales: Refleja las ocurrencias más recientes, las cuales son de gran interés c) Datos ligeramente resumidos: La data ligeramente resumida es aquella que proviene desde un bajo nivel de detalle encontrado al nivel de detalle actual. Este nivel de la data WareHouse casi siempre se almacena en disco. Los puntos en los que se basa el diseñador para construirlo son: d) Datos completamente resumidos: El siguiente nivel de datos encontrado en la data WareHouse es el de los datos completamente resumidos. Estos datos son compactos y fácilmente accesibles. 8

Empresas que utilizan Data WareHouse: Comercio Minorista: Kmart WH Smith Books (Gran Bretaña) Supermercados Casino (Francia) Manufactura de Bienes de Consumo Masivo: Coca Cola Nike Hallmark Maybelline Walt Disney Transporte de Cargas y Pasajeros: American Airlines Pulman Bus Union Pacific Telecomunicaciones: Vtr Cisco Movistar Entel Claro 9

Conclusión: Es un conjunto de procesos y acciones, orientados a un tema, integrados y no volátiles que sirve para la toma de decisiones a nivel de la gerencia. EL Data WareHouse a pesar de su alto costo, sigue funcionando y brindando credibilidad a la información que provee a los usuarios. 10

Bibliografía: Data warehouse http://www.dataprix.com/que-es-un-datawarehouse Data warehouse http://www.sinnexus.com/business_intelligence/datawarehouse.aspx Introducción a DataWarehouse e Inteligencia de Negocios http://es.slideshare.net/sebasrod/introduccin-al-datawarehouse-e-inteligencia-denegocios 11