Sistemas de Información Gerencial

Documentos relacionados
Sistemas de Información Gerencial

Unidad 10. Almacenes de Datos

Modulo II Data Warehouse y OLAP

Inteligencia de Negocios. Modelado Multidimensional Lógico

Bases de Datos Masivas

tanto, no pueden navegar por dicho modelo en busca de información.

Arquitectura de un data warehouse Funcionamiento detallado de un data warehouse

BASES DE DATOS AVANZADAS. Facultad de Estadística e Informática

Taller #2. Carlos Reveco Cinthya Vergara

FUNDAMENTOS DE BASES DE DATOS TEMA 6

Definición. Data Warehousing: almacenamiento, transformación y distribución de datos útiles para los responsables de tomar decisiones 9/29/2006 4

UNIVERSIDAD NACIONAL DEL CALLAO

Administración de las Bases de Datos

Sistemas de ayuda a la toma de decisión

Las empresas han comenzado a aprovechar los cada vez más numerosos datos en línea para tomar mejores decisiones sobre sus actividades.

2.3 Fundamentos de Inteligencia de Negocios JACOBO ADAN VICTOR MANUEL

Resumen Inteligencia de Negocios

Analisis Multidimensional

Procesamiento analítico en línea (OLAP) B.1 Qué es el procesamiento analítico en línea?

PROGRAMA ACADÉMICO DE TECNOLOGÍAS DE LA INFORMACIÓN. Actividad Cuestionario de BI. como requerimiento parcial para acreditar la asignatura de

CI2355 Almacenes de datos y OLAP

Teoría de Base de Datos Ing. José J. Reyes. Definiciones

Procesamiento Analítico en Línea IBARRA MARIA DE LOS ANGELES

Prof. Dr. Jaime Solano Soto C102-1

Representación multidimensional de los datos

Business Intelligence para la toma de decisiones gerenciales

Introducción al Data Warehousing. Diseño Conceptual.

Diseño de un Datamart orientado al proceso de ventas usando la herramienta de Inteligencia de Negocios SQL Server 2014

Sistemas de Soporte a las Decisiones

UNIVERSIDAD NACIONAL TECNOLÓGICA DE LIMA SUR CARRERA PROFESIONAL DE INGENIERÍA DE SISTEMAS

Pablo A. Sacco UNIVERSIDAD TECNOLÓGICA NACIONAL FACULTAD REGIONAL CÓRDOBA INGENIERÍA EN SISTEMAS DE INFORMACIÓN

La herramienta OLAP genera la correspondiente consulta y la envía al gestor de consultas del sistema (p.ej. mediante una sentencia SELECT).

CI2355 Almacenes de datos y OLAP

Capítulo 3. Data Warehouse

DIPLOMADO EN MICROSOFT SQL SERVER 2008

Esquema de la presentación

MSc. Francisco García

PROGRAMA ACADÉMICO DE TECNOLOGÍAS DE LA INFORMACIÓN. Actividad Cuestionario Business Intelligence

Conceptos de Inteligencia Empresarial

EXAMEN EXTRAORDINARIO Informática y Computación IV

Inteligencia de Negocios

BASES DE DATOS RELACIONALES

Inteligencia de Negocio

Bases de datos Masivas Introducción a Data Warehouse Proceso de ETL. Banchero, Santiago

Diseño y Construcción de Data Warehouse. Instituto de Computación - Facultad de Ingeniería Edición 2017

El Metodo Kimball Integración de Datos

Aux 2. Introducción a la Minería de Datos

UNIVERSIDAD TÉCNICA DEL NORTE

Prueba de autoevaluación 2

Dirección General de Estudios de Postgrado Área de Ingeniería Programa: Maestría Sistemas de Información

FUNDAMENTOS DE INTELIGENCIA DE NEGOCIOS

Diseño y Construcción de Data Warehouse. Instituto de Computación - Facultad de Ingeniería Mayo Diseño Lógico

Sistemas de Datos. Data warehouse y Business Intelligence

BASES DE DATOS TEMA 2 MODELOS DE DATOS

Grandes de Bases de Datos. Almacenes de Datos (DW) e Inteligencia de negocios IN (BI)

MODALIDAD ACADÉMICA. INGENIERÍA EN SISTEMAS DE INFORMACIÓN Ciclo Lectivo 2016 Vigencia del programa Desde el ciclo lectivo 2014 Plan 2008 Nivel

Temario. XI Encuentro Danysoft en Microsoft Crear modelos analíticos con herramientas Microsoft BI. XI Encuentro Danysoft Sala SQL

UNIVERSIDAD NACIONAL DE LA AMAZONIA PERUANA FACULTAD DE INGENIERIA DE SISTEMAS E INFORMATICA DATA WAREHOUSING

Almacenamiento y gestión de datos

TEMA 36: Herramientas de análisis de la información. OLTP y OLAP. Sistemas EIS y DSS. Data WareHouse. DataMining.

DESARROLLO APLICACIONES BUSINESS INTELLIGENCE CON MS SQL SERVER Big Data

Sistemas de Información para la Gestión. Unidad 3 Aplicaciones de Sistemas

CC Inteligencia de Negocios

GUIA DE CURSO: ELABORADO POR: ING. LUIS TAMAYO PARA: FECHA DE PRESENTACIÓN: INTELIGENCIA DE NEGOCIOS CON PENTAHO- Versión 1.0.

Bodegas de Datos y OLAP. Introducción a la Bodegas de Datos

Datawarehouse. Ing. Adan Jaimes Jaimes. Datawarehouse

Inteligencia de Negocios

Fundamentos de la Inteligencia de Negocios

OLAP EXPLOTACIÓN DE UN DW: HERRAMIENTAS OLAP. SISTEMAS ROLAP Y MOLAP. SQL AMPLIADO. OLAP 1

Inteligencia de Negocios

UMET : UNIVERSIDAD METROPOLITANA

Qué es SGBD? Mencionar 4 tipos de SGBD. SGBD de red. Román Gutiérrez Sosa. SGBD jerárquicos. Modelo de datos relacionales.

Diseño de Bases de Datos Relacionales. Febrero de 2013

MODALIDAD ACADÉMICA. Al menos 1 materia(s) del conjunto PAVII-DLC

Extensión del Data Warehouse de CIMEX basado en el Modelo Tabular

Sistemas de Información Base de Datos

UNIDAD 1: CONCEPTOS BA SICOS DE BASE DE DATOS

RECURSOS DE TI Aplicaciones - Bibliografía USO DE BD PARA MEJORAR EL DESEMPEÑO EMPRESARIAL

DE LAS BD A LOS ALMACENES DE DATOS (DW) FINALIDADES Y EVOLUCIÓN DE LOS SISTEMAS DE INFORMACIÓN FINALIDADES Y EVOLUCIÓN DE LOS SISTEMAS DE INFORMACIÓN

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE ESTUDIOS SUPERIORES CUAUTITLÁN LICENCIATURA EN INFORMÁTICA

SYLLABUS de la Asignatura Inteligencia de Negocios

Fundamentos de la Inteligencia de Negocios

MEDICIÓN DE LA GESTIÓN ESTRATÉGICA BASADA EN LA UNIÓN DEL CUADRO DE MANDO INTEGRAL Y EL DATA WAREHOUSE

Soluciones OLAP con Microsoft Analysis Services

EXPLOTACIÓN DE UN DW: HERRAMIENTAS OLAP OLAP EXPLOTACIÓN DE UN DW: HERRAMIENTAS OLAP EXPLOTACIÓN DE UN DW: HERRAMIENTAS OLAP

Estos documentos estarán dirigidos a todas las personas que pertenezcan a equipos de implementación de Oracle BI, incluyendo a:

SISTEMAS OPERATIVOS. TRABAJO DE ADSCRIPCIÓN N 2005 GERZEL, Stella Maris 17/11/2005 INTRODUCCIÓN AL TIVOLI 1

INTRODUCCIÓN MDX MDX. Jortilles.com

Registrar información o datos de una persona REQUERIMIENTO QUE LO UTILIZA O ESPECIALIZA:

APLICACION DE LA MINERIA DE DATOS SOBRE BASES DE DATOS TRANSACCIONALES. Alvaro Troche Clavijo

TABLEAU - Visualización y Analítica Avanzada

Lección 1. Estructura de las Tablas Bases de Datos para la creación de informes de Tabla Dinámica.

Tema 5: Conceptos de Diseño en Archivos y Bases de Datos. Ing. Elizabeth Guerrero

Fundamentos de la Inteligencia de Negocios

GUÍA DOCENTE SISTEMAS DE INFORMACIÓN Julio 2017

Tema I: Bases de Datos y Sistema Gestor de Bases de Datos

PARTE II: Almacenes de Datos

Modelamiento Hechos/Dimensiones.

INTELIGENCIA DE NEGOCIO CON MS- EXCEL POWERPIVOT Y POWERVIEW

Transcripción:

Sistemas de Información Gerencial Tema 6: Inteligencia de Negocios: Modelo Dimensional Ing. Francisco Rodríguez Novoa 1

INDICE OLTP. OLAP Modelo Estrella. Modelo Copa de Nieve Modelo Dimensional 2

Mapa de Inteligencia de Negocios Inteligencia de Negocios Metodología Kimball Planeamiento del Proyecto Modelo del Negocio Modelado Dimensional Modelado Físico ETL Minería de Datos Reportes

MODELOS RELACIONALES Y DIMENSIONALES

Dos técnicas Modelo E-R Entidades Atributos Relaciones Modelo dimensional Hechos Dimensiones Medidas

OLTP (On Line Transactional Process) Son sistemas de información operacionales que tienen transacciones en línea y de esa manera se van añadiendo datos. Gran detalle de cada operación.

Lógica El Diseño Transaccional es: Orientado a aplicaciones con movimientos constantes. Datos normalizados. Se busca ahorrar espacio de almacenamiento. Datos volátiles No existe sumarización de datos. Grandes niveles de detalle.

OLAP (Online Analytical Process) Tecnología que permite la explotación de datos en diferentes niveles organizacionales y periodos de tiempo

Lógica El Data Warehouse esta: Orientado a áreas de la organización Integrado Los datos no son volátiles Diversos niveles de detalle con sumarizaciónes. Se disminuye la cantidad de ligas con modelos tipo estrella o copo de nieve.

Conceptos Generales Fundamentos. Transacciones Registrar y Controlar (OLTP) Analizar y Evaluar (OLAP) Ventas Inventarios Contabilidad Recursos Humanos Etc- Velocidad de Transacción Integridad de Información Evitar Redundancias 3ª Forma Normal On-Line Transaction Processing Velocidad de Consultas Apoyo Toma de Decisiones Desnormalizado On-Line Analytical Processing 10

Como operan las B.D. Relacionales Los datos se almacenan en tablas Variable Meses Cantidad Productos Sales Expenses Cost of goods Sales Expenses Cost of goods Sales Expenses Cost of goods Sales Sales Expenses Cost of goods Sales Expenses Cost of goods January January January February February February March March March Qtr1 April April April May May May 25000 15000 5000 27000 20000 6000 2700 8000 19000 54700 23000 6100 1800 7600 1200 2000 Large Large Large Large Large Large Large Large Large Large Medium Medium Medium Medium Medium Medium

Lógica Variable Months Amount Product Sales Expenses Cost of goods Sales Expenses Cost of goods Sales Expenses Cost of goods Sales Sales January January January February February February March March March Qtr1 April 25000 15000 5000 27000 20000 6000 2700 8000 19000 54700 23000 6100 Large Large Large Large Large Large Large Large Large Large Medium de esta estructura a esta se necesita Expenses April Cost of goods Variable April January 1800 February MediumMarch April May June Sales Expenses Cost of goods May May May 7600 1200 2000 Medium Medium Medium Sales 25000 27000 24000 28000 30000 29000 Expenses 15000 20000 15000 17000 19000 14000 Cost of goods 5000 6000 5000 7000 7000 6000

OLAP Vista Multidimensional Poder observar los datos desde distintas perspectivas. LA SF West Sales Margin Denver Camera TV VCR Audio Camera TV VCR Audio Accounts by Product February March Actual Budget Actual Budget position only TV VCR Profit Total Exp Margin Cogs Jan Feb Mar Qtr 1 Jan Feb Mar Qtr 1 Products by Time East West Actual Budget Actual Budget position only TV VCR Apr Mar Feb Jan East West South Total East West South Total Products by Region Actual Budget Sales Margin Sales Margin East Apr Mar Feb Jan West Actual Budget Forecast Variance Actual Budget Forecast Variance Regions by Scenario Sales Margin TV VCR TV VCR

Conceptos Generales Características de un DataWarehouse Orientado a Temas Integrado Variantes en el Tiempo No Volátil Los datos se organizan y estructuran de acuerdo a las áreas temáticas que son de interés para los directivos de la empresa y no en función de procesos operacionales específicos. Todos los datos relativos a una misma entidad quedarán en una tabla. Debido a que la información procede desde distintos sistemas, es tarea del DW integrar las diversas fuentes y normalizar los datos. Un DW se organiza como una sucesión de fotografías de la organización o empresa, cada una asociada a un periodo o punto específico del tiempo, lo que permite realizar análisis en función del tiempo, con la finalidad de realizar pronósticos y análisis de tendencias. No se realizan actualización o eliminaciones de los datos, los datos se insertan como nuevos registros y por tanto no sobrescriben los existentes. 14

Conceptos Generales Componentes del Cubo Tabla de Hechos Almacena los indicadores del negocio (datos numéricos), tanto básicos como elementos calculados. Tabla de Dimensiones Almacena los datos descriptivos, por lo general son tablas con un porcentaje muy bajo de filas en relación a las tablas de Hechos, pero pueden contener muchas más columnas. Una correcta y completa definición de campos en la tabla de dimensiones puede ayudar a realizar análisis robusto sobre los datos.

Topología Conceptos Generales Estrella Las dimensiones se relacionan directamente con la tabla de hechos. Por lo general esta estrategia es utilizada cuando hay grandes volúmenes de información y/o cuando existe un proceso robusto de administración de Información (por ejemplo EIAD). Copo de Nieve Las dimensiones se pueden relacionar con las tablas de hechos, o con otras dimensiones. Esta estrategia es mejor para la administración directa en el modelo de DW. 16

Eficiencia Modelo Estrella Soportado por múltiples RDBMS Análisis de datos de menor complejidad, debido a la denormalización

Modelo Copo de Nieve Mayor normalización, es decir, los niveles de las jerarquías se normalizan. Mayor flexibilidad Mayor dificultad de mantenimiento Joins más costosos Menos registros en las dimensiones.

Modelado Dimensional Es una adaptación del modelo relacional. Consiste de tablas de hechos que se caracterizan usando dimensiones y medidas. La información sobre un hecho (actividad) se representa mediante indicadores (medidas o atributos de hecho). La información de cada dimensión se representa por un conjunto de atributos (atributos de dimensión). Una dimensión es el contexto de un hecho, tienden a ser discretas y jerárquicas. Un indicador es una cantidad que describe el hecho, debe ser agregables.

Conceptos básicos 1. Hecho. Evento, actividad, item transacción del negocio. 2. Medida. Atributo o medida de hechos, métricas del negocio 3. Dimensión. Característica de un hecho. 4. Jerarquía. Relaciones padre-hijo dentro de una dimensión 5. Tabla de hechos: Almacena eventos y las métricas. 6. Tabla de dimensión. Almacenan las dimensiones.

Hechos Representan un evento o actividad específica, tiene dimensiones y medidas. Representan un item de negocio, una transacción o un evento que tiene significancia para el negocio. Corresponden a una colección de items de datos y datos de contexto. Son aquellos datos que residen en una tabla de hechos y que son utilizados para crear indicadores, a través de sumarizaciones preestablecidas. Un hecho debe estar relacionado al menos con una dimensión: El tiempo.

Medidas Métricas - Hechos Es un atributo numérico de un hecho que representa la performance o comportamiento del negocio relativo a la dimensión Ejemplos: Ventas en $$ Cantidad de productos Total de transacciones Cantidad de pacientes admitidos Llamadas efectuadas. ImporteTotal = precioproducto * cantidadvendida Rentabilidad = utilidad / PN CantidadVentas = cantidad PromedioGeneral = AVG(notasFinales)

Hechos o medidas Representan los valores que son analizados. Características de las medidas: Deben ser numéricas. Porque estos valores son las bases de las cuales el usuario puede realizar cálculos. Cruzan todas las dimensiones en todos los niveles. Si la medida es no numérica debemos codificarla a un valor numérico y cuando tengamos que exponerla decodificarla para mostrarla con el valor original.

Hechos o medidas Las medidas pueden clasificarse en: Naturales. Son aquellas que se obtiene por agregación de los datos originales. Suma: suma los valores de las columnas Cuenta: conteo de los valores Mínima: valor mínimo Máxima: valor máximo Cuenta de Distintos: valores diferentes Calculadas Si se derivan de una medida natural. Cálculos Matemáticos Expresiones condicionales Alertas

Dimensiones Es una característica de un hecho que permite su análisis posterior, en el proceso de toma de decisiones. Determina el contexto del hecho (quién participó, cuándo y donde pasó y su tipo). Es una entidad de negocios respecto de la cual se deben calcular las métricas (clientes, productos, tiempo) Tienden a ser discretas y jerárquicas <país, región, departamento, provincia, distrito>. Es una colección de miembros o unidades o individuos del mismo tipo que permite categorizar un hecho.

Dimensiones 3 Se utilizan como parámetros para los análisis OLAP Las dimensiones habituales son: Dimensión Tiempo Geografía Cliente Vendedor Miembro Meses, Trimestre, Años País, Región, Ciudad Id Cliente Id Vendedor

Ejemplo

Ejemplo

The Time Dimension Time is critical to the data warehouse. A consistent representation of time is required for extensibility. Sales fact Time dimension How and where should it be stored?

Granularidad La granularidad es el nivel de detalle en que se almacena la información. Por ejemplo: Datos de ventas o compras de una empresa, pueden registrarse día a día Datos pertinentes a pagos de sueldos o cuotas de socios, podrán almacenarse a nivel de mes. A mayor nivel de detalle, mayor posibilidad analítica, ya que los mismos podrán ser resumidos o sumarizados. Los datos con granularidad fina (nivel de detalle) podrán ser resumidos hasta obtener una granularidad media o gruesa. No sucede lo mismo en sentido contrario.

Tablas de Hechos Las tablas de hechos contienen las dimensiones y las medidas de los hechos. Los hechos o medidas son los valores de datos que se analizan (son numéricos). La tabla de hechos tiene una compuesta por las claves primarias de las tablas de dimensiones relacionadas a este. Clave primaria Dimensiones Medidas o hechos

Tabla de dimensiones 6 Definen la organización lógica de los datos. Tiene una PK (única) y columnas de referencia: Clave principal (PK) o identificador único. Clave foráneas. Datos de referencia primarios (identifican la dimensión) Datos de referencia secundarios (complementan la descripción). No siempre la PK del OLTP, corresponde con la PK de la tabla de dimensión relacionada.

Ejercicio Etapas en la construcción de un modelo dimensional: 0 Requerimientos del usuario 2 Construcción de las Dimensiones Armado de la Tabla de Hechos 3 4 Definición de las Medidas 1 Decidir la granularidad

Requerimientos del usuario Dimensiones Medidas Tiempo Sucursal Vendedor Cliente Producto Ventas_Importe X X X X X Ventas_Costo X X X X X Ventas_Unidades X X X X X Ventas_ImporteTotal X X X X X Ventas_Ganancia X X X X X Ventas_Promedio X X X X X

Decidir la granularidad La granularidad: Es el nivel de detalle al que se desea almacenar información sobre la actividad a modelar. Define el nivel atómico de datos en el almacén de datos. Determina el significado de las tuplas de la tabla de hechos. Determina las dimensiones básicas del esquema. Por ejemplo en la dimensión Sucursal:

Decidir la granularidad Ejemplo de la dimensión fecha. Se desea los datos por: Información anual Información semestral Información trimestral Información mensual.... Información semanal Información diaria Transacción en el OLTP + granularidad + detalle

Construcción de las dimensiones Identificar las dimensiones que caracterizan el proceso al nivel de detalle (gránulo) que se ha elegido. De cada dimensión se debe decidir los atributos (propiedades) relevantes para el análisis de la actividad. Entre los atributos de una dimensión existen jerarquías naturales que deben ser identificadas (día-mes-año) Tiempo. Cuándo se produce la actividad Sucursal.Donde está ubicado el almacén Vendedor. Quién ha vendido Cliente. Quién es el destinatario de la actividad Producto. Cuál es el objeto de la actividad

Dimensión Tiempo Dimensión Sucursal Dimensión Vendedor * Año ** Semestre *** Trimestre **** Mes ***** Día * Sucursal ** Tipo Sucursal *** País **** Provincia ***** Ciudad * Sucursal ** Sección *** Vendedor Dimensión Cliente * País ** Provincia *** Ciudad **** Razón Social Dimensiones Medidas Tiempo Sucursal Vendedor Cliente Producto Ventas_Importe X X X X X Ventas_Costo X X X X X Ventas_Unidades X X X X X Ventas_ImporteTotal X X X X X Ventas_Ganancia X X X X X Ventas_Promedio X X X X X

Dimensiones Medidas Tiempo Sucursal Vendedor Cliente Producto Ventas_Importe X X X X X Ventas_Costo X X X X X Ventas_Unidades X X X X X Ventas_ImporteTotal X X X X X Ventas_Ganancia X X X X X Ventas_Promedio X X X X X

Fact_Ventas ID_Tiempo ID_Producto ID_Cliente ID_Vendedor ID_Sucursal Tabla de Hechos 3 Dimensiones Medidas Tiempo Sucursal Vendedor Cliente Producto Ventas_Importe X X X X X Ventas_Costo X X X X X Ventas_Unidades X X X X X Ventas_ImporteTotal X X X X X Ventas_Ganancia X X X X X Ventas_Promedio X X X X X

Definición de las medidas Fact_Ventas ID_Tiempo ID_Producto ID_Cliente ID_Vendedor ID_Sucursal Fact_Ventas Fact_Ventas ID_Tiempo ID_Fecha ID_Producto ID_Producto ID_Cliente ID_Cliente ID_Vendedor ID_Vendedor ID_Sucursal Ventas_Importe Ventas_Costo Ventas_Unidades Medidas

FIN 42