SISTEMAS DE INTELIGENCIA DE NEGOCIOS



Documentos relacionados
LABORATORIO 4. CONSTRUCCIÓN DE CUBOS PARA LA BODEGA DE DATOS

Sistema de análisis de información. Resumen de metodología técnica

Oracle vs Oracle por Rodolfo Yglesias Setiembre 2008

Estos documentos estarán dirigidos a todas las personas que pertenezcan a equipos de implementación de Oracle BI, incluyendo a:

ARQUITECTURA DE UNA BODEGA DE DATOS

PARÁMETROS DE CONFIGURACIÓN DE SISTEMAS MANEJADORES DE BASE DE DATOS

REGISTRO DE EMPRESAS Y PERSONAS BASE DE INFORMACIÓN DE CLIENTES & CONTACTOS

MOLAP REALIZADO POR: JOSE E. TABOADA RENNA

Microsoft SQL Server Conceptos.

Quienes Somos? Valor. Estrategia

Tecnologías de Información y Comunicación II CLASE 10

Almacén de datos - concepto. Arquitectura de un sistema de almacén de datos

Capítulo 2 Tecnología data warehouse

Sistemas de Información 12/13 La organización de datos e información

SISTEMAS DE INFORMACION GERENCIAL LIC.PATRICIA PALACIOS ZULETA

SQL Server Business Intelligence parte 1

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 5 -

TOMA DE DECISIONES II

Parte I: Introducción

Servicio Business Intellingence integrado con Data Management & Big Data Del dato al conocimiento

Portafolio de Servicios y Productos

Innovación para su Contact Center

Definición. Data Warehousing: almacenamiento, transformación y distribución de datos útiles para los responsables de tomar decisiones 9/29/2006 4

NTC - ISO 9001:2008 REQUISITOS DE LA DOCUMENTACION

SAP BusinessObjects Edge BI Standard Package La solución de BI preferida para. Empresas en Crecimiento

Data Mining Técnicas y herramientas

Inteligencia de Negocios. & Microsoft Excel 2013

BearSoft. SitodeCloud. Rafael Rios Bascón Web: Móvil:

Inteligencia de Negocios Introducción. Por Elizabeth León Guzmán, Ph.D. Profesora Ingeniería de Sistemas Grupo de Investigación MIDAS

DISEÑO E IMPLEMENTACIÓN DE SOLUCIONES BUSINESS INTELLIGENCE CON SQL SERVER 2012

Presentación de Pyramid Data Warehouse

PARÁMETROS DE GESTIÓN Y DESEMPEÑO DEL SISTEMA MANEJADOR DE BASES DE DATOS Y DE LA BASE DE DATOS

Día :00h Lugar: Obra Social Ibercaja, Sala De actos, Rambla Ferran 38, 3º, Lleida

Elementos requeridos para crearlos (ejemplo: el compilador)

Reporte Registro de Personas con Discapacidad

Facultad de Ciencias Económicas. Departamento de Sistemas. Asignatura: INTELIGENCIA DE NEGOCIOS. Plan 1997

Construcción de cubos OLAP utilizando Business Intelligence Development Studio

BI Business Intelligence Un Mercado de Alto Crecimiento

Overview of Data Warehousing / Business Intelligence with SQL Server

MACROPROCESO GESTIÓN TECNOLÓGICA

Incorpora la localización en tu compañía. Mejora la rentabilidad con la solución Location Analytics de Esri

ANEXO A - Plan de Proyecto EDT de la solución EDT GENERAL DEL PROYECTO1

CREACIÓN DE PROYECTOS DE BUSINESS INTELLIGENCE CON SQL SERVER. 40 horas 60 días

FUENTES SECUNDARIAS INTERNAS

LOS CINCO GRADOS DE MADUREZ DE UN PROYECTO BI

GENERALIDADES DE BASES DE DATOS

Kais Analytics Business Intelligence

1.2 Alcance. 1.3 Definición del problema

UNIVERSIDAD DE SANTIAGO DE CHILE INGENIERIA COMERCIAL APLICACIÓN COMPUTACIONAL I INTELIGENCIA DE NEGOCIOS

FACULTAD DE INGENIERÍA. Bases de Datos Avanzadas

3. GESTIÓN DE CONFIGURACIÓN DE SOFTWARE

CAPÍTULO 2 DATA WAREHOUSES

GeneXus BPM Suite X. Última actualización: 01 de Setiembre de 2008

Modelado dimensional de datos

Tecnologías de la Información en la Gestión Empresarial

3.3.3 Tecnologías Mercados Datos

Introducción. Componentes de un SI. Sistema de Información:

APOYO PARA LA TOMA DE DECISIONES

Figure 9-1: Phase C: Information Systems Architectures

REPOSITORIO COR O P R OR O A R T A I T VO V

INTELIGENCIA DE NEGOCIOS

Materia: Inteligencia de negocios

CMMI (Capability Maturity Model Integrated)

Mesa de Ayuda Interna

Visión Ampliada del Management: Enterprise Performance Management

REGISTRO DE PEDIDOS DE CLIENTES MÓDULO DE TOMA DE PEDIDOS E INTEGRACIÓN CON ERP

BUSINESS INTELLIGENCE

UN PASEO POR BUSISNESS INTELLIGENCE

ARIS Process Performance Manager

Maxpho Commerce 11. Gestión CSV. Fecha: 20 Septiembre 2011 Versión : 1.1 Autor: Maxpho Ltd

IAP TÉCNICAS DE AUDITORÍA APOYADAS EN ORDENADOR (TAAO)

Describir una metodología sistemática de análisis de los procesos organizacionales y cómo estos pueden ser apoyados por las TI.

Universidad acional Experimental Del Táchira Decanato de Docencia Departamento de Ingeniería en Informática

Business Intelligence

INFORME TÉCNICO PREVIO DE EVALUACIÓN DE SOFTWARE No GTIOOO

INSTRODUCCION. Toda organización puede mejorar su manera de trabajar, lo cual significa un

Convertimos lo complicado en sencillo, lo fácil en operativo y eliminamos lo ineficaz

Cuadrante Mágico de Gartner para BI 2013 vs. 2014

Sesión No. 12. Contextualización: Nombre de la sesión: SAP segunda parte PAQUETERÍA CONTABLE

Descripción del Servicio

PLANES DE PREVENCIÓN DE PÉRDIDA DE DATOS

SERIE ESTRATEGIA COMERCIAL CRM. Lic. Guiomar Patricia González P.

Estas visiones de la información, denominadas vistas, se pueden identificar de varias formas.

QUERCUS PRESUPUESTOS MANUAL DEL USO

LABORATORIO 10. COPIAS DE SEGURIDAD, RESTAURACIÓN Y RECUPERACIÓN DE UNA BASE DE DATOS

Unidad 5. Conceptos y Estructuras de Archivos

activuspaper Text Mining and BI Abstract

LABORATORIO 10. ADMINISTRACIÓN DE COPIAS DE SEGURIDAD EN SQL SERVER

Unidad 1. Fundamentos en Gestión de Riesgos

CONFIGURACIÓN Y DESARROLLO

Sistemas de Información Gerencial

BASES DE DATOS TEMA 4 DISEÑO DE BASES DE DATOS RELACIONALES

RESUMEN CUADRO DE MANDO

DATA WAREHOUSE DATA WAREHOUSE

SISTEMAS DE INFORMACIÓN II TEORÍA

CONSTRUCCIÓN DEL PROCESO ADMINISTRADOR DE PROYECTOS SEIS SIGMA Bizagi Process Modeler

Transcripción:

Estructura de contenidos INTRODUCCIÓN...3 1. BODEGA DE DATOS (DATA WAREHOUSE)...3 1.1. Componentes...3 1.1.1. Orígenes de datos...4 1.1.1.1. Sistemas propios...4 1.1.1.2. Origen externos...4 1.1.2. Área de almacenamiento de Datos...4 1.1.2.1. Modelos de datos dimensionales...4 1.1.2.2. Cubos OLAP...7 1.1.3. Herramientas de Acceso a datos...10 1.1.3.1. Reportes, Informes y herramientas Dashboard..10 1.1.3.2. Minería de Datos...10 1.1.3.3. Sistemas de Soporte a las Decisiones...11 2. CICLO DE VIDA DE UN SISTEMA DE INTELIGENCIA DE NEGOCIOS..12 2.1. Requisitos de Negocio...12 2.2. Modelado dimensional...13 2.3. Diseño y desarrollo ETL...14 2.4. Diseño y construcción de cubos...16 2.5. Implementación Interfaz de usuario...17 2.6. Plan de Mantenimiento...18 2.7. Pruebas e Implementación...18 GLOSARIO...20 BIBLIOGRAFÍA...22

2

INTRODUCCIÓN Cada día son más las organizaciones alrededor del mundo, que establecen estrategias y asumen posiciones privilegiadas en el sector debido a la toma de decisiones de apoyados en Sistemas de Inteligencia de Negocios. La generación de conocimiento asegura una mejor gestión de los procesos en las organizaciones, la cadena de valor que adquieren los datos durante su recorrido por la organización sólo es posible si se tienen adecuadamente estructuradas las actividades que hacen posible contar con soluciones de Inteligencia de Negocios (BI). 1. BODEGA DE DATOS (DATA WAREHOUSE) 1.1 Componentes La estructura organizacional de la bodega permite identificar tres elementos esenciales en la bodega de datos: VENTAS Modelos de Datos Dimensionales Esquema en Estrella Reportes, Informes y herramientas Dashboard ERP Esquema Copo de Nieve SCM Minería de Datos Web Log Procesos ETL Esquema Constelación Origenes de Datos Externos Sistemas de Soporte a las Decisiones Cubos OLAP Orígenes de datos Área de almacenamiento Herramientas de Acceso a Datos 3

1.1.1. Orígenes de datos Corresponde a las fuentes que suministran los datos que conformaran la bodega y permitirán la generación de información asociada a la filosofía organizacional. 1.1.1.1. Sistemas propios Al interior de las organizaciones existen sistemas de información los cuales son la fuente primaria para proveer los datos a transferir a la bodega. Los repositorios de estos datos pueden ser bases de datos relacionales, archivos de datos, archivos planos, hojas de cálculo, entre otros, esto determina la necesidad de establecer procesos pertinentes para el análisis de los mismos y determinar cuáles de esos datos representan la naturaleza del negocio y de los objetivos propuestos para la bodega de datos. 1.1.1.2. Orígenes externos Además de los sistemas de la organización la interacción con sistemas externos también genera fuentes de datos, los cuales pueden también corresponder a diferentes formatos, estos deben ser analizados para determinar el proceso ETL que corresponda para su inclusión como fuente de datos en la bodega. Entre estos se encuentran datos de tipo estadístico y cualitativo, como los desarrollados a través de estudios de mercado, poblacional, tendencias de la industria, etc. 1.1.2. Área de almacenamiento de Datos La información contenida en la bodega en su mayoría debe estar desnormalizada, para agilizar el tiempo de procesamiento de las consultas, ya que se requiere manejar grandes volúmenes de datos derivados y la realización de cálculos a diferentes niveles. 1.1.2.1. Modelos de datos dimensionales Para la construcción del modelo lógico conceptual de la estructura de la bodega de datos, se utiliza una representación multidimensional de las variables que conforman los diferentes indicadores de gestión y control. Se utilizan los modelos estrella, copo de nieve y constelación como forma de representación gráfica; los componentes de estos modelos son tablas de datos de dos tipos: tablas de dimensiones y tablas de hechos. 4

Las tablas de dimensiones son equivalentes a una entidad en un modelo de datos, tienen una llave primaria y datos que representan los filtros de información a aplicar, contienen información que en ciertos modelos debe estar desnormalizada; es importante no olvidar que siempre debe existir una tabla de dimensión asociada al tiempo, esta debe construirse con diferentes medidas de tiempo y preferiblemente debe utilizar como llave primaria un dato de tipo entero, para optimizar los tiempos de búsqueda y el espacio de almacenamiento. Las tablas de hechos representan eventos del negocio que deben ser cuantificables, poseen una llave primaria propia y llaves foráneas que identifican la relación con las tablas de dimensiones. Posee además otros campos asociados a las métricas con las que se establecen las respuestas que forman parte del objetivo de información. 1.1.2.1.1. Esquema en Estrella Este esquema es un modelo de datos compuesto por una tabla central denominada Tabla de hechos Fact Table, que contiene los datos fuente de información para el análisis, y unas tablas denominadas dimensiones, que se encuentran relacionadas con la tabla de hechos. Dimensiones Dimensiones Dimensiones TABLA DE HECHOS Dimensiones Dimensiones 5

Debido a la simplicidad del modelo, ofrece gran velocidad de procesamiento al ser usado en el análisis, permitiendo acceder tanto a los datos resumidos a partir de funciones de agregado como al detalle de la información. Esta velocidad es producto de la indexación que sufren las tablas de dimensiones en forma individual, sin afectar el rendimiento de la base de datos en su conjunto. 1.1.2.1.2. Esquema Copo de Nieve En este esquema el modelo de datos está compuesto por una tabla central denominada Tabla de hechos, pero a diferencia del esquema en estrella las tablas de dimensiones no están relacionadas todas con dicha tabla. Algunas de las tablas de dimensiones están directamente relacionadas con otras dimensiones, estableciendo una estructura similar a la representación gráfica de un copo de nieve. TABLA DE HECHOS Al sufrir un proceso de normalización, se reduce el espacio requerido de almacenamiento en las dimensiones minimizando la redundancia en los datos, pero al tener que construir más tablas de dimensiones la consulta de datos disminuye el rendimiento al tener que crear más tablas y consecuentemente el número de combinaciones (Joins) para procesarlas. 6

1.1.2.1.3. Esquema Constelación En este esquema el modelo de datos consta de más de una tabla de hechos, lo cual aumenta la complejidad del modelo. Las tablas de dimensiones son compartidas por las tablas de hechos. Aunque el modelo ofrece flexibilidad, su estructura puede ser muy compleja para mantener. Las tablas de hechos pueden llegar a representar diferentes niveles de detalle, representados por su relación con una misma dimensión. Algunas tablas representarán detalles y otras representarán pronósticos. Siendo entonces este modelo una combinación de esquemas en Estrella o Copo de Nieve. Dimensiones Dimensiones HECHOS A HECHOS B Dimensiones Dimensiones Dimensiones 1.1.2.2. Cubos OLAP OnLine Analytical Processing Un cubo OLAP o de Procesamiento Analítico en Línea, representa una base de datos multidimensional caracterizada porque el almacenamiento se realiza a través de un arreglo multidimensional. Las bases de datos relacionales tienen limitaciones respecto al análisis de grandes volúmenes de datos, por esta C L I E N T E S Cliente 1 Cliente 2 Cliente 3 25 32 93 13 15 50 56 45 11 Libro 1 Libro 2 Libro 3 LIBROS Año 3 Año 2 Año 1 AÑOS 7

razón la propuesta del almacenamiento en cubos agilizaría los procesos de análisis sobre los datos, sin embargo estaría limitada al periodo de tiempo para el cual se construyo el cubo, siendo necesario rediseñar el cubo si el periodo de análisis cambia. Las dimensiones en el cubo representan los posibles filtros asociados a las consultas, cuando se tienen más de tres dimensiones, los cubos se denominan hipercubos. Las herramientas OLAP permiten: rotar los cubos. C L I E N T E S Cliente 1 Cliente 2 Cliente 3 25 32 93 13 15 50 56 45 11 Libro 1 Libro 2 Libro 3 Año 3 Año 2 Año 1 AÑOS L I B R O S Libro 1 Libro 2 25 13 56 32 15 45 93 50 11 Libro 3 Año 3 Año 2 Año 1 Cliente 1 Cliente 2 Cliente 3 AÑOS LIBROS CLIENTES Cambio de dimensión clientes por la de libros. Seleccionar sólo algunas de las celdas C L I E N T E S Cliente 2 13 15 Libro 1 Libro 2 Año 1 AÑOS LIBROS 8

Totalizar por item C L I E N T E S Cliente 1 Cliente 2 150 78 Cliente 3 Año 3 112 Año 2 Año 1 AÑOS LIBROS O cambiar el nivel de agregación para obtener totales en diferentes niveles. Cubos con mas detalles C L I E N T E S Cliente 1 Cliente 2 Cliente 3 57 28 101 93 50 11 Materia 1 Materia 2 Año 3 Año 2 Año 1 AÑOS MATERIAS Se puede obtener diferentes jerarquías a partir de los atributos de las dimensiones. 9

1.1.3. Herramientas de Acceso a datos Una vez se tengan almacenados los datos, es necesario procesarlos para que se conviertan en conocimiento y apoyen la toma de decisiones. Estas herramientas pueden categorizarse de acuerdo con la complejidad de su uso o la manera en que presenta la información así: Dashboard Services View Agents Visual Console GIS Maps Inventory Edit My User Reporting SNMP console Menssages Extensions Manage Incidents Dashboard Add Widgets... 1.1.3.1. Reportes, Informes y Herramientas Dashboard Aquí se presentan los datos para que el usuario visualice la información en un alto nivel, establece Herramientas para la generación de consultas e informes con interfaz gráfica, las cuales a través de asistentes facilitan la realización de peticiones complejas. El término dashboard (tablero de control) hace alusión a una página desarrollada con tecnología Web, donde se muestre en tiempo real la información de la empresa, producto de las operaciones de Inteligencia de Negocios. Su utilidad se centra en la posibilidad de generar análisis casi instantáneos. Para la construcción de los tableros de control es importante identificar los indicadores de rendimiento claves (KPI Key Performance Indicator), que generalmente están asociados a un objetivo de negocio y de esta forma hacer seguimiento a través de tasas o porcentajes que indican si se esta cerca o por encima de una meta del negocio. A partir de esta filosofía se puede descomponer una meta organizacional en metas operacionales. 1.1.3.2. Minería de Datos La minería de datos busca que a partir de los datos almacenados se pueden extraer patrones que permitan convertir estos datos en Inteligencia de Negocios (BI), para lo cual existen en el mercado infinidad de soluciones de software que proporcionan ventajas competitivas a las organizaciones. 10

Estas herramientas facilitan la construcción de modelos de minería de datos, utilizando orígenes distintos, tanto de fuentes relacionales como de cubos multidimensionales. En estas herramientas se pueden aplicar las diferentes técnicas asociadas a la minería como son: el modelado de regresión lineal, árboles de decisión, redes neuronales, agrupación, etc. También permiten la visualización de los modelos y generar las consultas de predicción. 1.1.3.3. Sistemas de Soporte a las Decisiones Un Sistema de Soporte a la Decisión (DSS) es una herramienta de Inteligencia de Negocios que permite acceder a los datos para su análisis y proyección como información importante para cualquier organización. Dentro de las características asociadas a estas herramientas se encuentran: Generación de informes dinámicos y flexibles, ya que permiten ser modificados. Facilidad de utilización para los usuarios. Segmentación de información por perfil de usuario. Tiempos de respuesta óptimos. Integración con los demás sistemas de la compañía. Dentro de las herramientas DSS se encuentran: Sistemas de información gerencial (MIS, Management Information Systems): provee soporte a tareas organizacionales relacionadas con aplicaciones CRM/ERP. Sistemas de información ejecutiva (EIS, Executive Information System): provee acceso sencillo a información interna y externa relevante para alcanzar las metas, especializado en el presentar el estado diario de la organización a través de indicadores clave. 11

2. CICLO DE VIDA DE UN SISTEMA DE INTELIGENCIA DE NEGOCIOS 7 Pruebas e Implementación 6 Plan de Mantenimiento 5 Implementación Interfaz de Usuario 4 Diseño y Construcción de Cubos 3 Diseño y Desarrollo ETL 2 Modelado Dimensional 1 Requisitos de Negocio El anterior diagrama representa las etapas necesarias para la implementación de un Sistema de Inteligencia de Negocios, estas etapas son afrontadas por diferentes metodologías y representan un modelo de procesos a realizar.. 2.1. Requisitos de Negocio Para crear diseños apropiados es necesario identificar los requerimientos claves correspondientes a los factores de éxito del negocio, de tal manera que se describa el alcance de cada nivel de los usuarios y del Data Warehouse (Bodega de Datos). Se deben especificar en forma clara y precisa las funciones que se esperan de la Bodega de Datos, para lo cual es importante considerar las expectativas de los diferentes usuarios, tanto a nivel operativo, como gerencial y del mismo administrador de base de datos. 12

Es necesario además identificar las temáticas y objetivos de las áreas funcionales de la organización y el nivel de detalle de la información requerida ya que la granularidad determina los niveles de agrupamiento a implementar, las dimensiones de categorización (tiempo, ubicación geográfica, sector de industria, clientes, productos, etc.). En esta etapa se deben determinar cual es el problema que se desea resolver y establecer los criterios de éxito que pueden ser cualitativos o cuantitativos. Es importante considerar con que información previa se cuenta y si se tienen los datos necesarios para resolver los interrogantes. 2.2. Modelado Dimensional En esta etapa se debe pasar de un modelo Relacional de datos a un modelo dimensional, para lo cual se deben identificar las dimensiones, los hechos y el modelo a utilizar. Para determinar los campos contenidos en estas es recomendable considerar los siguientes ítems: Tabla de Dimensiones: o Debe contener una clave simple no relacionada con la llave del negocio, normalmente se refiere a llaves auto numéricas. o Sus campos deben ser descriptores que complementen la información y representan los niveles de agregación. o Debe incluir las claves del negocio. o Siempre debe existir una dimensión temporal. o Deben ser claras y explicitas ya que representan la interfaz que tendrán los usuarios para navegar por la información. o No se debe escatimar en cuanto al número de atributos para la tabla de dimensiones, ya que el numero de registros que contendrá es mínimo respecto al de la tabla de hechos. o Las dimensiones de fechas pueden tener diversas formas de representarse. o El numero de dimensiones depende del modelo dimensional adoptado, pero si se encuentra un numero muy elevado puede ser que algunas no son independientes y deberían agruparse. o En algunos casos se requiere normalizar las dimensiones, generándose un modelo copo de nieve. o Deberían ayudar a responder las siguientes preguntas: qué?, quién?, por qué?, dónde? y cuándo? 13

Tabla de Hechos o Debe contener una clave propia, independiente de las claves de negocio. o Los campos representan las métricas, por lo tanto son numéricos y aditivos (no se almacenan valores individuales, solo totales y subtotales) o Contiene los campos de referencia hacia las tablas de dimensiones. o Cada fila corresponde a una medida o Si se requiere calcular porcentajes y proporciones deben almacenarse el numerador y el denominador. o No tienen valores nulos. o Existen algunas tablas sin hechos (FactLess) que se utilizan para relacionar las dimensiones y deben contener un campo de hecho ficticio con valor por defecto igual a uno (1). El nivel de detalle con el que se debe construir el modelo depende de las preguntas que se quieran responder, aunque lo mejor es utilizar el máximo nivel de detalle, teniendo en cuenta el espacio disponible en la bodega de datos, también es necesario considerar que cada nivel de agregación hace que se pierda parte de la información. 2.3. Diseño y desarrollo de procesos ETL E (Extraction) T (Transformation) L (Load) Extracción Limpieza Transformación Integración Actualización Como se observa en la gráfica el proceso ETL recoge información de diferentes fuentes, transforma los datos convirtiéndolos en datos de calidad y veracidad, por último carga y actualiza la Bodega de Datos. Los procesos ETL por lo general consumen mucho tiempo en un proyecto de BI y es punto clave para el éxito. 14

Como se observa en la gráfica el proceso ETL recoge información de diferentes fuentes, transforma los datos convirtiendo en datos de calidad y veracidad por ultimo carga, actualiza en la DW. El proceso extracción, transformación y carga está compuesto por las siguientes etapas: a. Extracción: Este proceso obtiene los datos físicamente de las distintas fuentes de información utilizando técnicas y herramientas ETL, para la selección del método es necesario tener en cuenta algunas problemáticas de la extracción de datos como lo son el tipo de plataforma, protocolos, juego de caracteres, tipos de datos, etc. b. Limpieza: Al recuperar los datos en bruto, se requiere comprobar la calidad de los mismos y corregir errores relacionados con campos nulos, duplicados, inconsistencias en los datos, etc. Etapas de la limpieza de datos: Depurar los valores: Se pueden separar los datos de acuerdo con la estructura de destino de los datos o la regla definida para esto. Corregir: A partir de fuentes de datos externas se puede verificar la información existente. Estandarizar: A partir de formatos definidos por las reglas de negocio, se sustituyen valores en los campos de datos Relacionar: Verifica en otras fuentes la existencia de datos relacionados, para evitar duplicados. Consolidar: A partir de la identificación de relaciones entre registros, se llevan a una sola representación. c. Transformación: Una vez que los datos se encuentran limpios, se transforman de acuerdo con las reglas de negocio y las características de las herramientas a utilizar. En la transformación se consideran cambios de formato, cambios de códigos, adición de valores derivados y agregados. Es importante recordar que los agregados cumplen un valor importante, ya que al almacenar el resultado de estos cálculos en la Bodega de Datos, se obtendrá un mayor rendimiento al realizar las consultas respectivas, sin olvidar que el nivel de granularidad puede estar determinado por la dimensión del tiempo. d. Integración: En este proceso se realiza la carga de los datos y debe validarse que los datos cargados en la bodega de datos son consistentes 15

con los que se encontraban en el medio transaccional. e. Actualización: Este proceso es en el cual se determina la periodicidad con la cual se van a añadir y sincronizar los nuevos datos a la Bodega de Datos. 2.4. Diseño y construcción de cubos Un cubo representa un subconjunto de datos de la bodega almacenado en una estructura multidimensional. Para proceder a la implementación de los cubos es necesario determinar el tipo de cubo y la herramienta que se utilizará para ello. La construcción física de las tablas de dimensiones y las tablas de hechos se realizan de acuerdo con el modelo dimensional definido y la herramienta a utilizar, se ejecutan los procesos ETL para poblar las tablas y se genera el cubo para obtener las respuestas a los requerimientos definidos. Posteriormente se procede a visualizar la información del cubo. Para definir el tipo de cubo a construir es necesario identificar las opciones de almacenamiento que se tienen así: Rendimiento: En este caso debe ser de tipo MOLAP (Multidimensional On-Line Analytical Processing) almacenando en una base de datos multidimensional tanto los datos como las agregaciones. Capacidad: ROLAP Detalles Agregaciones Vistas de Usuario (Relational On-Line Analytical Processing), los datos de los hipercubos así como las agregaciones se encuentran dentro de una base de datos relacional 16

HOLAP Detalles Agregaciones Vistas de Usuario (Hibrid On-Line Analytical Processing), los datos se encuentran en una estructura relacional y los agregados en una estructura multidimensional. DOLAP Detalles Vistas de Usuario (Desktop On-Line Analytical Processing), Los datos se encuentran en una base de datos multidimensional almacenada en un equipo Cliente. 2.5. Implementación de la Interfaz de usuario Una vez que han sido construidos los cubos se deben establecer las herramientas que permitirán la visualización de la información, para lo cual se cuenta con diversidad de posibilidades tales como: Herramientas para la realización de informes, en las cuales participan desarrolladores, quienes construyen de acuerdo con requerimientos cambiantes de los usuarios, los informes que van siendo solicitados. Herramientas OLAP, que proporcionan a partir de los SMBD aplicaciones que permiten visualizar los datos desde diferentes contextos: informes, graficas, estadísticas etc. Aplicaciones de DashBoard, permitiendo la visualización sincrónica de indicadores, referidos a objetivos o metas procedimentales. Sistemas DSS, donde se permite utilizar diferentes niveles de análisis a la información a partir de aplicaciones definidas para ello. 17

2.6. Plan de Mantenimiento Debido a la naturaleza dinámica de algunos datos, es necesario establecer un plan de acción para considerar los ajustes o reconstrucción de algunos de los objetos de la Bodega de datos. La siguiente lista proporciona algunos de los elementos a considerar en el plan de mantenimiento. Modificación de datos de origen de las dimensiones. En este caso debe analizarse si el cambio se asume para toda la historia del dato (p.e. cambia la fecha de nacimiento del cliente) o si debe generarse un nuevo ciclo a partir de la modificación del mismo (p.e. una sucursal cambia de responsable). Se hace necesario modelar la información de manera tal que no se pierda el historial de los datos, para esto es posible utilizar claves subrogadas. Una característica importante de la Bodega de Datos, es la de repositorio de información Histórica. Rendimiento. Se debe considerar el espacio ocupado en la bodega de datos, por esto es posible que se haga necesario modificar las estructuras de las tablas para aliviar el tamaño de los objetos en la bodega. Es importante tener en cuenta que no se debe construir un modelo para generar un informe en particular, sino que debe dar respuesta a diferentes áreas a partir de la inclusión de los indicadores y conceptos del negocio. Subutilización de Tablas Agregadas. Aun cuando estas tablas proporcionan una mejora en el rendimiento de las consultas es necesario asegurarse que la herramienta BI que se esta utilizando sea capaz de aprovecharlas, de lo contrario los costes de mantenimiento y actualización permanente de estas tablas solo harían mas complejo el sistema. 2.7. Pruebas e Implementación En esta etapa se evalúa el modelo, partiendo de los criterios de éxito que se establecieron en la primera etapa. El proceso debe ser revisado a partir de los resultados obtenidos para determinar si es necesario repetir alguna de las etapas anteriores. 18

ERP CRM SCM Legancy Proceso de Integración de datos Data Warehouse Proceso de auditoría y reconciliación. Calidad de datos Control Usuarios BI Puntos de control de Calidad de datos Se evalúa el modelo respecto a los objetivos planteados y si no existen restricciones de tiempo se prueba con un problema real, también debe evaluarse respecto a objetivos diferentes a los inicialmente planteados. Si los resultados no son satisfactorios se hace necesario realizar otra iteración desde la fase de modelado o del proceso de ETL; en caso contrario se hace necesario proceder a la implementación del Sistema de BI. La implementación se ejecuta a partir del diseño de una estrategia, que debe incluir la monitorización y mantenimiento de los modelos adoptados por la bodega de datos, así como la presentación de los resultados de forma clara y precisa a los usuarios, para cumplir con los objetivos de conocimiento. 19

GLOSARIO DWH: (Data WareHouse). Bodega de Datos. Es un conjunto de datos integrados sobre los cuales se soportan procesos de toma de decisiones para grandes volúmenes de datos. ETL: (Extraction, Transformation and Load). Corresponde a los procesos de: Extracción: Aquí se identifican las fuentes y la información requerida por el almacén de datos (BD, archivos planos, aplicaciones no relacionales, etc.). Transformación: Una vez se selecciona la información a ser cargada al almacén, ésta se debe tratar para evitar que la migración no interrumpan su carga; por ejemplo: tipos de datos, formatos de fecha, caracteres especiales no visibles (cambios de línea, chr(10),chr(13)), caracteres de comillas sencillas y otros. Carga: Después de determinar las fuentes de información, las transformaciones y limpieza de la información extraída, se procede a determinar la fuente destino y el mapeo entre la estructura origen y la destino para realizar la carga de los datos extraídos KDD: (Knowledge Discovery from Databases). Descubrimiento de Conocimiento en Bases de Datos cuyo objetivo es encontrar conocimiento útil, válido, relevante y nuevo sobre una determinada actividad mediante algoritmos, para grandes volúmenes de datos. ODS (OPERATIONAL DATA STORE) o Almacén Operacional De Datos BI: (Business Intelligence) Inteligencia de Negocios es la habilidad para transformar los datos en información, y la información en conocimiento, de forma que se pueda optimizar el proceso de toma de decisiones en los negocios. 20

GLOSARIO OLAP: es el acrónimo en inglés de procesamiento analítico en línea (On- Line Analytical Processing). Es una solución utilizada en el campo de la llamada Inteligencia empresarial (o Business Intelligence) cuyo objetivo es agilizar la consulta de grandes cantidades de datos. Para ello utiliza estructuras multidimensionales (o Cubos OLAP) que contienen datos resumidos de grandes Bases de datos o Sistemas Transaccionales (OLTP). Se usa en informes de negocios de ventas, marketing, informes de dirección, minería de datos y áreas similares. La principal característica que potencia a OLAP, es que es lo más rápido a la hora de ejecutar sentencias SQL de tiposelect, en contraposición con OLTP que es la mejor opción para operaciones de tipo INSERT, UPDATE Y DELETE 21

BIBLIOGRAFÍA Cano, J. L. (2007). BUSINESS INTELLIGENCE: Competir con Información. Recuperado el 15 de Mayo de 2012, de http://www.iwith.org/pdf/libro_ BI_Competir_con_Informacion.pdf Gallardo Arancibia, J. A. (2009). Metodología para el desarrollo de proyectos en Minería de Datos CRISP-DM. Recuperado el 20 de Mayo de 2012, de http://www.oldemarrodriguez.com/yahoo_site_admin/assets/ docs/documento_crisp-dm.2385037.pdf Zorrilla, M. (2010). Data WareHouse y OLAP. Recuperado el 15 de Mayo de 2012, de Universidad de Cantabria: http://personales.unican.es/zorrillm/ BDAvanzadas/Teoria/bta-t4b-%20Business%20Intelligence.pdf 22

OBJETO DE APRENDIZAJE Desarrollador de contenido Experto temático SISTEMAS DE INTELIGENCIA DE NEGOCIOS Ana Yaqueline Chavarro Parra Edna Mireya Rivera L. Asesor Pedagógico Rafael Neftalí Lizcano Reyes Productor Multimedia Programadores Manuel Francisco Silva Barrera Victor Hugo Tabares Carreño Daniel Eduardo Martínez Díaz Grateful Dead Montaño Sierra Líder expertos temáticos Ana Yaqueline Chavarro Parra Líder línea de producción Santiago Lozada Garcés R PANDORAFMS, es una marca registrada propiedad de PANDORAFMS Enterprise. Copyright Registered trademark Atribución, no comercial,compartir igual Este material puede ser distribuido, copiado y exhibido por terceros si se muestra en los créditos. No se puede obtener ningún beneficio comercial y las obras derivadas tienen que estar bajo los mismos términos de licencia que el trabajo original. 23