ANEXO C Documento de Extracción. 1. Objetivo. 2. Alcance. 3. Arquitectura de la Extracción



Documentos relacionados
Guía de usuario CUBO TI

Cuadrante Mágico de Gartner para BI 2013 vs. 2014

Almacén de datos - concepto. Arquitectura de un sistema de almacén de datos

Oracle vs Oracle por Rodolfo Yglesias Setiembre 2008

ANEXO A - Plan de Proyecto EDT de la solución EDT GENERAL DEL PROYECTO1

CAPITULO 4 DESARROLLO DEL SISTEMA. En la parte de desarrollo de Base de Datos se implementaron los

Consultoría y Desarrollo de Sistemas CONTROLMAP. Software : Sistema Integral de Registro y Seguimiento de Eventos e Incidencias en Mapas Digitales

asired EIS Descripción de producto. Integración de Sistemas Explotación de Datos y Business Intelligence para la Pequeña y Mediana Empresa.

Business Intelligence

BearSoft. SitodeCloud. Rafael Rios Bascón Web: Móvil:

Business Intelligence Available Inteligencia de Negocios Disponible

MOLAP REALIZADO POR: JOSE E. TABOADA RENNA

ANEXO F ARQUITECTURAS DE INTELIGENCIA DE NEGOCIOS

ANEXO D Documento de Explotación. 1. Objetivo. 2. Alcance. 3. Fases de Explotación

FACULTAD DE INGENIERÍA. Bases de Datos Avanzadas

Puesta en marcha de Aspel-CAJA 3.5 trabajando con Puntos de venta remotos (no en red con el Administrador de puntos de venta).

DATA WAREHOUSING (ENERO DE 2003) Documento creado por Ing. Héctor H. Martínez Orpinel

CREACIÓN DE PROYECTOS DE BUSINESS INTELLIGENCE CON SQL SERVER. 40 horas 60 días

Microsoft SQL Server Conceptos.

Base de datos II Facultad de Ingeniería. Escuela de computación.

GUÍA TÉCNICA. Desarrollo de Sistemas de Información la plataforma Business Intellingence Pentaho

Manual de instalación. BIABLE Great Plains-Dynamics

D.T.Informática S.L. [Sistema hada] hilo Administrador Desarrollo Activo

Capítulo 5. Cliente-Servidor.

Componentes de Integración entre Plataformas Información Detallada

Guía de Apoyo Project Professional

PROYECTO ETL INTEGRATION SERVICES

DATA WAREHOUSE DATA WAREHOUSE

MS_20465 Designing Database Solutions for Microsoft SQL Server

10775 Administering Microsoft SQL Server 2012 Databases

WorkFlow Pagos de Facturas de Bienes y Servicios De la Administración Central. Seminario: Plataforma Lotus Domino.

Data Warehouse Marco de Calidad

Inteligencia de Negocios Introducción. Por Elizabeth León Guzmán, Ph.D. Profesora Ingeniería de Sistemas Grupo de Investigación MIDAS

Estos documentos estarán dirigidos a todas las personas que pertenezcan a equipos de implementación de Oracle BI, incluyendo a:

Manual de Instalación SICO MANUAL DE INSTALACION SICO - SOFTWARE DE GESTION BASE DE DATOS SQL SERVER

CAPÍTULO 2 DATA WAREHOUSES

U.E JUAN DE VELASCO CREAR DATOS EN SQL

Manual de usuario Versión: 1.3 Edición: 05/02/2015 1

DISEÑO E IMPLEMENTACIÓN DE SOLUCIONES BUSINESS INTELLIGENCE CON SQL SERVER 2012

Resumen ÁREA DE FACTURACIÓN::INFORMES::Pedidos Detalle Resumen ÁREA DE

Práctica1. Introducción a Microsoft Access. Qué es Access?

Programa de Ayuda EMCS Instalación Versión SQL Server Versión Marzo 2010

SolucionesAnalíticas con Pentaho.

Puesta en marcha de Aspel-CAJA 3.5 en una red de trabajo con más de un punto de venta.

PROYECTO DE TESIS DIEGO GALLARDO. ESPEL - Diego Gallardo

Primeros pasos hacia la Inteligencia de Negocios: Almacenes de datos (DataWareHouse), Herramientas ETL(PDI), Procesamiento analítico en línea.

Migración y Ecosistema. 14 de Julio de 2009

SQL Server Reporting Services 2000 y 2005

Integración de AuraPortal con SAP

LOS CINCO GRADOS DE MADUREZ DE UN PROYECTO BI

Arquitectura para análisis de información. Zombi es una arquitectura que proporciona de manera integrada los componentes

ARQUITECTURA DE DISTRIBUCIÓN DE DATOS

Configuracion Escritorio Remoto Windows 2003

BUSINESS INTELLIGENCE

Pentaho BI. Lic. Patricia Palacios Zuleta

Tecnologías de la Información en la Gestión Empresarial

CURSOS PREPARACIÓN PARA CERTIFICACIÓN MICROSOFT SQL SERVER

Arquitectura Cliente/Servidor

PROCEDIMIENTO DE ACCESO A DB2 AS/400 MEDIANTE SQL SERVER

CAPITULO 8. Planeamiento, Arquitectura e Implementación

Nombre de la sesión: Intelisis Business Intelligence segunda parte

INTELIGENCIA DE NEGOCIOS CON SQL SERVER 2008 R2

Custodia de Documentos Valorados

(Soluciones ERPContable) Versión 3.0.n. Manual de instalación

Libertya BI 1.0. Guía de Usuario

CAPITULO 9. Diseño de una Base de Datos Relacional Distribuida

3.3.3 Tecnologías Mercados Datos

Sistema de análisis de información. Resumen de metodología técnica

Sistema de Mensajería Empresarial para generación Masiva de DTE

Tecnologías Aplicadas a Business Intelligence Proyecto Práctico

Sistema de Gestión Integral STI NETWORK

Controle los documentos mediante una administración de directivas detallada y ampliable.

TELEFÓNICA MÓVILES ESPAÑA, S.A.U. Software para Soporte Unificado de Facturación

Definición. Data Warehousing: almacenamiento, transformación y distribución de datos útiles para los responsables de tomar decisiones 9/29/2006 4

Introducción a BusinessObjects XI Release 2 Service Pack 2 / Productivity Pack

BIABLE. Business Intelligence Available Inteligencia de Negocios Disponible. BIABLE, la nueva forma de trabajar con Microsoft Excel.

Se ha confeccionado una aplicación sencilla para poder probar el interfaz de gestión explotación de MEGA, Modelo Estandarizado de Gestión de Agua.

Capítulo III. Análisis y diseño.


arquitectura que maneja. Encontraremos también los diferentes servidores que

Cada parte de su organización dispondrá de la información y la generación de informes que necesite. Las ventajas es que usted puede:

Instalación y uso de Document Distributor

SIQUNET LIMS. Sistema Integrado de Gestión de Laboratorios

Documento de Arquitectura de Software

Cenfotec ofrece talleres de preparación para la certificación internacional de Microsoft SQL Server

Guía de Apoyo Project Web Access. (Jefe de Proyectos)

C a p í t u l o 3 : T r a b a j o r e l a c i o n a d o

DYA. Distribución y Almacenaje. Versión V13

Guía de Instalación de XTBox

UNIDESYS UNIVERSAL BUSINESS SYSTEMS INSTALACIÓN NUEVO PUESTO DE TRABAJO

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 5 -

Tecnologías de Información y Comunicación II CLASE 10

ARC 101 Architecture Overview Diagram

La interoperabilidad se consigue mediante la adopción de estándares abiertos. Las organizaciones OASIS y W3C son los comités responsables de la

Día :00h Lugar: Obra Social Ibercaja, Sala De actos, Rambla Ferran 38, 3º, Lleida

CONSTRUCCIÓN DEL MODELO DE VENTAS MULTIDIMENSIONAL BASADO EN LA INFORMACIÓN HISTÓRICA DE LA ORGANIZACIÓN TDM TRANSPORTES S.A.S.

AVA-SECSystemWeb. Introducción Características del producto Especificaciones Técnicas

Comunicación para Tecnimap Contenido: 1. Itourbask como elemento de un Sistema de Gestión de Destino Turístico 2. El Data Mart de Itourbask

Capitulo III. Diseño del Sistema.

Transcripción:

ANEXO C Documento de Extracción 1. Objetivo El objetivo del documento de extracción es presentar aquellas características que se mencionan de manera general en el documento de tesis. Aquí se enfoca directamente la extracción, transformación y carga de cada componente de los datamarts que se ejecutarán dentro del proyecto. 2. Alcance Se presentará el diseño dimensional final y el proceso de construcción dentro del proceso de ETL ejecutado. El asistente para el diseño de cubos basado en la herramienta SQL Integration Services 2008 (SSIS) ayudará a la creación de los datamarts facilitando la definición de las dimensiones, los niveles de jerarquía, la tabla de hechos y la conexión a la base de datos relacional en un fichero XML. Dichos paquetes se accederán a las fuentes descritas en el punto anterior y, dependiendo de la tarea, transformarán, cargarán o harán ambas cosas. 3. Arquitectura de la Extracción La arquitectura de esta solución constituye el diseño de una aplicación de alto nivel que se divide en los distintos orígenes de datos existentes y las capas donde extraerán, transformarán y cargarán dicha data. A. Origen Corresponde a las múltiples fuentes (hojas de texto, sistemas transaccionales, base de datos siguientes necesidades: Base de datos del sistema Core externa), las fuentes provienen de las Los datos son extraídos desde base de datos relacionales OLTP ubicados en el motor de base de datos SQL Server 2008 que son captados por sistemas transaccionales como SAP Business One 8.8; este sistema principal de la organización contiene la base de datos operacional fuente para la

construcción de la base de datos OLAP. La base de datos se muestra en la Figura 1. Figura 1 - Diagrama de Base de Datos de ERP fuente Archivo de almacenaje y control de gastos en almacén intermedio Estos archivos son provistos por el operador logístico encargado de los procesos de almacenaje intermedio de productos. Contiene información de los movimientos, estado y saldo de los productos dentro de sus almacenes a una fecha determinada. Archivo de control de envío en aduanas Estos archivos son provistos por la agencia de aduanas encargado de la entrada y salida de productos a territorio nacional. Contiene información del estado y los montos o gastos asignados a los productos que entran a nuestro país. B. Capas Capa Operacional Esta capa servirá para la integración de los datos, es la que seguirá el modelo de almacenamiento MOLAP, ya que tendrá la mayor atomicidad en detalle de la información. Asimismo, guardará información histórica y será la

que se actualice cada cierto tiempo por cada carga del proceso ETL extraído de la bases de datos fuente. Capa de Almacenamiento Temporal Operacional Esta capa servirá de almacenamiento intermedio entre la base de datos fuente y la base de análisis operacional. Teniendo presente que las soluciones se encontrarán en un servidor distinto al de la base de datos del sistema principal, será necesario tener un stage o almacén de datos donde se consolide la información de las distintas fuentes. Aquí se realiza la transformación de datos fuente como cambios de tipo de dato, truncamiento de datos, cambios de formato para tener nuevos datos fuente sumarizados para la capa de explotación; para estandarizar y realizar la limpieza de la base de datos OLAP Y permitir el mapeo adecuado. Capa de Explotación Esta capa servirá para almacenar información resumida y agregada de lo que existe en la capa de datos operacional, de acuerdo a las necesidades del negocio. Primero la información se importa de la capa operacional mediante herramientas ODBC, luego se crea el diseño físico, lógico y de presentación para el usuario final. La naturaleza de la estructura que se tiene en este ambiente sirve para procesar consultas con un perfomance mayor al de un modelo relacional. En tal sentido, permitirá una explotación analítica. 4. Proceso de Extracción, Transformación y Carga Este punto se encargará de describir los procesos de extracción, transformación y carga que se necesitarán para la población del datamart. Las tablas a usarse tendrán las fuentes presentadas en la Figura 1. Carga de Tablas de Almacenamiento Temporal Operacional: Para la realización de la carga de esta capa, es necesario extraer los datos de las fuentes, estos serán los que realicen la carga a una fecha de corte

determinada. Este proceso puede basarse usando la herramienta jobs de SQL Server 2008 o basado en alertas de Windows. La Figura 2 presenta la extracción de los distintos orígenes de datos hacia la capa intermedia. Figura 2 - Diagrama de extracción de archivos fuente Transformación y Carga de Datos hacia base operacional Una vez que se extraen los datos de las diversas fuentes lo que hace este paquete es ejecutar la réplica hacia la capa de Operación, siempre y cuando todos los archivos contengan registros nuevos. A continuación, en la Figura 7 se presenta consultas para realizar las extracciones y transformaciones estándar de la herramienta.

Figura 3 - Consulta de extracción Para cargar dicha información en la base de datos de intermedia, se tiene que realizar paquetes para la creación de tablas y que este la plataforma conforme para el ingreso de datos. En la presente Figura se realiza la extracción, la transformación de la tabla Producto.

Figura 4 - Diagrama de extracción de tabla Producto En el presente anexo se detallan las tablas fuente de extracción para todas las dimensiones y tabla de hechos involucradas en la solución. de Productos son las siguientes: OITM Tabla que representa información de Productos OITB -Tabla que representa información de la familia de productos. La extracción de las tablas origen dentro de la ETL para la tabla de dimensiones de Proveedores son las siguientes: OCRD Tabla que representa la información de Socios de Negocios tanto Clientes como Proveedores. OSLP Tabla que representa la información de Empleados de Compra. OSTG Tabla que representa los grupos que representan dichos Socios o Proveedores. CRD1 Tabla que representa las direcciones del Socio o Proveeedor.

Figura 5 - Diagrama de mapeo de tablas Anexas de Procedencia son las siguientes: OCRD Tabla que representa la información de Socios de Negocios tanto Clientes como Proveedores CRD1 Tabla que representa las direcciones del Socio o Proveeedor. OCST - Tabla de códigos de Paises. OCRY Tabla de códigos de Departamentos. Tiene como objetivo tener toda la base de datos de las direcciones de almacén de los proveedores internacionales para referenciar todos los orígenes posibles. son las siguientes: OALC Tabla que representa la información de la condición o tipo de gasto representado en la importación.

Tiene como objetivo tener toda la base de datos de las condiciones para el envío para los operadores logísticos para referenciar todos los orígenes posibles. de Estado_Aduana son las siguientes: @TE_ESTADOADUANA Tabla que representa la información del estado de la importación dentro de la oficina de aduana. Tiene como objetivo tener toda la base de datos de los estados para el envío dentro de la oficina de aduanas para referenciar todos los orígenes posibles. Figura 6 Mapeo de Tabla de Hechos de Importación de Imcoterm son las siguientes: @TE_INCOTERMINOS Tabla que representa la información de los términos internacionales de comercio

Tiene como objetivo tener toda la base de datos de los términos o condiciones internacionales para el comercio exterior referenciando todos los orígenes posibles. de Tipo de participación son las siguientes: @TE_TIPOPARTICIPA Tabla que representa la información de la condición o tipo de gasto representado en la importación. Tiene como objetivo tener toda la base de datos de las condiciones para el envío para los operadores logísticos para referenciar todos los orígenes posibles. Figura 7 Diagrama de extracción de tabla de Hechos Rendimiento Operadores La extracción de las tablas origen dentro de la ETL para la tabla de Hechos FT_Importacion y el FT_OperadorLogistico son las siguientes: OIPF Tabla que representa la información de la cabecera que representan gastos en una importación.

IPF1 - Tabla que representa la información del detalle de los productos que representan gastos en la importación IPF2 - Porcentaje de gasto en las importaciones sobre cada condición sea flete, almacenaje, documentación, aduanaje. OPDN Tabla que representa la cabecera de las guías de entrega. PDN1 Tabla que representa el detalle de las guías de entrega. PDN12 - Tabla que representa las direcciones de envio origen de las importaciones. OPCH Tabla que representa las facturas de gastos de importación. OITM Tabla que representa información de Productos OITB -Tabla que representa información de la familia de productos. Tiene como objetivo tener toda la base de datos de las combinaciones dentro de las compras de importación para referenciar todos los orígenes posibles. Figura 8 Diagrama de extracción de tabla de Hechos Importación