PONTIFICIA UNIVERSIDAD CATÓLICA DEL PERÚ



Documentos relacionados
ANEXO D Documento de Explotación. 1. Objetivo. 2. Alcance. 3. Fases de Explotación

ANEXO A - Plan de Proyecto EDT de la solución EDT GENERAL DEL PROYECTO1

Manual de Usuario Proveedor Módulo Cotizaciones

UNIVERSIDAD DE GUAYAQUIL

ing Solution La forma más efectiva de llegar a sus clientes.

Instalar el aplicativo con un usuario que sea administrador del sistema, e instalar para todos los usuarios.

Migración del Diagrama de Clases del Análisis al Modelo de Datos y a la Base de Datos en SQL Server 2000.x

Capítulo 2 Tecnología data warehouse

INSTRUCTIVO PARA GENERAR ANEXO ATS DESDE EXCEL

Sistema de Gestión Portuaria Sistema de Gestión Portuaria Uso General del Sistema

Eurowin 8.0 SQL. Manual del módulo TALLAS Y COLORES

Base de datos II Facultad de Ingeniería. Escuela de computación.

Solicitar la competencia Business Intelligence Solutions

34.- Cómo Hacer Evaluación del Desempeño

INSTRUCTIVO PARA REGISTRO ELECTRÓNICO DE DEJA SIN EFECTO PERMISOS Y FERIADOS. Enero

DOCUMENTO. Nº 416 GPRC/2014 Página 1 de 7 INFORME : GERENCIA GENERAL

Descripción. Este Software cumple los siguientes hitos:

Project Ing. Christian Ovalle

Pagos. Si desea acceder directamente a un capítulo, posicionese sobre el número de página y haga clic.

Ministerio de Salud de la Nación

Proceso Unificado de Rational PROCESO UNIFICADO DE RATIONAL (RUP) El proceso de desarrollo de software tiene cuatro roles importantes:

Bienvenido a la Guía de introducción - Utilidades

INSTRUCTIVO PRÉSTAMO DE EXPEDIENTES A USUARIOS INTERNOS CONTENIDO

SERVICE QUALITY INSTITUTE. BAD Software. Manual de Usuario. Fisis Consultores 6/20/2013

Manual de usuario del Centro de Control

MINISTERIO DE EDUCACIÓN DIRECCIÓN DE EDUCACIÓN TÉCNICA Y PROFESIONAL PROGRAMA DE LA ASIGNATURA BASE DE DATOS ESPECIALIDAD INFORMÁTICA.

CONVERSOR LIBROS DE REGISTRO (IVA IGIC) Agencia Tributaria DEPARTAMENTO DE INFORMÁTICA TRIBUTARIA

Manual del Sistema Extranet de Proveedores. Extranet de Proveedores. Versión 3.0. Manual de Usuario

MANUAL DE USUARIO PANEL DE CONTROL Sistema para Administración del Portal Web.

Manual de Ayuda. Sistema de Comercializacion RUBROS SRL - Desarrollado por Pragmatia

El desarrollo de este procedimiento se encuentra basado sobre los siguientes requisitos de control de documentación:

Para tener acceso al CAP, diríjase al sitio principal de SMG

Guías _SGO. Gestione administradores, usuarios y grupos de su empresa. Sistema de Gestión Online

Proceso de Gestión de la Información Sectorial. Manual de Usuario - Herramienta de cargue de Archivos - SIUST. Elaborado por:

Manual SAAE México 2012 EMPRESAS Manual para Software de Administración de Alumnos y Egresados

Manual de uso de la Consola de Administración para usuarios Administradores.

Es el listado de los productos que están ofertados en la página.

Manual de Usuario Comprador. Módulo Administración de Presupuesto. Iconstruy e S.A. Serv icio de Atención Telefónica:

Registro y consulta de clientes según la ley para la prevención de lavado de dinero en Neodata ERP.

Tema: INSTALACIÓN Y PARTICIONAMIENTO DE DISCOS DUROS.

Sistema para el control y tramitación de documentos SITA MSc. María de la Caridad Robledo Gómez y Ernesto García Fernández.

Base de datos en Excel

TRÁFICO DE PISO 2. Rev. 1 15/04/09

GUÍA TÉCNICA RÁPIDA DE CONFIGURACIÓN Y USO BRIDGE ODBC FOLIOS DIGITALES 2011

Comisión Nacional de Bancos y Seguros

BearSoft. SitodeCloud. Rafael Rios Bascón Web: Móvil:

Tecnologías Aplicadas a Business Intelligence Proyecto Práctico

"Diseño, construcción e implementación de modelos matemáticos para el control automatizado de inventarios

PROYECTO EDUCATIVO LA CALERA

A continuación se describen cuáles son los elementos principales de las tablas, cómo crear una y cómo modificarla.

USANDO SQL. EN BASE DE Ooo.

COMPRAS CEPAS A TRAVÉS DE INTERNET PORTAL CEPAS

Manual de usuario Versión: 1.3 Edición: 05/02/2015 1

Manual de usuario. Modulo Configurador V.1.0.1

MANUAL ECOMMERCE 2.0

Gestión de Permisos. Bizagi Suite. Copyright 2014 Bizagi

Diseño Técnico. Solución: Demo BeyeBuilder. Solucion ejemplo de BeyeBuilder para departamento de Ventas

SolucionesAnalíticas con Pentaho.

EDC Invoice V6. Guía de Migración a la versión 6. Diciembre 2010

Guía de usuario CUBO TI

Conector CONTPAQi Comercial GUIA DE INSTALACIÓN. Conector CONTPAQi CRM

INSTRUCTIVO ALTA DE BIEN O SERVICIO EN CATÁLOGO ALTA DE UN BIEN O SERVICIO EN CATÁLOGO

Sistema de Información de Compras y Contrataciones del Estado (SICE) Gestión y búsqueda de pedidos para compras comunes

Tema: CREACIÓN DE TABLAS DE RDBMS (RELATIONAL DATA BASE MANAGEMENT SYSTEM).

BASES DE DATOS TEMA 3 MODELO ENTIDAD - RELACIÓN

Administración de la producción. Sesión 10: Gestor de Base de Datos (Access)


Sistema de Captura de Información mensual de las Administradoras de Fondos. Manual de Usuario. Superintendencia de Compañías

Sociedad de Seguros de Vida del Magisterio Nacional. Sistema de Pignoraciones Web. Manual de Usuario. Marzo, 2012.

Construcción de Escenarios

Preguntas Frecuentes de MiCRM Enlace

Manual Consultas Web - PC Sistel Ver 486R4+ - USUARIO JEFATURA

Procedimiento para el alta de un empleado. Meta4. Valparaíso, Chile. PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO Dirección de Recursos Humanos

Guía rápida de configuración

Manual PARA EL ADMINISTRADOR DE LA WEB DE PRÁCTICAS PRE PROFESIONALES Y PASANTÍAS

MS Excel 2010 Avanzado y Tablas Dinámicas

Cuadrante Mágico de Gartner para BI 2013 vs. 2014

AVA-RPSystem. Introducción Características del producto Especificaciones Técnicas

Construcción de cubos OLAP utilizando Business Intelligence Development Studio

PHPMYADMIN Y MYSQL. Para gestionar la base de datos MySQL, lo haremos desde la aplicación PhpMyAdmin.

DIPRENA DIRECCION DE PRESUPUESTO DE LA NACION

Guía de Apoyo Project Web Access. (Jefe de Proyectos)

Novedades en Q-flow 3.02

Libertya BI 1.0. Guía de Usuario

GUÍA TÉCNICA RÁPIDA DE CONFIGURACIÓN Y USO BRIDGE ODBC FACTUREYA 2011 V1.0.0

Manual de Usuario SMS Inteligente

MANUAL DE USUARIO NOTAS PARCIALES VIA INTRANET

Manual Suspensión de Cheques

Visor de presupuestos en Android

SIIGO Pyme. Informes de Saldos y Movimientos de Inventarios. Cartilla I

Curso Excel Curso Excel Patrocinado por: Fecha de inicio: 23 de octubre Duración: 15 horas lectivas

DATA WAREHOUSING (ENERO DE 2003) Documento creado por Ing. Héctor H. Martínez Orpinel

SRM RELACIÓN CON LOS PROVEEDORES MANUAL DEL SUMINISTRADOR. Junio Versión 2

LA RED DE CAPACITACIÓN GASTRONÓMICA MÁS GRANDE DE LATINOAMÉRICA

Manual de Administración del sitio web Noviembre 1 de 2012

La Administración de Proyectos

Cómo ingresar a la Sucursal Electrónica?

SISTEMA DE GESTIÓN ACADÉMICA.

Cuadernillo de Autoaprendizaje Correo Electrónico Microsoft Outlook Express

FEDERACIÓN ARGENTINA DE EMPLEADOS DE COMERCIO Y SERVICIOS. Página 1 de 22 MESA DE AYUDA: ayuda@faecys.org.ar

Transcripción:

PONTIFICIA UNIVERSIDAD CATÓLICA DEL PERÚ FACULTAD DE CIENCIAS E INGENIERÍA ANÁLISIS, DISEÑO E IMPLEMENTACIÓN DE DATAMARTS PARA LAS ÁREAS DE VENTAS Y RECURSOS HUMANOS DE UNA EMPRESA DEDICADA A LA EXPORTACIÓN E IMPORTACIÓN DE PRODUCTOS ALIMENTICIOS Tesis para optar por el Título de Ingeniero Informático, que presenta el bachiller: Rolando Heli Moreno Reyes Anexo ASESOR: Edric Ricardo Jugo Soma Lima, junio del 2013

Índice Anexo A - Dimensiones... 1 Anexo B - Diseño de Extracción... 8 Anexo C - Diseño de Explotación... 43 Anexo D - Instalación Pentaho... 60 Anexo E - Configuración de la Herramienta ETL... 61 Anexo F - Instalación de SQL Server 2008... 63 Anexo G - Casos de Prueba... 73 Anexo H - Desarrollo de las Pruebas... 79 Anexo I - Ejecución y Pruebas del ETL... 116 Anexo J - Costo Total de Propiedad... 126 Anexo K - Funcionalidad de Kettle Pentaho... 127 Anexo L - Figuras... 129

Índice de Figuras Figura 1 - Instalación de Pentaho 2 (Kettle)... 60 Figura 2 - Instalación de Pentaho 3 (Kettle)... 60 Figura 3 - Configuración de Repositorio... 61 Figura 4 - Conexión a la Base de Datos... 61 Figura 5 - Test de Conexión... 62 Figura 6 - Pantalla de Diseño... 62 Figura 7 - Pantalla de Planificación de SQL Server 2008... 63 Figura 8 - Reporte de Configuración del Sistema... 63 Figura 9 - Pantalla de Instalación de SQL Server 2008... 64 Figura 10 - Reporte de Instalación del Sistema... 64 Figura 11 - Tipo de Instalación... 65 Figura 12 - Términos de Licencias de SQL Server... 65 Figura 13 - Componentes de Instalación... 66 Figura 14 - Reglas de Soporte... 66 Figura 15 - Componentes de Instalación... 67 Figura 16 - Configuración de la Instancia... 67 Figura 17 - Análisis de Requerimientos de Espacio en Disco... 68 Figura 18 - Configuración de Cuentas... 68 Figura 19 - Configuración de la Base de Datos... 69 Figura 20 - Configuración de los Servicios de Analysis Services... 69 Figura 21 - Configuración de los Servicios de Reporting Services... 70 Figura 22 - Envío de Reportes a Microsoft... 70 Figura 23 - Reglas Finales de Instalación... 71 Figura 24 - Resumen final de instalación... 71 Figura 25 - Progreso de instalación... 72 Figura 26 - Resumen de instalación final... 72 Figura 27 - ETL de Extracción del Datamart de Ventas... 116 Figura 28 - Job de Extracción del Datamart de Ventas... 116 Figura 29 - ETL de Transformación del Datamart de Ventas... 117 Figura 30 - Primer Job de Transformación de la Fact de Ventas... 117 Figura 31 Segundo Job de Transformación de la Fact de Ventas... 118 Figura 32 - ETL de Carga del Datamart de Ventas... 118 Figura 33 - Job de Carga de Una Dimensión del Datamart de Ventas... 119 Figura 34 - Job de Carga de Fact de Venta... 119

Figura 35 - Data de la Fact de Ventas... 119 Figura 36 - ETL de Extracción del Datamart de Recursos Humanos... 120 Figura 37 - Job de Extracción del Datamart de Ventas... 120 Figura 38- ETL de Transformación del Datamart de Recursos Humanos... 121 Figura 39 - Job de Transformación para la Dimensión Mes... 121 Figura 40 - Job de Transformación de la Fact de Personal... 121 Figura 41 - Job de Transformación de la Fact de Licencias... 122 Figura 42- Job de Transformación de la Fact de Movimientos... 122 Figura 43 - ETL de Carga del Datamart de Recursos Humanos... 123 Figura 44 - Job de Carga de Una Dimensión del Datamart de Recursos Humanos... 123 Figura 45 - Job de Carga de Fact de Recursos Humanos... 124 Figura 46 - Data de la Fact de Personal... 124 Figura 47 - Data de la Fact de Licencias... 124 Figura 48 - Data de la Fact de Movimientos... 125

Anexo A - Dimensiones DATAMART DE VENTAS Dimensión Cliente Descripción La dimensión Cliente es aquella dimensión que posee las características de los clientes a quienes la organización vende sus productos. Atributos Nombre del Atributo id_cliente Descripción Código numérico del cliente. Es un correlativo. Contenido Numérico Formato Valor por Defecto Ninguno codigo Código que identifica al cliente. Numérico Ninguno nombre Nombre completo del cliente Cadena de caracteres tipo Tipo de cliente para la empresa. Cadena de caracteres RUC RUC del cliente. Cadena de caracteres direccion Dirección del cliente. Cadena de caracteres telefono Teléfono con el cual contactar al cliente. Cadena de caracteres e-mail Correo electrónico del cliente. Cadena de caracteres Ninguno Ninguno Ninguno Ninguno Ninguno Ninguno Dimensión Tiempo Descripción La dimensión Tiempo es aquella dimensión que posee todas las características respecto al tiempo (dia, mes, año, trimestre etc.). Jerarquías Jerarquía 1 Representa a qué nivel de detalle de tiempo se desea observar las consultas (día, mes, trimestre, año, etc.) 1

Nivel Nivel 1 Nivel 2 Nivel 3 Nivel 4 Atributos Año Trimestre Mes Dia Atributos Contenido Nombre del Valor por Atributo Descripción Formato Defecto id_tiempo Código numérico del tiempo. Es un Numérico Ninguno correlativo. anho Año Cadena de Ninguno caracteres num_trimestre Número del trimestre (1 al 4) Numérico Ninguno trimestre Nombre del trimestre. Cadena de Ninguno caracteres num_mes Número del mes (1 al 12) Numérico Ninguno dia Número del día (1 al 31) Numérico Ninguno Dimensión Ubicación Descripción La dimensión Ubicación es aquella la cual posee las características de los lugares donde la empresa comercializa sus productos. Ejemplos: zona, departamento, provincia, etc. Jerarquía Jerarquía 1 Representa a qué nivel de detalle se desea observar la ubicación. Nivel Nivel 1 Nivel 2 Nivel 3 Nivel 4 Atributos Zona Departamento Provincia Ciudad Atributos Nombre del Atributo id_ubicación Contenido Descripción Formato Código numérico de la ubicación. Es un Numérico correlativo. Valor por Defecto Ninguno 2

Nombre del Atributo Descripción Contenido Formato zona Zona donde se realizo la venta. Cadena de caracteres departamento Departamento donde se realizo la venta. Cadena de caracteres provincia Provincia donde se realizo la venta. Cadena de caracteres ciudad Ciudad donde se realizo la venta. Cadena de caracteres Valor por Defecto Ninguno Ninguno Ninguno Ninguno Dimensión Vendedor Descripción La dimensión Vendedor es aquella la cual posee las características del vendedor de la organización. Atributos Nombre del Atributo id_vendedor Contenido Descripción Formato Código numérico del vendedor. Es un Numérico correlativo. Valor por Defecto Ninguno codigo Código que identifica al vendedor. Cadena de caracteres nombre Nombre completo del vendedor. Cadena de caracteres e-mail Correo electrónico del vendedor. Cadena de caracteres Ninguno Ninguno Ninguno Dimensión Devolución Descripción La dimensión Devolución es aquella dimensión que indica si un producto ha sido devuelto o no luego de haber sido entregado. Atributos Nombre del Atributo id_esdevuelto descripcion Contenido Descripción Formato Código que indica si el producto ha sido Numérico devuelto o no. 0: No hay devolución. 1: Si hay devolución. Breve descripción sobre si el producto es Cadena de devuelto o no. caracteres Valor por Defecto Ninguno Ninguno 3

DATAMART DE RECURSOS HUMANOS Dimensión Vínculo Descripción La dimensión Vínculo es aquella dimensión que muestra si un personal administrativo es Contratado o Nombrado. Atributos Nombre del Contenido Atributo Descripción Formato id_vinculo Código numérico que identifica al vínculo. 0 Numérico si es Contratado, 1 si es Nombrado. vinculo Vinculo: Contratado o Nombrado. Cadena de caracteres Valor por Defecto Ninguno Ninguno Dimensión Rol Descripción La dimensión Rol es aquella dimensión que muestra roles a los que pertenece cada personal de la organización (Directivo, Profesional, Técnico, Obrero, etc.). Atributos Contenido Nombre del Valor por Atributo Descripción Formato Defecto id_rol Código numérico del rol. Es un correlativo. Numérico Ninguno rol Descripción del rol. Cadena de caracteres Ninguno Dimensión ONP Descripción La dimensión ONP es aquella dimensión que indica si el personal pertenece o no a la ONP. 4

Atributos Nombre del Atributo id_onp Contenido Descripción Formato Identifica si pertenece o no a la ONP. 0 no Numérico pertenece, 1 sí pertenece. Valor por Defecto Ninguno onp 0: No es ONP. 1: Es ONP. Cadena de caracteres. Ninguno Dimensión AFP Descripción La dimensión AFP es aquella dimensión que indica a que AFP pertenece el personal de la organización. Atributos Contenido Nombre del Valor por Atributo Descripción Formato Defecto id_afp Código numérico de la AFP Numérico Ninguno afp Nombre de la AFP. Cadena de Ninguno caracteres. porc_descuento Porcentaje de descuento de la AFP. Numérico Ninguno Dimensión Puesto Descripción Es aquella dimensión que describe el Puesto de un personal de la organización. Atributos Nombre del Atributo id_puesto Contenido Descripción Formato Código numérico del puesto. Es un Numérico correlativo. Valor por Defecto Ninguno puesto Descripción del puesto del personal. Cadena de caracteres Ninguno 5

Dimensión Persona Descripción La dimensión Persona es aquella dimensión que describe las características del personal de la organización. Atributos Nombre del Atributo id_persona Contenido Descripción Formato Código numérico del personal. Es un Numérico correlativo. Valor por Defecto Ninguno codigo Código que identifica al personal de la organización. Cadena de caracteres Ninguno nombre Nombre del personal. Cadena de caracteres Ninguno Dimensión Oficina Descripción Es aquella dimensión que describe el área en la que labora un personal de la empresa. Atributos Nombre del Atributo id_oficina Descripción Código numérico de la oficina. Es un correlativo. Contenido Numérico Formato Valor por Defecto Ninguno oficina Descripción de la oficina a la que pertenece el personal de la organización. Cadena de caracteres Ninguno Dimensión Licencia Descripción Es aquella dimensión que describe la licencia que un personal puede pedir. Por ejemplo licencia por enfermedad, vacaciones, etc. 6

Atributos Nombre del Contenido Atributo Descripción Formato id_licencia Código numérico de la licencia. Es un Numérico correlativo. licencia Descripción de la licencia. Cadena de caracteres Valor por Defecto Ninguno Ninguno Dimensión Tiempo Descripción La dimensión Tiempo es aquella dimensión que posee todas las características respecto al tiempo (dia, mes, año, trimestre etc.). Jerarquías Jerarquía 1 Representa a qué nivel de detalle de tiempo se desea observar las consultas (día, mes, trimestre, año, etc.). Nivel Nivel 1 Nivel 2 Nivel 3 Nivel 4 Atributos Año Trimestre Mes Dia Atributos Nombre del Atributo id_tiempo Descripción Código numérico del tiempo. Es un correlativo. Contenido Numérico Formato Valor por Defecto Ninguno anho Año Cadena de Ninguno caracteres num_trimestre Número del trimestre (1 al 4) Numérico Ninguno trimestre Nombre del trimestre Cadena de Ninguno caracteres num_mes Número del mes (1 al 12) Numérico Ninguno dia Número del día (1 al 31) Numérico Ninguno 7

Anexo B - Diseño de Extracción DATAMART DE VENTAS Carga de la dimensión Cliente a) Descripción Es el proceso que consiste en realizar carga de la dimensión dimcliente desde la tabla t0001_cliente que se encuentra en la base de datos de ventas. b) Descripción de las tablas fuentes Tipo de Fuente Nombre de Tabla Descripción Base de Datos de la t0001_cliente La tabla contiene información acerca de Empresa (MySQL) los clientes con los que cuenta la organización. c) Estandarización de Datos y Limpieza de Datos Nombre Llave Tipo Formato Limpieza Valor por Defecto id_cliente PK Integer Numérico No debe ser NO TIENE nulo codigo Varchar(10) Texto NO TIENE nombre Varchar(100) Texto NO TIENE tipo Varchar(45) Texto NO TIENE RUC Varchar (11) Texto NO TIENE dirección Varchar(100) Texto NO TIENE teléfono Varchar(30) Texto NO TIENE e-mail Varchar(45) Texto NO TIENE d) Fuentes de Datos Tabla: t0001_cliente Nombre Llave Tipo Formato Consideración Importante id_cliente PK Integer Numérico NO TIENE codigo_cliente Varchar(10) Texto NO TIENE 8

Tabla: t0001_cliente Nombre Llave Tipo Formato Consideración Importante nombre_cliente Varchar(100) Texto Espacios en Blanco tipo_cliente Varchar(45) Texto NO TIENE ruc_cliente Varchar(11) Texto NO TIENE dirección_cliente Varchar(100) Texto NO TIENE telefono_cliente Varchar(30) Texto NO TIENE email_cliente Varchar(45) Texto NO TIENE e) Tabla destino Tabla: dimcliente Campo Tipo Mapeo id_cliente Integer t0001_cliente.id_cliente codigo Varchar(10) t0001_cliente.codigo_cliente nombre Varchar(100) t0001_cliente.nombre_cliente tipo Varchar(45) t0001_cliente.tipo_cliente RUC Varchar (11) t0001_cliente.ruc_cliente dirección Varchar(100) t0001_cliente.dirección_cliente teléfono Varchar(30) t0001_cliente.telefono_cliente e-mail Varchar(45) t0001_cliente.email_cliente f) Proceso i. Carga de registros en un archivo intermedio Se extrajo los datos de la tabla t0001_cliente de acuerdo al mapeo y se cargó en un archivo de texto intermedio Cliente. ii. Carga de la Dimensión Se extrajo los valores del archivo Cliente y se cargó en la dimensión dimcliente. En caso los registros hagan referencia a nuevos clientes se insertan las nuevas filas en la tabla; caso contrario, si los registros hacen referencia a antiguos clientes actualizar el código, nombre, tipo, RUC, dirección, teléfono y email del cliente. iii. Borrar el archivo intermedio Se borró el archivo intermedio Cliente. 9

Carga de la dimensión Tiempo a) Descripción Es el proceso que consiste en realizar la carga de la dimensión dimtiempo. Se carga a partir de una tabla generada mediante un procedimiento ejecutado en la base de datos MySQL. b) Descripción de las tablas fuentes Tipo de Fuente Nombre de Tabla Descripción Base de Datos de la Empresa (MySQL) dimtiempo Tabla de tiempo que es generada mediante un procedimiento en MySQL. Posee todos los días a partir del año 2006. c) Estandarización de Datos y Limpieza de Datos Nombre Llave Tipo Formato Limpieza Valor por Defecto id_tiempo PK Integer Numérico No debe ser nulo NO TIENE anho Integer Numérico NO TIENE num_trimestre Integer Numérico NO TIENE trimestre Varchar(45) Texto NO TIENE num_mes Integer Numérico NO TIENE mes Varchar(30) Texto NO TIENE dia Integer Numérico NO TIENE d) Fuentes de Datos Tabla: dimtiempo Nombre Llave Tipo Formato Consideración Importante id_tiempo PK Integer Numérico NO TIENE anho Integer Numérico NO TIENE num_trimestre Integer Numérico NO TIENE Trimestre Varchar(45) Texto NO TIENE num_mes Integer Numérico NO TIENE mes Varchar(30) Texto NO TIENE dia Integer Numérico NO TIENE 10

e) Tabla destino Tabla: dimtiempo Campo Tipo Mapeo id_tiempo Integer dimtiempo.id_tiempo anho Integer dimtiempo.anho num_trimestre Integer dimtiempo.num_trimestre trimestre Varchar(45) dimtiempo.trimestre num_mes Integer dimtiempo.num_mes mes Varchar(30) dimtiempo.mes dia Integer dimtiempo.dia f) Proceso i. Creación de la tabla dimtiempo en MySQL Se realiza un procedimiento para cargar la tabla dimtiempo con todos los días del año a partir del primero de enero del 2006. ii. Carga de registros en un archivo intermedio Se extrajo los datos de la tabla dimtiempo de acuerdo al mapeo, y se cargó en un archivo de texto intermedio Tiempo. iii. Carga de la Dimensión Se extrajo los valores del archivo intermedio Tiempo y se cargó en la dimensión dimtiempo de acuerdo al mapeo. Este proceso se realiza mediante un Truncate a la tabla dimtiempo ; es decir, si existiesen datos en la tabla entonces estas se borraran para proceder a la nueva carga respectiva. iv. Borrar el archivo intermedio Se borró el archivo intermedio Tiempo. 11

Carga de la dimensión Ubicación a) Descripción Es el proceso que consiste en realizar la carga de la dimensión dimubicacion desde las tablas t0004_ciudad, t0005_provincia, t0006_dpto y t0007_zona que se encuentran en la base de datos de ventas. b) Descripción de las tablas fuentes Tipo de Fuente Nombre de Tabla Descripción Base de Datos de la t0004_ciudad La tabla contiene el nombre de la ciudad Empresa (MySQL) donde se realiza una venta Base de Datos de la Empresa (MySQL) Base de Datos de la Empresa (MySQL) Base de Datos de la Empresa (MySQL) t0005_provincia t0006_dpto t0007_zona La tabla contiene el nombre de la provincia donde se realiza una venta La tabla contiene el nombre del departamento donde se realiza una venta La tabla contiene el nombre de la zona donde se realiza una venta c) Estandarización de Datos y Limpieza de Datos Nombre Llave Tipo Formato Limpieza Valor por Defecto id_ubicacion PK Integer Numérico No debe ser nulo NO TIENE ciudad Varchar(45) Texto NO TIENE provincia Varchar(45) Texto NO TIENE departamento Varchar(45) Texto NO TIENE zona Varchar(45) Texto NO TIENE d) Fuentes de Datos Tabla: t0004_ciudad Nombre Llave Tipo Formato Consideración Importante id_ciudad PK Integer Numérico NO TIENE descripcion_ciudad Varchar(45) Texto NO TIENE 12

Tabla: t0005_provincia Nombre Llave Tipo Formato Consideración Importante descripcion_provincia Varchar(45) Texto NO TIENE Tabla: t0006_dpto Nombre Llave Tipo Formato Consideración Importante descripcion_dpto Varchar(45) Texto NO TIENE Tabla: t0007_zona Nombre Llave Tipo Formato Consideración Importante descripcion_zona Varchar(45) Texto NO TIENE e) Tabla destino Tabla: dimubicacion Campo Tipo Mapeo id_ubicacion Integer t0004_ciudad.id_ciudad ciudad Varchar(45) t0004_ciudad.descripcion_ciudad provincia Varchar(45) t0005_provincia.descripcion_provincia departamento Varchar(45) t0006_dpto.descripcion_dpto zona Varchar(45) t0007_zona.descripcion_zona f) Proceso i. Carga de registros en un archivo intermedio Se extrajo los datos de las tablas t0004_ciudad, t0005_provincia, t0006_dpto y t0007_zona de acuerdo al mapeo y se cargó en un archivo de texto intermedio Ubicacion. ii. Carga de la Dimensión Se extrajo los valores del archivo Ubicacion y se cargó en la dimensión dimubicacion. En caso los registros hagan referencia a nuevos puntos de ventas se insertan las nuevas filas en la tabla; caso contrario, si los registros hacen referencia a antiguos puntos de ventas actualizar la ciudad, provincia, departamento y la zona. iii. Borrar el archivo intermedio Se borró el archivo intermedio Ubicacion. 13

Carga de la dimensión Vendedor a) Descripción Es el proceso que consiste en realizar la carga de la dimensión dimvendedor desde la tabla t0008_vendedor que se encuentra en la base de datos de ventas. b) Descripción de las tablas fuentes Tipo de Fuente Nombre de Tabla Descripción Base de Datos de la t0008_vendedor La tabla contiene todas las características Empresa (MySQL) de los vendedores de la organización c) Estandarización de Datos y Limpieza de Datos Nombre Llave Tipo Formato Limpieza Valor por Defecto id_vendedor PK Integer Numérico No debe ser nulo NO TIENE codigo Varchar(10) Texto NO TIENE nombre Varchar(100) Texto NO TIENE email Varchar(45) Texto NO TIENE d) Fuentes de Datos Tabla: t0008_vendedor Nombre Llave Tipo Formato Consideración Importante id_vendedor PK Integer Numérico NO TIENE codigo_vendedor Varchar(10) Texto NO TIENE nombre_ vendedor Varchar(100) Texto Espacios en Blanco email_ vendedor Varchar(45) Texto NO TIENE e) Tabla destino Tabla: dimvendedor Campo Tipo Mapeo id_vendedor Integer t0008_vendedor.id_vendedor codigo Varchar(10) t0008_vendedor.codigo_vendedor nombre Varchar(100) t0008_vendedor.nombre_vendedor email Varchar(45) t0008_vendedor.email_vendedor 14

f) Proceso i. Carga de registros en un archivo intermedio Se extrajo los datos de la tabla t0008_vendedor de acuerdo al mapeo y se cargó en un archivo de texto intermedio Vendedor. ii. Carga de la Dimensión Se extrajo los valores del archivo Vendedor y se cargó en la dimensión dimvendedor. En caso los registros hagan referencia a nuevos vendedores se insertan las nuevas filas en la tabla; caso contrario, si los registros hacen referencia a antiguos vendedores actualizar el código, nombre y email del vendedor. iii. Borrar el archivo intermedio Se borró el archivo intermedio Vendedor. Carga de la dimensión Devolución a) Descripción Es el proceso que consiste en realizar la carga de la dimensión dimdevolucion desde un archivo de texto. b) Descripción de las tablas fuentes Tipo de Fuente Nombre de archivo Descripción Archivo de Texto devolucion.txt El archivo contiene el detalle que indica si un producto ha sido devuelto o no. c) Estandarización de Datos y Limpieza de Datos Nombre Llave Tipo Formato Limpieza Valor por Defecto id_devolucion PK Integer Numérico No debe ser nulo NO TIENE descripcion Varchar(45) Texto NO TIENE 15

d) Fuentes de Datos Archivo: devolucion.txt Nombre Llave Tipo Formato Consideración Importante id_devolucion PK Integer Numérico NO TIENE descripcion Varchar(45) Texto Espacios en Blanco e) Tabla destino Tabla: dimdevolucion Campo Tipo Mapeo id_devolucion Integer devolucion.txt.id_devolucion descripcion Varchar(45) devolucion.txt descripcion f) Proceso i. Carga de registros en un archivo de texto Se creó los datos en un archivo de texto devolucion.txt. ii. Carga de la Dimensión Se cargó el archivo devolucion.txt en la dimensión dimdevolucion. En caso los registros hayan sido modificados la descripción será actualizada. Carga de la fact table Ventas a) Descripción Es el proceso que consiste en realizar la carga de la fact table factventas. b) Descripción de las tablas fuentes Tipo de Fuente Nombre de Tabla Descripción Base de Datos del dimtiempo Tabla de la dimensión de tiempo Datamart (SQLServer) Base de Datos de la Empresa (MySQL) t0001_cliente La tabla contiene información acerca de los clientes con los que cuenta la Base de Datos de la Empresa (MySQL) Base de Datos de la Empresa (MySQL) t0002_producto t0008_vendedor organización. La tabla contiene todas las características de los productos con los que trabaja la organización. La tabla contiene todas las características de los vendedores de la organización 16

Base de Datos de la Empresa (MySQL) Base de Datos de la Empresa (MySQL) t0009_ventas t0010_detventas Tabla que describe una venta realizada. Tabla que describe el detalle de las ventas realizadas. Archivo de texto devolucion.txt Archivo de texto que contiene la información sobre si un producto es eliminado o no. Archivo de excel devolucionestotal.xls Archivo excel que contiene el detalle sobre todas las devoluciones que ha tenido la organización. c) Estandarización de Datos y Limpieza de Datos Nombre Llave Tipo Formato Limpieza Valor por Defecto id_ubicacion FK Integer Numérico No debe ser nulo NO TIENE id_producto FK Integer Numérico No debe ser nulo NO TIENE id_tiempo FK Integer Numérico No debe ser nulo NO TIENE id_cliente FK Integer Numérico No debe ser nulo NO TIENE id_vendedor FK Integer Numérico No debe ser nulo NO TIENE id_devolucion FK Integer Numérico No debe ser nulo NO TIENE monto Float Numérico No debe ser nulo NO TIENE cantidad Integer Numérico No debe ser nulo NO TIENE devoluciones Integer Numérico No debe ser nulo NO TIENE montodevuelto Float Numérico No debe ser nulo NO TIENE factordevuelto Float Numérico NO TIENE NO TIENE d) Fuentes de Datos Tabla: dimtiempo Nombre Llave Tipo Formato Consideración Importante id_tiempo PK Integer Numérico NO TIENE Tabla: t0002_producto Nombre Llave Tipo Formato Consideración Importante id_producto PK Integer Numérico NO TIENE Tabla: t0008_vendedor Nombre Llave Tipo Formato Consideración Importante id_vendedor PK Integer Numérico NO TIENE 17

Tabla: t0001_cliente Nombre Llave Tipo Formato Consideración Importante id_cliente PK Integer Numérico NO TIENE id_ciudad FK Integer Numérico NO TIENE Tabla: t0009_ventas Nombre Llave Tipo Formato Consideración Importante id_venta PK Integer Numérico NO TIENE id_cliente FK Integer Numérico NO TIENE id_vendedor FK Integer Numérico NO TIENE fecha Date Fecha NO TIENE Tabla: t0010_detventas Nombre Llave Tipo Formato Consideración Importante id_venta PK Integer Numérico NO TIENE id_producto PK Integer Numérico NO TIENE cantidad_detventa Integer Numérico NO TIENE subtotal_detventa Decimal Numérico NO TIENE Archivo: devolucion.txt Nombre Llave Tipo Formato Consideración Importante id_devolucion PK Integer Numérico NO TIENE Archivo: devolucionestotal.xls Nombre Llave Tipo Formato Consideración Importante cliente Texto Texto NO TIENE producto Texto Texto NO TIENE fecha Date Fecha NO TIENE devoluciones Integer Numérico NO TIENE e) Tabla destino Tabla: factventas Campo Tipo Mapeo id_ubicacion Integer t0001_cliente.id_ciudad id_producto Integer t0002_producto.id_producto id_tiempo Integer dimtiempo.id_tiempo id_cliente Integer t0001_clienteid_cliente id_vendedor Integer t0008_vendedor.id_vendedor id_devolucion Integer devolucion.txt.id_devolucion 18

Tabla: factventas Campo Tipo Mapeo monto Float t0010_detventas.subtotal_detventa cantidad Integer t0010_detventas.cantidad_detventa devoluciones Integer devolucionestotal.xls.devoluciones montodevuelto Float Cálculo interno factordevuelto Float Cálculo interno f) Proceso i. Cargar de registros en archivos intermedios Se extrajo las fechas de ventas de la tabla t0009_ventas y se cargó en un archivo intermedio Temp_VentaTiempo. Se extrajo las medidas e ID s que formaran la fact table desde las tablas t0001_cliente, t0002_poducto, t0008_vendedor, t0009_ventas y t0010_detventas y se cargó en un archivo intermedio Detalle_Ventas. ii. Carga de tablas temporales Se cargó los datos del archivo Temp_VentaTiempo en una tabla temporal tmp_tiempo. iii. Transformación Se hizo el join entre la tabla temporal tmp_tiempo y la tabla dimtiempo para hallar los ID s del periodo de tiempo a cargar en la fact table. Los registros obtenidos fueron cargados en un archivo intermedio VentasTiempo. Se hizo el join entre los archivos intermedios VentasTiempo y Detalle_Ventas. Luego se hizo el join con el excel devolucionestotal.xls. Los registros obtenidos fueron cargados a un archivo intermedio Fact_Ventas. iv. Carga de la Fact Se extrajo los valores del archivo Fact_Ventas y se cargó en la fact table factventas. Este proceso de carga se realiza mediante un 19

Truncate a la fact table; es decir, por cada procesamiento de carga de la fact los registros son previamente borrados. v. Borrar los archivos intermedios y tablas temporales Se borró la tabla temporal tmp_tiempo y los archivos intermedios Temp_VentaTiempo, Detalle_Ventas, VentasTiempo y Fact_Ventas. Esquema de extracción Secuencia Mensual N Proceso Dependencia 1 Carga de la dimensión Producto NO TIENE 2 Carga de la dimensión Cliente NO TIENE 3 Carga de la dimensión Tiempo NO TIENE 4 Carga de la dimensión Ubicación NO TIENE 5 Carga de la dimensión Vendedor NO TIENE 6 Carga de la dimensión Devolucion NO TIENE 7 Carga de la fact table Ventas 1,2,3,4,5,6 20

DATAMART DE RECURSOS HUMANOS Carga de la dimensión Rol a) Descripción Es el proceso que consiste en realizar la carga de la dimensión dimrol desde la tabla t001_rol que se encuentra en la base de datos de recursos humanos. b) Descripción de las tablas fuentes Tipo de Fuente Nombre de Tabla Descripción Base de Datos de la Empresa (MySQL) t001_rol La tabla contiene los diferentes roles en los que puede estar clasificado un trabajador de la empresa c) Estandarización de Datos y Limpieza de Datos Nombre Llave Tipo Formato Limpieza Valor por Defecto id_rol PK Integer Numérico No debe ser NO TIENE nulo rol Varchar(45) Texto NO TIENE d) Fuentes de Datos Tabla: t001_rol Nombre Llave Tipo Formato Consideración Importante id_rol PK Integer Numérico NO TIENE rol Varchar(45) Texto NO TIENE e) Tabla destino Tabla: dimrol Campo Tipo Mapeo id_rol Integer t001_rol.id_rol rol Varchar(45) t001_rol.rol 21

f) Proceso i. Carga de registros en un archivo intermedio Se extrajo los datos de la tabla t001_rol de acuerdo al mapeo y se cargó en un archivo de texto intermedio Rol. ii. Carga de la Dimensión Se extrajo los valores del archivo Rol y se cargó en la dimensión dimrol. En caso los registros hagan referencia a nuevos roles se insertan las nuevas filas en la tabla; caso contrario, si los registros hacen referencia a antiguos roles actualizar sólo la descripción del rol. iii. Borrar el archivo intermedio Se borró el archivo intermedio Rol Carga de la dimensión Oficina a) Descripción Es el proceso que consiste en realizar la carga de la dimensión dimoficina desde la tabla t002_oficina que se encuentra en la base de datos de recursos humanos. b) Descripción de las tablas fuentes Tipo de Fuente Nombre de Tabla Descripción Base de Datos de la Empresa (MySQL) t002_oficina La tabla contiene la lista de todas las oficinas que existen en la empresa. c) Estandarización de Datos y Limpieza de Datos Nombre Llave Tipo Formato Limpieza Valor por Defecto id_oficina PK Integer Numérico No debe ser NO TIENE nulo oficina Varchar(45) Texto NO TIENE 22

d) Fuentes de Datos Tabla: t002_oficina Nombre Llave Tipo Formato Consideración Importante id_oficina PK Integer Numérico NO TIENE oficina Varchar(45) Texto NO TIENE e) Tabla destino Tabla: dimoficina Campo Tipo Mapeo id_oficina Integer t002_oficina.id_oficina oficina Varchar(45) t002_oficina oficina f) Proceso i. Carga de registros en un archivo intermedio Se extrajo los datos de la tabla t002_oficina de acuerdo al mapeo y se cargó en un archivo de texto intermedio Oficina. ii. Carga de la Dimensión Se extrajo los valores del archivo Oficina y se cargó en la dimensión dimoficina. En caso los registros hagan referencia a nuevos oficinas se insertan las nuevas filas en la tabla; caso contrario, si los registros hacen referencia a antiguas oficinas actualizar sólo la descripción de la oficina. iii. Borrar el archivo intermedio Se borró el archivo intermedio Oficina Carga de la dimensión Puesto a) Descripción Es el proceso que consiste en realizar la carga de la dimensión dimpuesto desde la tabla t003_puesto que se encuentra en la base de datos de recursos humanos. 23

b) Descripción de las tablas fuentes Tipo de Fuente Nombre de Tabla Descripción Base de Datos de la Empresa (MySQL) t003_puesto La tabla contiene la lista de todos los puestos de los trabajadores de la empresa. c) Estandarización de Datos y Limpieza de Datos Nombre Llave Tipo Formato Limpieza Valor por Defecto id_puesto PK Integer Numérico No debe ser NO TIENE nulo puesto Varchar(45) Texto NO TIENE d) Fuentes de Datos Tabla: t003_puesto Nombre Llave Tipo Formato Consideración Importante id_puesto PK Integer Numérico NO TIENE puesto Varchar(45) Texto NO TIENE e) Tabla destino Tabla: dimpuesto Campo Tipo Mapeo id_puesto Integer t003_puesto.id_puesto puesto Varchar(45) t003_puesto.puesto f) Proceso i. Carga de registros en un archivo intermedio Se extrajo los datos de la tabla t003_puesto de acuerdo al mapeo y se cargó en un archivo de texto intermedio Puesto. ii. Carga de la Dimensión Se extrajo los valores del archivo Puesto y se cargó en la dimensión dimpuesto. En caso los registros hagan referencia a nuevos puestos se insertan las nuevas filas en la tabla; caso contrario, si los registros hacen referencia a antiguos puestos sólo actualizar la descripción del puesto. 24