DATAWAREHOUSE DEL REGISTRO ACADÉMICO DE LA UNIVERSIDAD CENTROAMERICANA JOSÉ SIMEÓN CAÑAS FACULTAD DE INGENIERÍA Y ARQUITECTURA

Tamaño: px
Comenzar la demostración a partir de la página:

Download "DATAWAREHOUSE DEL REGISTRO ACADÉMICO DE LA UNIVERSIDAD CENTROAMERICANA JOSÉ SIMEÓN CAÑAS FACULTAD DE INGENIERÍA Y ARQUITECTURA"

Transcripción

1 UNIVERSIDAD CENTROAMERICANA JOSÉ SIMEÓN CAÑAS DATAWAREHOUSE DEL REGISTRO ACADÉMICO DE LA UNIVERSIDAD CENTROAMERICANA JOSÉ SIMEÓN CAÑAS TRABAJO DE GRADUACIÓN PREPARADO PARA LA FACULTAD DE INGENIERÍA Y ARQUITECTURA PARA OPTAR AL GRADO DE LICENCIADO EN CIENCIAS DE LA COMPUTACIÓN POR MELVIN GILBERTO CAMPOS MEJÍA CECILIA ELIZABETH GUEVARA AYALA ANA LISSETTE ROSALES INESTROZA OCTUBRE 2006 SAN SALVADOR, EL SALVADOR, C.A.

2

3 RECTOR JOSÉ MARÍA TOJEIRA, S.J. SECRETARIO GENERAL RENÉ ALBERTO ZELAYA DECANO DE LA FACULTAD DE INGENIERÍA Y ARQUITECTURA CELINA PÉREZ RIVERA COORDINADOR DE LA CARRERA DE LICENCIATURA EN CIENCIAS DE LA COMPUTACIÓN ALICIA ALVARENGA CONDE DIRECTOR DEL TRABAJO RAQUEL GUADALUPE DE MÉNDEZ LECTOR ALICIA ALVARENGA CONDE

4

5 AGRADECIMIENTOS A Dios nuestro Padre Celestial, por habernos concedido la sabiduría necesaria para llevar a cabo esta labor, así como también la fortaleza para resistir los momentos más difíciles que se presentaron a lo largo del desarrollo de este trabajo. A nuestras familias, por habernos brindado su confianza, cariño y apoyo incondicional en cada uno de los momentos importantes de nuestras vidas. A nuestros seres queridos, que tuvieron fe en el éxito de nuestra formación profesional y que siempre nos tuvieron presentes en sus mentes y oraciones. A nuestros amigos y compañeros junto a los que luchamos para conseguir nuestras metas y cuyo apoyo y confianza nos permitió seguir adelante. A nuestra directora, la Lic. Raquel de Méndez, porque sus observaciones y consejos, nos permitieron consolidar nuestros conocimientos, para presentar un proyecto que reflejara el trabajo y esfuerzo realizados. Deseamos hacer un agradecimiento especial, al Lic. Hugo Guerrero, quien a pesar de las dificultades que se presentaron, no dejó de brindarnos sus consejos, que fueron de gran importancia en la etapa inicial del desarrollo de nuestro proyecto, así como también durante las etapas críticas de este. Finalmente, queremos agradecer a todas las personas que se involucraron de una u otra forma en el desarrollo del proyecto, y que sin su colaboración no hubiera sido posible llevar a cabo de manera exitosa, algunas de las etapas de este. Melvin Campos, Cecilia Guevara y Ana Lissette Rosales

6

7 DEDICATORIA Dedico este logro a: Dios Todopoderoso, por haberme permitido culminar mis estudios, por la cantidad de bendiciones que ha derramado y sigue derramando sobre mí y mi familia y por darme la fuerza necesaria para seguir adelante. A mis padres, por brindarme su amor y apoyo incondicional, por la confianza que han depositado en mí durante estos años de estudio y por haberme enseñado lo mejor para saber conducirme en esta vida con sabiduría. A mis hermanos por brindarme su cariño, apoyo y protección y por tenerme siempre presente en sus vidas. A mis sobrinos, mis niños adorados, por alegrarme cada uno de los días que están conmigo con sus risas y sus juegos. A toda mi familia, mi abuela, tíos y primos, que han estado siempre pendientes de mí y me han brindado su apoyo con mucho cariño sin esperar nada a cambio. A todos los amigos que han estado siempre conmigo, gracias por todos esos momentos agradables que hemos compartido. A mis compañeros de la universidad, por todos esos sacrificios y desvelos que hemos pasado a lo largo de estos años de estudio, porque al fin serán recompensados. Ana Lissette Rosales Dedico este logro a mi Padre Celestial, por todo el amor que me ha dado, por acompañarme en todo momento brindándome protección y fortaleza para salir adelante, y por permitirme culminar mis estudios Universitarios. A mis padres, por su cariño y comprensión, porque a pesar de la distancia siempre están presentes dándome el apoyo necesario, y porque nunca han desconfiado en mis capacidades para lograr esta meta. A mis hermanos por acompañarme en los momentos más difíciles, por su apoyo y protección, y por tenerme presente en sus oraciones. A mi novio por su amor y comprensión, por brindarme palabras de aliento cuando más las necesito, para seguir luchando por alcanzar mis metas.

8 A mis hermanos en Cristo porque siempre se han preocupado por mí, porque me tienen presente en sus oraciones y me ofrecen su cariño incondicional. Cecilia Guevara Luego de finalizar mi trabajo de graduación, vienen a mi mente innumerables recuerdos de todos los momentos y pruebas que tuve que superar para cerrar esta etapa de mi vida. Estoy conciente que nunca estuve solo en este largo camino, y por ello deseo dedicar este logro: Principalmente a Dios nuestro Señor, porque sin él nada es posible, por estar conmigo durante todo el camino, y darme la fuerza y sabiduría para salir adelante. A la Virgen María, por estar siempre a mi lado e interceder por mí ante Dios en los momentos más duros y complicados que se me presentaron. A mi Madre por su cariño, confianza y apoyo incondicional, por enseñarme que en la vida es necesario luchar por nuestras metas y sueños, sin dejarse vencer. A mis Hermanos Efrén y Josué por estar siempre conmigo dándome la fuerza para salir adelante. A mi Abuela, así como también a mis tías María y Mirna por todo su amor, comprensión y enseñanza. A mi familia por ayudarme a salir adelante. A todas las personas que me tuvieron presente en sus oraciones. A mis amigos y compañeros, por todas las pruebas que superamos juntos. Por darme palabras de aliento cuando más lo necesitaba. A mis compañeras de grupo Liss y Cecy, por toda su entrega, esfuerzo y por aguantarme estos seis meses. Compañeras lo logramos! Quiero concluir diciendo que este logro no es mío, es el resultado del trabajo y esfuerzo conjunto de todos los que creyeron en mí y me brindaron su apoyo incondicional, a todos ellos quiero dedicar este triunfo. Melvin G. Campos

9 RESUMEN EJECUTIVO La Universidad Centroamericana José Simeón Cañas (UCA), posee unidades académicas llamadas Facultades, las cuales están encargadas de administrar y evaluar las carreras que les han sido asignadas, estas unidades son dirigidas por un Decano, quien a su vez cuenta con la colaboración de un grupo selecto de docentes denominados Coordinadores de Carrera, los cuales tienen la responsabilidad de asesorar a los estudiantes tanto en los procesos de inscripción, adición y retiro de materias, como en el manejo de su Plan de Estudios; al mismo tiempo, asisten a los decanos en la realización de procesos administrativos académicos de sus estudiantes. Para poder cumplir con sus labores, los Decanos y Coordinadores de Carrera necesitan tener acceso a la información académica de los estudiantes, y a partir de esta, elaborar reportes estadísticos/analíticos que les permitan examinar la situación académica actual de su Facultad o Carrera, respectivamente. La unidad encargada de administrar la información relacionada con los estudiantes es Registro Académico, para ello ha implementado el Sistema de Información Académica (SIA), en un trabajo conjunto con Dirección de Informática, quien se encarga de asegurar el buen funcionamiento de este y que la información almacenada sea consistente. El SIA registra las labores académicas que se desarrollan en la Universidad, entre estas: registro de nuevos alumnos, inscripción de materias, rendimiento de los estudiantes, etc. Este sistema además, proporciona a los usuarios reportes que reflejan la situación de las actividades anteriormente descritas. Con estos reportes, los Decanos y Coordinadores de Carrera realizan sus propios informes para poder analizar la situación actual de la Facultad o Carrera que dirigen y, en base a estos, tomar decisiones importantes para el mejor funcionamiento de su unidad. i

10 Los análisis y reportes que se elaboran actualmente no permiten realizar comparativas con datos históricos, pues no se cuenta con las herramientas necesarias para hacerlo y la información almacenada no es suficiente. Por todo lo anterior, se requiere de un sistema que integre la información académica de manera que facilite, agilice y mejore la elaboración de reportes para realizar un mejor análisis que ayude a la toma de decisiones, por ello se propuso desarrollar un Data Warehouse para el Registro Académico. Por qué un Data Warehouse? Un Data Warehouse es una colección de datos en la cual se encuentra integrada la información más importante de la compañía y que se usa como soporte para el proceso de toma de decisiones gerenciales. Además, las aplicaciones para soporte de decisiones basadas en esta tecnología, pueden hacer más práctica y fácil la explotación de datos para una mayor eficacia del negocio, que no se logra cuando se usan sólo los datos que provienen de las aplicaciones operacionales. Por otro lado, un Data Warehouse almacena información histórica para poder realizar comparativas de los datos a través del tiempo, asegura la integridad de estos y proporciona un acceso fácil a los usuarios, permitiendo de esta forma que puedan realizar consultas personalizadas y crear reportes con la información que realmente necesitan. En el presente documento se muestra el proceso seguido para el desarrollo del Data Warehouse del Registro Académico, este proceso inicia con la definición del problema y la determinación de los objetivos y alcances del proyecto, luego se consideró importante presentar una descripción teórica de los conceptos necesarios para llevar a cabo un proyecto de este tipo, estos conceptos son aplicados en las siguientes etapas que se desarrollan, las cuales son análisis y diseño del sistema. Finalmente, se muestran las conclusiones a las que llegó el grupo, así como también las recomendaciones que se consideraron importantes, ii

11 tanto para la Universidad como para nuevos proyectos relacionados con Sistemas de Data Warehouse. A partir del trabajo realizado (investigación teórica y desarrollo de la aplicación), se logró determinar que existe poco conocimiento acerca de los sistemas de soporte a la toma de decisiones, sin embargo, se pudo comprobar las ventajas que estos pueden proporcionar a las empresas u organizaciones, por tanto, la implementación de un Sistema de Datawarehouse dentro de la Universidad le permitirá estar a la vanguardia en el área de Inteligencia de Negocios. Con base en lo anterior se recomienda incentivar el desarrollo de este tipo de proyectos para permitir a los usuarios poder analizar la información de la empresa, de tal manera que puedan crear estrategias para mejorar el desempeño de la unidad donde trabajan. iii

12 iv

13 INDICE Pág. CAPÍTULO 1. INTRODUCCIÓN DEFINICIÓN DEL PROBLEMA DESCRIPCIÓN ANTECEDENTES DEFINICIÓN DEL PROYECTO OBJETIVOS ALCANCES LÍMITES LIMITANTES METODOLOGÍA DE TRABAJO...13 CAPÍTULO 2. MARCO TEÓRICO INTRODUCCIÓN SISTEMAS DE INFORMACIÓN SISTEMAS ESTRATÉGICOS SISTEMAS TÁCTICOS SISTEMAS TÉCNICO OPERATIVOS SISTEMAS INTERINSTITUCIONALES SISTEMAS TÉCNICO OPERACIONALES O SISTEMAS OLTP (ONLINE TRANSACTION PROCESSING) DATA WAREHOUSE CARACTERÍSTICAS DE UN DATA WAREHOUSE VENTAJAS DE UN DATA WAREHOUSE DIFERENCIAS ENTRE SISTEMAS TÉCNICO - OPERACIONALES (OLTP) Y DATA WAREHOUSES ARQUITECTURA TÉCNICA DE UN DATA WAREHOUSE...23 v

14 2.7. SISTEMAS ORIGEN (SOURCE SYSTEM) AREA DE ORGANIZACIÓN DE LOS DATOS (DATA STAGING AREA) MODELO DIMENSIONAL (DIMENSIONAL MODEL) PROCESOS DE NEGOCIO (BUSINESS PROCESS) DATA MART MODELO DIMENSIONAL COMPONENTES DE LA TABLA DE HECHOS GRANULARIDAD TABLAS DE DIMENSIONES EL ESQUEMA SNOWFLAKE PASOS PARA EL DISEÑO DEL MODELO DIMENSIONAL PRIMITIVAS DE TRANSFORMACIÓN OLAP (PROCESAMIENTO ANALÍTICO EN LÍNEA) HERRAMIENTAS OLAP ARQUITECTURAS DE ALMACENAMIENTO OLAP ALMACENAMIENTO ROLAP (OLAP RELACIONAL) ALMACENAMIENTO MOLAP (OLAP MULTIDIMENSIONAL) ALMACENAMIENTO HOLAP (OLAP HÍBRIDO) COMPONENTES DE BASES DE DATOS OLAP FUNDAMENTOS DE DIMENSIONES OPERACIONES EN MODELOS MULTIDIMENSIONALES SELECCIONAR DIMENSIONES (SLICE) FILTRADO (DICE) MOVIMIENTOS EN LA JERARQUÍA DE UNA DIMENSIÓN (DRILL- UP, DRILL-DOWN) CONSOLIDACIÓN (ROLL-UP) DRILL-ACROSS DRILL-THROUGH vi

15 2.17. CICLO DE VIDA DEL MODELADO DIMENSIONAL PLANIFICACIÓN DEL PROYECTO DEFINICIÓN DE LOS REQUERIMIENTOS DEL NEGOCIO DISEÑO DE LA ARQUITECTURA TÉCNICA SELECCIÓN DE PRODUCTOS E INSTALACIÓN MODELADO DIMENSIONAL DISEÑO FÍSICO DISEÑO Y DESARROLLO DEL DATA STAGING ESPECIFICACIONES DE LAS APLICACIONES DEL USUARIO FINAL DESARROLLO DE LAS APLICACIONES DEL USUARIO FINAL IMPLEMENTACIÓN MANTENIMIENTO Y CRECIMIENTO ADMINISTRACIÓN DEL PROYECTO...58 CAPITULO 3. ANÁLISIS DEL SISTEMA DEFINICIÓN DE LOS REQUERIMIENTOS DISEÑO DE LA ARQUITECTURA TÉCNICA SELECCIÓN DE LAS HERRAMIENTAS DE DESARROLLO MODELADO DIMENSIONAL...68 CAPÍTULO 4. DISEÑO DEL SISTEMA DISEÑO FÍSICO DISEÑO Y DESARROLLO DEL DATA STAGING AREA ESTANDARIZACIÓN DE DATOS SERVICIO DE TRANSFORMACIÓN DE DATOS (DTS, DATA TRANFORMATION SERVICES) BASE DE DATOS MULTIDIMENSIONAL CREACIÓN DE DIMENSIONES CREACION DE CUBOS DISEÑO DE LA APLICACIÓN DE USUARIO FINAL...96 vii

16 CAPÍTULO 5. CONCLUSIONES CAPÍTULO 6. RECOMENDACIONES GLOSARIO REFERENCIAS BIBLIOGRAFIA ANEXOS ANEXO A: ANEXO B: ANEXO C: ANEXO D: ANEXO E: ANÁLISIS PROPUESTOS PARA LOS REPORTES PREESTABLECIDOS DEL SISTEMA GUÍA PARA LA ELABORACIÓN DE ENTREVISTAS RESULTADOS OBTENIDOS EN LAS ENTREVISTAS REALIZADAS A LOS USUARIOS MANUAL DE USUARIO MANUAL TÉCNICO viii

17 INDICE DE TABLAS Pág. Tabla 1.1. Empresas que han implementado Data Warehouse en el país...4 Tabla 2.1. Diferencias entre Sistema Operacional y Data Warehouse [Castro y Urrutia, 2004: p.29]...22 Tabla 2.2. Primitivas de transformación. Traducido de Marotta [2000a: p.26]...35 Tabla 2.3. Elementos jerárquicos de una dimensión. Traducido de Microsoft [2001a: Mod1, p.27]...47 Tabla 3.1. Listado de personas entrevistadas...60 Tabla 3.2. Comparación entre RDBMS existentes en el mercado...64 Tabla 3.3. Requisitos mínimos de Hardware...68 Tabla 3.4. Requisitos mínimos de Software...68 Tabla 3.5. Aplicación del modelado dimensional al análisis de alumnos...70 Tabla 3.6. Aplicación del modelado dimensional al análisis de materias...75 Tabla 4.1. Tabla de estándares de datos...82 Tabla 4.2. Estructura de la tabla INSTITUCION_P...83 Tabla E.2.1. Requisitos mínimos de Hardware... E-1 Tabla E.2.2. Requisitos mínimos de Software... E-2 Tabla E.4.1. Dominio CATEG_INGRESO... E-22 Tabla E.4.2. Dominio CATEG_INSTITUCION... E-22 Tabla E.4.3. Dominio ESTADO_ALUMNO... E-22 Tabla E.4.4. Dominio ESTADO_CIVIL... E-23 Tabla E.4.5. Dominio ESTADO_MATERIA... E-23 Tabla E.4.6. Dominio MODALIDAD_MATERIA... E-24 ix

18 Tabla E.4.7. Dominio TIPO_CARRERA...E-24 Tabla E.4.8. Dominio TIPO_MATERIA...E-25 Tabla E.5.1. Estructura de la tabla DW_ALUMNO...E-28 Tabla E.5.2. Estructura de la tabla DW_CARRERA_FACULTAD...E-28 Tabla E.5.3. Estructura de la tabla DW_DEPTO_MUNIC...E-29 Tabla E.5.4. Estructura de la tabla DW_ESTADO_ALUMNO...E-29 Tabla E.5.5. Estructura de la tabla DW_ESTADO_CIVIL...E-29 Tabla E.5.6. Estructura de la tabla DW_INSTITUCION...E-30 Tabla E.5.7. Estructura de la tabla DW_PAIS...E-30 Tabla E.5.8. Estructura de la tabla DW_SEXO...E-30 Tabla E.5.9. Estructura de la tabla DW_TIEMPO...E-31 Tabla E Estructura de la tabla DW_CICLO1...E-31 Tabla E Estructura de la tabla DW_CICLO...E-31 Tabla E Estructura de la tabla DW_TIPO_INGRESO...E-32 Tabla E Estructura de la tabla FACT_ALUMNO...E-32 Tabla E Estructura de la tabla DW_ALUMNO...E-35 Tabla E Estructura de la tabla DW_CARRERA_FACULTAD...E-35 Tabla E Estructura de la tabla DW_MATERIA_DEPARTAMENTO...E-36 Tabla E Estructura de la tabla DW_ESTADO_MATERIA...E-36 Tabla E Estructura de la tabla DW_MATRICULA...E-37 Tabla E Estructura de la tabla DW_PROFESOR...E-37 Tabla E Estructura de la tabla DW_SECCION...E-37 Tabla E Estructura de la tabla DW_CICLO...E-38 Tabla E Estructura de la tabla DW_TIPO_MATERIA...E-38 x

19 Tabla E Estructura de la tabla FACT_MATERIA... E-38 Tabla E.6.1. Estructura de la tabla CONTROL_ALUMNO... E-45 Tabla E.6.2. Estructura de la tabla CONTROL_MATERIA... E-45 Tabla E.7.1. Tablas y campos requeridos en los archivos de texto... E-50 Tabla E.8.1. Tareas para transformar datos... E-54 Tabla E.8.2. Tareas para copiar y administrar datos... E-54 Tabla E.8.3. Tareas para ejecutar tareas como trabajos dentro de un paquete... E-55 Tabla E.8.4. Controladores de MDAC... E-55 Tabla E.8.5. Controladores Microsoft Jet... E-55 Tabla E.8.6. Otros controladores... E-55 Tabla E.8.7. Restricciones de prioridad en las tareas... E-56 Tabla E.8.8. Transformaciones integradas que proporciona DTS... E-58 Tabla E Dimensión DIM_ALUMNO... E-77 Tabla E Dimensión DIM_CALIDAD_INSTITUCION... E-77 Tabla E Dimensión DIM_CARRERA_FACULTAD... E-77 Tabla E Dimensión DIM_CATEG_INSTITUCION... E-78 Tabla E Dimensión DIM_CICLO_INGRESO... E-78 Tabla E Dimensión DIM_CICLO_ULTIMO_INGRESO... E-78 Tabla E Dimensión DIM_DEPTO_MUNIC... E-79 Tabla E Dimensión DIM_ESTADO_ALUMNO... E-79 Tabla E Dimensión DIM_ESTADO_FAMILIAR... E-79 Tabla E Dimensión DIM_INSTITUCION... E-80 Tabla E Dimensión DIM_PAIS... E-80 Tabla E Dimensión DIM_SECTOR_INSTITUCION... E-80 xi

20 Tabla E Dimensión DIM_SEXO...E-80 Tabla E Dimensión DIM_SISTEMA...E-81 Tabla E Dimensión DIM_TIEMPO...E-81 Tabla E Dimensión DIM_TIPO_CARRERA...E-81 Tabla E Dimensión DIM_TIPO_INGRESO...E-82 Tabla E Dimensión DIM_SECCION...E-85 Tabla E Dimensión DIM_ESTADO_MATERIA...E-85 Tabla E Dimensión DIM_MATRICULA...E-86 Tabla E Dimensión DIM_TIPO_MATERIA...E-86 Tabla E Dimensión DIM_PROFESOR...E-86 Tabla E Dimensión DIM_MATERIA_DEPARTAMENTO...E-86 xii

21 INDICE DE FIGURAS Pág. Figura 2.1. Clasificación de los Sistemas Operacionales [Castro y Urrutia, 2004: p.21]...17 Figura 2.2. Arquitectura Técnica de un Data Warehouse. Adaptado de Kimball et al. [2002: p.7]...24 Figura 2.3. Ejemplo de Diagrama Estrella...30 Figura 2.4. Ejemplo de Esquema Snowflake...33 Figura 2.5. Diagrama de Transformación de datos. Adaptado de Marotta [2000a: p.21]...35 Figura 2.6. Seleccionar Dimensiones (Slice) [Peralta, 2003: p.30]...49 Figura 2.7. Filtrado (Dice) [Peralta, 2003: p.31]...49 Figura 2.8. Ejemplo de Drill-Up y Drill-Down [Peralta, 2003: p.33]...50 Figura 2.9. Explicación gráfica de Drill-Up y Drill-Down [Peralta, 2003: p.34]...50 Figura Consolidación (Roll Up) [Peralta, 2003: p.35]...51 Figura Drill-Across [Peralta, 2003: p.38]...52 Figura Drill-Throug [Peralta, 2003: p.39]...52 Figura Ciclo de vida del modelado dimensional. Adaptado de Kimball [1998: p.33] 54 Figura 3.1. Diagrama de Flujo de Datos del Data Warehouse...63 Figura 3.2. Diagrama Estrella para análisis de alumnos...71 Figura 3.3. Diagrama de transformación de datos inicial para el análisis de alumnos...73 Figura 3.4. Diagrama de transformación de datos periódico para el análisis de alumnos...74 Figura 3.5. Diagrama Estrella para el análisis de materias...76 Figura 3.6. Diagrama de transformación de datos inicial para el análisis de materias...77 Figura 3.7. Diagrama de transformación de datos periódico para el análisis de materias...78 Figura 4.1. Diagrama Estrella Físico para el Análisis de Alumnos...80 Figura 4.2. Diagrama Estrella Físico para el Análisis de Materias...81 xiii

22 Figura 4.3. Diagrama de Flujo de Datos para la Carga Inicial de una Dimensión Figura 4.4. Diagrama de Flujo de Datos para la Carga Inicial de la Tabla de Hechos Figura 4.5. Diagrama de Flujo de Datos para la Carga Periódica de una Dimensión Figura 4.6. Diagrama de Flujo de Datos para la Carga Periódica de la Tabla de Hechos Figura 4.7. Esquema de la Carga Inicial del Diagrama Estrella Alumno Figura 4.8. Esquema de la Carga Periódica del Diagrama Estrella Alumno Figura 4.9. Esquema de la Carga Inicial del Diagrama Estrella Materia Figura Esquema de la Carga Periódica del Diagrama Estrella Materia Figura Creación del Cubo Alumno Figura Creación del Cubo Materia Figura Creación de una Dimensión Figura Estructura del Cubo Alumno Figura Estructura del Cubo Materia Figura Estándar de reportes preestablecidos Figura Plantilla de reportes Figura D.3.1. Menú Registro Académico... D-3 Figura D.4.1. Área de trabajo para la elaboración de reportes... D-5 Figura D.4.2. Área de campos de página... D-6 Figura D.4.3. Filtrado de los campos de página... D-7 Figura D.4.4. Área de campos de fila... D-8 Figura D.4.5. Filtrado de los campos de fila... D-9 Figura D.4.6. Niveles de una dimensión colocada dentro del área de campos de fila... D-10 Figura D.4.7. Área de datos... D-11 Figura D.4.8. Área de campos de columna... D-12 xiv

23 Figura D.4.9. Barra de herramientas Tabla Dinámica...D-13 Figura D Elegir campos de propiedad para una dimensión...d-14 Figura D Mostrar campos de propiedad de un nivel...d-15 Figura D.5.1. Asistente para gráficos...d-16 Figura D.5.2. Ejemplo de gráfico...d-17 Figura D.6.1. Reporte de población académica por carrera...d-18 Figura D.6.2. Reporte de rendimiento de alumnos...d-20 Figura E.3.1. Instalación de SQL Server 2000 Components... E-2 Figura E.3.2. Instalación del Servidor de Base de Datos... E-3 Figura E.3.3. Pantalla de bienvenida a la instalación de Microsoft SQL Server... E-3 Figura E.3.4. Servidor donde se desea instalar el software... E-4 Figura E.3.5. Crear nueva instancia de SQL Server... E-5 Figura E.3.6. Información de usuario y compañía... E-5 Figura E.3.7. Contrato de licencia de SQL Server... E-6 Figura E.3.8. Instalar herramientas de cliente y servidor... E-6 Figura E.3.9. Tipo de instalación de SQL Server... E-7 Figura E Introducir clave del producto... E-7 Figura E Nombre de la instancia de la base de datos... E-8 Figura E Usuario y contraseña para el iniciar servicio de SQL Server... E-8 Figura E Modo de autenticación... E-9 Figura E Finalización de configuraciones para la instalación de SQL Server... E-9 Figura E Instalación en proceso... E-10 Figura E Finalizar instalación de SQL Server... E-10 Figura E Crear nueva base de datos... E-11 xv

24 Figura E Asistente para creación de nueva base de datos...e-12 Figura E Base de datos creada...e-12 Figura E Restaurar base de datos...e-13 Figura E Asistente para restauración de base de datos...e-14 Figura E Elegir fuente del backup...e-15 Figura E Verificar ruta del backup...e-15 Figura E Forzar restauración de base de datos...e-16 Figura E Instalación de Analysis Services...E-17 Figura E Pantalla de bienvenida a la instalación de Analysis Services...E-18 Figura E Contrato de licencia para la instalación de Analysis Services...E-18 Figura E Seleccionar componentes a instalar...e-19 Figura E Directorio donde se instalará Analysis Services...E-19 Figura E Seleccionar fólder donde se crearán los iconos de Analysis Services...E-20 Figura E Proceso de instalación de Analysis Services...E-20 Figura E Finalizar instalación de Analysis Services...E-21 Figura E.5.1. Diagrama Estrella ALUMNO...E-27 Figura E.5.2. Diagrama Estrella MATERIA...E-34 Figura E.6.1. Tablas de carga inicial para el diagrama estrella ALUMNO...E-40 Figura E.6.2. Tablas de carga inicial para el diagrama estrella MATERIA...E-40 Figura E.6.3. Tablas de transformación de datos para el diagrama estrella ALUMNO (1)... E-41 Figura E.6.4. Tablas de transformación de datos para el diagrama estrella ALUMNO (2)...E-42 Figura E.6.5. Tablas de transformación de datos para el diagrama estrella MATERIA...E-43 xvi

25 Figura E.6.6. Tablas equivalentes a las dimensiones del diagrama estrella ALUMNO... E-44 Figura E.6.7. Tablas equivalentes a las dimensiones del diagrama estrella MATERIA.. E-44 Figura E.8.1. Interfaz del Diseñador DTS... E-53 Figura E.8.2. Tareas de secuencia de comandos ActiveX y Enviar correo con una restricción de prioridad al concluir...e-56 Figura E.8.3. Tareas de correo... E-57 Figura E.8.4. Ejemplo de varias restricciones de prioridad en una tarea... E-57 Figura E.9.1. Paquete: CARGA_INICIAL_DW_ALUMNO... E-59 Figura E.9.2. Paquete: CARGA_INICIAL_ARCHIVOS_DE_TEXTO_ALUMNO... E-60 Figura E.9.3. Paquete: CARGA_INICIAL_TIEMPO... E-61 Figura E.9.4. Paquete: CARGA_INICIAL_CARRERA_FACULTAD... E-61 Figura E.9.5. Paquete: CARGA_INICIAL_DEPTOYOTRAS... E-62 Figura E.9.6. Paquete: CARGA_INICIAL_INSTITUCION_Y_SEXO... E-63 Figura E.9.7. Paquete: CARGA_INICIAL_ALUMNO... E-64 Figura E.9.8. Paquete: MODIF_TIPO_INGRESO... E-65 Figura E Paquete: CARGA_EQUIVALENCIAS... E-65 Figura E Paquete: CARGA_INICIAL_SIA_STAR_ALUMNO... E-66 Figura E Paquete: CARGA_INICIAL_DW_MATERIA... E-67 Figura E Paquete: CARGA_INICIAL_ARCHIVOS_DE_TEXTO_MATERIA... E-68 Figura E Paquete: CARGA_INICIAL_ESTADO_TIPO_MATRICULA... E-68 Figura E Paquete: CARGA_INICIAL_FACT_MATERIA... E-69 Figura E Paquete: CARGA_INICIAL_SIA_STAR_MATERIA... E-70 Figura E Paquete: CARGA_PERIODICA_CUBALUMNO... E-71 Figura E Paquete: CARGA_PERIODICA_TIEMPO... E-72 xvii

26 Figura E Paquete: CARGA_PERIODICA_INSTITUCION...E-72 Figura E Paquete: CARGA_PERIODICA_CARRERA...E-73 Figura E Paquete: CARGA_PERIODICA_DEPTO_MUNIP...E-73 Figura E Paquete: CARGA_PERIODICA_ALUMNO...E-74 Figura E Paquete: VERIFICAR_REINGRESO...E-74 Figura E Paquete: CARGA_PERIODICA_SIA_STAR...E-75 Figura E Paquete: ACTUALIZACION_ALUMNO...E-76 Figura E Miembro calculado: CUMGRAL_PROMEDIO...E-83 Figura E Cubo ALUMNO...E-84 Figura Miembro calculado: NOTA_PROMEDIO...E-87 Figura E Cubo MATERIA...E-88 Figura E Menú Registro Académico para Decanos...E-90 Figura E Menú Registro Académico para Coordinadores de Carrera...E-90 xviii

27 SIGLAS AI Artificial Intelligence (Inteligencia Artificial) BIS Sistemas de Simulación de Negocios DBMS Data Base Management System (Sistema Administrador de Bases de Datos) EIS Enterprise Information System (Sistemas de Información Ejecutivos) ETL Extraction, Transformation and Load (Extracción, transformación y carga) GIS Georeferential Information System (Sistemas de Información Georeferencial) MIS Management Information System (Sistemas de Información Gerencial) MOLAP Multidimensional OLAP (OLAP Multidimensional) OA Sistemas Ofimáticos OLAP Online Analitycal Processing (Procesamiento Analítico en Línea) OLTP Online Transaction Processing (Procesamiento Transaccional en Línea) RDBMS Relational Data Base Management System (Sistema Administrador de Bases de Datos Relacionales) ROLAP Relational OLAP (OLAP Relacional) SIA Sistema de Información Académica SQL Structured Query Language (Lenguaje Estructurado de Consultas) SSF Superintendencia Del Sistema Financiero UCA Universidad Centroamericana José Simeón Cañas ABREVIATURAS Corp. DW Corporación Data Warehouse xix

28 xx

29 PRÓLOGO A través del presente Trabajo de Graduación se aplica la tecnología de Data Warehousing a la unidad de Registro Académico de la Universidad, para presentar y justificar las ventajas que un sistema de este tipo proporciona a las instituciones. La idea de la implementación de un Data Warehouse para la unidad de Registro Académico, surge a partir de las necesidades de información que presentan los Decanos y Coordinadores de Carrera de la Universidad, para evaluar y observar el rendimiento y la población académica de los estudiantes de cada una de las carreras que dirigen. Mediante las etapas de investigación teórica, obtención de requerimientos, análisis y diseño del sistema se llevó a cabo la elaboración de un trabajo que presenta como resultado final un Data Warehouse para el Registro Académico de la Universidad, que incluye un módulo para que los usuarios accedan a la información contenida dentro de éste, además de la documentación necesaria para su utilización. En el primer capítulo se detallan las generalidades del trabajo, presentando como primer punto la definición del problema, en la cual se especifican las necesidades que conllevan a la creación de este proyecto; se incluyó un apartado de antecedentes en el que se presenta la forma en que esta tecnología ha sido utilizada en diferentes lugares del país; finalmente, se definen los objetivos y alcances que se plantearon para el desarrollo del proyecto. Posteriormente en el segundo capítulo se presenta el Marco Teórico como resultado de una investigación bibliográfica sobre los conceptos básicos relacionados con los Sistemas de Data Warehouse. Este inicia dando una descripción acerca de los distintos tipos de sistemas de información, haciendo énfasis en los sistemas estratégicos, dentro de los cuales se ubican los Sistemas de Data Warehouse. Posteriormente se realiza una descripción más detallada donde se explican los conceptos básicos y la arquitectura técnica de estos sistemas. Una vez comprendidos los conceptos básicos, se introduce a la técnica de modelado dimensional y finalmente se describe el ciclo de vida del desarrollo de un xxi

30 Sistema de Data Warehouse, el cual se toma como referencia para la realización de este proyecto. En el tercer capítulo se aborda la etapa de análisis del sistema, que incluye un apartado para la obtención de los requerimientos de los usuarios, en el que se detallan las necesidades de información de éstos, y a partir de las cuales se determinan los tipos de análisis o procesos de negocio tomados en cuenta para el modelado dimensional. Se presenta también un apartado acerca de las herramientas de desarrollo a utilizar en la realización del proyecto. Finalmente, se muestra el diseño de la arquitectura técnica en la que se basa el desarrollo de cada uno de los componentes del Data Warehouse. En el cuarto capítulo, se presenta la etapa de diseño del sistema, en esta se detallan los pasos seguidos para crear cada uno de los componentes definidos en la etapa anterior, entre estos se encuentran: data staging area, diagramas estrella y base de datos multidimensional. Además se define el diseño de los reportes que proporcionará el sistema. Finalmente, en los capítulos cinco y seis se detallan las Conclusiones y Recomendaciones, obtenidas a partir de la elaboración del trabajo. Como punto final, se encuentra el apartado de Bibliografía y Anexos, que contienen información acerca del material de apoyo utilizado para el desarrollo del proyecto. xxii

31 CAPÍTULO 1. INTRODUCCIÓN 1. INTRODUCCIÓN 1.1. DEFINICIÓN DEL PROBLEMA DESCRIPCIÓN La Universidad Centroamericana José Simeón Cañas (UCA), posee unidades académicas llamadas Facultades, las cuales están encargadas de administrar y evaluar las carreras que les han sido asignadas, orientan el avance de los alumnos en sus estudios y proponen a la Vicerrectoría Académica la creación de nuevas carreras. Las Facultades de la UCA, dirigida cada una por un Decano o Decana, son tres: Facultad de Ciencias Económicas y Empresariales, Facultad de Ciencias Sociales y Humanidades y Facultad de Ingeniería y Arquitectura. Los Decanos son los encargados de dirigir y supervisar el funcionamiento académico y administrativo del grupo de carreras que están bajo su responsabilidad. Algunas de sus funciones son: aprobar el ingreso de los alumnos y alumnas a su facultad, otorgar equivalencias de acuerdo a los reglamentos, verificar el cumplimiento de los requisitos de graduación y expedición de títulos, conceder permisos de adición y retiro de materias, resolver en primera instancia, los problemas de índole administrativo de los estudiantes, entre otros. Para estas y muchas otras tareas dedicadas al bienestar de los alumnos, los Decanos cuentan con la colaboración de un grupo selecto de docentes denominados Coordinadores de Carrera, quienes asisten al Decano en los asuntos que éste les delegue relacionados con la carrera que coordinan. Además, son quienes permanecen en contacto directo con los estudiantes a fin de asesorarlos tanto en los procesos de inscripción, adición y retiro de 1

32 materias, como en el manejo de su Plan de Estudios; al mismo tiempo, asisten a los decanos en la realización de procesos administrativos académicos de sus estudiantes. Para que los Decanos y Coordinadores de Carrera puedan llevar a cabo todas sus labores, necesitan tener acceso a la información académica de los estudiantes, la cual es administrada por la Unidad de Registro Académico por medio de los expedientes físicos. Registro Académico cuenta con la colaboración de la Dirección de Informática, quien almacena los expedientes electrónicos dentro del Sistema de Información Académica (SIA). Dicho sistema concede acceso parcial a la información académica, dependiendo del rol que desempeña el usuario, ya sea Decano o Coordinador de Carrera. Para poder cumplir con sus tareas, los Decanos y Coordinadores de Carrera necesitan elaborar reportes estadísticos/analíticos que les permitan examinar la situación académica actual de su Facultad o Carrera, respectivamente. Algunas de las áreas en las que se enfocan sus análisis son las siguientes: Población académica y sus tendencias a través del tiempo. Rendimiento de los estudiantes. Cantidad de estudiantes clasificados por sexo y estado. Porcentaje de alumnos por institución de procedencia. Análisis geográfico estudiantil. Los análisis y reportes que se elaboran actualmente no permiten realizar comparativas con datos históricos, pues no se cuenta con las herramientas necesarias y la información almacenada no es suficiente. En la actualidad los Decanos y Coordinadores de Carrera deben hacer las solicitudes de información relacionada con los estudiantes a la Unidad de Registro Académico, sin 2

33 embargo con el objetivo de recibir más ágilmente esta información las peticiones se efectúan directamente a la Dirección de Informática. A pesar de ello, la información solicitada no es recibida en el tiempo deseado y en algunas ocasiones los datos obtenidos son pobres e insuficientes para poder realizar los análisis y reportes con la calidad esperada. Por todo lo anterior, se requiere de un sistema que integre la información académica de manera que facilite, agilice y mejore la elaboración de reportes para realizar un mejor análisis que ayude a la toma de decisiones ANTECEDENTES CASOS DE ÉXITO EN EL PAÍS En el país existe una cantidad considerable de empresas que poseen sistemas transaccionales como herramientas de soporte a sus operaciones diarias; estos sistemas son útiles pues les permiten agilizar y optimizar ciertos procesos. Sin embargo dentro de las bases de datos de estos sistemas se encuentra oculta gran cantidad de información de importancia estratégica para la organización. Por tal razón desde hace algún tiempo, en nuestro país, las empresas se han decidido por la implementación de sistemas de Data Warehousing, con el fin de optimizar sus procesos y tener herramientas más efectivas y eficaces que les ayuden a las personas en cargos directivos a la toma de decisiones En el cuadro que se muestra a continuación se menciona algunas empresas, de diversos sectores de la economía nacional que han optado por esta nueva tecnología. 3

34 Tabla 1.1. Empresas que han implementado Data Warehouse en el país Empresa Ministerio De Hacienda Avícola Salvadoreña S.A. De C.V. Superintendencia Del Sistema Financiero (SSF) Grupo Q El Salvador Período de Desarrollo Empresa Comentarios Consultora Datamart del área de Ejecución Presupuestaria; ayudó en el monitoreo marzo a Microdata de diario del presupuesto de las instituciones septiembre El Salvador estatales por parte de los usuarios finales, 2003 S.A. De C.V. sin la intervención recurrente del área de sistemas para proporcionarles los datos necesarios para sus informes Datamart del área de Presupuestos (Comparativo Real vrs Presupuesto); favoreció a la empresa en la planificación octubre Microdata de eficiente de su presupuesto y en la oportuna 2003 a El Salvador implementación de decisiones que marzo 2004 S.A. De C.V. provocaran medidas preventivas y correctivas en la administración de los activos de la empresa. marzo a agosto 2004 mediados del 2003 a la fecha Microdata de Datamart del área Financiera para el control El Salvador de las cuentas contables de las instituciones S.A. De C.V. financieras bancarias y no bancarias. Datamarts para 7 áreas de negocio diferentes, entre las cuales destaca el área Financiera-Contable, ya que como resultado GYSSA S.A. genera los Estados Financieros de la de C.V. empresa a nivel regional. Debido a que buena parte del proyecto aún sigue en desarrollo, no se tienen resultados definidos en las otras áreas implementadas. Inteligencia Datamart denominado Áreas de Negocio, Grupo TACA año 2001 de Negocios desarrollado por un grupo dentro de la 4

35 Banco Uno año 2003 CODISA empresa llamado Inteligencia de Negocios, se encuentra en funcionamiento desde Septiembre de 2001, y continúa siendo una herramienta útil para la toma de decisiones. Banco Uno ideó una estrategia de reducción de la organización a nivel regional, para convertirse en una compañía más eficiente, creciendo gradualmente, pero a la vez de manera ordenada y por medio de la ayuda proporcionada por el sistema de Inteligencia de Negocios (PROFIT). Entre los puntos o indicadores mostrados por el sistema PROFIT destacan: - Tiempos de Transacciones, con lo cual se logró identificar los procesos que consumían demasiado tiempo y generar así un reestructuración de los mismos. - Análisis de Ganancias, se mostraron comparativas entre los diferentes servicios proporcionados por el banco, por dicha razón la gerencia promovió la sustitución de algunos de ellos por otros más rentables. - Análisis de Clientes, se redujo la cartera de clientes entre un 60 y 70%, permitiendo conservar los clientes con mayor importancia en el banco. 5

36 EMPRESAS DESARROLLADORAS DE DATAWAREHOUSE Existe en la actualidad una serie de empresas dedicadas al desarrollo de software de Data Warehouse. A continuación se menciona algunas de estas empresas, existentes en la región Centroamericana. Empresa: CODISA SOFTWARE CORP. Esta empresa nació en 1989 con su Centro de Investigación y Desarrollo en Costa Rica, en los últimos 13 años de funcionamiento, ha diversificado su portafolio de productos con soluciones de Inteligencia de Negocios para Industria, Comercio, Banca, Finanzas, Emisores de Tarjeta, Administradoras de Fondos de Pensión o Retiro, entre otros. Entre la gama de productos ofrecidos por CODISA, en el área de Inteligencia de Negocios, podemos mencionar: CODISA PROFIT. Constituye una solución a los requerimientos de información ejecutiva en bancos e instituciones financieras. Es un producto con los siguientes atributos: o Analiza los movimientos de determinado período de tiempo. o Permite apreciar tendencias, monitorear el comportamiento de los canales de distribución (sucursales, ATM`s, etc) o regiones en cada faceta del negocio bancario. o Permite comparar la ejecutoria de distintas sucursales, contrastar la rentabilidad o volumen de actividades en distintos territorios atendidos, visualizar cada sucursal como una entidad financiera aparte y al mismo tiempo contemplar la suma de las oficinas como un todo. o Muestra valores que permiten percibir el cumplimiento de políticas establecidas en algunas áreas de negocio. o Apoya la elaboración de proyecciones y medición del impacto de ciertos comportamientos de las tasas de interés de mercado. 6

37 CODISA-BANCARD Constituye una solución a los requerimientos de información ejecutiva en bancos e instituciones financieras emisoras de tarjetas. Entre sus características podemos mencionar: o Analiza tendencias dentro del total de cuentas existentes o por segmentos. o Optimiza el desempeño financiero de la institución. o Analiza fraudes y controla la custodia de documentos y plásticos. o Permite medir la efectividad de centros de llamadas que funcionan para los diferentes servicios, como son gestiones de servicios al cliente, cobros y telemercadeo entre otros. o Analiza la morosidad y madurez del portafolio, además de la gestión de cobro, relacionando dicha información con los canales de adquisición y las políticas de crédito. o Facilita la toma de decisiones rápidas sobre datos reales y oportunos, presentados en una forma clara y ágil. o Muestra valores que permiten percibir el cumplimiento de políticas establecidas en algunas áreas de negocio. o Apoya la elaboración de proyecciones y medición del impacto del comportamiento de los portafolios. CODISA-SALES ANALYZER Es una herramienta que permite a los tomadores de decisión tener un horizonte más claro del proceso de comercialización y ventas de su empresa así como estar en capacidad de realizar análisis multivariables que se orientan a incrementar la rentabilidad de la operación, mejorar los procesos y apoyar la definición y control de las políticas de comercialización que guiarán el camino de la empresa en el área comercial. Empresa: PREDISOFT Es considerado por sus dueños como un Laboratorio Científico de Datos creado con el propósito de adaptar tecnologías que mediante el uso riguroso y profundo de las 7

38 matemáticas de alto nivel puedan aplicarse en la solución de problemas empresariales. Posee un grupo de poderosas tecnologías para soportar la toma de decisiones. Entre la gama de productos ofrecidos por PREDISOFT, en el área de Inteligencia de Negocios, podemos mencionar: EFFICASH Permite conocer de manera precisa los flujos futuros de efectivo en las sucursales y cajeros automáticos. Esto permitirá garantizar la disponibilidad de efectivo a la vez que reducirá al mínimo los saldos no requeridos. Permite reducir a sus niveles óptimos el volumen de dinero en sucursales, al calcular con precisión la necesidad de efectivo de los días siguientes. POINTER Detiene el fraude de manera temprana a la vez que reduce significativamente la cantidad de alertas falsas, logrando resultados que han sorprendido positivamente a los clientes de la empresa, entre estos resultados se encuentran: o Tecnología Inteligente. Una sofisticada tecnología científico-matemática única que le brinda la capacidad de autoaprender. Esta capacidad de autoaprendizaje de Pointer hace posible que él mismo pueda asimilar continuamente el perfil de consumo de cada tarjeta habiente, el patrón del fraude y el conocimiento experto, para adaptar automáticamente las reglas y parámetros necesarios para detener el fraude de manera anticipada. o Menos Costos. La capacidad de autoaprender de Pointer reduce significativamente las alertas falsas, las cuales requieren un menor esfuerzo humano para su seguimiento y menos costos indirectos asociados. o Mayor Efectividad. Además de reducir el trabajo asociado a la investigación de alertas y concentrar fraudes reales en una cantidad mínima de alertas falsas, Pointer logra anticiparse al fraude logrando incrementar el saldo disponible salvado y a la vez minimizar la posibilidad de ocurrencia de fraudes posteriores. 8

39 ANTECEDENTES ACADÉMICOS De acuerdo a la investigación realizada en las Universidades del país, no se encontraron tesis y/o trabajos de graduación referentes a la creación de sistemas de Data Warehousing, orientados a analizar el área académica de las mismas. Las tesis y/o trabajos de graduación existentes, están orientados a la implementación de tecnologías OLAP en otros sectores del país, a continuación se hace una reseña de los trabajos encontrados: Tema: Diseño y Desarrollo de un sistema para el apoyo del análisis de datos operativos del negocio orientado a empresas aseguradoras basado en tecnologías OLAP. Fecha: Abril Institución Educativa: Universidad Don Bosco. Objetivo: Diseñar y desarrollar un sistema de información para el análisis gerencial de la operación del negocio en las empresas aseguradoras salvadoreñas para el área de negocios: Venta de Pólizas, Recuperación de Primas y Reclamos. Entre las ventajas de la implementación de este sistema, los autores mencionan: o Disponibilidad de la información para realizar un análisis estratégico, considerando variables incidentes de la operatividad del negocio. o Reducción del consumo de recursos del departamento informático, debido a la automatización de la consolidación de información operativa. o Alta disponibilidad de información basada en una infraestructura centralizada de análisis para el personal gerencial. o Fiabilidad y consistencia en la información o Fácil manipulación de los datos consolidados. Tema: Sistema de gestión informática para la gerencia de tecnología de información. Caso práctico: Empresa comercial Fecha: Septiembre Institución Educativa: Universidad Don Bosco. 9

40 Objetivo: Diseño y desarrollo de un sistema para la gerencia de Tecnología de Información para la empresa en estudio que le permita administrar el hardware, software, desarrollo de proyectos y brinde soporte a la toma de decisiones del gerente de Tecnología de Información. El sistema como apoyo a la toma de decisiones brindará a la gerencia los siguientes reportes: o Generación de consolidados mensuales y anuales de gastos, donde se generan informes en base a las siguientes dimensiones: por usuario interno, externo y extranjero; fijo y variable. o Comparativos de gastos, que permite confrontar los gastos incurridos dentro del departamento con el presupuesto asignado. o Consolidados de software, que permite generar reportes en base a las siguientes dimensiones: por usuario, departamento, ubicación y totales. Tema: Herramienta para el Análisis de Variables Aplicadas al Marketing, Utilizando Servidores OLAP y Minería de Datos. Fecha: Septiembre Institución Educativa: Universidad Don Bosco. Objetivo: Desarrollar una herramienta que analiza el comportamiento de las variables utilizadas en marketing con el propósito de presentar resultados claves y comprensibles utilizando tecnología OLAP como técnica de minería de datos. Como objetivos específicos, los autores definieron: o Diseñar una herramienta que aproveche la tecnología OLAP para el análisis y tareas de información que abordan las empresas. o Mejorar los tiempos de análisis de información para la toma de decisiones. o Generar pronósticos e informes de los datos que recopilan, almacenan y manipulan las empresas. o Aplicar los beneficios de la tecnología OLAP para organizar y resumir cantidades de datos. 10

41 1.2. DEFINICIÓN DEL PROYECTO OBJETIVOS OBJETIVO GENERAL Realizar una investigación bibliográfica acerca de las Bases de Datos Multidimensionales y, a partir de esta, desarrollar un Sistema de Data Warehousing para el Registro Académico, que sirva como herramienta de soporte a la toma de decisiones en el área académica y que sea tomado como modelo, para la implementación de esta tecnología en otras áreas dentro de la Universidad OBJETIVOS ESPECÍFICOS 1. Efectuar una investigación bibliográfica que permita conocer las características, ventajas y el ciclo de desarrollo de un Sistema de Data Warehousing. 2. Efectuar un análisis para determinar cuales son las necesidades de información académica primordiales para Decanos y Coordinadores de Carrera. 3. Establecer estándares para asegurar la consistencia y calidad de los datos que serán almacenados en el Data Warehouse. 4. Proveer una herramienta que ayude a los Decanos y Coordinadores de Carrera a optimizar el tiempo utilizado por ellos, en la realización de los análisis para la toma de decisiones. 5. Proporcionar a los usuarios una interfaz, que les permita visualizar la información de los estudiantes, a través de reportes preestablecidos. 6. Proveer un módulo, que permita a los usuarios manipular la información del Data Warehouse, de manera que puedan elaborar sus propios reportes ALCANCES 1. La investigación teórica acerca de las bases de datos multidimensionales incluirá los conceptos básicos del tema, las características, ventajas y el ciclo de desarrollo de un Sistema de Data Warehousing. 11

42 2. Se realizará entrevistas a los Decanos y Coordinadores de Carrera, para poder identificar la información académica requerida y analizada por ellos, así como la información que intercambian con otras unidades de la Universidad. 3. Se proporcionará un conjunto de paquetes para la extracción, transformación y carga de los datos, que aseguren la consistencia de los datos dentro del Data Warehouse. 4. Se contará con una interfaz de acceso a cubos por medio de herramientas de oficina conocidas por los usuarios, que permita consultar los reportes preestablecidos y, al mismo tiempo, facilite la elaboración de reportes acerca del rendimiento académico y población académica. 5. Se hará entrega de las siguientes herramientas del Sistema de Data Warehouse: Base de Datos Multidimensional. Programas de carga y transformación de datos, inicial y periódica. Herramientas de consulta de datos. 6. Se entregará un manual técnico y un manual de usuario LÍMITES 1. El sistema es una herramienta de apoyo para la toma de decisiones, no proporcionará la solución a un determinado problema. 2. El sistema no permitirá el ingreso o modificación de datos de manera directa por parte de los usuarios, puesto que se alimentará de otras bases de datos ya existentes. 3. El sistema está orientado a las personas responsables de la toma de decisiones relacionadas con los estudiantes: Decanos, Coordinadores de Carrera. 4. No se creará una nueva herramienta de visualización de los reportes, sino que se adaptará a una herramienta de oficina ya existente utilizada dentro de la Universidad. 5. El sistema solo se alimentará con información relacionada con los estudiantes, y no se analizará otras áreas dentro de la Universidad, tales como: Biblioteca, Empresas UCA, Proyección social, etc. 6. Solo se hará análisis y reportes para las carreras o para los estudiantes de pregrado. 12

43 7. El sistema es una herramienta de apoyo a la toma de decisiones, no generará información que permita predecir la situación del o los procesos de negocio en un futuro (Data Mining) LIMITANTES 1. El nivel de detalle alcanzado en cada uno de los reportes y análisis está delimitado por los datos y la calidad de los mismos, los cuales serán proporcionados por Secretaría General. 2. La rapidez de procesamiento de las solicitudes de reportes e información, es dependiente de las características de Hardware y Software que posee tanto el servidor de análisis (servidor del Data Warehouse), como la máquina del usuario. Estas, además, deben cumplir con los requerimientos técnicos mínimos. (ver ANEXO B) 3. El tiempo de respuesta para que se cargue la información en la computadora del usuario depende de la cantidad de memoria que contenga y de la velocidad de conexión de red con la que este cuente. 4. No se podrá efectuar análisis de procesos o procedimientos que hasta la fecha no se encuentren automatizados a través de un sistema de información. 5. El alcance de los análisis y reportes es directamente proporcional a los datos históricos con que sea alimentado el Data Warehouse. 6. Para que el sistema funcione de manera óptima, es necesario que se cuente con una persona encargada de su alimentación y mantenimiento. 7. El adecuado desempeño del sistema es dependiente de que se cuente con una red local en funcionamiento. Por tanto el sistema no podrá realizar sus tareas si esta (la red), no se encuentra activa o sufre algún daño METODOLOGÍA DE TRABAJO La metodología de trabajo a seguir está basada en el Ciclo de Desarrollo del Modelado Dimensional, la cual fue propuesta por Ralph Kimball en su libro The Data Warehouse 13

44 Lyfecycle Toolkit, puesto que es la alternativa más utilizada y aceptada actualmente para el desarrollo de un sistema de Data Warehousing. Dicha metodología describe la organización de la información en un Data Warehouse y brinda flexibilidad, extensibilidad y adaptación a elementos de datos inesperados y a nuevas decisiones de diseño. Para saber un poco más de esta metodología, consulte el Marco Teórico. 14

45 CAPÍTULO 2. MARCO TEÓRICO 2. MARCO TEÓRICO 2.1. INTRODUCCIÓN Transformar datos en información útil, es uno de los procesos más importantes que dirige las operaciones y las decisiones de una organización. Desde que inició la era de las computadoras, las organizaciones, a través de aplicaciones operacionales, han capturado a diario grandes cantidades de datos, utilizando estos para atender sus necesidades de información. En su intento por satisfacer las necesidades de los usuarios, las organizaciones han proporcionado un acceso directo a la información contenida dentro de sus aplicaciones operacionales. Otras, han extraído los datos desde sus bases de datos, para combinarlos de varias formas no estructuradas. Estos métodos, han evolucionado a través del tiempo, y ahora, en la mayoría de los casos, las organizaciones manejan datos no limpios e inconsistentes, sobre los cuales pueden tomarse decisiones importantes que tengan que ver por ejemplo, con preparar sus operaciones para el futuro. Al encontrarse con la necesidad de realizar esta clase de análisis para la toma de decisiones, la solicitud de datos e información de los usuarios se vuelve más numerosa y frecuente. Pero, puede convertirse en una tarea compleja, si se navega a través de las grandes cantidades de datos, y se trata de consolidar, analizar y distribuir esta información a otros miembros de la organización. Para satisfacer estas solicitudes, una compañía típicamente, implementa un sistema de soporte a la toma de decisiones, dedicado a proveer datos e información que puede ser utilizada para realizar análisis de negocios más significativos. 15

46 El Data Warehouse, se encuentra dentro de estos sistemas y es actualmente, el centro de atención de las grandes organizaciones, porque provee un ambiente para que estas hagan un mejor uso de la información que está siendo administrada por diversas aplicaciones operacionales. Un Data Warehouse es una colección de datos en la cual se encuentra integrada la información de la compañía y que se usa como soporte para el proceso de toma de decisiones gerenciales. Reunir los elementos de datos apropiados desde diversas fuentes de aplicación en un ambiente integral centralizado, simplifica el problema de acceso a la información y en consecuencia, acelera el proceso de análisis, consultas y el menor tiempo de uso de la información. Las aplicaciones para soporte de decisiones basadas en un Data Warehousing, pueden hacer más práctica y fácil la explotación de datos para una mayor eficacia del negocio, que no se logra cuando se usan sólo los datos que provienen de las aplicaciones operacionales (que ayudan en la operación de la empresa en sus operaciones cotidianas) SISTEMAS DE INFORMACIÓN Los Sistemas de Información son un conjunto de elementos que interactúan entre sí, con el fin de apoyar las actividades de una organización. Llevan a cabo cuatro tareas: entrada, almacenamiento y procesamiento de datos, y entrega o salida de información. Los sistemas de información se han dividido de acuerdo al siguiente esquema: 16

47 Estratégico Táctico Técnico-Operativo Interinstitucional Figura 2.1. Clasificación de los Sistemas Operacionales [Castro y Urrutia, 2004: p.21] SISTEMAS ESTRATÉGICOS Están orientados a soportar la toma de decisiones. Facilitan la labor de la dirección de una organización, proporcionándole un soporte básico en forma de mejor información, para la toma de decisiones. Se caracterizan porque son sistemas sin carga periódica de trabajo, es decir, su utilización no es predecible, al contrario de los casos posteriores, cuya utilización es periódica. Destacan entre estos sistemas: los Sistemas de Información Gerencial (MIS), Sistemas de Información Ejecutivos (EIS), Sistemas de Información Georeferencial (GIS), Sistemas de Simulación de Negocios (BIS y que en la práctica son sistemas expertos o de Inteligencia Artificial - AI) SISTEMAS TÁCTICOS Diseñados para soportar las actividades de coordinación y manejo de documentación, definidos para facilitar consultas sobre información almacenada en el sistema, proporcionar informes y en resumen, facilitar la gestión independiente de la información por parte de los niveles intermedios de la organización. Destacan entre ellos: los Sistemas Ofimáticos (OA), Sistemas de Transmisión de Mensajería (Correo electrónico y Servidor de fax), coordinación y control de tareas (Work Flow) y tratamiento de documentos (Imagen, Trámite y Bases de Datos Documentales). 17

48 SISTEMAS TÉCNICO OPERATIVOS Cubren el núcleo de operaciones tradicionales de captura masiva de datos y servicios básicos de tratamiento de datos, con tareas predefinidas (contabilidad, facturación, almacén, presupuesto, personal y otros sistemas administrativos). Estos sistemas están evolucionando con la irrupción de censores, autómatas, sistemas multimedia, bases de datos relacionales más avanzadas y Data Warehousing SISTEMAS INTERINSTITUCIONALES Este último nivel de sistemas de información recién está surgiendo, es consecuencia del desarrollo organizacional orientado a un mercado de carácter global, el cual obliga a pensar e implementar estructuras de comunicación más estrechas entre la organización y el mercado (Empresa Extendida, Organización Inteligente e Integración Organizacional), todo esto a partir de la generalización de las redes informáticas de alcance nacional y global (INTERNET), que se convierten en vehículo de comunicación entre la organización y el mercado, no importa dónde esté la organización (INTRANET), el mercado de la institución (EXTRANET) y el mercado (Red Global). La tecnología Data Warehousing, basa sus conceptos y diferencias entre dos tipos fundamentales de sistemas de información en todas las organizaciones: los sistemas técnico - operacionales y los sistemas de soporte de decisiones. Este último es la base de un Data Warehouse SISTEMAS TÉCNICO OPERACIONALES O SISTEMAS OLTP (ONLINE TRANSACTION PROCESSING) Los sistemas OLTP, son sistemas operacionales que capturan las transacciones de uno o varios negocios de una organización y suministran los datos al Data Warehouse. 18

49 Una compañía, puede poseer uno o más sistemas operacionales que dirigen sus procesos de negocio esenciales, tales como facturación, contabilidad, inventario, etc. Estos, pueden encontrarse en servidores separados, en diferentes redes y pueden estar dentro o fuera de la compañía. Traducido de Microsoft [2001a: Mod1, p.5]. Características de un Sistema OLTP Procesa transacciones de tiempo real de un negocio. Los sistemas OLTP, dirigen los procesos de negocio esenciales a través de la captura de transacciones de tiempo real y cambian continuamente para representar el estado actual del negocio. Cuando los sistemas OLTP procesan nuevas transacciones, los datos son modificados o insertados en este inmediatamente. Contienen estructuras de datos optimizadas para entradas y modificaciones. A causa del rendimiento de estos sistemas, es crítico llevar la cuenta de los procesos de negocio esenciales, las estructuras de datos son optimizadas para la entrada y modificación de datos. Provee capacidades limitadas para el soporte de toma de decisiones. El soporte para la toma de decisiones no es la prioridad de los sistemas OLTP. Para suministrar la mayoría de los datos actuales de los sistemas operacionales, basta con la creación de reportes. Sin embargo, el acceder directamente a un sistema fuente o transaccional, puede tener un impacto negativo en el desempeño del mismo, así como también producir reportes inconsistentes debido a su inestabilidad DATA WAREHOUSE El concepto de Data Warehouse nace debido a la necesidad de contar con información de apoyo a la toma de decisiones, dado que los datos operacionales no cumplen eficientemente con este objetivo. Esto conlleva a desarrollar Data Warehouses para poner el uso estratégico de la información como generador de ventajas competitivas. El término Data Warehouse fue acuñado por Bill Inmon a principios de la década de los 90 y lo definió de la siguiente manera: Un warehouse es una colección de datos orientadas al 19

50 sujeto, integrada, variante en el tiempo y no volátil para ayudar al proceso de toma de decisiones gerenciales. A continuación se analizan los términos a los que hace referencia el autor. Orientado al Sujeto: datos que brindan información sobre un sujeto del negocio en particular, en lugar de concentrarse en la dinámica de las transacciones de la organización. Integrado: los datos con los que se nutre el Data Warehouse vienen de diferentes fuentes y son integrados para dar una visión de un todo coherente. Variante en el Tiempo: todos los datos en el Data Warehouse son asociados con un período de tiempo específico. No Volátil: los datos son estables en el Data Warehouse. Más datos son agregados pero los datos existentes no son removidos. Esta definición clásica, debe tomarse como la definición pura sobre Data Warehouse. Después de diez años, sin embargo, algunos términos han sido manejados según las necesidades y capacidades del mercado, dando origen a conceptos como el de Data Mart (para referirse a Data Warehouse sobre áreas específicas en lugar del warehouse corporativo). Ralph Kimball define Data Warehouse de una forma más sencilla y práctica pero igual de importante, un Data Warehouse es una copia de los datos transaccionales específicamente estructurados para consultas y análisis. Por otra parte, tratando de dar una definición más actualizada del concepto de Data Warehouse se puede definir como una base de datos orientada a soportar un proceso de toma de decisiones y cuya información proviene de múltiples fuentes. [Marotta, 2000b: p.1]. 20

51 CARACTERÍSTICAS DE UN DATA WAREHOUSE Las principales características de un Data Warehouse son: Proveer datos para los procesos de análisis de negocios. Un Data Warehouse es un almacén de datos, que soporta los procesos de análisis de los negocios de una organización. Usualmente, es implementado como un sistema de soporte a la toma de decisiones empresariales, utilizado para proveer un ambiente de información (reporteo) que facilite el análisis de los datos, proporcionando amplias capacidades para el soporte de toma de decisiones. Integra los datos a partir de fuentes o sistemas heterogéneos. Los sistemas operacionales y, en algunas ocasiones, los sistemas externos, son las fuentes para los Data Warehouses. Estos sistemas heterogéneos, pueden contener datos transformados e integrados de sistemas OLTP, versiones previas de sistemas, archivos de texto y hojas de cálculo. Combina datos validados. Un Data Warehouse, combina datos heterogéneos que han sido autenticados de acuerdo a reglas de negocio previamente definidas. Es importante que la integridad de los datos en un Data Warehouse conozca los estándares de estas reglas y procesos. Organiza los datos dentro de grupos no-volátiles y de temas específicos. Un Data Warehouse almacena los datos en subconjuntos de datos no-volátiles y datos orientados a un tema específico. Un Data Warehouse es un ambiente estático, los datos son actualizados e ingresados dentro de éste periódicamente. La frecuencia con que se hacen las inserciones y actualizaciones de los datos, depende de los requerimientos del negocio. Almacena los datos en estructuras físicas que son optimizadas para su distribución y consulta. Un Data Warehouse facilita la recuperación y el análisis de los datos, por lo tanto la ejecución de consultas es importante. Así, el diseño de uno, es importante para una distribución y una consulta óptima de los datos. Traducido de Microsoft [2001a: Mod1, p.7]. 21

52 VENTAJAS DE UN DATA WAREHOUSE La implementación de un Data Warehouse dentro de una organización, proporciona a ésta, una serie de ventajas: Permite que la información de una organización se encuentre siempre disponible a los usuarios. Presenta la información de la organización de manera consistente. Es decir, que esta es de alta calidad, registrada y completa. Proporciona una herramienta para la toma de decisiones en cualquier área funcional, basándose en información integrada y global del negocio. Es una fuente adaptable y flexible de información. Los datos existentes, no se cambian o interrumpen cuando se agregan datos nuevos. Es un bastión seguro y protege los activos de información: El Data Warehouse no sólo proporciona acceso seguro a los datos, sino que da a sus propietarios una gran visibilidad respecto al uso y abuso de los datos. Proporciona la capacidad de aprender de los datos del pasado y de predecir situaciones futuras en diversos escenarios DIFERENCIAS ENTRE SISTEMAS TÉCNICO - OPERACIONALES (OLTP) Y DATA WAREHOUSES En cuanto a los requerimientos de diseño y características de implementación, los Sistemas Operacionales (OLTP) y los Data Warehouses poseen muchas diferencias, las que se pueden resumir a continuación. Tabla 2.1. Diferencias entre Sistema Operacional y Data Warehouse [Castro y Urrutia, 2004: p.29]. Sistema Operacional Data Warehouse Predomina la actualización. Predomina la consulta. La actividad más importante es del tipo La actividad más importante es el análisis operativo (día a día). y la decisión estratégica. 22

53 Predomina el proceso puntual. Mayor importancia a la estabilidad. Datos en general desagregados. Importancia del dato actual. Importancia del tiempo de respuesta de la transacción instantánea. Estructura relacional. Usuarios de perfiles medios o bajos. Explotación de la información relacionada con la operativa de cada aplicación. Predomina el proceso masivo. Mayor importancia al dinamismo. Datos en distintos niveles de detalle y agregación. Importancia del dato histórico. Importancia de la respuesta masiva Visión multidimencional. Usuarios de perfiles altos. Explotación de toda la información interna y externa del negocio ARQUITECTURA TÉCNICA DE UN DATA WAREHOUSE Una de las razones por las que el desarrollo de un Data Warehouse crece rápidamente, es porque realmente es una tecnología entendible. El Data Warehousing puede representar mejor la estructura de una compañía para administrar los datos operacionales dentro de ésta. Con el fin de comprender cómo se relacionan todos los componentes involucrados en una estrategia Data Warehousing, es esencial tener una Arquitectura Data Warehouse. El diseño de una arquitectura agrega un gran valor a la construcción de un sistema, permitiendo una mejor comunicación comprensión de la magnitud y complejidad del proyecto- y planificación. Mas allá de eso, una arquitectura bien diseñada, incrementa la flexibilidad del sistema, facilita el aprendizaje (gracias a la documentación) y aumenta la productividad. La arquitectura técnica, es el plan completo, en el que se describe, qué es lo que el Data Warehouse hará cuando se implemente. Describe el flujo que siguen los datos, desde el/los sistema(s) fuentes, hasta las personas involucradas en la toma de decisiones, así como también, las transformaciones que los datos sufrirán a lo largo del camino. Asimismo, se 23

54 especifican las herramientas y las técnicas que se necesitarán para que estos procesos se lleven a cabo. Esta arquitectura, está constituida por un número de elementos conectados entre sí: Sistemas Origen (OLTP). Área de Organización de Datos (Data Staging Area). Servicios de extracción, transformación y carga. Modelo Dimensional. Data Warehouse. Servidor Analítico. BUS Data Warehouse Figura 2.2. Arquitectura Técnica de un Data Warehouse. Adaptado de Kimball et al. [2002: p.7] La arquitectura técnica tiene dos tipos de componentes: servicios y almacenes de datos. Los servicios son las funciones necesarias para realizar las tareas requeridas del Data Warehouse. Los almacenes de datos, son los lugares (temporales o permanentes) de alojamiento para estos. Descripción de la Arquitectura Técnica de un Data Warehouse 24

55 Los datos se mueven desde los sistemas origen hacia el área de organización de datos (comúnmente llamada data staging area), utilizando las aplicaciones proveídas como parte de los servicios de esta. Este flujo, es dirigido por los metadatos, que toman en cuenta los siguientes aspectos: información que describe la localización y definición de los datos fuentes y de sus destinos, transformaciones de datos, coordinación y dependencias. Una vez que los datos son combinados y transformados en el staging area, el mismo conjunto de servicios, son utilizados para seleccionar, sumarizar y reestructurar los datos dentro de conjuntos o estructuras denominadas diagramas estrella (base del modelo dimensional). Estos conjuntos de datos son cargados en la plataforma del servidor analítico, enlazando las respectivas dimensiones y hechos. Finalmente, los usuarios obtienen el acceso a los datos, a través de herramientas de acceso a los mismos. Estas herramientas deben ganar ventaja sobre los servicios de soporte de consultas para ayudar a localizar los datos adecuados, y recolectar la información acerca del uso y desempeño del sistema. En el desarrollo de este capítulo, se explicará con más detalle cada uno de los componentes que conforman esta arquitectura SISTEMAS ORIGEN (SOURCE SYSTEM) Es un sistema operacional, cuya función principal es la de capturar o almacenar las transacciones que realiza la empresa o negocio. Las principales prioridades de un Sistema Origen son: su tiempo de vida útil y la disponibilidad. Las consultas realizadas en un sistema origen, son cortas y forman parte del flujo normal de una transacción, además son altamente restringidas en sus demandas de información. Asimismo un sistema origen mantiene pocos datos históricos, y la administración de los reportes es una gran carga para estos sistemas. 25

56 A diferencia de un Data Warehouse, los datos almacenados en un sistema origen no son ampliamente consultados, ni en tantas diferentes formas como típicamente lo son en un Data Warehouse. Traducido de Kimball et al. [1998: p.14] AREA DE ORGANIZACIÓN DE LOS DATOS (DATA STAGING AREA) Es un área de almacenamiento y a su vez, un conjunto de procesos que limpian, transforman, combinan, eliminan datos duplicados, archivan y preparan los datos de origen, para su uso en el Data Warehouse. Estos procesos son comúnmente conocidos como procesos de extracción, transformación y carga (ETL). Traducido de Kimball et al. [1998: p.16]. El data staging area, es todo lo que se encuentra entre los sistemas origen y el servidor analítico. Su restricción principal es que está fuera del alcance de los usuarios del negocio y no provee consultas ni reportes. Kimball et al. [1998: p.16]. Pues en ésta, los datos operacionales son transformados para ser colocados luego, dentro de un almacén (servidor analítico) que permita el acceso a la información por parte de los usuarios. La extracción es el primer paso en el proceso de obtención de los datos que serán incluidos en el ambiente del DW. Extraer significa, leer y comprender los datos fuente y copiar los que el Data Warehouse necesita, dentro del staging area para que sean manipulados minuciosamente. Traducido de Kimball et al. [2002: p.8]. Una vez que los datos son extraídos dentro del staging area, hay muchos posibles pasos para la transformación de estos, que incluyen: la limpieza de los datos (corrigiendo errores ortográficos, resolviendo conflictos de dominios, tratando con elementos perdidos, o convirtiendo los datos en formatos estándar), la combinación de datos de múltiples fuentes, la eliminación de datos duplicados y la asignación de llaves para el almacenamiento. Todas estas transformaciones son precursoras para cargar los datos dentro del Data Warehouse. Traducido de Kimball et al. [2002: p.8] 26

57 Actualmente, dentro de la industria existe la interrogante acerca de si los datos resultantes del proceso anterior, deben ser cargados o almacenados dentro de estructuras normalizadas o relacionales antes de cargarlos en el servidor analítico para la realización de consultas y reportes. En muchos casos el data staging area no está basado en una tecnología de base de datos relacional, puede en cambio consistir en un sistema de archivos planos. Puesto que después de verificar si los datos se ajustan a las reglas del negocio, se considera innecesario diseñar una base de datos basada en un modelo relacional para almacenar la información. Sin embargo, existen algunos casos donde los datos llegan al data staging area en forma normalizada dentro de una estructura relacional. En estas situaciones, puede resultar más cómodo llevar a cabo las tareas de transformación y limpieza utilizando una estructura relacional. La creación de estructuras normalizadas para el data staging area y de estructuras dimensionales para el servidor analítico, significa que los datos son extraídos, transformados y cargados dos veces: una vez dentro de la base de datos normalizada y luego cuando se cargan en el modelo dimensional. Obviamente este proceso de dos pasos requiere más tiempo y recursos para el desarrollo: mayor tiempo para la carga periódica o modificación de datos y más capacidad para almacenar las múltiples copias de los datos. Es recomendable para el desarrollo de un proyecto de Data Warehousing, no invertir demasiado tiempo de desarrollo en la construcción de estructuras normalizadas para el data staging area, más bien, centrar su atención, en la elaboración del modelo de datos que ayudará a los usuarios finales en los procesos para la toma de las decisiones de su organización. Mientras se cree que la consistencia de los datos, es una de las metas principales dentro del ambiente de un DW, existen propuestas igualmente efectivas y menos costosas que crear un conjunto de tablas normalizadas dentro del staging area, cuando estas estructuras no existan. 27

58 Es aceptable crear una base de datos normalizada para soportar los servicios ETL, aunque este no es el objetivo principal del data staging area. Luego de los procesos de transformación, los datos están listos para cargarse. Es recomendable crear dentro del staging area una réplica de las estructuras utilizadas en el modelo dimensional, para luego llevar a cabo una carga masiva hacia las estructuras reales, esto con el fin de mejorar el rendimiento del Data Warehouse MODELO DIMENSIONAL (DIMENSIONAL MODEL) Antes de introducir la técnica del modelo dimensional, es necesario comprender los siguientes conceptos PROCESOS DE NEGOCIO (BUSINESS PROCESS) Conjunto principal de actividades o procesos operacionales, soportados por un sistema origen u OLTP (como por ejemplo el procesamiento de órdenes de compra ), desde los cuales los datos pueden ser recolectados para propósitos analíticos del Data Warehouse. Los procesos de negocio, en algunas ocasiones, pueden cruzarse y tener puntos en común; y ciertamente la definición de un proceso de negocio individual puede cambiar o evolucionar a través del tiempo. Asimismo, un proceso de negocio es un grupo útil de recursos de información con un tema coherente. Traducido de Kimball et al. [1998: p.18] DATA MART Es un subconjunto lógico y físico del Data Warehouse. Normalmente, se restringe a un solo proceso de negocio o a un grupo de procesos relacionados. Cada Data Mart debe ser representado por un modelo dimensional y dentro de un solo Data Warehouse. 28

59 Uno o varios Data Marts pueden ser incluidos en un Data Warehouse, ser construidos en bases de datos relacionales u OLAP y, contener información detallada o sumarizada, que puede o no ser compartida entre ellos. Traducido de Kimball et al. [1998: p.18] MODELO DIMENSIONAL El modelo dimensional, es el nombre para una técnica de diseño lógico que usualmente se utiliza para la construcción de un Data Warehouse y difiere de un modelo entidad relación. El modelo dimensional, contiene la misma información que un modelo E/R, sin embargo, los datos son empaquetados en un formato simétrico, en el cual las metas principales son: Entendimiento por parte de los usuarios. Rendimiento de las consultas. Resistencia al Cambio. El modelo dimensional se basa en el diseño y la construcción de una estructura lógica y física denominada Diagrama Estrella, que es utilizada para representar Data Mart. Los principales componentes de un diagrama estrella son: Tabla de hechos (Fact Table). Tablas de Dimensiones (Dimension Tables). Una tabla de hechos, es la tabla principal en todo diagrama estrella, contiene métricas o medidas, las cuales describen eventos específicos del negocio. Las métricas más utilizadas son datos numéricos y sumatorias. Cada tabla de hechos contiene dos o más llaves foráneas unidas a sus respectivas tablas de dimensiones. Una tabla de dimensión, es cada una de las tablas que acompañan a la tabla de hechos. Cada dimensión es definida por su llave primaria que sirve como base para la integridad referencial con cada tabla de hechos con la cual es unida. La mayoría de las tablas de 29

60 dimensiones contienen muchos atributos (campos), que son la base para la unión y agrupamiento dentro de las consultas que se generan en el Data Warehouse. Traducido de Kimball et al. [1998: p.17]. Figura 2.3. Ejemplo de Diagrama Estrella COMPONENTES DE LA TABLA DE HECHOS La tabla de hechos, es la tabla central del diagrama estrella que presenta los datos numéricos existentes en el contexto de las entidades del negocio. Está compuesta principalmente por métricas y llaves foráneas. Métricas: son columnas numéricas y cuantificables de la tabla de hechos. Las métricas típicamente representan los valores que son analizados, como por ejemplo: unidades de 30

61 ventas o número de empleados. Las métricas, son generalmente numéricas, puesto que estos valores son la base desde la cual pueden efectuarse cálculos. Llaves Foráneas: Una llave foránea, es la representación de la llave primaria de una dimensión en la tabla de hechos. Las llaves foráneas son tomadas de las llaves primarias de cada una de las tablas de dimensiones. La combinación de estas llaves, es típicamente el identificador único para cada registro de la tabla de hechos. Traducido de Microsoft [2001a: Mod1, p.20] GRANULARIDAD La granularidad, es el significado de un registro de la tabla de hechos que provee el contexto de los datos numéricos almacenados en la tabla. La granularidad es definida típicamente como, el mínimo nivel de detalle almacenado en las dimensiones asociadas con la tabla de hechos. Dada su dependencia con los datos en las dimensiones, la integridad de los datos en la tabla de hechos, depende de que se mantenga la granularidad y de que se apliquen llaves únicas en las tablas de dimensiones. La granularidad debe apegarse a los siguientes principios de diseño: Cada tabla de hechos solo puede tener definida una granularidad. Todas las métricas dentro de la tabla de hechos deben obedecer a la granularidad definida. Cuando se tienen datos en dos niveles de detalle diferentes, es necesario implementar más de una tabla de hechos para contener los datos. Traducido de Microsoft [2001a: Mod1, p.21] TABLAS DE DIMENSIONES Una tabla de dimensión representa una entidad del negocio, proporcionando el contexto para los datos numéricos contenidos dentro de la tabla de hechos. El diseño de las tablas de 31

62 dimensiones, se centra en las necesidades de análisis de los usuarios para poder presentarles información útil, descriptiva y fácil de encontrar. Características de la tabla de dimensión: Describe las entidades dentro del negocio. Dentro del diagrama estrella, una tabla de dimensión representa una sola entidad del negocio, por ejemplo: un producto o un cliente. Contiene atributos que proporcionan el contexto necesario para los datos numéricos. Las columnas de atributos son descriptivas y altamente correlacionadas. Estas son utilizadas con el fin de proveer el contexto para los datos numéricos almacenados en la tabla de hechos. La finalidad de los atributos, es ver la información de cada dimensión diferente y agrupar los datos para ser analizados. Por ejemplo, un usuario puede requerir los datos de las ventas mensuales medidas por cliente y región. Presentan datos organizados en jerarquías. Las jerarquías son representadas por un ordenamiento lógico dentro de la dimensión, se encuentran formadas por los diferentes tipos de relaciones entre los atributos de una misma dimensión. Pueden existir múltiples jerarquías dentro de una dimensión pero siempre es posible identificar una jerarquía principal o columna vertebral de la dimensión y jerarquías secundarias o descriptivas compuestas por atributos característicos definidos desde la jerarquía principal. En cada dimensión, los datos pueden ser organizados dentro de una o más jerarquías. Al construir jerarquías, se les permite a los usuarios observar los datos detallados y resumidos. Traducido de Microsoft [2001a: Mod1, p.22] EL ESQUEMA SNOWFLAKE El esquema snowflake es una variación del diagrama estrella, en el cual las jerarquías existentes en una tabla de dimensión son almacenadas en múltiples tablas de dimensiones. 32

63 Figura 2.4. Ejemplo de Esquema Snowflake Debido a que los datos de las dimensiones se almacenan a través de múltiples tablas, un esquema snowflake es más normalizado que un diagrama estrella que contiene una sola tabla para cada dimensión. Solamente una de las tablas de dimensión se relaciona con la tabla de hechos y las demás se unen por medio de relaciones de llaves foráneas. Traducido de Microsoft [2001a: Mod1, p.23] PASOS PARA EL DISEÑO DEL MODELO DIMENSIONAL Para la creación de un modelo dimensional se considera el seguimiento de cuatro pasos, que son descritos a continuación: Paso 1: Seleccionar el proceso de negocio a modelar Un proceso, es una actividad de negocio que se lleva a cabo dentro de la organización que típicamente es soportada por una colección de sistemas operacionales. Escuchar a los usuarios es el medio más eficiente para seleccionar el proceso de negocio a modelar. Las 33

64 métricas o medidas que ellos desean analizar en el Data Warehouse, provienen de las medidas de los procesos de negocio existentes. Paso 2: Declarar la granularidad del proceso de negocio Declarar la granularidad significa, especificar qué es lo que exactamente representa una fila de la tabla de hechos, es decir, cual es el mínimo nivel de detalle asociado a las métricas de dicha tabla. Paso 3: Seleccionar las dimensiones que se aplicarán para cada fila de la tabla de hechos Las dimensiones se obtienen al responder la pregunta Cómo los usuarios del negocio describen los datos resultantes del proceso de negocio?. Se pretende que la tabla de hechos, posea un conjunto robusto de dimensiones, que representen todas las posibles descripciones que sean aceptadas en el contexto de cada métrica. Al tener definida claramente la granularidad, será bastante sencillo poder identificar las dimensiones. Con cada métrica seleccionada, se debe crear una lista de todos los atributos discretos que completarán cada tabla de dimensión. Paso 4: Identificar las métricas Los datos son determinados por medio de la pregunta Qué se está midiendo?. Los usuarios del negocio se interesan en analizar el rendimiento de estas métricas. Todas las posibles métricas en el diseño deben estar de acuerdo con la granularidad definida en el paso 2. Los datos que pertenecen a una granularidad diferente deben separarse en otra tabla de hechos PRIMITIVAS DE TRANSFORMACIÓN Como una ayuda a la hora de diseñar los diagramas estrella de un DW, se utiliza un conjunto de herramientas conocidas como primitivas de transformación, que fueron propuestas por Adriana Marotta en su tesis Data Warehouse Design and Maintenance through Schema Transformations. Estas transformaciones, se aplican al esquema (relacional) de la base de datos fuente, para obtener así, el o los diagramas del DW 34

65 correspondientes. Estas primitivas trabajan con un solo esquema, no pueden utilizarse para integrar varios esquemas a la vez, a dicho esquema le llamaremos Diagrama de transformación de datos (DTD). Figura 2.5. Diagrama de Transformación de datos. Adaptado de Marotta [2000a: p.21] Entre las clases de transformaciones que estas primitivas incluyen están: particiones de tablas, uniones de tablas, adiciones de atributos, remociones de atributos y cambios de llaves primarias y foráneas. A continuación se presenta el conjunto completo de primitivas de transformación. Tabla 2.2. Primitivas de transformación. Traducido de Marotta [2000a: p.26] Transformación Descripción T1 Identidad Dada una tabla, genera otra exactamente igual a la tabla origen. T2 Filtrado de Datos Dada una tabla, genera otra donde solo algunos atributos se preservan. Su objetivo es eliminar los atributos puramente operacionales. T3 Temporización Agrega un elemento de tiempo al conjunto de 35

66 atributos de una tabla. T4 Generalización de PK * Generaliza la llave primaria de una tabla de dimensión T5 Actualización de FK Por medio de esta primitiva, una llave foránea y sus referencias pueden ser cambiadas en una tabla. Esto es útil cuando se cambian las llaves primarias. T6 DD-Adding * Las primitivas de este grupo, agregan a la tabla, un atributo que se deriva de otros. T7 Adición de Atributo Agrega atributos a una tabla de dimensión. Esto es útil para mantener en la misma tupla, más de una versión de un atributo. T8 Roll Up jerárquico Realiza un roll-up a partir de uno de los atributos de la tabla siguiendo una jerarquía. Además, se puede generar otra tabla de jerarquía con el mismo nivel de detalle. T9 Resumen Dada una tabla de métricas (que contiene un atributo de medida), genera otra donde los datos son resumidos o agrupados, por un conjunto de atributos. T10 Matriz Dada una tabla que contiene un atributo de medida, y un atributo que representa un conjunto predeterminado de valores, genera una tabla con una estructura de matriz. T11 Partición por estabilidad * Particiona una tabla de manera que organiza sus datos en forma histórica. Particiones horizontales y verticales pueden aplicarse según el criterio del diseñador T12 Generación jerárquica Esta es una familia de primitivas, que generan tablas de jerarquía, tomando como entrada, tablas que contienen una jerarquía o parte de una. T13 Break Off Elimina un conjunto de atributos de una tabla de dimensión, construyendo una nueva tabla con ellos. 36

67 T14 Crossing Permite realizar el cruzamiento de un conjunto de tablas de dimensión, en una nueva tabla de dimensión. Las primitivas marcadas con * corresponden a grupos de primitivas. Descripción de primitivas de transformación T1. Identidad Esta primitiva es útil cuando se desea generar en el DW, una tabla que es exactamente igual a otra. La tabla original puede ser una tabla que ya existe en la base de datos origen o una que es un resultado intermedio (el resultado de la aplicación de una primitiva). Traducido de Marotta [2000a, p.27]. T2. Filtrado de Datos En bases de datos operacionales, hay algunos atributos que son de interés para el sistema de DW, pero hay otros que corresponden a datos puramente operacionales, que no son útiles para la clase de análisis que se desea realizar con el DW. El objetivo de esta primitiva es preservar los atributos que son de utilidad, removiendo los demás. Traducido de Marotta [2000a, p.27]. T3. Temporización Muchas de las tablas en sistemas operacionales no mantienen una noción temporal. En DW, muchas tablas necesitan incluir un elemento temporal para que en estas se pueda almacenar información histórica. Traducido de Marotta [2000a, p.27]. T4. Generalización de la Llave Primaria (Pk) Los sujetos del mundo real que son representados en las dimensiones, usualmente evolucionan a través del tiempo. Por ejemplo, un cliente puede cambiar su dirección, o un producto puede cambiar su descripción. 37

68 En muchos casos, es suficiente mantener solamente el último valor, pero en otros, es necesario almacenar todas las versiones del elemento y de esta forma mantener la historia. El objetivo de este grupo de primitivas es, generalizar la llave primaria de una tabla de dimensión, de tal manera que se pueda almacenar más de un tupla de cada sujeto representado en la tabla. Traducido de Marotta [2000a, p.27]. Se proporcionan dos alternativas para hacer esta generalización: T4.1. Dígitos de la Versión Para generalizar la llave, se añade a cada valor del atributo, un dígito que represente la versión. Traducido de Marotta [2000a, p.28]. T4.2. Extensión de la llave primaria La llave primaria se extiende agregándole nuevos atributos de la tabla. Traducido de Marotta [2000a, p.28]. T5. Actualización de Llaves Foráneas Cuándo se cambia la llave primaria de una tabla, es necesario hacer los mismos cambios en todas las llaves foráneas de las tablas a las que hace referencia. Traducido de Marotta [2000a, p.28]. T6. DD-Adding En los sistemas de producción, los datos, usualmente son calculados a partir de otros al momento de realizar las consultas ( queries ); esto, a pesar de la complejidad de algunas funciones de cálculo, se realiza para prevenir cualquier clase de redundancia. En un sistema de DW, a veces, por razones de rendimiento, es conveniente mantener esta clase de datos calculados. 38

69 Las primitivas de este grupo, agregan a la tabla, un atributo que se deriva de otros. Estos datos no alteran la granularidad de la tabla. Traducido de Marotta [2000a, p.28]. T6.1. DD-Add 1-1 En este caso, los cálculos se hacen sólo sobre una tabla y una tupla. Por ejemplo, la importación total de una venta, se calcula a partir de la cantidad vendida y el precio por unidad, los cuales están todos dentro de la misma tabla. Traducido de Marotta [2000a, p.28]. T6.2. DD-Add N-1 En este caso se utilizan dos tablas. Un atributo calculado se añade a una ellas. Este atributo, se deriva de algunos atributos de la misma tabla y otros de la otra. Por ejemplo: los precios de los productos expresados en dólares, son calculados a partir de los precios de los productos expresados en cualquier otra moneda y de una tabla que contiene los valores del dólar. Traducido de Marotta [2000a, p.29]. La función de cálculo, trabaja sólo sobre una tupla de las tablas. Esta tupla debe ser obtenida únicamente por medio de la unión de las dos tablas. T6.3. DD-Add N-N Este es el caso más complejo. Se utilizan dos tablas y N tuplas para el cálculo del atributo. Se tiene el siguiente ejemplo de un banco: Existe una tabla con datos de los clientes y otra con datos de las cuentas que posee un cliente. Si se desea añadir a la primera, el monto total de todas las cuentas de cada cliente, deben sumarse todos los montos contenidos en la segunda tabla por cada cliente. La función del cálculo trabaja sobre un conjunto de tuplas de una de las tablas. Estas tuplas deben obtenerse por la unión de las dos tablas. Traducido de Marotta [2000a, p.29]. T7. Adición de Atributo 39

70 Como se mencionó anteriormente, los sujetos que son representados en las dimensiones, usualmente evolucionan o cambian a través del tiempo. A veces se requiere mantener la historia de estos cambios en el DW. En algunos casos, solamente un número fijo de valores de cierto atributo deben ser almacenados. Por ejemplo, podría ser útil mantener el valor actual de un atributo y el anterior a este, o el valor actual de un atributo y el original. En estos casos, se almacenan atributos vacíos en una tabla de dimensión, para cambios futuros. Por ejemplo, si un cliente se muda y se quiere almacenar la nueva dirección y también la antigua, se agrega a la tabla, un atributo con un valor nulo inicial, para luego ser llenado cuando el cliente se mude. Traducido de Marotta [2000a, p.29]. T8. Roll Up Jerárquico En las bases de datos operacionales, la información es almacenada en las tablas con el mayor nivel de detalle posible. Y, generalmente, en las tablas hay un atributo que tiene una jerarquía asociada. A menudo, cuando estas tablas se utilizan en un DW, son resumidas a partir de un atributo siguiendo alguna jerarquía (haciendo un roll-up ). Por ejemplo, si los datos están almacenados a nivel diario y se requieren las sumas mensuales. En este caso se está haciendo un roll-up en una jerarquía de tiempo. Esta primitiva, hace el roll-up, a partir de uno de los atributos de la tabla siguiendo una jerarquía. Además, se puede generar otra tabla de jerarquía con el correspondiente nivel de detalle. Traducido de Marotta [2000a, p.29]. T9. Resumen En los sistemas operacionales, los datos son manejados como cruces de muchas dimensiones. En general, muchas tablas del DW se construyen a partir de estos cruces, y 40

71 los datos son agrupados por algunas de las dimensiones. Otras dimensiones son removidas como resultado de esta agrupación de información. Por ejemplo, para un sistema de salario, puede ser de gran importancia saber qué empleado ha realizado cierta venta. Sin embargo, para analizar las ventas a nivel global en el DW, se requieren los datos resumidos y no el detalle de la información. Esta primitiva quita un conjunto de atributos de una tabla de medidas o métricas, resumiendo las medidas. Esta operación tiene el efecto de disminuir el número de tuplas de la tabla. Traducido de Marotta [2000a, p.30]. T10. Matriz En una tabla donde las medidas o métricas, son mantenidas mes a mes, puede ser útil, que en lugar de tener un atributo para el mes y otro para la medida, se tengan 12 atributos para las métricas de los 12 meses respectivamente. Con esta estructura, los informes comparativos se pueden elaborar más fácilmente y con un mejor rendimiento, pues los totales anuales se calculan a nivel de una tupla. Además, el número de tuplas se reduce. Esta esquema de múltiples atributos, es útil no sólo para los meses, de hecho puede utilizarse para cualquier atributo cuyo conjunto de valores es finito y conocido (para que un atributo pueda ser asignado a cada valor). Dada una tabla que contiene un atributo que representa un determinado conjunto de valores, esta primitiva genera una tabla con una estructura de matriz o de datos en serie. Traducido de Marotta [2000a, p.30]. T11. Partición Por Estabilidad A veces se recomienda particionar o dividir una tabla distribuyendo sus datos en tablas diferentes. Esto puede ser útil, por ejemplo, para mantener los datos más recientes más accesibles que el resto. Permite también organizar los datos según su propensión al cambio. 41

72 Estas primitivas dividen una tabla, para organizar su almacenamiento de datos. La primera (División Vertical) o la segunda (División Horizontal) primitiva de esta familia pueden ser aplicadas, dependiendo del criterio del diseño utilizado. Traducido de Marotta [2000a, p.30]. T11.1. Partición Vertical Esta primitiva aplica una partición vertical a una tabla de dimensión, obteniendo varias tablas como resultado. Se distribuyen los atributos, agrupándolos según su propensión al cambio. Traducido de Marotta [2000a, p.30]. T11.2. Partición Horizontal Dos tablas son generadas a partir de una original: una para datos más actuales y la otra para la información histórica. Cada tabla resultante contiene los mismos atributos que la original. Traducido de Marotta [2000a, p.31]. T12. Generación Jerárquica Generan tablas de jerarquía, tomando como entrada, tablas que incluyen una jerarquía o parte de una. Adicionalmente, transforman las tablas originales de tal forma que ya no incluyan la jerarquía. En lugar de esto, las relaciona con la o las nuevas tablas de jerarquía a través de una llave foránea. Traducido de Marotta [2000a, p.31]. Las tres primitivas que componen a esta familia son: T12.1. Denormalización Esta primitiva genera sólo una tabla para la jerarquía. Traducido de Marotta [2000a, p.31]. T12.2. Snowflake Esta primitiva genera varias tablas para la jerarquía, representándola en una forma normalizada. Traducido de Marotta [2000a, p.31]. T12.3. Descomposición Libre 42

73 Esta primitiva genera varias tablas para la jerarquía. La forma (la distribución de atributos) de estas tablas es decidida por el diseñador. Traducido de Marotta [2000a, p.31]. T13. Break Off A menudo, en una dimensión existe un conjunto de atributos que tienen un número limitado de valores posibles. La idea es codificar las combinaciones de valores de estos atributos (sólo las combinaciones que ocurren realmente) y almacenarlos en una tabla separada, de tal manera que puedan ser referidos o referenciados por otras tablas. El espacio del almacenamiento se salva utilizando esta estructura. Esta primitiva genera dos tablas de dimensión. Una es el resultado de eliminar un conjunto de atributos de una tabla de dimensión. La otra, es una tabla que contiene sólo este conjunto de atributos. Además, se define una llave foránea entre las dos tablas. Traducido de Marotta [2000a, p.31]. T14. Crossing En muchos casos, se necesita hacer un cruce de la dimensión en una tabla nueva. Esto puede hacerse a través de la unión de algunas tablas. Por ejemplo, hay una tabla de métricas donde la dimensión de producto se cruza con otras dimensiones, y otra tabla, donde el suministrador es determinado por el producto. La dimensión del suministrador se puede añadir a la tabla de métricas y el producto puede ser removido, obteniendo un cruce entre el suministrador y las otras dimensiones que existen en la tabla de métricas. Traducido de Marotta [2000a, p.32] OLAP (PROCESAMIENTO ANALÍTICO EN LÍNEA) OLAP (Online Analytical Processing) es la actividad general de consultar y presentar datos textuales y numéricos desde los Data Warehouses. 43

74 La tecnología OLAP es no-relacional, y casi siempre está basada en un cubo de datos multidimensional. Las bases de datos OLAP también son conocidas como bases de datos multidimensionales o MDDB s. Traducido de Kimball et al. [1998: p.21] HERRAMIENTAS OLAP Las herramientas OLAP presentan al usuario una visión multidimensional de los datos para cada actividad que es objeto de análisis. El usuario formula consultas a la herramienta OLAP seleccionando atributos del esquema multidimensional sin conocer la estructura interna del Data Warehouse. La herramienta OLAP genera la correspondiente consulta y la envía al gestor de consultas del sistema. Utilizando herramientas OLAP, los usuarios pueden acceder al Data Warehouse brindando a los responsables de las tomas de decisiones de las organizaciones, el potencial de mejorar su comprensión del negocio y los cambios que lo afectan, de incrementar su habilidad para identificar o generar soluciones posibles a problemas de decisión, y de efectuar oportunamente formulaciones tácticas o estratégicas alineadas con los objetivos de la organización. Esta característica de analizar y sintetizar la información a partir de OLAP, surge de la elaboración de múltiples escenarios que contestan preguntas tales como qué pasaría si... o por qué ARQUITECTURAS DE ALMACENAMIENTO OLAP OLAP soporta tres tipos de arquitecturas de almacenamiento: ROLAP MOLAP HOLAP 44

75 ALMACENAMIENTO ROLAP (OLAP RELACIONAL) La arquitectura ROLAP, accede a los datos almacenados en un Data Warehouse para proporcionar los análisis OLAP. La premisa de los sistemas ROLAP es que las capacidades OLAP se soportan mejor contra las bases de datos relacionales. El sistema ROLAP utiliza una arquitectura de tres niveles: El nivel de Base de Datos usa bases de datos relacionales para el manejo, acceso y obtención de los datos. El nivel de aplicación es el motor que ejecuta las consultas multidimensionales de los usuarios. El motor ROLAP se integra con niveles de presentación, a través de los cuales los usuarios realizan los análisis OLAP. Esta arquitectura accede directamente a los datos del Data Warehouse, y soporta técnicas de optimización de accesos para acelerar las consultas. Estas optimizaciones son, entre otras, particionado de los datos a nivel de aplicación, soporte a la desnormalización y joins múltiples ALMACENAMIENTO MOLAP (OLAP MULTIDIMENSIONAL) La arquitectura MOLAP usa bases de datos multidimensionales para proporcionar el análisis; su principal premisa es que el OLAP está mejor implantado almacenando los datos multidimensionalmente. El sistema MOLAP utiliza una arquitectura de dos niveles: La Base de Datos Multidimensional es la encargada del manejo, acceso y obtención de los datos. 45

76 El nivel de aplicación es el responsable de la ejecución de los requerimientos OLAP. El nivel de presentación se integra con el de aplicación y proporciona una interfaz a través de la cual los usuarios finales visualizan los análisis OLAP. Una arquitectura cliente/servidor permite a varios usuarios acceder a la misma base de datos multidimensional. La arquitectura MOLAP requiere cálculos intensivos de compilación. Lee datos precompilados, y tiene capacidades limitadas de crear agregaciones dinámicamente o de encontrar valores que no se hayan precalculado y almacenado previamente ALMACENAMIENTO HOLAP (OLAP HÍBRIDO) El modo de almacenamiento HOLAP combina atributos de los modos MOLAP y ROLAP. La idea que yace detrás de HOLAP es obtener los beneficios de una arquitectura MOLAP para la información resumida, pero se necesita el detalle, por lo tanto el sistema retrocederá a una base de datos relacional. El rendimiento aumenta aunque solo a nivel de información resumida, y la escalabilidad puede ser resuelta porque todo el detalle está almacenado en tablas relacionales convencionales. Las particiones almacenadas como HOLAP son más pequeñas que sus equivalentes MOLAP y responden más rápidamente que las particiones ROLAP a las consultas que implican datos de resumen. El modo de almacenamiento HOLAP suele ser más adecuado para particiones en cubos que requieren una respuesta de consultas rápida basada en una gran cantidad de datos de origen COMPONENTES DE BASES DE DATOS OLAP Las Bases de Datos OLAP están definidas por los siguientes componentes: Métricas Numéricas 46

77 Las métricas son los valores o datos que los usuarios analizan. Deben provenir de la tabla de hechos definida en el modelo dimensional. Dimensiones Las dimensiones representan las categorías del negocio que proveen el contexto a las métricas numéricas. Son los equivalentes lógicos de las dimensiones del diagrama estrella, con la excepción que los miembros de una dimensión están organizados dentro de una estructura jerárquica. Adicionalmente, puede mencionarse que las dimensiones OLAP resultan más fáciles de navegar que las dimensiones del diagrama estrella. Cubos Los cubos combinan todas las dimensiones y todas las métricas dentro de un modelo conceptual. Actúan como el almacenamiento lógico para una base de datos OLAP y son, lo que los usuarios manipulan para tener acceso a sus datos. Traducido de Microsoft [2001a: Mod1, p.25] FUNDAMENTOS DE DIMENSIONES Una dimensión OLAP es manejada por medio de niveles y miembros. Estos componentes representan las tablas de dimensiones encontradas en los cubos OLAP del origen de datos. Las dimensiones contienen los elementos jerárquicos que se describen en la siguiente tabla: Tabla 2.3. Elementos jerárquicos de una dimensión. Traducido de Microsoft [2001a: Mod1, p.27]. Elemento de Definición Dimensión Nivel Grupo de los miembros de una dimensión que comparten un significado en común. Los niveles son las columnas de las tablas de dimensión. Miembro Cada valor discreto dentro de una dimensión. Los miembros representan los valores de las tablas de dimensión en columnas de niveles. Dimensión Organiza los niveles y miembros en estructura de árbol. 47

78 Familia de Relaciones de Dimensiones OLAP utiliza términos familiares para describir las relaciones entre los miembros y los niveles de una dimensión. Las relaciones que se utilizan usualmente son: padre, hijo, descendiente, antepasado, hermano, primo y miembro. Traducido de Microsoft [2001a: Mod1, p.28]. Métricas de Cubos Las métricas son los valores numéricos que los usuarios analizan. Características de las métricas: Deben ser numéricas. Corresponden a los datos de la tabla de hechos. Solo una tabla de hechos puede ser usada para diseñar un cubo, por lo tanto, las métricas solamente pueden provenir de una tabla origen de datos. Las métricas cruzan todas las dimensiones en todos los niveles. Son, en conjunto todos los niveles de detalle a través de todas las dimensiones. Todos los cubos contienen métricas de dimensiones OPERACIONES EN MODELOS MULTIDIMENSIONALES Los cubos son las estructuras de almacenamiento lógico para las bases de datos OLAP. Combinan dimensiones y métricas en modelos intuitivos y flexibles que los usuarios manipulan para crear consultas. Un cubo define una serie de dimensiones relacionadas que forman una rejilla n- dimensional: Cada celda del cubo tiene un valor, exactamente como una hoja de balance. El valor de cada celda es una intersección de las dimensiones. Traducido de Microsoft [2001a: Mod1, p.33]. 48

79 SELECCIONAR DIMENSIONES (SLICE) Es la acción de conformar un subconjunto de los datos de un cubo aplicándole una única restricción a una sola dimensión, mediante la elección de un miembro en particular. Figura 2.6. Seleccionar Dimensiones (Slice) [Peralta, 2003: p.30] FILTRADO (DICE) Cuando se combinan varios Slice, la acción efectuada es llamada Dice. Dice es equivalente a aplicar más de una restricción, ya sea para una misma dimensión o para varias dimensiones. Figura 2.7. Filtrado (Dice) [Peralta, 2003: p.31] 49

80 MOVIMIENTOS EN LA JERARQUÍA DE UNA DIMENSIÓN (DRILL-UP, DRILL-DOWN) Una de las características del acceso a la información es la posibilidad de representarla a diferentes niveles de agregación. Esto se logra mediante las características conocidas como Drill Down y Roll Up. Estas son técnicas para navegar a través de distintos niveles de detalle de una jerarquía de datos, desde los de mayor nivel de agregación (también llamados datos sumarizados) hasta los más detallados. Drill Down explora los hechos hacia los niveles más detallados de la jerarquía de dimensiones, mientras que Roll Up explora los hechos iterativamente hacia el nivel más alto de agregación Figura 2.8. Ejemplo de Drill-Up y Drill-Down [Peralta, 2003: p.33] Drill-Up o Drill-Down son agrupamientos y desagrupamientos. Figura 2.9. Explicación gráfica de Drill-Up y Drill-Down [Peralta, 2003: p.34] 50

81 CONSOLIDACIÓN (ROLL-UP) Calcula las medidas en función de agrupamientos. Realiza el re-cálculo de la métrica de acuerdo a los ajustes de escala. Propiedades: Se debe especificar cuál es la operación que calcula el nuevo valor de la métrica. Esta operación puede ser: suma, promedio, etc. Puede haber métricas con comportamientos diferentes. En general cualquier operación de navegación en un cubo implica un nuevo cálculo de la métrica. Figura Consolidación (Roll Up) [Peralta, 2003: p.35] DRILL-ACROSS Relaciona dos cubos. Permite moverse lateralmente a otro cubo con el que se comparte dimensiones. 51

82 Figura Drill-Across [Peralta, 2003: p.38] DRILL-THROUGH Recuperar un conjunto de filas del origen de datos de una celda de un cubo, es decir, acceder a datos descriptivos. Figura Drill-Throug [Peralta, 2003: p.39] CICLO DE VIDA DEL MODELADO DIMENSIONAL Este modelado ilustra las diferentes etapas por las que debe pasar todo proceso de Data Warehousing. Esta es actualmente la alternativa más utilizada para el desarrollo de un sistema de Data Warehousing. A continuación se detallan las etapas de su ciclo de vida. 52

83 PLANIFICACIÓN DEL PROYECTO El ciclo de vida comienza con la planificación del proyecto. Esta, se centra en la definición y el alcance del Data Warehouse, incluyendo la valoración y la justificación de los procesos de negocios. Estas, son tareas críticas, debido a la alta visibilidad y a los costos asociados con la mayoría de proyectos de este tipo. Por ello, la planificación del proyecto se enfoca, en los recursos de la organización y en los requisitos de las habilidades del personal, asociadas con la asignación, duración y seguimiento de las tareas. El resultado integrado del plan del proyecto, identifica todas las tareas asociadas con el Ciclo de Vida Dimensional del Negocio y las partes involucradas. Esto, sirve como primer paso para la administración de un proyecto de Data Warehouse. Traducido de Kimball et al. [1998: p.33] DEFINICIÓN DE LOS REQUERIMIENTOS DEL NEGOCIO Para que el Data Warehouse tenga éxito, deben entenderse los negocios y requerimientos de los usuarios finales. Las técnicas utilizadas para obtener los requerimientos analíticos difieren significativamente de las utilizadas tradicionalmente. Los diseñadores de Data Warehouse deben entender los factores claves que guían el negocio para determinar efectivamente los requerimientos, y así traducirlos en las propuestas de diseño. Traducido de Kimball et al. [1998: p.34] DISEÑO DE LA ARQUITECTURA TÉCNICA El medio ambiente del Data Warehouse requiere de la integración de numerosas tecnologías. Se necesitan considerar simultáneamente, tres factores los requerimientos del negocio, el ambiente técnico actual y las estrategias técnicas planeadas para establecer el diseño de la arquitectura técnica. Traducido de Kimball et al. [1998: p.35]. 53

84 Figura Ciclo de vida del modelado dimensional. Adaptado de Kimball [1998: p.33] Figura Ciclo de vida del modelado dimensional. Adaptado de Kimball [1998: p.33] 54

85 SELECCIÓN DE PRODUCTOS E INSTALACIÓN Usando el diseño de la arquitectura técnica como estructura de soporte, se necesita evaluar y seleccionar componentes específicos, tales como: plataforma de hardware, sistema administrador de base de datos y las herramientas de carga y de acceso a datos. Un proceso de evaluación técnico, es realizado junto con la evaluación de factores específicos para cada uno de los componentes de la arquitectura. Una vez que los productos han sido evaluados y seleccionados, deben instalarse y probarse cuidadosamente para asegurar una integración apropiada en el entorno del Data Warehouse. Traducido de Kimball et al. [1998: p.36] MODELADO DIMENSIONAL La definición de los requerimientos del negocio, determina las necesidades de datos de los usuarios. Para diseñar modelos de datos que soporten estos análisis, se necesita una aproximación diferente a la utilizada en el diseño de sistemas operacionales. Se inicia construyendo una matriz que representa los puntos o procesos claves del negocio y su dimensionalidad. La matriz sirve como modelo para asegurar que el Data Warehouse sea extensible en la organización a través del tiempo. Partiendo de esto se dirigirá un análisis más detallado de los datos en los sistemas operacionales más relevantes. A partir de este análisis y junto con el entendimiento de los requerimientos obtenidos, se desarrolla un modelo dimensional. Este modelo identifica la granularidad de la tabla de hechos (fact table), las dimensiones asociadas, los atributos, jerarquías y datos. El diseño lógico de la base de datos es completado con las estructuras de las tablas y las relaciones entre éstas (llaves primarias y foráneas). Este grupo de actividades concluye con el desarrollo del mapeo de datos, desde las fuentes de origen hacia las fuentes destino. Traducido de Kimball et al. [1998: p.34]. 55

86 DISEÑO FÍSICO El diseño físico de la base de datos se enfoca en definir las estructuras físicas necesarias para soportar su diseño lógico. Los elementos principales de este proceso incluyen: definir los estándares de nombres y configurar el medio ambiente de la base de datos. Las estrategias preliminares de indexamiento y particionamiento son también determinadas. Traducido de Kimball et al. [1998: p.35] DISEÑO Y DESARROLLO DEL DATA STAGING Este proceso es, típicamente, la tarea de Data Warehousing más subestimada. El proceso de data staging tiene tres pasos principales: extracción, transformación y carga (ETL). El proceso de extracción siempre expone problemas relacionados con la calidad de los datos, estas inconsistencias se han encontrado ocultas dentro de los sistemas operacionales. La calidad de los datos tiene un impacto significativo en la credibilidad del Data Warehouse, por eso se necesita tratar estos problemas durante el proceso del data staging. Se necesita diseñar y construir dos procesos de carga, uno para la población inicial del Data Warehouse y el otro para las cargas regulares e incrementales. Traducido de Kimball et al. [1998: p.35] ESPECIFICACIONES DE LAS APLICACIONES DEL USUARIO FINAL Se recomienda definir un grupo estándar de aplicaciones de usuario final ya que no todos los usuarios del negocio necesitan tener un acceso particular (a la medida), al Data Warehouse. Las especificaciones de la aplicación describen la plantilla de los repotes, los parámetros de los usuarios y los cálculos requeridos. Estas especificaciones aseguran que el equipo de desarrollo y los usuarios del negocio tienen un entendimiento común de la aplicación que se desarrollará. Traducido de Kimball et al. [1998: p.36]. 56

87 DESARROLLO DE LAS APLICACIONES DEL USUARIO FINAL Siguiendo las especificaciones anteriores, se inicia el desarrollo de las aplicaciones del usuario final, esta etapa, involucra la configuración de la herramienta de metadatos y la construcción de los reportes. Estas aplicaciones deben ser construidas utilizando una herramienta avanzada de acceso a datos que provea una productividad significativa al equipo de desarrollo. Adicionalmente, la aplicación debe proveer un mecanismo poderoso para que los usuarios puedan modificar fácilmente las plantillas de los reportes ya existentes. Traducido de Kimball et al. [1998: p.36] IMPLEMENTACIÓN En esta etapa, se unifican los resultados de las tareas realizadas anteriormente, para que el Data Warehouse sea accesibles desde las computadoras de los usuarios finales. La planificación extensiva de este proceso, es requerida para asegurar que las piezas encajen apropiadamente. Así mismo, la capacitación de los usuarios debe integrar todos los aspectos del desarrollo y los productos entregados. La comunicación con los usuarios, o las estrategias de retroalimentación y soporte, deben ser establecidas antes de que cualquier usuario tenga acceso al Data Warehouse. Traducido de Kimball et al. [1998: p.36] MANTENIMIENTO Y CRECIMIENTO Después de la implementación inicial del Data Warehouse, es necesario, continuar dando soporte y capacitación a los usuarios del negocio. También se debe prestar atención a los procesos internos, asegurándose que trabajen efectivamente en el Data Warehouse. Los niveles de aceptación y de rendimiento del Data Warehouse deben ser medidos y registrados todo el tiempo. Finalmente, el plan de mantenimiento debe incluir una estrategia amplia de comunicación, basada en el acercamiento con los usuarios. Si se ha utilizado el ciclo de vida dimensional, el Data Warehouse estará destinado a evolucionar y a crecer. Traducido de Kimball et al. [1998: p.37]. 57

88 ADMINISTRACIÓN DEL PROYECTO Asegura que las actividades del ciclo de vida dimensional se mantengan en la vía correcta y en sintonía. Las actividades de la administración del proyecto ocurren a través de todo el ciclo de vida. Estas actividades se enfocan en monitorear el estado de los proyectos, llevar un control de errores y un control de cambios para preservar los objetivos del proyecto. Finalmente, la administración del proyecto, incluye el desarrollo de un plan de comunicación, que se centra tanto en el negocio como en la organización de los sistemas de información. La comunicación continua es absolutamente crítica para administrar las expectativas; y, administrar las expectativas, es absolutamente crítico para lograr los objetivos del Data Warehouse. Traducido de Kimball et al. [1998: p.37]. 58

89 CAPITULO 3. ANÁLISIS DEL SISTEMA 3. ÁLISIS DEL SISTEMA 3.1. DEFINICIÓN DE LOS REQUERIMIENTOS Con el propósito de identificar las necesidades de información específicas de los usuarios, se decidió llevar a cabo una serie de entrevistas con Decanos y Coordinadores de Carrera. Para ello, se elaboró una propuesta en base a la información con que cuenta Dirección de Informática, sobre los análisis que podrían ser de interés para el trabajo que estos realizan (ver Anexo A). Posteriormente se diseñó una guía de entrevistas (ver Anexo B) con una serie de preguntas encaminadas a conocer las labores de la unidad: el intercambio de información existente entre éstas y Registro Académico o Dirección de Informática, así como también, los reportes estadísticos importantes para el buen funcionamiento de las mismas. Se entrevistó a cada uno de los Decanos, por ser estos las entidades que pueden realizar procesos de toma de decisiones con respecto al área académica de cada una de sus Facultades. Asimismo, se entrevistó a un Coordinador de Carrera de cada Facultad, puesto que son quienes ayudan a los Decanos a llevar a cabo los procesos anteriormente mencionados, para la carrera que ellos dirigen. Para definir a cuáles Coordinadores de Carrera se entrevistaría, se tomaron en consideración las siguientes características: visionario, que realice constantemente análisis acerca de la situación académica de sus estudiantes y cuya carrera esté dentro de aquellas con el mayor número de estudiantes. En base a lo anterior, se entrevistó a las siguientes personas: 59

90 Tabla 3.1. Listado de personas entrevistadas Nombre Cargo Lic. José Manuel Ernesto Rivas Zacatares Decano de la Facultad de Ciencias Económicas y Empresariales. Lic. Silvia Elinor Azucena de Fernández Decano de la Facultad de Ciencias Sociales y Humanidades. Ing. Celina Pérez Rivera Decano de la Facultad de Ingeniería y Arquitectura. Lic. Alicia Guadalupe Alvarenga Conde Coordinador de Licenciatura en Ciencias de la Computación Lic. Víctor René Martínez Mejía Coordinador de Administración de Empresas Lic. Karla Ivette Peña Martell Coordinador de Licenciatura en Ciencias Jurídicas Como resultado del análisis de los requerimientos de información, se determinó que los usuarios requieren realizar análisis acerca de los siguientes temas: Análisis de Población Académica Análisis geográfico estudiantil: Donde se muestra cómo está distribuida la población estudiantil en las diferentes Facultades y carreras de la Universidad (cantidad de alumnos por departamento o municipio). Análisis por tipo de Ingreso: Se muestra la cantidad de alumnos por ciclo, para cada facultad y carrera, agrupados por el tipo de ingreso (nuevo ingreso, ingreso continuo, ingreso por equivalencia y reingreso). Análisis por sexo y estado familiar. Se presenta la cantidad de alumnos inscritos por ciclo, para cada facultad y carrera, agrupados por el sexo y estado familiar. Análisis por institución de procedencia. 60

91 Permite observar la cantidad de alumnos por institución de procedencia (colegio, escuela o instituto), para cada facultad y carrera en un determinado ciclo. Análisis de Rendimiento Académico Análisis geográfico estudiantil. Este análisis permite observar la relación que tiene el lugar de procedencia de los alumnos (departamento o municipio), con su rendimiento académico. Análisis por tipo de ingreso. Permite comparar el desempeño de los alumnos, por facultad y carrera, de acuerdo al tipo de ingreso de éstos a la Universidad (nuevo ingreso, ingreso continuo, ingreso por equivalencia y reingreso). Análisis por sexo y estado familiar. Se puede realizar una comparación del rendimiento académico de los alumnos, para cada facultad y carrera, por sexo y estado familiar. Análisis por institución de procedencia Es útil para comparar el rendimiento académico de los alumnos de cada facultad y carrera, con respecto a la institución (colegio, instituto o escuela) de procedencia de estos. Análisis por Materias Con este análisis, es posible comparar el rendimiento en las materias por secciones, a través de los diferentes ciclos. Se visualiza la cantidad de alumnos inscritos, anulados, retirados, aprobados y reprobados; así como la nota promedio de los alumnos que cursaron la materia y el catedrático asignado a cada sección. Gracias a los análisis anteriores, es posible satisfacer las necesidades de reportes planteadas por los usuarios, las cuales se detallan a continuación: Decanos: Distribución de la población académica por colegios y lugar de procedencia. Listado de los mejores alumnos de la facultad, carrera. 61

92 Cantidad de alumnos que tienen una materia inscrita en más de tercera matrícula, para cada materia. Reporte de alumnos por rendimiento (CUM), para cada carrera y facultad. Alumnos de reingreso, para cada facultad en un determinado ciclo. Tendencia de las diferentes materias a través del tiempo (profesor, inscritos, aprobados, reprobados y nota promedio). Consolidado de alumnos inscritos por carrera en un ciclo. Coordinadores de Carrera: CUM promedio por año de ingreso en un determinado ciclo. Materias con mayor índice de aprobación. Distribución por carrera, por matrícula en cada materia. Listado de los mejores alumnos de la carrera. Rendimiento de alumnos por el ciclo de ingreso (si su ciclo de ingreso es 01 o 02) Rendimiento de los alumnos por sexo y estado familiar (de la carrera que ellos coordinan). Tendencia de las diferentes materias a través del tiempo (inscritos, aprobados, reprobados, nota promedio y profesor). Cantidad de alumnos por carrera DISEÑO DE LA ARQUITECTURA TÉCNICA A continuación se presenta un esquema general de la arquitectura técnica diseñada, en el cual se contemplan las fuentes y destinos de la información del Data Warehouse que se creará, así como el flujo que seguirán los datos desde el sistema fuente hasta las personas involucradas en la toma de decisiones. 62

93 Figura 3.1. Diagrama de Flujo de Datos del Data Warehouse Figura 3.1. Diagrama de Flujo de Datos del Data Warehouse 63

94 La arquitectura técnica diseñada está constituida por cuatro repositorios de datos diferentes: Base de Datos Transaccional (OLTP), en este caso la Base de Datos del Sistema de Información Académica (BDSIA). Área de Organización de Datos (Data Staging Area). Base de Datos del Diagrama Estrella. Base de Datos Multidimensional. A partir de la Base de Datos del Sistema de Información Académica (BSIA), se cargarán los datos necesarios para la elaboración de los reportes al Data Staging Area, donde se someterán a diversos procesos de Extracción, Transformación y Limpieza. Los datos ya transformados serán cargados en la Base de Datos que contiene el o los Diagramas Estrella modelados, y se creará la Base de Datos Multidimensional a partir de estos. Los usuarios podrán consultar la información contenida en los cubos de la Base de Datos Multidimensional por medio los reportes que les serán proporcionados SELECCIÓN DE LAS HERRAMIENTAS DE DESARROLLO Se realizó una comparación de las ventajas y precios de los RDBMS más utilizados en la actualidad, para decidir cual de ellos era la mejor alternativa para elaborar el Data Warehouse para el Registro Académico. Tabla 3.2. Comparación entre RDBMS existentes en el mercado Ventajas Velocidad. Compresión de datos almacenados. Sybase Facilidad de manejo Mayor escalabilidad. Precios Sybase Adaptive Server Enterprise: $3, $4, Sybase IQ: $30,000 en adelante. 64

95 Oracle 9i SQL Server 2000 Es escalable, manejable y posee un buen rendimiento. Está diseñada para ser una plataforma completa para Data Warehouse. Proporciona nuevas funcionalidades significativas en Online Analytical Processing (OLAP) y Data Mining. Propone una visión más moderna, frente a la visión tradicional de servidores analíticos, ofreciendo una Base de Datos relacionalmultidimensional. Simplifica el proceso reduciendo el costo de mantenimiento de los datos. Soporta consultas complejas analíticas. Ofrece Oracle OLAP como una parte integrada de la Base de Datos. Proporciona un balance entre calidad y precio. Proporciona capacidades para Data Mining y análisis habilitado para la web Gran escalabilidad y buen rendimiento a través de Vistas indexadas, Data Transformation Services, Procesamiento avanzado de consultas. Una plataforma completa: Integración con Office 2000, English Query, Microsoft Visual Studio Database Tools, Business Intelligence Alliance. $40, para 25 nombres de usuarios por procesador $1, en adelante Luego de comparar las características que estos RDBMS poseen para el manejo y desarrollo de un Data Warehouse, se tomó la decisión de utilizar SQL Server 2000 y su 65

96 servidor analítico Analysis Server, pues éste, se adapta mejor a las características del sistema que se desarrolló, entre las que pueden mencionarse: cantidad de información a almacenar, frecuencia de la carga de datos, cantidad de usuarios con permisos de acceso, precio accesible, facilidad de manejo, adaptabilidad en cuanto a recursos de hardware que se poseen en la Universidad, entre otras. A continuación se detallarán las características de esta herramienta. MICROSOFT SQL SERVER 2000 SQL Server es un Sistema Administrador de Bases de Datos Relacionales (RDBMS), producido por Microsoft. Soporta el Lenguaje Estructurado de Consultas (SQL por sus siglas en inglés), que es el lenguaje de Base de Datos más utilizado. SQL Server 2000 es una Base de Datos completa, que posee características que facilitan los aspectos de la construcción y el mantenimiento de un Data Warehouse. Posee un conjunto de herramientas que ayudan a sacar el mejor partido de los datos que se recogen y almacenan en ella. Entre las herramientas de SQL Server más comúnmente utilizadas en aplicaciones de Data Warehouse, y que serán utilizadas para el desarrollo de este sistema, se pueden mencionar: o Base de Datos Relacional: Los sistemas de Data Warehouse, utilizan la tecnología de bases de datos relacionales como los fundamentos para su diseño, construcción y mantenimiento. El componente principal de SQL Server, es un potente motor de Base de Datos relacional. o Servicios de Transformación de Datos (DTS por sus siglas en inglés). 66

97 Las aplicaciones de Data Warehouse, requieren de la transformación de datos; comenzando con extraer estos, de las múltiples fuentes para luego introducirlos en un conjunto de datos consistentes, configurados apropiadamente para su uso en las operaciones dentro del Data Warehouse. SQL Server 2000 provee una herramienta para llevar a cabo tales tareas: Los Servicios de Transformación de Datos (DTS). Los DTS, pueden acceder a los datos desde múltiples fuentes de información, y luego transformarlas, utilizando especificaciones de transformación integradas. o Analysis Services. Los Data Warehouses, reúnen y organizan datos empresariales que soportan la toma de decisiones organizacional a través del análisis. Analysis Services, provee tecnología de procesamiento analítico en línea (OLAP), que organiza cantidades masivas de datos del Data Warehouse, para un análisis rápido por parte de las herramientas cliente; ofrece además, tecnología sofisticada de minería de datos (Data Mining) para analizar y descubrir información con los datos del Data Warehouse. MICROSOFT EXCEL Como herramienta para visualización de los datos del Data Warehouse, se utilizará Microsoft Excel. Esta herramienta tiene una fuerte integración con SQL Server 2000, con ella los usuarios pueden realizar análisis sofisticados en grandes conjuntos de datos. Aporta acceso a los datos de SQL Server 2000, permitiendo que se creen vistas dinámicas de cubos OLAP gracias a la funcionalidad de Microsoft PivotTable. Excel también facilita que cualquier usuario guarde una hoja de cálculo, gráfico o PivotTable como página web, capacitando a otros usuarios para el acceso y análisis de datos SQL Server. REQUISITOS MÍNIMOS DE HARDWARE Y SOFTWARE Para llevar a cabo la implementación del sistema y en base a las herramientas seleccionadas anteriormente se proponen como requisitos mínimos los siguientes: 67

98 Tabla 3.3. Requisitos mínimos de Hardware HARDWARE Servidor Usuarios Procesador Pentium IV 3.8 GHz. Computadoras personales con las Memoria RAM 1 GB. 160 GB disco duro. Dispositivos de CD-ROM o DVD- ROM siguientes características: Procesador Pentium III o mayores (mínimo a 800 Mhz). Memoria RAM 256 MB. 500 MB de espacio disponible en disco duro. Dispositivos de CD-ROM o DVD- ROM. Tabla 3.4. Requisitos mínimos de Software SOFTWARE Servidor Usuarios Sistema Operativo: Microsoft Sistema Operativo: Windows 2000 Server. Windows 2000 Service Pack 4; Microsoft SQL Server 2000 (Standard Edition) con Service Pack 4. Ms Excel Programa Antivirus. Windows XP; Windows XP Service Pack 2 Microsoft Excel: Microsoft Excel 2002 (con Office XP Service Pack 3) o Microsoft Excel MODELADO DIMENSIONAL Teniendo identificadas las necesidades de información de los usuarios y habiendo seleccionado las herramientas que se usarán para el desarrollo del Data Warehouse se llevó a cabo el proceso de Modelado Dimensional. 68

99 El proceso del Diseño Dimensional, estará basado en los siguientes cuatro pasos: Seleccionar el proceso de negocio a modelar. Declarar la granularidad del proceso de negocio. Seleccionar las dimensiones que se aplicarán para cada fila de la tabla de hechos. Identificar las métricas. A partir de los análisis planteados en la etapa de obtención de requerimientos, se identificaron dos procesos de negocio a modelar. Análisis de alumnos Paso 1 (seleccionar el proceso de negocio a modelar): Analizar el rendimiento académico de los alumnos, tomando en cuenta diferentes factores que influyen en éste y que fueron mencionados en el apartado anterior. Al mismo tiempo se decidió incluir el estudio de Población Académica, puesto que existen elementos comunes entre los dos análisis. Con esto se evitará que exista una redundancia de datos al modelar dos diagramas que contengan información similar. Paso 2 (definir la granularidad): Al observar los datos almacenados por el SIA y tomando en cuenta la dinámica de trabajo de la Universidad, se determinó que todos los datos estaban en función de un ciclo determinado. Por tanto, la granularidad para este proceso de negocio a modelar será ciclo. Paso 3 (seleccionar las dimensiones): De acuerdo a las peticiones efectuadas por los usuarios, se identificaron las siguientes dimensiones: Alumno, Departamento Municipio, Estado de Alumno, Carrera Facultad, Tipo de Ingreso del alumno, Sexo, Estado familiar, Institución de Procedencia, País de procedencia. Paso 4 (identificar las métricas): Los valores numéricos de interés, mediante los cuales se podrá analizar el rendimiento académico, son: el CUM del alumno (general, de carrera y de 69

100 ciclo). Para el análisis de población académica se incluyó una métrica para la cantidad de alumnos. Los pasos anteriores se resumen en la siguiente tabla: Tabla 3.5. Aplicación del modelado dimensional al análisis de alumnos Granularidad Dimensiones Métricas Ciclo Alumno Departamento Municipio Estado-Alumno Carrera Facultad Tipo de Ingreso Sexo Estado familiar Institución País Tiempo Cantidad alumnos CUM general CUM carrera CUM ciclo En base a la tabla anterior y tomando en cuenta la información existente en el SIA se diseñó el siguiente diagrama estrella: 70

101 Figura 3.2. Diagrama Estrella para análisis de alumnos Figura 3.2. Diagrama Estrella para análisis de alumnos 71

102 Para llevar a cabo los procesos ETL, se utilizó el conjunto de Primitivas de Transformación definidas en capítulos anteriores. Es necesario aclarar que para cada diagrama estrella se distinguieron dos momentos de carga: Carga Inicial: se almacena toda la información histórica disponible hasta el momento de la carga. Carga Periódica: solamente se almacenan los datos nuevos, en ese caso, la información de un nuevo ciclo. Se presentan a continuación, los Diagramas de Transformación de Datos (DTD) para generar las dimensiones del Diagrama Estrella Alumno, en los que se muestran: Las tablas de la Base de Datos origen BDSIA (izquierda). Las transformaciones que fueron aplicadas a las tablas del BDSIA, para alimentar las estructuras del Diagrama Estrella Alumno (círculos). Los números dentro de los círculos hacen referencia a la primitiva de transformación utilizada (ver Tabla 2.2). Las dimensiones del Diagrama Estrella Alumno (derecha). 72

103 Para la carga inicial se tiene: Figura 3.3. Diagrama de transformación de datos inicial para el análisis de alumnos Figura 3.3. Diagrama de transformación de datos inicial para el análisis de alumnos 73

104 Para la carga periódica: Figura 3.4. Diagrama de transformación de datos periódico para el análisis de alumnos Figura 3.4. Diagrama de transformación de datos periódico para el análisis de alumnos 74

105 Análisis de Materias Paso 1: Se necesita comparar el rendimiento en las materias por secciones, a través de los diferentes ciclos. Paso 2: Al igual que el análisis anterior, se determinó que todos los datos estaban en función de un ciclo determinado. Por tanto, la granularidad para este proceso de negocio a modelar, será ciclo. Paso 3: Las dimensiones identificadas para este proceso de negocio son: Sección, Profesor, Tipo de Materia, Matrícula, Materia - Departamento, Facultad-Carrera, Alumno, Estado Materia. Paso 4: Los valores numéricos, que se requieren para evaluar el rendimiento y demanda de una materia determinada son: total de alumnos inscritos, retirados, anulados, aprobados y reprobados; para analizar el rendimiento se considerarán las siguientes métricas: la nota promedio y cantidad. Tabla 3.6. Aplicación del modelado dimensional al análisis de materias Granularidad Dimensiones Métricas Ciclo Sección Profesor Tipo de Materia Matrícula Materia - Departamento Facultad - Carrera Tiempo Alumno Estado de la Materia Cantidad Nota 75

106 El diagrama estrella resultante es el siguiente: Figura 3.5. Diagrama Estrella para el análisis de materias Figura 3.5. Diagrama Estrella para el análisis de materias 76

107 El DTD de la carga inicial: Figura 3.6. Diagrama de transformación de datos inicial para el análisis de materias Figura 3.6. Diagrama de transformación de datos inicial para el análisis de materias 77

108 DTD carga periódica: Figura 3.7. Diagrama de transformación de datos periódico para el análisis de materias Figura 3.7. Diagrama de transformación de datos periódico para el análisis de materias 78

109 CAPÍTULO 4. DISEÑO DEL SISTEMA 4. DISEÑO DEL SISTEMA 4.1. DISEÑO FÍSICO En esta etapa, se crearon las estructuras físicas (tablas) del diagrama estrella, para implementar el modelo de datos creado en la fase de modelado dimensional. Para ello, se elaboró una nueva Base de Datos: SIA_STAR. Para el modelo de datos de ALUMNO, se crearon dos tablas de dimensión adicionales para manejar el tiempo, pues existen tres campos en la tabla de hechos, que se encuentran relacionados con este: el ciclo de ingreso de un estudiante, el ciclo de su último ingreso (último ciclo inscrito) y la fecha de nacimiento. Se creó una dimensión para manejar el ciclo de ingreso (DW_CICLO1) y otra para manejar el ciclo de último ingreso (DW_CICLO), las cuales solamente cuentan con tres campos: id para el ciclo, el año y el ciclo. Para manejar la edad, se utilizó la dimensión de tiempo ya existente (DW_TIEMPO). (Ver estructuras en el Manual Técnico). Por otro lado, para el modelo de datos de MATERIA se utilizaron las dimensiones DW_ALUMNO, DW_CICLO y DW_CARRERA_FACULTAD del modelo de datos ALUMNO, las otras dimensiones no sufrieron cambios. En las figuras que se muestran a continuación podrá observar el resultado final de crear las estructuras físicas de los dos diagramas estrella modelados, dentro de la Base de Datos SIA_STAR.. 79

110 Figura 4.1. Diagrama Estrella Físico para el Análisis de Alumnos Figura 4.1. Diagrama Estrella Físico para el Análisis de Alumnos 80

111 Figura 4.2. Diagrama Estrella Físico para el Análisis de Materias Figura 4.2. Diagrama Estrella Físico para el Análisis de Materias 81

112 4.2. DISEÑO Y DESARROLLO DEL DATA STAGING AREA ESTANDARIZACIÓN DE DATOS Para poder llevar a cabo los procesos ETL se procedió a definir estándares de datos, con el fin de asegurar la consistencia de estos dentro del Data Warehouse. Como regla general, un Data Warehouse no debe contener valores nulos o vacíos, por lo tanto, a los datos provenientes de la Base de Datos BDSIA con valor NULL o (vacío) se les asignó un valor, de la siguiente forma: Tabla 4.1. Tabla de estándares de datos Tipo de Dato Valor Asignado Carácter ND Cadena de caracteres No Definido Numérico 0 Se crearon nuevas tablas en el Data Staging Area para poder eliminar inconsistencias, valores nulos, campos vacíos, etc. En el Anexo E se podrá encontrar una explicación de las tablas que se usaron para la carga, limpieza y transformación de datos. TABLAS DE PARÁMETROS Se crearon tablas de parámetros en el Data Staging Area para algunos datos que estaban definidos como Rules en la Base de Datos BDSIA y serían utilizados para generar algunas dimensiones del Diagrama Estrella. Las tablas de parámetros creadas son las siguientes: CALIDAD_EDUCATIVA CATEG_INGRESO CATEG_INSTITUCION 82

113 ESTADO_ALUMNO ESTADO_FAMILIAR SECTOR_INSTITUCION SEXO SISTEMA TIPO_CARRERA MATRICULA ESTADO_MATERIA TIPO_MATERIA TABLAS DE EQUIVALENCIAS Cuando se procedió a limpiar los datos de la tabla Institución, se observó que había datos repetidos, es decir, existía dos registros para la misma institución, pero con código diferente. En este caso se creó una tabla de equivalencias que contendría el código anterior, el nombre anterior, el código nuevo y nombre nuevo usado para cada institución. La estructura de la tabla es la siguiente: Tabla 4.2. Estructura de la tabla INSTITUCION_P Atributo Tipo Dato Nulo PK FK Descripción cod_anterior char(11) No Código utilizado anteriormente para la institución (9 caracteres). Si no existe código anterior de 9 caracteres, se coloca el código de 5 caracteres nbr_institucion_anterior varchar(50) Si Nombre utilizado anteriormente para la institución. cod_nuevo char(11) Si Nuevo código de la institución (5 caracteres). Si no existe código nuevo de 5 caracteres, se coloca el código de 9 caracteres 83

114 nbr_institucion_nuevo varchar(50) Si Nuevo nombre utilizado para la institución SERVICIO DE TRANSFORMACIÓN DE DATOS (DTS, DATA TRANFORMATION SERVICES) Se conoce como DTS al conjunto de servicios proporcionados por SQL Server 2000 para las tareas de extracción, transformación y carga de datos (Procesos ETL). Los Servicios de transformación de datos (DTS) proporcionan un conjunto de herramientas gráficas y de objetos programables que permiten resolver problemas de movimiento de datos, incluyendo la extracción, transformación y la consolidación de datos de distintas fuentes a destinos únicos o múltiples. Dentro del ciclo de desarrollo de un Data Warehouse la creación de los procesos ETL es una de las tareas más complejas e importantes; puesto que en esta fase los datos provenientes de diversas fuentes son agrupados, estandarizados, transformados y validados para que la información que alimenta al sistema de Data Warehousing sea consistente. Esta es una de las fases que requiere mayor planificación, tiempo y cuidado en su ejecución, siendo además de las más subestimadas al principio del desarrollo de este tipo de sistemas. Las herramientas de DTS se han utilizado para llevar a cabo los procesos ETL siguiendo los pasos que se describen a continuación: Primero se realiza el proceso de extracción, que consiste en estudiar y entender los datos fuente, tomando aquellos que son útiles para el sistema, para ello se hace una copia y filtro de los datos desde la Base de Datos origen (BDSIA) hacia el Data Staging Area. Una vez que los datos han sido extraídos, éstos se transforman a una forma entendible y de valor para los usuarios. Este proceso incluye corrección de errores, resolución de problemas de estándares, borrado de campos que no son de interés, generación de claves, agregación de información, etc. 84

115 Al terminar el proceso de transformación, se hace la carga de los datos en el Data Warehouse (SIA_STAR), luego se realizan controles de calidad para asegurar que la información sea correcta y consistente. Para el desarrollo de este proyecto, los procesos ETL fueron divididos en dos partes: 1. Procesos ETL para alimentar el Diagrama Estrella Alumno. 2. Procesos ETL encargados de poblar el Diagrama Estrella Materia. De acuerdo al diseño de un Data Warehouse, cada de uno de estos procesos deber ser subdivididos en 2 cargas o tareas: Carga Inicial: Esta es la encargada de llevar toda información histórica, existente en las Base de Datos origen (BDSIA) al sistema de Data Warehousing. Carga Periódica: Su objetivo principal es actualizar la información contenida dentro del sistema de Data Warehousing agregando información nueva y modificando la información existente cuando sea necesario. Es importante aclarar que para la carga ya sea inicial o periódica en el diagrama estrella (SIA_STAR), primero se debe realizar la carga de todas las dimensiones y posteriormente llevar a cabo la carga de la tabla de hechos, ya que durante el proceso de carga de esta última se deben consultar todas las dimensiones con las que posee relación. A continuación se explica más detalladamente las tareas efectuadas en cada una de las cargas por medio de diagramas de flujo de datos: Carga Inicial: Como se dijo anteriormente primero es necesario hacer la carga de cada una de las dimensiones, esta carga se realiza de la siguiente forma: 85

116 Tabla(s) origen en BDSIA Extracción Archivo de Texto Filtrado de Campos Carga en Data Staging Area Carga en la Dimension Tabla limpia con claves necesarias para enlace en el Diagrama Estrella Limpieza y transformación de datos Tabla para efectuar transformaciones Dimensión Final Figura 4.3. Diagrama de Flujo de Datos para la Carga Inicial de una Dimensión Posteriormente se ejecuta la carga de la tabla de hechos de la siguiente forma: Tabla(s) origen en BDSIA Extracción Archivo de Texto Carga en Data Staging Area Filtrado de Campos Reconstrucción de Datos Históricos Tabla limpia Limpieza y transformación de datos Tabla para efectuar transformaciones Tabla auxiliar para generación de Tabla de Hechos Generación de claves para relación con dimensiones Tabla Auxiliar de Hechos con métricas y claves que la vinculan a cada dimensión Carga en Tabla de Hechos Tabla de Hechos Final Figura 4.4. Diagrama de Flujo de Datos para la Carga Inicial de la Tabla de Hechos 86

117 Carga periódica: Esta lleva a cabo la alimentación de los datos nuevos al Data Warehouse, en este caso, se encargará de almacenar los datos correspondientes al nuevo ciclo. Siguiendo los mismos pasos que en la carga inicial, en una primera fase se hacen las agregaciones de datos nuevos a cada una de las dimensiones, y finalmente se efectúa la carga de la tabla de hechos. Antes de llevar a cabo cada uno de estos procesos se verifica, que no se cargue información repetida dentro del data warehouse. Las tareas necesarias para la agregación de datos nuevos a una dimensión se explican a través del siguiente esquema: Tabla(s) origen en BDSIA Extracción Archivo de Texto Filtrado de Campos Carga en Data Staging Area Limpieza y transformación de datos Tabla con registros nuevos Comprobación y Carga de nuevos registros Tabla para efectuar transformaciones Tabla limpia con claves necesarias para enlace en el Diagrama Estrella Carga en la Dimensión de nuevos registros Dimensión Final Figura 4.5. Diagrama de Flujo de Datos para la Carga Periódica de una Dimensión Posteriormente es necesaria la carga del nuevo ciclo a la tabla de hechos, a continuación se detallan los procesos que se efectúan para esta carga: 87

118 Tabla(s) origen en BDSIA Extracción Archivo de Texto Carga de registros del nuevo ciclo en Data Staging Area Caga Registros de ciclo nuevo en Tabla Auxiliar de Hechos Tabla limpia Limpieza y transformación de datos Tabla para efectuar transformaciones Carga Tabla Auxiliar de Hechos Generación de claves para relación con dimensiones Tabla Auxiliar de Hechos con métricas y claves que la vinculan a cada dimensión. Carga en Tabla de Hechos Tabla de Hechos Final Figura 4.6. Diagrama de Flujo de Datos para la Carga Periódica de la Tabla de Hechos Finalmente, los paquetes para cada una de las cargas se describen a continuación: Carga inicial al Diagrama Estrella Alumno: Figura 4.7. Esquema de la Carga Inicial del Diagrama Estrella Alumno 88

119 Como puede observarse, como primer paso se realiza la extracción de los datos de la BDSIA, luego se hacen los procesos de transformación y limpieza para cargar cada una de las dimensiones que se relacionan con el diagrama estrella alumno, una vez dichas tareas han sido procesadas satisfactoriamente, se inician los subprocesos de transformación y limpieza para efectuar la carga de la tabla de hechos Alumno y finalmente se llena cada una de las dimensiones y la tabla de hechos en Base de Datos SIA_STAR, a partir de la cual es creada la Base de Datos Multidimensional. Para mayor detalle acerca de cada uno de los paquetes que intervienen en esta carga consultar Manual Técnico. Carga Periódica al Diagrama Estrella Alumno: Figura 4.8. Esquema de la Carga Periódica del Diagrama Estrella Alumno Carga inicial al Diagrama Estrella Materia: Figura 4.9. Esquema de la Carga Inicial del Diagrama Estrella Materia 89

120 Al igual que para el Diagrama Estrella Alumno, se realiza la extracción de los datos de la BDSIA, luego se hacen los procesos de transformación y limpieza para cargar cada una de las dimensiones que se relacionan con el diagrama estrella, una vez procesadas satisfactoriamente dichas tareas, se inician los subprocesos de transformación y limpieza para efectuar la carga de la tabla de hechos Materia y finalmente se llena cada una de las dimensiones y la tabla de hechos en Base de Datos SIA_STAR, a partir de la cual es creada la Base de Datos Multidimensional. Para mayor detalle acerca de cada uno de los paquetes que intervienen en esta carga consultar Manual Técnico. Carga Periódica al Diagrama Estrella Materia: Figura Esquema de la Carga Periódica del Diagrama Estrella Materia 4.3. BASE DE DATOS MULTIDIMENSIONAL Cuando ya se tienen los datos cargados en la Base de Datos SIA_STAR, el siguiente paso consiste en la creación de la Base de Datos Multidimensional, que para este caso fue llamada RA_OLAP. Dentro de la RA_OLAP, fueron creados dos cubos: Cubo Alumno y Cubo Materia. 90

121 Los cubos se crearon tomando como base los diagramas estrella resultantes de la etapa de modelado dimensional, este proceso se efectuó de la siguiente forma: A partir del Diagrama Estrella Alumno, se creó el Cubo Alumno. Figura Creación del Cubo Alumno Partiendo del Diagrama Estrella Materia, se elaboró el Cubo Materia. Figura Creación del Cubo Materia El procedimiento necesario para crear cada uno de estos cubos fue el siguiente: Como primer paso en la Base de Datos Multidimensional (RA_OLAP), se crean las dimensiones del Cubo, a partir de las tablas de dimensión del diagrama estrella. Posteriormente se elabora el cubo tomando como base la tabla de hechos existente en la Base de Datos SIA_STAR. 91

122 CREACIÓN DE DIMENSIONES Para la creación de cada una de las dimensiones que se relacionan con los cubos ALUMNO y MATERIA, se llevan a cabo los siguientes pasos: Se selecciona la tabla a la cual hace referencia la dimensión. A continuación son creados los niveles dentro de cada una de las dimensiones. Posteriormente se agregan los miembros pertenecientes a cada nivel. Luego se procesa la dimensión. Para concluir se verifica los niveles y datos dentro de la dimensión. El proceso anterior se ve reflejado en la siguiente figura: Figura Creación de una Dimensión CREACION DE CUBOS CUBO ALUMNO 92

123 A partir del diagrama estrella ALUMNO, se procedió a crear el cubo con el mismo nombre, tomando como base la tabla de hechos FACT_ALUMNO y como métricas: cantidad, cum_general, cum_carrera y cum_ciclo, campos de la misma tabla. Posteriormente se crearon métricas calculadas, para el caso se crearon el CUM general promedio, CUM carrera promedio y CUM ciclo promedio. Finalmente se procesó el cubo para crear todas las estructuras multidimensionales que soporten el diseño (Jerarquías y niveles) y verificar que no existiera ningún error. CUBO MATERIA Tomando como origen el diagrama estrella MATERIA, se creó el cubo con el mismo nombre, tomando como base la tabla de hechos FACT_MATERIA y como métricas: cantidad, nota. A continuación se crearon métricas calculadas, para el caso se crearon la Nota promedio. Finalmente se procesó el cubo para crear todas las estructuras multidimensionales que soporten el diseño (Jerarquías y niveles) y verificar que no existiera ningún error. En las figuras siguientes se observan las estructuras de los cubos resultantes: 93

124 Figura Estructura del Cubo Alumno Figura Estructura del Cubo Alumno 94

125 Figura Estructura del Cubo Materia Figura Estructura del Cubo Materia 95

126 4.4. DISEÑO DE LA APLICACIÓN DE USUARIO FINAL En esta fase se definieron los roles de acceso a la información contenida dentro del Data Warehouse, estos son: Decano: permisos de acceso a la información relacionada con la Facultad que dirigen. Coordinador de Carrera: permisos de acceso a la información relacionada con la Carrera que coordinan. Como ya fue mencionado en capítulos anteriores, se proporcionará a los usuarios un listado de reportes predefinidos, los cuales surgieron de las necesidades de información comunes entre ellos y, serán útiles para el proceso de toma de decisiones. Estos reportes han sido divididos en dos grupos: Reportes de Rendimiento Académico y Reportes de Población Académica. Al mismo tiempo, se permitirá a los usuarios, crear reportes personalizados a partir de la información del Data Warehouse, para esto se les proporcionará una plantilla de reportes similar a la que se observa en la figura Cada uno de los reportes tendrá las siguientes características: Título Logo de la UCA. Cuerpo del reporte: dimensiones y métricas tomadas en cuenta dentro del reporte (izquierda). Conjunto de dimensiones y métricas del cubo utilizado (derecha). A continuación se muestra el estándar de visualización de los reportes. 96

127 Figura Estándar de reportes preestablecidos Figura Plantilla de reportes 97

128 98

129 CAPÍTULO 5. CONCLUSIONES 1. El presente trabajo de graduación será útil como documentación de consulta para estudiantes que deseen introducirse a los conceptos básicos de Data Warehouse, así como para conocer los pasos a seguir en el desarrollo de un Sistema de este tipo. 2. Los usuarios encargados de la toma de decisiones en un área de negocio especifica, desconocen en un primer momento las ventajas y el conocimiento que puede proporcionarles un sistema de data warehousing. 3. Un Data Warehouse proporciona la capacidad de aprender de los datos del pasado y de predecir situaciones futuras en diversos escenarios. 4. El modelado de datos con el diagrama estrella y la utilización de tecnologías OLAP, facilita a los usuarios encargados del proceso de toma de decisiones, la consulta de información de manera más organizada y permite realizar cruces de esta información según las necesidades que los usuarios tengan. 5. Como una herramienta útil para la toma de decisiones, el Data Warehouse proporciona a los usuarios, elementos para poder descubrir si los procesos que se realizan actualmente en el área donde ellos trabajan son correctos y, corroborar con cifras exactas, ciertas inquietudes que se tienen actualmente acerca de dichos procesos. 6. Con el presente proyecto se muestran las ventajas estratégicas que proporciona la implementación de un Sistema de Data Warehousing, esto con el objetivo de incentivar a las autoridades de la universidad, a que fomenten y apoyen el desarrollo de nuevos proyectos de este tipo. 99

130 7. La implementación del Data Warehouse para el registro académico de la Universidad, será la base a partir de la cual se podrán diseñar nuevos Data Marts para otras áreas de la Universidad, conformando, de esta manera un Data Warehouse completo para la institución. 8. La implementación de un sistema de Data Warehousing, permitirá a la Universidad estar a la vanguardia en lo que a tecnologías de información se refiere, específicamente en el área de Inteligencia de Negocios (Business Intelligence). 100

131 CAPÍTULO 6. RECOMENDACIONES Dadas las ventajas que los sistemas de Data Warehousing brindan, así como también su magnitud, complejidad y crecimiento, se sugiere la creación del área de inteligencia de negocios dentro de la Universidad, que cuente con personal capacitado, para llevar a cabo la labor de desarrollo, soporte y administración de estos sistemas. Llevar a cabo la fase de implementación del proyecto, trabajando de la mano con la Dirección de Informática, para aclarar todos los puntos necesarios que permitan desarrollar esta fase de manera exitosa. Implementar nuevos Data Marts para otras áreas de la Universidad que cuentan con Sistemas de Información Técnico-Operacionales y que puedan proporcionar información útil, para ayudar al proceso de toma de decisiones de los altos mandos de la Universidad. Tomar en cuenta las materias de reciclaje dentro de los análisis, puesto que es importante estudiar el rendimiento y población de alumnos que cursan materias de este tipo. Incluir en el análisis por materias, los resultados de las evaluaciones realizadas a los catedráticos al final de cada ciclo, para poder determinar la interrelación entre el rendimiento académico y los resultados de las evaluaciones de profesores. Para futuros desarrollos se considera conveniente tomar en cuenta a los alumnos que cursan postgrado en la Universidad, puesto que es importante analizar su rendimiento y el crecimiento de la población en estas carreras. 101

132 La etapa de administración de un proyecto de data warehousing, es una de las bases para el éxito de este, por lo tanto se debe asegurar la existencia de una persona con los conocimientos necesarios para que coordine y administre el desarrollo del mismo Por diversos motivos este proyecto no llegó a su fase de implementación, por lo tanto se recomienda abordar el tema en un nuevo trabajo de graduación para poder llevar a cabo esta fase. A continuación se enumeran algunos puntos que deben tomarse en cuenta en esta nueva etapa: Elaborar el mantenimiento para la tabla de equivalencias Institucion_p, esta tabla deberá ser alimentada manualmente cada vez que surja una institución ya existente con nuevo código. Tomar en cuenta las equivalencias en el análisis por materias, puesto que es importante conocer qué materias se asignan como equivalencias a los alumnos que provienen de otras Universidades y no cometer errores al realizar dicha asignación. Desarrollar los DTS para Carga Periódica y Carga de Actualización del Diagrama Estrella Materia, de estas cargas solo se documentaron las etapas de análisis y diseño, se podrá tomar como ejemplo las cargas desarrolladas para el Diagrama Estrella Alumno. Incluir el cálculo de la edad y del porcentaje de avance de los alumnos en cada ciclo cursado. Implementar la verificación de usuarios y roles dentro de la aplicación del usuario final. Efectuar un análisis del crecimiento a través del tiempo, de los datos que se almacenarán dentro del Data Warehouse, para verificar cuanto influirá esto en el rendimiento de la aplicación. 102

133 Asignar al alumno el municipio del lugar de vivienda en lugar del departamento, para que el análisis por ubicación geográfica tenga cifras exactas. Guardar el histórico del CUM de los alumnos en una tabla temporal dentro de la Base de Datos BDSIA para cargar los datos directamente de esta tabla y no hacer el cálculo dentro del Data Staging Area. Esto servirá solamente para la Carga Inicial del Data Warehouse, pues a partir de la fecha de implementación se comenzará a guardar los nuevos datos históricos. Elaborar los mantenimientos necesarios para las tablas de parámetros que fueron creadas, pues estas deberán ser alimentadas de forma manual cuando surja un nuevo valor dentro de cada rule. Con el fin de mejorar el rendimiento de la aplicación, sería conveniente considerar realizar diferentes particiones de los cubos ya existentes, enfocadas a realizar análisis de temas específicos. 103

134 104

135 GLOSARIO Base de Datos: Conjunto de datos almacenados de forma tal que su acceso sea rápido y sencillo. En términos informáticos, se refiere a un programa que maneja una serie de datos relacionados entre si. Base de Datos Multidimensional: Base de Datos diseñada para procesamiento analítico on-line (OLAP). Estructurada como un hipercubo con un eje por dimensión. Base de Datos OLAP: ver Base de Datos Multidimensional. Business Process: ver Proceso de Negocio. Campo: Unidad básica de introducción de datos de un registro. Consulta: Consulta a una Base de Datos para obtener cierta información requerida. Requerimiento de la información almacenada en un Data Warehouse. En una Base de Datos Relacional, el query o consulta es una sentencia SELECT de SQL, pasada desde la aplicación de acceso a los datos (típicamente en la máquina cliente del usuario final). Coordinador de Carrera: Persona encargada de asistir al Decano de facultad, en los asuntos que este delegue, relacionados con la carrera que coordinan. Son quienes permanecen en contacto directo con los estudiantes, a fin de asesorarlos en los procesos de inscripción, adición y retiro de materias. Cubo: Almacenamiento lógico para una Base de Datos OLAP, combinan todas las dimensiones y todas las métricas dentro de un modelo conceptual, son manipulados por los usuarios para tener acceso a sus datos. Data Mart: Conjunto de hechos y datos organizados para soporte decisional basados en la 105

136 necesidad de un área o departamento específico. Los datos son orientados a satisfacer las necesidades particulares de un departamento dado, teniendo sentido solo para el personal de ese departamento y sus datos no tienen por qué tener las mismas fuentes que los de otro Data Mart. Data Mining o Minería de Datos: Solución de Business Intelligence que consiste en el conjunto de técnicas avanzadas para la extracción de información predecible escondida en grandes bases de datos, con el fin de conseguir los objetivos de negocio. Data Staging Area: Es un área de almacenamiento y a su vez, un conjunto de procesos que limpian, transforman, combinan, eliminan datos duplicados, archivan y preparan los datos de origen, para su uso en el Data Warehouse. Data Warehouse: Base de Datos orientada a soportar un proceso de toma de decisiones y cuya información proviene de múltiples fuentes. Dato: Unidad o cantidad mínima de información no elaborada, sin sentido en sí misma, pero que convenientemente tratada se puede utilizar en la realización de cálculos o toma de decisiones. Decano: Personas encargadas de dirigir y supervisar el funcionamiento académicoadministrativo del grupo de carreras que están bajo su responsabilidad. Aprueban el ingreso de los alumnos y alumnas a su facultad; otorgan equivalencias de acuerdo con los reglamentos; verifican el cumplimiento de los requisitos de graduación y la expedición de títulos; conceden permisos de adición y retiro de materias; resuelven, en primera instancia, los problemas de índole administrativo de los estudiantes, etc. Desnormalizar: Proceso mediante el cual se reduce el número de tablas de una Base de Datos y se agrega campos calculados que tienen mucho acceso, eso para mejorar las consultas a la Base de Datos. 106

137 Diagrama De Transformación de Datos (DTD): Esquema mediante el cual se aplican las primitivas de transformación a una Base de Datos fuente para obtener los diagramas estrella del Data Warehouse. Diagrama Estrella: Estructura en que se organizan los datos del Data Warehouse para facilitar el análisis y recuperación de estos. Dice: Filtrado de datos. Dimensión: Representan las categorías del negocio que proveen el contexto a las métricas numéricas. Son los equivalentes lógicos de las dimensiones del diagrama estrella, con la excepción que los miembros de una dimensión están organizadas dentro de una estructura jerárquica. Dimensional Model: ver Modelo Dimensional. Dirección De Informática: Unidad de la UCA cuya misión es Proveer al sector académico de infraestructura y soporte de calidad en tecnología de información para la realización de su labor. Drill-Across: Relacionar dos cubos. Drill-Down: Obtención de información más detallada sobre un conjunto de información en el cual se está trabajando. Drill-Through: Acceso a datos descriptivos. Drill-Up: Obtención de información general de un conjunto de información sobre el cual se está trabajando. 107

138 Empresa Consultora: Empresa dedicada al desarrollo de software a la medida para las empresas que contratan sus servicios. Empresa Desarrolladora de Data Warehouse: Empresa dedicada específicamente al desarrollo de Data Warehouse para las empresas que contratan sus servicios. Esquema Snowflake: Variación del diagrama estrella, en el cual las jerarquías existentes en una tabla de dimensiones son almacenadas en múltiples tablas de dimensiones. ETL: Extracción, transformación y carga de datos de una Base de Datos fuente al Data Warehouse. Expediente: Información del desempeño estudiantil de un alumno durante su historia en la Universidad. Fact Table: ver Tabla de Hechos. Facultad: Unidades académicas dentro la UCA, encargadas de administrar y evaluar las carreras que les han sido asignadas; regular el avance de los alumnos en sus estudios y proponer a la vicerrectoría académica la creación de nuevas carreras. Granularidad: Es la definición de lo que esta tabla representa. Granularidad de la Tabla de Hechos: La granularidad es definida típicamente, como el mínimo nivel de detalle almacenado en las dimensiones asociadas con la tabla de hechos. MDDB: (Multidimensional Database) ver Base de Datos Multidimensional. Metadato: Consiste en información sobre los datos del DW. Que incluye Semántica de los datos y su ubicación en el DW, información sobre frecuencias de carga, reglas de transformación, etc. 108

139 Métrica: son columnas numéricas y cuantificables de la tabla de hechos. Las métricas típicamente representan los valores que son analizados. Microsoft Analysis Services: es un servidor para el proceso analítico online (OLAP) y el data mining. Ofrece capacidades para el diseño, creación y gestión de modelos de cubos analíticos y de data mining a partir de la información en un Data Warehouse. Modelado Dimensional: Técnica a través de la cual se efectúa el Modelo Dimensional. Modelo Dimensional: Contiene la misma información que un Modelo E/R, sin embargo, los datos son empaquetados en un formato simétrico, en el cual las metas principales son entendimiento por parte de los usuarios y rendimiento de consultas. Modelo Entidad Relación (E/R): El modelo entidad-relación es el modelo conceptual más utilizado para el diseño conceptual de bases de datos. Está formado por un conjunto de conceptos que permiten describir la realidad mediante un conjunto de representaciones gráficas y lingüísticas. MOLAP: (Multidimensional On-line Analitical Process) ver OLAP Multidimensional. Normalizar: es realizar un tratamiento sobre su estructura de manera que ésta se ajuste de forma idónea al esquema de bases de datos relacionales. OLAP (On-Line Analitical Process): Ver Procesamiento Analítico en Línea. OLAP Multidimensional: Base de Datos que almacena y manipula los datos en estructuras especiales llamadas matrices multidimensionales. OLAP Relacional: Un conjunto de interfaces de usuarios y aplicaciones que dan a una Base de Datos relacional un sabor dimensional. 109

140 Presentation Server: Ver Servidor Analítico. Procesamiento Analítico en Línea (OLAP): Es la actividad general de consultar y presentar datos textuales y numéricos desde los Data Warehouse. Proceso de Negocio: Un grupo coherente de actividades del negocio. Programa de Carga y Transformación de Datos: Proceso mediante el cual se extraen los datos de diferentes fuentes, que luego de una estandarización y revisión de la calidad de los mismos son llevados al Data Warehouse. Query: ver Consulta. Registro: Una fila en una tabla relacional. Registro Académico: Unidad encargada de registrar la información oficial de los estudiantes de la Universidad. Relación: Es una correspondencia o asociación entre dos o más tablas. Cada relación tiene un nombre que describe su función. Reporte: Informe que se emite o presenta con base en la realización de una actividad o tarea. Reporte Estadístico/Analítico: Reporte que permite realizar análisis a partir de las estadísticas presentadas en él. ROLAP: OLAP Relacional. Base de Datos Relacional que, almacena los datos en un Sistema de Gestión de Bases de Datos relacional extendido, y transforma operaciones sobre datos multidimensionales en operaciones relacionales en SQL. 110

141 Roll-Up: Presentar niveles más altos de sumarización. Servidor: Ordenador que suministra servicios a otros ordenadores. Servidor Analítico: Servidor en la cual los datos del Data Warehouse son organizados y almacenados para: optimización de consultas, generación de reportes y análisis OLAP. SIA: ver Sistema de Información Académica. Sistema Administrador de Bases de Datos (DBMS): Una aplicación cuyo único propósito es almacenar, recuperar y modificar datos de una manera altamente estructurada. Los datos en un DBMS usualmente son compartidos por una variedad de aplicaciones. Sistema Administrador de Bases de Datos Relacionales (RDBMS): Sistema Administrador de Bases de Datos basado en el modelo relacional que soporta la gama completa del estándar SQL. Utiliza una serie de tablas relacionadas con filas y columnas para organizar y almacenar datos. Sistema de Data Warehousing: Sistema informático capaz de ofrecer información para la toma de decisiones, y cuya pieza principal es un Data Warehouse. Sistema de Información: Conjunto de elementos que interactúan entre sí, con el fin de apoyar las actividades de una empresa o negocio. Lleva a cabo cuatro tareas: entrada, almacenamiento y procesamiento de datos, y entrega o salida de información. Sistema de Información Académica: Sistema utilizado por la Universidad Centroamericana José Simeón Cañas, para almacenar los expedientes electrónicos de sus estudiantes. 111

142 Sistema de Soporte a la Toma de Decisiones (DSS): Conjunto de programas y herramientas que permiten obtener de manera oportuna la información que se requiere, mediante el proceso de la toma de decisiones que se desarrolla en una organización. Sistema OLTP (Online Transaction Processing): Sistema transaccional diario (o en detalle) que mantiene los datos operacionales del negocio. Sistema Origen: Un sistema operacional, cuya función es capturar las transacciones u otras métricas de procesos de negocio. Alternativamente, el o los sistemas origen, pueden ser externos a la organización, pero siguen capturando información que se necesita en el Data Warehouse. Slice: Habilidad para acceder a un Data Warehouse a través de algunas de sus dimensiones. Es el proceso de separar los datos en diferentes combinaciones. Source System: ver Sistema Origen. SQL Server: Sistema Administrador de Bases de Datos Relacionales. Ofrece un motor de Base de Datos moderno, muy confiable para el almacenamiento de datos. Star Schema: ver Diagrama Estrella. Sumarización: Actividad de incremento de la granularidad de la información en una Base de Datos. La sumarización reduce el nivel de detalle, y es muy útil para presentar los datos para apoyar al proceso de Toma de Decisiones. Tabla: Colección de filas (registros) que tienen asociadas columnas (campos). Tabla de Dimensión: Una tabla en un modelo dimensional con una sola llave primaria y columnas de atributos descriptivos. 112

143 Tabla de Hechos: En un diagrama estrella (modelo dimensional), es la tabla central con métricas de rendimiento numéricas que son caracterizadas por una llave compuesta, cuyos elementos son cada uno, una llave foránea sacada de una tabla de dimensión. Tabla Origen: Tabla de la cual provienen datos que utiliza un Data Warehouse. Tiempo de Vida Útil: Duración estimada que un objeto puede tener cumpliendo correctamente con la función para la cual ha sido creado. Transacción: Unidad indivisible de trabajo, sistema de procesamiento de transacciones, o lleva a cabo una transacción entera o no lleva a cabo alguna parte de la transacción. Transact SQL: Versión aumentada del lenguaje SQL para bases de datos relacionales. Utilizado por Microsoft SQL Server. Transformación de Datos: Proceso de modificar los datos extraídos de los sistemas origen en formatos coherentes con el esquema de almacenamiento de datos. Tupla: ver Registro. Uptime: ver Tiempo de Vida Útil. Usuario de Negocio: Usuarios de un sistema, cuya función es la creación de consultas e informes así como el análisis de la información de su Empresa u Organización. Usuario Final: Persona que manipulará de manera directa un sistema o aplicación. Vicerrectoría Académica: Unidad de la UCA que dirige y supervisa el trabajo de las unidades académicas y administrativas que se encuentran bajo su responsabilidad. 113

144 114

145 REFERENCIAS Instituto Nacional de Estadística e Informática, junio Microsoft Corporation, abril Oracle Corporation, abril Oracle Corporation, oraclestore.oracle.com/oa_html/ibecctpsctdsprte.jsp?section=11468, abril Oracle Corporation, elligence.pdf, abril Sybase Colombia, abril Sybase, abril

146 116

147 BIBLIOGRAFIA Aguilar, R. et al. [1997] Diseño de un sistema de información gerencial como base para la toma de decisiones en la UCA. Trabajo de graduación presentado para optar al grado de Licenciado en Ciencias de la Computación en la Universidad Centroamericana José Simeón Cañas, San Salvador, El Salvador. Castro Sepúlveda, J. y L. Urrutia Suárez [2004] Diseño e Implementación de un Data Warehouse para la gestión de ventas de la empresa vitivinícola Miguel Torres Chile. Seminario de Título para optar al título de Ingeniero de Ejecución en Computación e Informática en la Universidad Católica del Maule, Talca, Chile. Durán, A et al. [2004] Diseño y Desarrollo de un Sistema para el Apoyo del Análisis de Datos Operativos del Negocio Orientado a Empresas Aseguradoras Basado en Tecnología OLAP. Tesis de graduación presentada para optar al grado de Ingeniero en Ciencias de la Computación de la Universidad Don Bosco, San Salvador, El Salvador. González, A. et al. [2000] Módulo de información académica para la toma de decisiones de coordinadores de carrera y decanos. Trabajo de graduación presentado para optar al grado de Licenciado en Ciencias de la Computación en la Universidad Centroamericana José Simeón Cañas, San Salvador, El Salvador. Gutiérrez, F. et al. [2004] Herramienta para el Análisis de Variables Aplicadas al Marketing, Utilizando Servidores OLAP y Mineria de Datos. Tesis de graduación presentada para optar al grado de Ingeniero en Ciencias de la Computación de la Universidad Don Bosco, San Salvador, El Salvador. Huezo, et al. [2004] Diseño del Sistema de Gestión Informática para la Gerencia de Tecnología de Información. Caso Práctico: Empresa Comercial. Tesis de graduación presentada para optar al grado de Ingeniero en Ciencias de la Computación de la Universidad Don Bosco, San Salvador, El Salvador. 117

148 Kimball, R. et al. [1998] The Data Warehouse Lifecycle Toolkit: Expert methods for designing, developing and deploying Data Warehouses. John Wiley & Sons, Inc., New York, Estados Unidos de América. Kimball, R. et al. [2002] The Data Warehouse Toolkit: The complete guide to dimensional modeling. John Wiley & Sons, Inc., New York, Estados Unidos de América. Marotta, A. [2000a] Data Warehouse Design and Maintenance through Schema Transformations. Master Thesis de la Universidad de la República, Uruguay. Marotta, A. [2000b] Resolución de la Integración en el Diseño del Data Warehouse. Documento elaborado para el Instituto de Computación de la Universidad de la República, Uruguay. Microsoft Corporation, [2001a] Designing and Implementing OLAP Solutions with Microsoft SQL Server Curso número 2074A. Cargraphics S.A., Colombia. Microsoft Corporation, [2001b] Populating a Data Warehouse with Microsoft SQL Server 2000 Data Transformation Service. Curso número 2092a. Cargraphics S.A., Colombia. Peralta, V. [2003] Sistemas de Data Warehousing. Diseño Conceptual. Documento elaborado para el Instituto de Computación de la Universidad de la República, Uruguay. Peralta, V. [2001] Diseño Lógico de Datawarehouses a partir de Esquemas Conceptuales Multidimensionales. Tesis de Maestría, Uruguay. 118

149 ANEXO A

150

151 ANÁLISIS PROPUESTOS PARA LOS REPORTES PREESTABLECIDOS DEL SISTEMA ANÁLISIS FINANCIEROS - Análisis histórico de cuotas: Qué rango de cuotas se manejan por facultad y por carrera, cuáles cuotas prevalecen más. - Análisis de créditos estudiantiles: Se permitirá conocer el porcentaje de alumnos a los que se les otorgó crédito educativo, ya sea por carrera, facultad, etc.; así como también los rangos de créditos otorgados. - Procedencia de nuevos ingresos: Analizar la relación que existe entre la asignación de cuotas y las instituciones de procedencia de los alumnos. - Análisis de solvencias de alumnos: Con este análisis, se podrá determinar el porcentaje de alumnos solventes dentro de la universidad, por períodos de tiempo, carreras, Facultades, etc. Que permita a los entes interesados ver los puntos críticos y las causas de los mismos. - Análisis geográfico estudiantil: Es importante conocer la dirección de vivienda de los alumnos (departamento, municipio, colonia, otros) para analizar los lugares de procedencia de estos, ya sea por carrera, por facultad o por año. Este análisis permitirá observar la relación existente entre las cuotas asignadas y los departamentos o ciudades. Para poder realizar este análisis es necesario contar con la información resultante del estudio socioeconómico que se le realiza a cada estudiante al momento de su ingreso a la Universidad. ANÁLISIS DE RENDIMIENTO ACADÉMICO - Análisis por Alumno a través del tiempo, variación del CUM por año: Este análisis nos mostrará cómo varía el CUM de un alumno a través del tiempo, con cuál CUM comienza la carrera y con cuál la termina, cómo afectan en el CUM las materias que lleva en ciertos ciclos. A-1

152 - Deserción estudiantil: Analizar qué materias son las que afectan más el rendimiento de los alumnos, por qué razón deciden retirarse de la Universidad y en cuáles carreras se repite más este fenómeno. - Análisis por Edad, Sexo, estado civil: Este análisis servirá para comparar el rendimiento académico de los estudiantes por edades, sexo o estatus. - Análisis por tipo de ingreso (Nuevo ingreso, ingreso por equivalencias, reingreso): Permitirá comparar el desempeño académico de los alumnos con el tipo de ingreso que ellos tienen. - Análisis por Pensum, Cambios de carrera: Se analizará el rendimiento de los alumnos dependiendo del pensum en el que se encuentran, lo cual permitirá al mismo tiempo mostrar un análisis de los cambios de carrera más comunes, así como también se medirá el rendimiento de los alumnos en base al CUM de estos. - Alumnos aprobados, reprobados, análisis de rendimiento Como su nombre lo indica, mostrará la curva de rendimiento, que se podrá agrupar bajo diferentes criterios, ya sea por materia, carrera, alumnos, etc. Que permitirá observar los principales problemas de los alumnos en el avance de su carrera, o analizar el rendimiento de una materia específica a través del tiempo, etc. - Análisis de créditos estudiantiles: Podrá compararse el porcentaje alumnos a los que se les otorgó crédito educativo con el rendimiento académico (basado en el CUM) de estos. - Procedencia de nuevos ingresos: Este análisis será útil para determinar la relación existente entre el desempeño académico de los alumnos y las instituciones de procedencia de estos. Para ello es importante saber si la institución donde cursaron su bachillerato es pública o privada, si es de religión católica, evangélica o es laica. - Análisis geográfico estudiantil: Es importante conocer la dirección de vivienda de los alumnos (departamento, municipio, colonia, otros) para analizar los lugares de procedencia de estos, ya sea por A-2

153 carrera, por facultad o por año. Este análisis permitirá observar la relación que tiene esta información con el rendimiento académico de los estudiantes. Para poder realizar este análisis es necesario contar con la información resultante del estudio socioeconómico que se le realiza a cada estudiante al momento de su ingreso a la Universidad. - Análisis por Facultades: Evolución de Cum s Por otra parte, permitirá mostrar el avance del CUM, de las diferentes, carreras o Facultades. - Análisis por Materia en los diferentes ciclos: Cantidad de alumnos aprobados y reprobados en una materia específica a través de los diferentes ciclos. ANÁLISIS DE POBLACIÓN ACADÉMICA - Análisis por Facultades: Cantidad de alumnos por carrera: Este análisis, permitirá observar la evolución a través del tiempo de las diferentes carreras y Facultades dentro de la universidad, en relación a la cantidad de alumnos de cada una, mostrando cuáles presentan alzas o bajas en su demanda. - Cantidad de alumnos por carrera x ciclo x materia: Cómo varía la cantidad de alumnos en una determinada materia a través de los diferentes ciclos. - Análisis por Materia en los diferentes ciclos: Cantidad de inscritos, máximos, mínimos. Con esto, se permitirá analizar con un buen nivel de detalle el desempeño de las diferentes materias en un ciclo o hacer una comparativa a través del tiempo, mostrando estadísticas de estudiantes inscritos, porcentaje de personas que retiran la materia, aprobados, reprobados, promedio del curso, nota mínima o máxima, etc. - Análisis por Edad, Sexo, Status Este análisis servirá para saber cuántos hombres y cuántas mujeres están inscritas por facultad o por carrera; en qué carrera o en qué facultad predomina más un sexo. Qué rangos de edades se manejan dentro de las Facultades. - Análisis de ingresos por equivalencias A-3

154 Qué cantidad de alumnos ingresan por equivalencias en cada facultad, carrera, ciclo. Este análisis permitirá observar una estadística de la cantidad de materias que son aceptadas a un alumno proveniente de una determinada carrera e institución. Esto servirá como base para orientar a los estudiantes que deseen tramitar un ingreso por equivalencias, de manera que puedan tener una noción de qué cantidad de materias se le podrían aceptar. - Análisis de reingresos Cuántos alumnos reingresan a una carrera o una facultad en un ciclo determinado. - Iniciales de los alumnos para inscripción de materias, distribución equitativa Con este análisis se pretende mostrar una estadística por apellidos de la cantidad de alumnos correspondientes a una letra, apellido, rango de apellidos etc., que permita al Registro Académico en un futuro hacer una distribución más equitativa en el momento de realizar el retiro de documentos y principalmente la inscripción de materias. - Procedencia de nuevos ingresos: De qué instituciones provienen los alumnos de nuevo ingreso, en qué facultad o carrera se concentran más alumnos provenientes de instituciones privadas o públicas y cómo se distribuye la población estudiantil de la UCA en relación con las instituciones de procedencia (porcentaje de alumnos por institución). - Análisis geográfico estudiantil: Es importante conocer la dirección de vivienda de los alumnos (departamento, municipio, colonia, otros) para analizar los lugares de procedencia de estos, ya sea por carrera, por facultad o por año. Este análisis permitirá observar cómo se distribuye la población estudiantil de la UCA en relación con el lugar de vivienda (porcentaje de alumnos por departamentos o ciudades). Para poder realizar este análisis es necesario contar con la información resultante del estudio socioeconómico que se le realiza a cada estudiante al momento de su ingreso a la Universidad. ANÁLISIS DE CATEDRÁTICOS - Análisis de Catedrático x Materia, promedios A-4

155 Una buena carrera la hacen los catedráticos que imparten cada una de sus materias, por tanto el aseguramiento de la calidad de los mismos es una pieza clave; con este análisis se podrá observar la cantidad de alumnos aprobados en una materia, la evolución de la materia a través del tiempo (la demanda de la materia, observar si el número de aprobados y reprobados disminuye o aumenta), el desempeño de un determinado catedrático en una materia o área específica, para lo cual podría hacerse uso de los resultados de las evaluaciones que realizan los estudiantes al catedrático de la materia cada ciclo. ANÁLISIS DE TUTORÍAS - Análisis de asesorías vrs. inscripciones reales (solicitar información al sistema de asesoría) Este análisis indicará cuántos alumnos siguieron las indicaciones de su asesor, inscribiendo las materias que le asesoró, cuántos profesores asesoran más de las materias que recomienda el sistema de asesoría (de acuerdo al pensum y prerrequisitos cumplidos). ANÁLISIS DE HORAS SOCIALES - Análisis de cantidad de horas sociales por alumno Por medio de este análisis se podrá visualizar en qué momento los alumnos inician o finalizan sus horas sociales y ver el avance de las mismas a lo largo del tiempo, de las diferentes carreras y Facultades, permitiendo un comparativo entra cada una de ellas (carreras y/o Facultades). ANÁLISIS DE MAESTRÍAS - Cuantos de los alumnos con pre-grado se inscriben en un post-grado Con frecuencia un alumno UCA, decide estudiar un post-grado o maestría dentro de la misma institución, con este análisis se observará qué tan frecuente se realiza esto, cuáles maestrías son las más solicitadas por un graduado UCA, etc. A-5

156

157

158 ANEXO B

159

160

161 Data Warehouse de Registro Académico de la Facultad de Ingeniería y Arquitectura de la Universidad Centroamericana José Simeón Cañas Guía para elaboración de Entrevistas Presentación del grupo Breve explicación de la finalidad del proyecto: Se pretende desarrollar un sistema que reúna toda la información académica de la Universidad, y a partir de esta, presentar reportes estadísticos que permitan hacer comparativos basados en datos históricos, para poder visualizar las tendencias o características comunes de los datos entre los diferentes periodos. Además el sistema brindará a los usuarios, la facilidad de crear sus propios reportes, permitiendo que estos escojan los factores que desean analizar. Con todo lo anterior se pretende ayudar a los usuarios en la toma de decisiones. Finalidad de la entrevista: Identificar la información académica que requieren y analizan cada una de las unidades a entrevistar, así como la información que intercambian con otras unidades de la Universidad, todo esto con el fin tener una mejor visualización de los reportes que se podrían realizar dentro del sistema. [Presentación de análisis propuestos por el grupo dependiendo de la unidad a entrevistar. Ver Anexo B] Cuestionario: 1. Cuál es el objetivo principal de esta unidad? 2. Qué relación existe entre esta unidad y Registro Académico de la UCA? 3. Qué relación existe entre esta unidad y Dirección de Informática, con relación a los sistemas que ella posee? 4. Qué reportes estadísticos recibe por parte de la Dirección de Informática? 5. Qué reportes estadísticos ha solicitado a la unidad de Registro Académico? 6. Qué reportes estadísticos no se le han proporcionado? B-1

162 7. Por qué razón? Qué argumentos se le han dado? 8. Qué reportes estadísticos le gustaría recibir para mejorar el rendimiento de esta unidad? (y que por diferentes razones no ha solicitado) 9. Qué reportes estadísticos elabora a partir de la información que posee y la que solicita a otras unidades? 10. Qué reportes necesitan gran cantidad de tiempo para poder ser generados? 11. Con cuáles unidades intercambia información? 12. Qué tipo de reportes solicita a otras unidades? 13. Qué tipos de reportes proporciona a otras unidades? B-2

163 ANEXO C

164

165 RESULTADOS OBTENIDOS EN LAS ENTREVISTAS REALIZADAS A LOS USUARIOS A continuación se presenta un resumen de los resultados obtenidos en las entrevistas realizadas a Decanos y Coordinadores de Carrera dentro de la Universidad. DECANOS El Decanato recibe gran cantidad de reportes por parte de la Dirección de Informática, incluso, según manifestaron, algunos reportes podrían estar disponibles pero ellos desconocen su existencia. Entre los reportes más importantes con los que se cuenta se pueden mencionar: Reporte de Alumnos inscritos por materia (Listas definitivas de Inscripción). Posibles alumnos a egresar de acuerdo al grado de avance. Listado de Materias asesoradas a los alumnos. Población estudiantil por grado de avance y sexo. Listado de Alumnos notas definitivas por materia Listados de CUM Reprobaciones en 3a matricula, en 2a, Alumnos que están cursando una materia en 1a. matrícula. Alumnos de Nuevo Ingreso. Por otra parte, comentaron que su unidad a partir de la información proporcionada por dirección de Informática y la que ellos poseen elaboran ciertos informes. El Decanato de Ciencias Económicas y Empresariales elabora los siguientes reportes: Reportes para proyectar las materias del próximo semestres (cupos, demanda posible) Perfil y cantidad de Alumnos de nuevo ingreso Niveles de aprobación y reprobación. Tendencia de las diferentes materias a través del tiempo (desde 1998, inscritos, aprobados, reprobados, media, moda, promedio ponderado, varianza, profesor). C-1

166 Demanda de alumnos dividida por sexo, nivel de cum, grado de avance. Distribución de la población académica. Distribución de horario de materias de acuerdo al ciclo en el que se encuentra. Consolidado de alumnos inscritos por carrera Reporte de diferidos por carrera en un ciclo Asignación de aulas. Por su parte el Decanato de Ingeniería y Arquitectura trabaja en los siguientes: Tendencias de reprobaciones, con relación al profesor, análisis de las causas de reprobación en un ciclo determinado. Promedio de tiempo de estudio de los alumnos. Proceso de graduación, cuántos alumnos entran en proceso de graduación, cuantos se gradúan. En contraste de acuerdo a lo manifestado por el Decanato de Ciencias Sociales y Humanidades, los reportes proporcionados por Dirección de Informática son suficientes y por tanto ellos no se ven en la necesidad de elaborar reportes propios. Con el fin de mejorar y optimizar el trabajo de los decanos, ellos consideran importante contar con los siguientes reportes: Distribución de la población académica por colegios de procedencia, lugar de procedencia. Cantidad de egresados y graduados por ciclo Listado de los mejores alumnos de la facultad. Cuántas secciones se deben abrir de una materia, en relación a las tendencias tomando en cuenta prerrequisitos cumplidos, alumnos reprobados, etc. Seguimiento de Graduados. Conocer la deserción estudiantil a partir del grado de avance (identificar materias que se cursaron en 2ª o n matrícula), clasificados por institución de procedencia. Reporte de todos los alumnos que han tramitado cambio de carrera, acompañado del nivel procedencia, nota curso preuniversitario, porcentaje de avance, CUM. C-2

167 Reporte de materias que puede cursar un alumno en el próximo ciclo, tratando de evitar datos inflados, tomando en cuenta el CUM del alumno. Todos los alumnos que tienen una materia inscrita en más de tercera matrícula, por materia. Reporte de alumnos por rendimiento (CUM). Alumnos de reingreso. Organizar tesis por tema, cantidad y año en los que se han realizado. Seguimiento de cuántos alumnos ingresaron y de ellos cuántos se graduaron (por institución de procedencia), esto permitirá analizar que pasó con las otras personas en el camino, por qué decidieron retirarse de la Universidad. COORDINADORES DE CARRERA Reportes que reciben por parte de Dirección de Informática: Alumnos activos clasificados por porcentaje de avance, sexo y CUM. Listado de alumnos inscritos en la carrera. Listado de alumnos inscritos por cada materia. Listado de alumnos aprobados, reprobados en cada materia. En cuanto a los reportes que desearían recibir se mencionan los siguientes: Histórico de la cantidad de alumnos inscritos por cada ciclo. Reporte de la cantidad de alumnos admitidos en cada ciclo, clasificados por tipo de ingreso Histórico de Catedráticos (incluyendo información general y de contacto) que han impartido las diferentes materias del plan de estudios. Listado de las materias comúnmente otorgadas por equivalencia externa, clasificados por la Universidad de Procedencia. Consolidado histórico de alumnos aprobados y reprobados para cada una de las materias y secciones en un ciclo determinado. Listado de alumnos posibles a Egresar en un determinado ciclo. Estadísticas por año de ingreso de los egresados. C-3

168 Promedio de las edades de los estudiantes. CUM promedio por año. Materias con mayor índice de aprobación. Distribución de los alumnos en cada materia, clasificados por carrera y por matrícula. Rendimiento de catedráticos por materia. Cantidad potencial de estudiantes para el siguiente ciclo, por materia; esto se hace actualmente en función del porcentaje de aprobados en los segundos parciales, o a partir de los resultados de tutoría académica. Listado de los mejores alumnos de la carrera. C-4

169 ANEXO D

170

171 UNIVERSIDAD CENTROAMERICANA JOSÉ SIMEÓN CAÑAS MANUAL DE USUARIO DATAWAREHOUSE DEL REGISTRO ACADÉMICO DE LA UNIVERSIDAD CENTROAMERICANA JOSÉ SIMEÓN CAÑAS POR MELVIN GILBERTO CAMPOS MEJÍA CECILIA ELIZABETH GUEVARA AYALA ANA LISSETTE ROSALES INESTROZA OCTUBRE 2006 SAN SALVADOR, EL SALVADOR, C.A.

172

173 INDICE Pág. 1. INTRODUCCIÓN... D-1 2. CONCEPTOS IMPORTANTES... D-2 3. ACCESO A LA APLICACIÓN... D-3 4. ELABORACIÓN DE REPORTES PERSONALIZADOS... D-4 5. ELABORACIÓN DE GRÁFICAS... D MÓDULO DE DECANOS... D MÓDULO DE COORDINADORES DE CARRERA... D-20

174

175 1. INTRODUCCIÓN El Data Warehouse para el Registro Académico, es un sistema de soporte para la toma de decisiones gerenciales, dedicado a proveer datos e información que puede ser utilizada para realizar análisis acerca de la situación académica de la Universidad Centroamericana José Simeón Cañas. El presente documento, está dirigido a los usuarios involucrados en el proceso de toma decisiones en el área académica, y que desean analizar la situación de esta. Se presenta en un primer momento, un apartado dedicado a explicar los conceptos importantes acerca de data warehouse que los usuarios deben conocer, para que puedan realizar un análisis más efectivo de los datos. Posteriormente se muestra la guía para acceder a la aplicación y a cada uno de los reportes preelaborados que esta posee. A continuación se presenta un apartado dedicado a la creación de reportes personalizados, en el cual los usuarios tendrán la oportunidad de realizar sus propios reportes y los gráficos relacionados con estos. D-1

176 2. CONCEPTOS IMPORTANTES Un Data Warehouse, es una colección de datos en la cual se encuentra integrada la información de la compañía y que se usa como soporte para el proceso de toma de decisiones gerenciales. Esta herramienta brinda al usuario mayor independencia en sus tareas, pues les permite elaborar sus propios reportes, de acuerdo a la situación que deseen analizar. Antes de presentar la manera en que puede preparar sus propios informes es necesario familiarizarse con ciertos conceptos: Cubo: Un cubo, es la estructura donde se encuentra almacenada la información concerniente a un proceso de negocio. Virtualmente contiene miles de reportes almacenados. Ofrece a los usuarios finales, diferentes alternativas y perspectivas de ver los datos. Por ejemplo, un cubo que contiene datos de alumnos, puede producir reportes tan diversos como: alumnos por tipo ingreso, alumnos por institución de procedencia, etc. Dimensión: Las dimensiones se centran en las necesidades de análisis, éstas permiten presentarles información útil, descriptiva y fácil de encontrar. Una tabla de dimensión representa una entidad del negocio que proporciona el contexto para los datos numéricos que serán analizados. Ejemplos de Dimensiones Tipo Ingreso, Instituciones, Carrera, etc. Métrica: Las métricas típicamente representan los valores numéricos que son analizados, por ejemplo, si se desea analizar el rendimiento de los alumnos, las métricas serían: notas y CUM. Miembros: Los miembros representan los valores de las tablas de dimensión, por ejemplo en la dimensión Tipo Ingreso, los miembros serían: Nuevo Ingreso, Ingreso Continuo. D-2

177 Niveles: Grupo de miembros en una dimensión que comparten una característica en común. Por ejemplo para la Dimensión Municipio, los municipios pueden agruparse en un nivel conocido como departamento, de esta forma se pueden ver datos ya sea por municipio o por Departamento. 3. ACCESO A LA APLICACIÓN Con el objetivo de facilitar el acceso a los reportes predefinidos, se creó un menú denominado Registro Académico, que está agregado en la barra de menús de Microsoft Excel. En este menú podrá observar los títulos de los reportes predefinidos del Data Warehouse y un apartado con los datos de los autores. Para ver cualquiera de estos reportes, haga clic en el nombre del mismo y a continuación se mostrará en la hoja actual. Figura D.3.1. Menú Registro Académico D-3

178 Para atender las necesidades de información, los reportes se han clasificado dentro de dos módulos diferentes: un módulo para los reportes de interés de un Decano y otro que muestra los reportes con la información que requiere un Coordinador. A continuación se describe cada uno de ellos. 4. ELABORACIÓN DE REPORTES PERSONALIZADOS En cada uno de los módulos se presenta la opción para crear sus reportes personalizados. Con esta opción, podrá realizar de una manera sencilla los informes con la información que necesita analizar. La aplicación cuenta con dos cubos: el cubo ALUMNO, que contiene la información relacionada con los alumnos: su CUM, los ciclos cursados, el ciclo de ingreso, su departamento y municipio de procedencia, etc. El segundo cubo es el de MATERIA, con el que podrá analizar las diferentes materias que se imparten en cada facultad y carrera de la Universidad. Para iniciar con la realización de su reporte diríjase al menú de la aplicación: Registro Académico. Si desea realizar un reporte a partir del cubo Alumno, elija la opción Plantilla Reporte Alumno, si lo desea hacer a partir del cubo Materia, elija la opción Plantilla Reporte Materia. A continuación se mostrará una pantalla como la siguiente: D-4

179 Figura D.4.1. Área de trabajo para la elaboración de reportes En la parte derecha, se presenta el listado de las dimensiones del cubo con el que se trabajará, así como también las métricas o medidas que puede utilizar para los análisis. Al mismo tiempo, se presentará en la Hoja, el área de trabajo en la que podrá colocar las dimensiones y las métricas según sus necesidades. Nota: Para colocar una dimensión o una métrica en cualquiera de las áreas de trabajo, haga clic izquierdo sobre ésta y arrástrela hasta colocarla en el lugar que desea. A continuación se explicará con detalle cada una de las partes que componen el área de trabajo. Área de Campos de Página: En esta área, se podrán colocar las dimensiones por las que se desea agrupar los datos que se encuentren en el resto de las áreas. D-5

180 En la pantalla siguiente, se observa que desean verse los datos, clasificados por la dimensión de ciclo de último ingreso. Figura D.4.2. Área de campos de página Si lo desea, puede filtrar los datos de la dimensión, haciendo clic izquierdo sobre la flecha que aparece junto al nombre de ésta. Se mostrará a continuación, el listado de todos los miembros agrupados por niveles, de la dimensión, y usted podrá escoger cuáles desea mostrar. D-6

181 Figura D.4.3. Filtrado de los campos de página Campos de Fila Al colocar una dimensión en el área de Campos de Fila, los miembros de ésta, se mostrarán en cada una de las filas de la tabla. Así: D-7

182 Figura D.4.4. Área de campos de fila Si desea filtrar los datos de estas dimensiones, también lo puede hacer, haciendo clic izquierdo sobre la flecha que está junto al nombre de estas. D-8

183 Figura D.4.5. Filtrado de los campos de fila Si una dimensión posee más de un nivel, puede ver el resto de ellos, haciendo doble clic sobre un campo de cualquier nivel. En la siguiente figura puede observar, que la dimensión Alumno, posee tres niveles (los cuales se muestran en el recuadro que aparece al lado derecho de la Hoja). D-9

184 Figura D.4.6. Niveles de una dimensión colocada dentro del área de campos de fila Área de Datos El área de datos, está reservada únicamente para colocar las métricas o medidas que se desean analizar. Para colocar una métrica en el área de trabajo, solo debe arrastrarla con el botón izquierdo del Mouse. D-10

185 Figura D.4.7. Área de datos Campos de Columna En el área de campos de columna, se colocan las dimensiones, cuyos miembros se deseen ver en cada una de las columnas de la tabla. En la siguiente figura, se puede observar que se ha colocado la dimensión de ciclo último ingreso, en el área de campos de columna, mostrando en cada una, los diferentes ciclos que un alumno ha estudiado. D-11

186 Figura D.4.8. Área de campos de columna Si desea mostrar también los miembros o campos de propiedad de un nivel, presione el botón de Tabla Dinámica, que se encuentra en la barra de herramientas de Tabla Dinámica, elija la opción Campos de Propiedad. A continuación se presentará una pequeña ventana en la se muestra un listado con todos los niveles de esa dimensión. D-12

187 Figura D.4.9. Barra de herramientas Tabla Dinámica Al escoger un nivel, se muestran también los campos de propiedad de éste. Haga clic izquierdo sobre el campo de propiedad que desea que se muestre y luego presione el botón para agregarlo al listado de campos de propiedades. D-13

188 Figura D Elegir campos de propiedad para una dimensión Una vez agregado, presione el botón Aceptar, a continuación se desplegará en la pantalla, los campos de propiedad pertenecientes a ese nivel. D-14

189 Figura D Mostrar campos de propiedad de un nivel 5. ELABORACIÓN DE GRÁFICAS Teniendo ya elaborado el reporte, podrá crear gráficas de los datos contenidos en éste, por medio del Asistente para gráficos, el cual puede ser accedido por medio del botón través del menú Insertar, seleccionando la opción Gráfico. o a Dentro de este asistente podrá escoger el tipo de gráfico que desee elaborar, como se observa en la figura: D-15

190 Figura D.5.1. Asistente para gráficos Luego, deberá seguir los pasos del asistente para especificar los detalles que desee que se muestren en el gráfico. Como se observa en la figura, a la derecha del gráfico estará el conjunto de dimensiones del cubo, en la parte superior del gráfico observará los campos de página, a la derecha los campos de filas y en la parte inferior, los campos de columna. D-16

191 Figura D.5.2. Ejemplo de gráfico De forma similar a la elaboración de reportes, podrá modificar el gráfico, moviendo las dimensiones disponibles a los campos de fila, columna o página. 6. MÓDULO DE DECANOS El módulo de reportes está dividido en dos secciones: Población académica y Rendimiento Académico. Población Académica Esta sección permite conocer la cantidad de estudiantes agrupadas por diferentes criterios, por ejemplo Institución de procedencia, Lugar de Procedencia, Tipo de Ingreso, etc. D-17

192 Población por carrera: Presenta como esta distribuida la población total de una facultad en las diferentes carreras que esta imparte, para un ciclo determinado. El reporte obtenido se muestra a continuación: Figura D.6.1. Reporte de población académica por carrera Como puede observar en el área de página se agregó el ciclo que se desea analizar, el área de filas representa la facultad con cada una de las diferentes carreras finalmente en el área de datos se encuentra la cantidad de alumnos para cada carrera. Institución: A partir de este reporte es sencillo conocer para un ciclo determinado la cantidad de alumnos inscritos en la facultad agrupados por instituciones de educación media del país. Historial Institución: Se muestra la cantidad de alumnos inscritos en los diferentes ciclos para la facultad agrupados por cada una de las diferentes instituciones de procedencia, D-18

193 permitiendo hacer comparativas para conocer la demanda de estudiantes de las diversas instituciones y conocer si esta aumentando o disminuyendo. Materias por matrícula: Permite conocer la cantidad de alumnos en las diferentes materias, agrupados por matrícula inscrita; para un ciclo determinado. Departamento Municipio: Reporte que muestra la cantidad de alumnos de la facultad organizada por el departamento y municipio de procedencia del alumno. Historial Departamento Municipio: Presenta como ha variado en los diferentes ciclos la población académica, de acuerdo al lugar de procedencia del alumno. Tipo Ingreso: Con este reporte se puede conocer la cantidad de alumnos en un ciclo, agrupados en relación al tipo o categoría de ingreso a la Universidad. Rendimiento Académico En este apartado se puede conocer la situación histórica y actual de la Universidad, con respecto al rendimiento académico de los alumnos. El rendimiento se mide por medio de CUM ciclo, CUM carrera, CUM general y por nota promedio. Mejores alumnos: Este reporte presenta el listado de todos los alumnos pertenecientes a una facultad ordenados por CUM de carrera, de esta forma se permite conocer a los estudiantes con el rendimiento mas sobresaliente para una facultad en un ciclo determinado. Rendimiento de Alumnos: Permite observar los diferentes cambios en el CUM carrera, para la facultad en un los diferentes ciclos determinados por el usuario. A partir de esto se permite observar los diferentes cambios en el rendimiento de la población total de la Universidad. Un modelo de este reporte se presenta a continuación: D-19

194 Figura D.6.2. Reporte de rendimiento de alumnos Historial materias: Muestra la nota promedio de cada una de las materias impartidas para la facultad en los diferentes ciclos, para hacer comparativas y determinar como ha variado el rendimiento en las diversas materias. Tipo Ingreso: Se presenta el CUM de carrera promedio obtenido por los estudiantes en un ciclo, agrupados por el tipo de ingreso a la Universidad. 7. MÓDULO DE COORDINADORES DE CARRERA El módulo de reportes esta dividido en dos apartados Población académica y Rendimiento Académico. Población Académica D-20

195 Esta sección permite conocer la cantidad de estudiantes agrupadas por diferentes criterios, por ejemplo Institución de procedencia, Lugar de Procedencia, Tipo de Ingreso, etc. Institución: A partir de este reporte es sencillo conocer para un ciclo determinado la cantidad de alumnos inscritos en una carrera agrupados por las instituciones de procedencia de éstos. Historial institución: Se muestra la cantidad de alumnos inscritos en los diferentes ciclos para la carrera agrupados por las diferentes instituciones de procedencia, esto permite hacer comparativas para conocer la demanda de estudiantes de las diversas instituciones y conocer si esta aumentando o disminuyendo. Materias: Se presentan todas las materias cursadas por los alumnos de una carrera, indicando las carreras aprobadas, reprobadas, etc. Materia por matrícula: Permite conocer la cantidad de alumnos inscritos en las diferentes materias, agrupados por matrícula; para un ciclo determinado. Departamento Municipio: Reporte que muestra la cantidad de alumnos de la carrera organizada por el departamento y municipio de procedencia del estudiante. Historial Departamento Municipio: Presenta como ha variado en los diferentes ciclos la población académica, de acuerdo al lugar de procedencia del alumno. Tipo de Ingreso: Con este reporte se puede conocer la cantidad de alumnos en un ciclo, agrupados en relación al tipo o categoría de ingreso a la Universidad. Rendimiento Académico En este apartado se puede conocer la situación histórica y actual de la Universidad, con respecto al rendimiento académico de los alumnos. El rendimiento se mide por medio de CUM ciclo, CUM carrera, CUM general y por nota promedio. D-21

196 Mejores alumnos: Este reporte presenta el listado de todos los alumnos pertenecientes a una carrera ordenados por CUM de carrera, de esta forma se permite conocer a los estudiantes con el rendimiento mas sobresaliente para una facultad en un ciclo determinado. Historial de materias por matrícula: Muestra la nota promedio de cada una de las materias cursadas por los alumnos de la carrera, en los diferentes ciclos, la nota promedio se muestra para las diferentes matrículas en las que fue inscrita la materia, para hacer comparativas y determinar como ha variado el rendimiento en las diversas materias. Historial Materias: Muestra la nota promedio de cada una de las materias cursadas por los alumnos de la carrera, en los diferentes ciclos. Rendimiento de Alumnos: El reporte muestra la variación del CUM carrera, ciclo y general en los diferentes ciclos para la carrera elegida. De esta manera se comprueba si el rendimiento esta mejorando, se mantiene constante o esta disminuyendo. Rendimiento por año de nacimiento: Permite observar el rendimiento de los alumnos en los diferentes ciclos agrupados por el año de nacimiento de estos. Rendimiento Departamento Municipio: Se presenta el CUM de carrera promedio obtenido por los estudiantes en un ciclo, agrupados por el lugar de procedencia de éstos. D-22

197 ANEXO E

198

199 UNIVERSIDAD CENTROAMERICANA JOSÉ SIMEÓN CAÑAS MANUAL TÉCNICO DATAWAREHOUSE DEL REGISTRO ACADÉMICO DE LA UNIVERSIDAD CENTROAMERICANA JOSÉ SIMEÓN CAÑAS POR MELVIN GILBERTO CAMPOS MEJÍA CECILIA ELIZABETH GUEVARA AYALA ANA LISSETTE ROSALES INESTROZA SEPTIEMBRE 2006 SAN SALVADOR, EL SALVADOR, C.A.

200

201 INDICE Pág. 1. INTRODUCCIÓN... E-1 2. REQUISITOS MÍNIMOS DE HARDWARE Y SOFTWARE... E-1 3. GUÍA DE INSTALACIÓN DE SOFTWARE... E GUÍA DE INSTALACIÓN DE SQL SERVER E RECUPERACIÓN DE LAS BASES DE DATOS DENTRO DEL ENTERPRISE MANAGER...E GUÍA DE INSTALACIÓN DE ANALYSIS SERVICES...E SERVICE PACK 4 PARA SQL SERVER E DOMINIOS DE LA BASE DE DATOS BDSIA... E DIAGRAMAS ESTRELLA ELABORADOS... E DIAGRAMA ESTRELLA ALUMNO...E DICCIONARIO DE DATOS DEL DIAGRAMA ESTRELLA ALUMNO...E DIAGRAMA ESTRELLA MATERIA...E DICCIONARIO DE DATOS DEL DIAGRAMA ESTRELLA MATERIA...E DATA STAGING AREA... E TABLAS PARA CARGA INICIAL DE DATOS...E TABLAS DE TRANSFORMACIÓN DE DATOS...E TABLAS EQUIVALENTES A LAS DIMENSIONES DEL DIAGRAMA ESTRELLA...E TABLAS DE CONTROL DE CARGA...E TABLAS DE BITÁCORA...E DESCRIPCIÓN DE LAS TABLAS DE TRANSFORMACIÓN DE DATOS E ESPECIFICACIONES DE LOS ARCHIVOS DE TEXTO CON LOS DATOS

202 PROVENIENTES DE LA BASE DE DATOS DEL BDSIA...E NOMENCLATURA DTS...E SERVICIOS DE TRANSFORMACIÓN DE DATOS (DTS)...E CARGA INICIAL DE DATOS... E CARGA PERIÓDICA DE DATOS... E CARGA DE ACTUALIZACIÓN DE DATOS... E CREACIÓN DE CUBOS...E CUBO ALUMNO... E CUBO MATERIA... E ADD IN PARA MICROSOFT EXCEL...E-89

203 1. INTRODUCCIÓN El presente manual está dirigido al personal de la Dirección de Informática o a estudiantes de futuros proyectos de graduación que deseen llevar a cabo la etapa de implementación del Data Warehouse para el Registro Académico de la UCA, con el fin de guiarlos en los pasos que deben seguirse para el desarrollo de este. El manual describe las herramientas que se utilizaron para desarrollar el Data Warehouse, así como las diferentes bases de datos que fueron creadas, la aplicación de las herramientas de carga, extracción y transformación de los datos y la construcción de la aplicación de usuario final. 2. REQUISITOS MÍNIMOS DE HARDWARE Y SOFTWARE Para llevar a cabo la implementación del sistema y en base a las herramientas seleccionadas se proponen como requisitos mínimos de hardware y software, tanto para el servidor como para los usuarios, los siguientes: Tabla E.2.1. Requisitos mínimos de Hardware HARDWARE Servidor Usuarios Procesador Pentium IV 3.8 GHz. Computadoras personales con las Memoria RAM 1 GB. 160 GB disco duro. Dispositivos de CD-ROM o DVD- ROM siguientes características: Procesador Pentium III o mayores (mínimo a 800 Mhz). Memoria RAM 256 MB. 500 MB de espacio disponible en disco duro. Dispositivos de CD-ROM o DVD- ROM. E-1

204 Tabla E.2.2. Requisitos mínimos de Software SOFTWARE Servidor Usuarios Sistema Operativo: Microsoft Sistema Operativo: Windows 2000 Server. Windows 2000 Service Pack 4; Microsoft SQL Server 2000 (Standard Edition) con Service Pack 4. Ms Excel Programa Antivirus. Windows XP; Windows XP Service Pack 2 Microsoft Excel: Microsoft Excel 2002 (con Office XP Service Pack 3) o Microsoft Excel GUÍA DE INSTALACIÓN DE SOFTWARE 3.1. GUÍA DE INSTALACIÓN DE SQL SERVER 2000 Introduzca el CD de instalación de SQL Server Al ejecutarse el programa de instalación se presentará una pantalla como la que se muestra a continuación, elija la opción SQL Server 2000 Components. Figura E.3.1. Instalación de SQL Server 2000 Components E-2

205 Posteriormente se presentaran tres opciones, escoja la opción Install Database Server. Figura E.3.2. Instalación del Servidor de Base de Datos Al aparecer la pantalla de Bienvenida, presione el botón Next para continuar. Figura E.3.3. Pantalla de bienvenida a la instalación de Microsoft SQL Server E-3

206 A continuación, elija el servidor en el que desea instalar el software. Si desea instalar SQL Server en la máquina local, escoja la opción Local Computer. Presione Next para continuar con la instalación. Figura E.3.4. Servidor donde se desea instalar el software Posteriormente, se muestran las diferentes opciones de instalación que pueden efectuarse; elija la opción "Create a new instante of SQL Server, or Install Client Tools. Presione Next para continuar. E-4

207 Figura E.3.5. Crear nueva instancia de SQL Server Como siguiente paso, se solicita la información de usuario y su compañía. Figura E.3.6. Información de usuario y compañía E-5

208 Luego, se muestra el contrato de licencia del software, después de leerla, presione el botón Yes, si está de acuerdo con los términos ahí expuestos, o No en caso contrario. Figura E.3.7. Contrato de licencia de SQL Server Seleccione la opción Server and Client Tools, para instalar las herramientas del cliente y del servidor. Figura E.3.8. Instalar herramientas de cliente y servidor E-6

209 Seleccione el tipo de instalación que desea efectuar. Se recomienda elegir la opción Typical. Figura E.3.9. Tipo de instalación de SQL Server Antes de iniciar, introduzca la clave del producto. Figura E Introducir clave del producto E-7

210 Introduzca un nombre para la instancia de la base de datos. Si desea mantener el nombre que SQL Server, coloca por defecto, chequee la casilla Default. Figura E Nombre de la instancia de la base de datos Elija la opción Use the same account for each service. Auto start SQL Server Service, para inicializar el servicio con la cuenta de usuario local. Figura E Usuario y contraseña para el iniciar servicio de SQL Server E-8

211 A continuación debe escoger el modo de autenticación, elija la opción Window Authentication Mode. Esta opción puede ser modificada luego. Figura E Modo de autenticación Luego de realizar las configuraciones anteriores, la instalación puede llevarse a cabo. Presione Next, para dar inicio. Figura E Finalización de configuraciones para la instalación de SQL Server E-9

212 Figura E Instalación en proceso Luego de terminar la copia de los archivos, presione el botón Finish para completar la instalación. Figura E Finalizar instalación de SQL Server 3.2. RECUPERACIÓN DE LAS BASES DE DATOS DENTRO DEL ENTERPRISE MANAGER CREACIÓN DE BASE DE DATOS Una vez se ha ingresado al Enterprise Manager, se despliega en la parte izquierda, un árbol que nos muestra las diferentes bases de datos con las que cuenta el Sistema. Para crear una nueva, basta con dar clic derecho y se muestra un menú como el de la figura: E-10

213 Figura E Crear nueva base de datos Al escoger la opción New Database, se muestra una pantalla similar a la de la figura E En el campo Name introduzca el nombre de la base de datos: BDSIA, luego presione el botón de Aceptar. Una vez creada, la base de datos aparece en el árbol o directorio, como se muestra en la figura E Si se desean ver todos los objetos que posee la base de datos (diagramas, tablas, vistas, procedimientos almacenados, usuarios, roles, etc.), presione el símbolo +, que se encuentra al lado izquierdo del nombre de esta. E-11

214 Figura E Asistente para creación de nueva base de datos Figura E Base de datos creada E-12

215 RESTAURAR LA BASE DE DATOS Para restaurar el Backup de la base de datos debe realizar los siguientes pasos: Una vez creada la base de datos BDSIA, con el botón derecho del ratón presione el nombre de la base de datos. Se desplegará un menú como se muestra a continuación: Figura E Restaurar base de datos Dentro de ese menú, escoja la opción Todas las Tareas, y a continuación la opción Restore Database, luego se le mostrará una pantalla como la siguiente: E-13

216 Figura E Asistente para restauración de base de datos Presione la opción Restore From Device para restaurar la base desde el archivo bdsia.bck. A continuación presione el botón Select Device para escoger el directorio en donde se encuentra el backup. A continuación se muestra una pantalla en la que deberá presionar la opción: Add, para que seleccione la ruta en la que se encuentra el archivo de backup. En la siguiente pantalla, usted podrá digitar la ruta en la que se encuentra el backup que se desea restaurar; si lo desconoce presione el botón examinar para buscarlo directamente. En el caso que presione el botón de examinar, se le mostrará la siguiente ventana de exploración: E-14

217 Figura E Elegir fuente del backup Luego de haber ubicado el archivo que desea restaurar presione OK. Figura E Verificar ruta del backup E-15

218 A continuación verifique que la ruta del archivo esté correcta, y si es así presione OK para aceptar. Presione de nuevo OK para regresar a la ventana principal. Seleccione la viñeta Options, y marque la casilla que corresponde a Force restore over existing database para que la restauración se efectúe correctamente. Figura E Forzar restauración de base de datos Luego presione el botón Aceptar para que comience la restauración de la base de datos. E-16

219 3.3. GUÍA DE INSTALACIÓN DE ANALYSIS SERVICES Introduzca el CD de instalación de SQL Server Al ejecutarse el programa de instalación se presentará una pantalla donde deberá escoger la opción SQL Server 2000 Components. En la siguiente pantalla, elija la opción Install Analysis Services. Figura E Instalación de Analysis Services Al presentarse la pantalla de bienvenida, presione el botón Next, para dar inicio con la instalación. E-17

220 Figura E Pantalla de bienvenida a la instalación de Analysis Services Luego se muestra el contrato de licencia del software. Después de leerlo presione el botón Yes si está de acuerdo con los términos ahí expuestos, o No en caso contrario. Figura E Contrato de licencia para la instalación de Analysis Services Seleccione los componentes que desea instalar. E-18

221 Figura E Seleccionar componentes a instalar Posteriormente se mostrará el directorio que utilizará la aplicación. Si desea que utilice uno diferente, presione el botón Browse, para elegirlo. Figura E Directorio donde se instalará Analysis Services E-19

222 Seleccione el Folder en el cual se crearán los iconos del programa. Presione Next para continuar. Figura E Seleccionar fólder donde se crearán los iconos de Analysis Services Espere mientras se instalan los archivos. Figura E Proceso de instalación de Analysis Services E-20

223 Presione el botón Finish, para finalizar la instalación. Figura E Finalizar instalación de Analysis Services 3.4. SERVICE PACK 4 PARA SQL SERVER 2000 La instalación del Service Pack 4, específicamente los Componentes de Analysis Services, permitirá visualizar de manera gráfica las dimensiones y los cubos creados en el Analysis Services, así como los datos contenidos en cada cubo. Descargue e instale el Service Pack 4 de SQL Server 2000 en el siguiente link: E-21

224 4. DOMINIOS DE LA BASE DE DATOS BDSIA Dominios son las especificaciones de los tipos de datos creados dentro del BDSIA como rules. Estas especificaciones fueron utilizadas para conocer el significado del código asignado a un campo dentro de un registro. A continuación se presentan los dominios del BDSIA utilizados para el desarrollo del Data Warehouse. Tabla E.4.1. Dominio CATEG_INGRESO Dominio CATEG_INGRESO Nombre CATEG_INGRESO Código CATEG_INGRESO Tipo de Dato char(1) Lista de Valores N Nuevo ingreso S Estudios superiores R Reingreso E Equivalencias 9 No definido M Reserva de matrócula O Otros Tabla E.4.2. Dominio CATEG_INSTITUCION Dominio CATEG_INSTITUCION Nombre CATEG_INSTITUCION Código CATEG_INSTITUCION Tipo de Dato char(2) Lista de Valores P Privada E Estatal Tabla E.4.3. Dominio ESTADO_ALUMNO Dominio ESTADO_ALUMNO E-22

225 Nombre Código Tipo de Dato Lista de Valores ESTADO_ALUMNO ESTADO_ALUMNO char(1) D Admision P Preselección S Selecciondo a Cursillo C Cursillo U Admitido a la Universidad A Activo I Inactivo Tabla E.4.4. Dominio ESTADO_CIVIL Dominio ESTADO_CIVIL Nombre ESTADO_CIVIL Código ESTADO_CIVIL Tipo de Dato char(1) Lista de Valores S Soltero C Casado V Viudo D Divorciado A Acompañado Tabla E.4.5. Dominio ESTADO_MATERIA Dominio ESTADO_MATERIA Nombre ESTADO_MATERIA Código ESTADO_MATERIA Tipo de Dato char(2) Lista de Valores TN Graduación anulada DN Deficitarias anulada NN Normal anulada NI Normal inscrita E-23

226 NA Normal aprobada NR Normal reprobada NT Normal retirada NO Normal retirada por orden DI Deficitarias inscrita DA Deficitarias aprobada DR Deficitarias reprobada DT Deficitarias retirada DO Deficitaria retirada por orden TI Graduación inscrita TA Graduación aprobada TR Graduación reprobada TT Graduación retirada TO Graduación retirada por orden EA Equiv.Externa aprobada ER Equiv.Externa reprobada IA Equiv.Interna aprobada IR Equiv.Interna reprobada Tabla E.4.6. Dominio MODALIDAD_MATERIA Dominio MODALIDAD_MATERIA Nombre MODALIDAD_MATERIA Código MODALIDAD_MATERIA Tipo de Dato char(1) Lista de Valores N Normal G Graduación Tabla E.4.7. Dominio TIPO_CARRERA Dominio TIPO_CARRERA Nombre TIPO_CARRERA Código TIPO_CARRERA E-24

227 Tipo de Dato Lista de Valores char(1) G Grado P Postgrado T Técnico C Grado Complementario O Optativas E Electivas F Facultad U Graduacion Tabla E.4.8. Dominio TIPO_MATERIA Dominio TIPO_MATERIA Nombre TIPO_MATERIA Código TIPO_MATERIA Tipo de Dato char(1) Lista de Valores T Curso Monográfico de Teología H ELECTIVA HUMANISTICA S ELCTIVA SOCIAL O OPTATIVA A OPTATIVA O ELECTIVA HUMANISTICA B OPTATIVA O ELECTIVA SOCIAL E ELECTIVA (SOCIAL O HUMANISTICA) L ELECTIVA DE PROF. O LIC. EN LETRAS X ELECTIVA TEORICA DE FILOSOFIA Y ELECTIVA HISTORICO-METODOLOGICA DE FILOSOFIA Z ELECTIVA PRODUCCION-LATINOAMERICANA DE FILOSOFIA M ELECTIVA DE MAESTRIA EN ADMON. Y DIR. DE EMPR. G EQUIVALENCIA INTERNA GLOBAL E-25

228 I EQUIVALENCIA INTERNA INDIVIDUAL R CARGA REDUCIDA W MATERIA PERTENECIENTE A ALGUN PLAN ANTERIOR J MATERIA EX-TIPO "G"PERTENECIENTE A ALGUN PLAN-ANTERIOR K MATERIA EX-TIPO "I" PERTENECIENTE A ALGUN PLAN ANTERIOR P PERTENECIENTE AL PLAN 5. DIAGRAMAS ESTRELLA ELABORADOS A partir de la Base de Datos del Sistema de Información Académica se crearon dos diagramas estrella, uno para el análisis de los alumnos y el otro para el análisis de las materias. A continuación se especifica tanto el modelo como el diccionario de datos de cada uno de estos diagramas estrella. E-26

229 5.1. DIAGRAMA ESTRELLA ALUMNO Figura E.5.1. Diagrama Estrella ALUMNO Figura E.5.1. Diagrama Estrella ALUMNO E-27

230 5.2. DICCIONARIO DE DATOS DEL DIAGRAMA ESTRELLA ALUMNO DW_ALUMNO: Tabla de Dimensión de Alumno, en la que se almacena la información de los alumnos de la Universidad. Tabla E.5.1. Estructura de la tabla DW_ALUMNO Atributo Tipo Dato Nulo PK FK Descripción carnet char(8) No Carnet del alumno nombres varchar(50) No Nombres del alumno apellidos varchar(50) No Apellidos del alumno i_a char(1) No Inicial del primer apellido del alumno. DW_CARRERA_FACULTAD: Tabla de dimensión, en la que se almacenan las diferentes Facultades que existen dentro de la Universidad, junto con las carreras que le pertenecen a cada una. Tabla E.5.2. Estructura de la tabla DW_CARRERA_FACULTAD Atributo Tipo Dato Nulo PK FK Descripción id_carrera integer No Número que identifica a la carrera cod_carrera char(4) No Código de la Carrera carrera varchar(50) No Nombre de la Carrera cod_facultad char(1) No Código de la Facultad a la que pertenece la Carrera facultad varchar(50) No Nombre de la Facultad a la que pertenece a la Carrera siglas_facultad char(10) No Siglas de la Facultad cod_decano char(10) No Código del Decano encargado de la Facultad nbr_decano char(10) No Nombre del Decano cod_coordinador char(10) No Código del coordinador de la Carrera nbr_coordinador char(10) No Nombre del coordinador de la carrera E-28

231 tipo_carrera char(10) No Tipo de carrera titulo_obtenido char(10) No Título que obtienen los alumnos al terminar la carrera DW_DEPTO_MUNIC: Tabla de dimensión en la que se almacenan los departamentos del país y a la vez los municipios asociados a estos. Tabla E.5.3. Estructura de la tabla DW_DEPTO_MUNIC Atributo Tipo Dato Nulo PK FK Descripción id_depto_munic integer No Número que identifica a un municipio cod_depto_munic char(4) No Código del departamento y municipio departamento varchar(50) No Nombre del departamento municipio varchar(100) No Nombre del Municipio DW_ESTADO_ALUMNO: Tabla de dimensión, en la que se almacena los diferentes tipos de estado que un alumno puede tener dentro de la Universidad (Activo, Inactivo, etc.). Tabla E.5.4. Estructura de la tabla DW_ESTADO_ALUMNO Atributo Tipo Dato Nulo PK FK Descripción id_estado_alumno integer No Número que identifica al estado del alumno estado_alumno varchar(10) No Nombre del estado del alumno i_ea char(1) No Inicial del estado del alumno DW_ESTADO_CIVIL: Tabla de Dimensión del estado civil, en la que se almacenan los diferentes estados civiles. Tabla E.5.5. Estructura de la tabla DW_ESTADO_CIVIL Atributo Tipo Dato Nulo PK FK Descripción id_estado_civil int No Número que identifica al estado civil estado_civil varchar(10) No Nombre del estado civil E-29

232 i_ec char(1) No Inicial del estado civil DW_INSTITUCION: Tabla de Dimensión, en la que se almacena las diferentes instituciones o centros educativos en los que han estudiado los alumnos de la Universidad, durante su educación media. Tabla E.5.6. Estructura de la tabla DW_INSTITUCION Atributo Tipo Dato Nulo PK FK Descripción id_institucion int No Número que identifica a la institución cod_institucion char(10) No Código de la institución institucion varchar(30) No Nombre de la institución DW_PAIS: Tabla de dimensión, en la que se almacenan los diferentes países. Tabla E.5.7. Estructura de la tabla DW_PAIS Atributo Tipo Dato Nulo PK FK Descripción id_pais int No Número que identifica al país cod_pais char(3) No Código del país pais varchar(30) No Nombre del país DW_SEXO: Tabla de dimensión, en la que se almacena el sexo de una persona. Tabla E.5.8. Estructura de la tabla DW_SEXO Atributo Tipo Dato Nulo PK FK Descripción id_sexo integer No Número que identifica al tipo de sexo sexo varchar(10) No Nombre del tipo de sexo i_s char(1) No Inicial del tipo de sexo DW_TIEMPO: Tabla de dimensión que almacena las fechas de nacimiento de los alumnos. E-30

233 Tabla E.5.9. Estructura de la tabla DW_TIEMPO Atributo Tipo Dato Nulo PK FK Descripción id_tiempo int No Número que identifica la fecha Anio char(4) No Año Mes int No Mes nombremes char(10) No Nombre del mes dia Int No Día Fecha datetime No Fecha exacta DW_CICLO1: Tabla de dimensión que almacena el ciclo de ingreso de los alumnos. Tabla E Estructura de la tabla DW_CICLO1 Atributo Tipo Dato Nulo PK FK Descripción id_ciclo Int No Número que identifica el ciclo anio char(4) No Año del ciclo ciclo char(7) No Cadena que representa el ciclo DW_CICLO: Tabla de dimensión que almacena el ciclo de último ingreso (último ciclo inscrito) de los alumnos. Tabla E Estructura de la tabla DW_CICLO Atributo Tipo Dato Nulo PK FK Descripción id_ciclo Int No Número que identifica el ciclo anio char(4) No Año del ciclo ciclo char(7) No Cadena que representa el ciclo DW_TIPO_INGRESO: Tabla de dimensión, donde se almacenan los tipos de ingreso de un alumno a la Universidad. E-31

234 Tabla E Estructura de la tabla DW_TIPO_INGRESO Atributo Tipo Dato Nulo PK FK Descripción id_tipo_ingreso integer No Número que identifica un tipo de ingreso cod_tipo_ingreso varchar(1) No Código del tipo de ingreso tipo_ingreso varchar(20) No Nombre del tipo de ingreso FACT_ALUMNO: Tabla de Hechos del Diagrama Estrella. Tabla E Estructura de la tabla FACT_ALUMNO Atributo Tipo Dato Nulo PK FK Descripción carnet char() No Carnet de un Alumno id_depto_munic integer No Identificador del departamento y municipio al que pertenece el alumno id_estado_alumno integer No Estado del alumno id_estado_civil integer No Estado civil del alumno id_institucion integer No Institución de donde proviene el alumno id_pais integer No País de origen del Alumno id_sexo integer No Sexo del Alumno id_fecha_nacimiento integer No Fecha de nacimiento del Alumno id_fecha_ingreso integer No Fecha de ingreso del Alumno a la Universidad id_ciclo_carga integer No Ciclo en que se cargará la información existente en esta base de datos. id_carrera integer No Carrera a la que está inscrito el Alumno id_tipo_ingreso integer No Tipo de ingreso a la Universidad E-32

235 del alumno id_ultimo_ingreso integer No Fecha de ultimo ingreso del alumno a la Universidad cantidad bigint No Cantidad de alumnos (en el caso mas trivial será 1) cum_general numeric(5,2) No Cum general del alumno cum_carrera numeric(5,2) No Cum de carrera del alumno cum_ciclo numeric(5,2) No Cum de ciclo del alumno cuota_nominal smallmoney No Cuota nominal del alumno cuota_real smallmoney No Cuota real del alumno E-33

236 5.3. DIAGRAMA ESTRELLA MATERIA Figura E.5.2. Diagrama Estrella MATERIA Figura E.5.2. Diagrama Estrella MATERIA E-34

237 5.4. DICCIONARIO DE DATOS DEL DIAGRAMA ESTRELLA MATERIA DW_ALUMNO: Tabla de Dimensión de Alumno, en la que se almacena la información de los alumnos de la Universidad. Tabla E Estructura de la tabla DW_ALUMNO Atributo Tipo Dato Nulo PK FK Descripción carnet char(8) No Carnet del alumno nombres varchar(50) No Nombres del alumno apellidos varchar(50) No Apellidos del alumno i_a char(1) No Inicial del primer apellido del alumno. DW_CARRERA_FACULTAD: Tabla de dimensión, en la que se almacenan las diferentes Facultades que existen dentro de la Universidad, junto con las carreras que le pertenecen a cada una. Tabla E Estructura de la tabla DW_CARRERA_FACULTAD Atributo Tipo Dato Nulo PK FK Descripción id_carrera integer No Número que identifica a la carrera cod_carrera char(4) No Código de la Carrera carrera varchar(50) No Nombre de la Carrera cod_facultad char(1) No Código de la Facultad a la que pertenece la Carrera facultad varchar(50) No Nombre de la Facultad a la que pertenece a la Carrera siglas_facultad char(10) No Siglas de la Facultad cod_decano char(10) No Código del Decano encargado de la Facultad nbr_decano char(10) No Nombre del Decano cod_coordinador char(10) No Código del coordinador de la Carrera nbr_coordinador char(10) No Nombre del coordinador de la carrera E-35

238 tipo_carrera char(10) No Tipo de carrera titulo_obtenido char(10) No Título que obtienen los alumnos al terminar la carrera DW_MATERIA_DEPARTAMENTO: Tabla de dimensión que almacena los departamentos que existen dentro de la Universidad junto con las materias que brinda cada departamento. Tabla E Estructura de la tabla DW_MATERIA_DEPARTAMENTO Atributo Tipo Dato Nulo PK FK Descripción id_materia int No Número que identifica la materia cod_departamento char(2) No Código del departamento nbr_departamento varchar(50) No Nombre del departamento cod_jefe char(7) No Código del jefe de departamento nbr_jefe varchar(100) No Nombre del jefe de departamento cod_materia char(6) No Código de la materia nbr_materia varchar(50) No Nombre de la materia horas_clase numeric(3,1) No Horas de clase semanales de la materia cupo smallint No Cupo máximo para la sección uv numeric(5,2) No Número de unidades valorativas asignadas a la materia DW_ESTADO_MATERIA: Tabla de dimensión que almacena los estados que puede tener un alumno con respecto a la materia que inscribió en el ciclo. Tabla E Estructura de la tabla DW_ESTADO_MATERIA Atributo Tipo Dato Nulo PK FK Descripción id_estado_materia int No Número que identifica el estado de la materia cod_estado_materia char(2) No Código del estado de la materia E-36

239 estado_materia varchar(50) No Nombre del estado de materia DW_MATRICULA: Tabla de dimensión que almacena los tipos de matrícula que puede tener una materia. Tabla E Estructura de la tabla DW_MATRICULA Atributo Tipo Dato Nulo PK FK Descripción id_matricula int No Número que identifica el tipo de matrícula matricula varchar(10) No Nombre del tipo de matrícula DW_PROFESOR: Tabla de dimensión que almacena los profesores que imparten las diferentes materias. Tabla E Estructura de la tabla DW_PROFESOR Atributo Tipo Dato Nulo PK FK Descripción id_profesor int No Número que identifica al profesor cod_empleado char(7) No Código de empleado del profesor nombre varchar(100) No Nombre del profesor DW_SECCION: Tabla de dimensión que almacena las secciones. Tabla E Estructura de la tabla DW_SECCION Atributo Tipo Dato Nulo PK FK Descripción id_ seccion int No Número que identifica la sección nbr_seccion char(2) No Nombre de la sección DW_CICLO: Tabla de dimensión que almacena el ciclo. E-37

240 Tabla E Estructura de la tabla DW_CICLO Atributo Tipo Dato Nulo PK FK Descripción id_tiempo int No Número que identifica el ciclo anio char(4) No Año del ciclo ciclo char(2) No Nombre del ciclo DW_TIPO_MATERIA: Tabla de dimensión que almacena el tipo de materia. Tabla E Estructura de la tabla DW_TIPO_MATERIA Atributo Tipo Dato Nulo PK FK Descripción id_tipo_materia int No Número que identifica el tipo de materia cod_tipo_materia char(1) No Código del tipo de materia nbr_tipo_materia varchar(50) No Nombre del tipo de materia FACT_MATERIA: Tabla de Hechos del Diagrama Estrella. Tabla E Estructura de la tabla FACT_MATERIA Atributo Tipo Dato Nulo PK FK Descripción carnet char(8) No Carnet del estudiante id_ciclo int No Identificador del ciclo en que se impartió la materia id_profesor int No Identificador del profesor que impartió la materia id_tipo_materia int No Identificador del tipo de materia id_matricula int No Identificador de la matrícula en que se llevaba la materia id_ seccion int No Identificador de la sección id_carrera int No Identificador de la carrera de los alumnos que cursaron la materia id_materia_depto int No Identificador de la materia cursada E-38

241 id_estado_materia int No Identificador del estado de los alumnos que cursaron la materia cantidad int No Cantidad de alumnos que cursaron nota numeric(2,1) No Nota promedio de los alumnos 6. DATA STAGING AREA El Data Staging Area es un área de almacenamiento y a su vez, un conjunto de procesos que limpian, transforman, combinan, eliminan datos duplicados, archivan y preparan los datos de origen, para su uso en el Data Warehouse, procesos comúnmente conocidos como procesos de extracción, transformación y carga (ETL). Para definir el Data Staging Area se creó una base de datos denominada BDSIA, en la cual se aplicaron los procesos ETL a los datos provenientes de la Base de Datos del Sistema de Información Académica. Dentro de esta base de datos se crearon cinco tipos diferentes de tablas: Tablas para carga inicial de datos Tablas de transformación de datos Tablas equivalentes a las dimensiones del diagrama estrella. Tablas de control de carga. Tablas de bitácora 6.1. TABLAS PARA CARGA INICIAL DE DATOS Estas tablas tienen una estructura similar a las existentes dentro de la Base de Datos del Sistema de Información Académica y son utilizadas para cargar los archivos de texto que contienen los registros de dichas tablas. A continuación se detalla la estructura de las tablas de carga inicial para cada uno de los diagramas estrella diseñados. E-39

242 ALUMNO: Figura E.6.1. Tablas de carga inicial para el diagrama estrella ALUMNO MATERIA: Figura E.6.2. Tablas de carga inicial para el diagrama estrella MATERIA E-40

243 6.2. TABLAS DE TRANSFORMACIÓN DE DATOS A partir de los datos contenidos en las tablas de carga inicial se procede a realizar los procesos de limpieza y transformación de estos datos y para ello se utilizan las tablas de transformación, las cuales se detallan a continuación: ALUMNO: Figura E.6.3. Tablas de transformación de datos para el diagrama estrella ALUMNO (1) E-41

244 Figura E.6.4. Tablas de transformación de datos para el diagrama estrella ALUMNO (2) MATERIA: E-42

245 Figura E.6.5. Tablas de transformación de datos para el diagrama estrella MATERIA 6.3. TABLAS EQUIVALENTES A LAS DIMENSIONES DEL DIAGRAMA ESTRELLA Con el fin de facilitar la carga de los datos en las dimensiones del diagrama estrella, se crearon tablas equivalentes a estas dimensiones dentro del Data Staging Area. En estas tablas los datos deberán estar listos, transformados, limpios y estandarizados para que no surja ninguna inconsistencia cuando se carguen en el diagrama estrella. A continuación se detalla la estructura de las tablas equivalentes a las dimensiones de cada uno de los diagramas estrella diseñados. ALUMNO: E-43

246 Figura E.6.6. Tablas equivalentes a las dimensiones del diagrama estrella ALUMNO Materia: Figura E.6.7. Tablas equivalentes a las dimensiones del diagrama estrella MATERIA E-44

247 6.4. TABLAS DE CONTROL DE CARGA Con el fin de tener un control de los ciclos que ya han sido cargados dentro de la fact table, se crearon tablas de control de carga, una para el diagrama estrella ALUMNO y otra para el diagrama estrella MATERIA. Estas tablas son alimentadas cada vez que finaliza cada una de las cargas de datos. A continuación se muestra la estructura de dichas tablas. Tabla E.6.1. Estructura de la tabla CONTROL_ALUMNO Atributo Tipo Dato Nulo PK FK Descripción fecha datetime Si Fecha de finalización de la carga cod_cargado char(9) Si Ciclo cargado tipo_carga char(20) Si Tipo de carga realizada resultado varchar(20) Si Resultado de la carga, ya sea Exitosa o Fallida Tabla E.6.2. Estructura de la tabla CONTROL_MATERIA Atributo Tipo Dato Nulo PK FK Descripción fecha datetime Si Fecha de finalización de la carga cod_cargado char(9) Si Ciclo cargado tipo_carga char(20) Si Tipo de carga realizada resultado varchar(20) Si Resultado de la carga, ya sea Exitosa o Fallida 6.5. TABLAS DE BITÁCORA Con el propósito de mantener una bitácora de los registros que han sido cargados en el Data Warehouse, se utilizan un conjunto de tablas de control las cuales son accedidas en el momento de llevar a cabo la carga periódica. E-45

248 Por tanto es necesario mantener actualizados los registros de estas tablas y no eliminar o limpiar sus registros al momento de finalizar el proceso de carga de información. Las tablas utilizadas son: Alumno_td Carrera_facultad_t Categ_ingreso Control_alumno Departamento_t Estado_familiar Institución Institución_p Sexo Tiempo Tipo_carrera Calidad_educativa Carrera_t Categ_institucion Departamento_municipio_t Estado_alumno Facultad_t Institución_dim Pais_t Sistema Tiempo DESCRIPCIÓN DE LAS TABLAS DE TRANSFORMACIÓN DE DATOS ALUMNO_FACT: Tabla equivalente a la fact table del Diagrama Estrella Alumno. ALUMNO_T: Tabla que contiene la información de los alumnos sin nulos ni vacíos. ALUMNO_T1: Tabla que contiene la información de los alumnos sustituyendo los códigos de los campos estado_familiar, sexo, categ_ingreso, estado_alumno, cod_institucion, cod_pais, cod_depto_munic, cod_carrera y fecha de nacimiento por su respectivo id. ALUMNO_TD: Tabla que contiene la información personal de cada alumno: carnet, nombres, apellidos, inicial del primer apellido, dirección y teléfono. CALIDAD_EDUCATIVA: Contiene las diferentes calidades educativas de institución. E-46

249 CARRERA_T: Contiene las carreras de la Universidad sin nulos ni vacíos. CARRERA_FACULTAD_T: Unión de las carreras con sus respectivas facultades. CATEG_INGRESO: Tabla que guarda los diferentes tipos de ingreso que puede tener un alumno dentro de la Universidad. CATEG_INSTITUCION: Guarda las diferentes categorías de institución. DEPARTAMENTO_T: Guarda los diferentes departamentos existentes dentro de los países. DEPARTAMENTO1_T: Guarda los diferentes departamentos existentes dentro de la Universidad. DEPARTAMENTO_MUNICIPIO_T: Tabla que guarda los diferentes municipios, agregando el campo que hace referencia al departamento al que pertenece el municipio. ESTADO_ALUMNO: Guarda los diferentes estados que puede tener un alumno dentro de la Universidad. ESTADO_FAMILIAR: Guarda los diferentes estados familiares existentes, antes denominado estado civil. ESTADO_MATERIA: Tabla que guarda los diferentes estados que puede tener un alumno dentro de una materia en un ciclo determinado. EQUIVALENCIA_EXTERNA_T: Tabla que guarda los registros de las materias que se han otorgado como equivalencia externa a los alumnos provenientes de otras Universidades. E-47

250 EQUIVALENCIA_GLOBAL_T: Tabla que guarda los registros de las materias que se han otorgado como equivalencia interna a los alumnos de la Universidad. EXPEDIENTE_T: Expedientes de los alumnos sin vacíos ni nulos. FACULTAD_T: Guarda las facultades de la Universidad sin nulos ni vacíos. HISTORIA_EQUIVALENCIA_T: Tabla que guarda los registros de las materias que se han otorgado como equivalencia, tanto interna como externa, a los alumnos en los diferentes ciclos. INSTITUCION_DIM: Tabla equivalente a la dimensión Institución del Diagrama Estrella Alumno. INSTITUCION_P: Tabla de equivalencias de institución, utilizada para eliminar registros repetidos. Contiene el código anterior, nombre anterior, código nuevo y nombre nuevo para cada institución. INSTITUCION_T: Contiene la información de cada una de las instituciones, sin nulos ni vacíos. INSTITUCION_T1: Tabla que contiene la información de las instituciones sustituyendo los códigos de los campos sector, calidad_educativa, sistema y categ_institución por su respectivo id. MATERIA_FACT: Tabla equivalente a la fact table del Diagrama Estrella Alumno. MATERIA_DEPARTAMENTO: Unión de las materias con los departamentos que las imparten. MATERIA_T: Guarda las diferentes materias que se imparten dentro de la Universidad. E-48

251 MATRICULA: Guarda las diferentes matrículas en las que un alumno puede inscribir sus materias. PAIS_T: Tabla que contiene los registros de los países sin vacíos ni nulos. PROFESOR_DIM: Tabla equivalente a la dimensión DW_PROFESOR del diagrama estrella Alumno. PROFESOR_T: Guarda los datos personales de los profesores que imparten materias en la Universidad. SECTOR_INSTITUCION: Guarda los diferentes sectores en los que puede estar una institución. SEXO: Tabla que guarda el sexo. SISTEMA: Guarda los diferentes sistemas de institución. TIEMPO: Guarda diferentes registros de fecha. TIEMPO1: Guarda diferentes registros de ciclos. TIPO_CARRERA: Guarda los tipos de carrera existentes en la Universidad. TIPO_MATERIA: Tabla que guarda los diferentes tipos de materias que se imparten en la Universidad. E-49

252 7. ESPECIFICACIONES DE LOS ARCHIVOS DE TEXTO CON LOS DATOS PROVENIENTES DE LA BASE DE DATOS DEL BDSIA Los datos provenientes de la Base de Datos del Sistema de Información Académica deben ser descargados en archivos diferentes para cada tabla, teniendo un registro por línea, con los campos separados por el símbolo. A continuación se especifican los campos que se requieren por cada tabla: Tabla E.7.1. Tablas y campos requeridos en los archivos de texto Tabla Alumno Carnet Apellido Nombres Fecha_nacimiento Estado_civil Sexo Dirección Cod_depto_munic Teléfono Um_general Cum_general Um_carrera Facultad Cod_facultad Nbr_facultad Siglas Carrera Cod_carrera Nbr_carrera Cod_coordinador Semestre Carnet Ciclo Campos Cum_carrera Primer_ingreso Ultimo_ingreso Cuota_nominal Cuota_real Cod_carrera Plan_ingreso Categ_ingreso Estudios_superiores Cod_país Cod_institución Estado_alumno Cod_decano Nbr_decano Nbr_coordinador Cod_facultad Tipo_carrera Matricula Estado_materia E-50

253 Expediente País Departamento_Municipio Institución Equivalencia_Externa Equivalencia_Global Historia_Equivalencia Materia Cod_materia Sección Carnet Ciclo Cod_carrera Cod_materia Cod_país Nbr_país Cod_depto_munic Nbr_depto_munic Cod_institución Nbr_institución Departamento Municipio Dirección Urbana Carnet Cod_materia Uv Cod_carrera Ciclo Cod_materia_otorgada Carnet Cod_carrera Cod_materia_otorgada Ciclo_otorgada Cod_materia Cod_departamento Nbr_materia Uv Valor_laboratorio Nota Tipo_materia Matricula Tipo_materia Nota Estado_materia Privada Teléfono Calidad_educativa Nivel_financiero Sistema Categ_institución Desc_materia Nota Nbr_institucion Cod_materia_cursada_1 Conector_logico Cod_materia_cursada_2 Cod_materia Ciclo Matricula Num_secciones Ult_ciclo_servido Horas_clase Porc_aprob_ant E-51

254 Departamento Profesor Profesor_materia Cod_departamento Nbr_departamento Cod_empleado Apell_pa Apell_ma Ciclo Cod_empleado Cod_jefe Nbr_jefe Apell_ca Nombre Cod_materia Seccion 8. NOMENCLATURA DTS Se conoce como DTS al conjunto de servicios proporcionados por SQL Server 2000 para las tareas de extracción, transformación y carga de datos (Procesos ETL). Los Servicios de transformación de datos (DTS) proporcionan un conjunto de herramientas gráficas y de objetos programables que permiten resolver problemas de movimiento de datos, incluyendo la extracción, transformación y la consolidación de datos de distintas fuentes a destinos únicos o múltiples. DTS es un conjunto de herramientas que permiten importar, exportar y transformar datos heterogéneos entre uno o más orígenes de datos, como Microsoft SQL Server, Microsoft Excel o Microsoft Access. La conectividad la proporciona OLE DB, un estándar abierto para el acceso a datos. Los orígenes de datos de ODBC (Open Database Connectivity) se admiten gracias al proveedor Microsoft OLE DB para ODBC. Se puede crear una solución DTS como uno o varios paquetes, cada uno de los cuales puede contener un conjunto organizado de tareas que determinan el trabajo que se debe llevar a cabo, las transformaciones que se deben realizar en los datos y los objetos, las restricciones del flujo de trabajo que definen la ejecución de las tareas y las conexiones a los orígenes y destinos de datos. Los paquetes DTS también proporcionan servicios como el registro de los detalles de la ejecución de los paquetes, el control de las transacciones y la administración de las variables globales. E-52

255 Para la creación de un paquete DTS es necesaria la utilización del Diseñador DTS el cual implementa de forma gráfica el modelo de objetos DTS, posibilitando la creación gráfica de paquetes DTS. Puede utilizar el Diseñador DTS para: Crear un paquete simple que contenga uno o más pasos. Crear un paquete que incluya flujos de trabajo complejos que comprendan varios pasos utilizando la lógica condicional, el código controlado por eventos o las conexiones múltiples a los orígenes de datos. Editar paquetes existentes. La interfaz del Diseñador DTS consta de un área de trabajo para la creación de paquetes, barras de herramientas que incluyen elementos del paquete y que se pueden arrastrar a la hoja de diseño y, por último, menús que contienen los flujos de trabajo y los comandos de administración de los paquetes. Figura E.8.1. Interfaz del Diseñador DTS Al arrastrar las conexiones y tareas a la hoja de diseño y especificar el orden de ejecución de los flujos de trabajo, se pueden desarrollar fácilmente eficaces paquetes DTS utilizando el Diseñador DTS. Las secciones siguientes definen las tareas, los flujos de trabajo, las conexiones y las transformaciones necesarias para implementar un proceso DTS. E-53

256 Tareas: Un paquete DTS generalmente incluye una o varias tareas, cada una de las cuales define un elemento de trabajo que se puede llevar a cabo durante la ejecución del paquete. Las tareas se pueden emplear para: Transformar datos Copiar y administrar datos Ejecutar tareas como trabajos dentro de un paquete A continuación se explican las tareas utilizadas para realizar los paquetes DTS del proyecto: Transformar datos Tabla E.8.1. Tareas para transformar datos Tarea Permite mover datos entre el origen y el destino y, de manera Transformar opcional, aplicar transformaciones a los datos a nivel de columna. datos Tarea de Permite llevar a cabo operaciones flexibles basadas en Transactconsulta SQL con los datos, incluyendo procedimientos almacenados y las controlada instrucciones INSERT, UPDATE o DELETE. por datos Copiar y administrar datos Tabla E.8.2. Tareas para copiar y administrar datos Tarea Ejecutar Permite ejecutar instrucciones SQL durante la ejecución de los SQL paquetes. La tarea Ejecutar SQL también puede almacenar los datos que resulten de las consultas. E-54

257 Ejecutar tareas como trabajos dentro de un paquete Tabla E.8.3. Tareas para ejecutar tareas como trabajos dentro de un paquete Tarea Ejecutar Permite ejecutar otros paquetes DTS dentro de un paquete. paquete Conexiones: Acceso y movimiento de los datos Para poder ejecutar con éxito las tareas de DTS que permiten copiar y transformar datos, un paquete DTS debe establecer las conexiones adecuadas a los datos de origen y destino y a cualquier otro origen de datos adicional, por ejemplo, las tablas de consulta. Cuando se crea un paquete, el usuario configura las conexiones seleccionando el tipo en una lista de proveedores OLE DB y de controladores ODBC. Los tipos de conexiones que fueron utilizados en el proyecto son: Controladores de Microsoft Data Access Components (MDAC) Tabla E.8.4. Controladores de MDAC Proveedor Microsoft OLE DB para SQL Server Controladores Microsoft Jet Tabla E.8.5. Controladores Microsoft Jet Microsoft Excel Otros controladores Tabla E.8.6. Otros controladores Archivo de texto (Origen) E-55

258 Flujos de trabajo: Establecimiento de la prioridad en las tareas Cuando se define un grupo de tareas, existe por norma general un orden establecido en su ejecución, en cuyo caso, cada una de las tareas constituye un paso en el proceso. En el Diseñador DTS, se pueden manipular las tareas en la hoja de estilo y utilizar restricciones de prioridad que controlen la secuencia en la que éstas se ejecutan. Las restricciones de prioridad se vinculan de forma secuencial en un paquete. La tabla siguiente muestra los tipos de restricciones de prioridad que se pueden utilizar en DTS. Tabla E.8.7. Restricciones de prioridad en las tareas Restricciones de prioridad Descripción Si desea que la tarea 2 espere a que se ejecute la tarea Al concluir 1, independientemente del resultado, vincule la tarea (flecha azul) 1 a la 2 con la restricción de prioridad Al concluir. Si desea que la tarea 2 espere a que la tarea 1 se haya En caso de éxito ejecutado con éxito, vincule la tarea 1 a la 2 con la (flecha verde) restricción de prioridad En caso de éxito. Si desea que la tarea 2 comience a ejecutarse sólo si En caso de error se produce un error en la tarea 1, vincule la tarea 1 a (flecha roja) la 2 con la restricción de prioridad En caso de error. La siguiente ilustración muestra las tareas de secuencia de comandos ActiveX y Enviar correo con una restricción de prioridad Al concluir. La tarea Enviar correo no se ejecuta hasta que no ha terminado la ejecución de la tarea de secuencia de comandos Active X, independientemente del éxito o del error de la primera. Figura E.8.2. Tareas de secuencia de comandos ActiveX y Enviar correo con una restricción de prioridad al concluir E-56

259 Se puede configurar más de una tarea Enviar correo simultáneamente, una para la restricción En caso de éxito y otra para En caso de error. Estas dos tareas podrán enviar distintos mensajes en función del éxito o error de la secuencia de comandos ActiveX. Figura E.8.3. Tareas de correo También se pueden establecer varias restricciones en una tarea. Por ejemplo, "Notificación del administrador" de la tarea Enviar correo podía haber contado con la restricción En caso de éxito para la secuencia de comando nº 1 y En caso de error para la nº 2. En estos casos, DTS asume una relación lógica "AND". Por tanto, la secuencia nº 1 deberá ejecutarse con éxito y la nº 2 deberá resultar en un error para que se pueda enviar la mencionada notificación. Figura E.8.4. Ejemplo de varias restricciones de prioridad en una tarea Nota: En las tareas de transformación, también se pueden definir los cambios que se van a implementar en los datos. La siguiente tabla muestra las transformaciones integradas que proporciona DTS. E-57

260 Tabla E.8.8. Transformaciones integradas que proporciona DTS Transformación Descripción Copy Column Permite copiar datos directamente desde el origen a la columnas de destino, sin que se aplique transformación alguna a los datos. 9. SERVICIOS DE TRANSFORMACIÓN DE DATOS (DTS) Se utilizaron DTS (Data Transformation Services) para llevar a cabo las siguientes tareas: Hacer una copia y filtro de los datos desde las bases de datos origen (BDSIA) hacia el Data Staging Area. Realizar todos los procesos de limpieza, estandarización y preparación de los datos. Efectuar la carga de los datos transformados en el Diagrama Estrella (SIA_STAR). Se diseñaron tres cargas para el Data Staging Area: Carga Inicial. Carga Periódica. Carga de Actualización. A continuación se explica de forma general las tareas que componen cada una de ellas CARGA INICIAL DE DATOS DIAGRAMA ESTRELLA ALUMNO Para realizar la carga de los datos históricos al Diagrama Estrella Alumno se construyeron diferentes paquetes, los cuales se unieron dentro del siguiente: Paquete: CARGA_INICIAL_DW_ALUMNO En este paquete se une todo el proceso de carga inicial de los datos al Diagrama Estrella Alumno. El proceso se resume en los siguientes pasos: E-58

261 Truncar las tablas que se utilizarán para la limpieza y transformación de los datos. Carga de los archivos de texto a las tablas iniciales del BDSIA. Carga de las tablas Tiempo y Tiempo1. Carga de Carrera_Facultad_t. Carga de las tablas Departamento_municipio_t, Pais_t, Estado_alumno, Categ_Ingreso y Estado_Familiar. Carga de las tablas Sexo, Calidad_educativa, Sector_institucion, Categ_institucion, Sistema, Institucion_p, Institucion_dim y Expediente_t. Carga de las tablas Alumno_td y Alumno_fact. Modificación del tipo de ingreso de los alumnos. Carga inicial de los datos del Data Staging Area al Diagrama Estrella Alumno. Figura E.9.1. Paquete: CARGA_INICIAL_DW_ALUMNO Este será el único paquete que debe ejecutarse para poder cargar los datos históricos al Diagrama Estrella Alumno. A continuación se dará una breve explicación de cada uno de los paquetes que son utilizados para esta carga. Paquete: CARGA_INICIAL_ARCHIVOS_DE_TEXTO_ALUMNO E-59

262 En este paquete se realiza el proceso de carga desde la bases de datos origen hacia el Staging Area, para tal efecto, se solicitó en archivos de texto, copias de las tablas necesarias para realizar los análisis propuestos. Cada archivo de texto representa una tabla, de estas solo se solicitan los campos utilizados para llevar a cabo los análisis, dichos campos deben están separados por el caracter de barra vertical ( ). (Para mayor detalle de las tablas y los campos requeridos VER ANEXO F) Las tablas que se cargan en este proceso son: Alumno, Institucion, Facultad, Semestre, Carrera, Expediente, Pais, Materia y Departamento_Municipio El paquete se observa de la siguiente forma: Figura E.9.2. Paquete: CARGA_INICIAL_ARCHIVOS_DE_TEXTO_ALUMNO Después de cargar los datos en las tablas iniciales, se procede a transformarlos para que estos lleguen limpios al Diagrama Estrella. Paquete: CARGA_INICIAL_TIEMPO E-60

263 En este paquete se realizan las tareas necesarias para preparar los datos que serán cargados en las dimensiones: DW_CICLO, DW_CICLO1 y DW_TIEMPO. La carga de las tablas de tiempo en el Data Staging Area, se hace a partir de una hoja de datos en Excel que contiene los siguientes campos: Año, ciclo, mes, nombre mes, día, fecha. Esta carga se hace en dos diferentes tablas: TIEMPO y TIEMPO1, cada una con un propósito diferente. Figura E.9.3. Paquete: CARGA_INICIAL_TIEMPO Paquete: CARGA_INICIAL_CARRERA_FACULTAD De acuerdo al modelo de datos de alumno se decidió tener en una sola dimensión las facultades y carreras con las que cuenta la universidad, para tal efecto se realizan las siguientes tareas: Cambiar los campos vacíos y nulos, atendiendo a la definición de estándares previamente definida. Creación de la tabla de parámetros Tipo_carrera. Unión de tablas carrera y facultad, en la tabla Ccarrera_facultad_t. Figura E.9.4. Paquete: CARGA_INICIAL_CARRERA_FACULTAD E-61

264 Paquete: CARGA_INICIAL_DEPTOYOTRAS En este paquete se llevan a cabo los trabajos para preparar los datos que serán cargados en las dimensiones: DW_DEPARTAMENTO_MUNICIPIO, DW_ESTADO_ALUMNO, DW_PAIS, DW_TIPO_INGRESO y DW_ESTADO_FAMILIAR. Para ello las tareas más importantes que se llevaron a cabo son las siguientes: Cambiar los campos vacíos y nulos, atendiendo a la definición de estándares previamente definida. Creación de la tabla de parámetros Departamento_t a partir de la tabla Departamento_municipio, ya que no se contaba con una separación que fuera útil para el diseño que se desea implementar. Carga de la tabla Departamento_municipio_t, la cual incluía los campos: id_departamento_municipio, id_departamento, departamento, municipio. Creación y carga de las tablas Estado_alumno, Categ_ingreso, Estado_familiar a partir de los rules ó tipos de datos definidos por los usuarios, existentes en BDSIA. Limpieza de los datos existentes en la tabla país para su posterior carga en la tabla Pais_t. Figura E.9.5. Paquete: CARGA_INICIAL_DEPTOYOTRAS E-62

265 Paquete: CARGA_INICIAL_INSTITUCION_Y_SEXO En este paquete se realizan las tareas necesarias para preparar los datos que serán cargados en las dimensiones: DW_INSTITUCION y DW_SEXO. Al mismo tiempo se limpiarán los datos de la tabla EXPEDIENTE. Para ello se efectúan los procesos siguientes: Carga de la tabla sexo a partir del tipo de dato sexo existente en el BSIA Carga de la tabla de parámetros Calidad_educativa, Sectir_institucion, Categ_institucion y Sistema. Se crea la tabla de equivalencia de institución para poder unificar las instituciones con un solo código, ya que en la BDSIA algunas instituciones poseen dos códigos. Limpieza y transformación de instituciones para luego ser cargados en Institución_dim. Se actualizan los campos vacíos y nulos en la tabla Expediente_t, atendiendo a la definición de estándares previamente definida. Figura E.9.6. Paquete: CARGA_INICIAL_INSTITUCION_Y_SEXO E-63

266 Paquete: CARGA_INICIAL_ALUMNO En este paquete se realizan las tareas necesarias para preparar los datos que serán cargados en las dimensiones: DW_ALUMNO y FACT_ALUMNO. Por tanto en este paquete se realizan los siguientes trabajos: Se actualizan los campos vacíos y nulos, atendiendo a la definición de estándares previamente definida. Llenar la tabla Alumno_td a partir de Alumno. Actualizar el número de teléfono a 8 dígitos, cuando sea necesario. Modificar el código de la institución donde estudió el alumno, de acuerdo con la tabla Institución_p. Llamar a procedimiento que reconstruye el rendimiento académico de cada uno de los estudiantes (cum_ciclo, cum_carrera, cum_general), para cada uno de los ciclos que ha cursado el alumno. Figura E.9.7. Paquete: CARGA_INICIAL_ALUMNO E-64

267 Paquete: MODIF_TIPO_INGRESO Se lleva a cabo la actualización del tipo de ingreso. Para tal efecto se agregó el tipo de ingreso: Ingreso Continuo (C), el cual no estaba contemplado en los registros que se proporcionaron, pero existe dentro de la dinámica con que trabaja la universidad. Posteriormente se actualizaron los ciclos cursados por los estudiantes en los que su tipo de ingreso es ingreso continuo. Finalmente se llama al procedimiento que para los alumnos de Reingreso calcula el ciclo en el que reingresa un alumno, ya que este dato no es almacenado en el BDSIA. Figura E.9.8. Paquete: MODIF_TIPO_INGRESO Paquete: CARGA_EQUIVALENCIAS En este paquete se llevan a cabo los trabajos para preparar los datos que utilizarán para el cálculo del cum. Para ello se cambiaron los campos vacíos y nulos de las tablas Equivalencia_externa_t, Equivalencia_global_t e Historia_equivalencia_t, atendiendo a la definición de estándares previamente definida. Figura E Paquete: CARGA_EQUIVALENCIAS E-65

268 Paquete: CARGA_INICIAL_SIA_STAR_ALUMNO Cuando ya se tienen los datos transformados, limpios, validados y estandarizados, se lleva a cabo la carga de cada una de las dimensiones del diagrama estrella y posteriormente de la tabla de hechos. En este paso solo es necesario copiar en la Base de Datos SIA_STAR, las tablas que representan las dimensiones o tabla de hechos en el Data Staging Area y que en los procesos anteriores fueron cargadas y transformadas. Las dimensiones que se cargan en la base de datos SIA_STAR son las siguientes: DW_DEPTO_MUNIC DW_CARRERA_FACULTAD DW_SEXO DW_ALUMNO DW_CICLO1 DW_ESTADO_FAMILIAR DW_ESTADO_ALUMNO DW_TIPO_INGRESO DW_PAIS DW_CICLO DW_TIEMPO DW_INSTITUCION Figura E Paquete: CARGA_INICIAL_SIA_STAR_ALUMNO E-66

269 DIAGRAMA ESTRELLA MATERIA Para realizar la carga de los datos históricos al Diagrama Estrella Materia se construyeron diferentes paquetes, los cuales se unieron dentro del siguiente: Paquete: CARGA_INICIAL_DW_MATERIA En este paquete se une todo el proceso de carga inicial de los datos al Diagrama Estrella Materia. El proceso se resume en los siguientes pasos: Truncar las tablas que se utilizarán para la limpieza y transformación de los datos. Carga de los archivos de texto a las tablas iniciales del BDSIA. Carga de las tablas Estado_materia, Tipo_materia y Matricula. Carga de las tablas Materia_departamento, Profesor_dim y Materia_Fact. Carga inicial de los datos al Diagrama Estrella Materia contenido en la base de datos SIA_STAR. Figura E Paquete: CARGA_INICIAL_DW_MATERIA Este será el único paquete que debe ejecutarse para poder cargar los datos históricos al Diagrama Estrella Materia. A continuación se dará una breve explicación de cada uno de los paquetes que son utilizados para esta carga. E-67

270 Paquete: CARGA_INICIAL_ARCHIVOS_DE_TEXTO_MATERIA Dentro de este paquete se cargan los datos provenientes de los archivos de texto a las tablas del Data Staging Area, en este caso, las tablas son: Profesor, Profesor_materia, Materia_seccion, Materia y Departamento El paquete se observa de la siguiente forma: Figura E Paquete: CARGA_INICIAL_ARCHIVOS_DE_TEXTO_MATERIA Después de cargar los datos en las tablas iniciales, se procede a transformarlos para que estos lleguen limpios al Diagrama Estrella. Paquete: CARGA_INICIAL_ESTADO_TIPO_MATRICULA A partir de los registros contenidos en la tabla Expediente, se limpian y transforman los datos para ser cargados en las dimensiones: DW_ESTADO_MATERIA, DW_TIPO_MATERIA y DW_MATRICULA Para ello se cambiaron los campos vacíos y nulos, atendiendo a la definición de estándares. Figura E Paquete: CARGA_INICIAL_ESTADO_TIPO_MATRICULA E-68

271 Paquete: CARGA_INICIAL_FACT_MATERIA En este paquete se preparan los datos que se cargarán en las dimensiones: DW_MATERIA_DEPARTAMENTO y DW_PROFESOR. Al mismo tiempo, se preparan los datos de Materia_fact, equivalente a la tabla de hechos del Diagrama Estrella Materia El proceso que se siguió dentro de este paquete fue el siguiente: Se cargaron los datos de la tabla Departamento en Departamento1_t, donde fueron limpiados los datos vacíos y nulos. Se cargaron los datos de la tabla Materia en Materia_t, donde se limpiaron los datos vacíos y nulos. Se unieron las tablas Departamento1_t y Materia_t en la tabla Materia_Departamento. Se cargaron los datos de la tabla Profesor en Profesor_t, donde fueron limpiados los datos vacíos y nulos, se unió el nombre completo del profesor dentro del campo nombre y, se cargaron los datos en la tabla Profesor_dim. Se cargaron los datos de la tabla de hechos Materia_fact, a partir de los datos contenidos en la tabla Expediente y uniendo estos con las tablas de dimensiones creadas anteriormente. Figura E Paquete: CARGA_INICIAL_FACT_MATERIA E-69

272 Paquete: CARGA_INICIAL_SIA_STAR_MATERIA Teniendo los datos transformados, limpios, validados y estandarizados, se lleva a cabo la carga de cada una de las dimensiones del diagrama estrella y posteriormente de la tabla de hechos. En este paso solo es necesario copiar en la Base de Datos SIA_STAR, las tablas que representan las dimensiones o tabla de hechos en el Data Staging Area y que en los procesos anteriores fueron cargadas y transformadas. Son cargadas las tablas siguientes en la base de datos SIA_STAR: DW_ESTADO_MATERIA DW_TIPO_MATERIA DW_MATRICULA DW_MATERIA_DEPARTAMENTO DW_PROFESOR DW_SECCION Figura E Paquete: CARGA_INICIAL_SIA_STAR_MATERIA E-70

273 9.2. CARGA PERIÓDICA DE DATOS Este proceso puede realizarse al iniciar o al finalizar el ciclo para poder cargar nuevos registros dentro del diagrama estrella. Como ejemplo, se hizo esta carga, solamente para el Diagrama Estrella Alumno. Paquete: CARGA_PERIODICA_CUBALUMNO Dentro de este paquete se siguen los siguientes pasos: Carga de nuevas fechas de nacimiento y nuevo ciclo dentro de las tablas de tiempo. Carga de nuevas instituciones. Carga de nuevas carreras. Carga de nuevos municipios o departamentos que no fueron considerados con anterioridad. Carga de nuevos registros de alumnos. Carga del expediente de los nuevos alumnos registrados en el ciclo. Carga de nuevos registros en el Diagrama Estrella. Figura E Paquete: CARGA_PERIODICA_CUBALUMNO E-71

274 A continuación se dará una breve explicación de cada uno de los paquetes que son utilizados para esta carga. Paquete: CARGA_PERIODICA_TIEMPO En este paquete se registra el nuevo ciclo de carga y las fechas de nacimiento de los nuevos registros de alumnos que no habían sido consideradas con anterioridad en la tabla de Tiempo. Figura E Paquete: CARGA_PERIODICA_TIEMPO Paquete: CARGA_PERIODICA_INSTITUCION A través de este proceso se cargan los nuevos registros de Calidad_educativa, Sistema y Categ_institucion. Luego de esto, se cargan los datos de las instituciones no existentes aún dentro del Data Warehouse, se limpian los campos vacíos y nulos, se actualiza la tabla de equivalencias Institucion_p y se cargan los datos limpios dentro de la tabla Institucion_dim. Figura E Paquete: CARGA_PERIODICA_INSTITUCION E-72

275 Paquete: CARGA_PERIODICA_CARRERA Son cargados en este proceso, los registros de carreras o facultades no existentes aún dentro del Data Warehouse. Al igual que la carga inicial, se limpian los valores nulos y vacíos. Figura E Paquete: CARGA_PERIODICA_CARRERA Paquete: CARGA_PERIODICA_DEPTO_MUNIP En este proceso son cargados países o municipios que no habían sido cargados con anterioridad. Figura E Paquete: CARGA_PERIODICA_DEPTO_MUNIP Paquete: CARGA_PERIODICA_ALUMNO Los datos personales de los nuevos registros de alumnos son cargados, al igual que su estado de alumno, estado familiar, categoría de ingreso y sexo si aún no existen dentro del E-73

276 Data Warehouse. Seguidamente es cargado el nuevo semestre y se calcula el cum de ciclo, cum general y cum de carrera para cada alumno en el ciclo de carga. Figura E Paquete: CARGA_PERIODICA_ALUMNO Paquete: VERIFICAR_REINGRESO Se actualiza el tipo de ingreso de los alumnos, de tal forma que se registre el tipo de ingreso con el cual estuvo el alumno dentro el ciclo de carga. Figura E Paquete: VERIFICAR_REINGRESO Paquete: CARGA_PERIODICA_SIA_STAR Cuando ya se tienen limpios y transformados los datos, son cargados dentro del Diagrama Estrella contenido en la base de datos SIA_STAR. Solamente se cargan los nuevos registros no existentes aún dentro del Data Warehouse. E-74

277 Figura E Paquete: CARGA_PERIODICA_SIA_STAR 9.3. CARGA DE ACTUALIZACIÓN DE DATOS El proceso de actualización de datos puede realizarse en cualquier momento que necesite hacerse una actualización. Como ejemplo, se hizo esta carga, solamente para el Diagrama Estrella Alumno. Paquete: ACTUALIZACION_ALUMNO Para poder realizar la actualización de datos se necesita especificar el o los ciclos que se desea actualizar dentro del archivo CICLO_ACTUALIZACION.xls contenido dentro de la siguiente ruta: c:\origen\. El paquete de actualización recalcula el cum de ciclo, cum de carrera y cum general de los alumnos que estuvieron estudiando en la Universidad en los ciclos especificados dentro del archivo de Excel. Este proceso se realiza dentro del Data Staging Area, luego, cuando ya se tienen listos los datos, estos se actualizan dentro de la base de datos SIA_STAR. E-75

278 Figura E Paquete: ACTUALIZACION_ALUMNO 10. CREACIÓN DE CUBOS CUBO ALUMNO Con los datos almacenados en el diagrama estrella de ALUMNO, se procedió a elaborar la base de datos OLAP (RA_OLAP), en la cual, se creó el cubo correspondiente a dicho modelo. Antes de elaborar el cubo, se procedió con la creación de las dimensiones OLAP, que están basadas en las tablas de dimensión del diagrama estrella: DIM_ALUMNO Descripción: Dimensión en la que se almacenan los datos generales de un alumno. Tabla Fuente: DW_ALUMNO. E-76

279 Tabla E Dimensión DIM_ALUMNO Niveles I_A Apellidos Carnet Columnas Fuente DW_ALUMNO.i_a DW_ALUMNO.apellidos DW_ALUMNO.carnet DIM_CALIDAD_INSTITUCION Descripción: Dimensión en la que se almacena la información sobre la calidad educativa de la institución. Tablas Fuente: DW_INSTITUCION, CALIDAD_EDUCATIVA. Tabla E Dimensión DIM_CALIDAD_INSTITUCION Niveles Columnas Fuente Id Calidad Educativa CALIDAD_EDUCATIVA.id_calidad_educativa Id Institucion DW_INSTITUCION.id_institucion DIM_CARRERA_FACULTAD Descripción: Dimensión en la que se presentan las diferentes carreras y las facultades a las que estas pertenecen. Tabla Fuente: DW_CARRERA_FACULTAD. Tabla E Dimensión DIM_CARRERA_FACULTAD Niveles Columnas Fuente Cod Facultad DW_CARRERA_FACULTAD.cod_facultad Id Carrera DW_CARRERA_FACULTAD.id_carrera DIM_CATEG_INSTITUCION Descripción: Dimensión que almacena las categorías de las diferentes instituciones. Tablas Fuente: DW_INSTITUCION, CATEG_INSTITUCION. E-77

280 Tabla E Dimensión DIM_CATEG_INSTITUCION Niveles Columnas Fuente Id Categ Institucion CATEG_INSTITUCION.id_categ_institucion Id Institucion DW_INSTITUCION.id_institucion DIM_CICLO_INGRESO Descripción: Dimensión que presenta los diferentes ciclos de ingreso. Tabla Fuente: DW_CICLO1. Tabla E Dimensión DIM_CICLO_INGRESO Niveles Anio Ciclo Id Ciclo Columnas Fuente DW_CICLO1.anio DW_CICLO1.ciclo DW_CICLO1.id_ciclo DIM_CICLO_ULTIMO_INGRESO Descripción: Dimensión que presenta los diferentes ciclos que los alumnos han cursado dentro de la universidad. Tabla Fuente: DW_CICLO. Tabla E Dimensión DIM_CICLO_ULTIMO_INGRESO Niveles Columnas Fuente Anio DW_CICLO.anio Ciclo DW_CICLO.ciclo Id Ciclo DW_CICLO.id_ciclo DIM_DEPTO_MUNIC Descripción: Dimensión que presenta los departamentos del país junto con sus respectivos municipios. E-78

281 Tabla Fuente: DW_DEPTO_MUNIC. Tabla E Dimensión DIM_DEPTO_MUNIC Niveles Departamento Id Depto Munic Columnas Fuente DW_DEPTO_MUNIC.departamento DW_DEPTO_MUNIC.cod_depto_munic DIM_ESTADO_ALUMNO Descripción: Dimensión que almacena el estado del alumno. Tabla Fuente: DW_ESTADO_ALUMNO. Tabla E Dimensión DIM_ESTADO_ALUMNO Niveles Columnas Fuente Id Estado Alumno DW_ESTADO_ALUMNO.id_estado_alumno DIM_ESTADO_FAMILIAR Descripción: Dimensión que almacena el estado familiar. Tabla Fuente: DW_ESTADO_FAMILIAR. Tabla E Dimensión DIM_ESTADO_FAMILIAR Niveles Columnas Fuente Id Estado Familiar DW_ESTADO_FAMILIAR.id_estado_familiar DIM_INSTITUCION Descripción: Dimensión que almacena las instituciones. Tabla Fuente: DW_INSTITUCION. E-79

282 Tabla E Dimensión DIM_INSTITUCION Id Institucion Niveles Columnas Fuente DW_INSTITUCION.id_institucion DIM_PAIS Descripción: Dimensión que almacena los países. Tabla Fuente: DW_PAIS. Tabla E Dimensión DIM_PAIS Id Pais Niveles DW_PAIS.id_pais Columnas Fuente DIM_SECTOR_INSTITUCION Descripción: Dimensión que almacena las instituciones agrupadas por su sector. Tablas Fuente: DW_INSTITUCION, SECTOR_INSTITUCION. Tabla E Dimensión DIM_SECTOR_INSTITUCION Niveles Columnas Fuente Id Sector Institucion SECTOR_INSTITUCION.id_sector_institucion Id Institucion DW_INSTITUCION.id_institucion DIM_SEXO Descripción: Dimensión que almacena el sexo. Tabla Fuente: DW_SEXO. Tabla E Dimensión DIM_SEXO Id Sexo Niveles DW_SEXO.id_sexo Columnas Fuente E-80

283 DIM_SISTEMA Descripción: Dimensión que almacena las instituciones agrupadas por su sistema. Tablas Fuente: DW_INSTITUCION, SISTEMA. Tabla E Dimensión DIM_SISTEMA Niveles Columnas Fuente Id Sistema SISTEMA.id_sistema Id Institucion DW_INSTITUCION.id_institucion DIM_TIEMPO Descripción: Dimensión que almacena las fechas. Tabla Fuente: DW_TIEMPO. Tabla E Dimensión DIM_TIEMPO Niveles Year Month Day Columnas Fuente DatePart(year,DW_TIEMPO.fecha) DatePart(month,DW_TIEMPO.fecha) convert(char,dw_tiempo.fecha, 112) DIM_TIPO_CARRERA Descripción: Dimensión que almacena el tipo de carrera. Tablas Fuente: DW_CARRERA_FACULTAD, TIPO_CARRERA. Tabla E Dimensión DIM_TIPO_CARRERA Niveles Id Tipo Carrera Id Carrera Columnas Fuente TIPO_CARRERA.id_tipo_carrera DW_CARRERA_FACULTAD.id_carrera E-81

284 DIM_TIPO_INGRESO Descripción: Dimensión que presenta el tipo de ingreso de un alumno. Tabla Fuente: DW_TIPO_INGRESO. Tabla E Dimensión DIM_TIPO_INGRESO Niveles Id Tipo Ingreso Columnas Fuente DW_TIPO_INGRESO.id_tipo_ingreso A partir del diagrama estrella ALUMNO, se procedió a crear el cubo con el mismo nombre, tomando como base la tabla de hechos FACT_ALUMNO y como métricas: cantidad, cum_general, cum_carrera y cum_ciclo, que son campos de la misma tabla. Miembros calculados Para poder realizar los diferentes análisis con la información almacenada en el cubo, se necesitan conocer los promedios de CUM general, de carrera y de ciclo de los alumnos. Con ese fin, se crearon miembros calculados para estas métricas, dividiendo cada una de ellas entre la métrica cantidad. E-82

285 Figura E Miembro calculado: CUMGRAL_PROMEDIO Luego de la creación de estos miembros, se procesó el cubo para verificar que no existiera ningún error. En la siguiente figura se observa la estructura del cubo dentro del Análisis Services. E-83

286 Figura E Cubo ALUMNO Figura E Cubo ALUMNO E-84

287 10.2. CUBO MATERIA Con los datos almacenados en el diagrama estrella de MATERIA, se procedió a crear el cubo correspondiente a dicho modelo. Antes de elaborar el cubo, se procedió con la creación de las dimensiones OLAP, que están basadas en las tablas de dimensión del diagrama estrella: DIM_SECCION Descripción: Dimensión que almacena las secciones que se imparten en una materia. Tabla Fuente: DW_SECCION Tabla E Dimensión DIM_SECCION Id_Seccion Niveles Columnas Fuente DW_SECCION.id_seccion DIM_ESTADO_MATERIA Descripción: Dimensión que guarda los estados que tiene un alumno en una materia. Tabla Fuente: DW_ESTADO_MATERIA Tabla E Dimensión DIM_ESTADO_MATERIA Niveles Columnas Fuente Id_estado_materia DW_ESTADO_MATERIA.id_estado_materia DIM_MATRICULA Descripción: Dimensión que contiene las matrículas. Tabla Fuente: DW_MATRICULA E-85

288 Tabla E Dimensión DIM_MATRICULA Id_matricula Niveles Columnas Fuente DW_MATRICULA.id_matricula DIM_TIPO_MATERIA Descripción: Dimensión que almacena los tipos de materia Tabla Fuente: DW_TIPO_MATERIA Tabla E Dimensión DIM_TIPO_MATERIA Id_tipo_materia Niveles Columnas Fuente DW_TIPO_MATERIA.tipo_materia DIM_PROFESOR Descripción: Dimensión que contiene los profesores. Tabla Fuente: DW_PROFESOR Tabla E Dimensión DIM_PROFESOR Id_profesor Niveles Columnas Fuente DW_PROFESOR.profesor DIM_MATERIA_DEPARTAMENTO Descripción: Dimensión que almacena todas las materias y los departamentos por los que son impartidas. Tabla Fuente: DW_MATERIA_DEPARTAMENTO Tabla E Dimensión DIM_MATERIA_DEPARTAMENTO Niveles Columnas Fuente Cod_departamento DW_MATERIA_DEPARTAMENTO.cod_departamento E-86

289 Id_materia DW_MATERIA_DEPARTAMENTO.id_materia Se utilizaron también las siguientes dimensiones, creadas para el cubo ALUMNO: DIM_ALUMNO, DIM_CARRERA_FACULTAD, DIM_CICLO_ULTIMO_INGRESO A partir del diagrama estrella MATERIA, se procedió a crear el cubo con el mismo nombre, tomando como base la tabla de hechos FACT_MATERIA y como métricas: cantidad y nota_promedio. Miembros calculados Para poder realizar los diferentes análisis con la información almacenada en el cubo, se necesita conocer la nota promedio, por lo tanto, se creó un miembro calculados para esta métrica, dividiendo la nota entre la métrica cantidad. Figura Miembro calculado: NOTA_PROMEDIO Luego de crear este miembro, se procesó el cubo para verificar que no existiera ningún error. En la siguiente figura se observa la estructura del cubo dentro del Análisis Services. E-87

CAPÍTULO 2 DATA WAREHOUSES

CAPÍTULO 2 DATA WAREHOUSES CAPÍTULO 2 DATA WAREHOUSES Un Data Warehouse (DW) es un gran repositorio lógico de datos que permite el acceso y la manipulación flexible de grandes volúmenes de información provenientes tanto de transacciones

Más detalles

SISTEMAS DE INFORMACION GERENCIAL LIC.PATRICIA PALACIOS ZULETA

SISTEMAS DE INFORMACION GERENCIAL LIC.PATRICIA PALACIOS ZULETA SISTEMAS DE INFORMACION GERENCIAL LIC.PATRICIA PALACIOS ZULETA Qué es inteligencia de negocios? (BI) Business Intelligence es la habilidad para transformar los datos en información, y la información en

Más detalles

TECNOLÓGICAS EMPRESAS

TECNOLÓGICAS EMPRESAS SOLUCIONES TECNOLÓGICAS INTEGRALES PARA LAS EMPRESAS Por: Ivonne Rodríguez CONTENIDO 1. Problemas actuales en las empresas 2. Bussines Intelligence 3. Capa: Data Warehouse 4. Capa: BI en el campo empresarial

Más detalles

DESARROLLO E IMPLANTANCIÓN DE UN SISTEMA ACADEMICO PARA EL ICM

DESARROLLO E IMPLANTANCIÓN DE UN SISTEMA ACADEMICO PARA EL ICM DESARROLLO E IMPLANTANCIÓN DE UN SISTEMA ACADEMICO PARA EL ICM Sergio Bauz Olvera 1, Washington Jama 2 1 Ingeniero en Estadística e Informática 2003 2 Director de Tesis de Grado, Ing. Washington Jama.

Más detalles

ANEXO A - Plan de Proyecto. 1. - EDT de la solución EDT GENERAL DEL PROYECTO1

ANEXO A - Plan de Proyecto. 1. - EDT de la solución EDT GENERAL DEL PROYECTO1 ANEXO A - Plan de Proyecto 1. - EDT de la solución EDT GENERAL DEL PROYECTO1 2.- Diagrama de Gantt de la Solución DIAGRAMA DE GANTT- FASE INICIAL DOCUMENTACION Y ANALISIS2 DIAGRAMA DE GANTT- FASE FINAL

Más detalles

Construcción de cubos OLAP utilizando Business Intelligence Development Studio

Construcción de cubos OLAP utilizando Business Intelligence Development Studio Universidad Católica de Santa María Facultad de Ciencias e Ingenierías Físicas y Formales Informe de Trabajo Construcción de cubos OLAP utilizando Business Intelligence Development Studio Alumnos: Solange

Más detalles

Inteligencia de Negocios Introducción. Por Elizabeth León Guzmán, Ph.D. Profesora Ingeniería de Sistemas Grupo de Investigación MIDAS

Inteligencia de Negocios Introducción. Por Elizabeth León Guzmán, Ph.D. Profesora Ingeniería de Sistemas Grupo de Investigación MIDAS Inteligencia de Negocios Introducción Por Elizabeth León Guzmán, Ph.D. Profesora Ingeniería de Sistemas Grupo de Investigación MIDAS Agenda 1.Introducción 2.Definición 3.ETL 4.Bodega de Datos 5.Data Mart

Más detalles

Licencia GNU FDL. Detalle del cambio. Ing. Bernabeu Ricardo Dario, Ing. García Mattío Mariano Alberto. Versión incial. 05/11/2009

Licencia GNU FDL. Detalle del cambio. Ing. Bernabeu Ricardo Dario, Ing. García Mattío Mariano Alberto. Versión incial. 05/11/2009 Licencia GNU FDL Copyright 2009 Ing. Bernabeu Ricardo Dario, Ing. García Mattío Mariano Alberto. Se otorga permiso para copiar, distribuir y/o modificar este documento bajo los términos de la Licencia

Más detalles

VICERRECTORÍA ACADÉMICA LICENCIATURA EN MERCADOTECNIA

VICERRECTORÍA ACADÉMICA LICENCIATURA EN MERCADOTECNIA VICERRECTORÍA ACADÉMICA LICENCIATURA EN MERCADOTECNIA TEMA: LA COMUNICACIÓN INTEGRAL COMO UNA HERRAMIENTA EFECTIVA EN EL FORTALECIMIENTO DE LA ATRACCIÓN DEL TURISMO INTERNO EN LAS RUTAS TURÍSTICAS DE EL

Más detalles

Cátedra: BI Business Intelligence. Asignatura BI Business Intelligence Ciclo Lectivo 2012 Vigencia del Ciclo lectivo 2012.

Cátedra: BI Business Intelligence. Asignatura BI Business Intelligence Ciclo Lectivo 2012 Vigencia del Ciclo lectivo 2012. Asignatura BI Business Intelligence Ciclo Lectivo 2012 Vigencia del Ciclo lectivo 2012 programa Plan 2008 Área Complementaria Carga horaria semanal Anual/ cuatrimestral Coordinador de Cátedra Objetivos

Más detalles

CREACIÓN DE PROYECTOS DE BUSINESS INTELLIGENCE CON SQL SERVER. 40 horas 60 días

CREACIÓN DE PROYECTOS DE BUSINESS INTELLIGENCE CON SQL SERVER. 40 horas 60 días CREACIÓN DE PROYECTOS DE BUSINESS INTELLIGENCE CON SQL SERVER DURACIÓN DÍAS DE CONEXIÓN 40 horas 60 días CONTACTO: formacion@fgulem.es El Campus Virtual ha sido concebido con una metodología dinámica e

Más detalles

BUSINESS INTELLIGENCE. www.sbi-technology.com

BUSINESS INTELLIGENCE. www.sbi-technology.com BUSINESS INTELLIGENCE www.sbi-technology.com SBI Technology SRL Maipú 1492 Piso 2 S2000CGT - Rosario Rep. Argentina Tel: (54 341) 530 0815 www.sbi-technology.com Copyright - SBI Technology SRL - Todos

Más detalles

BUSINESS INTELLIGENCE

BUSINESS INTELLIGENCE BUSINESS INTELLIGENCE PRESENTACIÓN Ramón Díaz Hernández Gerente (1.990) Nuestro Perfil Inversión permanente en formación y nuevas tecnologías. Experiencia en plataforma tecnológica IBM (Sistema Operativo

Más detalles

Programa Internacional Business Intelligence

Programa Internacional Business Intelligence Fecha de inicio: 18 de junio de 2012 Programa Internacional Business Intelligence En un ambiente globalizado y de alta competitividad entre las empresas, la adecuada administración del capital intelectual

Más detalles

Sistemas de Información para la Gestión. UNIDAD 2: RECURSOS DE TI Información y Aplicaciones

Sistemas de Información para la Gestión. UNIDAD 2: RECURSOS DE TI Información y Aplicaciones UNIDAD 2: RECURSOS DE TI Información y Aplicaciones UNIDAD 2: RECURSOS DE TI Información y Aplicaciones 1. La Información: Propiedades de la Información. Sistemas de Información. Bases de Datos. 2. Administración

Más detalles

SQL Server Business Intelligence parte 1

SQL Server Business Intelligence parte 1 SQL Server Business Intelligence parte 1 Business Intelligence es una de las tecnologías de base de datos más llamativas de los últimos años y un campo donde Microsoft ha formado su camino a través de

Más detalles

INTELIGENCIA DE NEGOCIOS CON SQL SERVER 2008 R2

INTELIGENCIA DE NEGOCIOS CON SQL SERVER 2008 R2 Programa de Capacitación y Certificación. INTELIGENCIA DE NEGOCIOS CON SQL SERVER 2008 R2 Contenido PERFIL DE UN ESPECIALISTA EN BASES DE DATOS.... 3 6231. MANTENIENDO UNA BASE DE DATOS DE SQL SERVER 2008

Más detalles

Definición. Data Warehousing: almacenamiento, transformación y distribución de datos útiles para los responsables de tomar decisiones 9/29/2006 4

Definición. Data Warehousing: almacenamiento, transformación y distribución de datos útiles para los responsables de tomar decisiones 9/29/2006 4 Definición Data Warehousing: almacenamiento, transformación y distribución de datos útiles para los responsables de tomar decisiones 9/29/2006 4 Definición (cont.) Un Data Warehouse es una colección de

Más detalles

IMPLEMENTACIÓN DE UN DATA MART PARA UN SERVICIO DE DOSIMETRÍA EXTERNA.

IMPLEMENTACIÓN DE UN DATA MART PARA UN SERVICIO DE DOSIMETRÍA EXTERNA. X Congreso Regional Latinoamericano IRPA de Protección y Seguridad Radiológica Radioprotección: Nuevos Desafíos para un Mundo en Evolución Buenos Aires, 12 al 17 de abril, 2015 SOCIEDAD ARGENTINA DE RADIOPROTECCIÓN

Más detalles

Cuadro de mando para el análisis de la información de Extranjería del Ministerio de Administraciones Públicas

Cuadro de mando para el análisis de la información de Extranjería del Ministerio de Administraciones Públicas Cuadro de mando para el análisis de la información de Extranjería del Ministerio de Administraciones Públicas José Antonio Peláez Ruiz Ministerio de Administraciones Públicas Alfonso Martín Murillo BG&S

Más detalles

Instituto Educación Superior Tecnológico Privado El Buen Pastor

Instituto Educación Superior Tecnológico Privado El Buen Pastor Instituto Educación Superior Tecnológico Privado El Buen Pastor SILABO DE ADMINISTRACIÓN DE BASE DE DATOS CARRERA PROFESIONAL: COMPUTACIÓN E INFORMÁTICA I. DATOS GENERALES: 1.1. CARRERA PROFESIONAL : COMPUTACIÓN

Más detalles

SISTEMA DE INFORMACION DE GESTION DE TARJETAS DE CREDITO USANDO DATA MART E INTELIGENCIA DE NEGOCIOS PARA EL AREA COMERCIAL DEL BANCO RIPLEY PERU

SISTEMA DE INFORMACION DE GESTION DE TARJETAS DE CREDITO USANDO DATA MART E INTELIGENCIA DE NEGOCIOS PARA EL AREA COMERCIAL DEL BANCO RIPLEY PERU SISTEMA DE INFORMACION DE GESTION DE TARJETAS DE CREDITO USANDO DATA MART E INTELIGENCIA DE NEGOCIOS PARA EL AREA COMERCIAL DEL BANCO RIPLEY PERU AGENDA INTRODUCCION PLANTEAMIENTO METODOLOGICO ANTECEDENTES

Más detalles

DISEÑO DE UN SITIO WEB PARA EL CONTROL ACADÉMICO EN INSTITUCIONES PÚBLICAS DE EDUCACIÓN PARVULARIA DEL MUNICIPIO DE SAN SALVADOR

DISEÑO DE UN SITIO WEB PARA EL CONTROL ACADÉMICO EN INSTITUCIONES PÚBLICAS DE EDUCACIÓN PARVULARIA DEL MUNICIPIO DE SAN SALVADOR UNIVERSIDAD FRANCISCO GAVIDIA FACULTAD DE CIENCIAS ECONÓMICAS ESCUELA DE CIENCIAS EMPRESARIALES Tecnología, Humanismo y Calidad TRABAJO DE GRADUACIÓN DISEÑO DE UN SITIO WEB PARA EL CONTROL ACADÉMICO EN

Más detalles

www.itconsulting.com.bo B. Las palmas C./ San Miguel#420 Telf. Of.: 591-3-3210356 Cel.76364838 Santa Cruz - Bolivia

www.itconsulting.com.bo B. Las palmas C./ San Miguel#420 Telf. Of.: 591-3-3210356 Cel.76364838 Santa Cruz - Bolivia Señor(a): CLIENTE Presente.- Santa Cruz, 14 Noviembre del 2012 REF.: COTIZACION ESPECIALISTA EN ANALISIS DE DATOS & INTELIGENCIA DE NEGOCIOS EN EXCEL 2007-2010 Distinguido Señores: Consultores en Tecnologías

Más detalles

DATA WAREHOUSE DATA WAREHOUSE

DATA WAREHOUSE DATA WAREHOUSE DATA WAREHOUSE DATA WAREHOUSE Autor: Roberto Abajo Alonso Asignatura: Sistemas Inteligentes, 5º Curso Profesor: José Carlos González Dep. Ing. Sistemas Telemáticos, E.T.S.I. Telecomunicación Universidad

Más detalles

CONSTRUCCION DE INDICADORES DE GESTION Y HERRAMIENTAS OLAP PARA PEQUEÑAS Y MEDIANAS EMPRESAS

CONSTRUCCION DE INDICADORES DE GESTION Y HERRAMIENTAS OLAP PARA PEQUEÑAS Y MEDIANAS EMPRESAS CONSTRUCCION DE INDICADORES DE GESTION Y HERRAMIENTAS OLAP PARA PEQUEÑAS Y MEDIANAS EMPRESAS 1. RESEÑA HISTORICA Las exigencias competitivas del mercado hacen que las organizaciones busquen mecanismos

Más detalles

Botón menú Objetivo de la Minería de datos.

Botón menú Objetivo de la Minería de datos. Titulo de Tutorial: Minería de Datos N2 Botón menú: Introducción. Las instituciones y empresas privadas coleccionan bastante información (ventas, clientes, cobros, pacientes, tratamientos, estudiantes,

Más detalles

DATAMART PASO A PASO WWW.RUEDATECNOLOGICA.COM

DATAMART PASO A PASO WWW.RUEDATECNOLOGICA.COM DATAMART PASO A PASO WWW.RUEDATECNOLOGICA.COM Historial de revisiones Versión Fecha Autor: Descripción del cambio 1.0 31/08/2007 Rayner Huamantumba. Manual para diseño y desarrollo de Datamart INDICE 1-

Más detalles

UNIVERSIDAD DE ORIENTE FACULTAD DE CIENCIAS ECONÓMICAS TEMA:

UNIVERSIDAD DE ORIENTE FACULTAD DE CIENCIAS ECONÓMICAS TEMA: UNIVERSIDAD DE ORIENTE FACULTAD DE CIENCIAS ECONÓMICAS TEMA: ESTUDIO DE FACTIBILIDAD PARA LA IMPLEMENTACIÓN DE UN CRM (CUSTOMER RELATIONSHIP MANAGEMENT), QUE PROPICIE EL MEJORAMIENTO DE LA ADMINISTRACIÓN

Más detalles

FUNDAMENTOS DE DATA WAREHOUSE

FUNDAMENTOS DE DATA WAREHOUSE FUNDAMENTOS DE DATA WAREHOUSE 1. Qué es Data Warehouse? El Data Warehouse es una tecnología para el manejo de la información construido sobre la base de optimizar el uso y análisis de la misma utilizado

Más detalles

Data Warehousing - Marco Conceptual

Data Warehousing - Marco Conceptual Data Warehousing - Marco Conceptual Carlos Espinoza C.* Introducción Los data warehouses se presentan como herramientas de alta tecnología que permiten a los usuarios de negocios entender las relaciones

Más detalles

ARQUITECTURA DE UNA BODEGA DE DATOS

ARQUITECTURA DE UNA BODEGA DE DATOS ARQUITECTURA DE UNA BODEGA DE DATOS Estructura de contenidos INTRODUCCIÓN... 3 1. ARQUITECTURA DE UNA BODEGA DE DATOS... 3 1.1 PROPIEDADES... 3 1.2 ARQUITECTURA DE UNA CAPA... 4 1.3 ARQUITECTURA DE DOS

Más detalles

Inteligencia de negocios desde la perspectiva cubana: factores críticos de éxito.

Inteligencia de negocios desde la perspectiva cubana: factores críticos de éxito. Tomado de: La inteligencia de negocios desde la perspectiva cubana: retos y tendencias. Informe publicado en TodoBI. Autora: MSc. Ivette Marrero Antunez Consultora de inteligencia empresarial. E-mail:

Más detalles

Programa de Actualización Profesional en. Business Intelligence

Programa de Actualización Profesional en. Business Intelligence Programa de Actualización Profesional en Business Intelligence INTRODUCCION El tratamiento de la información transaccional generada en el día a día de las empresas, para evaluar la situación de negocio

Más detalles

UNIVERSIDAD DE SANTIAGO DE CHILE INGENIERIA COMERCIAL APLICACIÓN COMPUTACIONAL I INTELIGENCIA DE NEGOCIOS

UNIVERSIDAD DE SANTIAGO DE CHILE INGENIERIA COMERCIAL APLICACIÓN COMPUTACIONAL I INTELIGENCIA DE NEGOCIOS UNIVERSIDAD DE SANTIAGO DE CHILE INGENIERIA COMERCIAL APLICACIÓN COMPUTACIONAL I INTELIGENCIA DE NEGOCIOS Integrante: Profesor: Maximiliano Heise Luis Ríos Fecha de entrega: miércoles 18 de abril de 2012

Más detalles

Diplomado Business Management

Diplomado Business Management Diplomado Business Management Duración 112 horas Objetivo general: Business Management es un programa innovador que permite que el alto directivo de reciente nombramiento en el puesto (con poco tiempo

Más detalles

PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR FACULTAD DE INGENIERÍA ESCUELA DE SISTEMAS DISERTACIÓN DE TESIS PREVIO A LA OBTENCIÓN DEL TÍTULO DE

PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR FACULTAD DE INGENIERÍA ESCUELA DE SISTEMAS DISERTACIÓN DE TESIS PREVIO A LA OBTENCIÓN DEL TÍTULO DE PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR FACULTAD DE INGENIERÍA ESCUELA DE SISTEMAS DISERTACIÓN DE TESIS PREVIO A LA OBTENCIÓN DEL TÍTULO DE INGENIERO EN SISTEMAS GUÍA PARA IMPLEMENTAR UNA SOLUCION

Más detalles

Resumen General del Manual de Organización y Funciones

Resumen General del Manual de Organización y Funciones Gerencia de Tecnologías de Información Resumen General del Manual de Organización y Funciones (El Manual de Organización y Funciones fue aprobado por Resolución Administrativa SBS N 354-2011, del 17 de

Más detalles

Sistemas de Información 12/13 La organización de datos e información

Sistemas de Información 12/13 La organización de datos e información 12/13 La organización de datos e información Departamento Informática e Ingeniería de Sistemas Universidad de Zaragoza (raqueltl@unizar.es) " Guión Introducción: Data Warehouses Características: entornos

Más detalles

APOYO PARA LA TOMA DE DECISIONES

APOYO PARA LA TOMA DE DECISIONES APOYO PARA LA TOMA DE DECISIONES Cátedra: Gestión de Datos Profesor: Santiago Pérez Año: 2006 Bibliografía: Introducción a las Bases de Datos. DATE - 1 - 1. INTRODUCCION APOYO PARA LA TOMA DE DECISIONES

Más detalles

UNIVERSIDAD ALBERT EINSTEIN FACULTAD DE INGENIERIA

UNIVERSIDAD ALBERT EINSTEIN FACULTAD DE INGENIERIA UNIVERSIDAD ALBERT EINSTEIN FACULTAD DE INGENIERIA Estudio de las herramientas TOAD y DBArtisan para la administración e integración de bases de datos relacionales. PREVIA OPCION AL TÍTULO DE: INGENIERO

Más detalles

Informática II Ing. Industrial. Data Warehouse. Data Mining

Informática II Ing. Industrial. Data Warehouse. Data Mining Data Warehouse Data Mining Definición de un Data Warehouses (DW) Fueron creados para dar apoyo a los niveles medios y altos de una empresa en la toma de decisiones a nivel estratégico en un corto o mediano

Más detalles

RECURSOS DE TI Aplicaciones - Bibliografía FUNDAMENTOS DE LA INTELIGENCIA DE NEGOCIOS

RECURSOS DE TI Aplicaciones - Bibliografía FUNDAMENTOS DE LA INTELIGENCIA DE NEGOCIOS Sistemas de Información para la Gestión UNIDAD 3: RECURSOS DE TECNOLOGÍA DE INFORMACIÓN Aplicaciones UNIDAD 2: RECURSOS DE TI Aplicaciones 1. Administración de bases de datos e información: Sistemas de

Más detalles

Diseño de almacén de datos para el análisis eficiente de la información de incidentes informáticos y mantenimientos.

Diseño de almacén de datos para el análisis eficiente de la información de incidentes informáticos y mantenimientos. Diseño de almacén de datos para el análisis eficiente de la información de incidentes informáticos y mantenimientos. Ing. Corso Cynthia, Ing. Luque Claudio, Ing. Ciceri Leonardo, Sr Donnet Matías Grupo

Más detalles

Business Information Warehouse Manual SAP BW Business Information Warehouse

Business Information Warehouse Manual SAP BW Business Information Warehouse Manual SAP BW Business Information Warehouse Manual SAP BW / BI Business Information Warehouse Página 1 Confidencialidad Este documento es propiedad de E-SAP (CVOSOFT) por lo tanto, no podrá ser publicado

Más detalles

Fundamentos de la Inteligencia de Negocios

Fundamentos de la Inteligencia de Negocios Universidad Nacional de Salta Facultad de Ciencias Económicas, Jurídicas y Sociales Sistemas de Información para la Gestión Fundamentos de la Inteligencia de Negocios Administración de Bases de Datos e

Más detalles

INTELIGENCIA INSTITUCIONAL EN EL GOBIERNO DE LA UCLM (SID)

INTELIGENCIA INSTITUCIONAL EN EL GOBIERNO DE LA UCLM (SID) INTELIGENCIA INSTITUCIONAL EN EL GOBIERNO DE LA UCLM (SID) Contenido 1. Descripción del proyecto... 3 1.1. Introducción... 3 1.2. Características técnicas... 3 1.3. Características funcionales... 5 2.

Más detalles

UNIVERSIDAD DE GUAYAQUIL

UNIVERSIDAD DE GUAYAQUIL II UNIVERSIDAD DE GUAYAQUIL Facultad de Ciencias Matemáticas y Físicas Carrera de Ingeniería en Sistemas Computacionales Desarrollo de una VPN / Firewall de Software con Administración Vía Web TESIS DE

Más detalles

Datawarehouse. Ing. Adan Jaimes Jaimes. Datawarehouse

Datawarehouse. Ing. Adan Jaimes Jaimes. Datawarehouse 1 Ing. Adan Jaimes Jaimes 2 Conceptos : Repositorio completo de datos, donde se almacenan datos estratégicos, tácticos y operativos, al objeto de obtener información estratégica y táctica Data-Marts: Repositorio

Más detalles

Para Medianas Empresas. Descripción del producto de Oracle Oracle Business Intelligence Standard Edition One

Para Medianas Empresas. Descripción del producto de Oracle Oracle Business Intelligence Standard Edition One Para Medianas Empresas Descripción del producto de Oracle Edition One PÓR QUÉ NECESITA SU ORGANIZACIÓN UNA SOLUCIÓN BUSINESS INTELLIGENCE (BI) Cuándo se convierte en una carga y no en una ventaja el enorme

Más detalles

UNIVERSIDAD FRANCISCO GAVIDIA FACULTAD DE CIENCIAS ECONÓMICAS TRABAJO DE GRADO:

UNIVERSIDAD FRANCISCO GAVIDIA FACULTAD DE CIENCIAS ECONÓMICAS TRABAJO DE GRADO: UNIVERSIDAD FRANCISCO GAVIDIA FACULTAD DE CIENCIAS ECONÓMICAS TRABAJO DE GRADO: PROPUESTA DE UN PLAN DE PUBLICIDAD CORPORATIVA PARA AUMENTAR LA COMPETITIVIDAD DE LA EMPRESA DISTRIBUIDORA LOURDES S.A. DE

Más detalles

Business Intelligence.

Business Intelligence. Business Intelligence. Qué es inteligencia de negocios? Es el proceso de analizar los bienes o datos acumulados en la empresa y extraer una cierta inteligencia o conocimiento de ellos. Dentro de la categoría

Más detalles

DATATUR Almacén de Datos para el Análisis y Difusión de la Información Estadística del Turismo en España

DATATUR Almacén de Datos para el Análisis y Difusión de la Información Estadística del Turismo en España DATATUR Almacén de Datos para el Análisis y Difusión de la Información Estadística del Turismo en España Jorge Rubio Navarro 1 José Manuel Salinas 2 1. Subdirector General Adjunto de Promoción Turística

Más detalles

Fundamentos de la Inteligencia de Negocios

Fundamentos de la Inteligencia de Negocios Sistemas de Información para la Gestión UNIDAD 2: Infraestructura de Tecnología de la Información Unidad 2 Infraestructura de Tecnología de la Información Estructura de TI y tecnologías emergentes. Estructura

Más detalles

INFORME TECNICO PREVIO A DE EVALUACION DE SOFTWARE Nº 001-2008-REGIONCALLAO/GGR/OSIE

INFORME TECNICO PREVIO A DE EVALUACION DE SOFTWARE Nº 001-2008-REGIONCALLAO/GGR/OSIE INFORME TECNICO PREVIO A DE EVALUACION DE SOFTWARE Nº 001-2008-REGIONCALLAO/GGR/OSIE 1.GERENCIA: Gerencia General Regional. 2.OFICINA: Oficina de stemas, Informática y Estadística. 3. RESPONSABLES DE LA

Más detalles

Ficha Técnica. effidetect

Ficha Técnica. effidetect Ficha Técnica effidetect Página 1 de 9 Introducción El Sistema Pointer es un producto de Predisoft (www.predisoft.com) cuyo propósito es la detección (en línea) del fraude que sufren las instituciones

Más detalles

SpagoBI Open Source Business Intelligence

SpagoBI Open Source Business Intelligence SpagoBI Open Source Business Intelligence La plataforma SpagoBI Open Source Business Intelligence Conceptos Inteligencia empresarial (Business Intelligence) es un agregado de aplicaciones y herramientas

Más detalles

FACULTAD DE INGENIERÍA. Bases de Datos Avanzadas

FACULTAD DE INGENIERÍA. Bases de Datos Avanzadas FACULTAD DE INGENIERÍA Ingeniería en Computación Bases de Datos Avanzadas Datawarehouse Elaborado por: MARÍA DE LOURDES RIVAS ARZALUZ Septiembre 2015 Propósito Actualmente las empresas necesitan contar

Más detalles

APROBACIÓN DEL TUTOR

APROBACIÓN DEL TUTOR APROBACIÓN DEL TUTOR En mi calidad de tutor del trabajo de investigación sobre el tema: Portal Web usando software libre con conexión a Base de Datos para consultas de pagos de servicios municipales en

Más detalles

UN PASEO POR BUSISNESS INTELLIGENCE

UN PASEO POR BUSISNESS INTELLIGENCE UN PASEO POR BUSISNESS INTELLIGENCE Ponentes: Agreda, Rafael Chinea, Linabel Agenda Sistemas de Información Transaccionales Qué es Business Intelligence? Usos y funcionalidades Business Intelligence Ejemplos

Más detalles

Presentación Comercial IXAYA Crédito

Presentación Comercial IXAYA Crédito Presentación Comercial IXAYA Crédito Versión: 2.0.1 Fecha: 21/04/2014 Elaboró: División Consultoría Contenido 1. Descripción de la solución....3 1.1. Beneficios....4 1.2. Modelo operativo....5 1.3. Arquitectura

Más detalles

MOLAP REALIZADO POR: JOSE E. TABOADA RENNA

MOLAP REALIZADO POR: JOSE E. TABOADA RENNA MOLAP REALIZADO POR: JOSE E. TABOADA RENNA BASE DE DATOS Conjunto de datos estructurados, fiables y homogéneos organizados independientemente en máquina, m accesibles en tiempo real, compatible por usuarios

Más detalles

UNIVERSIDAD FRANCISCO GAVIDIA FACULTAD DE CIENCIAS ECONOMICAS

UNIVERSIDAD FRANCISCO GAVIDIA FACULTAD DE CIENCIAS ECONOMICAS UNIVERSIDAD FRANCISCO GAVIDIA FACULTAD DE CIENCIAS ECONOMICAS TRABAJO DE GRADO PROPUESTA DE UN PLAN PROMOCIONAL PARA POTENCIAR LA VENTA AL DETALLE DE PISOS Y AZULEJOS CERÁMICOS QUE COMERCIALIZA LA EMPRESA

Más detalles

El presente artículo se centra en el conocimiento

El presente artículo se centra en el conocimiento Herramientas para el Diseño de Sistemas de Gestión del Conocimiento Basadas en Inteligencia Empresarial Lilian Judith Sandoval.¹ Salvador Peña.² Resumen El presente artículo se centra en el conocimiento

Más detalles

INGENERíA EN INFORMÁTICA. Sistema de Información. (Concepto, Importancia, Tipos de Si, Actividades)

INGENERíA EN INFORMÁTICA. Sistema de Información. (Concepto, Importancia, Tipos de Si, Actividades) INGENERíA EN INFORMÁTICA Sistema de Información (Concepto, Importancia, Tipos de Si, Actividades) NOMBRE: Oscar Apata T. CARRERA: Ingeniería en Informática ASIGNATURA: Tecnologías de la Información II

Más detalles

Kais Analytics Business Intelligence

Kais Analytics Business Intelligence Analizador de datos Analice toda la información estratégica y mejore la toma de decisiones Con la globalización de la información en los últimos años nace el concepto Business Intelligence. La gran cantidad

Más detalles

SISTEMAS DE INFORMACIÓN

SISTEMAS DE INFORMACIÓN Capítulo I SISTEMAS DE INFORMACIÓN 1.1. INTRODUCCIÓN Los sistemas información están creando muchas oportunidas para las empresas, pero son también fuentes nuevos problemas y cambios [94]. Aunque la tecnología

Más detalles

UNIVERSIDAD FRANCISCO GAVIDIA FACULTAD DE CIENCIAS ECONÓMICAS ESCUELA DE CIENCIAS EMPRESARIALES

UNIVERSIDAD FRANCISCO GAVIDIA FACULTAD DE CIENCIAS ECONÓMICAS ESCUELA DE CIENCIAS EMPRESARIALES UNIVERSIDAD FRANCISCO GAVIDIA FACULTAD DE CIENCIAS ECONÓMICAS ESCUELA DE CIENCIAS EMPRESARIALES TRABAJO DE GRADUACIÓN TESIS DISEÑO DE UNA INTRANET PARA UNA EMPRESA DE MEDIANO TAMAÑO, EN EL ÁREA METROPOLITANA

Más detalles

www.itconsulting.com.bo

www.itconsulting.com.bo Señor(a): Cliente Presente.- Santa Cruz, 23 de octubre del 2012 Distinguido Señores: REF.: COTIZACION CURSO BUSINESS INTELLIGENCE & DATAWAREHOUSE & CUBOS OLAP EN EXCEL 2010 Consultores en Tecnologías de

Más detalles

GRUPO IX GRUPO DE ESTUDO DE OPERAÇÃO DE SISTEMAS ELÉTRICOS

GRUPO IX GRUPO DE ESTUDO DE OPERAÇÃO DE SISTEMAS ELÉTRICOS SNPTEE SEMINÁRIO NACIONAL DE PRODUÇÃO E TRANSMISSÃO DE ENERGIA ELÉTRICA GOP 06 14 a 17 Outubro de 2007 Rio de Janeiro - RJ GRUPO IX GRUPO DE ESTUDO DE OPERAÇÃO DE SISTEMAS ELÉTRICOS EVALUACIÓN DEL DESEMPEÑO

Más detalles

UNIVERSIDAD DE ORIENTE FACULTAD DE CIENCIAS ECONOMICAS CARRERA: LICENCIATURA EN CIENCIAS DE LA COMPUTACION.

UNIVERSIDAD DE ORIENTE FACULTAD DE CIENCIAS ECONOMICAS CARRERA: LICENCIATURA EN CIENCIAS DE LA COMPUTACION. UNIVERSIDAD DE ORIENTE FACULTAD DE CIENCIAS ECONOMICAS CARRERA: LICENCIATURA EN CIENCIAS DE LA COMPUTACION. TEMA: ESTUDIO DE FACTIBILIDAD SOBRE INTEGRACIÓN DE VOZ Y DATOS PARA UNA LAN EN EL INSTITUTO NACIONAL

Más detalles

SISTEMAS DE INFORMACIÓN

SISTEMAS DE INFORMACIÓN SISTEMAS DE INFORMACIÓN Tema 2 ROL Y TIPOS DE SISTEMAS DE INFORMACIÓN COMPUTER-BASED INFORMATION SYSTEMS (CBIS) SISTEMAS FORMALES DATOS, PROCEDIMIENTOS COLECCIÓN, ALMACENAMIENTO PROCESAMIENTO DISEMINACIÓN

Más detalles

UNIVERSIDAD FRANCISCO GAVIDIA FACULTAD DE CIENCIAS ECONOMICAS ESCUELA DE CIENCIAS EMPRESARIALES TRABAJO DE GRADUACION TESIS

UNIVERSIDAD FRANCISCO GAVIDIA FACULTAD DE CIENCIAS ECONOMICAS ESCUELA DE CIENCIAS EMPRESARIALES TRABAJO DE GRADUACION TESIS UNIVERSIDAD FRANCISCO GAVIDIA FACULTAD DE CIENCIAS ECONOMICAS ESCUELA DE CIENCIAS EMPRESARIALES Tecnología, Humanismo y Calidad TRABAJO DE GRADUACION TESIS PROPUESTA DE UN MODELO MARKETING MASTER PARA

Más detalles

MINERÍA DE DATOS. Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE. Octubre - 2003

MINERÍA DE DATOS. Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE. Octubre - 2003 MINERÍA DE DATOS Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE Octubre - 2003 CONTENIDO Qué es Data Warehousing Data Warehouse Objetivos del Data Warehouse

Más detalles

LOS INDICADORES DE GESTIÓN

LOS INDICADORES DE GESTIÓN LOS INDICADORES DE GESTIÓN Autor: Carlos Mario Pérez Jaramillo Todas las actividades pueden medirse con parámetros que enfocados a la toma de decisiones son señales para monitorear la gestión, así se asegura

Más detalles

UNIVERSIDAD AUTÓNOMA DE BAJA CALIFORNIA SUR ÁREA DE CONOCIMIENTO DE CIENCIAS DEL MAR DEPARTAMENTO ACADÉMICO DE SISTEMASCOMPUTACIONALES TESIS

UNIVERSIDAD AUTÓNOMA DE BAJA CALIFORNIA SUR ÁREA DE CONOCIMIENTO DE CIENCIAS DEL MAR DEPARTAMENTO ACADÉMICO DE SISTEMASCOMPUTACIONALES TESIS UNIVERSIDAD AUTÓNOMA DE BAJA CALIFORNIA SUR ÁREA DE CONOCIMIENTO DE CIENCIAS DEL MAR DEPARTAMENTO ACADÉMICO DE SISTEMASCOMPUTACIONALES TESIS CONSTRUCCIÓN DE UN DATAWAREHOUSE PARA DATOS DE PESCA RIBEREÑA

Más detalles

Aplicación de las tecnologías OLAP y Data Warehousing para la gestión hospitalaria utilizando software libre.

Aplicación de las tecnologías OLAP y Data Warehousing para la gestión hospitalaria utilizando software libre. Aplicación de las tecnologías OLAP y Data Warehousing para la gestión hospitalaria utilizando software libre. Autores: Ing. Sandro Martínez Folgoso, Ing. Jorge Recio Capote, Ing. Eduardo Rodríguez Reyes.

Más detalles

Monitoreo automatizado de redes de. cajeros automáticos

Monitoreo automatizado de redes de. cajeros automáticos Monitoreo automatizado de redes de cajeros automáticos Definición Ejecutiva ATMonitor es una solución completa, integrada y flexible de monitoreo visual de una red de cajeros automáticos. Centraliza la

Más detalles

Business Intelligence

Business Intelligence Business Intelligence Curso 2012-2013 Departamento de Lenguajes y Sistemas Informáticos II http://www.kybele.es ISI/SI - 1 Introducción Nuestra misión: Hacer inteligente el negocio Buenos días. Soy Negocio.

Más detalles

Tecnologías de la Información en la Gestión Empresarial

Tecnologías de la Información en la Gestión Empresarial Tecnologías de la Información en la Gestión Empresarial 1 Sesión No.8 Nombre: Procesos de Negocio y Gestión en Business Intelligence Objetivo: Al término de la sesión, el alumno ilustrará un proceso de

Más detalles

Business Intelligence

Business Intelligence Business Intelligence Definición Business Intelligence es una aproximación estratégica para identificar, vigilar, comunicar y transformar, sistemáticamente, signos e indicadores en información activa en

Más detalles

LOS CINCO GRADOS DE MADUREZ DE UN PROYECTO BI

LOS CINCO GRADOS DE MADUREZ DE UN PROYECTO BI LOS CINCO GRADOS DE MADUREZ DE UN PROYECTO BI INTRODUCCIÓN Se habla en multitud de ocasiones de Business Intelligence, pero qué es realmente? Estoy implementando en mi organización procesos de Business

Más detalles

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS (Universidad del Perú, DECANA DE AMÉRICA) SYLLABO

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS (Universidad del Perú, DECANA DE AMÉRICA) SYLLABO UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS (Universidad del Perú, DECANA DE AMÉRICA) FACULTAD DE INGENIERIA DE SISTEMAS E INFORMATICA Escuela Académico Profesional de Ingeniería de Sistemas 1. ESPECIFICACIONES

Más detalles

Alicia Iriberri Dirección de Tecnologías de Información. I.- Definición del foco estratégico

Alicia Iriberri Dirección de Tecnologías de Información. I.- Definición del foco estratégico Alicia Iriberri Dirección de Tecnologías de Información I.- Definición del foco estratégico II.- Establecimiento de mediciones a través del Balanced Scorecard (Tablero de Comando) III.- Despliegue del

Más detalles

Pero que es el Data Mining? Como esta tecnología puede resolver los problemas diarios de las organizaciones? Cuál es el ciclo de vida de un DM?

Pero que es el Data Mining? Como esta tecnología puede resolver los problemas diarios de las organizaciones? Cuál es el ciclo de vida de un DM? Introducción En vista de los comentarios y sugerencias que nos hicieron, via mail y por chat, sobre la posibilidad de la creación de nuevo conocimiento, he creido conveniente introducir el tema Data Mining

Más detalles

Gobernabilidad de TI. Elsa Estevez Departamento de Ciencias e Ingeniería de la Computación Universidad Nacional del Sur. 2do.

Gobernabilidad de TI. Elsa Estevez Departamento de Ciencias e Ingeniería de la Computación Universidad Nacional del Sur. 2do. Gobernabilidad de TI COBIT Elsa Estevez Departamento de Ciencias e Ingeniería de la Computación Universidad Nacional del Sur 2do. Cuatrimestre 2010 T. 2 Contenido Introducción a la Gobernabilidad de TI

Más detalles

Módulo Minería de Datos

Módulo Minería de Datos Módulo Minería de Datos Diplomado Por Elizabeth León Guzmán, Ph.D. Profesora Ingeniería de Sistemas Grupo de Investigación MIDAS Análsis Dimensional OLAP On-Line Analytical Processing Estructura del Proceso

Más detalles

UNIVERSIDAD FRANCISCO GAVIDIA FACULTAD DE CIENCIAS ECONÓMICAS ESCUELA DE CIENCIAS EMPRESARIALES

UNIVERSIDAD FRANCISCO GAVIDIA FACULTAD DE CIENCIAS ECONÓMICAS ESCUELA DE CIENCIAS EMPRESARIALES UNIVERSIDAD FRANCISCO GAVIDIA FACULTAD DE CIENCIAS ECONÓMICAS ESCUELA DE CIENCIAS EMPRESARIALES TRABAJO DE GRADUACIÓN TESIS PROPUESTA DE UN PLAN ESTRATÉGICO DE BUZZ MARKETING TURÍSTICO PARA MEJORAR LA

Más detalles

MATERIAL DE APOYO CASO PRÁCTICO SISTEMA INTEGRAL PARA LA PROYECCION Y DETECCION DE LA PREVENCION DEL DELITO, MEDIANTE MINERIA DE DATOS.

MATERIAL DE APOYO CASO PRÁCTICO SISTEMA INTEGRAL PARA LA PROYECCION Y DETECCION DE LA PREVENCION DEL DELITO, MEDIANTE MINERIA DE DATOS. MATERIAL DE APOYO CASO PRÁCTICO SISTEMA INTEGRAL PARA LA PROYECCION Y DETECCION DE LA PREVENCION DEL DELITO, MEDIANTE MINERIA DE DATOS. PRESENTA MTIE. Erik Guerrero Bravo. Tula de Allende Hidalgo Septiembre

Más detalles

MS_20331 Core Solutions of Microsoft SharePoint Server 2013

MS_20331 Core Solutions of Microsoft SharePoint Server 2013 Core Solutions of Microsoft SharePoint Server 2013 www.ked.com.mx Av. Revolución No. 374 Col. San Pedro de los Pinos, C.P. 03800, México, D.F. Tel/Fax: 52785560 Introducción Este curso le proporcionará

Más detalles

LINEAMIENTOS GENERALES PARA LA IMPLEMENTACIÓN DE PROCESOS ELECTRÓNICOS

LINEAMIENTOS GENERALES PARA LA IMPLEMENTACIÓN DE PROCESOS ELECTRÓNICOS LINEAMIENTOS GENERALES PARA LA IMPLEMENTACIÓN DE PROCESOS LINEAMIENTOS GENERALES PARA LA IMPLEMENTACIÓN DE PROCESOS Ministerio de Tecnologías de la Información y las Comunicaciones Programa de Gobierno

Más detalles

UNIVERSIDAD FRANCISCO GAVIDIA FACULTAD DE CIENCIAS ECONOMICAS TRABAJO DE GRADO TESIS

UNIVERSIDAD FRANCISCO GAVIDIA FACULTAD DE CIENCIAS ECONOMICAS TRABAJO DE GRADO TESIS UNIVERSIDAD FRANCISCO GAVIDIA FACULTAD DE CIENCIAS ECONOMICAS TRABAJO DE GRADO TESIS DISEÑO DE UN SISTEMA DE ADMINISTRACION DE RECURSOS HUMANOS PARA FORTALECER EL DESEMPEÑO DEL PERSONAL DE LA EMPRESA TACOPLAST,

Más detalles

UNIVERSIDAD SIMÓN BOLÍVAR

UNIVERSIDAD SIMÓN BOLÍVAR UNIVERSIDAD SIMÓN BOLÍVAR DECANATO DE ESTUDIOS PROFESIONALES COORDINACIÓN DE INGENIERÍA DE COMPUTACIÓN DISEÑO Y DESARROLLO DE SISTEMA DE INTELIGENCIA DE NEGOCIOS EN EL SECTOR FINANCIERO Por: Daniel Alejandro

Más detalles

Manual. Seguridad Banner Finanzas SISTEMA UNIVERSITARIO ANA G. MÉNDEZ VICEPRESIDENCIA DE ASUNTOS FINANCIEROS

Manual. Seguridad Banner Finanzas SISTEMA UNIVERSITARIO ANA G. MÉNDEZ VICEPRESIDENCIA DE ASUNTOS FINANCIEROS SISTEMA UNIVERSITARIO ANA G. MÉNDEZ VICEPRESIDENCIA DE ASUNTOS FINANCIEROS Manual Seguridad Banner Finanzas COPYRIGHT 2012 SISTEMA UNIVERSITARIO ANA G. MÉNDEZ REVISADO MARZO 2013 Tabla de Contenido Página

Más detalles

Diplomado en Inteligencia de Negocios Coordinador académico: Lic. Seth Pérez Melesio

Diplomado en Inteligencia de Negocios Coordinador académico: Lic. Seth Pérez Melesio Diplomado en Inteligencia de Negocios Coordinador académico: Lic. Seth Pérez Melesio Proporcionar a los participantes los conocimientos necesarios que les permitan entender, de una manera integral y objetiva,

Más detalles

UNIVERSIDAD FRANCISCO GAVIDIA FACULTAD DE CIENCIAS SOCIALES

UNIVERSIDAD FRANCISCO GAVIDIA FACULTAD DE CIENCIAS SOCIALES UNIVERSIDAD FRANCISCO GAVIDIA FACULTAD DE CIENCIAS SOCIALES PROGRAMA DE ESCUELA DE PADRES Y MADRES COMO ESTRATEGIA PARA PROMOVER EL ACERCAMIENTO DE LOS PADRES Y MADRES A LA ESCUELA DE EDUCACIÓN PARVULARIA,

Más detalles

Carlos Daniel Quattrocchi

Carlos Daniel Quattrocchi PRESENTA Lic. Héctor Iglesias Licenciado en Informática. Profesional independiente, ha desempeñado la actividad en informática desarrollando e implementando sistemas, capacitando y asesorando a numerosas

Más detalles

PROYECTO DE DESARROLLO E IMPLANTACIÓN DE LA SOLUCIÓN DE BUSINESS INTELLIGENCE PARA ELIPSOS INTERNACIONAL S.A.

PROYECTO DE DESARROLLO E IMPLANTACIÓN DE LA SOLUCIÓN DE BUSINESS INTELLIGENCE PARA ELIPSOS INTERNACIONAL S.A. PROYECTO DE DESARROLLO E IMPLANTACIÓN DE LA SOLUCIÓN DE BUSINESS INTELLIGENCE PARA ELIPSOS INTERNACIONAL S.A. Dirección de Sistemas de Información Madrid, mayo 2014 PCT B.I. ELIPSOS 1 CONTENIDO 1. OBJETIVO

Más detalles

Implementando un DataWarehouse.

Implementando un DataWarehouse. Página 1 de 8 Implementando un DataWarehouse. Carmen Wolff Comenzando A Construir Un DW. Para llevar a cabo con éxito un proyecto Datawarehouse, es vital considerar al inicio de su construcción tres factores

Más detalles