PRINCIPIOS Y TÉCNICAS PRÁCTICAS PARA LA IMPLEMENTACIÓN DE UN PROTOTIPO DE DATA WAREHOUSE EN SQL 2000 Y ORACLE 10g CAPÍTULO 1

Tamaño: px
Comenzar la demostración a partir de la página:

Download "PRINCIPIOS Y TÉCNICAS PRÁCTICAS PARA LA IMPLEMENTACIÓN DE UN PROTOTIPO DE DATA WAREHOUSE EN SQL 2000 Y ORACLE 10g CAPÍTULO 1"

Transcripción

1 CAPÍTULO 1 1. HISTORIA DE DATA WAREHOUSE: El concepto de un Data Warehouse es antiguo y se remonta a los años 70 s, en donde los estudios del MIT 1 desarrollaron una arquitectura informática óptima, por ello utilizaron procesos analíticos en capas es decir, trabajaron con conjuntos de datos independientes los cuales tenían diseños diferentes, el problema más grande en ese entonces fue la capacidad mínima de las memorias de los computadores. Más tarde en la década de los 80 s DEC 2. la primera compañía en construir una arquitectura de red distribuida y la primera en emigrar a un ambiente de base de datos relacional utilizando su propio producto DBMS, RdB. Colaboró con los planes de realizar una arquitectura informática diferente y se enfocó en aspectos como ingeniería, comercialización y finanzas así que decidieron combinar los principios de MIT (utilizando diferentes conjuntos de datos con diferentes características) y los suyos (utilizando bases de datos y redes informáticas). A esta técnica se la llamó TA-2, la cual definió recopilación de datos, acceso a los mismos. Mientras tanto en el año de 1988, el ingeniero Barry Devlin de la empresa IBM en Irlanda, preocupado por el crecimiento de la información dentro de las empresas, trabajó en la definición de una arquitectura nueva que sirviera de soporte para las grandes empresas. Apareció entonces la arquitectura interna de un Data Warehouse para IBM de Europa, proveyendo un soporte completo y estructurado para un ambiente de negocios. Entre los años de 1988 y 1991, se decide retomar la investigación y posterior desarrollo de la nueva arquitectura informática. Se propuso construir una guía completa de diseño para aplicaciones y desarrollo de un Data Warehouse, basándose en la arquitectura propuesta por DEC y añadiendo el ambiente de integración y las metas de IBM, a esta fusión se la llamó TA-3. En esta nueva arquitectura se incorporó interfaces gráficas, computadoras personales y componentes de redes locales tomando 1 MIT Massachusetts_Institute_Technology (Más información 2 DEC Digital_Equipment_Corporation (Más información 1

2 en cuenta arquitectura cliente servidor. Se especificaron características propias de un Data Warehouse tales como, extracción, transformación y carga de datos, desarrollo de cubos de datos y utilización herramientas gráficas para la visualización de los mismos En el año de 1991 Inmon Corporation 3 (Más información publica su primer libro como una guía para la construcción de un Data Warehouse, este libro contiene las definiciones, requerimientos y pasos para crear un Data Warehouse. Luego de más de una década este concepto no ha pasado de moda y al contrario sigue siendo explotado utilizando herramientas más amigables y escalables para conseguir resultados más exactos y ayudar a resolver problemas de toma de decisiones empresariales QUÉ ES DATA WAREHOUSE?: Data Warehouse es un conjunto de información no volátil (información que no cambia) recopilada de varias bases de datos operacionales OLTP 4. Esta información es filtrada, procesada y correctamente organizada para obtener una estructura confiable de manera que las consultas y reportes ayudan a la toma de decisiones en cualquier tipo de empresa. Data Warehouse tiene la capacidad de filtrar datos ya que al obtener información de varias fuentes u orígenes de datos (bases de datos operacionales OLTP), en algunas ocasiones se pueden presentar inconsistencias en cuanto a medidas o tipos de datos. Este es un proceso muy importante ya que de esto dependerá el éxito del desarrollo del nuevo sistema; más tarde esta información será transformada, integrada y posteriormente almacenada en un depósito, al cual se lo podrá acceder cada vez que la empresa precise de esta información. A la información antigua se la conoce como datos históricos de la empresa y nos sirve al momento de analizar procesos y tomar decisiones acerca de un negocio. Se puede decir que Data Warehouse es una BODEGA DE DATOS, que contiene datos históricos, departamentales, gerenciales, externos, etc., los cuales servirán 3 Inmon Corporation (Internet Monitoring). Más información: 4 OLTP (On Line Transacction Processing). Lo ampliaremos más adelante capítulo

3 posteriormente para el respectivo análisis, proceso y toma de decisiones por medio de herramientas dispuestas para este fin. Las ventajas de tener un Data Warehouse dentro de una empresa son: Manejo de grandes cantidades de información. Realizar un análisis de predicción. Fácil acceso a datos. Tiempo de respuesta. Todas estas ventajas desencadenan en ganancia para la empresa ya que tiempo es dinero. FIGURA N.- 1.1: Bodega de Datos: FUENTE: La Figura ilustra una bodega con grandes cantidades de mercancía. Refleja la similitud de un Data Warehouse que es una gran bodega de datos. Una de las características de Data Warehouse son las consultas de grandes cantidades de información y esto permite colaborar en la toma de decisiones en la empresa ya que por medio de los datos históricos cuenta con información suficiente para comparar datos y lograr una decisión beneficiosa para la empresa. Entre las principales razones para implementar un Data Warehouse tenemos: 3

4 Falta de ayuda en la toma de decisiones. Herramientas poco adecuadas para el usuario final. Inconsistencia de datos y redundancia de otros. Necesidad de corregir defectos de sistemas anteriores. Administrar de grandes volúmenes de datos CONCEPTOS ASOCIADOS A UN DATA WAREHOUSE Para comprender más que es Data Warehouse necesitamos conocer conceptos que se asocian en su diseño y construcción QUÉ ES UNA TRANSACCIÓN: Una transacción es una pequeña parte de información dentro del conjunto de bases de datos de origen para el Data Warehouse, es llamado OLTP (ON LINE TRANSACTION PROCESSING este concepto será ampliado en el capítulo 1.2.3), sin embargo cada transacción gestiona miles o hasta millones de registros. Dentro de un sistema OLTP se procesan cientos y miles de transacciones por día, en cambio un Data Warehouse procesa solo una transacción al día QUÉ ES UN MODELO MULTIDIMENSIONAL: Representa en forma gráfica una actividad que es sujeto de análisis dentro de una empresa. Está compuesto por dimension tables (tablas de dimension) y una Fact Table. Se explicarán más adelante en los capítulos y Según la relación entre las dimension tables se presentan tres alternativas: Star Schema. Snowflake. Parent Child. Los cuales serán ampliados en el capítulo , Y

5 FACT TABLE: Es el lugar donde se almacenan todas las medidas o valores numéricos del negocio, estas medidas son tomadas en la intersección de todas las dimensiones. Esta tabla no contiene atributos tipo char debido a que el Data Warehouse se degrada y el tiempo de respuesta sería mucho mayor. La razón más importante para utilizar atributos numéricos es porque cada query está hecho para la Fact table, entonces el usuario preguntará por cantidades tales como cuentas o miles de registros a ser utilizados por el modelo dimensional y será construido en base a ello. Este número de registros será comprimido dentro de conjuntos de docenas de filas para dar respuestas a los usuarios. Si las medidas son números y si ellas son totalizadas se podrá obtener fácilmente un conjunto de respuestas. La Fact table debe ser valorada continuamente para evitar llenar de datos obsoletos la misma. Algo muy importante es no llenar de ceros los campos que no tienen movimiento dentro de la Fact table. Existen Fact tables semisumarizadas y no sumarizadas. Semisumarizadas: Son aquellas que pueden ser añadidas en una dimensión. No sumarizadas: Son aquellas que no pueden ser añadidas, el diseñador está forzado a utilizar contadores para sumarizar los registros. Cuando existe un registro de datos que cambia constantemente quiere decir que se lo debería tomar como un registro de la Fact. Table, en cambio cuando el registro se mantiene Más o menos constante sería tomado como un atributo de una Dimension Table. 5

6 FIGURA. N.- 1.2: Componentes de una Fact Table: FUENTE: CD De Entrenamiento de Data Warehouse en SQL Server Una Fact. Table está compuesta por las claves primarias de lasdiferentesdimension Tables (Tablas de dimensión) y las medidas correspondientes DIMENSION TABLES: Es el lugar donde se encuentran almacenadas las descripciones textuales del negocio, cada descripción describe un miembro de la dimensión, por ejemplo cada registro de la dimensión producto representa un producto específico (tomando en cuenta que dentro de la tabla producto se encuentran muchos atributos). Los mejores atributos son textuales y usados como el origen de constraints y row header para los conjuntos de respuestas dadas al 6

7 usuario. Desde los atributos de la dimensión se describen cada uno de los ítems. Al ser atributos textuales, las descripciones pueden ser cortas o largas: Cortas: Tendrán una longitud entre 10 y 15 caracteres. Largas: Tendrán una longitud entre 30 y 60 caracteres. FIGURA. N.- 1.3: Características de las Tablas de Dimensión (dimension table): FUENTE: CD De Entrenamiento de Data Warehouse en SQL Server Las Dimension Tables están compuestas por atributos y cada unadeellas tiene su clave primaria (primary key) ESQUEMA ESTRELLA (STAR SCHEMA): Se lo llama esquema estrella porque su modelo toma forma de estrella. Es un modelo asimétrico ya que muestra una sola tabla dominante (tabla central) dentro del diagrama la cual se conecta al resto de tablas. La tabla dominante es llamada Fact table, las tablas que se conectan a ella toman el nombre de Dimension tables (tablas de dimensión). 7

8 El modelo dimensional de datos es una alternativa del modelo entidad relación. FIGURA. N.- 1.4: Esquema Estrella: FUENTE: CD. De Entrenamiento de Data Warehouse en SQL Server 2000 El modelo dimensional muestra una tabla dominante Fact Table que es Ventas_Fact, la cual se une a las Dimension Table (Empleado, Tiempo, Producto, Pago, Cliente) por una sola relación, las Dimension Table o tablas de dimensión no se unen entre sí. 8

9 ESQUEMA COPO DE NIEVE (SNOWFLAKE SCHEMA): Es una variación del Star Schema, la diferencia radica en que la Fact Table está unida directamente, solo a una Dimension Table, las demás van unidas con la foreign key de la Dimension Table anterior. FIGURA. N.- 1.5: Esquema Copo de Nieve: FUENTE: CD De Entrenamiento de Data Warehouse en SQL Server 2000 La Fact Table está directamente unida con una Dimension Table, las demás se unen con la Foreign Key de la anterior ESQUEMA PADRE HIJO (PARENT CHILD SCHEMA): Es similar al esquema copo de nieve y se lo utiliza para representar relaciones jerárquicas con dependencia, por ejemplo: situaciones geográficas en donde una ciudad pertenece a una provincia, una provincia a una región, una región a un país, un país a un continente. Dependencias laborales (organigramas). 9

10 CUBO DE DATOS (DATA CUBE): El cubo de datos, está compuesto por medidas y dimensiones. Es decir es el centro de un modelo multidimensional. Cada esquina del cubo tiene su etiqueta y representa de manera gráfica el comportamiento de los datos recopilados y procesados en el Data Warehouse. El cubo de datos tiene mucha importancia debido a que el usuario puede observar el negocio en una figura, donde cualquier punto dentro del cubo es la intersección de las coordenadas definidas por las esquinas del mismo. FIGURA. N.- 1.6: Cubo de datos: FUENTE: CD De Entrenamiento de Data Warehouse en SQL Server 2000 El gráfico muestra un cubo de datos con sus respectivas dimensiones como son: lugares de comercialización de los productos, productos comercializados, y el tiempo de comercialización de los mismos. Como podemos observar globaliza la información y la presenta en forma clara. Los resultados se pueden observar en cada una de las esquinas de los cubos interiores. 10

11 MEDIDAS: Las medidas de datos son valores numéricos dentro de la base, los cuales van a ser analizados con relación a las dimensiones definidas. En otras palabras no son más que el resultado de la intersección de todas las dimensiones. Generalmente se las representa como un resultado de alguna operación aritmética anterior, por ejemplo en la figura N.-3 encontramos como medidas número de ventas y total de ventas DIMENSIONES: Las dimensiones son los atributos que el usuario va a visualizar. Una dimensión está compuesta por miembros los cuales pueden ser comparados con otras dimensiones. Los miembros de una dimensión generalmente están organizados por jerarquías desde el mayor al menor MODELO ENTIDAD RELACIÓN: Representa un modelo lógico de una base de datos, en el cual podemos observar las entidades (tablas) que la forman y las relaciones entre ellas. Para tener una idea más clara de lo que se va a desarrollar, es necesario construir es un modelo entidad relación. En el caso de un Data Warehouse las cosas no son diferentes, aunque el modelo varíe. La diferencia más importante entre sistemas OLTP (On Line Transaction Processing) y Data Warehouse es la organización del sistema de datos o lo que es lo mismo modelo de datos. A continuación podemos observar algunas de las características del Modelo Entidad Relación: El Modelo Entidad Relación busca construir una base de datos sin redundancia en sus datos (registros repetidos), de esta manera se mejora la velocidad o transaction processing. EL Modelo Entidad Relación divide los datos dentro de muchas entidades (tablas). Tiene varias conexiones entre tablas lo que muchas veces dificulta su entendimiento. 11

12 DIFERENCIAS ENTRE MODELO ENTIDAD RELACIÓN Y MODELO MULTIDIMENSIONAL: Si bien es cierto para diseñar tanto bases de datos relacionales y bases de datos multidimensionales necesitamos un modelo específico, no quiere decir que sean iguales o tengan el mismo funcionamiento o estructura. Es por ello que detallamos las diferencias más importantes del modelo entidad relación y modelo multidimensional. TABLA N.- 1.1: Diferencias entre Modelo Entidad Relación y Modelo Multidimensional. MODELO ENTIDAD RELACION Se conecta con varias tablas. Es difícil conocer cual es la tabla principal o en algunos casos carece de ella. No tiene tablas de medidas y descripciones. No es el recomendadodo para diseñar un Data Warehouse. MODELO MULTIDIMENSIONAL Se conecta a una sola tabla Fact table. La tabla principal es llamada Fact table. Especifica tabla de medidas (Fact table) Y dimensiones (dimension tables). Es el adecuado para diseñar un Data Warehouse. FUENTE: Rebeca Mideros. La tabla muestra las diferencias entre Modelo Entidad Relación y Modelo Multidimencional. Los datos de la tabla se obtienen de acuerdo a las investigaciones realizadas y a la experiencia adquirida en el desarrollo de la tesis. 12

13 DIFERENCIA ENTRE BASES DE DATOS MULTIDIMENSIONALES Y BASES DE DATOS RELACIONALES: La siguiente tabla detalla las diferencias más importantes entre bases de datos multidimensionales y bases de datos relacionales. TABLA N.-1.2: Diferencia entre bases de datos multidimensionales y bases de datos relacionales: BASES DE DATOS RELACIONALES Alta escalabilidad. Permite todo tipo de consultas no predeterminadas. Independencia de plataforma. Proceso lento en consultas complejas, en bases de datos muy grandes si no cuenta con una plataforma paralela y capacidad de consultas paralelizadas. BASES DE DATOS MULTIDIMENSIONALES Al aumentar el número de dimensiones el sistema se vuelve lento. Permite todo tipo de consultas predeterminadas. Plataformas específicas. Las consultas no previstas (fuera de sus dimensiones) son muy lentas, al aumentar el número de dimensiones explosiona el tamaño de la base de datos. FUENTE: Data Warehouse Funcionalidad y Servicios de José Luis Díaz Caprino. La tabla muestra en síntesis la diferencia entre bases de datos multidimensionales y bases de datos relacionales QUE ES OLTP: Es una de las bases de datos operacionales de la cual se extrae la información para crear un Data Warehouse. Se lo conoce como ON LINE TRANSACTION PROCESSING. 13

14 Debemos tomar en cuenta que un OLTP no es igual a un Data Warehouse puesto que sus características tales como los usuarios, la estructura de los datos, el hardware y software, la administración, el manejo de los sistemas, el ritmo de trabajo son diferentes. Por esta razón una base de datos para soportar procesos transaccionales en línea (OLTP) podría no ser adecuada para el Data Warehouse, ya que (OLTP) ha sido diseñada para maximizar la capacidad transaccional de sus datos y típicamente tiene cientos de tablas. Su diseño también ha sido condicionado para administrar datos que varían con frecuencia (los atributos de las tablas pueden tomar otros valores), ya que muchos usuarios pueden cambiar datos en tiempo real. Por esta razón cuenta con controles de simultaneidad que aseguran que dos usuarios no pueden cambiar al mismo tiempo un dato, o que mientras un dato esté siendo utilizado este no pueda ser cambiado por otro usuario; su diseño también garantiza que si una transacción debe seguir una secuencia de pasos para resolverse, los pasos anteriores deben cumplirse para ejecutar los siguientes DIFERENCIAS ENTRE DATA WAREHOUSE Y OLTP Si bien es cierto Data Warehouse toma información de varias fuentes de datos, no quiere decir que los requerimientos de diseño sean iguales a los sistemas normales que estamos acostumbrados a realizar. Por ello es importante mostrar las diferencias entre un Data Warehouse y un OLTP. 14

15 TABLA N.- 1.3: Diferencia entre Data Warehouse y OLTP: DATA WAREHOUSE Organizado en base a conceptos. Ejm. clientes Son accedidas por un menor número de usuarios. Una sola consulta puede tomar varios minutos. El número de tablas es menor, pero tiene mayor número de columnas. Son actualizados en batch de manera periódica. Sufren cambios constantes debido a su evolución. Mayor tamaño (unión de varios OLTP). OLTP Organizadas para ejecutar transacciones. Ejm. Mover dinero Son accedidas por cientos de usuarios. Realizan cientos de transacciones por segundo. Tiene muchas tablas, cada una con pocas columnas. Son actualizados por sistemas operacionales día a día. Son muy estables, rara vez cambian. Menor tamaño. FUENTE: Qué es un Data Warehousing?- monografias.com La tabla muestra las diferencias entre Data Warehouse y OLTP QUE ES OLAP (On Line Analytical Processing): OLAP son aplicaciones que se encargan de analizar los datos del negocio utilizando una estructura multidimensional. Estas herramientas se encargan de revisar, graficar y visualizar la información del negocio por medio de cubos de datos, para cumplir con su objetivo principal que es brindar un soporte para la toma de decisiones en una empresa. OLAP surgió como una necesidad de analizar grandes cantidades de información provenientes de fuentes externas y de bases de datos productivas de la empresa que generalmente contienen transacciones tales como ventas, facturación, producción, etc. Y cumplen con una característica fundamental que es la velocidad de respuesta a las consultas realizadas por los usuarios gracias 15

16 a su cubo de datos, al cual se lo puede seccionar y visualizar la información desde múltiples perspectivas COMPONENTES DE UN DATA WAREHOUSE: El siguiente gráfico resume los componentes de un Data Warehouse. FIGURA. N.-1.7: Componentes de un Data Warehouse FUENTE: CD De Entrenamiento de Data Warehouse en SQL Server La Figuraura muestra desde la izquierda: Origen de datos, Área de Tráfico de datos (Staging Área), Data Marts, Data Warehouse y la entrega de datos al usuario o Acceso de Datos ORIGEN DE DATOS: Es el conjunto de dos o más bases de datos (OLTP o Legacy Systems). Por estar compuesto de varias fuentes de información posee transacciones de negocios y todos los datos correspondientes para alimentar el Data Warehouse. 16

17 El origen de datos puede ser relacional o no relacional y no necesariamente puede contener grandes cantidades de datos históricos. Como cambia constantemente reflejan el estado del negocio ÁREA DE TRÁFICO DE DATOS: Se la conoce con el nombre de área de preparación en ella se almacenan grupos de procesos que limpian, transforman, combinan y preparan los orígenes de datos para utilizarlos más tarde en el Data Warehouse o Data Mart. En esta área los datos de origen son transformados a un formato común y se chequea consistencia e integridad de datos. Esta área posee características como: Los datos pueden estar en una o varias computadoras. En esta área no se pueden sacar reportes de datos DATA MART: El Data Mart es un subconjunto de Data Warehouse, contiene datos específicos de actividades del negocio tales como: análisis financiero, análisis de clientes, etc. Y tiene características como: Su información puede incluirse en el Data Warehouse. Puede contener datos detallados o totalizados. Sus datos los puede compartir con otros Data Marts DATA WAREHOUSE: Se lo define como la unión de Data Marts la cual tiene información integrada que puede ser compartida a través de ellos. En otras palabras un Data Warehouse puede definirse como una bodega de datos centralizada e integrada que alimenta de datos a los Data Marts ACCESO DE DATOS AL USUARIO: Es el lugar donde los usuarios visualizan la información del negocio luego de procesos realizados para analizarla, evaluarla y posteriormente tomar una decisión específica. 17

18 Los usuarios pueden acceder a estos datos directamente por medio de consultas. Cuando estos sistemas están en constante cambio pueden producirse diferentes resultados y talvez reportes inconsistentes SERVIDOR DE PRESENTACIÓN: Es la máquina en la cual los Data Warehouse son guardados y dispuestos para procesos como consultas, reportes, etc ALMACENAMIENTO OPERACIONAL DE DATOS: Es el lugar donde se almacenan los datos que han sido procesados y se encuentran listos para la toma de decisiones PROCESOS DE UN DATA WAREHOUSE: El Data Warehouse debe cumplir procesos específicos para llegar a tener un sistema exitoso, esos procesos son: extracción, transformación EXTRACCIÓN: Este es el primer paso para obtener la información para el Data Warehouse, ya que recopilados los datos se realizará una selección sistemática de datos operacionales necesarios para alimentar el Data Warehouse TRANSFORMACIÓN: Una vez que la información ha sido extraída, esta debe ser filtrada. Filtrar es un proceso por medio del cual seleccionamos los campos necesarios para realizar otros cambios en los datos operacionales para reunir los objetivos necesarios para el desarrollo del Data Warehouse CARGA DE DATOS: Al final del proceso de transformación, los datos estarán listos para ser cargados. La carga de datos es una inserción sistemática de datos, esto se logra en el componente de almacenamiento del Data Warehouse. 18

19 1.4. TIPOS DE MODELOS DE DATA WAREHOUSE: OLAP trata de almacenar la información en una base de datos de tal forma que permita realizar consultas de una forma eficaz para lo cual dispone dos formas de representar un modelo de Data Warehouse y son: Modelo multidimensional (MOLAP). Modelo relacional (ROLAP). Los dos modelos nos muestran los datos de una forma multidimensional. Los ROLAP se construyen sobre un manejador de bases de datos relacionales mientras que los MOLAP se basan en manejadores multimensionales de la base de datos. FIGURA. N.-1.8 Tipos de Modelos OLAP: Vista de Usuario Vista de Usuario Agregaciones Detalles Detalles Agregaciones FUENTE: CD De Entrenamiento de Data Warehouse en SQL Server 2000 La Figura muestra los tipos de almacenamiento de un Data Warehouse. 19

20 ROLAP: Un modelo ROLAP se caracteriza por tener dentro de una misma base de datos relacional los datos precalculados y datos fuente esto ayuda a: Manejar Data Warehouse muy grandes. Permite extraer grandes cantidades de información. Realiza consultas relacionales. En Data Warehouses pequeños se obtienen soluciones en tiempo real. Son escalables. Sin embargo por tener sus datos en una misma base de datos también afecta al performance de las consultas, una de las formas para agilizar consultas serían los índices. FIGURA. N.- 1.9: ROLAP (Relational OLAP): Vista de Usuario Detalles Agregaciones FUENTE: CD De Entrenamiento de Data Warehouse en SQL Server 2000 Se observa que las agregaciones o datos calculados y detalles, se encuentran almacenadas en bases de datos, diferentes. 20

21 MOLAP: En un modelo MOLAP los datos precalculados y agregados residen en un mismo formato multidimensional. Guardan únicamente los valores de medida ya que las dimensiones son tratadas como índices de los arreglos multidimensionales. Sus características principales son: Mejor desempeño de procesamiento de consultas. Es más eficiente ya que ocupa poco espacio en disco. Almacenan la información en cubos de datos y los visualizan por medio de una interfaz estilo hoja de cálculo. No es muy escalable. FIGURA. N : MOLAP: Vista de Usuario Detalles y Agregaciones FUENTE: CD De Entrenamiento de Data Warehouse en SQL Server 2000 Se observa que las agregaciones y detalles se encuentran almacenadas dentro del cubo de datos. En un modelo MOLAP los datos precalculados y agregados residen en un mismo formato multidimensional. Guardan únicamente los valores de medida ya que las dimensiones son tratadas como índices de los arreglos multidimensionales. Sus características principales son: Mejor desempeño de procesamiento de consultas. 21

22 Es más eficiente ya que ocupa poco espacio en disco. Almacenan la información en cubos de datos y los visualizan por medio de una interfaz estilo hoja de cálculo. No es muy escalable PRESTACIONES DE UN DATA WAREHOUSE: Las características de un Data Warehouse permiten que su aplicación tenga varios objetivos dentro de la empresa. Por esta razón un Data Warehouse debe estar en disposición de ofrecer las siguientes prestaciones: TABLA N.- 1.4: PRESTACIONES DE UN DATA WAREHOUSE: CARACTERISTICA Menor coste en la toma de decisiones. Mayor flexibilidad ante el entorno. Mejor servicio al cliente. Rediseño de procesos. DESCRIPCIÓN Ahorra tiempo al ejecutar consultas de datos largas y complejas. Convierte los datos operacionales en información estructurada y relacionada que genera el conocimiento necesario para la toma de decisiones. Tiene mayor flexibilidad en el análisis de mercado y el entorno en general lo que repercute en la relación con el cliente que es uno de los pilares más importantes para el éxito de una organización. Los usuarios son capaces de analizar la información del negocio y esto permite obtener ideas renovadoras para el rediseño de los procesos. FUENTE: datawarehouse.pdf. La tabla muestra las características de un Data Warehouse. 22

23 1.6. DATA MINING (MINADO DE DATOS): Data Mining 5 es una tecnología con gran potencial, que permite al usuario concentrarse en la información más importante de la empresa para extraer información específica a partir de la información contenida en las bases de datos. Data Mining es capaz de: Analizar factores de influencia en determinados procesos. Predecir o estimar variables o comportamientos futuros. Segmentar o agrupar ítems similares. Obtener secuencias de eventos que provocan comportamientos específicos. Un Data Mining se desarrolla bajo lenguajes de última generación basados en la inteligencia artificial y utilizan modelos matemáticos tales como: Redes neuronales artificiales: Son modelos predecibles no-lineales que aprenden a través del entrenamiento y semejan la estructura de una red neuronal biológica. Arboles de decisión: Son estructuras de forma de árbol que representan conjuntos de decisiones. Estas decisiones generan reglas para la clasificación de un conjunto de datos. Algoritmos genéticos: Son técnicas de optimización que usan procesos tales como combinaciones genéticas, mutaciones y selección natural en un diseño basado en los conceptos de evolución. Muchas de estas tecnologías han estado en uso por más de una década en herramientas de análisis especializadas que trabajan con volúmenes de datos relativamente pequeños. Actualmente han evolucionado para integrarse directamente con herramientas OLAP y de Data Warehouse. Ya que las herramientas de Data Mining se basan en modelos matemáticos son capaces de predecir tendencias y comportamientos futuros de la empresa respondiendo preguntas que normalmente tomarían mucho tiempo para resolverlas por 5 Data Mining (Más información : Disertación de grado Karina Molina. Pontificia Universidad Católica del Ecuador. Facultad de Ingeniería Escuela de Sistemas.) 23

24 lo que ayudan a dar una idea más clara sobre el panorama del negocio y consecuentemente ayudan a tomar decisiones en la empresa BUSINESS INTELIGENT: Estas herramientas son adecuadas para dar soporte a una empresa al momento de tomar decisiones ya que en tiempo real permiten procesos tales como el análisis y manejo de datos. Sus características más importantes son: Ayudan a tomar decisiones empresariales de una forma rápida. Incrementa la eficiencia organizacional y la efectividad. Posee técnicas que capturan los datos importantes de forma rápida para que puedan ser analizados desde diferentes puntos de vista. Transforman los datos recopilados en información útil para el negocio. Cada usuario final debe seleccionar que herramienta se ajusta mejor a las necesidades y su Data Warehouse. Entre estas herramientas tenemos SQL (Structured Query Language). Herramientas MDA (Multidimensional Analysis). OLAP (On Line Analytical Processing). ROLAP (Relational On Line Analytical Processing). DATA MINING. Oracle METAS DE DATA WAREHOUSE: Data Warehouse es un sistema que ayuda a la toma de decisiones de la empresa por esta razón debe cumplir metas tales como: Proveer el acceso organizado a los datos: Esto es que cada usuario tenga acceso a la información del Data Warehouse desde su computadora personal, esta conexión debe ser inmediata y con alto performance. Mantener Información consistente: Es decir que los datos sean fieles. Apoyo en la toma de decisiones de empresa a nivel jerárquico. 24

25 1.9. FUTURO DE DATA WAREHOUSE: Debido a las características de Data Warehouse tales como manejo de grandes cantidades de información, facilidad de acceso a los datos, alto performance, velocidad en respuestas. El Data Warehouse en el futuro será capaz de: Mantener bodegas de datos de 1 Terabyte. Almacenar y analizar tipos de datos multimedia. Acceso a Internet. Técnicas de Data Mining. Aplicaciones verticales (accesibles a toda la organización). 25

26 CAPÍTULO 2 2. PASOS A SEGUIR PARA LA IMPLEMENTACIÓN DE UN DATA WAREHOUSE Si bien es cierto para implementar un Data Warehouse, no existe una fórmula específica que garantice su éxito, sin embargo algunos consejos pueden ayudarnos en su desarrollo para lograr un sistema nuevo y exitoso. Al desarrollo de esta tesis se han estudiado los siguientes pasos que pueden ayudar para el desarrollo de un Data Warehouse. FIGURA. N : Esquema para el Análisis de un Data Warehouse: ANALISIS Establecer Relación Entre Usuarios y Desarrolladores Realizar un Cronograma de Trabajo FUENTE: Rebeca Mideros. La figura muestra gráficamente los pasos recomendados para el análisis de un Data Warehouse. 2.1 DESCRIPCIÓN DEL ANALISIS DE UN DATA WAREHOUSE: Sin duda alguna el análisis de todo sistema debe ser la base de éste, mucho más en el caso de un Data Warehouse 6 que depende de bases de datos anteriores OLTP e información histórica. Por ello es muy importante tener una buena planificación, la cual dependerá de factores tales como: 6 Más información: 26

27 2.1.1 ESTABLECER UNA RELACIÓN ENTRE USUARIOS Y DESARROLLADORES: Es muy importante establecer una relación directa entre los usuarios y el grupo de trabajo que desarrollará el Data Warehouse. Este paso no es desconocido, ya que la experiencia nos enseña que la comunicación entre usuario y desarrollador es vital para contar en un futuro con un sistema que brinde todas las funcionalidades y seguridades. En esta fase se explican los detalles de la implementación, tipo de herramientas, requerimientos y costos REALIZAR UNA CRONOGRAMA DE TRABAJO DEL FUTURO DATA WAREHOUSE: De acuerdo a los datos, visión, misión y requerimientos de la empresa se establecerá un cronograma de trabajo para los desarrolladores y uno de revisión para los usuarios, de esta forma el desarrollo del Data Warehouse no será desconocido para ninguna de las partes. Esto beneficiará a la empresa ya que al final tendrá un sistema que cumpla con todos sus requerimientos y beneficia a los desarrolladores ya que se evitan problemas posteriores. 27

28 Warehouse: FIGURA. N : Esquema para el Diseño de un Data DISEÑO Facilidad de Acceso a Información y Seguridad Alcance del Data WareHouse Redundancia de datos Usuario Final Arquitectura Tipo de Servidor Construcción Modelo Lógico FUENTE: Rebeca Mideros. La figura muestra gráficamente los pasos recomendados para el diseño de un Data Warehouse. 28

29 2.2 DESCRIPCIÓN DEL DISEÑO DE UN DATA WAREHOUSE: El diseño de un Data Warehouse se desarrolla en términos del negocio ya que utiliza la estrategia de diseño de afuera hacia adentro outside-in, a diferencia de los sistemas comunes de arriba hacia abajo ( top - down ). Sin embargo, algunos usuarios no conocen a fondo sobre sus requerimientos y necesidades, por lo tanto será muy importante realizar prototipos para ayudar a los usuarios a definir sus requerimientos. Dentro del proceso de diseño se deberá tomar en cuenta lo siguiente: FACILIDAD DE ACCESO A INFORMACIÓN Y SEGURIDAD: Para una empresa un Data Warehouse será una inversión acertada, si los usuarios finales pueden acceder a información de una forma más rápida que asegure toma de decisiones más certeras en poco tiempo. Pero recordemos que el Data Warehouse está compuesto por varias bases de datos anteriores que poseen información financiera, administrativa, recursos humanos, etc., por ello se deberá organizar los depósitos de datos y crear roles y permisos necesarios para que de acuerdo a ellos, los usuarios puedan acceder a la información requerida ALCANCE DEL DATA WAREHOUSE: Dependiendo de la empresa el alcance de un Data Warehouse puede ser amplio o limitado (Data Warehouse personal), de cualquier forma es uno de los puntos más importantes para saber concretamente que se desarrollará o a donde irá el nuevo sistema. Algunas empresas prefieren implementar Data Warehouse departamentales o divisionales para luego expandirlos como usuarios que retroalimentan el sistema REDUNDANCIA DE DATOS: Existen tres niveles de redundancia de datos que debemos considerar: 29

30 DATA WAREHOUSE VIRTUAL O POINT TO POINT : Significa que los usuarios finales pueden tener acceso a las bases de datos operacionales (OLTP) directamente utilizando herramientas adecuadas. El resultado de esta técnica descrita provee flexibilidad y mínima cantidad de datos redundantes DATA WAREHOUSE CENTRAL : Al tener una sola base de datos física que tiene toda la información para un área específica de la empresa, se dice que es el concepto inicial de un Data Warehouse. Este tipo de Data Warehouse se lo utiliza cuando dentro de la empresa existe una necesidad común de datos y un gran número usuarios finales conectados a una computadora central DATA WAREHOUSE DISTRIBUÍDOS : Son aquellos en los que algunos componentes se distribuyen a bases de datos físicas diferentes. Este tipo de Data Warehouse involucra muchos datos redundantes, por esta razón los procesos de actualización y carga son más complejos ya que los datos necesarios para la toma de decisiones se envían a la red local para filtrarlos y obtener un resultado real y fiel TIPO DE USUARIO FINAL: Se debe tomar en cuenta que existen diferentes tipos de usuario final (ejecutivos, gerentes, analistas financieros, administrativos, etc.) y por lo tanto diferentes requerimientos al momento de implementar el Data Warehouse ELEMENTOS CLAVES PARA EL DESARROLLO DE UN DATA WAREHOUSE: Antes de desarrollar un Data Warehouse es muy importante tomar en cuenta: 30

31 ARQUITECTURA DEL DEPÓSITO: Un Data Warehouse exitoso debe iniciar con la estructura lógica y física de la base de datos, todo ello conjuntamente con las prestaciones necesarias para operar y mantenerlo. Dentro de la estructura física se pueden tomar en cuenta las siguientes alternativas de arquitectura: ARQUITECTURA CENTRALIZADA: Esto quiere decir que los datos de la empresa pueden ser almacenados en fuentes diferentes tanto internas como externas. Este enfoque proporciona eficiencia tanto en la potencia de procesamiento como en los costos del soporte. FIGURA. N : Arquitectura Centralizada FUENTE: OSA.HTM En esta arquitectura las bases de datos de alimentación OLTP son almacenadas dentro de un mismo servidor. 31

32 ARQUITECTURA GLOBAL: Este tipo de arquitectura distribuye la información entre diferentes servidores, es decir los datos se almacenan por separado. FIGURA. N.- 2.4: Arquitectura Global: FUENTE: OSA.HTM Los datos son almacenados por categorías en diferentes servidores ARQUITECTURA POR NIVELES: Esta arquitectura almacena datos resumidos en una estación de trabajo del usuario, los detalles se van desarrollando en los siguientes servidores. 32

33 FIGURA. N.- 2.5: Arquitectura por Niveles: FUENTE: OSA.HTM Los datos son divididos por niveles de detalle. El primer nivel satisface la mayor parte de requerimientos del usuario ARQUITECTURA DEL SERVIDOR: Luego de tomar la decisión de una arquitectura distribuida o centralizada es importante considerar la clase de servidor que se utilizará para procesar los datos, de esta forma tenemos SERVIDORES DE UN SOLO PROCESADOR: Son mucho más fáciles de administrar, pero la potencia de procesamiento y escalabilidad es limitada. Sin embargo un servidor de redes puede ser ampliado mediante arquitecturas distribuidas las cuales utilizan productos tales como: DCE 7 o CORBA 8. 7 DCE (Distributed Computing Environment). 8 CORBA (Common Objects Request Broker Architecture). 33

34 Estas arquitecturas permiten cambiar a un servidor backup si un servidor falla, esto beneficia pero la gestión de sistemas es más compleja MULTIPROCESAMIENTO SIMÉTRICO: Es conocido como el poder de los CPU, las máquinas de Multiprocesamiento Simétrico 9 aumentan mediante la adición de procesadores que comparten la memoria interna de los servidores y los dispositivos de almacenamiento de disco. Entre sus características tenemos: El poder del procesamiento es fijo. El CPU solo puede ir a una velocidad. Es finito PROCESAMIENTO EN PARALELO MASIVO: Una máquina de procesamiento en paralelo masivo 10 (Massively Paralell Processing MPP), conecta un conjunto de procesadores por medio de un enlace de banda ancha y de alta velocidad. Para optimizar esta arquitectura MPP se necesita realizar operaciones paralelas (que operen por separado). Sus características son: Son escalables. No son muy costosas. 9 SMP (Symmetric MultiProcessing). Más información: 10 MPP (Massively Paralell Processing). Más información: 34

35 ELECCIÓN DE HERRAMIENTAS: La elección de las herramientas será según las necesidades de los usuarios finales, los requerimientos económicos de la empresa. FIGURA. N : Esquema para la Implementación de un Data Warehouse: IMPLEMENTACIÓN Definir Procesos Definir Consultas FUENTE: Rebeca Mideros. La figura muestra gráficamente los pasos recomendados para la implementación de un Data Warehouse. 2.3 DESCRIPCIÓN DE LA IMPLEMENTACIÓN DE UN DATA WAREHOUSE En esta fase se llevarán a cabo los planes de diseño en las herramientas elegidas como las más adecuadas para la empresa (según los req uerimientos de la misma), es decir se pondrá en práctica todos los conceptos aprendidos hasta ahora, así como los recursos humanos tecnológicos y el presupuesto adecuado. Sin embargo se deben tomar en cuenta las siguientes consideraciones: IMPLEMENTACIÓN DE UN PROYECTO TOTAL : Se trata de implementar un Data Warehouse hasta un plazo definido por el usuario. Este plazo podría ser perjudicial para la empresa ya que el proyecto se entregaría al término del mismo y no se podrían ver las 35

36 necesidades del usuario final en cada fase de implementación, es posible que los gastos sean mayores y los resultados poco productivos IMPLEMENTACIÓN DE UN PROYECTO EN FASES: Es la mejor alternativa para implementar un Data Warehouse, ya que se obtendrán resultados a corto plazo y con mayor interacción de los usuarios finales según se va desarrollando el proyecto MODELO LÓGICO DE DATOS: El modelo lógico de datos debe cubrir todas las necesidades de la empresa tales como: Mercadeo, comercialización, gestión de clientes, productos, ventas, etc ESTRATEGIAS EN LA IMPLEMENTACIÓN: DEFINIR LOS PROCESOS: Dentro de estos procesos están los de extracción de información, carga de datos, filtros, administración de información DEFINIR LAS FORMAS DE CONSULTA: De acuerdo al tipo de usuario y permisos de los mismos. Las consultas deben satisfacer las necesidades del usuario final para resolver cualquier problema y deben tener un tiempo respuesta aceptable. 2.4 DESCRIPCIÓN DEL TESTING EN UN DATA WARE HOUSE Esta es una etapa crucial en el desarrollo de un Data Warehouse, puesto que aquí podremos observar la confiabilidad de los datos. Si las etapas anteriores tales como: análisis, diseño, e implementación fueron exitosas pero los repositorios de datos fueron alimentados por mala información los resultados serán incorrectos y falsos, dañando la credibilidad de la implementación. Para evitar estos problemas deberemos: 36

37 2.4.1 ANALIZAR LOS DATOS DE LA EMPRESA: La información de los sistemas de alimentación del Data Warehouse debe ser exacta a nuestro sistema. Es necesario analizar y transformar los datos para que sean coherentes y confiables ASEGURAR LA INTEGRIDAD REFERENCIAL: Data Warehouse tiene la capacidad de identificar cada objeto del negocio y realizar consultas de prueba PRODUCIR LA METADATA: Es decir realizar una descripción del tipo de datos, formato y todo lo relacionado al negocio. De encontrarnos con datos erróneos dentro del sistema se procederá a la limpieza de los mismos, para lo cual existen herramientas que nos pueden ayudar en la limpieza de datos y pueden ser las siguientes: LIMPIEZA O FILTRO DE DATOS MODERADO: Existen dos caminos: PROGRAMAR FUNCIONES DE LIMPIEZA DE DATOS: La puede realizar un consultor, la ventaja es que se puede evitar el gasto en herramientas específicas de limpieza, es decir está al alcance de empresas medianas y pequeñas. La desventaja es el largo tiempo dispuesto para la elaboración de la función y posibles errores en el proceso ADQUIRIR SOFTWARE DE GESTIÓN DEL DATA WAREHOUSE: Este tipo de herramientas tienen algunas ventajas tales como: permiten la extracción de los datos desde las bases de datos operacionales, carga de los datos en una base de datos de depósito, administración de la metadata. En el mercado las 37

38 podemos encontrar como: Warehouse Manager de Prism Solutions o Passport de Carleton. En el año 2000 su precio que iba desde $75000 a más de $ Es decir está al alcance de empresas grandes LIMPIEZA DE DATOS INTENSA: Existen dos tipos de herramientas para limpieza de datos intensa: ENTERPRISE/INTEGRATOR: De Apertus Technologies 11 la cual toma tiene una estrategia de limpieza directa, es decir es el desarrollador el que decide que limpiar. Contamos con ventajas tales como: extracción, transformación, carga de datos, repetición, sincronización, administración del metadata. La desventaja su alto costo entre $ y $ (Estos valores monetarios son tomados ha la fecha de realización de esta disertación de grado) INTEGRITY DATA REENGINEERING: De Vality 12, esta herramienta analiza los carácter por carácter de esta forma emergen las regla del negocio. Las ventajas de la herramienta son: menor tiempo en el proceso de limpieza, normaliza, condiciona, y consolida datos. La desventaja su costo es de $ (valor monetario a la fecha de realización de esta disertación de grado), además podría necesitar la ayuda de otra herramienta como Warehouse Manager o Passport. Luego de limpiar los datos de nuestro sistema el siguiente paso es pasarlo a producción. 11 Más información: 12 Más información: 38

39 2.5 DESCRIPCIÓN DEL PASO A PRODUCCIÓN DE UN DATA WAREHOUSE: Después de estudiar y analizar los requerimientos del negocio, haber diseñado e implementado el modelo, la siguiente etapa es el paso a producción del Data Warehouse. Los desarrolladores entregarán manuales y documentación firmada por los responsables. 2.6 CICLO DE DESARROLLO DE UN DATA WAREHOUSE Los pasos que pueden ayudar al desarrollo de un Data Warehouse son muy similares teóricamente al desarrollo de cualquier sistema. Si embargo por trabajar con grandes volúmenes de datos también, requiere de ayuda de varias herramientas para obtener un sistema confiable y apto para la toma de decisiones. FIGURA. N.- 2.7: Ciclo de Desarrollo de un Data Warehouse: ANALISIS DISEÑO IMPLEMENTACIÒN TESTING PRODUCCIÓN FUENTE: Rebeca Mideros. La Figura muestra en síntesis los pasos para el desarrollo de un Data Warehouse explicados en el capítulo dos. 39

40 CAPITULO 3 3. REQUERIMIENTO DE HARDWARE Y SOTFWARE PARA IMPLEMENTAR UN DATA WAREHOUSE Al momento de analizar los requerimientos de la empresa y visualizar al futuro Data Warehouse, es de suma importancia investigar las herramientas en las se lo puede desarrollar sin olvidar detalles como tamaño de la empresa, necesidades, tamaño de la información etc. Esta disertación de grado, se enfoca en dos herramientas para el desarrollo de un Data Warehouse y son: SQL Server Oracle Application Server 10g. Analicemos entonces cada una de ellas ARQUITECTURA DE UN DATA WAREHOUSE EN SQL SERVER ELEMENTOS DE UN DATA WAREHOUSE EN SQL SERVER 2000: Un Data Warehouse construído en SQL SERVER 2000 consta de los siguientes elementos los cuales son de vital importancia dentro de su funcionamiento: Data Transformation Services Depósito de Datos Analices Services Interfaces de Clientes (OLE DB para OLAP ó ActiveX Data Objects Multidimensional ADO MD) Aplicaciones de Clientes 40

41 FIGURA. N : DTS (Data Transformation Services): FUENTE: Microsoft Training and Certification. Los DTS se encargan de filtrar y llevar la información de los diferentes OLTP DATA TRANSFORMATION SERVICES (DTS): Dentro de Sql Server encontramos los DTS los cuales se encargan de: Transforman y mueven los datos de diferentes fuentes Programa tareas DTS. Automatiza las tareas administrativas de OLAP FIGURA. N.- 3.2: Elementos de un Data Warehouse en SQL Server 2000: FUENTE: Microsoft Training and Certification. Observamos los diferentes elementos que conforman un Data Warehouse. 41

42 DEPOSITO DE DATOS (DATA WAREHOUSE): La base de datos relacional no se limita solo a SQL Server 2000, ya que Analysis Services puede ser utilizado con ODBC (Open Database Connectivity)/ OLE DB y se pueden utilizar versiones de: SQL Server versiones 6.5 en adelante Microsoft Access 97 en adelante ORACLE versiones 7.3 y 8.0 FIGURA. N.- 3.3: Depósito de datos Data Warehouse: FUENTE: Microsoft Training and Certification. Obsevamos la información dentro del Data Warehouse o bodega de datos ANALYSIS SERVICES: Un Data Warehouse está compuesto de bases de datos relacionales en las cuales se depositan valores, que luego se despliegan desde la base de datos relacional, mediante reportes. Analysis Services tiene acceso a la base de datos relacional convirtiendo los datos de Data Warehouse en datos entendibles para los analytical reports. 42

43 FIGURA. N.- 3.4: Analysis Services: FUENTE: Microsoft Training and Certification. La Figura muestra Analysis Services que es la herramienta encargada de la creación de cubos de datos INTERFACES DE CLIENTES: Analysis Services posee interfases para el usuario tales como Microsoft Excel 2000 utilizando OLE DB para OLAP y de esta forma poder comunicarse con Analysis Server. OLE DB para OLAP consta de un conjunto de datos el cual permite un acceso multidimencional a los datos, además a través de OLE DB podemos crear aplicaciones para Analysis Services con caracteristicas de Data Mining. ADO MD es un conjunto de instrucciones simples las cuales son usadas por herramientas tales como Microsoft Visual Basic, Excel 2000 y otros ambientes de desarrollo de controles como Microsoft ActiveX. 43

44 FIGURA. N.- 3.5: Interfases de Clientes: FUENTE: Microsoft Training and Certification. La Figura muestra las interfaces de cliente, por medio de las cuales se observa el cubo de datos físicamente APLICACIONES PARA CLIENTES: Describen los roles de usuario dentro de la estructura de Data Warehouse construído en SQL Server COMPONENTES DE ANALYSIS SERVICES: Analysys Services está tiene varios componentes que existen en el servidor y es muy importante conocer la interacción entre ellos. Arquitectura de Analysis Services. Analysis Manager. Características de Analysis Server ARQUITECTURA DE ANALYSYS SERVICES: Existen muchos componentes interactivos para acceder a un cubo de datos en OLAP. Es importante comprender como se relacionan entre si antes d diseñar las bases de datos y posteriormente los cubos. Los componentes vitales dentro de Analysis Services son: Analysis Server, que contiene un motor OLAP y el motor de Data Mining. Decisión Support Objects (DSO). Analysis Manager. 44

45 Origen de datos Relacional. MOLAP stores. PivotTable Service (PTS). OLE DB para OLAP y OLAP DB para Data Mining(DM). ADO MD. Aplicaciones de Cliente. FIGURA. N.- 3.6: Arquitectura de Analysis Services: FUENTE: Microsoft Training and Certification. La Figura muestra la arquitectura completa de Analysis Services, y la interacción entre sus componentes, se observan los orígenes de los datos, Analysis Manager conectado con DSO (Decision Support Objects) y este conectado a Analysis Server ANALYSIS SERVICES MANAGER: Al utilizar Analysis Server como administrador estamos utilizando la aplicación de Analysis Manager. Analysis Manager define cubos de datos, administra el servidor de datos y procesa la ejecución de cubos y dimensiones. 45

46 Analysis Manager trabaja con la consola MMC (Microsoft Management Console), por medio de ella se puede adicionar comandos para automatizar operaciones batch tales como un cubo mensual de procesos. La aplicación de Analysis Manager se comunica con Analysis Server mediante un estrato llamado DSO. DSO es un conjunto de instrucciones programables y un API que permite un control de aplicaciones para Analysis Services. Análisis Manager es una aplicación que utiliza DSO para controlar Analysis Services. El programador puede construir su propia aplicacion DSO para manejar Analysis Server CARACTERISTICAS DE ANALYSIS SERVER: El componente principal de Analysis Services de Analysis Server el cual es un servidor de base de Datos de OLAP y un servidor de Data Mining que corre en Microsoft Windows 2000, Microsoft Windows NT 4.0 con Service Pack 5 o superior REPOSITORIO DE METADATA: Este repositorio se encuentra en el Analysis Server y contiene toda la información de la base de datos. Dentro de este repositorio podemos ingresar nuevos datos a la base. Por defecto el repositorio de Analysis Server está en Microsoft Access r dentro del directorio Bin OPCIONES DE ALMACENAMIENTO DE CUBOS: Para diseñar y configurar cubos OLAP, lo más importante es optimizar el almacenamiento del cubo y su rendimiento de sus consultas. Analysis Services utiliza una variedad de opciones de almacenamiento para diseño y construcción de cubos OLAP, tales como: Modelos de almacenamiento. Particiones. Cubos Virtuales. Conexión de Cubos. 46

47 Arquitectura de la base de datos. Limites de Analysis Server MODELOS DE ALMACENAMIENTO: Estos modelos se diferencian por el tipo de almacenamiento tales como: agregación de diseño, agregación de construcción, partición y dimensiones de construcción. Cualquiera de estos tres modelos de almacenamiento no soporta almacenamiento Null y proveen el mismo modelo multidimensional a clientes, usuarios y aplicaciones. A continuación revisaremos brevemente las características de los modelos desarrollados en el capítulo uno ALMACENAMIENTO MOLAP: Cuando utilizamos el modelo MOLAP para almacenar datos el formato del cubo será el siguiente: La respuesta a una consulta utilizando un cubo con almacenamiento MOLAP es muy veloz, lo que facilita al usuario al momento de tomar una decisión. Existe duplicación de datos porque la Fact Table es construída dentro Analysis Sever. Es Económico en cuanto a almacenamiento en disco, ya que posee algoritmos de comprensión eficientes. Las consultas para Analysis Server no pueden acceder al manejo de sistemas de base de datos relacionales (RDBMS). Si el servidor de RDBMS es apagado el Analysis Services no es afectado ALMACENAMIENTO ROLAP: Cuando utilizamos ROLAP todos los datos detallados y agregaciones son almacenadas en RDBMS. El único dato almacenado en Analysis Sever es la jerarquía dimensional, ROLAP asume las dimensiones que no son utilizadas. 47

48 Las características del almacenamiento ROLAP son: Analysis Server reparte el almacenamiento entre clientes y RDBMS tomando en cuenta un nivel de jerarquía multidimensional. Todo tipo de consulta satisfecha por el usuario debe tener acceso a RDBMS por medio de sus tablas. Los cubos con modelo de almacenamiento ROLAP son mucho más lentos que los MOLAP al momento de realizar una consulta ALMACENAMIENTO HOLAP: Cuando utilizamos el modelo de almacenamiento HOLAP, los datos son almacenados de forma detallada dentro de RDBMS y las agregaciones son almacenadas en un formato multidimensional. Las carácterísticas del modelo de almacenamiento HOLAP son: HOLAP es una fusión entre MOLAP y ROLAP en cuanto a rendimiento y almacenamiento en disco. Los datos no son duplicados por lo tanto el disco no es saturado con datos repetidos. Las consultas no son tan lentas como en el modelo ROLAP y no es tan veloz como MOLAP. El tiempo de procesamiento para cubos HOLAP es similar al tiempote proceso de cubos MOLAP. 48

49 FIGURA. N.- 3.7: Modelos de OLAP: FUENTE: Microsoft Training and Certification. La Figura muestra las diferentes formas de almacenamiento en SQL Server PARTICIONES: Una partición es una unidad de almacenamiento definido por un cubo OLAP. Analysis Services brinda esta característica para incrementar la escalabilidad del cubo. Por defecto un cubo consta de una sola partición pero podemos almacenar datos en un cubo creando más particiones, cabe decir que cada partición puede tener un modo de almacenamiento diferente y estar almacenada en computadores diferentes. Los cubos que poseen múltiples particiones tienen dos ventajas principales que son: menor tiempo de procesamiento en cubo y mayor eficacia al momento de realizar consultas, de esta forma tenemos que: A una partición se la puede procesar sin que las otras particiones interfieran en el proceso, de esta forma podemos obtener respuesta en un corto tiempo. Una partición específica puede ser procesadas desde otras particiones 49

50 El rendimiento de las consultas se puede mejorar si las consultas necesitan acceder solamente a una única partición ARQUITECTURA DE LA BASE DE DATOS: La arquitectura de la base de datos deben estar organizadas de la siguiente manera: Un Analysis Server contiene uno a más bases de datos Cada Base de datos contiene uno o más cubos de datos. Cada cubo posee una o más particiones. Cada partición puede tener diferentes modelos de almacenamiento, diferente diseño de agregación y puede almacenarse en diferentes computadoras LIMITES DE ANALYSIS SERVER: Analysis Services posee algunas limitaciones en cuanto a dimensiones y medidas todas ellas las visualizamos en la tabla siguiente: TABLA N.-3.1: Límites de Analysis Server: ITEMS Base de Datos por Servidor. Cubos por base de Datos. Cubos por cubo virtual. Dimensiones por Cubo. Medidas por Cubo. Miembros calculados por Cubo. Niveles de Dimensión. Particiones por Cubo. LIMITES Ilimitados. Ilimitados. 64 cubos. 128 dimensiones / cubo medidas / cubo miembros / cubo. 64 niveles de dimensión. Ilimitados. Fuente: Microsoft Training and Certification. La tabla muestra la cantidad máxima de cubos, dimensiones, medidas, etc. Que puede manejar Analysis Server dentro de una base de datos. 50

51 ARQUITECTURA DEL CLIENTE: Para desarrollar un Data Warehouse el cliente debe contar con : PTS (PivotTable Service). Arquitectura PTS (PivotTable Service). IntelligenceCaching. Expresiones Multidimensionales (MDX). Internet para soporte de clientes PIVOTTABLE SERVICE: Todas las aplicaciones del cliente deben comunicarse con Analysis Server a través de PTS. PTS es un componente de OLAP que fue diseñado para Analysis Server, es un OLE DB que da soporte para extensiones OLE DB para OLAP, funciona también como ADO MD. PTS no es una interfase pero interactúa con Excel PTS posee características similares a Analysis Server y estas son: Datos inteligentes y Quero caching. Motos MX donde se define los clientes y los servidores. Habilidad para crear cubos. Los cubos de Analysis Server se basan en servidores pero los cubos PTS son considerados como cubos locales ARQUITECTURA PTS: Todos los clientes que acceden a un cubo de datos deben comunicarse por medio de PivotTable Services. Cuando se utiliza Analysis Manager para administrar cubos y posteriormente visualizarlos mediante un browser, Analysis Manager tiene comunicación con PTS para visualizar los datos. No se necesita instalar nada adicional ya que PTS junto con Analysis Services (Server or Client Components), o al instalar Office PTS corre en a partir de la versión de Windows

52 FIGURA. N.-3.8: Arquitectura PTS: FUENTE: Microsoft Training and Certification. La Figura muestra el funcionamiento de PTS, que es el responsible de la visualización de los datos INTELLIGENCECACHING: Analysis Server utiliza IntelligenceCaching para ejecutar las consultas de una forma más eficaz y funciona de la siguiente manera: Si un usuario ejecuta una consulta y los datos consultados no existen esta información viaja a través del servidor cache. Si dentro del servidor cache no existe el dato, los resultados de la búsqueda serán transportados desde el disco al servidor cache. Si los resultados se encuentran dentro de client cache los resultados de la búsqueda se visualizaran sin necesidad de buscarlos en el Server cache EXPRESIONES MULTIDIMENSIONALES: Es el lenguaje multidimensional d las consultas y posee las siguientes características: 52

53 MDX es parte de OLE DB para OLAP API, y soporta múltiples bases de datos. Un subconjunto de MDX se utiliza para crear miembros calculados. MDX es la llave para añadir capacidades analíticas de Analysis Services INTERNET PARA SOPORTE A CLIENTES: Las aplicaciones del cliente pueden conectarse a Analysis Server por medio de IIS 13 utilizando http 14. Para conectar Analysis Server con IIS, se definirá un localizador de recursos uniforme (URL) para el nombre del servidor Data Source en propiedades de conexión del cliente. De esta forma PTS pasará a través de firewalls o del servidor Proxy para accesar a Analysis Server. Al utilizar SQL Server 2000 Enterprise Edition podremos tener todas las ventajas que ofrece IIS y HTTP en cuanto a conectividad con Analysis Server COMPONENTES OLAP DE OFFICE 2000: PivotTable Service esta directamente relacionado con Office 2000 y tiene algunas características que dependen de PTS EXCEL PIVOTTABLES: En sus inicios con Excel versión 5.0 PivotTable no podía soportar una cantidad grande de datos pero a partir de la versión de Office 2000 eso ha terminado ya que ahora es capaz de analizar todos los datos exportados de Data Wahouse para su correspondiente análisis CUBOS LOCALES (LOCAL CUBES): PTS tiene la capacidad de crear cubos locales de datos y realizar consultas como en un cubo de Analysis Server ahora con Excel 13 IIS (Microsoft Internet Information Services). 14 http (Hypertext Transfer Protocol). 53

54 2000 que tiene una Interface la cual permite realizar esta función WEB PIVOT CONTROL: Incluye ActiveX con controles de Office 200 diseñados para páginas Web. El control Pivot es similar a un PivotTable de Excel ya que nos faculta la habilidad de deplorar aplicaciones de Intranet y estas tienen acceso a páginas Web con datos OLAP. 54

55 3.1.6 ARQUITECTURA DE UN DATA WAREHOUSE EN ORACLE 10g Los componentes centrales de Oracle Application Server son tres: Oracle HTTP Server. Oracle Application Server Containers para J2EE. OracleAS Web Cache ORACLE HTTP SERVER: Es el servidor Web para Oracle Application Server. Su funcionamiento es el siguiente: Toma un requerimiento nuevo en la forma de un URI. El requerimiento es enviado directamente a el solicitante en forma de un archivo con contenido estático por ejemplo un HTML. Este proceso lo realiza por medio de OracleAS Web Caché Retorna el archivo con un contenido dinámico, el cual puede ser manejado como ejecutable. Oracle HTTP Server puede procesar un requerimiento dinámico utilizando lo siguiente: Commom Gateway Interface (CGI): Pueden ser programas escritos en C, C++, Java, otros lenguajes de programación. Oracle HTTP, está basado en el servidor Web de Apache ORACLE APPLICATION SERVER CONTAINERS PARA J2EE: Maneja JavaServer Pages que tiene un entorno Java que es escalable horizontal y verticalmente. Trabaja de la siguiente manera: Si Java genera un archivo, es procesado usando JavaServerPages. Envían un contenido dinámico para Oracle HTTP Server. Este contenido pasa a OracleAS Web Cache. 55

56 ORACLEAS WEB CACHE: Es un componente opcional, que puede ser muy útil en procesos como los siguientes: Retira los archivos con contenido dinámico o estático de Oracle HTTP Server. OracleAS Web Cache, es programable y se lo puede configurar para las aplicaciones que requieran sus servicios. Puede servir como front end para cargar datos cuando Oracle Application Server está en proceso de almacenamiento. Trabaja de la siguiente manera: Recibe un usuario final y determina si está o no disponible en su caché. Si está disponible retorna el contenido. Caso contrario envía el pedido o requerimiento a Oracle HTTP Server ARQUITECTURA DE ORACLE APPLICATION SERVER: La arquitectura de Oracle Application Server 10g, está dividida en dos partes que son: OracleAs Metadata Repository. Oracle Identity Management ORACLEAS METADATA REPOSITORY: OracleAs Metadata Repository, es una base de datos que contiene la información sobre el negocio la cual nos sirve de base para realizar un proyecto. OracleAs guarda la configuración de Oracle Application Server y de otros componentes en una colección de esquemas. Entre los más conocidos están SYS, SYSMAN, OLAPSYS, GLOBAL, GLOBAL-AW, y se encuentran almacenados dentro de Oracle. 56

57 ORACLE IDENTITY MANAGEMENT: Es un término usado con Oracle Application Server 10g que abarca todos los componentes usados, para crear un ambiente seguro dentro de Oracle. Estos componentes dependen del OracleAs Metadata Repository ORACLE INTERNET DIRECTORY: Maneja el directorio de esquemas y usuarios para ingresar al entorno de Oracle y poder desarrollar un proyecto ORACLE DIRECTORY PROVISIONING INTEGRATION SERVICE: Permite que el directorio importe y copie datos sean homogéneos o heterogéneos ORACLE DELEGATED ADMINISTRATION SERVICES: Permite el ingreso de nuevos administradores y usuarios. Esta información es actualizada en Oracle Internet Directory ORACLE SINGLE SIGN-ON: Maneja el ingreso a cualquier aplicación de Oracle por medio de las claves definidas al momento de la instalación ORACLEAS CERTIFICATE AUTHORITY: Se encarga de manejar el protocolo SSL (Secure Sockets Layer), el cual vigila que los datos que van desde el browser hasta el web se encuentren encriptados para evitar manipulación de la información APPLICATION SERVER CONTROL: Es la interface gráfica que maneja Oracle, la cual se encarga de monitorear, controlar y manejar las instancias de Oracle Application Server. 57

58 Utiliza Oracle Enterprise Manager 10g, que es la herramienta más completa al momento de desarrollar Data Warehouse, sin necesidad de cambiar de entorno. Oracle Enterprise Manager permite crear directamente: Cubes. Dimensions. Materializad Views. Tables. 3.2 CARACTERISTICAS DE UN DATA WAREHOUSE EN ORACLE: Un Data Warehouse en ORACLE, soporta: Extracción, transformación y carga de Datos desde múltiples orígenes (ETL son las siglas de este proceso). Almacenamiento y manejo de datos basado en un modelo relacional de datos (RDBMS). OLAP (Analytical Processing of Data) que ofrece selección, agregación, y análisis estadístico de datos empleando un modelo multidimensional. Técnicas de Data Mining manejando inteligencia 3.3 SISTEMAS OPERATIVOS PARA ORACLE: ORACLE desarrolla un rendimiento superior en cuanto al desarrollo de bases de datos y Data Warehouse específicamente en: Windows Server System (desde Windows 2000) Windows XP Linux Red Hat A.S. 3.4 PORQUE CREAR UN DATA WAREHOUSE EN ORACLE?: Un Data Warehouse construido en ORACLE ofrece los siguientes beneficios: Diseño rápido: se maneja por medio de wizards. Diseño Centralizado: debido a su arquitectura toda la información se encuentra dentro de un mismo lugar (OracleAS Metadata Repository). Mejora el performance, escalabilidad. 58

59 Ofrecer administración eficiente, segura y confiable de datos para aplicaciones de high-end como procesamiento de transacciones on-line (OLTP) de alto volumen (Data Warehouses) que requieren muchas consultas y aplicaciones exigentes para Internet. Proporcionar herramientas y funcionalidad para cumplir los requerimientos de accesibilidad y escalabilidad de las actuales aplicaciones de misión crítica para la empresa. 59

60 CAPÍTULO 4 4. IMPLEMENTACIÓN DE UN PROTOTIPO DE DATA WAREHOUSE EN SQL SERVER 2000 Antes iniciar con la implementación de un prototipo de Data Warehouse en SQL Server 2000 o en Oracle 10g, se recomienda en base a la experiencia, que la información haya pasado por las etapas de análisis y diseño. Concluidos estos pasos se procede a crear las tablas de dimensión y la Fact table 15, para consecutivamente trasladarlas a la herramienta (Analysis Manager 16 u Oracle Enterprise Manager 17 ) a fin de poder visualizarla en forma de cubos de información CREACION DE LAS TABLAS DE DIMENSION Y FACT TABLE EN SQL SERVER 2000: Para la presente disertación de grado se obtuvo una tabla general de transacciones de ventas del año 2004, correspondiente a mercancía de Artefacta (datos reales). Esta tabla tuvo que ser sometida a un análisis para conocer cada uno de los campos y posteriormente crear dimensiones y Fact Table. El número de registros de la tabla de Artefacta originalmente contenía registros, sin embargo al momento de subir la información a la Fact Table creada, se presentaron inconvenientes con algunos de ellos, debiendo ser borrados y se obtuvieron finalmente , los cuales son presentados en forma de cubos de datos. Para el caso de las dimensiones, se las crea utilizando los conocimientos y conceptos de bases de datos. 15 Fact Table explicado en el capítulo Analysis Manager explicado en el capítulo Oracle Enterprise Manager explicado en el capítulo

61 FIGURA. N.-4.1: Creación de las tablas de dimensión o dimension tables: FUENTE: Captura de pantalla tomada de SQL Server Enterprise Manager. Creación de las tablas de dimensión y llenado de datos de las mismas. Tanto para la creación de dimension tables y Fact table se disponen los siguientes pasos: Ingresar a SQL Server Enterprise Manager. Se crean las tablas de acuerdo a las sentencias SQL conocidas. Las tablas con pocos registros pueden ser llenadas con la sentencia Insert de SQL. En el caso de tablas con varios registros se procede a la importación de datos de la siguiente manera: Ingresar a Enterprise Manager. Dentro de Enterprise Manager, se escoge la Tabla creada y se pulsa doble click, aparece una pantalla como esta: 61

62 FIGURA. N.-4.2: Importación para llenado de datos en la Fact Table: FUENTE: Captura de pantalla tomada de SQL Server Enterprise Manager. Importación de datos para llenar la Fact Table creada. Seleccionar Importar Datos y se escoge la base de datos en la cual se va a trabajar. A continuación se visualizan tres opciones para llenar la tabla: o Copiar las tablas y vistas de la base de datos de origen. o Usar una consulta para especificar que datos se van a trasferir. o Copiar objetos y datos entre bases de datos de SQL Server. 62

63 FIGURA. N.-4.3: Especificación de Origen de datos para la importación: FUENTE: Captura de pantalla tomada de SQL Server Enterprise Manager. Para la elaboración de esta disertación de grado se utilizó una consulta previamente realizada para llenar datos en la Fact Table. Elegir el destino y observar los datos a copiar. 63

64 FIGURA. N.-4.4: Especificación de Destino de datos y vista previa de los mismos: FUENTE: Captura de pantalla tomada de SQL Server Enterprise Manager. En esta pantalla especificamos el destino de los datos y podemos observar los 100 primeros registros. De esta forma se finaliza la importación de los datos. 64

65 FIGURA. N.-4.5: Confirmación de copia de los datos: FUENTE: Captura de pantalla tomada de SQL Server Enterprise Manager. Al realizar la importación de datos la Fact Table es alimentada con los mismos CÓMO ACCEDER A ANALYSIS MANAGER? Es momento de implementar el prototipo de Data Warehouse en SQL Server 2000, para ello se debe acceder a Analysis Manager, que es la interface entre Analysis Services y el usuario, se despliega dentro del MMC (Microsoft Management Console). Los pasos para acceder al Analysis Manager son los siguientes: En Inicio, Programas, Microsoft SQL Server, Analysis Services, Analysis Manager. Despliega una pantalla como esta: 65

66 FIGURA. N.-4.6: Pantalla principal de Analysis Services: FUENTE: Captura de pantalla tomada de SQL Server 2000, Análisis Services. La Figura muestra la consola donde trabaja Analysis Services. MMC. Se trabaja con la división izquierda de la pantalla. 4.3 CÓMO EMPEZAR LA CONSTRUCCIÓN DEL PROTOTIPO DE DATA WAREHOUSE EN SQL SERVER 2000? Para empezar con la construcción del prototipo de Data Warehouse, se necesita crear una base de datos nueva. Los pasos son los siguientes: 66

67 Abrir la carpeta de Analysis Server donde se pueden visualizar los servidores activos, bases de datos creadas. Para crear una nueva se hace click derecho sobre el servidor y se escoge nueva base de datos. FIGURA. N.-4.7: Creación de nueva base de Datos: FUENTE: Captura de pantalla tomada de SQL Server 2000, Análisis Services. Creación de la Base de Datos en la cual se desarrollará el prototipo. Despliega una pequeña pantalla donde pide el nombre de la nueva base de datos, así como una descripción breve. Luego de realizado el procedimiento, se puede observar que la base de datos creada, se encuentra dentro del MMC. Analysis Services crea automáticamente carpetas para almacenar los orígenes de datos, cubos de datos, dimensiones compartidas, modelos de Data Mining, y Roles de Bases de datos. 67

68 FIGURA. N.-4.8: Atributos de la nueva base de datos: FUENTE: Captura de pantalla tomada de SQL Server 2000, Análisis Services. Analysis Services crea automáticamente las carpetas para almacenar orígenes de datos, cubos, dimensiones, modelos de minado de datos y roles CONFIGURAR EL ORIGEN DE DATOS (DATA SOURCE): El origen de datos contiene toda la información necesaria (Tablas de informacíon) para desarrollar el Data Warehouse. Para empezar la implementación se lo debe configurar, ya que de la información contenida depende el desarrollo del Data Warehouse. La configuración se realiza de la siguiente manera: Dentro del MMC, se encuentra la nueva base de datos que contiene carpetas, se ubica el mouse dentro de la carpeta Data Source (Origen de Datos). 68

69 Hacer click derecho y escoger la opción New Data Source (nuevo origen de datos). Se despliega una nueva pantalla en Proveedor, se escoge Microsoft OLE DB Provider for SQL Server. En la pestaña Conexión, pide datos como Nombre del Servidor, el segundo numeral escogemos Usar la seguridad integrada de Windows NT y finalmente seleccionamos la base de datos creada y Aceptar. FIGURA. N.-4.9: Configuración del origen de datos: FUENTE: Captura de pantalla tomada de SQL Server 2000, Análisis Services. Escoger el proveedor y la conexión necesarias para acceder a los datos. Luego de configurar el origen de datos, se procede con la implementación del prototipo de Data Warehouse en SQL Server

70 4.3.2 CREACIÓN DE CUBOS DE DATOS: En MMC, se observa la segunda carpeta llamada Cubes, con click derecho escoger New Cube (Nuevo Cubo). Se despliega la pantalla de Cube Wizard, pulsar Next. Abre la siguiente pantalla en donde pide escoger la Fact Table. Es importante recordar que esta es la tabla principal y solamente debe contener valores numéricos, tales como números, fechas, valores monetarios. Ninguno tipo char. Dentro de Browse Data, muestra el contenido de la tabla. A continuación muestra una pantalla para escoger las dimensiones o Dimension Tables, pulsar New Dimension y escoger las dimensiones del cubo. Si la clave foránea está relacionada solo con la Fact table el modelo será Star Schema. Si la clave foránea de una tabla se relaciona con otra tabla escogemos Snowflake Schema. Y para relaciones laborales o geográficas Parent Child. Para la elaborción de esta disertación de grado se utilizó el modelo Star Schema y una dimensión de tiempo. 70

71 FIGURA. N.-4.10: Creación de dimensiones: FUENTE: Captura de pantalla tomada de SQL Server 2000, Análisis Services. Escogemos las dimensiones (lo que vamos a visualizar en el Data Warehouse). Luego de crear las dimensiones pulsar Next y finaliza la creación del cubo de datos. Inmediatamente despliega una nueva pantalla llamada Cube Editor, en el cual se puede visualizar la Fact Table (Amarilla) y las Dimension Tables (Azules), en la división izquierda se observan carpetas de dimensiones, medidas, miembros calculados, celdas calculadas, etc. 71

72 FIGURA. N.-4.11: Edit Cube: FUENTE: Captura de pantalla tomada de SQL Server 2000, Análisis Services. La Figura muestra el Star Schema compuesto por sus dimension tables y la Fact Table, en el lado izquierdo visualizamos las medidas y dimensiones creadas. Al cerrar el Cube Editor, despliega una pantalla hacer un clic sobre Yes, para escoger la forma de almacenamiento del cubo dentro de Storage Aggregation Options. Sql Server 2000 recomienda escoger la opción Performance gain reaches, con el 40% agregaciones (datos precalculados los cuales se calcularán al procesar el cubo), la cual ayuda a visualizar el 72

73 rendimiento frente al espacio en disco, pulsar continue, Next, Process Now, Finish. FIGURA. N.-4.12: Elegir el modelo de almacenamiento : FUENTE: Captura de pantalla tomada de SQL Server 2000, Análisis Services. La Figura muestra el modelo de almacenamiento para SQL entre MOLAP, ROLAP Y HOLAP. 73

74 FIGURA. N.-4.13: Visualización del cubo de información en SQL Server 2000: FUENTE: Captura de pantalla tomada de SQL Server 2000, Análisis Services. Finalmente se puede visualizar el cubo de información y realizar las consultas necesarias CUBO DE DATOS EN EXCEL: Excel da la facilidad de observar el cubo de datos, los pasos son los siguientes: En la barra escoger Datos, Obtener Datos Externos, Nueva Consulta de Base de Datos. Se despliega una pantalla y elegir Cubos OLAP y se inicia la conexión entre la base de datos y Excel. 74

75 FIGURA. N Conexión con Cubos OLAP desde Excel: FUENTE: Captura de pantalla tomada de Excel. Se realiza la conexión entre la base de datos y Excel para visualizar el cubo de información. Para finalizar pulsar Finish. Se pueden observar las dimensiones y medidas dentro de Excel y realizar toda tipo de consultas en esta herramienta, el manejo de los datos es muy similar al manejo en SQL Server 2000, por lo que no hay ningún problema al momento de manipular la información. 75

76 FIGURA. N Visualización de Cubos OLAP desde Excel: FUENTE: Captura de pantalla tomada de Excel. Se observa un cubo muy similar a uno en SQL Server 2000 y se pueden realizar las consultas necesarias para el negocio FUTURO DE DATA WAREHOUSE EN SQL 2005: La tecnología sigue creciendo y es por esta razón que SQL Server 2005, tiene algunos cambios en su arquitectura y nuevas características para el desarrollo de un Data Warehouse en esta herramienta ARQUITECTURA DE SQL SERVER 2005: Se presentan cambios en la arquitectura de SQL Server 2005 los cuales detallamos a continuación: 76

77 INTEGRATION SERVICES: Se puede decir que Integration Services es el sucesor de los DTS de SQL Server Es un concepto nuevo que ha sido diseñado para convertirse en una plataforma ETL. Incluye herramientas gráficas y wizards. FIGURA. N Integration Services FUENTE: technologies/ssasvcs.mspx. La Figura muestra los componentes Integration Services, los cuales trabajarán como los DTS en SQL Server ANALYSIS SERVICES: Al igual que en SQL Server 2000, Analysis Services para SQL Server 2005, soporta diseño, creación y manejo de estructuras multidimensionales. 77

78 REPORTING SERVICES: Es un componente de la plataforma de Business Intelligence que crea, maneja y visualiza reportes ad hoc. Se accede a ella por medio de Report Builder DATABASE ENGINE: Es el motor de base de datos de SQL Server 2005, es el lugar en donde se almacena y procesa datos SQL SERVER 2005 Y DATA WAREHOUSE: SQL Server 2005, añade dos componentes nuevos para la construcción de modelos dimensionales Data Warehouse y son: SQL Server Management Studio. SQL Server Business Intelligence Development Studio SQL SERVER MANAGEMENT STUDIO: Se lo utiliza para manejar todas las bases de datos de SQL Server. Ofrece un manejo integrado de las bases de datos relacionales por medio de Analysis Services e incluye otras herramientas tales como: Server console management (reemplaza a Enterprise Manager y Analysis Manager). Query Analysis (Sql y MDX). Flight Recorder y Capture and Relay (capturan los eventos que suceden dentro del servidor, esto hace más fácil el diagnóstico de algún problema) SQL SERVER BUSINESS INTELLIGENCE DEVELOPMENT STUDIO: Es el ambiente de diseño para Business Intelligence está construído en Visual Studio 2005 y es muy amigable para el usuario. 78

79 Trabaja conjuntamente con Analysis Services y Reporting Services. La meta de SQL Server 2005, es soportar el desarrollo de aplicaciones multidimensionales y de business intelligence de gran tamaño. Es una herramienta fácil de manejar, con servicio web y que provee suficiente información sobre la construcción y desarrollo de aplicaciones multidimensionales y business intelligence. Podemos comparar las diferencias entre SQL Server 2000 y SQL Server 2005 en la siguiente tabla: TABLA 4.1: Diferencias y equivalencias entre SQL Server 2000 y SQL Server TAREA SQL SERVER 2000 SQL SERVER 2005 Extraccion, Transformación y Data Transformation Services Carga (ETL) (DTS). Data Warehouse Relacional SQL SERVER 2000 Relational database. Bases de Datos SQL SERVER 2000 Analysis Multidimensionales Services. Data Mining SQL SERVER 2000 Analysis Services. Manejo de reportes SQL SERVER 2000 Reporting Services. Reportes Ad hoc. SQL SERVER 2000 Reporting Services. Ad hoc Query y Analysis Microsoft Office (Excel, Componente web para Office, Data Analyzer, SharePoint Portal). SQL SERVER 2005 Integration Services. SQL SERVER 2005 relational database. SQL SERVER 2005 Analysis Services. SQL SERVER 2005 Analysis Services. SQL SERVER 2005 Reporting Services. SQL SERVER 2005 Reporting Services. Microsoft Office (Excel, Componente web para Office, Data Analyzer, SharePoint Portal). Fuente: sqlsy.mspx Se observan las diferentes herramientas para construir un Data Warehouse en SQL Server 2000 y SQL Server

80 CAPÍTULO 5 5. IMPLEMENTACIÓN DE UN PROTOTIPO DE DATA WAREHOUSE EN ORACLE 10g : De igual forma que en SQL Server 2000, el primer paso para la construcción de un prototipo de Data Warehouse es la construcción de las tablas de dimension o dimension tables y la Fact table. Para este caso los registros de las tablas, se encuentran grabados en archivos planos. Existen tres formas para construcción de las tablas: Oracle Enterprise Manager. Oracle Management Console. SQL Plus. Desde Oracle Management Console, se definen las tablas de una forma gráfica es decir utilizando el wizard, la construcción es muy sencilla. Desde Oracle Enterprise Manager, se definen dentro del browser. Sin embargo en esta disertación de grado se utiliza SQL Plus, con el código de bases de datos, ya que será de mayor utilidad al momento de cargar los datos en las tablas creadas. 5.1 CONSTRUCCIÓN Y CARGA DE DATOS PARA LAS DIMENSION TABLES Y FACT TABLE: Oracle permite cargar los datos de una forma particular, por esta razón dentro de C:/oracle/globafirstl_install, se han creado varios archivos de texto. 80

81 FIGURA. N.-5.1 Creación de archivos planos: FUENTE: Captura de pantalla tomada de globallfirst_install. La Figura muestra los archivos planos que debemos crear previamente para cargar los datos en las tablas de dimensión o dimension tables. Se crean los archivos de texto.bad, en donde se almacenarán los registros que no pudieron ser copiados a la tabla y archivos.log, en donde se puede observar el mensaje de éxito si todos los registros fueron copiados. Para comprender de mejor manera se proporciona el siguiente ejemplo de la dimension table artículo. 81

82 FIGURA. N.-5.2 Archivos planos: FUENTE: Captura de pantalla tomada SQL Plus. La Figura muestra el contenido de cada uno de los archivos planos. El archivo plano con extensión.dat, contiene todos los registros que debe tener la tabla. Los archivos.ctl,.par, contienen las sentencias de carga de datos. El archivo.sql, contiene la creación de la tabla de dimensión o dimension table. Para iniciar el proceso de creación de tablas y carga de los mismos, se abre SQL Plus y se procede a ejecutar el archivo articulo.sql de la siguiente manera. 82

83 FIGURA. N.-5.3 Creación de las tablas de dimensión o dimension tables, Fact table y carga de datos: FUENTE: Captura de pantalla tomada SQL Plus. La Figura muestra la creación de las tablas de dimensión y Fact table, la sentencia para la carga de los datos es host sqlldr parfile = articulo2004.par. 5.2 CONSTRUCCIÓN DE DIMENSIONES, MEDIDAS Y CUBOS POR MEDIO DE ORACLE ENTERPRISE MANAGER: Para ingresar a Oracle Enterprise Manager la secuencia es la siguiente: Abrir el browser y lo direccionarlo a Oracle Enterprise Manager. Se abre una pantalla para iniciar la conección. Se llenan los campos de usuario y password. Aparece la siguiente pantalla, y se escoje la pestaña de administración. 83

"Diseño, construcción e implementación de modelos matemáticos para el control automatizado de inventarios

Diseño, construcción e implementación de modelos matemáticos para el control automatizado de inventarios "Diseño, construcción e implementación de modelos matemáticos para el control automatizado de inventarios Miguel Alfonso Flores Sánchez 1, Fernando Sandoya Sanchez 2 Resumen En el presente artículo se

Más detalles

Definición. Data Warehousing: almacenamiento, transformación y distribución de datos útiles para los responsables de tomar decisiones 9/29/2006 4

Definición. Data Warehousing: almacenamiento, transformación y distribución de datos útiles para los responsables de tomar decisiones 9/29/2006 4 Definición Data Warehousing: almacenamiento, transformación y distribución de datos útiles para los responsables de tomar decisiones 9/29/2006 4 Definición (cont.) Un Data Warehouse es una colección de

Más detalles

Oracle vs Oracle por Rodolfo Yglesias Setiembre 2008

Oracle vs Oracle por Rodolfo Yglesias Setiembre 2008 Oracle vs Oracle por Rodolfo Yglesias Setiembre 2008 Introducción Aunque la estrategia de adquisiciones que Oracle ha seguido en los últimos años siempre ha buscado complementar y fortalecer nuestra oferta

Más detalles

Capítulo 5. Cliente-Servidor.

Capítulo 5. Cliente-Servidor. Capítulo 5. Cliente-Servidor. 5.1 Introducción En este capítulo hablaremos acerca de la arquitectura Cliente-Servidor, ya que para nuestra aplicación utilizamos ésta arquitectura al convertir en un servidor

Más detalles

Estos documentos estarán dirigidos a todas las personas que pertenezcan a equipos de implementación de Oracle BI, incluyendo a:

Estos documentos estarán dirigidos a todas las personas que pertenezcan a equipos de implementación de Oracle BI, incluyendo a: Oracle Business Intelligence Enterprise Edition 11g. A lo largo de los siguientes documentos trataré de brindar a los interesados un nivel de habilidades básicas requeridas para implementar efectivamente

Más detalles

MOLAP REALIZADO POR: JOSE E. TABOADA RENNA

MOLAP REALIZADO POR: JOSE E. TABOADA RENNA MOLAP REALIZADO POR: JOSE E. TABOADA RENNA BASE DE DATOS Conjunto de datos estructurados, fiables y homogéneos organizados independientemente en máquina, m accesibles en tiempo real, compatible por usuarios

Más detalles

Tecnologías de Información y Comunicación II CLASE 10

Tecnologías de Información y Comunicación II CLASE 10 Tecnologías de Información y Comunicación II CLASE 10 Medidas Una medida es un tipo de dato cuya información es usada por los analistas (usuarios) en sus consultas para medir la perfomance del comportamiento

Más detalles

BUSINESS INTELLIGENCE

BUSINESS INTELLIGENCE BUSINESS INTELLIGENCE PRESENTACIÓN Ramón Díaz Hernández Gerente (1.990) Nuestro Perfil Inversión permanente en formación y nuevas tecnologías. Experiencia en plataforma tecnológica IBM (Sistema Operativo

Más detalles

Capítulo 2 Tecnología data warehouse

Capítulo 2 Tecnología data warehouse Capítulo 2 Tecnología data warehouse El objetivo de éste capítulo es mostrar la tecnología data warehouse (DW) como una herramienta para analizar la información. Este capítulo se encuentra organizado de

Más detalles

CAPÍTULO 2 DATA WAREHOUSES

CAPÍTULO 2 DATA WAREHOUSES CAPÍTULO 2 DATA WAREHOUSES Un Data Warehouse (DW) es un gran repositorio lógico de datos que permite el acceso y la manipulación flexible de grandes volúmenes de información provenientes tanto de transacciones

Más detalles

Construcción de cubos OLAP utilizando Business Intelligence Development Studio

Construcción de cubos OLAP utilizando Business Intelligence Development Studio Universidad Católica de Santa María Facultad de Ciencias e Ingenierías Físicas y Formales Informe de Trabajo Construcción de cubos OLAP utilizando Business Intelligence Development Studio Alumnos: Solange

Más detalles

Base de datos en Excel

Base de datos en Excel Base de datos en Excel Una base datos es un conjunto de información que ha sido organizado bajo un mismo contexto y se encuentra almacenada y lista para ser utilizada en cualquier momento. Las bases de

Más detalles

Día 5-6-2012 17:00h Lugar: Obra Social Ibercaja, Sala De actos, Rambla Ferran 38, 3º, Lleida

Día 5-6-2012 17:00h Lugar: Obra Social Ibercaja, Sala De actos, Rambla Ferran 38, 3º, Lleida Resumen de la conferencia Día 5-6-2012 17:00h Lugar: Obra Social Ibercaja, Sala De actos, Rambla Ferran 38, 3º, Lleida Ponente: Luis Muñiz Socio Director de Sisconges & Estrategia y experto en Sistemas

Más detalles

Microsoft SQL Server Conceptos.

Microsoft SQL Server Conceptos. Microsoft Conceptos. Microsoft 2005 es una plataforma de base de datos a gran escala de procesamiento de transacciones en línea (OLTP) y de procesamiento analítico en línea (OLAP). La siguiente tabla muestra

Más detalles

INTRODUCCION AL DESARROLLO DE SISTEMAS DE INFORMACION

INTRODUCCION AL DESARROLLO DE SISTEMAS DE INFORMACION INTRODUCCION AL DESARROLLO DE SISTEMAS DE INFORMACION INTRODUCCION AL DESARROLLO DE SISTEMAS DE INFORMACION. Los sistemas que el analista diseña día a día, la tecnología, las personas, que utilizan el

Más detalles

ANEXO A - Plan de Proyecto. 1. - EDT de la solución EDT GENERAL DEL PROYECTO1

ANEXO A - Plan de Proyecto. 1. - EDT de la solución EDT GENERAL DEL PROYECTO1 ANEXO A - Plan de Proyecto 1. - EDT de la solución EDT GENERAL DEL PROYECTO1 2.- Diagrama de Gantt de la Solución DIAGRAMA DE GANTT- FASE INICIAL DOCUMENTACION Y ANALISIS2 DIAGRAMA DE GANTT- FASE FINAL

Más detalles

SISTEMAS DE INFORMACIÓN II TEORÍA

SISTEMAS DE INFORMACIÓN II TEORÍA CONTENIDO: EL PROCESO DE DISEÑO DE SISTEMAS DISTRIBUIDOS MANEJANDO LOS DATOS EN LOS SISTEMAS DISTRIBUIDOS DISEÑANDO SISTEMAS PARA REDES DE ÁREA LOCAL DISEÑANDO SISTEMAS PARA ARQUITECTURAS CLIENTE/SERVIDOR

Más detalles

Presentación de Pyramid Data Warehouse

Presentación de Pyramid Data Warehouse Presentación de Pyramid Data Warehouse Pyramid Data Warehouse tiene hoy una larga historia, desde 1994 tiempo en el que su primera versión fue liberada, hasta la actual versión 8.00. El incontable tiempo

Más detalles

Mejores prácticas para el éxito de un sistema de información. Uno de los problemas de información dentro de las empresas es contar con datos

Mejores prácticas para el éxito de un sistema de información. Uno de los problemas de información dentro de las empresas es contar con datos ANEXO VI. Mejores prácticas para el éxito de un sistema de información Uno de los problemas de información dentro de las empresas es contar con datos importantes del negocio y que éstos estén aislados

Más detalles

CREACIÓN DE PROYECTOS DE BUSINESS INTELLIGENCE CON SQL SERVER. 40 horas 60 días

CREACIÓN DE PROYECTOS DE BUSINESS INTELLIGENCE CON SQL SERVER. 40 horas 60 días CREACIÓN DE PROYECTOS DE BUSINESS INTELLIGENCE CON SQL SERVER DURACIÓN DÍAS DE CONEXIÓN 40 horas 60 días CONTACTO: formacion@fgulem.es El Campus Virtual ha sido concebido con una metodología dinámica e

Más detalles

Modificación y parametrización del modulo de Solicitudes (Request) en el ERP/CRM Compiere.

Modificación y parametrización del modulo de Solicitudes (Request) en el ERP/CRM Compiere. UNIVERSIDAD DE CARABOBO FACULTAD DE CIENCIA Y TECNOLOGÍA DIRECCION DE EXTENSION COORDINACION DE PASANTIAS Modificación y parametrización del modulo de Solicitudes (Request) en el ERP/CRM Compiere. Pasante:

Más detalles

BASES DE DATOS TEMA 3 MODELO ENTIDAD - RELACIÓN

BASES DE DATOS TEMA 3 MODELO ENTIDAD - RELACIÓN BASES DE DATOS TEMA 3 MODELO ENTIDAD - RELACIÓN 3.3 Aplicaciones Definición de Aplicación (Application). Programa informático que permite a un usuario utilizar una computadora con un fin específico. Las

Más detalles

CAPITULO 3 DISEÑO. El diseño del software es el proceso que permite traducir los requisitos

CAPITULO 3 DISEÑO. El diseño del software es el proceso que permite traducir los requisitos 65 CAPITULO 3 DISEÑO 3.1. DISEÑO El diseño del software es el proceso que permite traducir los requisitos analizados de un sistema en una representación del software. 66 Diseño procedural Diseño de la

Más detalles

Introducción En los años 60 s y 70 s cuando se comenzaron a utilizar recursos de tecnología de información, no existía la computación personal, sino que en grandes centros de cómputo se realizaban todas

Más detalles

Unidad 1: Componentes del sistema

Unidad 1: Componentes del sistema Unidad 1: Componentes del sistema Identificar los elementos del sistema de información de mercados de la organización. M.I.A. Gabriel Ruiz Contreras gabriel2306@prodigy.net.mx Contenido 1. Elementos del

Más detalles

Introducción. Ciclo de vida de los Sistemas de Información. Diseño Conceptual

Introducción. Ciclo de vida de los Sistemas de Información. Diseño Conceptual Introducción Algunas de las personas que trabajan con SGBD relacionales parecen preguntarse porqué deberían preocuparse del diseño de las bases de datos que utilizan. Después de todo, la mayoría de los

Más detalles

GENERALIDADES DE BASES DE DATOS

GENERALIDADES DE BASES DE DATOS GENERALIDADES DE BASES DE DATOS A fin de evitar que idénticos datos se encuentren repetidos en múltiples archivos, parece necesario que los comunes se almacenen en un archivo único y que este archivo sea

Más detalles

Elementos requeridos para crearlos (ejemplo: el compilador)

Elementos requeridos para crearlos (ejemplo: el compilador) Generalidades A lo largo del ciclo de vida del proceso de software, los productos de software evolucionan. Desde la concepción del producto y la captura de requisitos inicial hasta la puesta en producción

Más detalles

SÍNTESIS Y PERSPECTIVAS

SÍNTESIS Y PERSPECTIVAS SÍNTESIS Y PERSPECTIVAS Los invitamos a observar, a identificar problemas, pero al mismo tiempo a buscar oportunidades de mejoras en sus empresas. REVISIÓN DE CONCEPTOS. Esta es la última clase del curso.

Más detalles

Visión General GXplorer. Última actualización: 2009

Visión General GXplorer. Última actualización: 2009 Última actualización: 2009 Copyright Artech Consultores S. R. L. 1988-2009. Todos los derechos reservados. Este documento no puede ser reproducido en cualquier medio sin el consentimiento explícito de

Más detalles

BASE DE DATOS UNIVERSIDAD DE LOS ANDES FACULTAD DE MEDICINA T.S.U. EN ESTADISTICA DE SALUD CATEDRA DE COMPUTACIÓN II. Comenzar presentación

BASE DE DATOS UNIVERSIDAD DE LOS ANDES FACULTAD DE MEDICINA T.S.U. EN ESTADISTICA DE SALUD CATEDRA DE COMPUTACIÓN II. Comenzar presentación UNIVERSIDAD DE LOS ANDES FACULTAD DE MEDICINA T.S.U. EN ESTADISTICA DE SALUD CATEDRA DE COMPUTACIÓN II BASE DE DATOS Comenzar presentación Base de datos Una base de datos (BD) o banco de datos es un conjunto

Más detalles

Actividades para mejoras. Actividades donde se evalúa constantemente todo el proceso del proyecto para evitar errores y eficientar los procesos.

Actividades para mejoras. Actividades donde se evalúa constantemente todo el proceso del proyecto para evitar errores y eficientar los procesos. Apéndice C. Glosario A Actividades de coordinación entre grupos. Son dinámicas y canales de comunicación cuyo objetivo es facilitar el trabajo entre los distintos equipos del proyecto. Actividades integradas

Más detalles

Introducción a las redes de computadores

Introducción a las redes de computadores Introducción a las redes de computadores Contenido Descripción general 1 Beneficios de las redes 2 Papel de los equipos en una red 3 Tipos de redes 5 Sistemas operativos de red 7 Introducción a las redes

Más detalles

Portafolio de Servicios y Productos

Portafolio de Servicios y Productos Portafolio de Servicios y Productos Introducción Somos una empresa que se dedica a generar ventajas competitivas para nuestros clientes a través de desarrollos y consultoría en inteligencia de negocios

Más detalles

DATA WAREHOUSING (ENERO DE 2003) Documento creado por Ing. Héctor H. Martínez Orpinel

DATA WAREHOUSING (ENERO DE 2003) Documento creado por Ing. Héctor H. Martínez Orpinel DATA WAREHOUSING (ENERO DE 2003) DEFINICIÓN UN DATA WAREHOUSING ES UN CONJUNTO DE DATOS INTEGRADOS ORIENTADOS A UNA MATERIA, QUE VARIA CON EL TIEMPO Y QUE NO SON TRANSITORIOS, LOS CUALES SOPORTAN EL PROCESO

Más detalles

Sistemas de Información para la Gestión. UNIDAD 2: RECURSOS DE TI Información y Aplicaciones

Sistemas de Información para la Gestión. UNIDAD 2: RECURSOS DE TI Información y Aplicaciones UNIDAD 2: RECURSOS DE TI Información y Aplicaciones UNIDAD 2: RECURSOS DE TI Información y Aplicaciones 1. La Información: Propiedades de la Información. Sistemas de Información. Bases de Datos. 2. Administración

Más detalles

Sistemas de Información 12/13 La organización de datos e información

Sistemas de Información 12/13 La organización de datos e información 12/13 La organización de datos e información Departamento Informática e Ingeniería de Sistemas Universidad de Zaragoza (raqueltl@unizar.es) " Guión Introducción: Data Warehouses Características: entornos

Más detalles

DATA WAREHOUSE PARA LA PRESTACIÓN DEL SERVICIO PÚBLICO DE INFORMACIÓN ESTADÍSTICA

DATA WAREHOUSE PARA LA PRESTACIÓN DEL SERVICIO PÚBLICO DE INFORMACIÓN ESTADÍSTICA 147 DATA WAREHOUSE PARA LA PRESTACIÓN DEL SERVICIO PÚBLICO DE INFORMACIÓN ESTADÍSTICA RICARDO LUJÁN SALAZAR INSTITUTO NACIONAL DE ESTADÍSTICA, GEOGRAFÍA E INFORMÁTICA (INEGI) MÉXICO 148 Data warehouse

Más detalles

Solicitar la competencia Business Intelligence Solutions

Solicitar la competencia Business Intelligence Solutions Solicitar la competencia Business Intelligence Solutions Guía paso a paso de la inscripción En Microsoft Partner Program, las competencias de Microsoft definen sus áreas de especialización, ayudándole

Más detalles

3.3.3 Tecnologías Mercados Datos

3.3.3 Tecnologías Mercados Datos 3.3.3 Tecnologías Mercados Datos TECNOLOGIAS DATAMART: Aspect Data Mart es una solución completa de reportes para la empresa, que le proporciona un mayor entendimiento de las operaciones de sus negocios

Más detalles

Curso Excel Básico - Intermedio

Curso Excel Básico - Intermedio Curso Excel Básico - Intermedio Clase 4 Relator: Miguel Rivera Adonis Introducción Base de Datos: Definición de Base de Datos Ordenar datos Formulario Filtros Trabajar con Sub-Totales Validación de Datos

Más detalles

Infraestructura Tecnológica. Sesión 12: Niveles de confiabilidad

Infraestructura Tecnológica. Sesión 12: Niveles de confiabilidad Infraestructura Tecnológica Sesión 12: Niveles de confiabilidad Contextualización La confianza es un factor determinante y muy importante, con ésta se pueden dar o rechazar peticiones de negocio, amistad

Más detalles

ELEMENTO I INTRODUCCION A LOS SISTEMAS DE BASES DE DATOS

ELEMENTO I INTRODUCCION A LOS SISTEMAS DE BASES DE DATOS Base de Datos ELEMENTO I INTRODUCCION A LOS SISTEMAS DE BASES DE DATOS Una base de datos es un conjunto de elementos de datos que se describe a sí mismo, con relaciones entre esos elementos, que presenta

Más detalles

Tecnologías de la Información en la Gestión Empresarial

Tecnologías de la Información en la Gestión Empresarial Tecnologías de la Información en la Gestión Empresarial 1 Sesión No.8 Nombre: Procesos de Negocio y Gestión en Business Intelligence Objetivo: Al término de la sesión, el alumno ilustrará un proceso de

Más detalles

UNIVERSIDAD DR. JOSE MATIAS DELGADO Facultad de Economía, Empresas y Negocios

UNIVERSIDAD DR. JOSE MATIAS DELGADO Facultad de Economía, Empresas y Negocios UNIVERSIDAD DR. JOSE MATIAS DELGADO Facultad de Economía, Empresas y Negocios Seminario de Investigación Tesina Elaboración de la estrategia de manejo de clientes (CRM) para la Fidelización en la empresa

Más detalles

CAPITULO I. Introducción. En la actualidad, las empresas están tomando un papel activo en cuanto al uso de sistemas y

CAPITULO I. Introducción. En la actualidad, las empresas están tomando un papel activo en cuanto al uso de sistemas y CAPITULO I Introducción 1.1 Introducción En la actualidad, las empresas están tomando un papel activo en cuanto al uso de sistemas y redes computacionales. La tecnología ha ido evolucionando constantemente

Más detalles

DE VIDA PARA EL DESARROLLO DE SISTEMAS

DE VIDA PARA EL DESARROLLO DE SISTEMAS MÉTODO DEL CICLO DE VIDA PARA EL DESARROLLO DE SISTEMAS 1. METODO DEL CICLO DE VIDA PARA EL DESARROLLO DE SISTEMAS CICLO DE VIDA CLÁSICO DEL DESARROLLO DE SISTEMAS. El desarrollo de Sistemas, un proceso

Más detalles

Bechtle Solutions Servicios Profesionales

Bechtle Solutions Servicios Profesionales Soluciones Tecnología Bechtle Solutions Servicios Profesionales Fin del servicio de soporte técnico de Windows Server 2003 No hacer nada puede ser un riesgo BECHTLE Su especialista en informática Ahora

Más detalles

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 5 -

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 5 - Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos - Sesión 5 - Juan Alfonso Lara Torralbo 1 Índice de contenidos Data Warehouse Modelo multidimensional Diagrama

Más detalles

http://www.statum.biz http://www.statum.info http://www.statum.org

http://www.statum.biz http://www.statum.info http://www.statum.org ApiaMonitor Monitor de Infraestructura BPMS Por: Ing. Manuel Cabanelas Product Manager de Apia Manuel.Cabanelas@statum.biz http://www.statum.biz http://www.statum.info http://www.statum.org Abstract A

Más detalles

Metodología básica de gestión de proyectos. Octubre de 2003

Metodología básica de gestión de proyectos. Octubre de 2003 Metodología básica de gestión de proyectos Octubre de 2003 Dentro de la metodología utilizada en la gestión de proyectos el desarrollo de éstos se estructura en tres fases diferenciadas: Fase de Éjecución

Más detalles

Facultad de Ciencias Económicas. Departamento de Sistemas. Asignatura: INTELIGENCIA DE NEGOCIOS. Plan 1997

Facultad de Ciencias Económicas. Departamento de Sistemas. Asignatura: INTELIGENCIA DE NEGOCIOS. Plan 1997 UNIVERSIDAD DE BUENOS AIRES Facultad de Ciencias Económicas Departamento de Sistemas Asignatura: INTELIGENCIA DE NEGOCIOS Código: 715 Plan 1997 Cátedra: DEPARTAMENTO DE SISTEMAS Carrera: Licenciado en

Más detalles

Clasificación de los Sistemas de Información

Clasificación de los Sistemas de Información Universidad Nacional Autónoma de México Facultad de Contaduría y Administración Clasificación de los Sistemas de Información Autor: L.I. Alejandro Muñoz Estrada Clasificación de los Sistemas de Información

Más detalles

Los mayores cambios se dieron en las décadas de los setenta, atribuidos principalmente a dos causas:

Los mayores cambios se dieron en las décadas de los setenta, atribuidos principalmente a dos causas: SISTEMAS DISTRIBUIDOS DE REDES 1. SISTEMAS DISTRIBUIDOS Introducción y generalidades La computación desde sus inicios ha sufrido muchos cambios, desde los grandes equipos que permitían realizar tareas

Más detalles

Presentación. 29/06/2005 Monografía de Adscripción 1

Presentación. 29/06/2005 Monografía de Adscripción 1 Presentación Alumno: Uribe, Valeria Emilce Profesor Director: Mgter. David Luis La Red Martínez. Asignatura: Diseño y Administración de Datos. Corrientes 2005. 29/06/2005 Monografía de Adscripción 1 MONOGRAFIA

Más detalles

3. GESTIÓN DE CONFIGURACIÓN DE SOFTWARE

3. GESTIÓN DE CONFIGURACIÓN DE SOFTWARE 3. GESTIÓN DE CONFIGURACIÓN DE SOFTWARE Software Configuration Management (SCM) es una disciplina de la Ingeniería de Software que se preocupa de [Ber92] [Ber84] [Bou98] [Mik97]: Identificar y documentar

Más detalles

ANEXO 26-A COMITÉ PERMANENTE DE INTERPRETACIÓN SIC N 32 ACTIVOS INTANGIBLES COSTOS DE SITIOS WEB. (Modificada en 2008) (IV Difusión)

ANEXO 26-A COMITÉ PERMANENTE DE INTERPRETACIÓN SIC N 32 ACTIVOS INTANGIBLES COSTOS DE SITIOS WEB. (Modificada en 2008) (IV Difusión) ANEXO 26-A COMITÉ PERMANENTE DE INTERPRETACIÓN SIC N 32 ACTIVOS INTANGIBLES COSTOS DE SITIOS WEB (Modificada en 2008) (IV Difusión) Interpretación SIC-32 Activos Intangibles - Costos de Sitios Web Referencias

Más detalles

Diseño orientado al flujo de datos

Diseño orientado al flujo de datos Diseño orientado al flujo de datos Recordemos que el diseño es una actividad que consta de una serie de pasos, en los que partiendo de la especificación del sistema (de los propios requerimientos), obtenemos

Más detalles

PRUEBAS DE SOFTWARE TECNICAS DE PRUEBA DE SOFTWARE

PRUEBAS DE SOFTWARE TECNICAS DE PRUEBA DE SOFTWARE PRUEBAS DE SOFTWARE La prueba del software es un elemento crítico para la garantía de la calidad del software. El objetivo de la etapa de pruebas es garantizar la calidad del producto desarrollado. Además,

Más detalles

Universidad acional Experimental Del Táchira Decanato de Docencia Departamento de Ingeniería en Informática

Universidad acional Experimental Del Táchira Decanato de Docencia Departamento de Ingeniería en Informática Universidad acional Experimental Del Táchira Decanato de Docencia Departamento de Ingeniería en Informática Metodología Evolutiva Incremental Mediante Prototipo y Técnicas Orientada a Objeto (MEI/P-OO)

Más detalles

SQL Server Business Intelligence parte 1

SQL Server Business Intelligence parte 1 SQL Server Business Intelligence parte 1 Business Intelligence es una de las tecnologías de base de datos más llamativas de los últimos años y un campo donde Microsoft ha formado su camino a través de

Más detalles

Unidad didáctica 2: Metodologías de desarrollo de Bases de Datos. Unidad didáctica 1: Fase de análisis de requisitos Modelo E/R

Unidad didáctica 2: Metodologías de desarrollo de Bases de Datos. Unidad didáctica 1: Fase de análisis de requisitos Modelo E/R índice Módulo A Unidad didáctica 1: Introducción a las Bases de Datos Unidad didáctica 2: Metodologías de desarrollo de Bases de Datos 3 19 Módulo B Unidad didáctica 1: Fase de análisis de requisitos Modelo

Más detalles

Almacén de datos - concepto. Arquitectura de un sistema de almacén de datos

Almacén de datos - concepto. Arquitectura de un sistema de almacén de datos Almacén de datos - concepto Almacén de datos (Bodega de Datos, Data warehouse) es una integrada colección de datos que contiene datos procedentes de sistemas del planeamiento del recurso de la empresa

Más detalles

Ciclo de vida y Metodologías para el desarrollo de SW Definición de la metodología

Ciclo de vida y Metodologías para el desarrollo de SW Definición de la metodología Ciclo de vida y Metodologías para el desarrollo de SW Definición de la metodología La metodología para el desarrollo de software es un modo sistemático de realizar, gestionar y administrar un proyecto

Más detalles

Sistema de análisis de información. Resumen de metodología técnica

Sistema de análisis de información. Resumen de metodología técnica Sistema de análisis de información Resumen de metodología técnica Tabla de Contenidos 1Arquitectura general de una solución de BI y DW...4 2Orígenes y extracción de datos...5 2.1Procesos de extracción...5

Más detalles

MINING SOLUTIONS LIMITADA

MINING SOLUTIONS LIMITADA MINING SOLUTIONS LIMITADA Contenido... 1 Resumen Ejecutivo... 3... 4 Nuestros Servicios... 5 Administración de proyectos... 6 Operación y mantenimiento sobre los Sistema de Manejo de la Información Geológica

Más detalles

Creación y administración de grupos de dominio

Creación y administración de grupos de dominio Creación y administración de grupos de dominio Contenido Descripción general 1 a los grupos de Windows 2000 2 Tipos y ámbitos de los grupos 5 Grupos integrados y predefinidos en un dominio 7 Estrategia

Más detalles

Tecnologías Aplicadas a Business Intelligence Proyecto Práctico

Tecnologías Aplicadas a Business Intelligence Proyecto Práctico Tecnologías Aplicadas a Business Intelligence Proyecto Práctico Empresa: La empresa en cuestión, es una Importadora y Distribuidora de Autopartes, con más de 30 años de vida. Nació como la distribuidora

Más detalles

Multipedidos es un sistema de ventas on-line que permite gestionar pedidos por internet en tiempo real de manera económica, simple y eficaz.

Multipedidos es un sistema de ventas on-line que permite gestionar pedidos por internet en tiempo real de manera económica, simple y eficaz. Presentación Multipedidos es un sistema de ventas on-line que permite gestionar pedidos por internet en tiempo real de manera económica, simple y eficaz. El sistema está pensado para empresas que deseen

Más detalles

e-commerce, es hacer comercio utilizando la red. Es el acto de comprar y vender en y por medio de la red.

e-commerce, es hacer comercio utilizando la red. Es el acto de comprar y vender en y por medio de la red. Comercio electrónico. (e-commerce) Las empresas que ya están utilizando la red para hacer comercio ven como están cambiando las relaciones de la empresa con sus clientes, sus empleados, sus colaboradores

Más detalles

CARRERA TITULO DEL TRABAJO CURSO

CARRERA TITULO DEL TRABAJO CURSO CARRERA Ingeniería Informática TITULO DEL TRABAJO TOGAF CURSO Tópicos de Ingeniería del Software CÉSAR ESTRADA CONDORI MAYRA GOMEZ QUEVEDO LUIS MUǸOS ESCAPA ALAN A. ROJAS MARROQUIN SEMESTRE IX 2010 Los

Más detalles

Capítulo I. Definición del problema y objetivos de la tesis. En la actualidad Internet se ha convertido en una herramienta necesaria para todas

Capítulo I. Definición del problema y objetivos de la tesis. En la actualidad Internet se ha convertido en una herramienta necesaria para todas Capítulo I Definición del problema y objetivos de la tesis 1.1 Introducción En la actualidad Internet se ha convertido en una herramienta necesaria para todas las personas ya que nos permite realizar diferentes

Más detalles

INTEGRAL UNA COMPAÑÍA. Con las mejores alternativas del mercado

INTEGRAL UNA COMPAÑÍA. Con las mejores alternativas del mercado Bienvenidos a TFC, THE FLEXLINE COMPANY S.A., una compañía diseñada y pensada para la solución de los problemas de administración y gestión de sus clientes. Nos interesa desarrollar soluciones que apoyen

Más detalles

Artículo dedicado a la Innovación y Mejores Prácticas en la Ingeniería de Negocios

Artículo dedicado a la Innovación y Mejores Prácticas en la Ingeniería de Negocios Herramienta para Indicadores de Gestión Se ha dado cuenta de lo difícil que es conseguir que todos los miembros de su organización vean "la gran foto" y trabajen juntos para lograr los objetivos estratégicos

Más detalles

LOGISTICA D E COMPRAS

LOGISTICA D E COMPRAS LOGISTICA D E COMPRAS 1. - Concepto de compras OBTENER EL (LOS) PRODUCTO(S) O SERVICIO(S) DE LA CALIDAD ADECUADA, CON EL PRECIO JUSTO, EN EL TIEMPO INDICADO Y EN EL LUGAR PRECISO. Muchas empresas manejan

Más detalles

UNIDAD 2: Abstracción del Mundo real Al Paradigma Orientado a Objetos

UNIDAD 2: Abstracción del Mundo real Al Paradigma Orientado a Objetos 2.1. Principios básicos del Modelado de Objetos UNIDAD 2: Abstracción del Mundo real Al Paradigma Orientado a Objetos Hoy en día muchos de los procesos que intervienen en un negocio o empresa y que resuelven

Más detalles

1.1.- Objetivos de los sistemas de bases de datos 1.2.- Administración de los datos y administración de bases de datos 1.3.- Niveles de Arquitectura

1.1.- Objetivos de los sistemas de bases de datos 1.2.- Administración de los datos y administración de bases de datos 1.3.- Niveles de Arquitectura 1. Conceptos Generales 2. Modelo Entidad / Relación 3. Modelo Relacional 4. Integridad de datos relacional 5. Diseño de bases de datos relacionales 6. Lenguaje de consulta estructurado (SQL) 1.1.- Objetivos

Más detalles

Proceso Unificado de Rational PROCESO UNIFICADO DE RATIONAL (RUP) El proceso de desarrollo de software tiene cuatro roles importantes:

Proceso Unificado de Rational PROCESO UNIFICADO DE RATIONAL (RUP) El proceso de desarrollo de software tiene cuatro roles importantes: PROCESO UNIFICADO DE RATIONAL (RUP) El proceso de desarrollo de software tiene cuatro roles importantes: 1. Proporcionar una guía de actividades para el trabajo en equipo. (Guía detallada para el desarrollo

Más detalles

REGISTRO DE EMPRESAS Y PERSONAS BASE DE INFORMACIÓN DE CLIENTES & CONTACTOS

REGISTRO DE EMPRESAS Y PERSONAS BASE DE INFORMACIÓN DE CLIENTES & CONTACTOS REGISTRO DE EMPRESAS Y PERSONAS BASE DE INFORMACIÓN DE CLIENTES & CONTACTOS La gestión del asesor comercial se basa en mantener contacto personalizado con un grupo de clientes empresariales o personales.

Más detalles

http://www.nicasoft.com.ni

http://www.nicasoft.com.ni BSC-RH es un sistema automatizado de planificación estratégica y gestión, utilizado en empresas para direccionar las actividades del negocio a la visión y estrategia de la organización. Mejora la comunicación

Más detalles

Unidad 1. Fundamentos en Gestión de Riesgos

Unidad 1. Fundamentos en Gestión de Riesgos 1.1 Gestión de Proyectos Unidad 1. Fundamentos en Gestión de Riesgos La gestión de proyectos es una disciplina con la cual se integran los procesos propios de la gerencia o administración de proyectos.

Más detalles

Bases de datos en Excel

Bases de datos en Excel Universidad Complutense de Madrid CURSOS DE FORMACIÓN EN INFORMÁTICA Bases de datos en Excel Hojas de cálculo Tema 5 Bases de datos en Excel Hasta ahora hemos usado Excel básicamente para realizar cálculos

Más detalles

activuspaper Text Mining and BI Abstract

activuspaper Text Mining and BI Abstract Text Mining and BI Abstract Los recientes avances en lingüística computacional, así como la tecnología de la información en general, permiten que la inserción de datos no estructurados en una infraestructura

Más detalles

UNIVERSIDAD ALBERT EINSTEIN FACULTAD DE INGENIERIA

UNIVERSIDAD ALBERT EINSTEIN FACULTAD DE INGENIERIA UNIVERSIDAD ALBERT EINSTEIN FACULTAD DE INGENIERIA Estudio de las herramientas TOAD y DBArtisan para la administración e integración de bases de datos relacionales. PREVIA OPCION AL TÍTULO DE: INGENIERO

Más detalles

Sistema PYMES Ventas e Inventarios H&S

Sistema PYMES Ventas e Inventarios H&S Sistema PYMES Ventas e Inventarios H&S Sistema PYMES Ventas e Inventarios H&S Visión DESARROLLADORA Teodora Vargas Tarqui Versión 0.9 Tabla de Contenidos 1. INTRODUCCION 3 1.1 Propósito 3 1.2 Alcance 3

Más detalles

LINEAMIENTOS ESTÁNDARES APLICATIVOS DE VIRTUALIZACIÓN

LINEAMIENTOS ESTÁNDARES APLICATIVOS DE VIRTUALIZACIÓN LINEAMIENTOS ESTÁNDARES APLICATIVOS DE VIRTUALIZACIÓN Tabla de Contenidos LINEAMIENTOS ESTÁNDARES APLICATIVOS DE VIRTUALIZACIÓN... 1 Tabla de Contenidos... 1 General... 2 Uso de los Lineamientos Estándares...

Más detalles

Implementando un ERP La Gestión del Cambio

Implementando un ERP La Gestión del Cambio Artículos> Implementando un ERP - La Gestión del Cambio Artículo Implementando un ERP La Gestión del Cambio 1 Contenido Sumario Ejecutivo 3 Los sistemas ERP flexibilizan la gestión de la empresa y su cadena

Más detalles

REGISTRO DE PEDIDOS DE CLIENTES MÓDULO DE TOMA DE PEDIDOS E INTEGRACIÓN CON ERP

REGISTRO DE PEDIDOS DE CLIENTES MÓDULO DE TOMA DE PEDIDOS E INTEGRACIÓN CON ERP REGISTRO DE PEDIDOS DE CLIENTES MÓDULO DE TOMA DE PEDIDOS E INTEGRACIÓN CON ERP Visual Sale posee módulos especializados para el método de ventas transaccional, donde el pedido de parte de un nuevo cliente

Más detalles

Empresa Financiera Herramientas de SW Servicios

Empresa Financiera Herramientas de SW Servicios Empresa Financiera Herramientas de SW Servicios Resulta importante mencionar que ésta es una empresa cuya actividad principal está enfocada a satisfacer las necesidades financieras de los clientes, a través

Más detalles

AUDITORÍA ADMINISTRATIVA INFORME. 1. Brindar a la organización los elementos necesarios para mejorar su funcionamiento.

AUDITORÍA ADMINISTRATIVA INFORME. 1. Brindar a la organización los elementos necesarios para mejorar su funcionamiento. Naturaleza AUDITORÍA ADMINISTRATIVA INFORME Auditoria Administrativa Alcance Toda la empresa Antecedentes No existen Objetivos 1. Brindar a la organización los elementos necesarios para mejorar su funcionamiento.

Más detalles

Diseño de Base de Datos

Diseño de Base de Datos Diseño de Base de Datos DISEÑO DE BASE DE DATOS 1 Lectura No. 2 Nombre: Arquitectura Cliente-Servidor Contextualización Qué es la arquitectura Cliente-Servidor? En la nueva de las comunicaciones a través

Más detalles

Educación y capacitación virtual, algo más que una moda

Educación y capacitación virtual, algo más que una moda Éxito Empresarial Publicación No.12 marzo 2004 Educación y capacitación virtual, algo más que una moda I Introducción Últimamente se ha escuchado la posibilidad de realizar nuestra educación formal y capacitación

Más detalles

ADMINISTRACION DE CENTROS DE COMPUTO

ADMINISTRACION DE CENTROS DE COMPUTO ADMINISTRACION DE CENTROS DE COMPUTO 1.1 Datos Informativos 1.2 Tutor: Ing. Jorge Miranda 1.3 Nombre: Iván Guadalupe 1.4 Facultad: Ciencias de la Computación y Electrónica 1.5 Nivel: Decimo Informática

Más detalles

RESUMEN DE LA SOLUCIÓN CA ERwin Modeling. Cómo puedo gestionar la complejidad de los datos y mejorar la agilidad empresarial?

RESUMEN DE LA SOLUCIÓN CA ERwin Modeling. Cómo puedo gestionar la complejidad de los datos y mejorar la agilidad empresarial? RESUMEN DE LA SOLUCIÓN CA ERwin Modeling Cómo puedo gestionar la complejidad de los datos y mejorar la agilidad empresarial? CA ERwin Modeling ofrece una perspectiva centralizada sobre las definiciones

Más detalles

Introducción. Componentes de un SI. Sistema de Información:

Introducción. Componentes de un SI. Sistema de Información: Introducción. Sistema de Información: Conjunto de elementos relacionados entre sí de acuerdo a ciertas reglas, que aporta a la organización la información necesaria para el cumplimiento de sus fines, para

Más detalles

Servicio de Email Marketing

Servicio de Email Marketing Servicio de Email Marketing Cuando hablamos de Email marketing, es un envío Masivo de correos con permisos realizado por herramientas tecnológicas de correo electrónico, mediante el cual su anuncio estará

Más detalles

Unidad 5. Conceptos y Estructuras de Archivos

Unidad 5. Conceptos y Estructuras de Archivos Unidad 5 Conceptos y Estructuras de Archivos En todos los tiempos y más aún en la era en que vivimos, el hombre tiene cada vez mas necesidad de consultar una mayor cantidad de información para poder desarrollar

Más detalles

Administración por Procesos contra Funciones

Administración por Procesos contra Funciones La administración moderna nos marca que en la actualidad, las organizaciones que no se administren bajo un enfoque de procesos eficaces y flexibles, no podrán sobrepasar los cambios en el entorno y por

Más detalles

Capítulo 2. Planteamiento del problema. Capítulo 2 Planteamiento del problema

Capítulo 2. Planteamiento del problema. Capítulo 2 Planteamiento del problema Capítulo2 Planteamientodelproblema 38 2.1Antecedentesycontextodelproyecto En lo que respecta a los antecedentes del proyecto, se describe inicialmente el contexto donde se utiliza el producto de software.

Más detalles

Visión General de GXportal. Última actualización: 2009

Visión General de GXportal. Última actualización: 2009 Última actualización: 2009 Copyright Artech Consultores S. R. L. 1988-2009. Todos los derechos reservados. Este documento no puede ser reproducido en cualquier medio sin el consentimiento explícito de

Más detalles