UNIVERSIDAD AUTÓNOMA DE BAJA CALIFORNIA SUR ÁREA DE CONOCIMIENTO DE CIENCIAS DEL MAR DEPARTAMENTO ACADÉMICO DE SISTEMASCOMPUTACIONALES TESIS

Tamaño: px
Comenzar la demostración a partir de la página:

Download "UNIVERSIDAD AUTÓNOMA DE BAJA CALIFORNIA SUR ÁREA DE CONOCIMIENTO DE CIENCIAS DEL MAR DEPARTAMENTO ACADÉMICO DE SISTEMASCOMPUTACIONALES TESIS"

Transcripción

1 UNIVERSIDAD AUTÓNOMA DE BAJA CALIFORNIA SUR ÁREA DE CONOCIMIENTO DE CIENCIAS DEL MAR DEPARTAMENTO ACADÉMICO DE SISTEMASCOMPUTACIONALES TESIS CONSTRUCCIÓN DE UN DATAWAREHOUSE PARA DATOS DE PESCA RIBEREÑA QUE COMO REQUISITO PARA OBTENER EL TITULO DE: LICENCIADO EN COMPUTACIÓN PRESENTA: ISRAEL DURAN ENCINAS DIRECTOR: M. S.C. MÓNICA ADRIANA CARREÑO LEÓN LA PAZ, BAJA CALIFORNIA SUR, ENERO DE 2014

2 AGRADECIMIENTOS Gracias a Dios por darme la oportunidad de concluir este trabajo tan importante para mis estudios y por haber puesto en mi camino a personas maravillosas que hicieron posible este logro. Quiero expresar también mi más sincero agradecimiento a todos los maestros del departamento académico de sistemas computacionales, por haber compartido de sus conocimientos, su tiempo, su dedicación y su amistad. En especial a mis queridos Maestros: M.S.C. Jesús Andrés Sandoval Bringas y M.S.C. Mónica Adriana Carreño León, gracias por creer en mí y por ayudarme a llegar a esta etapa de mis estudios, considero un honor aprender de ustedes. De la misma manera quiero expresar mis agradecimientos a mis padres Roberto Durán Romero y Elvira Encinas Piña, gracias por su apoyo incondicional y por haber inculcado valores y principios que me han ayudado a salir adelante en cualquier momento. Gracias por la mejor herencia que me han dejado el conocimiento. Saldré adelante en cualquier cosa que emprenda y cada logro obtenido me recordara que ustedes son parte de él. Por último quisiera agradecer a mis compañeros por brindarme su amistad y compañía durante tantos años, compartimos momentos buenos y malos, reímos, lloramos, celebramos, peleamos lo único que importa es que nunca los olvidare, por que guardo todos los buenos recuerdos de ustedes.

3 Capítulo Introducción Antecedentes Descripción del problema Propuesta de solución Objetivo general Objetivos específicos Capítulo Marco teórico Toma de decisiones Sistemas para apoyar la toma de decisiones Categorías y clase de decisiones DSS centrados en los datos y centrados en los modelos DSS formales y ad-hoc DSS Dirigido y No Dirigido Modelo del proceso de toma de decisiones Alcance del problema del proceso de toma de decisiones Tecnologías de data warehouse Data warehouse Características de un data warehouse Orientado al tema Variante en el tiempo No volátil Integrados Arquitectura de un data warehouse Data warehouse empresariales Data warehouse virtuales Data marts Data marts Componentes de un data warehouse Componente de diseño / Adquisición de datos Componente de acceso a la información Componente de acceso a los datos Componente de Directorio de Datos (Metadata): Componente de Gestión de Procesos:

4 6. Componente de Mensaje de la Aplicación Componente data warehouse (Físico) Componente de Organización de Datos Operaciones de un data warehouse a) Sistemas Operacionales b) Extracción, Transformación y Carga de los Datos: c) Metadata: d) Acceso de usuario final e) Plataforma del Data Warehouse f) Datos Externos Diferencias entre OLTP y data warehouse Arquitectura OLAP Sistema MOLAP Sistema ROLAP Operaciones OLAP Capacidades de la técnica OLAP Técnicas de modelados de datos Modelo Entidad / Relación Modelo Dimensional Capítulo Diseño e implementación Modelo dimensional del data warehouse Esquema de integración Capítulo Resultados Comportamiento histórico de la pesquería de escama en bahía Comportamiento histórico de la captura en bahía por pesquería Comportamiento histórico de la captura en bahía por pesquería Comportamiento histórico de la captura de camarón en esteros con total de volumen por estero Comportamiento por temporada de la captura de camarón, escama y tiburón 66 Capítulo Conclusiones Referencias

5 Capítulo 1 Introducción 1.1 Antecedentes Tener la información justa en el momento oportuno ha significado para las organizaciones vanguardistas un elemento primordial, ya que, su aplicación, uso, interpretación y una administración adecuada conlleva a un alto nivel de conocimiento. La información puede ser cualquier cosa que sea de importancia para el individuo o la organización; en otras palabras, todo lo que sea necesario para auxiliarle en el proceso general de su administración [14]. Actualmente las organizaciones de cualquier índole, le han dado gran importancia a la información que poseen, porque se han dado cuenta de lo importante y valioso que representa la información, para la forma de funcionar de la propia organización, ya que esto permite estar evaluando sus diferentes mecanismos de operación y sus procesos de desarrollo en la administración organizacional. De igual manera el conocimiento en las organizaciones, emerge, de una combinación de dos variables muy importantes: por un lado, la capacidad del recurso humano, y por el otro, la tecnología en la cual se apoyan. En este mismo contexto, el buen uso de la información, pudiera sustentar una acertada toma de decisión, y desde luego las repercusiones posteriores a la toma de ella, generaría una ventaja competitiva. En los últimos años ha existido un enorme crecimiento en la capacidad de generación y almacenamiento de información, debido a la creciente automatización de procesos en general, a través del uso de sistemas de información operacionales o transaccionales OLTP (On-Line Transaction Proccesing), y a los avances de tecnología en las capacidades de 3

6 almacenamiento de información. Los sistemas OLTP son los que resuelven las necesidades de funcionamiento de una empresa, y los aspectos más importantes que se toman en cuenta son las actualizaciones y el tiempo de respuesta [2]. Si bien los sistemas de información existen desde la década de los setentas, su incursión en las organizaciones y su utilización como herramienta de competitividad, toma un auge fuerte a inicio de los 90 s [4]. En la actualidad se hace necesario que las organizaciones establezcan mecanismos que les permita obtener mejor y mayor provecho de los sistemas de información, ya que esto representa un elemento sumamente importante para que éstas se mantengan en competencia. La información como base para la toma de decisiones, ha incrementado el interés por disponer de información altamente relevante. Una herramienta importante que permite integrar información y aprovechar ésta para el análisis de la información relevante que soporta el proceso de la toma de decisiones, son los data warehouse, ya que favorecen la eficiencia en las operaciones de consulta, y con herramientas adecuadas de análisis de datos ofrece facilidades de apoyo en la toma de decisiones [4]. Data Warehouse es un conjunto de datos integrados, históricos, variantes en el tiempo y unidos alrededor de un tema específico, que es usado por la gerencia para la toma de decisiones (INMON). Los Data Warehouse (DWH) son una herramienta que permite la interpretación de datos con el objetivo de tomar mejores decisiones, auxilian a recuperar, resumir y analizar información relevante e importante, es decir, permiten hacer una compilación de datos diseñada para soportar decisiones administrativas. Los data warehouse contienen una gran variedad de datos que pueden presentar en un determinado momento las condiciones de una organización. Dicho de otra forma, los data warehouse son una herramienta sumamente robusta que presenta la información e interpretaciones de estrategias a seguir, para evaluar y seleccionar entre varias alternativas, visualizándolas desde distintos escenarios. 4

7 Debido al crecimiento vertiginoso de información y a falta de sistemas informáticos adecuados para la toma de decisiones, y dado su aceptación en diferentes áreas de conocimiento y sectores productivos, como es el caso de la pesca ribereña, muy importante en el país, fundamentalmente en algunos estados de la República Mexicana, este sector no queda exento de desarrollar herramientas para la mejor toma de decisiones. El estado de Baja California Sur se sitúa al noroeste de México y cuenta con kilómetros de litorales, la pesca es fundamental porque emplea a más de 10,700 personas, y cuyo volumen de captura promedio anual es de 155 mil toneladas de especies marinas; 11 por ciento del total de la producción pesquera nacional [12]. Al igual que en otras regiones de México, el manejo de la pesca en Baja California Sur se refiere a normas oficiales mexicanas como las relacionadas con la del camarón y tiburón y a las observaciones de la Carta Nacional Pesquera. En la mayoría de los casos, las normas y reglas no consideran diferencias regionales en la dinámica de las flotas, la distribución de los recursos y los impactos sobre ellos y el ecosistema, derivados de interacciones por la coexistencia espacial y temporal de las pesquerías. 5

8 1.2 Descripción del problema La toma de decisiones relacionada con los recursos pesqueros (particularmente en pesca ribereña) en un área, requiere de información que permita conocer la situación actual del recurso en cuanto a disponibilidad y demanda, así como modelos que permitan evaluar escenarios prospectivos y simular los efectos que producirían ciertas acciones. Las instituciones y/o organizaciones responsables de tomar decisiones en cuanto al sector pesquero, no cuentan con las herramientas que le permitan extraer, agrupar y analizar datos históricos para apoyar a los procesos de planificación, ordenamiento y manejo pesquero, para ello, se requiere contar con información confiable y oportuna que sirva como apoyo en el proceso de toma de decisiones. 6

9 1.3 Propuesta de solución Para el problema expuesto en el apartado anterior, se propone como solución diseñar e implementar un data warehouse que sirva como herramienta de apoyo, que simplifique y facilite a los usuarios la observación y análisis de la información. Esto significará el almacenamiento de información homogénea y confiable, en una estructura basada en la consulta y el tratamiento jerarquizado de la misma, y en un entorno diferenciado de los sistemas operacionales para enfatizar la toma de decisión. Para la construcción del data warehouse, es necesario convertir los datos de las diferentes fuentes de información en datos integrados de gran relevancia. Para lograr la conversión de los datos transaccionales, es necesario aplicar la metodología ETL (Extraction, Transformation, Loading), la cual se compone de tres etapas básicas: 1. Extracción: Involucra acceder a los datos y determinar si existen problemas de calidad de los mismos. 2. Transformación: Implica aplicar reglas de conversión de valores de aplicaciones locales o globales. 3. Carga: Consiste en la incorporación de los datos al data warehouse. 7

10 Figura 1.1 Arquitectura típica de una data warehouse La figura 1.1 visualiza la arquitectura típica para la construcción del data warehouse, para lo cual es necesario obtener los datos de los diferentes fuentes, incorporarlos al data warehouse y finalmente presentar los datos utilizando herramientas OLAP (On-Line Analitic Processing). En resumen, lo que se propone como solución, es la construcción de un data warehouse con datos que se basan en los registros de captura de pesca ribereña por especie o por grupo de ellas y por lugar, registrados de 1998 a 2009, en avisos de arribo de embarcaciones menores facilitados por la Comisión Nacional de Acuacultura y Pesca (conapesca). En el siguiente apartado se definen los objetivos generales y particulares que son necesarios cumplir, para llevar a cabo el desarrollo de la propuesta de tesis. 8

11 1.4 Objetivo general El objetivo principal del presente trabajo de tesis, es diseñar e implementar un data warehouse con datos de pesca ribereña para el estado de Baja California Sur, que permita obtener información relevante, para la consulta y análisis temporal de la información, que sirva como apoyo a la toma de decisiones. El data warehouse deberá funcionar como una herramienta tecnológica que concentre en un único lugar la información de pesca ribereña necesaria para que los tomadores de decisiones puedan llevar a cabo los procesos de planificación, ordenamiento y manejo pesquero de manera eficiente y eficaz mediante el comportamiento de la información. 9

12 1.5 Objetivos específicos Los objetivos específicos de este proyecto se enlistan a continuación: Identificar las fuentes de datos operacionales que actualmente almacenan la información de pesca ribereña en las costas del estado de Baja California Sur. Analizar y resolver las múltiples fuentes de datos. Diseñar el modelo dimensional para la construcción del data warehouse, utilizando el esquema conocido como estrella. Especificar los procesos de transformación e integración basados en las mejores fuentes de datos. Utilizar una herramienta que permita visualizar la información. Una vez definidos los objetivos generales y específicos, es necesario revisar la teoría relacionada con los data warehouse, que dará soporte al desarrollo de éste trabajo de tesis. En el siguiente capítulo, se presenta un panorama general de los data warehouse. 10

13 Capítulo 2 Marco teórico 2.1 Toma de decisiones El tomar o decidir por una decisión es una actividad con la cual se puede vivir de manera cotidiana. Las decisiones realmente importantes, generalmente son difíciles de tomar y requieren gran cantidad de información así como un alto nivel de soporte de la decisión. La decisión es el vehículo por el cual todos los recursos de una organización son desplegados o estructurados en un momento dado. Las dificultades asociadas con la toma de decisiones pueden ser el resultado de combinaciones innumerables de complejidad, incertidumbre, presiones de las organizaciones y ambientales y las limitaciones individuales del tomador de la decisión. A continuación se presenta un panorama de la toma de decisiones, las clasificaciones y las herramientas de soporte de este proceso, como los pronósticos. 11

14 2.2 Sistemas para apoyar la toma de decisiones La toma de decisiones es el proceso de seleccionar entre varias alternativas de acciones a tomar con el propósito de obtener ciertos objetivos. Los sistemas para el soporte de las decisiones (DSS, por sus siglas en inglés) son diseñados, construidos y utilizados para asistir en la actividad por la que son nombrados: soporte del proceso de la toma de decisiones. El propósito real de un DSS es el de proporcionar soporte al tomador de la decisión durante el proceso de la toma de la decisión.[4]. Un DSS es un sistema bajo el control de uno o más tomadores de decisiones que asiste en la actividad de la toma de decisiones y proporciona un conjunto de herramientas estructuradas, orientadas a mejorar la efectividad de los resultados de la decisión. Los DSS son en esencia muy diversos, pero comparten algunas características en común que son enlistadas a continuación: Se emplean en contextos de decisión no estructurados o semiestructurados. Un contexto estructurado es aquel que tiene objetivos no conflictivos, claramente definido, con pocas alternativas de decisión y normalmente son conocidos los efectos de las decisiones. Tratan de apoyar al tomador de decisiones más que reemplazarlo. Soportan todas las fases del proceso de toma de decisiones. Se enfocan en la efectividad del proceso de toma de decisiones, más que en su eficiencia. Usan datos y modelos predefinidos. Son interactivos y en general amigables. Se desarrollan a través de un proceso iterativo y evolutivo. 12

15 Soportan los niveles estratégicos y tácticos de las empresas. Soportan la toma de decisiones independientes o interdependientes. Soportan contextos de toma de decisiones individuales, grupales y en equipo. Los DSS ofrecen grandes beneficios a la organización, así como algunas limitantes. Los beneficios que puede aportar un DSS son: 1. Extienden la capacidad del tomador de decisiones para procesar información y conocimiento. 2. Permiten el atacar problemas complejos, de gran escala y que normalmente demandarían muchísimo tiempos sin el uso del DSS. 3. Permiten reducir el tiempo necesario para llegar a una decisión. 4. Aunque es difícil de evaluar pero normalmente incrementan la confiabilidad de los resultados que se logran al tomar una decisión. 5. Motivan la exploración y el descubrimiento del tomador de decisiones. 6. Dan nuevas evidencias para apoyar una decisión o apoyan las suposiciones previas. 7. Crean una ventaja competitiva en las empresas. 13

16 A continuación se muestra la figura 2.1, con los beneficios de los DSS para las organizaciones. Figura 2.1 Beneficios de los DSS en las organizaciones Las limitaciones que tiene un DSS son: 1. Normalmente no involucran aspectos de la inteligencia humana como la creatividad, la imaginación y la intuición. 2. El DSS tiene como limitantes: el equipo computacional en el que corre, el diseño del mismo, y el conocimiento que posee cuando es usado. 3. Las interfaces no son suficientemente sofisticadas como para soportar la generación de voz, el reconocimiento de voz y el manejo de lenguaje natural. 4. Son aplicables a contextos específicos. 14

17 Los componentes de un DSS son: a) El Sistema de Administración de Datos. Compuesto en esencia por la base de datos y una facilidad para realizar consultas. b) El Sistema de Administración de Modelos. Responsable de controlar el almacenamiento y recuperación de los datos relacionados con los modelos cuantitativos en base a los cuales se estructura el proceso de análisis de decisiones. c) La Máquina de Conocimiento. Permite el derivar nuevo conocimiento en base a los datos base o a conocimiento previamente derivado. La máquina de conocimiento maneja: Estrategias de solución específicas de acuerdo al contexto, reglas derivadas, restricciones inherentes a una situación particular, probabilidades a priori. Básicamente podemos ubicar que el conocimiento contenido en un DSS pueden ser HECHOS e HIPOTESIS (reglas o relaciones que se cree existen entre los hechos). La máquina de conocimiento tiene dos funciones básicas: La Adquisición del Conocimiento; y La Recuperación del Conocimiento (Máquina de Inferencias). d) La Interface con el Usuario. Esta interface debería ser ad-hoc al usuario. Se pretende que está interfaz tenga capacidades de generación de voz, reconocimiento de voz, manejo de lenguaje natural, presentación de los datos, conocimiento, opciones y en general de toda la información de una manera adecuada al usuario, se busca de manera adicional agregar afectividad a la interfaz y el uso de agentes inteligentes. e) El Usuario del DSS. Se puede ubicar que existen diversos tipos de usuarios de un DSS, pero en esencia se distinguen: El Administrador del DSS. 15

18 El Mantenedor de los Datos, Base de Conocimiento, Reglas, entre otros. El Tomador de Decisiones Categorías y clase de decisiones Existe una gran variedad de métodos propuestos para clasificar y categorizar los sistemas de soporte a las decisiones. Métodos basados en el tipo de soporte ofrecido por el DSS; situación de la decisión; orientados a los datos, texto, reglas, o modelos; y enfoque en lo individual contra lo múltiple de los tomadores de decisiones, son todas las usadas en clasificar el gran número de DSS en existencia o bajo desarrollo. Según Marakas, algunas de las clasificaciones de los DSS, son las siguientes [4]. Centrados en los datos y centrados en los modelos DSS centrados en los datos y centrados en los modelos Los DSS centrados en los datos se enfocan primordialmente en la recuperación y análisis de los datos de las actividades de soporte. Los centrados en los modelos incluyen actividades tales como simulación, maximización u optimización de escenarios y aquellos resultados de los DSS que generan acciones sugeridas basadas en los modelos o reglas determinadas DSS formales y ad-hoc Esta clasificación es basada en los atributos del contexto de la solución del problema. Los formales están diseñados para enfocarse en decisiones que son periódicas o recurrentes dentro de la organización. Los ad-hoc se enfocan en un contexto de problema muy reducido o en un conjunto de decisiones que normalmente no son recurrentes o fáciles de anticipar. 16

19 DSS Dirigido y No Dirigido Esta clasificación se refiere al grado de dependencia del DSS con respecto al usuario, que tan automático es el proceso del DSS Modelo del proceso de toma de decisiones El problema a solucionar bajo condiciones y circunstancias específicas, marcan el rumbo de la forma que debe de ser tomada la decisión. La forma en la que es modelado el planteamiento del problema es sumamente útil, ya que permite estudiar con gran efectividad el contexto de un problema, derivar y organizar la información necesaria Alcance del problema del proceso de toma de decisiones Una vez definido en su totalidad el planteamiento del problema, el tomador de decisión debe examinar el alcance del problema. Al hacer dicha examinación podrá determinar la factibilidad de la solución del problema, pero que el alcance de ésta, va más allá de los recursos disponibles. El alcance del problema será determinado por las prioridades del tomador de decisiones. 17

20 2.3 Tecnologías de data warehouse El data warehouse es una herramienta novedosa para el soporte de la toma de decisiones, ya que ofrecen una base de información para el análisis de la situación de diversos factores relevantes al proceso en cuestión. En el presente capítulo se ofrecen conceptos relativos al data warehouse o bodegas de datos y sus características, se aborda además la arquitectura que los rige, así como una descripción del modelo dimensional de estos warehouses y su proceso de diseño. Por último se analizan las herramientas de aplicación en el data warehouse, como las consultas, análisis y visualización de la información Data warehouse Es común que en algunas organizaciones y empresas se haya acumulado la información que los sistemas generan al resolver los procesos que hacen posible la gestión cotidiana. Esta información es sumamente valiosa a la hora de tomar decisiones gerenciales, que necesitan conocimientos sobre datos históricos y sus tendencias. Puede ser muy usual el hecho de tratar de buscar información estratégica, consistente en encontrar cierta información, y luego utilizar el resultado obtenido para dirigir su próxima consulta, por lo que es preciso contar con una herramienta que permita la interacción en un corto tiempo y minimizando la interferencia con los sistemas que realizan la gestión cotidiana. El uso de herramientas tradicionales basadas en el desarrollo de aplicaciones sobre sistemas administradores de bases de datos para obtener información estratégica para la toma de decisiones, presenta inconvenientes de diferente índole, como tiempos de respuesta extremadamente lentos, dificultad o imposibilidad de expresar una consulta compleja, y dificultad para la obtención de resultados que recopilen información de fuentes diversas. 18

21 La información como base para la toma de decisiones, ha incrementado el interés por disponer de información altamente relevante. Una herramienta importante que permite integrar la información y aprovechar ésta para el análisis de la información relevante que soporta el proceso de la toma de decisiones, son los data warehouse, ya que favorecen la eficiencia en las operaciones de consulta, y con herramientas adecuadas de análisis de datos que ofrecen facilidades de apoyo en la toma de decisiones. El concepto de data warehouse se ha desarrollado a partir de la necesidad de disponer de un acceso sencillo e inmediato a determinada información de negocio estructurada y de calidad, que pueda ser empleada para la toma de decisiones. Dentro de una organización el uso del data warehouse se puede aplicar no sólo en el soporte de la gerencia de alto nivel que debe tomar decisiones de objetivos y planificación estratégicas, sino en niveles más técnicos de toma de decisión. Los sistemas data warehouse han surgido como respuesta a la problemática de extraer información relevante a partir de datos atómicos almacenados en bases de datos operacionales o transaccionales también conocidos como sistemas de procesamiento de transacciones en línea. Uno de los objetivos de los sistemas operacionales, es servir como base de información para la toma de decisiones. Los beneficios obtenidos por la utilización de éste tipo de sistemas se basan en el acceso interactivo e inmediato a información estratégica de un área de negocios. Al concepto de data warehouse le han dado definiciones diferentes personas. Algunas de estas definiciones se limitan al ámbito de los datos, algunas otras hacen referencia al conjunto global de procesos, software, herramientas y a los propios datos. Aunque las definiciones difieren, entre las distintas variantes existe un nexo común casi siempre. Un data warehouse es una colección de datos integrados, orientados a un tema, que varían con el tiempo y que no son transitorios, los cuales apoyan el proceso de la toma de decisiones [13]. 19

22 De manera informal, se puede entender a un data warehouse como un gran almacén que contiene una clase especial de producto, datos procedentes de cualquier lugar, de naturaleza heterogénea, en grandes volúmenes y con características mucho muy especiales y en donde los datos deben de estar bien definidos, ser consistentes y de naturaleza no vólatil; Adicionalmente deben ser capaces de proporcionar información histórica. El data warehouse no es un producto y no puede ser comprado, debe construirse paso a paso. Un data warehouse contiene una amplia variedad de datos que permiten visualizar un panorama lógico de las condiciones de la organización en cualquier momento, lo cual permitirá a los tomadores de decisiones, tener la capacidad para interpretarlos, convertirlos en información, posteriormente en conocimiento, y desde luego determinar las acciones a seguir. El esquema data warehouse se construye sobre la base de un proceso de integración aplicado sobre cierto conjunto de bases de datos fuentes. Se cargan con datos que surgen de un proceso conocido como extracción y limpieza, en donde sólo se cargan los datos y se construyen los resúmenes que sean relevantes para las tareas de toma de decisiones Características de un data warehouse El término data warehouse, que fue introducido por Inmon en 1990, el cual lo definió como una colección de datos orientada a temas, integrada, variante en el tiempo y no volátil, para el soporte del proceso de toma de decisiones. Esta definición establece las cuatro características que describen un data warehouse: Orientado al tema Esta característica de los data warehouse es que está orientado hacia el tema principal de una organización. La orientación por temas tiene como beneficio el incorporar una perspectiva de los datos, bajo características que son comunes a una entidad. Se parte del ambiente operacional donde la orientación y las 20

23 funciones buscan proveer servicio más que información. Una vez identificado el dato operativo, se procede a mapearlo hacia la temática seleccionada. Los datos se organizan en base a temas y no a aplicaciones. Por ejemplo, en el caso de seguros los temas pudieran ser cliente, prima, reclamo. Solamente contiene la información necesaria para el proceso de toma de decisiones. Variante en el tiempo La siguiente característica de los data warehouse es ser variante en el tiempo. El ambiente operacional contiene datos actuales, que son exactos al momento de acceso y tienen un horizonte de 60 a 90 días. Su actualización al momento es necesaria. En el caso de la tienda departamental, si el cliente utiliza el crédito abierto con la empresa y lleva a cabo una compra, es necesario actualizar su saldo disponible en tiempo real. Por otra parte, en el data warehousese mantiene una gran cantidad de historia. Se compone de fotografías de datos que reflejan alguna perspectiva dentro de un cierto horizonte de tiempo. En general, su horizonte puede ser entre 5 y 10 años. Los cambios en este caso no actualizan datos, sino son agregados al almacén de datos. Los datos en el data warehouse son históricos a diferentes niveles de granularidad. Su uso es para comparaciones, tendencias, pronóstico. No volátil Otra característica definida por Inmon dentro de los data warehouse es su no volatilidad. El ambiente operacional requiere de una actualización de datos constante, bajo operación de borrar, cambiar, insertar. La mecánica de operación de data warehouse tiene dos operaciones: a) carga de datos b) consulta de datos. 21

24 Una vez que se ha cargado un dato, no se actualiza. Los datos son solamente cargados y accedidos, nunca se actualizan. Integrados En el ambiente de los data warehouse, el factor más importante, es que al interior la información siempre será encontrada de forma integrada. En esencia, el ambiente de los data warehouse es que los datos que contiene en los límites del data warehouse, son integrados; el origen de los datos, son usualmente aplicaciones separadas dentro del ambiente operativo, donde la codificación de los datos generalmente es inconsistente [13]. Los datos implica que todos los datos de los diversos sistemas operacionales que son producidos por distintas secciones y distintas aplicaciones, deben ser unidos antes de ser agregados al data warehouse. A éste proceso se le conoce como Proceso de Extracción, Transformación y Carga (ETL, por sus siglas en inglés). La integración de los datos se muestra de muchas maneras: Convenciones de nombre consistentes Medidas uniformes de variables Codificación de estructuras consistentes Atributos físicos de los datos consistentes Fuentes múltiples Otros 22

25 2.3.3 Arquitectura de un data warehouse La arquitectura lógica de un sistema data warehouse consta de tres niveles básicos: 1. Bases de datos fuentes de producción e históricos. Consisten en bases de datos operacionales, transaccionales o de producción (OLTP), así como de históricos de dichas bases. Estas bases de datos pueden estar implementadas en diferentes tipos de sistemas: base de datos relacionales, base de datos geográficas, base de datos de textos, archivos. La característica en común que tienen dichas bases de datos, es que almacenan items de datos atómicos, los cuales son relevantes como datos operacionales, pero pudieran ser demasiados finos como base para la toma de decisiones. 2. Base de datos con datos resumidos extraídos de las bases de producción (data warehouse). Es un gran almacén que incluye los datos relevantes para la toma de decisiones en un área de negocios o globalmente en la organización. Los datos almacenados en el data warehouse son fundamentalmente datos relevantes agrupados y totalizados que se encuentran en las bases de datos transaccionales y en los históricos. Un elemento sumamente importante en el contexto de los data warehouse es el diccionario de datos (metadatos), el cual describe los datos almacenados con el objetivo de facilitar el acceso a los mismos a través de las herramientas de explotación del data warehouse. El diccionario de datos establece correspondencias entre los datos almacenados y los conceptos que estos representan deforma de facilitar la extracción de información por parte del usuario final. 3. Interfaces orientados a usuarios que extraen información para la toma de decisiones. A partir de las bases de datos fuentes éstos deben resolver problemas técnicos importantes, como el acceso a sistemas 23

26 heterogéneos, ejecución de consultas complejas afectando lo mínimo el performance de las bases fuentes. Adicionalmente a los componente descritos anteriormente, es preciso decir, que existen herramientas de monitoreo y administración del sistema y un área para almacenar y administrar metadatos. Las herramientas de administración, se dividen en herramientas de desarrollo, de planeación y análisis, y de monitoreo propiamente. Los data warehouse por su concepción almacenan grandes volúmenes de información, por lo que éstos son de mucho mayor magnitud en almacenamiento que las bases de datos operacionales. Según la capacidad de almacenamiento de los data warehouse se clasifican en tres categorías: 1. Data warehouse empresariales. Son proyectos de gran magnitud, dónde es necesario invertir fuertemente tiempo y recursos. 2. Data warehouse virtuales. Proporcionan vista de bases de datos, las cuales son materializadas para un acceso eficiente. 3. Data marts. Es un data warehouse específico o departamental, orientado a las necesidades de un grupo, específico de usuarios y, por tanto, enfocado a un subconjunto de aspectos de la organización [14]. 24

27 2.3.4 Data marts Es un pequeño data warehouse, para un determinado número de usuarios, para un área funcional, especifica de la compañía. También podemos definir que un data Marts es un subconjunto de una bodega de datos para un propósito específico. Data mart es un modelo multidimensional basado en tecnología OLAP (On- Line Analytical Processing) que representa a un área específica de la empresa, incluyendo las variables claves y los indicadores para el proceso de toma de decisiones. Hay tres enfoques principales para la creación de un data mart [14]: 1. Los datos pueden ser simplemente extraídos del data warehouse; de hecho sigue un enfoque de divide y vencerás sobre la carga de trabajo general de apoyo para la toma de decisiones, a fin de lograr un mejor rendimiento y escalabilidad. 2. A pesar del hecho de que el data warehouse pretende proporcionar un punto de control único, un data mart puede ser creado todavía en forma independiente (es decir, no por medio de la extracción a partir del data warehouse). Dicho enfoque puede ser adecuado si el data warehouse es inaccesible por alguna razón. 3. Algunas organizaciones han seguido un enfoque de crear primero el data mart, donde éstos son creados conforme van siendo necesarios y el data warehouse general es creado finalmente, como una consolidación de los diversos data marts. 25

28 2.3.5 Componentes de un data warehouse Poder transformar los datos en conocimientos es un proceso complejo. Un data warehouse, es una arquitectura que debe de servir como infraestructura para proporcionar una solución completa. Los componentes principales de un data warehouse se describen a continuación. 1. Componente de diseño / Adquisición de datos: Los sistemas operacionales procesan datos para apoyar las necesidades de operaciones críticas. Para hacer eso, se han creado las bases de datos operacionales históricas que proveen una estructura de procesamiento eficiente, para un número relativamente pequeño de transacciones comerciales bien definidas. Sin embargo, a causa del enfoque limitado de los sistemas operacionales, las bases de datos diseñadas para soportar estos, tienen dificultad al acceder los datos para otra gestión o propósitos informáticos. Esta, es amplificada por el hecho que muchos de estos sistemas tienen de 10 a 15 años de antigüedad. El tiempo de algunos de estos sistemas significa que la tecnología de acceso a los datos disponible para obtener los datos operacionales, es antigua. La meta del Data Warehouse es liberar la información que se almacena en bases de datos operacionales y combinarla con la información desde otra fuente de datos, generalmente externa. Cada vez, las organizaciones grandes adquieren datos adicionales desde bases de datos externas. 2. Componente de acceso a la información: Es el nivel del que el usuario final se encarga directamente. En particular, representa las herramientas que este normalmente, usa diariamente. Este nivel incluye el hardware y software que muestran la información en pantalla y emitir reportes de impresión, hojas de cálculo, gráficos y diagramas para el análisis y presentación. 26

29 Actualmente, existen herramientas sofisticadas para manipular, analizar y presentar los datos, sin embargo, hay problemas significativos al tratar de convertir los datos tal como son recolectados y que se encuentran contenidos en los sistemas operacionales en información fácil y transparente para las herramientas de los usuarios finales. 3. Componente de acceso a los datos: El nivel de acceso a los datos de la arquitectura Data Warehouse se involucra con el nivel de acceso a la información para conversar en el nivel operacional. En la red mundial de hoy, el lenguaje de datos común que surge es SQL (Structured Query Language). Originalmente, SQL fue desarrollado por IBM como un lenguaje de consulta, pero en los últimos veinte años ha llegado a ser el estándar para el intercambio de datos. El nivel de acceso a los datos no solamente conecta DBMSs (Bases de Datos Relacionales) diferentes y sistemas de archivos sobre el mismo hardware, sino también a los fabricantes y protocolos de red. Una de las claves de una estrategia Data Warehouse es proveer a los usuarios finales con "acceso a datos universales". El acceso a los datos universales significa que, teóricamente por lo menos, los usuarios finales sin tener en cuenta la herramienta de acceso a la información o ubicación, deberían ser capaces de accesar a cualquier o todos los datos en la empresa que es necesaria para ellos. El nivel de acceso a los datos entonces es responsable de la interfase entre las herramientas de acceso a la información y las bases de datos operacionales. En algunos casos, esto es todo lo que un usuario final necesita. 4. Componente de Directorio de Datos (Metadata): A fin de proveer el acceso a los datos universales, es absolutamente necesario mantener alguna forma de directorio de datos o repositorio de la información metadata. A fin de tener un depósito totalmente funcional, es necesario 27

30 tener una variedad de metadata disponibles, información sobre las vistas de datos de los usuarios finales e información sobre las bases de datos operacionales. Idealmente, los usuarios finales deberían de accesar a los datos desde el data warehouse (o desde las bases de datos operacionales), sin tener que conocer dónde residen los datos o la forma en que se han almacenado. 5. Componente de Gestión de Procesos: El nivel de gestión de procesos tiene que ver con la programación de diversas tareas que deben realizarse para construir y mantener el data warehouse y la información del directorio de datos. Este nivel puede depender del alto nivel de control de trabajo para muchos procesos que deben ocurrir para mantener el data warehouse actualizado. 6. Componente de Mensaje de la Aplicación: El nivel de mensaje de la aplicación tiene que ver con el transporte de información alrededor de la red de la empresa. El mensaje de aplicación se refiere también como "subproducto", pero puede involucrar sólo protocolos de red. Puede usarse por ejemplo, para aislar aplicaciones operacionales o estratégicas a partir del formato de datos exacto, recolectar transacciones o los mensajes y entregarlos a una ubicación segura en un tiempo seguro. 7. Componente data warehouse (Físico): En el data warehouse es donde ocurren los datos actuales, usados principalmente para usos estratégicos. En algunos casos, se puede pensar del data warehouse simplemente como una vista lógica o virtual de datos. En muchos ejemplos, el Data Warehouse puede no involucrar almacenamiento de datos. En un Data Warehouse físico, copias, en algunos casos, muchas copias de datos operacionales y/o externos, son almacenados realmente en una forma que es fácil de acceder y es altamente flexible. Cada vez más, los Data Warehouse son 28

31 almacenados sobre plataformas cliente / servidor, pero por lo general se almacenan sobre mainframes o computadoras grandes. 8. Componente de Organización de Datos: El componente final de la arquitectura data warehouse es la organización de los datos. Se llama también gestión de copia o réplica, pero de hecho, incluye todos los procesos necesarios como seleccionar, editar, resumir, combinar y cargar datos en el depósito y acceder a la información desde bases de datos operacionales y/o externas. Existen distintas categorías de componentes, dependiendo del tipo de usuario al que esté enfocado, y que se mencionan y describen a continuación: Usuarios básicos. En esta categoría se encuentran las aplicaciones que permiten realizar informes predefinidos que se ejecutaran de forma mas o menos periódica. En este caso el interés del usuario se centra en disponer de una información determinada, probablemente que atienda informes de indicadores de la organización, pero sin ir más allá en el análisis de la información. Aplicaciones que facilitan la ejecución de análisis elemental de los datos contenidos en el data warehouse. Aquí se incluyen las herramientas de análisis multidimensionales y aquéllas que permiten a los analistas a cuestionar al data warehouse sobre la información, y a explorar los datos más desde la visión de la organización que desde el punto de vista de las operaciones. Aplicaciones que permiten realizar análisis avanzados. Aquí se encuentran las herramientas de análisis estadístico (basadas en técnicas como el análisis factorial o discriminante) y las de data mining (minería de datos, que son técnicas procedentes de la inteligencia artificial y redes 29

32 neuronales). Este componente también dispone de mecanismos para implementar la seguridad de acceso. Así mismo, este control tiene como objetivo primordial impedir la utilización del sistema a los usuarios no autorizados y delimitar a cada uno de los usuarios su ámbito de acceso, ya sea en cuanto a la información disponible para él o en cuanto al tipo de operaciones que le está permitido realizar. Componente middleware. Este componente middleware proporciona la conectividad necesaria entre la base de datos del data warehouse y las herramientas de acceso de usuario final. Existen dos tipos de middleware especializados. 1. Middleware inteligente. Proporciona una visión de la organización del data warehouse a los usuarios finales y supervisa y registra el acceso a la información del data warehouse. 2. Servidores analíticos. Mejoran las prestaciones de las operaciones de análisis multidimensional en un entorno de base de datos relacional. Componente de distribución de datos. Es el responsable de distribuir la información del data warehouse a otras aplicaciones, como pueden ser data mart, hojas de cálculo, bases de datos locales entre otros Operaciones de un data warehouse El objetivo de un ambiente data warehouse es convertir los datos de aplicaciones del ambiente transaccional (OLTP), en datos integrados de gran calidad. Después deben almacenarse en una estructura que optimice el acceso por parte de los usuarios finales en un ambiente decisión (OLAP). Durante éste 30

33 proceso, los datos totalizados son agregados al data warehouse en una base periódica, apropiada al tipo de análisis de negocios necesarios. A continuación se describen las operaciones de un data warehouse. a) Sistemas Operacionales: Los datos administrados por los sistemas de aplicación operacionales son la fuente principal de datos para el Data Warehouse. Las bases de datos operacionales se organizan como archivos indexados, bases de datos de redes/jerárquicas o sistemas de base de datos relacionales. b) Extracción, Transformación y Carga de los Datos: Se requieren herramientas de gestión de datos para extraer datos desde bases de datos y/o archivos operacionales, luego es necesario manipular o transformar los datos antes de cargar los resultados en el Data Warehouse. Tomar los datos desde varias bases de datos operacionales y transformarlos en datos requeridos para el depósito, se refiere a la transformación o a la integración de datos. Las bases de datos operacionales, diseñadas para el soporte de varias aplicaciones de producción, frecuentemente difieren en el formato. Los mismos elementos de datos, si son usados por aplicaciones diferentes o administrados por diferentes software de administración de bases de datos (DBMS), pueden definirse al usar nombres de elementos inconsistentes, que tienen formatos inconsistentes y/o ser codificados de manera diferente. Todas estas inconsistencias deben resolverse antes que los elementos de datos sean almacenados en el data warehouse. c) Metadata: Otro paso necesario es crear la metadata. Esta describe los contenidos del data warehouse. Consiste de definiciones de los elementos de datos en el depósito, sistemas de los elementos fuente. Los datos, se integran y transforman antes de ser almacenados en información similar. 31

34 d) Acceso de usuario final: Estos accesan al data warehouse por medio de herramientas de productividad basadas en Interface gráfica de usuario (GUI). Proveen a los usuarios del data warehouse muchos de estos tipos de instrumentos. Estos pueden incluir software de consultas, generadores de reportes, procesamiento analítico en línea, data/visual mining, entre otros, dependiendo de los tipos de usuarios y sus requerimientos particulares. Sin embargo, una sola no satisface a todos, por lo que es necesaria la integración de una serie de utensilios. e) Plataforma del Data Warehouse: La plataforma para el data warehouse es casi siempre un servidor de base de datos relacional. Cuando se manipulan volúmenes muy grandes de datos puede requerirse una configuración en bloque. Los extractos de los datos integrados/transformados se cargan en el data warehouse. La elección de la plataforma es crítica, el almacén crece y hay que comprender los requerimientos después de 3 o 5 años. Muchas de las organizaciones quieran o no escogen una plataforma por diversas razones: el Sistema X es el elegido o el Y está disponible sobre uno que ya se tiene. Uno de los errores más grandes que las organizaciones cometen al seleccionar la plataforma, es que ellos presumen que el sistema (hardware y/o DBMS) escala con los datos. El sistema de depósito ejecuta las consultas que se pasa a los datos por el software de acceso del usuario. Aunque uno de estos visualiza las consultas desde el punto de vista de un GUI, estas típicamente se formulan como pedidos SQL, porque es un lenguaje universal y el estándar hecho para el acceso a datos. f) Datos Externos: Dependiendo de la aplicación, el alcance del data warehouse se extiende por la capacidad de accesar los datos externos. Por ejemplo, los datos accesibles por medio de servicios de computadora en línea y/o vía Internet, pueden estar disponibles a los usuarios del data warehouse. 32

35 Los seis puntos mencionados anteriormente del data warehouse, proveen un marco de trabajo para controlar la arquitectura de los componentes. Éste marco, describe las transformaciones de los datos desde un ambiente OLTP, a un ambiente OLAP Diferencias entre OLTP y data warehouse Los sistemas tradicionales de transacciones y las aplicaciones de Data warehouse son polos opuestos en cuanto a sus requerimientos de diseño y sus características de operación. Las aplicaciones de OLTP están organizadas para ejecutar las transacciones para lo cual fueron hechas, como por ejemplo: mover dinero entre cuentas, un cargo o abono, una devolución de inventario, entre otros. Por otro lado, un data warehouse está organizado en base a conceptos, como por ejemplo: clientes, facturas, productos, y otros. Otra diferencia radica en el número de usuarios. Normalmente, el número de usuarios de un data warehouse es menor al de un OLTP. Es común encontrar que los sistemas transaccionales son accedidos por cientos de usuarios simultáneamente, mientras que los data warehouse sólo por decenas. Los sistemas de OLTP realizan cientos de transacciones por segundo mientras que una sola consulta de un data warehouse puede tomar minutos. Otro factor es que frecuentemente los sistemas transaccionales son menores en tamaño a los data warehouse, esto es debido a que un data warehouse puede estar formado por información de varios sistemas tipo OLTP. Existe también diferencia en los diseños, mientras que el de un OLTP es extremadamente normalizado, el de un data warehouse tiende a ser desnormalizado. El OLTP normalmente está formado por un número mayor de tablas, cada una con pocas columnas, mientras que en un data warehouse el número de tablas es menor, pero cada una de éstas tiende a ser mayor en número de columnas. 33

36 Los OLTP son continuamente actualizados por los sistemas operacionales del día con día, mientras que los data warehouse son actualizados en batch de manera periódica. Las estructuras de los OLTP son muy estables, rara vez cambian, mientras las de los data warehouses sufren cambios constantes derivados de su evolución. Esto se debe a que los tipos de consultas a los cuales están sujetos son muy variados y es imposible preverlos todos de antemano. Mejorar la entrega de información: información completa, correcta, consistente, oportuna y accesible. Información que la gente necesita, en el tiempo que la necesita y en el formato que la necesita. Mejorar el proceso de toma de decisiones: con un mayor soporte de información se obtienen decisiones más rápidas; así también, la gente de negocios adquiere mayor confianza en sus propias decisiones y las del resto, y logra un mayor entendimiento de los impactos de sus decisiones. Impacto positivo sobre los procesos empresariales: cuando a la gente se le da acceso a una mejor calidad de información, la empresa puede lograr por sí sola: Eliminar los retardos de los procesos empresariales que resultan de información incorrecta, inconsistente y/o no existente. Integrar y optimizar procesos empresariales a través del uso compartido e integrado de las fuentes de información. Eliminar la producción y el procesamiento de datos que no son usados ni necesarios, producto de aplicaciones mal diseñados o ya no utilizados. El proceso analítico es la parte más importante de los sistemas data warehouse. Al construir un data warehouse se requiere organizar los datos 34

37 operacionales como información analítica y ofrecer herramientas de análisis a los tomadores de decisión. El proceso analítico, permite a los tomadores de decisión, examinar diferentes dimensiones de información de una manera efectiva para poder tomar una decisión. El proceso analítico es definido como el proceso analítico en línea (OLAP, On Line Analytical Proccesing, por sus siglas en inglés). Los sistemas data warehouse son datos dimensionales, normalmente no están en línea y el énfasis está en el poder extraer información relevante de los datos provenientes de los sistemas OLTP.. 35

38 2.3.8 Arquitectura OLAP La explotación de sistemas data warehouse a través de datos obtenidos directamente de sistemas transaccionales, OLTP, se basa fundamental y básicamente en estructuras agrupadas o información previamente pre-calculada y procesada. La información reportada está compuesta y gestionada desde conceptos basados en datos agregados y coeficientes de gestión, que los cuadros directivos de la organización pueden definir y consultar según las dimensiones de negocio que se definan o el área a la que pertenezca. Implementar un sistema de business intelligence significa encontrar el punto de equilibrio entre dos extremos: implementación independiente de las unidades de la organización y la arquitectura de almacenamiento de datos definida por los IT departamentales. Por un lado los IT departamentales deben aceptar que el hecho de que ellos no puedan suministrar las visiones del usuario final con la premura requerida sin incorporar tecnología OLAP. Por otro lado los directivos deben aprender a reconocer el valor de tener un repositorio común del que leer todos los indicadores y toda la terminología que cruza todos los datos de todos los departamentos. Únicamente un data warehouse puede proveer esta consistencia. La información es gestionada y procesada en grandes bloques organizativos, como puede ser la estructura geográfica o académica, llamados dimensiones. Dichas dimensiones de negocio se estructuran a su vez en distintos niveles de detalle (por ejemplo, la dimensión geográfica puede constar de los niveles país, comunidad autónoma, provincia, población y código postal). Este tipo de sistemas ha existido desde hace tiempo, en el mundo de la informática, bajo distintas denominaciones: cuadros de mando, MIS, EIS, y otros. Aunque su implementación, al margen del entorno data warehouse, puede repercutir sobre estos sistemas en una mayor rigidez, dificultad de actualización y mantenimiento, tiempos de respuesta inaceptables, incoherencias de la información, falta del dato agregado. 36

39 Los sistemas de soporte a la decisión que utilizan tecnologías de data warehouse, se llaman sistemas OLAP. En general, estos sistemas OLAP deben: Soportar requerimientos complejos de análisis Analizar datos desde diferentes perspectivas Soportar análisis complejos contra un volumen ingente de datos La principal característica de los sistemas OLAP es que son entornos especialmente diseñados para la ejecución de análisis multidimensionales de los datos corporativos, que soportan amigablemente los análisis de cualquier usuario así como las posibilidades de navegación, seleccionando la información a obtener, permitiendo el análisis de datos segmentados y que permiten ir reduciendo el conjunto de datos reportados. Este tipo de selecciones se refleja en la visualización de la estructura multidimensional, mediante unos campos de selección que nos permitan elegir el nivel de agregación (jerarquía) de la dimensión, y/o la elección de un dato en concreto, pudiendo con ello realizar, entre otras, las acciones de rotar, bajar atributos, navegar, expandir o colapsar los datos mostrados Sistema MOLAP La arquitectura de sistemas MOLAP se fundamenta, para proporcionar el análisis, en bases de datos multidimensionales. Su principal premisa es que se trata del entorno OLAP mejor implantado y adaptado para el almacenamiento y gestión de datos multidimensionalmente. Por el contrario, la arquitectura y gestión de entornos ROLAP presupone que las capacidades OLAP están perfectamente implantadas y reflejadas sobre bases de datos relacionales. Un sistema MOLAP usa una base de datos multidimensional, en la que la información se almacena multidimensionalmente, para ser visualizada 37

40 multidimensionalmente (valga la redundancia). El sistema MOLAP utiliza una arquitectura de dos niveles: La bases de datos multidimensionales y el motor analítico. La base de datos multidimensional es la encargada del manejo, acceso y obtención del dato. El nivel de aplicación es el responsable de la ejecución de los requerimientos OLAP. El nivel de presentación se integra con el de aplicación y proporciona un interfaz a través del cual los usuarios finales visualizan los análisis OLAP. Una arquitectura cliente/servidor permite a varios usuarios acceder a la misma base de datos multidimensional. La información procedente de los sistemas transaccionales, se carga en el sistema MOLAP, mediante una serie de rutinas o procedimientos batch. Una vez cargado el dato elemental en la Base de Datos multidimensional (MDDB), se realizan una serie de cálculos en batch, para obtener los datos agregados, a través de las dimensiones de negocio, rellenando la estructura MDDB y generando los cubos multidimensionales que darán cobertura a los informes implementados en el nivel de aplicación. Tras cargar esta estructura, se generan unos índices y algoritmos de tablas hash para mejorar los tiempos de acceso a las consultas. Una vez que el proceso de compilación ha finalizado, la MDDB está lista para su uso. Los usuarios solicitan informes a través del interface, y la lógica de aplicación de la MDDB obtiene el dato. La arquitectura MOLAP requiere cálculos intensivos de compilación. Leer de datos precompilados, y tiene capacidades limitadas de crear agregaciones dinámicamente o de hallar ratios que no se hayan precalculados y almacenados previamente. 38

41 Sistema ROLAP En una arquitectura ROLAP, el sistema accede directamente a los datos almacenados en un data warehouse para proporcionar los análisis OLAP solicitados. La premisa de estos sistemas es que las capacidades OLAP se soportan mejor contra las bases de datos relacionales, más que tenerlas directamente implementadas en la base de datos (como en entornos MOLAP). La esencia de estos entornos es que las acciones de filtrado y agregación son equivalentes a la inclusión de una cláusula WHERE" en una sentencia SQL. El sistema ROLAP utiliza una arquitectura de tres niveles. La base de datos relacional maneja los requerimientos de almacenamiento de datos, y el motor ROLAP proporciona la funcionalidad analítica. El nivel de base de datos usa bases de datos relacionales para el manejo, acceso y obtención del dato. El nivel de aplicación es el motor que ejecuta las consultas multidimensionales de los usuarios. El motor ROLAP se integra con niveles de presentación, a través de los cuales los usuarios realizan los análisis OLAP. Después de que el modelo de datos para el data warehouse se ha definido, los datos se cargan desde el sistema transaccional. Se ejecutan rutinas de bases de datos para agregar el dato, si así es requerido por los modelos de datos. Se crean entonces los índices para optimizar los tiempos de acceso a las consultas. Los usuarios finales ejecutan sus análisis multidimensionales, a través del motor ROLAP, que transforma dinámicamente sus consultas a consultas SQL. Se ejecutan estas consultas SQL en las bases de datos relacionales, y sus resultados 39

42 se relacionan mediante tablas cruzadas y conjuntos multidimensionales para devolver los resultados a los usuarios. La arquitectura ROLAP es capaz de usar datos precalculados si estos están disponibles, o de generar dinámicamente los resultados desde los datos elementales si es preciso. Esta arquitectura accede directamente a los datos del data warehouse, y soporta técnicas de optimización de accesos para acelerar las consultas. Estas optimizaciones son, entre otras, particionado de los datos a nivel de aplicación, soporte a la desnormalización y múltiples joins entre tablas Operaciones OLAP Las herramientas OLAP implementan una serie de operaciones para manejar y extraer los datos que queramos, de las dimensiones representadas en el cubo. Las operaciones multidimensionales se pueden agrupar en dos conjuntos básicos: 1) De agrupación (roll-up, drill-down). Éste grupo de operaciones está constituido, por operaciones que surgen de realizar movimientos en las jerarquías de las dimensiones. La operación que realiza el roll-up es aumentar el nivel de abstracción. Cuando se sube de nivel por una jerarquía, se agrupan todos los valores del nivel original que están relacionados con el mismo valor del nivel superior, mientras que el drilldown lo que hace es decrecer el nivel de abstracción y aumentar el detalle. Cuando baja por la jerarquía se produce la desagrupación de los valores. Cuando se realiza un roll-up, se debe calcular una nueva medida en función del conjunto de los valores de las medidas que se agrupan. 2) De selección y visualización (slice & dice). No se ha encontrado un consenso en la definición de slice & dice, sin embargo se acepta en general 40

43 que hay tres operaciones asociadas a slice & dice. Uno, la operación slice selecciona y proyecta en una dimensión del cubo de datos; dos, la operación dice realiza una selección en más de una dimensión que consiste en un corte bidimensional en un cubo multidimensional; y tres, la operación pivoting, que básicamente lo que realiza es reorientar la vista multidimensional de los datos. Las operaciones roll-up y drill-down, permiten al usuario obtener un nivel más detallado o más generalizado, definiendo así niveles de granularidad o agrupación de la misma [9]. La elección de una herramienta OLAP que permita realizar éstos análisis de la información será fundamental para que el soporte a la toma de decisiones sea el más adecuado posible. Sin embargo existen métodos para saber si una herramienta es o no OLAP, que son las reglas de Codd. Dichas reglas quedan definidas como FASMI que se refieren a cinco palabras; Fast Analysis of Shared Multidimensional Information (Análisis rápido de información multidimensional compartida), que además, son en sí mismas una definición de lo que es OLAP. 1) FAST. La primera regla de Codd se refiere a que el sistema debe ser capaz de responder de una forma rápida y ágil a la información que le sea solicitada por el usuario, el cuál no deberá esperar mucho tiempo (cinco segundos) a la hora de resolver peticiones sencillas y no más de veinte segundos en las peticiones complejas. Las herramientas deben proveer una amplia variedad de técnicas para cumplir ésta regla, tales como almacenamiento especializado de datos, pre cálculos, por mencionar algunos. 2) ANALYSIS. Esto significa, que el sistema debe poder reflejar cualquier lógica del negocio para poder responder a las preguntas específicas y necesidades de la empresa. Por ejemplo, deberá permitir generar cálculos ad-hoc sin necesidad de usar una herramienta de programación específica, esto no implica que forzosamente deba proveer la herramienta un entorno 41

44 para conseguirlo, sino que puede proveer la integración con productos externos. 3) SHARED. Esto se refiere, a que el sistema deberá proporcionar herramientas que garanticen la confiabilidad de los datos. Por ejemplo, seguridad de acceso por perfiles de los usuarios. 4) MULTIDIMENSIONAL. Este es el punto más importante que podría definir como OLAP en sí mismo. La herramienta deberá proporcionar soporte a cada una de las múltiples jerarquías que pudieran existir dentro de la organización. 5) INFORMATION. Son todos los datos e información derivado de éste proceso de análisis, la cual nos permitirá la toma de decisiones en la organización. OLAP es una opción de análisis y de reporte. Es un componente importante del bloque de acceso y uso de la arquitectura de referencia del data warehouse. Los componentes de la tecnología OLAP se capturan en sub-bloques de los bloques de acceso y uso. El componente OLAP del sub-bloque de análisis y reporte representa las opciones de análisis y reporte de los servicios OLAP requeridos, mientras que la transformación a la estructura multidimensional, así como el acceso a los componentes data warehouse y de los data marts, son parte del sub-bloque de acceso y recuperación Capacidades de la técnica OLAP Son varias capacidades las que ofrece la técnica OLAP. Algunas de ellas, se mencionan a continuación: Permite a gerentes y analistas examinar y manipular interactivamente grandes cantidades de datos consolidados y detallados desde muchas perspectivas. 42

45 OLAP comprende el análisis de relaciones entre miles e incluso millones de datos almacenados, en bases de datos multidimensionales para descubrir patrones tendencias y condiciones de excepción. OLAP suministra respuestas rápidas a consultas complejas. Una sesión OLAP, ocurre en línea y en tiempo real, con respuestas rápidas a las consultas. Permite manipular requerimientos analíticos. 43

46 2.4 Técnicas de modelados de datos En la estructura de base de datos el modelado de datos es parte fundamental. El modelo de datos es una colección de herramientas conceptuales para describir los datos, las relaciones de los datos, la semántica de los datos y las ligaduras de integridad referencial [15]. Existen dos técnicas de modelado de datos que son relevantes en un ambiente de data warehouse estas son: el modelado Entidad-Relación (ER) y el modelado dimensional. Ambas técnicas de modelado, Entidad-Relación y Dimensional, pueden ser usadas para crear un modelo abstracto de un tema específico. Sin embargo, cada una tiene sus propias limitaciones en cuanto a conceptos de modelado y convenciones de notación asociadas. En consecuencia, las técnicas parecen y son, realmente diferentes en términos de la representación semántica utilizada. Para efectos del trabajo desarrollado, se dará una explicación básica del modelado ER y en mayor detalle el modelado dimensional en las siguientes secciones Modelo Entidad / Relación El modelado de datos ER se basa en una percepción del mundo real formado por una colección de objetos básicos, estos objetos se llaman entidades, y de relaciones entre estos objetos [15]. Así, el modelado ER genera un modelo de datos del área específica de interés, utilizando: entidades y las relaciones entre estas entidades. Los modelos ER detallados contienen atributos, los cuales pueden ser propiedades de ambos, de las entidades o bien de las relaciones. El modelado ER es una herramienta de abstracción dado que es utilizada para entender y simplificar las relaciones ambiguas de datos en el mundo de los negocios y ambientes de sistemas complejos. 44

47 2.4.2 Modelo Dimensional Tanto para la eficiencia operativa como para la planeación a futuro, se deben analizar muchos datos de la organización que se encuentran interrelacionados. Esta necesidad de las organizaciones se aborda mediante el procesamiento analítico. En éste, el enfoque está en el análisis de los datos, específicamente en el análisis dimensional. El Modelo Dimensional es el reflejo directo de la manera en que son visualizados los procesos del negocio. Captura las medidas de importancia de un negocio y los parámetros por los cuales éstas medidas son explotadas [CA98]. El modelado dimensional (Dimensional Modeling, DM) es una técnica de diseño que provee una forma de representar los datos en una forma estándar para conseguir un alto rendimiento. El modelado dimensional es muy útil para sumarizar y organizar los datos y vistas, presentadas en información para soportar el análisis de la misma. En un almacén multidimensional, la información se presenta como matrices multidimensionales, cuadros de múltiples entradas o funciones de varias variables sobre conjuntos finitos. El modelado dimensional permite visualizar los datos en forma de cubo tridimensional o con más dimensiones; para éste caso se le llama hipercubo. El cubo multidimensional, es una estructura que permite realizar diferentes y posibles combinaciones para visualizar los resultados de una organización hasta un determinado grado de detalle, ésta estructura es independiente al sistema operacional o transaccional de la organización, y facilita consultar información histórica de manera rápida y eficiente; ofreciendo la posibilidad de navegar y analizar los datos requeridos. Cada celda del cubo contiene un valor o medición para una combinación particular. El esquema de un cubo queda determinado dando a conocer sus ejes con sus respectivas estructuras, y la estructura de los datos que se presentan en cada celda de la matriz. Se asume que los datos en todas las celdas son uniformes, es decir, todas la posiciones de la matriz tienen datos con igual estructura. la figura 2.2 muestra un cubo con tres dimensiones, 45

48 producto, lugar y período, donde cada celda pudiera contener información para una combinación dada las tres dimensiones. Figura 2.2 Ejemplo de un cubo con tres dimensiones. 46

49 Una instancia de un cubo, queda determinada por un conjunto de datos para cada eje y un conjunto de datos para la matriz. A los ejes se les llama dimensiones y al dato que se presenta en la matriz, se le llama medida. El modelado dimensional es una técnica de diseño lógica usada en los data warehouse, la cual es una alternativa al modelado entidad-relación. Un modelo dimensional contiene la misma información que un modelo entidad-relación pero almacena la información en una estrella asimétrica la cual es una estructura optimizada para el diseño de diferentes propósitos: Entender al usuario, funcionamiento de consultas, resistencia al cambio. Un modelo dimensional está compuesto por una tabla con múltiples llaves. la tabla de hechos y un conjunto de tablas más pequeñas, las tablas de dimensiones. Cada tabla de dimensión está conectada a la tabla de hechos por una llave primaria la cual corresponde a uno de los componentes de la llave compuesta. La tabla de hechos contiene las medidas del negocio o los hechos. La actividad del modelado dimensional inicia con la definición Ralph Kimball propone los pasos que a continuación se enumeran para diseñar un modelo dimensional: 1) Definir el proceso a modelar. Se refiere a que se debe modelar la actividad natural a la cual está dedicada la organización. Típicamente está soportado por los sistemas transaccionales. Ejemplo de esto suponiendo que fuera una cadena de supermercados inventarios, ventas, promociones entre otros, asi como el movimiento diario de productos. 2) Definir la granularidad. La granularidad especifica exactamente el nivel de detalle con el cual los datos serán almacenados en la tabla de hechos. Típicamente la granularidad son transacciones individuales y generalmente en un data warehouse, los datos se expresan con el más bajo grado de granularidad de las dimensiones. En los data warehouse es posible manejar diversos niveles de granularidad, a menor granularidad, mayor cantidad de detalle. Para aumentar la granularidad, los datos operacionales deben 47

50 resumirse y acumularse, entre mayor sea la granularidad, mas procesamiento se tendrá para convertir y resumir los datos desde las fuentes, pero, al mismo tiempo, menor será el volumen de almacenamiento y mayor la facilidad de las consultas. Algunos datos se pueden almacenar como agregados, esto implica un especial cuidado al momento de las actualizaciones, para que estos datos agregados también sean actualizados. Ejemplos comunes de granularidad son operaciones diarias de la venta de cierto producto al final del día, en un lugar determinado, o las operaciones de ventas mensuales del producto. 3) Identificar las dimensiones. Son los objetos del negocio, con los cuales se puede analizar la tendencia y el comportamiento del negocio. La definición de estas dimensiones, se basan en políticas de la compañía o del mercado, es decir como interpretan o clasifican su información para segmentar el análisis en sectores que por sus características comunes facilitan la observación y el análisis. 4) Definir el hecho. Son características cualitativas o cuantitativas, de los objetos que se desean analizar en las empresas. Las medidas cuantitativas están dadas por valores o cifras porcentuales. Por ejemplo, se tienen las ventas en dólares, el número de unidades de inventario, las horas trabajadas, el promedio de piezas producidas, el porcentaje de aceptación de un producto, el consumo de combustible de un vehículo y etc. El modelado dimensional posee tres conceptos básicos: hechos, dimensiones y atributos [9]. Hechos, dimensiones, Atributos En el modelado dimensional, cada modelado está compuesto de una tabla con una clave primaria compuesta, denominada tabla de hechos, y un conjunto de tablas más pequeñas denominadas tabla de dimensiones. Cada una de las tablas 48

51 de dimensión tiene una clave primaria que corresponde exactamente con uno de los componentes de la clave compuesta de la tabla de hechos. Ésta estructura se asemeja a una estrella, que se pudiera decir que es una gran tabla central o tabla de hechos conectada con un conjunto de tablas menores dispuestas de manera radial alrededor de ésta tabla central. Generalmente recibe el nombre de "star-join O modelado estrella [9]. En la figura 2.3 se muestra un ejemplo del modelo estrella, donde las dimensiones son tiempo, localización y producto, y la tabla de hechos es ventas. El modelado estrella es altamente desnormalizado, todo lo contrario en un modelo relacional de bases de datos operacionales, con la desnormalización se logra minimizar el números de uniones (join) y, por consiguiente, incrementar el rendimiento de las consultas (una tabla de hechos está relacionada con numerosas tablas de dimensiones). Como se ha mencionado anteriormente los componentes básicos del modelo dimensional son hechos, dimensiones y atributos. Cada uno de ellos se definen a continuación: a) Hechos. El hecho es la información que es objeto de análisis, una medición númerica de interés. Por lo general los hechos son típicamente numéricos, sin embargo existen algunos casos que pueden ser de tipo texto. Un ejemplo de hecho, seria el número de unidades de un producto vendidas en el día en una determinada tienda. La tabla de hechos, es la tabla básica donde se registran medidas de rendimiento de la empresa [9], es decir, que contienen datos sobre las actividades básicas de la organización. El hecho tiene las propiedades de la aditividad (hechos que se pueden sumar en cualquier dimensión o combinación de ellas), la semiaditividad (solo se suman en algunas dimensiones) y la no aditividad (solo se pueden sumar en algunas dimensiones). En la tabla de hechos mostrada en el modelo estrella de la figura 2.3 el valor de las ventas y el 49

52 número de unidades vendidas son propiedades de aditividad, por el hecho de poder sumarse con cualquier combinación de las dimensiones tiempo, localización o producto. Un hecho semiaditivo pudiera ser el nivel de inventario, ya que únicamente sobre la dimensión tiempo no puede sumarse. Los indicadores más útiles en una tabla de hechos son numéricos y aditivos, ya que la aditividad representa un factor sumamente importante, porque en las aplicaciones de los data warehouse casi nunca se recupera un solo registro de la tabla de hechos, sino todo lo contrario ya que acceden a cientos, miles o incluso millones de registros a la vez y, por tanto, lo único eficaz que se puede hacer en ellos es sumarlos. b) Dimensiones. Las dimensiones describen los objetos relevantes para la organización y son clases descriptores de los hechos. Los atributos de las dimensiones se emplean como fuente de las restricciones en las consultas al data warehouse. Los atributos de la dimensión son almacenados en una tabla de dimensiones y cada columna representa un nivel particular en una jerarquía. En un esquema estrella todas las columnas están en la misma tabla mientras en un esquema copo de nieve (snowflake) las columnas están en tablas separadas por cada nivel. El concepto dimensión es fundamental para un modelo multidimensional. Una de las dimensiones mas comunes en cualquier modelado multidimensional es el tiempo, por lo que en raras ocasiones ésta dimensión no sea incluida en el modelado. Los datos de las tablas de dimensiones son generalmente de tipo alfanumérico. 50

53 Jerarquías de las dimensiones Las jerarquías son una manera para organizar los datos de acuerdo a los niveles. Las dimensiones están estructuradas jerárquicamente y así los datos de los diferentes niveles de agrupación se pueden manipular juntos de manera eficiente para su análisis y visualización. Las jerarquías en las dimensiones permiten a los usuarios reconocer tendencias en un nivel de agrupación, explorar a un nivel más bajo para identificar las razones de estas tendencias, y subir a un nivel más alto para ver qué efectos esas tendencias tienen en un amplio sector del negocio. A cada nivel de una jerarquía se le llama nivel de agrupación o simplemente nivel. De ésta forma se puede considerar que toda dimensión siempre tiene por lo menos una jerarquía con un único nivel. Cada uno de los niveles representa una posición en la jerarquía, los niveles agrupan los datos y son usados internamente para realizar cálculos. Por ejemplo, la dimensión tiempo puede tener día, semana, trimestre y año para los niveles de la jerarquía. Sí los datos del hecho ventas son almacenado en días, entonces el nivel mas alto de la dimensión tiempo permite que los datos de las ventas sean agrupados correctamente dentro de semana, trimestre y año. Día se agrupa en semana, semana se agrupa en trimestre y trimestre se agrupa en años. Los atributos de las jerarquías en los diferentes niveles tienen una relación de uno a muchos (1:N), es decir de padres e hijos. Por ejemplo, el semestre 1 y el semestre 2 son hijos del año, y así el año es padre del semestre 1 y semestre 2 En la figura 2.3 se muestra un ejemplo de jerarquía para la dimensión tiempo. Una dimensión puede tener más de una jerarquía. Un ejemplo típico, es la dimensión tiempo. En el ejemplo que se muestra en la figura 2.4 los niveles bimestre y trimestre no están relacionados entre sí, a pesar de que ambos están relacionados con mes y año. 51

54 Figura 2.3 Ejemplo de dimensión tiempo 52

55 Si existe más de una jerarquía, la relación que une datos de un nivel con datos de otro nivel superior debe ser confluente. Esto significa que todos los caminos que parten de un elemento e del nivel E, llegan al mismo elemento d del nivel D superior a E, independientemente de la jerarquía recorrida. Figura 2.4 Dimensión tiempo con jerarquías alternativas Si no se cumpliera la confluencia, entonces el primer trimestre que figura relacionado con el año 1998, podría aparecer relacionado, por ejemplo, con En éste caso, al recorrer la jerarquía por trimestre, el mes de marzo de 1998 aparecería en El nivel de los atributos facilita información suplementaria acerca de los atributos de la dimensión de un nivel en particular de la dimensión jerarquía. Los atributos de la dimensión por sí mismos no adquieren ningún sentido; por ejemplo el valor "1296" para el período tiempo. 53

56 Esos valores secretos de los atributos son usados internamente para seleccionar y ordenar rápidamente, para darle un sentido de información al usuario. 54

57 Capítulo 3 Diseño e implementación 3.1 Modelo dimensional del data warehouse La metodología propuesta por Ralph Kimball [9] se utilizó como base para el diseño del modelado dimensional del data warehouse: 1) Definición del proceso a modelar. El primer paso consiste en definir las fuentes de datos de donde se van a obtener los datos que formarán parte del data warehouse. Se cuenta con los datos sobre captura por especie o por grupo de ellas y por lugar, registrados de 1998 a 2008, en avisos de arribo de embarcaciones menores facilitados por la Comisión Nacional de Acuacultura y Pesca (conapesca). 2) Definición de la granularidad. Se desea almacenar información sobre el volumen de la captura de una pesquería, en una zona específica, con una embarcación determinada, en un tiempo dado. 3) Selección de las dimensiones. El tercer paso consiste en identificar las dimensiones que caracterizan el proceso, las cuales se derivan del paso anterior. Las dimensiones identificadas son: Ubicación. Los atributos para esta dimensión son municipio, zona del mar, tipo de lugar, área de manejo y lugar de captura. En la figura 3.1 se puede apreciar la jerarquía para la dimensión Ubicación. Esta jerarquía permite que la dimensión ubicación se pueda explorar por diversos caminos. 55

58 Figura 3.1 Jerarquía para la dimensión ubicación Especie. Esta dimensión proporciona los datos de las especies que son capturadas y reportadas en los avisos de arribo. Los atributos para esta dimensión son: familia y especie. En la figura 3.2 se puede apreciar la jerarquía para la dimensión especie. 56

59 Figura 3.2 Jerarquía para la dimensión especie Embarcación. Esta dimensión contiene atributos relacionados con los datos de las diferentes embarcaciones que participan en la captura de especies. Los atributos de la dimensión son: número de embarcaciones, tipo_titular y RNP. En la figura 3.3 se puede apreciar la jerarquía para la dimensión embarcación. Figura 3.3 Jerarquía para la dimensión especie 57

60 Tiempo. Los atributos para esta dimensión son id_tiempo, estación, año y mes. Esta dimensión proporciona información de las temporadas de capturas de especies. En la figura 3.4 se puede apreciar la jerarquía para la dimensión tiempo. Figura 3.4 Jerarquía para la dimensión tiempo 4) Definir los hechos. En el último paso se debe decidir la información a almacenar sobre el proceso, es decir, se deben seleccionar los hechos (información sobre la actividad) que se desea almacenar en cada registro de la tabla de hechos y que será el objeto del análisis. En éste caso, la tabla de hechos contendrá las llaves primarias de cada una de las dimensiones. Además de contener cuatro variables de medición, que son: Contador registra el total de elementos que se están evaluando, el peso de las especies capturadas de cada aviso de arribo se almacena en la variable 58

61 Peso, también se almacenan el valor en costo y el esfuerzo requerido para la captura en las variables Valor y Esfuerzo. Figura 3.5 Diagrama estrella del data warehouse. En la mayoría de los data warehouse se utiliza el esquema estrella para representar el modelo multidimensional de datos [5][13]. En la figura 3.5 se puede observar el esquema estrella del data warehouse. En el esquema están definidas las tablas que forman el data warehouse y los atributos de cada una de ellas. En total son cinco tablas. La tabla de hechos se denomina Aviso de Arribos. Las otras cuatro son las tablas de dimensiones y se denominan Ubicación, Especie, Embarcación y Tiempo. 59

62 3.2 Esquema de integración Después de tener definido el modelo dimensional del data warehouse, es necesario aplicar las herramientas ETL, las cuales permiten incorporar los datos en el data warehouse que cumplan con las especificaciones del modelo dimensional. El primer paso consiste en extraer la información de las fuentes. La información de los avisos de arribo se encuentra almacenada en un sistema de tipo OLTP denominado SIMAVI (Sistema automatizado para el manejo de avisos de arribo). A partir de este sistema es de donde se obtiene la información para empezar a construir el data warehouse. Al realizar la extracción de la información de las tablas del sistema se construyó una tabla temporal en donde se almacenaron los campos extraídos. El siguiente paso después de analizar la información obtenida de la etapa de extracción fue necesario realizar algunas transformaciones antes de incorporar información a cada una de las dimensiones del data warehouse. Algunas de las transformaciones que fueron necesarias son las siguientes: 1) En la tabla de hechos se requiere la medición Esfuerzo, por lo tanto es necesario crear el atributo tomando como base el siguiente cálculo: peso / (número de embarcaciones * frecuencia). 2) En la tabla de hechos se requiere la medición Contador, por lo tanto se agregó el atributo con un valor de uno para todas sus mediciones. 3) Para la dimensión tiempo se requiere el atributo estación, el cual es necesario calcular a partir del atributo mes. El último paso consiste en alimentar cada una de las dimensiones del data warehouse con los datos transformados. 60

63 Capítulo 4 Resultados 4.1 Comportamiento histórico de la pesquería de escama en bahía El modelo dimensional creado, permite la visualización de la información de varias dimensiones, apoyando de esta manera el proceso de toma de decisiones. La herramienta desarrollada proporciona acceso a los datos de los avisos de arribos de las embarcaciones de pesca ribereña en el estado de Baja California Sur. Estos datos se pueden combinar y dividir en cualquier forma posible de acuerdo a las dimensiones del modelo, y facilitar el monitoreo de la pesca ribereña. A continuación se presentan algunos de los resultados obtenidos. En la figura 4.1 se puede observar el comportamiento histórico de la pesquería de escama en las bahías de la costa oeste de Baja California Sur en la zona que comprende desde Bahía Magdalena hasta Bahía Almejas. Esta gráfica pone en evidencia que las bahías de Magdalena, Puerto Chale y Las Almejas, son las bahías con mayor volumen de captura de escama. 61

64 Figura 4.1 Comportamiento histórico de la pesquería de escama en bahía. 62

65 4.2 Comportamiento histórico de la captura en bahía por pesquería En la figura 4.2 se puede observar el comportamiento histórico de la captura de camarón, escama y tiburón en bahía. En esta gráfica se pone en evidencia que el volumen de captura de escama ocupa el primer lugar Figura 4.2 Comportamiento histórico de la captura en bahía por pesquería. 63

66 4.3 Comportamiento histórico de la captura en bahía por pesquería En la figura 4.3 se puede observar el comportamiento histórico de la pesca ribereña de camarón en los esteros de la zona de Bahía Magdalena a Bahía Almejas. En esta gráfica se muestra el comportamiento del volumen de captura por año, y se puede apreciar que los años 1998, 2001 y 2002 son los que acumularon los volúmenes de captura mayores. Figura 4.3 Comportamiento histórico de la captura de camarón en esteros. 64

67 4.4 Comportamiento histórico de la captura de camarón en esteros con total de volumen por estero En la figura 4.4 se muestra el acumulado del volumen de captura por esteros, en donde se puede apreciar que el estero La Herradura de 1998 a 2008 tiene un volumen acumulado de 155,292, el estero Las Vacas un total de 146,265 y el estero San Vicente un total de 67,413. Figura 4.4 Comportamiento histórico de la captura de camarón en esteros con total de volumen por estero. 65

68 4.5 Comportamiento por temporada de la captura de camarón, escama y tiburón En la figura 4.5 se muestra el comportamiento del volumen de captura de la pesquería de camarón, escama y tiburón. En esta gráfica se puede apreciar que el volumen de captura de escama y tiburón es mayor durante el verano, mientras que la captura de camarón es mayor durante el otoño. También se puede apreciar que de las tres pesquerías la escama es la de mayor volumen de captura. Figura 4.5 Comportamiento por temporada de la captura de camarón, escama y tiburón. 66

Data Warehousing - Marco Conceptual

Data Warehousing - Marco Conceptual Data Warehousing - Marco Conceptual Carlos Espinoza C.* Introducción Los data warehouses se presentan como herramientas de alta tecnología que permiten a los usuarios de negocios entender las relaciones

Más detalles

SISTEMAS DE INFORMACION GERENCIAL LIC.PATRICIA PALACIOS ZULETA

SISTEMAS DE INFORMACION GERENCIAL LIC.PATRICIA PALACIOS ZULETA SISTEMAS DE INFORMACION GERENCIAL LIC.PATRICIA PALACIOS ZULETA Qué es inteligencia de negocios? (BI) Business Intelligence es la habilidad para transformar los datos en información, y la información en

Más detalles

CAPÍTULO 2 DATA WAREHOUSES

CAPÍTULO 2 DATA WAREHOUSES CAPÍTULO 2 DATA WAREHOUSES Un Data Warehouse (DW) es un gran repositorio lógico de datos que permite el acceso y la manipulación flexible de grandes volúmenes de información provenientes tanto de transacciones

Más detalles

Definición. Data Warehousing: almacenamiento, transformación y distribución de datos útiles para los responsables de tomar decisiones 9/29/2006 4

Definición. Data Warehousing: almacenamiento, transformación y distribución de datos útiles para los responsables de tomar decisiones 9/29/2006 4 Definición Data Warehousing: almacenamiento, transformación y distribución de datos útiles para los responsables de tomar decisiones 9/29/2006 4 Definición (cont.) Un Data Warehouse es una colección de

Más detalles

Botón menú Objetivo de la Minería de datos.

Botón menú Objetivo de la Minería de datos. Titulo de Tutorial: Minería de Datos N2 Botón menú: Introducción. Las instituciones y empresas privadas coleccionan bastante información (ventas, clientes, cobros, pacientes, tratamientos, estudiantes,

Más detalles

BUSINESS INTELLIGENCE. www.sbi-technology.com

BUSINESS INTELLIGENCE. www.sbi-technology.com BUSINESS INTELLIGENCE www.sbi-technology.com SBI Technology SRL Maipú 1492 Piso 2 S2000CGT - Rosario Rep. Argentina Tel: (54 341) 530 0815 www.sbi-technology.com Copyright - SBI Technology SRL - Todos

Más detalles

Inteligencia de Negocios Introducción. Por Elizabeth León Guzmán, Ph.D. Profesora Ingeniería de Sistemas Grupo de Investigación MIDAS

Inteligencia de Negocios Introducción. Por Elizabeth León Guzmán, Ph.D. Profesora Ingeniería de Sistemas Grupo de Investigación MIDAS Inteligencia de Negocios Introducción Por Elizabeth León Guzmán, Ph.D. Profesora Ingeniería de Sistemas Grupo de Investigación MIDAS Agenda 1.Introducción 2.Definición 3.ETL 4.Bodega de Datos 5.Data Mart

Más detalles

Sistemas de Información para la Gestión. UNIDAD 2: RECURSOS DE TI Información y Aplicaciones

Sistemas de Información para la Gestión. UNIDAD 2: RECURSOS DE TI Información y Aplicaciones UNIDAD 2: RECURSOS DE TI Información y Aplicaciones UNIDAD 2: RECURSOS DE TI Información y Aplicaciones 1. La Información: Propiedades de la Información. Sistemas de Información. Bases de Datos. 2. Administración

Más detalles

ARQUITECTURA DE UNA BODEGA DE DATOS

ARQUITECTURA DE UNA BODEGA DE DATOS ARQUITECTURA DE UNA BODEGA DE DATOS Estructura de contenidos INTRODUCCIÓN... 3 1. ARQUITECTURA DE UNA BODEGA DE DATOS... 3 1.1 PROPIEDADES... 3 1.2 ARQUITECTURA DE UNA CAPA... 4 1.3 ARQUITECTURA DE DOS

Más detalles

APOYO PARA LA TOMA DE DECISIONES

APOYO PARA LA TOMA DE DECISIONES APOYO PARA LA TOMA DE DECISIONES Cátedra: Gestión de Datos Profesor: Santiago Pérez Año: 2006 Bibliografía: Introducción a las Bases de Datos. DATE - 1 - 1. INTRODUCCION APOYO PARA LA TOMA DE DECISIONES

Más detalles

Proyecto técnico MINERÍA DE DATOS. Febrero 2014. www.osona-respon.net info@osona-respon.net

Proyecto técnico MINERÍA DE DATOS. Febrero 2014. www.osona-respon.net info@osona-respon.net Proyecto técnico MINERÍA DE DATOS Febrero 2014 www.osona-respon.net info@osona-respon.net 0. Índice 0. ÍNDICE 1. INTRODUCCIÓN... 2 2. LOS DATOS OCULTOS... 3 2.1. Origen de la información... 3 2.2. Data

Más detalles

Informática II Ing. Industrial. Data Warehouse. Data Mining

Informática II Ing. Industrial. Data Warehouse. Data Mining Data Warehouse Data Mining Definición de un Data Warehouses (DW) Fueron creados para dar apoyo a los niveles medios y altos de una empresa en la toma de decisiones a nivel estratégico en un corto o mediano

Más detalles

Licencia GNU FDL. Detalle del cambio. Ing. Bernabeu Ricardo Dario, Ing. García Mattío Mariano Alberto. Versión incial. 05/11/2009

Licencia GNU FDL. Detalle del cambio. Ing. Bernabeu Ricardo Dario, Ing. García Mattío Mariano Alberto. Versión incial. 05/11/2009 Licencia GNU FDL Copyright 2009 Ing. Bernabeu Ricardo Dario, Ing. García Mattío Mariano Alberto. Se otorga permiso para copiar, distribuir y/o modificar este documento bajo los términos de la Licencia

Más detalles

TECNOLOGÍA SOFTWARE PARA EL DESARROLLO DE SISTEMAS DE INFORMACIÓN. Sistemas Informacionales (BI Business Intelligence) Sonia Marrero Cáceres

TECNOLOGÍA SOFTWARE PARA EL DESARROLLO DE SISTEMAS DE INFORMACIÓN. Sistemas Informacionales (BI Business Intelligence) Sonia Marrero Cáceres TECNOLOGÍA SOFTWARE PARA EL DESARROLLO DE SISTEMAS DE INFORMACIÓN Sistemas Informacionales (BI Business Intelligence) Sonia Marrero Cáceres Sistemas Informacionales Sistemas informacionales: Sistemas de

Más detalles

UNIVERSIDAD DE SANTIAGO DE CHILE INGENIERIA COMERCIAL APLICACIÓN COMPUTACIONAL I INTELIGENCIA DE NEGOCIOS

UNIVERSIDAD DE SANTIAGO DE CHILE INGENIERIA COMERCIAL APLICACIÓN COMPUTACIONAL I INTELIGENCIA DE NEGOCIOS UNIVERSIDAD DE SANTIAGO DE CHILE INGENIERIA COMERCIAL APLICACIÓN COMPUTACIONAL I INTELIGENCIA DE NEGOCIOS Integrante: Profesor: Maximiliano Heise Luis Ríos Fecha de entrega: miércoles 18 de abril de 2012

Más detalles

INTELIGENCIA DE NEGOCIOS

INTELIGENCIA DE NEGOCIOS INTELIGENCIA DE NEGOCIOS En tiempos de incertidumbre financiera, la toma de decisiones basada en información es crucial para sobrevivir en el mundo de los negocios. Empresas de todas las industrias dependen

Más detalles

LOS CINCO GRADOS DE MADUREZ DE UN PROYECTO BI

LOS CINCO GRADOS DE MADUREZ DE UN PROYECTO BI LOS CINCO GRADOS DE MADUREZ DE UN PROYECTO BI INTRODUCCIÓN Se habla en multitud de ocasiones de Business Intelligence, pero qué es realmente? Estoy implementando en mi organización procesos de Business

Más detalles

FUNDAMENTOS DE DATA WAREHOUSE

FUNDAMENTOS DE DATA WAREHOUSE FUNDAMENTOS DE DATA WAREHOUSE 1. Qué es Data Warehouse? El Data Warehouse es una tecnología para el manejo de la información construido sobre la base de optimizar el uso y análisis de la misma utilizado

Más detalles

Diseño de almacén de datos para el análisis eficiente de la información de incidentes informáticos y mantenimientos.

Diseño de almacén de datos para el análisis eficiente de la información de incidentes informáticos y mantenimientos. Diseño de almacén de datos para el análisis eficiente de la información de incidentes informáticos y mantenimientos. Ing. Corso Cynthia, Ing. Luque Claudio, Ing. Ciceri Leonardo, Sr Donnet Matías Grupo

Más detalles

TECNOLÓGICAS EMPRESAS

TECNOLÓGICAS EMPRESAS SOLUCIONES TECNOLÓGICAS INTEGRALES PARA LAS EMPRESAS Por: Ivonne Rodríguez CONTENIDO 1. Problemas actuales en las empresas 2. Bussines Intelligence 3. Capa: Data Warehouse 4. Capa: BI en el campo empresarial

Más detalles

SQL Server Business Intelligence parte 1

SQL Server Business Intelligence parte 1 SQL Server Business Intelligence parte 1 Business Intelligence es una de las tecnologías de base de datos más llamativas de los últimos años y un campo donde Microsoft ha formado su camino a través de

Más detalles

CUALIFICACIÓN SISTEMAS DE GESTIÓN DE INFORMACIÓN PROFESIONAL. Nivel 3. Versión 5 Situación RD 1201/2007 Actualización

CUALIFICACIÓN SISTEMAS DE GESTIÓN DE INFORMACIÓN PROFESIONAL. Nivel 3. Versión 5 Situación RD 1201/2007 Actualización Página 1 de 16 CUALIFICACIÓN SISTEMAS DE GESTIÓN DE INFORMACIÓN PROFESIONAL Familia Profesional Informática y Comunicaciones Nivel 3 Código IFC304_3 Versión 5 Situación RD 1201/2007 Actualización Competencia

Más detalles

RECURSOS DE TI Aplicaciones - Bibliografía FUNDAMENTOS DE LA INTELIGENCIA DE NEGOCIOS

RECURSOS DE TI Aplicaciones - Bibliografía FUNDAMENTOS DE LA INTELIGENCIA DE NEGOCIOS Sistemas de Información para la Gestión UNIDAD 3: RECURSOS DE TECNOLOGÍA DE INFORMACIÓN Aplicaciones UNIDAD 2: RECURSOS DE TI Aplicaciones 1. Administración de bases de datos e información: Sistemas de

Más detalles

MINERÍA DE DATOS. Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE. Octubre - 2003

MINERÍA DE DATOS. Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE. Octubre - 2003 MINERÍA DE DATOS Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE Octubre - 2003 CONTENIDO Qué es Data Warehousing Data Warehouse Objetivos del Data Warehouse

Más detalles

DATA WAREHOUSE DATA WAREHOUSE

DATA WAREHOUSE DATA WAREHOUSE DATA WAREHOUSE DATA WAREHOUSE Autor: Roberto Abajo Alonso Asignatura: Sistemas Inteligentes, 5º Curso Profesor: José Carlos González Dep. Ing. Sistemas Telemáticos, E.T.S.I. Telecomunicación Universidad

Más detalles

Fundamentos de la Inteligencia de Negocios

Fundamentos de la Inteligencia de Negocios Universidad Nacional de Salta Facultad de Ciencias Económicas, Jurídicas y Sociales Sistemas de Información para la Gestión Fundamentos de la Inteligencia de Negocios Administración de Bases de Datos e

Más detalles

Datawarehouse. Ing. Adan Jaimes Jaimes. Datawarehouse

Datawarehouse. Ing. Adan Jaimes Jaimes. Datawarehouse 1 Ing. Adan Jaimes Jaimes 2 Conceptos : Repositorio completo de datos, donde se almacenan datos estratégicos, tácticos y operativos, al objeto de obtener información estratégica y táctica Data-Marts: Repositorio

Más detalles

Fundamentos de la Inteligencia de Negocios

Fundamentos de la Inteligencia de Negocios Sistemas de Información para la Gestión UNIDAD 2: Infraestructura de Tecnología de la Información Unidad 2 Infraestructura de Tecnología de la Información Estructura de TI y tecnologías emergentes. Estructura

Más detalles

Sistema de análisis de información. Resumen de metodología técnica

Sistema de análisis de información. Resumen de metodología técnica Sistema de análisis de información Resumen de metodología técnica Tabla de Contenidos 1Arquitectura general de una solución de BI y DW...4 2Orígenes y extracción de datos...5 2.1Procesos de extracción...5

Más detalles

LA GESTIÓN DEL CONOCIMIENTO

LA GESTIÓN DEL CONOCIMIENTO Plan de Formación 2006 ESTRATEGIAS Y HABILIDADES DE GESTIÓN DIRECTIVA MÓDULO 9: 9 LA ADMINISTRACIÓN ELECTRÓNICA EN LA SOCIEDAD DE LA INFORMACIÓN LA GESTIÓN DEL CONOCIMIENTO José Ramón Pereda Negrete Jefe

Más detalles

DESARROLLO E IMPLANTANCIÓN DE UN SISTEMA ACADEMICO PARA EL ICM

DESARROLLO E IMPLANTANCIÓN DE UN SISTEMA ACADEMICO PARA EL ICM DESARROLLO E IMPLANTANCIÓN DE UN SISTEMA ACADEMICO PARA EL ICM Sergio Bauz Olvera 1, Washington Jama 2 1 Ingeniero en Estadística e Informática 2003 2 Director de Tesis de Grado, Ing. Washington Jama.

Más detalles

Carlos Daniel Quattrocchi

Carlos Daniel Quattrocchi PRESENTA Lic. Héctor Iglesias Licenciado en Informática. Profesional independiente, ha desempeñado la actividad en informática desarrollando e implementando sistemas, capacitando y asesorando a numerosas

Más detalles

Cátedra: BI Business Intelligence. Asignatura BI Business Intelligence Ciclo Lectivo 2012 Vigencia del Ciclo lectivo 2012.

Cátedra: BI Business Intelligence. Asignatura BI Business Intelligence Ciclo Lectivo 2012 Vigencia del Ciclo lectivo 2012. Asignatura BI Business Intelligence Ciclo Lectivo 2012 Vigencia del Ciclo lectivo 2012 programa Plan 2008 Área Complementaria Carga horaria semanal Anual/ cuatrimestral Coordinador de Cátedra Objetivos

Más detalles

Business Intelligence.

Business Intelligence. Business Intelligence. Qué es inteligencia de negocios? Es el proceso de analizar los bienes o datos acumulados en la empresa y extraer una cierta inteligencia o conocimiento de ellos. Dentro de la categoría

Más detalles

Sistemas de Información 12/13 La organización de datos e información

Sistemas de Información 12/13 La organización de datos e información 12/13 La organización de datos e información Departamento Informática e Ingeniería de Sistemas Universidad de Zaragoza (raqueltl@unizar.es) " Guión Introducción: Data Warehouses Características: entornos

Más detalles

Fecha de elaboración: Julio de 2010 Fecha de última actualización:

Fecha de elaboración: Julio de 2010 Fecha de última actualización: Programa Licenciatura en Ciencias Educativo: Computacionales PROGRAMA DE ESTUDIO Área de Sustantiva profesional Formación: Horas teóricas: 2 Horas prácticas: 3 Total de Horas: 5 Total de Bases de Datos

Más detalles

REPOSITORIO COR O P R OR O A R T A I T VO V

REPOSITORIO COR O P R OR O A R T A I T VO V REPOSITORIO CORPORATIVO Repositorio Corporativo Que es? Antecedentes? Por que lo necesito? Multiplicidad de sistemas Retraso en obtención de reportes Info 3 Info 2 Info 1 Redundancia Inconsistencia de

Más detalles

BI BUSINESS INTELLIGENCE

BI BUSINESS INTELLIGENCE ESCUELA SUPERIOR POLITECNICA DEL LITORAL MAESTRÍA EN SISTEMAS DE INFORMACION GERENCIAL 7 ma. PROMOCIÓN BI BUSINESS INTELLIGENCE Grupo No. 1 Geannina Aguirre Henry Andrade Diego Maldonado Laura Ureta MATERIA:

Más detalles

Fundamentos de Data Warehouse

Fundamentos de Data Warehouse Mendez, A., Mártire, A., Britos, P. Y Garcia-Martínez, R. Centro de Actualización Permanente en Ingeniería del Software Escuela de Postgrado Instituto Tecnológico de Buenos Aires Av. Eduardo Madero 399

Más detalles

CONSTRUCCION DE INDICADORES DE GESTION Y HERRAMIENTAS OLAP PARA PEQUEÑAS Y MEDIANAS EMPRESAS

CONSTRUCCION DE INDICADORES DE GESTION Y HERRAMIENTAS OLAP PARA PEQUEÑAS Y MEDIANAS EMPRESAS CONSTRUCCION DE INDICADORES DE GESTION Y HERRAMIENTAS OLAP PARA PEQUEÑAS Y MEDIANAS EMPRESAS 1. RESEÑA HISTORICA Las exigencias competitivas del mercado hacen que las organizaciones busquen mecanismos

Más detalles

Tecnologías de la Información en la Gestión Empresarial

Tecnologías de la Información en la Gestión Empresarial Tecnologías de la Información en la Gestión Empresarial 1 Sesión No.8 Nombre: Procesos de Negocio y Gestión en Business Intelligence Objetivo: Al término de la sesión, el alumno ilustrará un proceso de

Más detalles

Business Intelligence

Business Intelligence Business Intelligence Curso 2012-2013 Departamento de Lenguajes y Sistemas Informáticos II http://www.kybele.es ISI/SI - 1 Introducción Nuestra misión: Hacer inteligente el negocio Buenos días. Soy Negocio.

Más detalles

Cómo ganar con una solución intuitiva de Business Intelligence para las medianas empresas

Cómo ganar con una solución intuitiva de Business Intelligence para las medianas empresas Resumen de producto SAP Soluciones SAP para pequeñas y medianas empresas SAP BusinessObjects Business Intelligence, Edge Edition Objetivos Cómo ganar con una solución intuitiva de Business Intelligence

Más detalles

Business Information Warehouse Manual SAP BW Business Information Warehouse

Business Information Warehouse Manual SAP BW Business Information Warehouse Manual SAP BW Business Information Warehouse Manual SAP BW / BI Business Information Warehouse Página 1 Confidencialidad Este documento es propiedad de E-SAP (CVOSOFT) por lo tanto, no podrá ser publicado

Más detalles

Sistemas de Data Warehousing

Sistemas de Data Warehousing Federación Médica del Interior (FEMI) Sociedad Uruguaya de Informática en la Salud (SUIS) Información en Salud Edición 2009 Sistemas de Data Warehousing Dr. Ing. Adriana Marotta (In.Co - F.Ing - UDELAR)

Más detalles

SISTEMA DE INFORMACION DE GESTION DE TARJETAS DE CREDITO USANDO DATA MART E INTELIGENCIA DE NEGOCIOS PARA EL AREA COMERCIAL DEL BANCO RIPLEY PERU

SISTEMA DE INFORMACION DE GESTION DE TARJETAS DE CREDITO USANDO DATA MART E INTELIGENCIA DE NEGOCIOS PARA EL AREA COMERCIAL DEL BANCO RIPLEY PERU SISTEMA DE INFORMACION DE GESTION DE TARJETAS DE CREDITO USANDO DATA MART E INTELIGENCIA DE NEGOCIOS PARA EL AREA COMERCIAL DEL BANCO RIPLEY PERU AGENDA INTRODUCCION PLANTEAMIENTO METODOLOGICO ANTECEDENTES

Más detalles

SISTEMAS DE GESTIÓN DE BASE DE DATOS SGBD / DBMS

SISTEMAS DE GESTIÓN DE BASE DE DATOS SGBD / DBMS Universidad de Carabobo Facultad Experimental de Ciencias y Tecnología Departamento de Computación Unidad Académica Base de Datos SISTEMAS DE GESTIÓN DE BASE DE DATOS SGBD / DBMS Integrantes: Fidel Gil

Más detalles

El presente artículo se centra en el conocimiento

El presente artículo se centra en el conocimiento Herramientas para el Diseño de Sistemas de Gestión del Conocimiento Basadas en Inteligencia Empresarial Lilian Judith Sandoval.¹ Salvador Peña.² Resumen El presente artículo se centra en el conocimiento

Más detalles

Microsoft Dynamics NAV

Microsoft Dynamics NAV Microsoft Dynamics NAV Maximizar el valor a través de conocimiento de negocio Business Intelligence White Paper Noviembre 2011 La información contenida en este documento representa el punto de vista actual

Más detalles

VISIÓN GENERAL HERRAMIENTAS COMERCIALES

VISIÓN GENERAL HERRAMIENTAS COMERCIALES VISIÓN GENERAL El servidor de MS SQL se ha convertido en un estándar en muchas partes de la América corporativa. Puede manejar volúmenes de datos grandes y se integra bien con otros productos de Microsoft.

Más detalles

BASES DE DATOS. 1.1 Funciones de un DBMS

BASES DE DATOS. 1.1 Funciones de un DBMS BASES DE DATOS Un DBMS, son programas denominados Sistemas Gestores de Base de Datos, abreviado SGBD, en inglés Data Base Management System (DBMS) que permiten almacenar y posteriormente acceder a los

Más detalles

Business Intelligence

Business Intelligence Business Intelligence Definición Business Intelligence es una aproximación estratégica para identificar, vigilar, comunicar y transformar, sistemáticamente, signos e indicadores en información activa en

Más detalles

El modelo ebusiness (2) SIE II. Curso 2004/05

El modelo ebusiness (2) SIE II. Curso 2004/05 El modelo ebusiness (2) SIE II. Curso 2004/05 Elemento central en una estrategia ebusiness: capa de aplicaciones Procesos de Negocio (producción, logística, dirección, ) Aplicaciones de Negocio (SCM, ERP,

Más detalles

Introducción a Bases de Datos

Introducción a Bases de Datos de a M. -Tastets Universidad de Concepción,Chile www.inf.udec.cl\ andrea andrea@udec.cl II Semestre - 2007 y del s: Sistemas de y del s: de y del s: Objetivos de la Unidad Dar a conocer las características,

Más detalles

UN PASEO POR BUSISNESS INTELLIGENCE

UN PASEO POR BUSISNESS INTELLIGENCE UN PASEO POR BUSISNESS INTELLIGENCE Ponentes: Agreda, Rafael Chinea, Linabel Agenda Sistemas de Información Transaccionales Qué es Business Intelligence? Usos y funcionalidades Business Intelligence Ejemplos

Más detalles

Programa Internacional Business Intelligence

Programa Internacional Business Intelligence Fecha de inicio: 18 de junio de 2012 Programa Internacional Business Intelligence En un ambiente globalizado y de alta competitividad entre las empresas, la adecuada administración del capital intelectual

Más detalles

asired EIS Descripción de producto. Integración de Sistemas Explotación de Datos y Business Intelligence para la Pequeña y Mediana Empresa.

asired EIS Descripción de producto. Integración de Sistemas Explotación de Datos y Business Intelligence para la Pequeña y Mediana Empresa. asired EIS Integración de Sistemas Explotación de Datos y Business Intelligence. Descripción de producto. 2004 Así-Red Servicios Telemáticos, S.L.L. C/ Progreso, 36, 3º B 36202 Vigo Telf. 986 44 34 91

Más detalles

Estructura de Bases de datos. Leonardo Víquez Acuña

Estructura de Bases de datos. Leonardo Víquez Acuña Estructura de Bases de datos Leonardo Víquez Acuña Lenguajes de Bases de Datos Un sistema de bases de datos proporciona Un lenguaje de definición de datos para especificar el esquema de la base de datos

Más detalles

INGENIERÍA EN SISTEMAS COMPUTACIONALES

INGENIERÍA EN SISTEMAS COMPUTACIONALES INGENIERÍA EN SISTEMAS COMPUTACIONALES UNIDAD 1 Catedrático: JOSÉ RAMÓN VALDEZ GUTIÉRREZ Alumnos: AVILA VALLES JAIRO EDUARDO 08040265 Victoria de Durango, Dgo.Mex Fecha: 14/09/2012 Tabla de contenido INTRODUCCIÓN

Más detalles

Resumen General del Manual de Organización y Funciones

Resumen General del Manual de Organización y Funciones Gerencia de Tecnologías de Información Resumen General del Manual de Organización y Funciones (El Manual de Organización y Funciones fue aprobado por Resolución Administrativa SBS N 354-2011, del 17 de

Más detalles

ELEMENTO I INTRODUCCION A LOS SISTEMAS DE BASES DE DATOS

ELEMENTO I INTRODUCCION A LOS SISTEMAS DE BASES DE DATOS Base de Datos ELEMENTO I INTRODUCCION A LOS SISTEMAS DE BASES DE DATOS Una base de datos es un conjunto de elementos de datos que se describe a sí mismo, con relaciones entre esos elementos, que presenta

Más detalles

Capacitación SAP BW Plataforma Tecnológica Única

Capacitación SAP BW Plataforma Tecnológica Única Capacitación SAP BW Plataforma Tecnológica Única Noviembre, 2011 Agenda Presentación del Instructor e Integración Grupal Objetivos del Taller Qué es un Datawarehouse? Qué es SAP BW? Estructura / Capas

Más detalles

Sistemas de Información para la Gestión. Unidad 3 Aplicaciones de Sistemas

Sistemas de Información para la Gestión. Unidad 3 Aplicaciones de Sistemas para la Gestión Unidad 3 Aplicaciones de Sistemas U.N.Sa. Facultad de Cs.Económicas SIG 2010 UNIDAD 3: APLICACIONES DE SISTEMAS Aplicaciones empresariales: Sistemas empresariales. Sistemas de administración

Más detalles

DATAMART PASO A PASO WWW.RUEDATECNOLOGICA.COM

DATAMART PASO A PASO WWW.RUEDATECNOLOGICA.COM DATAMART PASO A PASO WWW.RUEDATECNOLOGICA.COM Historial de revisiones Versión Fecha Autor: Descripción del cambio 1.0 31/08/2007 Rayner Huamantumba. Manual para diseño y desarrollo de Datamart INDICE 1-

Más detalles

Arquitectura para análisis de información. Zombi es una arquitectura que proporciona de manera integrada los componentes

Arquitectura para análisis de información. Zombi es una arquitectura que proporciona de manera integrada los componentes Capítulo 4 Arquitectura para análisis de información propuesta 4.1 Arquitectura Zombi es una arquitectura que proporciona de manera integrada los componentes necesarios para el análisis de información

Más detalles

MOLAP REALIZADO POR: JOSE E. TABOADA RENNA

MOLAP REALIZADO POR: JOSE E. TABOADA RENNA MOLAP REALIZADO POR: JOSE E. TABOADA RENNA BASE DE DATOS Conjunto de datos estructurados, fiables y homogéneos organizados independientemente en máquina, m accesibles en tiempo real, compatible por usuarios

Más detalles

Unidad 5. Conceptos y Estructuras de Archivos

Unidad 5. Conceptos y Estructuras de Archivos Unidad 5 Conceptos y Estructuras de Archivos En todos los tiempos y más aún en la era en que vivimos, el hombre tiene cada vez mas necesidad de consultar una mayor cantidad de información para poder desarrollar

Más detalles

Control Informático de Gestión. Tema 5: Sistemas de Apoyo a la Toma de Decisiones

Control Informático de Gestión. Tema 5: Sistemas de Apoyo a la Toma de Decisiones Control Informático de Gestión Tema 5: Sistemas de Apoyo a la Toma de Decisiones Índice Revisión de los sistemas de información en la empresa La información y la toma de decisiones Sistemas transaccionales

Más detalles

La toma de decisiones está presente dentro de la vida de la mayoría de las personas. Los

La toma de decisiones está presente dentro de la vida de la mayoría de las personas. Los ANEXO II. Sistema de Soporte a las Decisiones-SSD La toma de decisiones está presente dentro de la vida de la mayoría de las personas. Los gerentes día a día deben tomar decisiones también, la diferencia

Más detalles

MÁRKETING & VENTAS DOSSIER

MÁRKETING & VENTAS DOSSIER MÁRKETING & VENTAS Conozca las ventajas que los proyectos de business intelligence pueden aportar a la toma de decisiones LA INDUSTRIALI- ZACIÓN DE LA INFORMACIÓN DIRECTIVA: BUSINESS INTELLIGENCE Josep

Más detalles

La Inteligencia de Negocios es ya una realidad para las empresas medianas

La Inteligencia de Negocios es ya una realidad para las empresas medianas Reuniones/Entrevistas La Inteligencia de Negocios es ya una realidad para las empresas medianas La Inteligencia de Negocios es el siguiente paso que las empresas deben dar para mejorar su toma de decisiones

Más detalles

Sistemas de Ayuda a la Decision Qué es un Sistema de Ayuda a la Decisión?

Sistemas de Ayuda a la Decision Qué es un Sistema de Ayuda a la Decisión? Sistemas de Ayuda a la Decision Qué es un Sistema de Ayuda a la Decisión? Luis Daniel Hernández Molinero Departamento de Ingeniería de la Información y las Comunicaciones Facultad de Informática Universidad

Más detalles

BUSINESS INTELLIGENCE

BUSINESS INTELLIGENCE BUSINESS INTELLIGENCE PRESENTACIÓN Ramón Díaz Hernández Gerente (1.990) Nuestro Perfil Inversión permanente en formación y nuevas tecnologías. Experiencia en plataforma tecnológica IBM (Sistema Operativo

Más detalles

Base de datos II Facultad de Ingeniería. Escuela de computación.

Base de datos II Facultad de Ingeniería. Escuela de computación. 2 Base de datos II Facultad de Ingeniería. Escuela de computación. Base de datos II. Guía 9 3 Introducción Este manual ha sido elaborado para orientar al estudiante de Bases de datos II en el desarrollo

Más detalles

Evaluación de un sistema de información para mejorar la red de ventas Pág. 1 SUMARIO 1 A. TECNOLOGÍAS DE LA INFORMACIÓN Y COMUNICACIÓN 3

Evaluación de un sistema de información para mejorar la red de ventas Pág. 1 SUMARIO 1 A. TECNOLOGÍAS DE LA INFORMACIÓN Y COMUNICACIÓN 3 Evaluación de un sistema de información para mejorar la red de ventas Pág. 1 Sumario SUMARIO 1 A. TECNOLOGÍAS DE LA INFORMACIÓN Y COMUNICACIÓN 3 A.1. Intranet...3 A.2. Extranet...4 A.3. Internet...4 A.4.

Más detalles

BASES DE DATOS MIS 308

BASES DE DATOS MIS 308 2. MODELOS DE DATOS Introducción 2.1 Entidad relación 2.2 Jerárquico 2.3 De red 2.4 Relacional Introducción Hoy en día las empresas manejan una gran cantidad de datos. Cualquier empresa que se precie debe

Más detalles

Estos documentos estarán dirigidos a todas las personas que pertenezcan a equipos de implementación de Oracle BI, incluyendo a:

Estos documentos estarán dirigidos a todas las personas que pertenezcan a equipos de implementación de Oracle BI, incluyendo a: Oracle Business Intelligence Enterprise Edition 11g. A lo largo de los siguientes documentos trataré de brindar a los interesados un nivel de habilidades básicas requeridas para implementar efectivamente

Más detalles

BUSINESS INTELLIGENCE

BUSINESS INTELLIGENCE BUSINESS INTELLIGENCE Técnicas, herramientas y aplicaciones María Pérez Marqués Business Intelligence. Técnicas, herramientas y aplicaciones María Pérez Marqués ISBN: 978-84-943055-2-8 EAN: 9788494305528

Más detalles

Comunicación para Tecnimap 2010. Contenido: 1. Itourbask como elemento de un Sistema de Gestión de Destino Turístico 2. El Data Mart de Itourbask

Comunicación para Tecnimap 2010. Contenido: 1. Itourbask como elemento de un Sistema de Gestión de Destino Turístico 2. El Data Mart de Itourbask Comunicación para Tecnimap 2010. EL BI APLICADO AL ANÁLISIS DE LAS VISITAS TURÍSTICAS Contenido: 1. Itourbask como elemento de un Sistema de Gestión de Destino Turístico 2. El Data Mart de Itourbask Autor:

Más detalles

UNIVERSIDAD ALBERT EINSTEIN FACULTAD DE INGENIERIA

UNIVERSIDAD ALBERT EINSTEIN FACULTAD DE INGENIERIA UNIVERSIDAD ALBERT EINSTEIN FACULTAD DE INGENIERIA Estudio de las herramientas TOAD y DBArtisan para la administración e integración de bases de datos relacionales. PREVIA OPCION AL TÍTULO DE: INGENIERO

Más detalles

IBM Cognos Enterprise: Inteligencia de negocio y gestión del rendimiento potente y escalable

IBM Cognos Enterprise: Inteligencia de negocio y gestión del rendimiento potente y escalable : Inteligencia de negocio y gestión del rendimiento potente y escalable Puntos destacados Dota a los usuarios de su organización de las capacidades de business intelligence y de gestión del rendimiento

Más detalles

LINEAMIENTOS GENERALES PARA LA IMPLEMENTACIÓN DE PROCESOS ELECTRÓNICOS

LINEAMIENTOS GENERALES PARA LA IMPLEMENTACIÓN DE PROCESOS ELECTRÓNICOS LINEAMIENTOS GENERALES PARA LA IMPLEMENTACIÓN DE PROCESOS LINEAMIENTOS GENERALES PARA LA IMPLEMENTACIÓN DE PROCESOS Ministerio de Tecnologías de la Información y las Comunicaciones Programa de Gobierno

Más detalles

Business Intelligence

Business Intelligence Business Intelligence Metodología > 1 Implantación tecnológica de un balanced scorecard Precio 1.000 Este curso introduce al alumno en la metodología de BSC y su implantación tecnológica para el seguimiento

Más detalles

UNIVERSIDAD VERACRUZANA M O N O G R A F Í A. Licenciado en Sistemas Computacionales Administrativos. Ana Laura Alba Mendez

UNIVERSIDAD VERACRUZANA M O N O G R A F Í A. Licenciado en Sistemas Computacionales Administrativos. Ana Laura Alba Mendez UNIVERSIDAD VERACRUZANA Facultad de Contaduría y Administración Arquitectura, Diseño, Construcción, Mantenimiento y Consulta de un Almacén de Datos M O N O G R A F Í A Para obtener el Título de: Licenciado

Más detalles

Desafíos de gestionar proyectos de analítica de negocios

Desafíos de gestionar proyectos de analítica de negocios Desafíos de gestionar proyectos de analítica de negocios Desafíos de gestionar proyectos de analítica de negocios Tipología de proyectos BA Complejidad de proyectos BA Proyectos BA versus tradicionales

Más detalles

Alicia Iriberri Dirección de Tecnologías de Información. I.- Definición del foco estratégico

Alicia Iriberri Dirección de Tecnologías de Información. I.- Definición del foco estratégico Alicia Iriberri Dirección de Tecnologías de Información I.- Definición del foco estratégico II.- Establecimiento de mediciones a través del Balanced Scorecard (Tablero de Comando) III.- Despliegue del

Más detalles

ANEXO A - Plan de Proyecto. 1. - EDT de la solución EDT GENERAL DEL PROYECTO1

ANEXO A - Plan de Proyecto. 1. - EDT de la solución EDT GENERAL DEL PROYECTO1 ANEXO A - Plan de Proyecto 1. - EDT de la solución EDT GENERAL DEL PROYECTO1 2.- Diagrama de Gantt de la Solución DIAGRAMA DE GANTT- FASE INICIAL DOCUMENTACION Y ANALISIS2 DIAGRAMA DE GANTT- FASE FINAL

Más detalles

IMPLEMENTACIÓN DE UN DATA MART PARA UN SERVICIO DE DOSIMETRÍA EXTERNA.

IMPLEMENTACIÓN DE UN DATA MART PARA UN SERVICIO DE DOSIMETRÍA EXTERNA. X Congreso Regional Latinoamericano IRPA de Protección y Seguridad Radiológica Radioprotección: Nuevos Desafíos para un Mundo en Evolución Buenos Aires, 12 al 17 de abril, 2015 SOCIEDAD ARGENTINA DE RADIOPROTECCIÓN

Más detalles

PROYECTO DE TESIS DIEGO GALLARDO. ESPEL - Diego Gallardo

PROYECTO DE TESIS DIEGO GALLARDO. ESPEL - Diego Gallardo PROYECTO DE TESIS DIEGO GALLARDO TEMA DISEÑO E IMPLEMENTACIÓN DE UN SISTEMA DE ADMINISTRACIÓN DE TIEMPOS EN PROYECTOS DE DESARROLLO DE SOFTWARE Y CONTROL DE DESEMPEÑO MEDIANTE CUBOS DE INFORMACIÓN PARA

Más detalles

El valor de una infraestructura optimizada

El valor de una infraestructura optimizada El valor de una infraestructura optimizada El Estudio del Estado del CIO 2006 (CIO Research, 2006) muestra que los CIO están buscando, cada vez más, introducir, de forma proactiva, soluciones de tecnología

Más detalles

Nociones de Data Warehousing

Nociones de Data Warehousing Nociones de Data Warehousing 1 Presentación Prefacio 1. ASPECTOS TEORICOS o 1.1 Introducción al Concepto Data Warehousing o 1.2 Sistemas de Información o 1.2.1 Sistemas Técnico-operacionales o 1.2.2 Sistemas

Más detalles

Creación de un almacén de datos para apoyar los procesos operacionales ejecutados por el área de Crédito de una empresa automotriz.

Creación de un almacén de datos para apoyar los procesos operacionales ejecutados por el área de Crédito de una empresa automotriz. UNIVERSIDAD CENTRAL DE VENEZUELA FACULTAD DE CIENCIAS ESCUELA DE COMPUTACIÓN CENTRO DE INFORMACIÓN DE SISTEMAS DE INFORMACIÓN Creación de un almacén de datos para apoyar los procesos operacionales ejecutados

Más detalles

POSIBLE APLICACIÓN DE LA MINERÍA DE TEXTOS A LOS TRABAJOS DE LA COMISIÓN MINISTERIAL DE INFORMÁTICA

POSIBLE APLICACIÓN DE LA MINERÍA DE TEXTOS A LOS TRABAJOS DE LA COMISIÓN MINISTERIAL DE INFORMÁTICA POSIBLE APLICACIÓN DE LA MINERÍA DE TEXTOS A LOS TRABAJOS DE LA COMISIÓN MINISTERIAL DE INFORMÁTICA M.ª del Pilar Cantero Blanco Jefa de Servicio de Sistemas Informáticos. Subdirección General de Planificación

Más detalles

INTRODUCCIÓN. Desde un inicio, las bases de datos se convirtieron en una herramienta fundamental de

INTRODUCCIÓN. Desde un inicio, las bases de datos se convirtieron en una herramienta fundamental de INTRODUCCIÓN Desde un inicio, las bases de datos se convirtieron en una herramienta fundamental de control y manejo de las operaciones comerciales. Fue así como en unos pocos años en grandes empresas y

Más detalles

13/11/2007 INTRODUCCIÓN AL TIVOLI 1

13/11/2007 INTRODUCCIÓN AL TIVOLI 1 INTRODUCCIÓN AL TIVOLI GERZEL, Stella Maris 2007 13/11/2007 INTRODUCCIÓN AL TIVOLI 1 Temario Conceptos de Tivoli. Descripción del Tivoli Storage Manager. Servicios Esenciales. Introducción n al Tivoli

Más detalles

LA UBICACIÓN DEL CONOCIMIENTO EN LAS ORGANIZACIONES

LA UBICACIÓN DEL CONOCIMIENTO EN LAS ORGANIZACIONES Cuadernos de Gestión del Conocimiento Empresarial Número 25. Septiembre de 2010 LA UBICACIÓN DEL CONOCIMIENTO EN LAS ORGANIZACIONES Por Fernando Piera Gómez, vicepresidente 1º de ATI Al final de la primera

Más detalles

PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR FACULTAD DE INGENIERÍA ESCUELA DE SISTEMAS DISERTACIÓN DE TESIS PREVIO A LA OBTENCIÓN DEL TÍTULO DE

PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR FACULTAD DE INGENIERÍA ESCUELA DE SISTEMAS DISERTACIÓN DE TESIS PREVIO A LA OBTENCIÓN DEL TÍTULO DE PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR FACULTAD DE INGENIERÍA ESCUELA DE SISTEMAS DISERTACIÓN DE TESIS PREVIO A LA OBTENCIÓN DEL TÍTULO DE INGENIERO EN SISTEMAS GUÍA PARA IMPLEMENTAR UNA SOLUCION

Más detalles

DESARROLLO DE APLICACIONES CON TECNOLOGÍAS WEB PROFESIONAL

DESARROLLO DE APLICACIONES CON TECNOLOGÍAS WEB PROFESIONAL Página 1 de 21 CUALIFICACIÓN DESARROLLO DE APLICACIONES CON TECNOLOGÍAS WEB PROFESIONAL Familia Profesional Informática y Comunicaciones Nivel 3 Código IFC154_3 Versión 5 Situación RD 1087/2005 Actualización

Más detalles