UNIVERSIDAD AUTÓNOMA DE BAJA CALIFORNIA SUR ÁREA DE CONOCIMIENTO DE CIENCIAS DEL MAR DEPARTAMENTO ACADÉMICO DE SISTEMASCOMPUTACIONALES TESIS

Tamaño: px
Comenzar la demostración a partir de la página:

Download "UNIVERSIDAD AUTÓNOMA DE BAJA CALIFORNIA SUR ÁREA DE CONOCIMIENTO DE CIENCIAS DEL MAR DEPARTAMENTO ACADÉMICO DE SISTEMASCOMPUTACIONALES TESIS"

Transcripción

1 UNIVERSIDAD AUTÓNOMA DE BAJA CALIFORNIA SUR ÁREA DE CONOCIMIENTO DE CIENCIAS DEL MAR DEPARTAMENTO ACADÉMICO DE SISTEMASCOMPUTACIONALES TESIS CONSTRUCCIÓN DE UN DATAWAREHOUSE PARA DATOS DE PESCA RIBEREÑA QUE COMO REQUISITO PARA OBTENER EL TITULO DE: LICENCIADO EN COMPUTACIÓN PRESENTA: ISRAEL DURAN ENCINAS DIRECTOR: M. S.C. MÓNICA ADRIANA CARREÑO LEÓN LA PAZ, BAJA CALIFORNIA SUR, ENERO DE 2014

2 AGRADECIMIENTOS Gracias a Dios por darme la oportunidad de concluir este trabajo tan importante para mis estudios y por haber puesto en mi camino a personas maravillosas que hicieron posible este logro. Quiero expresar también mi más sincero agradecimiento a todos los maestros del departamento académico de sistemas computacionales, por haber compartido de sus conocimientos, su tiempo, su dedicación y su amistad. En especial a mis queridos Maestros: M.S.C. Jesús Andrés Sandoval Bringas y M.S.C. Mónica Adriana Carreño León, gracias por creer en mí y por ayudarme a llegar a esta etapa de mis estudios, considero un honor aprender de ustedes. De la misma manera quiero expresar mis agradecimientos a mis padres Roberto Durán Romero y Elvira Encinas Piña, gracias por su apoyo incondicional y por haber inculcado valores y principios que me han ayudado a salir adelante en cualquier momento. Gracias por la mejor herencia que me han dejado el conocimiento. Saldré adelante en cualquier cosa que emprenda y cada logro obtenido me recordara que ustedes son parte de él. Por último quisiera agradecer a mis compañeros por brindarme su amistad y compañía durante tantos años, compartimos momentos buenos y malos, reímos, lloramos, celebramos, peleamos lo único que importa es que nunca los olvidare, por que guardo todos los buenos recuerdos de ustedes.

3 Capítulo Introducción Antecedentes Descripción del problema Propuesta de solución Objetivo general Objetivos específicos Capítulo Marco teórico Toma de decisiones Sistemas para apoyar la toma de decisiones Categorías y clase de decisiones DSS centrados en los datos y centrados en los modelos DSS formales y ad-hoc DSS Dirigido y No Dirigido Modelo del proceso de toma de decisiones Alcance del problema del proceso de toma de decisiones Tecnologías de data warehouse Data warehouse Características de un data warehouse Orientado al tema Variante en el tiempo No volátil Integrados Arquitectura de un data warehouse Data warehouse empresariales Data warehouse virtuales Data marts Data marts Componentes de un data warehouse Componente de diseño / Adquisición de datos Componente de acceso a la información Componente de acceso a los datos Componente de Directorio de Datos (Metadata): Componente de Gestión de Procesos:

4 6. Componente de Mensaje de la Aplicación Componente data warehouse (Físico) Componente de Organización de Datos Operaciones de un data warehouse a) Sistemas Operacionales b) Extracción, Transformación y Carga de los Datos: c) Metadata: d) Acceso de usuario final e) Plataforma del Data Warehouse f) Datos Externos Diferencias entre OLTP y data warehouse Arquitectura OLAP Sistema MOLAP Sistema ROLAP Operaciones OLAP Capacidades de la técnica OLAP Técnicas de modelados de datos Modelo Entidad / Relación Modelo Dimensional Capítulo Diseño e implementación Modelo dimensional del data warehouse Esquema de integración Capítulo Resultados Comportamiento histórico de la pesquería de escama en bahía Comportamiento histórico de la captura en bahía por pesquería Comportamiento histórico de la captura en bahía por pesquería Comportamiento histórico de la captura de camarón en esteros con total de volumen por estero Comportamiento por temporada de la captura de camarón, escama y tiburón 66 Capítulo Conclusiones Referencias

5 Capítulo 1 Introducción 1.1 Antecedentes Tener la información justa en el momento oportuno ha significado para las organizaciones vanguardistas un elemento primordial, ya que, su aplicación, uso, interpretación y una administración adecuada conlleva a un alto nivel de conocimiento. La información puede ser cualquier cosa que sea de importancia para el individuo o la organización; en otras palabras, todo lo que sea necesario para auxiliarle en el proceso general de su administración [14]. Actualmente las organizaciones de cualquier índole, le han dado gran importancia a la información que poseen, porque se han dado cuenta de lo importante y valioso que representa la información, para la forma de funcionar de la propia organización, ya que esto permite estar evaluando sus diferentes mecanismos de operación y sus procesos de desarrollo en la administración organizacional. De igual manera el conocimiento en las organizaciones, emerge, de una combinación de dos variables muy importantes: por un lado, la capacidad del recurso humano, y por el otro, la tecnología en la cual se apoyan. En este mismo contexto, el buen uso de la información, pudiera sustentar una acertada toma de decisión, y desde luego las repercusiones posteriores a la toma de ella, generaría una ventaja competitiva. En los últimos años ha existido un enorme crecimiento en la capacidad de generación y almacenamiento de información, debido a la creciente automatización de procesos en general, a través del uso de sistemas de información operacionales o transaccionales OLTP (On-Line Transaction Proccesing), y a los avances de tecnología en las capacidades de 3

6 almacenamiento de información. Los sistemas OLTP son los que resuelven las necesidades de funcionamiento de una empresa, y los aspectos más importantes que se toman en cuenta son las actualizaciones y el tiempo de respuesta [2]. Si bien los sistemas de información existen desde la década de los setentas, su incursión en las organizaciones y su utilización como herramienta de competitividad, toma un auge fuerte a inicio de los 90 s [4]. En la actualidad se hace necesario que las organizaciones establezcan mecanismos que les permita obtener mejor y mayor provecho de los sistemas de información, ya que esto representa un elemento sumamente importante para que éstas se mantengan en competencia. La información como base para la toma de decisiones, ha incrementado el interés por disponer de información altamente relevante. Una herramienta importante que permite integrar información y aprovechar ésta para el análisis de la información relevante que soporta el proceso de la toma de decisiones, son los data warehouse, ya que favorecen la eficiencia en las operaciones de consulta, y con herramientas adecuadas de análisis de datos ofrece facilidades de apoyo en la toma de decisiones [4]. Data Warehouse es un conjunto de datos integrados, históricos, variantes en el tiempo y unidos alrededor de un tema específico, que es usado por la gerencia para la toma de decisiones (INMON). Los Data Warehouse (DWH) son una herramienta que permite la interpretación de datos con el objetivo de tomar mejores decisiones, auxilian a recuperar, resumir y analizar información relevante e importante, es decir, permiten hacer una compilación de datos diseñada para soportar decisiones administrativas. Los data warehouse contienen una gran variedad de datos que pueden presentar en un determinado momento las condiciones de una organización. Dicho de otra forma, los data warehouse son una herramienta sumamente robusta que presenta la información e interpretaciones de estrategias a seguir, para evaluar y seleccionar entre varias alternativas, visualizándolas desde distintos escenarios. 4

7 Debido al crecimiento vertiginoso de información y a falta de sistemas informáticos adecuados para la toma de decisiones, y dado su aceptación en diferentes áreas de conocimiento y sectores productivos, como es el caso de la pesca ribereña, muy importante en el país, fundamentalmente en algunos estados de la República Mexicana, este sector no queda exento de desarrollar herramientas para la mejor toma de decisiones. El estado de Baja California Sur se sitúa al noroeste de México y cuenta con kilómetros de litorales, la pesca es fundamental porque emplea a más de 10,700 personas, y cuyo volumen de captura promedio anual es de 155 mil toneladas de especies marinas; 11 por ciento del total de la producción pesquera nacional [12]. Al igual que en otras regiones de México, el manejo de la pesca en Baja California Sur se refiere a normas oficiales mexicanas como las relacionadas con la del camarón y tiburón y a las observaciones de la Carta Nacional Pesquera. En la mayoría de los casos, las normas y reglas no consideran diferencias regionales en la dinámica de las flotas, la distribución de los recursos y los impactos sobre ellos y el ecosistema, derivados de interacciones por la coexistencia espacial y temporal de las pesquerías. 5

8 1.2 Descripción del problema La toma de decisiones relacionada con los recursos pesqueros (particularmente en pesca ribereña) en un área, requiere de información que permita conocer la situación actual del recurso en cuanto a disponibilidad y demanda, así como modelos que permitan evaluar escenarios prospectivos y simular los efectos que producirían ciertas acciones. Las instituciones y/o organizaciones responsables de tomar decisiones en cuanto al sector pesquero, no cuentan con las herramientas que le permitan extraer, agrupar y analizar datos históricos para apoyar a los procesos de planificación, ordenamiento y manejo pesquero, para ello, se requiere contar con información confiable y oportuna que sirva como apoyo en el proceso de toma de decisiones. 6

9 1.3 Propuesta de solución Para el problema expuesto en el apartado anterior, se propone como solución diseñar e implementar un data warehouse que sirva como herramienta de apoyo, que simplifique y facilite a los usuarios la observación y análisis de la información. Esto significará el almacenamiento de información homogénea y confiable, en una estructura basada en la consulta y el tratamiento jerarquizado de la misma, y en un entorno diferenciado de los sistemas operacionales para enfatizar la toma de decisión. Para la construcción del data warehouse, es necesario convertir los datos de las diferentes fuentes de información en datos integrados de gran relevancia. Para lograr la conversión de los datos transaccionales, es necesario aplicar la metodología ETL (Extraction, Transformation, Loading), la cual se compone de tres etapas básicas: 1. Extracción: Involucra acceder a los datos y determinar si existen problemas de calidad de los mismos. 2. Transformación: Implica aplicar reglas de conversión de valores de aplicaciones locales o globales. 3. Carga: Consiste en la incorporación de los datos al data warehouse. 7

10 Figura 1.1 Arquitectura típica de una data warehouse La figura 1.1 visualiza la arquitectura típica para la construcción del data warehouse, para lo cual es necesario obtener los datos de los diferentes fuentes, incorporarlos al data warehouse y finalmente presentar los datos utilizando herramientas OLAP (On-Line Analitic Processing). En resumen, lo que se propone como solución, es la construcción de un data warehouse con datos que se basan en los registros de captura de pesca ribereña por especie o por grupo de ellas y por lugar, registrados de 1998 a 2009, en avisos de arribo de embarcaciones menores facilitados por la Comisión Nacional de Acuacultura y Pesca (conapesca). En el siguiente apartado se definen los objetivos generales y particulares que son necesarios cumplir, para llevar a cabo el desarrollo de la propuesta de tesis. 8

11 1.4 Objetivo general El objetivo principal del presente trabajo de tesis, es diseñar e implementar un data warehouse con datos de pesca ribereña para el estado de Baja California Sur, que permita obtener información relevante, para la consulta y análisis temporal de la información, que sirva como apoyo a la toma de decisiones. El data warehouse deberá funcionar como una herramienta tecnológica que concentre en un único lugar la información de pesca ribereña necesaria para que los tomadores de decisiones puedan llevar a cabo los procesos de planificación, ordenamiento y manejo pesquero de manera eficiente y eficaz mediante el comportamiento de la información. 9

12 1.5 Objetivos específicos Los objetivos específicos de este proyecto se enlistan a continuación: Identificar las fuentes de datos operacionales que actualmente almacenan la información de pesca ribereña en las costas del estado de Baja California Sur. Analizar y resolver las múltiples fuentes de datos. Diseñar el modelo dimensional para la construcción del data warehouse, utilizando el esquema conocido como estrella. Especificar los procesos de transformación e integración basados en las mejores fuentes de datos. Utilizar una herramienta que permita visualizar la información. Una vez definidos los objetivos generales y específicos, es necesario revisar la teoría relacionada con los data warehouse, que dará soporte al desarrollo de éste trabajo de tesis. En el siguiente capítulo, se presenta un panorama general de los data warehouse. 10

13 Capítulo 2 Marco teórico 2.1 Toma de decisiones El tomar o decidir por una decisión es una actividad con la cual se puede vivir de manera cotidiana. Las decisiones realmente importantes, generalmente son difíciles de tomar y requieren gran cantidad de información así como un alto nivel de soporte de la decisión. La decisión es el vehículo por el cual todos los recursos de una organización son desplegados o estructurados en un momento dado. Las dificultades asociadas con la toma de decisiones pueden ser el resultado de combinaciones innumerables de complejidad, incertidumbre, presiones de las organizaciones y ambientales y las limitaciones individuales del tomador de la decisión. A continuación se presenta un panorama de la toma de decisiones, las clasificaciones y las herramientas de soporte de este proceso, como los pronósticos. 11

14 2.2 Sistemas para apoyar la toma de decisiones La toma de decisiones es el proceso de seleccionar entre varias alternativas de acciones a tomar con el propósito de obtener ciertos objetivos. Los sistemas para el soporte de las decisiones (DSS, por sus siglas en inglés) son diseñados, construidos y utilizados para asistir en la actividad por la que son nombrados: soporte del proceso de la toma de decisiones. El propósito real de un DSS es el de proporcionar soporte al tomador de la decisión durante el proceso de la toma de la decisión.[4]. Un DSS es un sistema bajo el control de uno o más tomadores de decisiones que asiste en la actividad de la toma de decisiones y proporciona un conjunto de herramientas estructuradas, orientadas a mejorar la efectividad de los resultados de la decisión. Los DSS son en esencia muy diversos, pero comparten algunas características en común que son enlistadas a continuación: Se emplean en contextos de decisión no estructurados o semiestructurados. Un contexto estructurado es aquel que tiene objetivos no conflictivos, claramente definido, con pocas alternativas de decisión y normalmente son conocidos los efectos de las decisiones. Tratan de apoyar al tomador de decisiones más que reemplazarlo. Soportan todas las fases del proceso de toma de decisiones. Se enfocan en la efectividad del proceso de toma de decisiones, más que en su eficiencia. Usan datos y modelos predefinidos. Son interactivos y en general amigables. Se desarrollan a través de un proceso iterativo y evolutivo. 12

15 Soportan los niveles estratégicos y tácticos de las empresas. Soportan la toma de decisiones independientes o interdependientes. Soportan contextos de toma de decisiones individuales, grupales y en equipo. Los DSS ofrecen grandes beneficios a la organización, así como algunas limitantes. Los beneficios que puede aportar un DSS son: 1. Extienden la capacidad del tomador de decisiones para procesar información y conocimiento. 2. Permiten el atacar problemas complejos, de gran escala y que normalmente demandarían muchísimo tiempos sin el uso del DSS. 3. Permiten reducir el tiempo necesario para llegar a una decisión. 4. Aunque es difícil de evaluar pero normalmente incrementan la confiabilidad de los resultados que se logran al tomar una decisión. 5. Motivan la exploración y el descubrimiento del tomador de decisiones. 6. Dan nuevas evidencias para apoyar una decisión o apoyan las suposiciones previas. 7. Crean una ventaja competitiva en las empresas. 13

16 A continuación se muestra la figura 2.1, con los beneficios de los DSS para las organizaciones. Figura 2.1 Beneficios de los DSS en las organizaciones Las limitaciones que tiene un DSS son: 1. Normalmente no involucran aspectos de la inteligencia humana como la creatividad, la imaginación y la intuición. 2. El DSS tiene como limitantes: el equipo computacional en el que corre, el diseño del mismo, y el conocimiento que posee cuando es usado. 3. Las interfaces no son suficientemente sofisticadas como para soportar la generación de voz, el reconocimiento de voz y el manejo de lenguaje natural. 4. Son aplicables a contextos específicos. 14

17 Los componentes de un DSS son: a) El Sistema de Administración de Datos. Compuesto en esencia por la base de datos y una facilidad para realizar consultas. b) El Sistema de Administración de Modelos. Responsable de controlar el almacenamiento y recuperación de los datos relacionados con los modelos cuantitativos en base a los cuales se estructura el proceso de análisis de decisiones. c) La Máquina de Conocimiento. Permite el derivar nuevo conocimiento en base a los datos base o a conocimiento previamente derivado. La máquina de conocimiento maneja: Estrategias de solución específicas de acuerdo al contexto, reglas derivadas, restricciones inherentes a una situación particular, probabilidades a priori. Básicamente podemos ubicar que el conocimiento contenido en un DSS pueden ser HECHOS e HIPOTESIS (reglas o relaciones que se cree existen entre los hechos). La máquina de conocimiento tiene dos funciones básicas: La Adquisición del Conocimiento; y La Recuperación del Conocimiento (Máquina de Inferencias). d) La Interface con el Usuario. Esta interface debería ser ad-hoc al usuario. Se pretende que está interfaz tenga capacidades de generación de voz, reconocimiento de voz, manejo de lenguaje natural, presentación de los datos, conocimiento, opciones y en general de toda la información de una manera adecuada al usuario, se busca de manera adicional agregar afectividad a la interfaz y el uso de agentes inteligentes. e) El Usuario del DSS. Se puede ubicar que existen diversos tipos de usuarios de un DSS, pero en esencia se distinguen: El Administrador del DSS. 15

18 El Mantenedor de los Datos, Base de Conocimiento, Reglas, entre otros. El Tomador de Decisiones Categorías y clase de decisiones Existe una gran variedad de métodos propuestos para clasificar y categorizar los sistemas de soporte a las decisiones. Métodos basados en el tipo de soporte ofrecido por el DSS; situación de la decisión; orientados a los datos, texto, reglas, o modelos; y enfoque en lo individual contra lo múltiple de los tomadores de decisiones, son todas las usadas en clasificar el gran número de DSS en existencia o bajo desarrollo. Según Marakas, algunas de las clasificaciones de los DSS, son las siguientes [4]. Centrados en los datos y centrados en los modelos DSS centrados en los datos y centrados en los modelos Los DSS centrados en los datos se enfocan primordialmente en la recuperación y análisis de los datos de las actividades de soporte. Los centrados en los modelos incluyen actividades tales como simulación, maximización u optimización de escenarios y aquellos resultados de los DSS que generan acciones sugeridas basadas en los modelos o reglas determinadas DSS formales y ad-hoc Esta clasificación es basada en los atributos del contexto de la solución del problema. Los formales están diseñados para enfocarse en decisiones que son periódicas o recurrentes dentro de la organización. Los ad-hoc se enfocan en un contexto de problema muy reducido o en un conjunto de decisiones que normalmente no son recurrentes o fáciles de anticipar. 16

19 DSS Dirigido y No Dirigido Esta clasificación se refiere al grado de dependencia del DSS con respecto al usuario, que tan automático es el proceso del DSS Modelo del proceso de toma de decisiones El problema a solucionar bajo condiciones y circunstancias específicas, marcan el rumbo de la forma que debe de ser tomada la decisión. La forma en la que es modelado el planteamiento del problema es sumamente útil, ya que permite estudiar con gran efectividad el contexto de un problema, derivar y organizar la información necesaria Alcance del problema del proceso de toma de decisiones Una vez definido en su totalidad el planteamiento del problema, el tomador de decisión debe examinar el alcance del problema. Al hacer dicha examinación podrá determinar la factibilidad de la solución del problema, pero que el alcance de ésta, va más allá de los recursos disponibles. El alcance del problema será determinado por las prioridades del tomador de decisiones. 17

20 2.3 Tecnologías de data warehouse El data warehouse es una herramienta novedosa para el soporte de la toma de decisiones, ya que ofrecen una base de información para el análisis de la situación de diversos factores relevantes al proceso en cuestión. En el presente capítulo se ofrecen conceptos relativos al data warehouse o bodegas de datos y sus características, se aborda además la arquitectura que los rige, así como una descripción del modelo dimensional de estos warehouses y su proceso de diseño. Por último se analizan las herramientas de aplicación en el data warehouse, como las consultas, análisis y visualización de la información Data warehouse Es común que en algunas organizaciones y empresas se haya acumulado la información que los sistemas generan al resolver los procesos que hacen posible la gestión cotidiana. Esta información es sumamente valiosa a la hora de tomar decisiones gerenciales, que necesitan conocimientos sobre datos históricos y sus tendencias. Puede ser muy usual el hecho de tratar de buscar información estratégica, consistente en encontrar cierta información, y luego utilizar el resultado obtenido para dirigir su próxima consulta, por lo que es preciso contar con una herramienta que permita la interacción en un corto tiempo y minimizando la interferencia con los sistemas que realizan la gestión cotidiana. El uso de herramientas tradicionales basadas en el desarrollo de aplicaciones sobre sistemas administradores de bases de datos para obtener información estratégica para la toma de decisiones, presenta inconvenientes de diferente índole, como tiempos de respuesta extremadamente lentos, dificultad o imposibilidad de expresar una consulta compleja, y dificultad para la obtención de resultados que recopilen información de fuentes diversas. 18

21 La información como base para la toma de decisiones, ha incrementado el interés por disponer de información altamente relevante. Una herramienta importante que permite integrar la información y aprovechar ésta para el análisis de la información relevante que soporta el proceso de la toma de decisiones, son los data warehouse, ya que favorecen la eficiencia en las operaciones de consulta, y con herramientas adecuadas de análisis de datos que ofrecen facilidades de apoyo en la toma de decisiones. El concepto de data warehouse se ha desarrollado a partir de la necesidad de disponer de un acceso sencillo e inmediato a determinada información de negocio estructurada y de calidad, que pueda ser empleada para la toma de decisiones. Dentro de una organización el uso del data warehouse se puede aplicar no sólo en el soporte de la gerencia de alto nivel que debe tomar decisiones de objetivos y planificación estratégicas, sino en niveles más técnicos de toma de decisión. Los sistemas data warehouse han surgido como respuesta a la problemática de extraer información relevante a partir de datos atómicos almacenados en bases de datos operacionales o transaccionales también conocidos como sistemas de procesamiento de transacciones en línea. Uno de los objetivos de los sistemas operacionales, es servir como base de información para la toma de decisiones. Los beneficios obtenidos por la utilización de éste tipo de sistemas se basan en el acceso interactivo e inmediato a información estratégica de un área de negocios. Al concepto de data warehouse le han dado definiciones diferentes personas. Algunas de estas definiciones se limitan al ámbito de los datos, algunas otras hacen referencia al conjunto global de procesos, software, herramientas y a los propios datos. Aunque las definiciones difieren, entre las distintas variantes existe un nexo común casi siempre. Un data warehouse es una colección de datos integrados, orientados a un tema, que varían con el tiempo y que no son transitorios, los cuales apoyan el proceso de la toma de decisiones [13]. 19

22 De manera informal, se puede entender a un data warehouse como un gran almacén que contiene una clase especial de producto, datos procedentes de cualquier lugar, de naturaleza heterogénea, en grandes volúmenes y con características mucho muy especiales y en donde los datos deben de estar bien definidos, ser consistentes y de naturaleza no vólatil; Adicionalmente deben ser capaces de proporcionar información histórica. El data warehouse no es un producto y no puede ser comprado, debe construirse paso a paso. Un data warehouse contiene una amplia variedad de datos que permiten visualizar un panorama lógico de las condiciones de la organización en cualquier momento, lo cual permitirá a los tomadores de decisiones, tener la capacidad para interpretarlos, convertirlos en información, posteriormente en conocimiento, y desde luego determinar las acciones a seguir. El esquema data warehouse se construye sobre la base de un proceso de integración aplicado sobre cierto conjunto de bases de datos fuentes. Se cargan con datos que surgen de un proceso conocido como extracción y limpieza, en donde sólo se cargan los datos y se construyen los resúmenes que sean relevantes para las tareas de toma de decisiones Características de un data warehouse El término data warehouse, que fue introducido por Inmon en 1990, el cual lo definió como una colección de datos orientada a temas, integrada, variante en el tiempo y no volátil, para el soporte del proceso de toma de decisiones. Esta definición establece las cuatro características que describen un data warehouse: Orientado al tema Esta característica de los data warehouse es que está orientado hacia el tema principal de una organización. La orientación por temas tiene como beneficio el incorporar una perspectiva de los datos, bajo características que son comunes a una entidad. Se parte del ambiente operacional donde la orientación y las 20

23 funciones buscan proveer servicio más que información. Una vez identificado el dato operativo, se procede a mapearlo hacia la temática seleccionada. Los datos se organizan en base a temas y no a aplicaciones. Por ejemplo, en el caso de seguros los temas pudieran ser cliente, prima, reclamo. Solamente contiene la información necesaria para el proceso de toma de decisiones. Variante en el tiempo La siguiente característica de los data warehouse es ser variante en el tiempo. El ambiente operacional contiene datos actuales, que son exactos al momento de acceso y tienen un horizonte de 60 a 90 días. Su actualización al momento es necesaria. En el caso de la tienda departamental, si el cliente utiliza el crédito abierto con la empresa y lleva a cabo una compra, es necesario actualizar su saldo disponible en tiempo real. Por otra parte, en el data warehousese mantiene una gran cantidad de historia. Se compone de fotografías de datos que reflejan alguna perspectiva dentro de un cierto horizonte de tiempo. En general, su horizonte puede ser entre 5 y 10 años. Los cambios en este caso no actualizan datos, sino son agregados al almacén de datos. Los datos en el data warehouse son históricos a diferentes niveles de granularidad. Su uso es para comparaciones, tendencias, pronóstico. No volátil Otra característica definida por Inmon dentro de los data warehouse es su no volatilidad. El ambiente operacional requiere de una actualización de datos constante, bajo operación de borrar, cambiar, insertar. La mecánica de operación de data warehouse tiene dos operaciones: a) carga de datos b) consulta de datos. 21

24 Una vez que se ha cargado un dato, no se actualiza. Los datos son solamente cargados y accedidos, nunca se actualizan. Integrados En el ambiente de los data warehouse, el factor más importante, es que al interior la información siempre será encontrada de forma integrada. En esencia, el ambiente de los data warehouse es que los datos que contiene en los límites del data warehouse, son integrados; el origen de los datos, son usualmente aplicaciones separadas dentro del ambiente operativo, donde la codificación de los datos generalmente es inconsistente [13]. Los datos implica que todos los datos de los diversos sistemas operacionales que son producidos por distintas secciones y distintas aplicaciones, deben ser unidos antes de ser agregados al data warehouse. A éste proceso se le conoce como Proceso de Extracción, Transformación y Carga (ETL, por sus siglas en inglés). La integración de los datos se muestra de muchas maneras: Convenciones de nombre consistentes Medidas uniformes de variables Codificación de estructuras consistentes Atributos físicos de los datos consistentes Fuentes múltiples Otros 22

25 2.3.3 Arquitectura de un data warehouse La arquitectura lógica de un sistema data warehouse consta de tres niveles básicos: 1. Bases de datos fuentes de producción e históricos. Consisten en bases de datos operacionales, transaccionales o de producción (OLTP), así como de históricos de dichas bases. Estas bases de datos pueden estar implementadas en diferentes tipos de sistemas: base de datos relacionales, base de datos geográficas, base de datos de textos, archivos. La característica en común que tienen dichas bases de datos, es que almacenan items de datos atómicos, los cuales son relevantes como datos operacionales, pero pudieran ser demasiados finos como base para la toma de decisiones. 2. Base de datos con datos resumidos extraídos de las bases de producción (data warehouse). Es un gran almacén que incluye los datos relevantes para la toma de decisiones en un área de negocios o globalmente en la organización. Los datos almacenados en el data warehouse son fundamentalmente datos relevantes agrupados y totalizados que se encuentran en las bases de datos transaccionales y en los históricos. Un elemento sumamente importante en el contexto de los data warehouse es el diccionario de datos (metadatos), el cual describe los datos almacenados con el objetivo de facilitar el acceso a los mismos a través de las herramientas de explotación del data warehouse. El diccionario de datos establece correspondencias entre los datos almacenados y los conceptos que estos representan deforma de facilitar la extracción de información por parte del usuario final. 3. Interfaces orientados a usuarios que extraen información para la toma de decisiones. A partir de las bases de datos fuentes éstos deben resolver problemas técnicos importantes, como el acceso a sistemas 23

26 heterogéneos, ejecución de consultas complejas afectando lo mínimo el performance de las bases fuentes. Adicionalmente a los componente descritos anteriormente, es preciso decir, que existen herramientas de monitoreo y administración del sistema y un área para almacenar y administrar metadatos. Las herramientas de administración, se dividen en herramientas de desarrollo, de planeación y análisis, y de monitoreo propiamente. Los data warehouse por su concepción almacenan grandes volúmenes de información, por lo que éstos son de mucho mayor magnitud en almacenamiento que las bases de datos operacionales. Según la capacidad de almacenamiento de los data warehouse se clasifican en tres categorías: 1. Data warehouse empresariales. Son proyectos de gran magnitud, dónde es necesario invertir fuertemente tiempo y recursos. 2. Data warehouse virtuales. Proporcionan vista de bases de datos, las cuales son materializadas para un acceso eficiente. 3. Data marts. Es un data warehouse específico o departamental, orientado a las necesidades de un grupo, específico de usuarios y, por tanto, enfocado a un subconjunto de aspectos de la organización [14]. 24

27 2.3.4 Data marts Es un pequeño data warehouse, para un determinado número de usuarios, para un área funcional, especifica de la compañía. También podemos definir que un data Marts es un subconjunto de una bodega de datos para un propósito específico. Data mart es un modelo multidimensional basado en tecnología OLAP (On- Line Analytical Processing) que representa a un área específica de la empresa, incluyendo las variables claves y los indicadores para el proceso de toma de decisiones. Hay tres enfoques principales para la creación de un data mart [14]: 1. Los datos pueden ser simplemente extraídos del data warehouse; de hecho sigue un enfoque de divide y vencerás sobre la carga de trabajo general de apoyo para la toma de decisiones, a fin de lograr un mejor rendimiento y escalabilidad. 2. A pesar del hecho de que el data warehouse pretende proporcionar un punto de control único, un data mart puede ser creado todavía en forma independiente (es decir, no por medio de la extracción a partir del data warehouse). Dicho enfoque puede ser adecuado si el data warehouse es inaccesible por alguna razón. 3. Algunas organizaciones han seguido un enfoque de crear primero el data mart, donde éstos son creados conforme van siendo necesarios y el data warehouse general es creado finalmente, como una consolidación de los diversos data marts. 25

28 2.3.5 Componentes de un data warehouse Poder transformar los datos en conocimientos es un proceso complejo. Un data warehouse, es una arquitectura que debe de servir como infraestructura para proporcionar una solución completa. Los componentes principales de un data warehouse se describen a continuación. 1. Componente de diseño / Adquisición de datos: Los sistemas operacionales procesan datos para apoyar las necesidades de operaciones críticas. Para hacer eso, se han creado las bases de datos operacionales históricas que proveen una estructura de procesamiento eficiente, para un número relativamente pequeño de transacciones comerciales bien definidas. Sin embargo, a causa del enfoque limitado de los sistemas operacionales, las bases de datos diseñadas para soportar estos, tienen dificultad al acceder los datos para otra gestión o propósitos informáticos. Esta, es amplificada por el hecho que muchos de estos sistemas tienen de 10 a 15 años de antigüedad. El tiempo de algunos de estos sistemas significa que la tecnología de acceso a los datos disponible para obtener los datos operacionales, es antigua. La meta del Data Warehouse es liberar la información que se almacena en bases de datos operacionales y combinarla con la información desde otra fuente de datos, generalmente externa. Cada vez, las organizaciones grandes adquieren datos adicionales desde bases de datos externas. 2. Componente de acceso a la información: Es el nivel del que el usuario final se encarga directamente. En particular, representa las herramientas que este normalmente, usa diariamente. Este nivel incluye el hardware y software que muestran la información en pantalla y emitir reportes de impresión, hojas de cálculo, gráficos y diagramas para el análisis y presentación. 26

29 Actualmente, existen herramientas sofisticadas para manipular, analizar y presentar los datos, sin embargo, hay problemas significativos al tratar de convertir los datos tal como son recolectados y que se encuentran contenidos en los sistemas operacionales en información fácil y transparente para las herramientas de los usuarios finales. 3. Componente de acceso a los datos: El nivel de acceso a los datos de la arquitectura Data Warehouse se involucra con el nivel de acceso a la información para conversar en el nivel operacional. En la red mundial de hoy, el lenguaje de datos común que surge es SQL (Structured Query Language). Originalmente, SQL fue desarrollado por IBM como un lenguaje de consulta, pero en los últimos veinte años ha llegado a ser el estándar para el intercambio de datos. El nivel de acceso a los datos no solamente conecta DBMSs (Bases de Datos Relacionales) diferentes y sistemas de archivos sobre el mismo hardware, sino también a los fabricantes y protocolos de red. Una de las claves de una estrategia Data Warehouse es proveer a los usuarios finales con "acceso a datos universales". El acceso a los datos universales significa que, teóricamente por lo menos, los usuarios finales sin tener en cuenta la herramienta de acceso a la información o ubicación, deberían ser capaces de accesar a cualquier o todos los datos en la empresa que es necesaria para ellos. El nivel de acceso a los datos entonces es responsable de la interfase entre las herramientas de acceso a la información y las bases de datos operacionales. En algunos casos, esto es todo lo que un usuario final necesita. 4. Componente de Directorio de Datos (Metadata): A fin de proveer el acceso a los datos universales, es absolutamente necesario mantener alguna forma de directorio de datos o repositorio de la información metadata. A fin de tener un depósito totalmente funcional, es necesario 27

30 tener una variedad de metadata disponibles, información sobre las vistas de datos de los usuarios finales e información sobre las bases de datos operacionales. Idealmente, los usuarios finales deberían de accesar a los datos desde el data warehouse (o desde las bases de datos operacionales), sin tener que conocer dónde residen los datos o la forma en que se han almacenado. 5. Componente de Gestión de Procesos: El nivel de gestión de procesos tiene que ver con la programación de diversas tareas que deben realizarse para construir y mantener el data warehouse y la información del directorio de datos. Este nivel puede depender del alto nivel de control de trabajo para muchos procesos que deben ocurrir para mantener el data warehouse actualizado. 6. Componente de Mensaje de la Aplicación: El nivel de mensaje de la aplicación tiene que ver con el transporte de información alrededor de la red de la empresa. El mensaje de aplicación se refiere también como "subproducto", pero puede involucrar sólo protocolos de red. Puede usarse por ejemplo, para aislar aplicaciones operacionales o estratégicas a partir del formato de datos exacto, recolectar transacciones o los mensajes y entregarlos a una ubicación segura en un tiempo seguro. 7. Componente data warehouse (Físico): En el data warehouse es donde ocurren los datos actuales, usados principalmente para usos estratégicos. En algunos casos, se puede pensar del data warehouse simplemente como una vista lógica o virtual de datos. En muchos ejemplos, el Data Warehouse puede no involucrar almacenamiento de datos. En un Data Warehouse físico, copias, en algunos casos, muchas copias de datos operacionales y/o externos, son almacenados realmente en una forma que es fácil de acceder y es altamente flexible. Cada vez más, los Data Warehouse son 28

31 almacenados sobre plataformas cliente / servidor, pero por lo general se almacenan sobre mainframes o computadoras grandes. 8. Componente de Organización de Datos: El componente final de la arquitectura data warehouse es la organización de los datos. Se llama también gestión de copia o réplica, pero de hecho, incluye todos los procesos necesarios como seleccionar, editar, resumir, combinar y cargar datos en el depósito y acceder a la información desde bases de datos operacionales y/o externas. Existen distintas categorías de componentes, dependiendo del tipo de usuario al que esté enfocado, y que se mencionan y describen a continuación: Usuarios básicos. En esta categoría se encuentran las aplicaciones que permiten realizar informes predefinidos que se ejecutaran de forma mas o menos periódica. En este caso el interés del usuario se centra en disponer de una información determinada, probablemente que atienda informes de indicadores de la organización, pero sin ir más allá en el análisis de la información. Aplicaciones que facilitan la ejecución de análisis elemental de los datos contenidos en el data warehouse. Aquí se incluyen las herramientas de análisis multidimensionales y aquéllas que permiten a los analistas a cuestionar al data warehouse sobre la información, y a explorar los datos más desde la visión de la organización que desde el punto de vista de las operaciones. Aplicaciones que permiten realizar análisis avanzados. Aquí se encuentran las herramientas de análisis estadístico (basadas en técnicas como el análisis factorial o discriminante) y las de data mining (minería de datos, que son técnicas procedentes de la inteligencia artificial y redes 29

32 neuronales). Este componente también dispone de mecanismos para implementar la seguridad de acceso. Así mismo, este control tiene como objetivo primordial impedir la utilización del sistema a los usuarios no autorizados y delimitar a cada uno de los usuarios su ámbito de acceso, ya sea en cuanto a la información disponible para él o en cuanto al tipo de operaciones que le está permitido realizar. Componente middleware. Este componente middleware proporciona la conectividad necesaria entre la base de datos del data warehouse y las herramientas de acceso de usuario final. Existen dos tipos de middleware especializados. 1. Middleware inteligente. Proporciona una visión de la organización del data warehouse a los usuarios finales y supervisa y registra el acceso a la información del data warehouse. 2. Servidores analíticos. Mejoran las prestaciones de las operaciones de análisis multidimensional en un entorno de base de datos relacional. Componente de distribución de datos. Es el responsable de distribuir la información del data warehouse a otras aplicaciones, como pueden ser data mart, hojas de cálculo, bases de datos locales entre otros Operaciones de un data warehouse El objetivo de un ambiente data warehouse es convertir los datos de aplicaciones del ambiente transaccional (OLTP), en datos integrados de gran calidad. Después deben almacenarse en una estructura que optimice el acceso por parte de los usuarios finales en un ambiente decisión (OLAP). Durante éste 30

33 proceso, los datos totalizados son agregados al data warehouse en una base periódica, apropiada al tipo de análisis de negocios necesarios. A continuación se describen las operaciones de un data warehouse. a) Sistemas Operacionales: Los datos administrados por los sistemas de aplicación operacionales son la fuente principal de datos para el Data Warehouse. Las bases de datos operacionales se organizan como archivos indexados, bases de datos de redes/jerárquicas o sistemas de base de datos relacionales. b) Extracción, Transformación y Carga de los Datos: Se requieren herramientas de gestión de datos para extraer datos desde bases de datos y/o archivos operacionales, luego es necesario manipular o transformar los datos antes de cargar los resultados en el Data Warehouse. Tomar los datos desde varias bases de datos operacionales y transformarlos en datos requeridos para el depósito, se refiere a la transformación o a la integración de datos. Las bases de datos operacionales, diseñadas para el soporte de varias aplicaciones de producción, frecuentemente difieren en el formato. Los mismos elementos de datos, si son usados por aplicaciones diferentes o administrados por diferentes software de administración de bases de datos (DBMS), pueden definirse al usar nombres de elementos inconsistentes, que tienen formatos inconsistentes y/o ser codificados de manera diferente. Todas estas inconsistencias deben resolverse antes que los elementos de datos sean almacenados en el data warehouse. c) Metadata: Otro paso necesario es crear la metadata. Esta describe los contenidos del data warehouse. Consiste de definiciones de los elementos de datos en el depósito, sistemas de los elementos fuente. Los datos, se integran y transforman antes de ser almacenados en información similar. 31

34 d) Acceso de usuario final: Estos accesan al data warehouse por medio de herramientas de productividad basadas en Interface gráfica de usuario (GUI). Proveen a los usuarios del data warehouse muchos de estos tipos de instrumentos. Estos pueden incluir software de consultas, generadores de reportes, procesamiento analítico en línea, data/visual mining, entre otros, dependiendo de los tipos de usuarios y sus requerimientos particulares. Sin embargo, una sola no satisface a todos, por lo que es necesaria la integración de una serie de utensilios. e) Plataforma del Data Warehouse: La plataforma para el data warehouse es casi siempre un servidor de base de datos relacional. Cuando se manipulan volúmenes muy grandes de datos puede requerirse una configuración en bloque. Los extractos de los datos integrados/transformados se cargan en el data warehouse. La elección de la plataforma es crítica, el almacén crece y hay que comprender los requerimientos después de 3 o 5 años. Muchas de las organizaciones quieran o no escogen una plataforma por diversas razones: el Sistema X es el elegido o el Y está disponible sobre uno que ya se tiene. Uno de los errores más grandes que las organizaciones cometen al seleccionar la plataforma, es que ellos presumen que el sistema (hardware y/o DBMS) escala con los datos. El sistema de depósito ejecuta las consultas que se pasa a los datos por el software de acceso del usuario. Aunque uno de estos visualiza las consultas desde el punto de vista de un GUI, estas típicamente se formulan como pedidos SQL, porque es un lenguaje universal y el estándar hecho para el acceso a datos. f) Datos Externos: Dependiendo de la aplicación, el alcance del data warehouse se extiende por la capacidad de accesar los datos externos. Por ejemplo, los datos accesibles por medio de servicios de computadora en línea y/o vía Internet, pueden estar disponibles a los usuarios del data warehouse. 32

35 Los seis puntos mencionados anteriormente del data warehouse, proveen un marco de trabajo para controlar la arquitectura de los componentes. Éste marco, describe las transformaciones de los datos desde un ambiente OLTP, a un ambiente OLAP Diferencias entre OLTP y data warehouse Los sistemas tradicionales de transacciones y las aplicaciones de Data warehouse son polos opuestos en cuanto a sus requerimientos de diseño y sus características de operación. Las aplicaciones de OLTP están organizadas para ejecutar las transacciones para lo cual fueron hechas, como por ejemplo: mover dinero entre cuentas, un cargo o abono, una devolución de inventario, entre otros. Por otro lado, un data warehouse está organizado en base a conceptos, como por ejemplo: clientes, facturas, productos, y otros. Otra diferencia radica en el número de usuarios. Normalmente, el número de usuarios de un data warehouse es menor al de un OLTP. Es común encontrar que los sistemas transaccionales son accedidos por cientos de usuarios simultáneamente, mientras que los data warehouse sólo por decenas. Los sistemas de OLTP realizan cientos de transacciones por segundo mientras que una sola consulta de un data warehouse puede tomar minutos. Otro factor es que frecuentemente los sistemas transaccionales son menores en tamaño a los data warehouse, esto es debido a que un data warehouse puede estar formado por información de varios sistemas tipo OLTP. Existe también diferencia en los diseños, mientras que el de un OLTP es extremadamente normalizado, el de un data warehouse tiende a ser desnormalizado. El OLTP normalmente está formado por un número mayor de tablas, cada una con pocas columnas, mientras que en un data warehouse el número de tablas es menor, pero cada una de éstas tiende a ser mayor en número de columnas. 33

36 Los OLTP son continuamente actualizados por los sistemas operacionales del día con día, mientras que los data warehouse son actualizados en batch de manera periódica. Las estructuras de los OLTP son muy estables, rara vez cambian, mientras las de los data warehouses sufren cambios constantes derivados de su evolución. Esto se debe a que los tipos de consultas a los cuales están sujetos son muy variados y es imposible preverlos todos de antemano. Mejorar la entrega de información: información completa, correcta, consistente, oportuna y accesible. Información que la gente necesita, en el tiempo que la necesita y en el formato que la necesita. Mejorar el proceso de toma de decisiones: con un mayor soporte de información se obtienen decisiones más rápidas; así también, la gente de negocios adquiere mayor confianza en sus propias decisiones y las del resto, y logra un mayor entendimiento de los impactos de sus decisiones. Impacto positivo sobre los procesos empresariales: cuando a la gente se le da acceso a una mejor calidad de información, la empresa puede lograr por sí sola: Eliminar los retardos de los procesos empresariales que resultan de información incorrecta, inconsistente y/o no existente. Integrar y optimizar procesos empresariales a través del uso compartido e integrado de las fuentes de información. Eliminar la producción y el procesamiento de datos que no son usados ni necesarios, producto de aplicaciones mal diseñados o ya no utilizados. El proceso analítico es la parte más importante de los sistemas data warehouse. Al construir un data warehouse se requiere organizar los datos 34

37 operacionales como información analítica y ofrecer herramientas de análisis a los tomadores de decisión. El proceso analítico, permite a los tomadores de decisión, examinar diferentes dimensiones de información de una manera efectiva para poder tomar una decisión. El proceso analítico es definido como el proceso analítico en línea (OLAP, On Line Analytical Proccesing, por sus siglas en inglés). Los sistemas data warehouse son datos dimensionales, normalmente no están en línea y el énfasis está en el poder extraer información relevante de los datos provenientes de los sistemas OLTP.. 35

38 2.3.8 Arquitectura OLAP La explotación de sistemas data warehouse a través de datos obtenidos directamente de sistemas transaccionales, OLTP, se basa fundamental y básicamente en estructuras agrupadas o información previamente pre-calculada y procesada. La información reportada está compuesta y gestionada desde conceptos basados en datos agregados y coeficientes de gestión, que los cuadros directivos de la organización pueden definir y consultar según las dimensiones de negocio que se definan o el área a la que pertenezca. Implementar un sistema de business intelligence significa encontrar el punto de equilibrio entre dos extremos: implementación independiente de las unidades de la organización y la arquitectura de almacenamiento de datos definida por los IT departamentales. Por un lado los IT departamentales deben aceptar que el hecho de que ellos no puedan suministrar las visiones del usuario final con la premura requerida sin incorporar tecnología OLAP. Por otro lado los directivos deben aprender a reconocer el valor de tener un repositorio común del que leer todos los indicadores y toda la terminología que cruza todos los datos de todos los departamentos. Únicamente un data warehouse puede proveer esta consistencia. La información es gestionada y procesada en grandes bloques organizativos, como puede ser la estructura geográfica o académica, llamados dimensiones. Dichas dimensiones de negocio se estructuran a su vez en distintos niveles de detalle (por ejemplo, la dimensión geográfica puede constar de los niveles país, comunidad autónoma, provincia, población y código postal). Este tipo de sistemas ha existido desde hace tiempo, en el mundo de la informática, bajo distintas denominaciones: cuadros de mando, MIS, EIS, y otros. Aunque su implementación, al margen del entorno data warehouse, puede repercutir sobre estos sistemas en una mayor rigidez, dificultad de actualización y mantenimiento, tiempos de respuesta inaceptables, incoherencias de la información, falta del dato agregado. 36

39 Los sistemas de soporte a la decisión que utilizan tecnologías de data warehouse, se llaman sistemas OLAP. En general, estos sistemas OLAP deben: Soportar requerimientos complejos de análisis Analizar datos desde diferentes perspectivas Soportar análisis complejos contra un volumen ingente de datos La principal característica de los sistemas OLAP es que son entornos especialmente diseñados para la ejecución de análisis multidimensionales de los datos corporativos, que soportan amigablemente los análisis de cualquier usuario así como las posibilidades de navegación, seleccionando la información a obtener, permitiendo el análisis de datos segmentados y que permiten ir reduciendo el conjunto de datos reportados. Este tipo de selecciones se refleja en la visualización de la estructura multidimensional, mediante unos campos de selección que nos permitan elegir el nivel de agregación (jerarquía) de la dimensión, y/o la elección de un dato en concreto, pudiendo con ello realizar, entre otras, las acciones de rotar, bajar atributos, navegar, expandir o colapsar los datos mostrados Sistema MOLAP La arquitectura de sistemas MOLAP se fundamenta, para proporcionar el análisis, en bases de datos multidimensionales. Su principal premisa es que se trata del entorno OLAP mejor implantado y adaptado para el almacenamiento y gestión de datos multidimensionalmente. Por el contrario, la arquitectura y gestión de entornos ROLAP presupone que las capacidades OLAP están perfectamente implantadas y reflejadas sobre bases de datos relacionales. Un sistema MOLAP usa una base de datos multidimensional, en la que la información se almacena multidimensionalmente, para ser visualizada 37

40 multidimensionalmente (valga la redundancia). El sistema MOLAP utiliza una arquitectura de dos niveles: La bases de datos multidimensionales y el motor analítico. La base de datos multidimensional es la encargada del manejo, acceso y obtención del dato. El nivel de aplicación es el responsable de la ejecución de los requerimientos OLAP. El nivel de presentación se integra con el de aplicación y proporciona un interfaz a través del cual los usuarios finales visualizan los análisis OLAP. Una arquitectura cliente/servidor permite a varios usuarios acceder a la misma base de datos multidimensional. La información procedente de los sistemas transaccionales, se carga en el sistema MOLAP, mediante una serie de rutinas o procedimientos batch. Una vez cargado el dato elemental en la Base de Datos multidimensional (MDDB), se realizan una serie de cálculos en batch, para obtener los datos agregados, a través de las dimensiones de negocio, rellenando la estructura MDDB y generando los cubos multidimensionales que darán cobertura a los informes implementados en el nivel de aplicación. Tras cargar esta estructura, se generan unos índices y algoritmos de tablas hash para mejorar los tiempos de acceso a las consultas. Una vez que el proceso de compilación ha finalizado, la MDDB está lista para su uso. Los usuarios solicitan informes a través del interface, y la lógica de aplicación de la MDDB obtiene el dato. La arquitectura MOLAP requiere cálculos intensivos de compilación. Leer de datos precompilados, y tiene capacidades limitadas de crear agregaciones dinámicamente o de hallar ratios que no se hayan precalculados y almacenados previamente. 38

41 Sistema ROLAP En una arquitectura ROLAP, el sistema accede directamente a los datos almacenados en un data warehouse para proporcionar los análisis OLAP solicitados. La premisa de estos sistemas es que las capacidades OLAP se soportan mejor contra las bases de datos relacionales, más que tenerlas directamente implementadas en la base de datos (como en entornos MOLAP). La esencia de estos entornos es que las acciones de filtrado y agregación son equivalentes a la inclusión de una cláusula WHERE" en una sentencia SQL. El sistema ROLAP utiliza una arquitectura de tres niveles. La base de datos relacional maneja los requerimientos de almacenamiento de datos, y el motor ROLAP proporciona la funcionalidad analítica. El nivel de base de datos usa bases de datos relacionales para el manejo, acceso y obtención del dato. El nivel de aplicación es el motor que ejecuta las consultas multidimensionales de los usuarios. El motor ROLAP se integra con niveles de presentación, a través de los cuales los usuarios realizan los análisis OLAP. Después de que el modelo de datos para el data warehouse se ha definido, los datos se cargan desde el sistema transaccional. Se ejecutan rutinas de bases de datos para agregar el dato, si así es requerido por los modelos de datos. Se crean entonces los índices para optimizar los tiempos de acceso a las consultas. Los usuarios finales ejecutan sus análisis multidimensionales, a través del motor ROLAP, que transforma dinámicamente sus consultas a consultas SQL. Se ejecutan estas consultas SQL en las bases de datos relacionales, y sus resultados 39

42 se relacionan mediante tablas cruzadas y conjuntos multidimensionales para devolver los resultados a los usuarios. La arquitectura ROLAP es capaz de usar datos precalculados si estos están disponibles, o de generar dinámicamente los resultados desde los datos elementales si es preciso. Esta arquitectura accede directamente a los datos del data warehouse, y soporta técnicas de optimización de accesos para acelerar las consultas. Estas optimizaciones son, entre otras, particionado de los datos a nivel de aplicación, soporte a la desnormalización y múltiples joins entre tablas Operaciones OLAP Las herramientas OLAP implementan una serie de operaciones para manejar y extraer los datos que queramos, de las dimensiones representadas en el cubo. Las operaciones multidimensionales se pueden agrupar en dos conjuntos básicos: 1) De agrupación (roll-up, drill-down). Éste grupo de operaciones está constituido, por operaciones que surgen de realizar movimientos en las jerarquías de las dimensiones. La operación que realiza el roll-up es aumentar el nivel de abstracción. Cuando se sube de nivel por una jerarquía, se agrupan todos los valores del nivel original que están relacionados con el mismo valor del nivel superior, mientras que el drilldown lo que hace es decrecer el nivel de abstracción y aumentar el detalle. Cuando baja por la jerarquía se produce la desagrupación de los valores. Cuando se realiza un roll-up, se debe calcular una nueva medida en función del conjunto de los valores de las medidas que se agrupan. 2) De selección y visualización (slice & dice). No se ha encontrado un consenso en la definición de slice & dice, sin embargo se acepta en general 40

43 que hay tres operaciones asociadas a slice & dice. Uno, la operación slice selecciona y proyecta en una dimensión del cubo de datos; dos, la operación dice realiza una selección en más de una dimensión que consiste en un corte bidimensional en un cubo multidimensional; y tres, la operación pivoting, que básicamente lo que realiza es reorientar la vista multidimensional de los datos. Las operaciones roll-up y drill-down, permiten al usuario obtener un nivel más detallado o más generalizado, definiendo así niveles de granularidad o agrupación de la misma [9]. La elección de una herramienta OLAP que permita realizar éstos análisis de la información será fundamental para que el soporte a la toma de decisiones sea el más adecuado posible. Sin embargo existen métodos para saber si una herramienta es o no OLAP, que son las reglas de Codd. Dichas reglas quedan definidas como FASMI que se refieren a cinco palabras; Fast Analysis of Shared Multidimensional Information (Análisis rápido de información multidimensional compartida), que además, son en sí mismas una definición de lo que es OLAP. 1) FAST. La primera regla de Codd se refiere a que el sistema debe ser capaz de responder de una forma rápida y ágil a la información que le sea solicitada por el usuario, el cuál no deberá esperar mucho tiempo (cinco segundos) a la hora de resolver peticiones sencillas y no más de veinte segundos en las peticiones complejas. Las herramientas deben proveer una amplia variedad de técnicas para cumplir ésta regla, tales como almacenamiento especializado de datos, pre cálculos, por mencionar algunos. 2) ANALYSIS. Esto significa, que el sistema debe poder reflejar cualquier lógica del negocio para poder responder a las preguntas específicas y necesidades de la empresa. Por ejemplo, deberá permitir generar cálculos ad-hoc sin necesidad de usar una herramienta de programación específica, esto no implica que forzosamente deba proveer la herramienta un entorno 41

44 para conseguirlo, sino que puede proveer la integración con productos externos. 3) SHARED. Esto se refiere, a que el sistema deberá proporcionar herramientas que garanticen la confiabilidad de los datos. Por ejemplo, seguridad de acceso por perfiles de los usuarios. 4) MULTIDIMENSIONAL. Este es el punto más importante que podría definir como OLAP en sí mismo. La herramienta deberá proporcionar soporte a cada una de las múltiples jerarquías que pudieran existir dentro de la organización. 5) INFORMATION. Son todos los datos e información derivado de éste proceso de análisis, la cual nos permitirá la toma de decisiones en la organización. OLAP es una opción de análisis y de reporte. Es un componente importante del bloque de acceso y uso de la arquitectura de referencia del data warehouse. Los componentes de la tecnología OLAP se capturan en sub-bloques de los bloques de acceso y uso. El componente OLAP del sub-bloque de análisis y reporte representa las opciones de análisis y reporte de los servicios OLAP requeridos, mientras que la transformación a la estructura multidimensional, así como el acceso a los componentes data warehouse y de los data marts, son parte del sub-bloque de acceso y recuperación Capacidades de la técnica OLAP Son varias capacidades las que ofrece la técnica OLAP. Algunas de ellas, se mencionan a continuación: Permite a gerentes y analistas examinar y manipular interactivamente grandes cantidades de datos consolidados y detallados desde muchas perspectivas. 42

45 OLAP comprende el análisis de relaciones entre miles e incluso millones de datos almacenados, en bases de datos multidimensionales para descubrir patrones tendencias y condiciones de excepción. OLAP suministra respuestas rápidas a consultas complejas. Una sesión OLAP, ocurre en línea y en tiempo real, con respuestas rápidas a las consultas. Permite manipular requerimientos analíticos. 43

46 2.4 Técnicas de modelados de datos En la estructura de base de datos el modelado de datos es parte fundamental. El modelo de datos es una colección de herramientas conceptuales para describir los datos, las relaciones de los datos, la semántica de los datos y las ligaduras de integridad referencial [15]. Existen dos técnicas de modelado de datos que son relevantes en un ambiente de data warehouse estas son: el modelado Entidad-Relación (ER) y el modelado dimensional. Ambas técnicas de modelado, Entidad-Relación y Dimensional, pueden ser usadas para crear un modelo abstracto de un tema específico. Sin embargo, cada una tiene sus propias limitaciones en cuanto a conceptos de modelado y convenciones de notación asociadas. En consecuencia, las técnicas parecen y son, realmente diferentes en términos de la representación semántica utilizada. Para efectos del trabajo desarrollado, se dará una explicación básica del modelado ER y en mayor detalle el modelado dimensional en las siguientes secciones Modelo Entidad / Relación El modelado de datos ER se basa en una percepción del mundo real formado por una colección de objetos básicos, estos objetos se llaman entidades, y de relaciones entre estos objetos [15]. Así, el modelado ER genera un modelo de datos del área específica de interés, utilizando: entidades y las relaciones entre estas entidades. Los modelos ER detallados contienen atributos, los cuales pueden ser propiedades de ambos, de las entidades o bien de las relaciones. El modelado ER es una herramienta de abstracción dado que es utilizada para entender y simplificar las relaciones ambiguas de datos en el mundo de los negocios y ambientes de sistemas complejos. 44

47 2.4.2 Modelo Dimensional Tanto para la eficiencia operativa como para la planeación a futuro, se deben analizar muchos datos de la organización que se encuentran interrelacionados. Esta necesidad de las organizaciones se aborda mediante el procesamiento analítico. En éste, el enfoque está en el análisis de los datos, específicamente en el análisis dimensional. El Modelo Dimensional es el reflejo directo de la manera en que son visualizados los procesos del negocio. Captura las medidas de importancia de un negocio y los parámetros por los cuales éstas medidas son explotadas [CA98]. El modelado dimensional (Dimensional Modeling, DM) es una técnica de diseño que provee una forma de representar los datos en una forma estándar para conseguir un alto rendimiento. El modelado dimensional es muy útil para sumarizar y organizar los datos y vistas, presentadas en información para soportar el análisis de la misma. En un almacén multidimensional, la información se presenta como matrices multidimensionales, cuadros de múltiples entradas o funciones de varias variables sobre conjuntos finitos. El modelado dimensional permite visualizar los datos en forma de cubo tridimensional o con más dimensiones; para éste caso se le llama hipercubo. El cubo multidimensional, es una estructura que permite realizar diferentes y posibles combinaciones para visualizar los resultados de una organización hasta un determinado grado de detalle, ésta estructura es independiente al sistema operacional o transaccional de la organización, y facilita consultar información histórica de manera rápida y eficiente; ofreciendo la posibilidad de navegar y analizar los datos requeridos. Cada celda del cubo contiene un valor o medición para una combinación particular. El esquema de un cubo queda determinado dando a conocer sus ejes con sus respectivas estructuras, y la estructura de los datos que se presentan en cada celda de la matriz. Se asume que los datos en todas las celdas son uniformes, es decir, todas la posiciones de la matriz tienen datos con igual estructura. la figura 2.2 muestra un cubo con tres dimensiones, 45

48 producto, lugar y período, donde cada celda pudiera contener información para una combinación dada las tres dimensiones. Figura 2.2 Ejemplo de un cubo con tres dimensiones. 46

49 Una instancia de un cubo, queda determinada por un conjunto de datos para cada eje y un conjunto de datos para la matriz. A los ejes se les llama dimensiones y al dato que se presenta en la matriz, se le llama medida. El modelado dimensional es una técnica de diseño lógica usada en los data warehouse, la cual es una alternativa al modelado entidad-relación. Un modelo dimensional contiene la misma información que un modelo entidad-relación pero almacena la información en una estrella asimétrica la cual es una estructura optimizada para el diseño de diferentes propósitos: Entender al usuario, funcionamiento de consultas, resistencia al cambio. Un modelo dimensional está compuesto por una tabla con múltiples llaves. la tabla de hechos y un conjunto de tablas más pequeñas, las tablas de dimensiones. Cada tabla de dimensión está conectada a la tabla de hechos por una llave primaria la cual corresponde a uno de los componentes de la llave compuesta. La tabla de hechos contiene las medidas del negocio o los hechos. La actividad del modelado dimensional inicia con la definición Ralph Kimball propone los pasos que a continuación se enumeran para diseñar un modelo dimensional: 1) Definir el proceso a modelar. Se refiere a que se debe modelar la actividad natural a la cual está dedicada la organización. Típicamente está soportado por los sistemas transaccionales. Ejemplo de esto suponiendo que fuera una cadena de supermercados inventarios, ventas, promociones entre otros, asi como el movimiento diario de productos. 2) Definir la granularidad. La granularidad especifica exactamente el nivel de detalle con el cual los datos serán almacenados en la tabla de hechos. Típicamente la granularidad son transacciones individuales y generalmente en un data warehouse, los datos se expresan con el más bajo grado de granularidad de las dimensiones. En los data warehouse es posible manejar diversos niveles de granularidad, a menor granularidad, mayor cantidad de detalle. Para aumentar la granularidad, los datos operacionales deben 47

50 resumirse y acumularse, entre mayor sea la granularidad, mas procesamiento se tendrá para convertir y resumir los datos desde las fuentes, pero, al mismo tiempo, menor será el volumen de almacenamiento y mayor la facilidad de las consultas. Algunos datos se pueden almacenar como agregados, esto implica un especial cuidado al momento de las actualizaciones, para que estos datos agregados también sean actualizados. Ejemplos comunes de granularidad son operaciones diarias de la venta de cierto producto al final del día, en un lugar determinado, o las operaciones de ventas mensuales del producto. 3) Identificar las dimensiones. Son los objetos del negocio, con los cuales se puede analizar la tendencia y el comportamiento del negocio. La definición de estas dimensiones, se basan en políticas de la compañía o del mercado, es decir como interpretan o clasifican su información para segmentar el análisis en sectores que por sus características comunes facilitan la observación y el análisis. 4) Definir el hecho. Son características cualitativas o cuantitativas, de los objetos que se desean analizar en las empresas. Las medidas cuantitativas están dadas por valores o cifras porcentuales. Por ejemplo, se tienen las ventas en dólares, el número de unidades de inventario, las horas trabajadas, el promedio de piezas producidas, el porcentaje de aceptación de un producto, el consumo de combustible de un vehículo y etc. El modelado dimensional posee tres conceptos básicos: hechos, dimensiones y atributos [9]. Hechos, dimensiones, Atributos En el modelado dimensional, cada modelado está compuesto de una tabla con una clave primaria compuesta, denominada tabla de hechos, y un conjunto de tablas más pequeñas denominadas tabla de dimensiones. Cada una de las tablas 48

51 de dimensión tiene una clave primaria que corresponde exactamente con uno de los componentes de la clave compuesta de la tabla de hechos. Ésta estructura se asemeja a una estrella, que se pudiera decir que es una gran tabla central o tabla de hechos conectada con un conjunto de tablas menores dispuestas de manera radial alrededor de ésta tabla central. Generalmente recibe el nombre de "star-join O modelado estrella [9]. En la figura 2.3 se muestra un ejemplo del modelo estrella, donde las dimensiones son tiempo, localización y producto, y la tabla de hechos es ventas. El modelado estrella es altamente desnormalizado, todo lo contrario en un modelo relacional de bases de datos operacionales, con la desnormalización se logra minimizar el números de uniones (join) y, por consiguiente, incrementar el rendimiento de las consultas (una tabla de hechos está relacionada con numerosas tablas de dimensiones). Como se ha mencionado anteriormente los componentes básicos del modelo dimensional son hechos, dimensiones y atributos. Cada uno de ellos se definen a continuación: a) Hechos. El hecho es la información que es objeto de análisis, una medición númerica de interés. Por lo general los hechos son típicamente numéricos, sin embargo existen algunos casos que pueden ser de tipo texto. Un ejemplo de hecho, seria el número de unidades de un producto vendidas en el día en una determinada tienda. La tabla de hechos, es la tabla básica donde se registran medidas de rendimiento de la empresa [9], es decir, que contienen datos sobre las actividades básicas de la organización. El hecho tiene las propiedades de la aditividad (hechos que se pueden sumar en cualquier dimensión o combinación de ellas), la semiaditividad (solo se suman en algunas dimensiones) y la no aditividad (solo se pueden sumar en algunas dimensiones). En la tabla de hechos mostrada en el modelo estrella de la figura 2.3 el valor de las ventas y el 49

52 número de unidades vendidas son propiedades de aditividad, por el hecho de poder sumarse con cualquier combinación de las dimensiones tiempo, localización o producto. Un hecho semiaditivo pudiera ser el nivel de inventario, ya que únicamente sobre la dimensión tiempo no puede sumarse. Los indicadores más útiles en una tabla de hechos son numéricos y aditivos, ya que la aditividad representa un factor sumamente importante, porque en las aplicaciones de los data warehouse casi nunca se recupera un solo registro de la tabla de hechos, sino todo lo contrario ya que acceden a cientos, miles o incluso millones de registros a la vez y, por tanto, lo único eficaz que se puede hacer en ellos es sumarlos. b) Dimensiones. Las dimensiones describen los objetos relevantes para la organización y son clases descriptores de los hechos. Los atributos de las dimensiones se emplean como fuente de las restricciones en las consultas al data warehouse. Los atributos de la dimensión son almacenados en una tabla de dimensiones y cada columna representa un nivel particular en una jerarquía. En un esquema estrella todas las columnas están en la misma tabla mientras en un esquema copo de nieve (snowflake) las columnas están en tablas separadas por cada nivel. El concepto dimensión es fundamental para un modelo multidimensional. Una de las dimensiones mas comunes en cualquier modelado multidimensional es el tiempo, por lo que en raras ocasiones ésta dimensión no sea incluida en el modelado. Los datos de las tablas de dimensiones son generalmente de tipo alfanumérico. 50

53 Jerarquías de las dimensiones Las jerarquías son una manera para organizar los datos de acuerdo a los niveles. Las dimensiones están estructuradas jerárquicamente y así los datos de los diferentes niveles de agrupación se pueden manipular juntos de manera eficiente para su análisis y visualización. Las jerarquías en las dimensiones permiten a los usuarios reconocer tendencias en un nivel de agrupación, explorar a un nivel más bajo para identificar las razones de estas tendencias, y subir a un nivel más alto para ver qué efectos esas tendencias tienen en un amplio sector del negocio. A cada nivel de una jerarquía se le llama nivel de agrupación o simplemente nivel. De ésta forma se puede considerar que toda dimensión siempre tiene por lo menos una jerarquía con un único nivel. Cada uno de los niveles representa una posición en la jerarquía, los niveles agrupan los datos y son usados internamente para realizar cálculos. Por ejemplo, la dimensión tiempo puede tener día, semana, trimestre y año para los niveles de la jerarquía. Sí los datos del hecho ventas son almacenado en días, entonces el nivel mas alto de la dimensión tiempo permite que los datos de las ventas sean agrupados correctamente dentro de semana, trimestre y año. Día se agrupa en semana, semana se agrupa en trimestre y trimestre se agrupa en años. Los atributos de las jerarquías en los diferentes niveles tienen una relación de uno a muchos (1:N), es decir de padres e hijos. Por ejemplo, el semestre 1 y el semestre 2 son hijos del año, y así el año es padre del semestre 1 y semestre 2 En la figura 2.3 se muestra un ejemplo de jerarquía para la dimensión tiempo. Una dimensión puede tener más de una jerarquía. Un ejemplo típico, es la dimensión tiempo. En el ejemplo que se muestra en la figura 2.4 los niveles bimestre y trimestre no están relacionados entre sí, a pesar de que ambos están relacionados con mes y año. 51

54 Figura 2.3 Ejemplo de dimensión tiempo 52

55 Si existe más de una jerarquía, la relación que une datos de un nivel con datos de otro nivel superior debe ser confluente. Esto significa que todos los caminos que parten de un elemento e del nivel E, llegan al mismo elemento d del nivel D superior a E, independientemente de la jerarquía recorrida. Figura 2.4 Dimensión tiempo con jerarquías alternativas Si no se cumpliera la confluencia, entonces el primer trimestre que figura relacionado con el año 1998, podría aparecer relacionado, por ejemplo, con En éste caso, al recorrer la jerarquía por trimestre, el mes de marzo de 1998 aparecería en El nivel de los atributos facilita información suplementaria acerca de los atributos de la dimensión de un nivel en particular de la dimensión jerarquía. Los atributos de la dimensión por sí mismos no adquieren ningún sentido; por ejemplo el valor "1296" para el período tiempo. 53

56 Esos valores secretos de los atributos son usados internamente para seleccionar y ordenar rápidamente, para darle un sentido de información al usuario. 54

57 Capítulo 3 Diseño e implementación 3.1 Modelo dimensional del data warehouse La metodología propuesta por Ralph Kimball [9] se utilizó como base para el diseño del modelado dimensional del data warehouse: 1) Definición del proceso a modelar. El primer paso consiste en definir las fuentes de datos de donde se van a obtener los datos que formarán parte del data warehouse. Se cuenta con los datos sobre captura por especie o por grupo de ellas y por lugar, registrados de 1998 a 2008, en avisos de arribo de embarcaciones menores facilitados por la Comisión Nacional de Acuacultura y Pesca (conapesca). 2) Definición de la granularidad. Se desea almacenar información sobre el volumen de la captura de una pesquería, en una zona específica, con una embarcación determinada, en un tiempo dado. 3) Selección de las dimensiones. El tercer paso consiste en identificar las dimensiones que caracterizan el proceso, las cuales se derivan del paso anterior. Las dimensiones identificadas son: Ubicación. Los atributos para esta dimensión son municipio, zona del mar, tipo de lugar, área de manejo y lugar de captura. En la figura 3.1 se puede apreciar la jerarquía para la dimensión Ubicación. Esta jerarquía permite que la dimensión ubicación se pueda explorar por diversos caminos. 55

58 Figura 3.1 Jerarquía para la dimensión ubicación Especie. Esta dimensión proporciona los datos de las especies que son capturadas y reportadas en los avisos de arribo. Los atributos para esta dimensión son: familia y especie. En la figura 3.2 se puede apreciar la jerarquía para la dimensión especie. 56

59 Figura 3.2 Jerarquía para la dimensión especie Embarcación. Esta dimensión contiene atributos relacionados con los datos de las diferentes embarcaciones que participan en la captura de especies. Los atributos de la dimensión son: número de embarcaciones, tipo_titular y RNP. En la figura 3.3 se puede apreciar la jerarquía para la dimensión embarcación. Figura 3.3 Jerarquía para la dimensión especie 57

60 Tiempo. Los atributos para esta dimensión son id_tiempo, estación, año y mes. Esta dimensión proporciona información de las temporadas de capturas de especies. En la figura 3.4 se puede apreciar la jerarquía para la dimensión tiempo. Figura 3.4 Jerarquía para la dimensión tiempo 4) Definir los hechos. En el último paso se debe decidir la información a almacenar sobre el proceso, es decir, se deben seleccionar los hechos (información sobre la actividad) que se desea almacenar en cada registro de la tabla de hechos y que será el objeto del análisis. En éste caso, la tabla de hechos contendrá las llaves primarias de cada una de las dimensiones. Además de contener cuatro variables de medición, que son: Contador registra el total de elementos que se están evaluando, el peso de las especies capturadas de cada aviso de arribo se almacena en la variable 58

61 Peso, también se almacenan el valor en costo y el esfuerzo requerido para la captura en las variables Valor y Esfuerzo. Figura 3.5 Diagrama estrella del data warehouse. En la mayoría de los data warehouse se utiliza el esquema estrella para representar el modelo multidimensional de datos [5][13]. En la figura 3.5 se puede observar el esquema estrella del data warehouse. En el esquema están definidas las tablas que forman el data warehouse y los atributos de cada una de ellas. En total son cinco tablas. La tabla de hechos se denomina Aviso de Arribos. Las otras cuatro son las tablas de dimensiones y se denominan Ubicación, Especie, Embarcación y Tiempo. 59

62 3.2 Esquema de integración Después de tener definido el modelo dimensional del data warehouse, es necesario aplicar las herramientas ETL, las cuales permiten incorporar los datos en el data warehouse que cumplan con las especificaciones del modelo dimensional. El primer paso consiste en extraer la información de las fuentes. La información de los avisos de arribo se encuentra almacenada en un sistema de tipo OLTP denominado SIMAVI (Sistema automatizado para el manejo de avisos de arribo). A partir de este sistema es de donde se obtiene la información para empezar a construir el data warehouse. Al realizar la extracción de la información de las tablas del sistema se construyó una tabla temporal en donde se almacenaron los campos extraídos. El siguiente paso después de analizar la información obtenida de la etapa de extracción fue necesario realizar algunas transformaciones antes de incorporar información a cada una de las dimensiones del data warehouse. Algunas de las transformaciones que fueron necesarias son las siguientes: 1) En la tabla de hechos se requiere la medición Esfuerzo, por lo tanto es necesario crear el atributo tomando como base el siguiente cálculo: peso / (número de embarcaciones * frecuencia). 2) En la tabla de hechos se requiere la medición Contador, por lo tanto se agregó el atributo con un valor de uno para todas sus mediciones. 3) Para la dimensión tiempo se requiere el atributo estación, el cual es necesario calcular a partir del atributo mes. El último paso consiste en alimentar cada una de las dimensiones del data warehouse con los datos transformados. 60

63 Capítulo 4 Resultados 4.1 Comportamiento histórico de la pesquería de escama en bahía El modelo dimensional creado, permite la visualización de la información de varias dimensiones, apoyando de esta manera el proceso de toma de decisiones. La herramienta desarrollada proporciona acceso a los datos de los avisos de arribos de las embarcaciones de pesca ribereña en el estado de Baja California Sur. Estos datos se pueden combinar y dividir en cualquier forma posible de acuerdo a las dimensiones del modelo, y facilitar el monitoreo de la pesca ribereña. A continuación se presentan algunos de los resultados obtenidos. En la figura 4.1 se puede observar el comportamiento histórico de la pesquería de escama en las bahías de la costa oeste de Baja California Sur en la zona que comprende desde Bahía Magdalena hasta Bahía Almejas. Esta gráfica pone en evidencia que las bahías de Magdalena, Puerto Chale y Las Almejas, son las bahías con mayor volumen de captura de escama. 61

64 Figura 4.1 Comportamiento histórico de la pesquería de escama en bahía. 62

65 4.2 Comportamiento histórico de la captura en bahía por pesquería En la figura 4.2 se puede observar el comportamiento histórico de la captura de camarón, escama y tiburón en bahía. En esta gráfica se pone en evidencia que el volumen de captura de escama ocupa el primer lugar Figura 4.2 Comportamiento histórico de la captura en bahía por pesquería. 63

66 4.3 Comportamiento histórico de la captura en bahía por pesquería En la figura 4.3 se puede observar el comportamiento histórico de la pesca ribereña de camarón en los esteros de la zona de Bahía Magdalena a Bahía Almejas. En esta gráfica se muestra el comportamiento del volumen de captura por año, y se puede apreciar que los años 1998, 2001 y 2002 son los que acumularon los volúmenes de captura mayores. Figura 4.3 Comportamiento histórico de la captura de camarón en esteros. 64

67 4.4 Comportamiento histórico de la captura de camarón en esteros con total de volumen por estero En la figura 4.4 se muestra el acumulado del volumen de captura por esteros, en donde se puede apreciar que el estero La Herradura de 1998 a 2008 tiene un volumen acumulado de 155,292, el estero Las Vacas un total de 146,265 y el estero San Vicente un total de 67,413. Figura 4.4 Comportamiento histórico de la captura de camarón en esteros con total de volumen por estero. 65

68 4.5 Comportamiento por temporada de la captura de camarón, escama y tiburón En la figura 4.5 se muestra el comportamiento del volumen de captura de la pesquería de camarón, escama y tiburón. En esta gráfica se puede apreciar que el volumen de captura de escama y tiburón es mayor durante el verano, mientras que la captura de camarón es mayor durante el otoño. También se puede apreciar que de las tres pesquerías la escama es la de mayor volumen de captura. Figura 4.5 Comportamiento por temporada de la captura de camarón, escama y tiburón. 66

Definición. Data Warehousing: almacenamiento, transformación y distribución de datos útiles para los responsables de tomar decisiones 9/29/2006 4

Definición. Data Warehousing: almacenamiento, transformación y distribución de datos útiles para los responsables de tomar decisiones 9/29/2006 4 Definición Data Warehousing: almacenamiento, transformación y distribución de datos útiles para los responsables de tomar decisiones 9/29/2006 4 Definición (cont.) Un Data Warehouse es una colección de

Más detalles

Oracle vs Oracle por Rodolfo Yglesias Setiembre 2008

Oracle vs Oracle por Rodolfo Yglesias Setiembre 2008 Oracle vs Oracle por Rodolfo Yglesias Setiembre 2008 Introducción Aunque la estrategia de adquisiciones que Oracle ha seguido en los últimos años siempre ha buscado complementar y fortalecer nuestra oferta

Más detalles

Día 5-6-2012 17:00h Lugar: Obra Social Ibercaja, Sala De actos, Rambla Ferran 38, 3º, Lleida

Día 5-6-2012 17:00h Lugar: Obra Social Ibercaja, Sala De actos, Rambla Ferran 38, 3º, Lleida Resumen de la conferencia Día 5-6-2012 17:00h Lugar: Obra Social Ibercaja, Sala De actos, Rambla Ferran 38, 3º, Lleida Ponente: Luis Muñiz Socio Director de Sisconges & Estrategia y experto en Sistemas

Más detalles

"Diseño, construcción e implementación de modelos matemáticos para el control automatizado de inventarios

Diseño, construcción e implementación de modelos matemáticos para el control automatizado de inventarios "Diseño, construcción e implementación de modelos matemáticos para el control automatizado de inventarios Miguel Alfonso Flores Sánchez 1, Fernando Sandoya Sanchez 2 Resumen En el presente artículo se

Más detalles

MOLAP REALIZADO POR: JOSE E. TABOADA RENNA

MOLAP REALIZADO POR: JOSE E. TABOADA RENNA MOLAP REALIZADO POR: JOSE E. TABOADA RENNA BASE DE DATOS Conjunto de datos estructurados, fiables y homogéneos organizados independientemente en máquina, m accesibles en tiempo real, compatible por usuarios

Más detalles

Capítulo 5. Cliente-Servidor.

Capítulo 5. Cliente-Servidor. Capítulo 5. Cliente-Servidor. 5.1 Introducción En este capítulo hablaremos acerca de la arquitectura Cliente-Servidor, ya que para nuestra aplicación utilizamos ésta arquitectura al convertir en un servidor

Más detalles

La toma de decisiones está presente dentro de la vida de la mayoría de las personas. Los

La toma de decisiones está presente dentro de la vida de la mayoría de las personas. Los ANEXO II. Sistema de Soporte a las Decisiones-SSD La toma de decisiones está presente dentro de la vida de la mayoría de las personas. Los gerentes día a día deben tomar decisiones también, la diferencia

Más detalles

LOS CINCO GRADOS DE MADUREZ DE UN PROYECTO BI

LOS CINCO GRADOS DE MADUREZ DE UN PROYECTO BI LOS CINCO GRADOS DE MADUREZ DE UN PROYECTO BI INTRODUCCIÓN Se habla en multitud de ocasiones de Business Intelligence, pero qué es realmente? Estoy implementando en mi organización procesos de Business

Más detalles

Los mayores cambios se dieron en las décadas de los setenta, atribuidos principalmente a dos causas:

Los mayores cambios se dieron en las décadas de los setenta, atribuidos principalmente a dos causas: SISTEMAS DISTRIBUIDOS DE REDES 1. SISTEMAS DISTRIBUIDOS Introducción y generalidades La computación desde sus inicios ha sufrido muchos cambios, desde los grandes equipos que permitían realizar tareas

Más detalles

ANEXO A - Plan de Proyecto. 1. - EDT de la solución EDT GENERAL DEL PROYECTO1

ANEXO A - Plan de Proyecto. 1. - EDT de la solución EDT GENERAL DEL PROYECTO1 ANEXO A - Plan de Proyecto 1. - EDT de la solución EDT GENERAL DEL PROYECTO1 2.- Diagrama de Gantt de la Solución DIAGRAMA DE GANTT- FASE INICIAL DOCUMENTACION Y ANALISIS2 DIAGRAMA DE GANTT- FASE FINAL

Más detalles

Capítulo 2 Tecnología data warehouse

Capítulo 2 Tecnología data warehouse Capítulo 2 Tecnología data warehouse El objetivo de éste capítulo es mostrar la tecnología data warehouse (DW) como una herramienta para analizar la información. Este capítulo se encuentra organizado de

Más detalles

Elementos requeridos para crearlos (ejemplo: el compilador)

Elementos requeridos para crearlos (ejemplo: el compilador) Generalidades A lo largo del ciclo de vida del proceso de software, los productos de software evolucionan. Desde la concepción del producto y la captura de requisitos inicial hasta la puesta en producción

Más detalles

Resumen General del Manual de Organización y Funciones

Resumen General del Manual de Organización y Funciones Gerencia de Tecnologías de Información Resumen General del Manual de Organización y Funciones (El Manual de Organización y Funciones fue aprobado por Resolución Administrativa SBS N 354-2011, del 17 de

Más detalles

UNIVERSIDAD DE SANTIAGO DE CHILE INGENIERIA COMERCIAL APLICACIÓN COMPUTACIONAL I INTELIGENCIA DE NEGOCIOS

UNIVERSIDAD DE SANTIAGO DE CHILE INGENIERIA COMERCIAL APLICACIÓN COMPUTACIONAL I INTELIGENCIA DE NEGOCIOS UNIVERSIDAD DE SANTIAGO DE CHILE INGENIERIA COMERCIAL APLICACIÓN COMPUTACIONAL I INTELIGENCIA DE NEGOCIOS Integrante: Profesor: Maximiliano Heise Luis Ríos Fecha de entrega: miércoles 18 de abril de 2012

Más detalles

Desarrollo de la estrategia a seguir para. un Sistema de Gestión de la Energía. Instalaciones Industriales

Desarrollo de la estrategia a seguir para. un Sistema de Gestión de la Energía. Instalaciones Industriales Desarrollo de la estrategia a seguir para un Sistema de Gestión de la Energía Instalaciones Industriales Noviembre 2014 Contenido 1. Introducción 2. Antecedentes 3. Potencial de mejora energética de los

Más detalles

Unidad 1. Fundamentos en Gestión de Riesgos

Unidad 1. Fundamentos en Gestión de Riesgos 1.1 Gestión de Proyectos Unidad 1. Fundamentos en Gestión de Riesgos La gestión de proyectos es una disciplina con la cual se integran los procesos propios de la gerencia o administración de proyectos.

Más detalles

Estos documentos estarán dirigidos a todas las personas que pertenezcan a equipos de implementación de Oracle BI, incluyendo a:

Estos documentos estarán dirigidos a todas las personas que pertenezcan a equipos de implementación de Oracle BI, incluyendo a: Oracle Business Intelligence Enterprise Edition 11g. A lo largo de los siguientes documentos trataré de brindar a los interesados un nivel de habilidades básicas requeridas para implementar efectivamente

Más detalles

Introducción En los años 60 s y 70 s cuando se comenzaron a utilizar recursos de tecnología de información, no existía la computación personal, sino que en grandes centros de cómputo se realizaban todas

Más detalles

PRUEBAS DE SOFTWARE TECNICAS DE PRUEBA DE SOFTWARE

PRUEBAS DE SOFTWARE TECNICAS DE PRUEBA DE SOFTWARE PRUEBAS DE SOFTWARE La prueba del software es un elemento crítico para la garantía de la calidad del software. El objetivo de la etapa de pruebas es garantizar la calidad del producto desarrollado. Además,

Más detalles

NORMA INTERNACIONAL DE AUDITORÍA 520

NORMA INTERNACIONAL DE AUDITORÍA 520 NORMA INTERNACIONAL DE AUDITORÍA 520 PROCEDIMIENTOS ANALíTICOS (En vigor para auditorías de estados financieros por periodos que comiencen en, o después del, 15 de diciembre de 2004)* CONTENIDO Párrafo

Más detalles

Sistemas de Información Geográficos (SIG o GIS)

Sistemas de Información Geográficos (SIG o GIS) Sistemas de Información Geográficos (SIG o GIS) 1) Qué es un SIG GIS? 2) Para qué sirven? 3) Tipos de datos 4) Cómo trabaja? 5) Modelos de datos, Diseño Conceptual 6) GeoDataase (GD) 7) Cómo evaluamos

Más detalles

Mejores prácticas para el éxito de un sistema de información. Uno de los problemas de información dentro de las empresas es contar con datos

Mejores prácticas para el éxito de un sistema de información. Uno de los problemas de información dentro de las empresas es contar con datos ANEXO VI. Mejores prácticas para el éxito de un sistema de información Uno de los problemas de información dentro de las empresas es contar con datos importantes del negocio y que éstos estén aislados

Más detalles

REGISTRO DE EMPRESAS Y PERSONAS BASE DE INFORMACIÓN DE CLIENTES & CONTACTOS

REGISTRO DE EMPRESAS Y PERSONAS BASE DE INFORMACIÓN DE CLIENTES & CONTACTOS REGISTRO DE EMPRESAS Y PERSONAS BASE DE INFORMACIÓN DE CLIENTES & CONTACTOS La gestión del asesor comercial se basa en mantener contacto personalizado con un grupo de clientes empresariales o personales.

Más detalles

Microsoft SQL Server Conceptos.

Microsoft SQL Server Conceptos. Microsoft Conceptos. Microsoft 2005 es una plataforma de base de datos a gran escala de procesamiento de transacciones en línea (OLTP) y de procesamiento analítico en línea (OLAP). La siguiente tabla muestra

Más detalles

Construcción de cubos OLAP utilizando Business Intelligence Development Studio

Construcción de cubos OLAP utilizando Business Intelligence Development Studio Universidad Católica de Santa María Facultad de Ciencias e Ingenierías Físicas y Formales Informe de Trabajo Construcción de cubos OLAP utilizando Business Intelligence Development Studio Alumnos: Solange

Más detalles

http://www.nicasoft.com.ni

http://www.nicasoft.com.ni BSC-RH es un sistema automatizado de planificación estratégica y gestión, utilizado en empresas para direccionar las actividades del negocio a la visión y estrategia de la organización. Mejora la comunicación

Más detalles

Introducción. Ciclo de vida de los Sistemas de Información. Diseño Conceptual

Introducción. Ciclo de vida de los Sistemas de Información. Diseño Conceptual Introducción Algunas de las personas que trabajan con SGBD relacionales parecen preguntarse porqué deberían preocuparse del diseño de las bases de datos que utilizan. Después de todo, la mayoría de los

Más detalles

DATA WAREHOUSING (ENERO DE 2003) Documento creado por Ing. Héctor H. Martínez Orpinel

DATA WAREHOUSING (ENERO DE 2003) Documento creado por Ing. Héctor H. Martínez Orpinel DATA WAREHOUSING (ENERO DE 2003) DEFINICIÓN UN DATA WAREHOUSING ES UN CONJUNTO DE DATOS INTEGRADOS ORIENTADOS A UNA MATERIA, QUE VARIA CON EL TIEMPO Y QUE NO SON TRANSITORIOS, LOS CUALES SOPORTAN EL PROCESO

Más detalles

2.1 Clasificación de los sistemas de Producción.

2.1 Clasificación de los sistemas de Producción. ADMINISTRACION DE OPERACIONES Sesión 2: La Administración de operaciones II Objetivo específico 1: El alumno conocerá la clasificación de los sistemas de producción, los sistemas avanzados de manufactura

Más detalles

Multipedidos es un sistema de ventas on-line que permite gestionar pedidos por internet en tiempo real de manera económica, simple y eficaz.

Multipedidos es un sistema de ventas on-line que permite gestionar pedidos por internet en tiempo real de manera económica, simple y eficaz. Presentación Multipedidos es un sistema de ventas on-line que permite gestionar pedidos por internet en tiempo real de manera económica, simple y eficaz. El sistema está pensado para empresas que deseen

Más detalles

3. GESTIÓN DE CONFIGURACIÓN DE SOFTWARE

3. GESTIÓN DE CONFIGURACIÓN DE SOFTWARE 3. GESTIÓN DE CONFIGURACIÓN DE SOFTWARE Software Configuration Management (SCM) es una disciplina de la Ingeniería de Software que se preocupa de [Ber92] [Ber84] [Bou98] [Mik97]: Identificar y documentar

Más detalles

Sistemas de Información 12/13 La organización de datos e información

Sistemas de Información 12/13 La organización de datos e información 12/13 La organización de datos e información Departamento Informática e Ingeniería de Sistemas Universidad de Zaragoza (raqueltl@unizar.es) " Guión Introducción: Data Warehouses Características: entornos

Más detalles

Actividades para mejoras. Actividades donde se evalúa constantemente todo el proceso del proyecto para evitar errores y eficientar los procesos.

Actividades para mejoras. Actividades donde se evalúa constantemente todo el proceso del proyecto para evitar errores y eficientar los procesos. Apéndice C. Glosario A Actividades de coordinación entre grupos. Son dinámicas y canales de comunicación cuyo objetivo es facilitar el trabajo entre los distintos equipos del proyecto. Actividades integradas

Más detalles

SISTEMAS DE INFORMACION ESTRATEGICOS

SISTEMAS DE INFORMACION ESTRATEGICOS SISTEMAS DE INFORMACION ESTRATEGICOS DEFINICION Son el uso de la tecnología de la información para soportar o dar forma a la estrategia competitiva de la organización, a su plan para incrementar o mantener

Más detalles

Parte I: Introducción

Parte I: Introducción Parte I: Introducción Introducción al Data Mining: su Aplicación a la Empresa Cursada 2007 POR QUÉ? Las empresas de todos los tamaños necesitan aprender de sus datos para crear una relación one-to-one

Más detalles

Portafolio de Servicios y Productos

Portafolio de Servicios y Productos Portafolio de Servicios y Productos Introducción Somos una empresa que se dedica a generar ventajas competitivas para nuestros clientes a través de desarrollos y consultoría en inteligencia de negocios

Más detalles

SISTEMAS DE INFORMACIÓN II TEORÍA

SISTEMAS DE INFORMACIÓN II TEORÍA CONTENIDO: EL PROCESO DE DISEÑO DE SISTEMAS DISTRIBUIDOS MANEJANDO LOS DATOS EN LOS SISTEMAS DISTRIBUIDOS DISEÑANDO SISTEMAS PARA REDES DE ÁREA LOCAL DISEÑANDO SISTEMAS PARA ARQUITECTURAS CLIENTE/SERVIDOR

Más detalles

Administración Logística de Materiales

Administración Logística de Materiales Administración Logística de Materiales Para un mejor conocimiento de la industria acerca de distribución física, manufactura y compras, se estableció el programa de administración logística de materiales.

Más detalles

Estructura de Bases de datos. Leonardo Víquez Acuña

Estructura de Bases de datos. Leonardo Víquez Acuña Estructura de Bases de datos Leonardo Víquez Acuña Lenguajes de Bases de Datos Un sistema de bases de datos proporciona Un lenguaje de definición de datos para especificar el esquema de la base de datos

Más detalles

RESUMEN CUADRO DE MANDO

RESUMEN CUADRO DE MANDO 1. Objetivo Los objetivos que pueden alcanzarse, son: RESUMEN CUADRO DE MANDO Disponer eficientemente de la información indispensable y significativa, de modo sintético, conectada con los objetivos. Facilitar

Más detalles

de la empresa Al finalizar la unidad, el alumno:

de la empresa Al finalizar la unidad, el alumno: de la empresa Al finalizar la unidad, el alumno: Identificará el concepto de rentabilidad. Identificará cómo afecta a una empresa la rentabilidad. Evaluará la rentabilidad de una empresa, mediante la aplicación

Más detalles

ADMINISTRACIÓN DE BASES DE DATOS DISTRIBUIDAS

ADMINISTRACIÓN DE BASES DE DATOS DISTRIBUIDAS 5 ADMINISTRACIÓN DE BASES DE DATOS DISTRIBUIDAS Contenido: 5.1 Conceptos Generales Administración de Bases de Datos Distribuidas 5.1.1 Administración la Estructura de la Base de Datos 5.1.2 Administración

Más detalles

K2BIM Plan de Investigación - Comparación de herramientas para la parametrización asistida de ERP Versión 1.2

K2BIM Plan de Investigación - Comparación de herramientas para la parametrización asistida de ERP Versión 1.2 K2BIM Plan de Investigación - Comparación de herramientas para la parametrización asistida de ERP Versión 1.2 Historia de revisiones Fecha VersiónDescripción Autor 08/10/2009 1.0 Creación del documento.

Más detalles

UNIDAD 2: Abstracción del Mundo real Al Paradigma Orientado a Objetos

UNIDAD 2: Abstracción del Mundo real Al Paradigma Orientado a Objetos 2.1. Principios básicos del Modelado de Objetos UNIDAD 2: Abstracción del Mundo real Al Paradigma Orientado a Objetos Hoy en día muchos de los procesos que intervienen en un negocio o empresa y que resuelven

Más detalles

LINEAMIENTOS ESTÁNDARES APLICATIVOS DE VIRTUALIZACIÓN

LINEAMIENTOS ESTÁNDARES APLICATIVOS DE VIRTUALIZACIÓN LINEAMIENTOS ESTÁNDARES APLICATIVOS DE VIRTUALIZACIÓN Tabla de Contenidos LINEAMIENTOS ESTÁNDARES APLICATIVOS DE VIRTUALIZACIÓN... 1 Tabla de Contenidos... 1 General... 2 Uso de los Lineamientos Estándares...

Más detalles

Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI)

Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI) Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI) OFERTAS TECNOLÓGICAS 1) GESTIÓN ORGANIZACIONAL Y LOGÍSTICA INTEGRADA: TÉCNICAS Y SISTEMAS DE INFORMACIÓN 2) GESTIÓN

Más detalles

1.1.- Objetivos de los sistemas de bases de datos 1.2.- Administración de los datos y administración de bases de datos 1.3.- Niveles de Arquitectura

1.1.- Objetivos de los sistemas de bases de datos 1.2.- Administración de los datos y administración de bases de datos 1.3.- Niveles de Arquitectura 1. Conceptos Generales 2. Modelo Entidad / Relación 3. Modelo Relacional 4. Integridad de datos relacional 5. Diseño de bases de datos relacionales 6. Lenguaje de consulta estructurado (SQL) 1.1.- Objetivos

Más detalles

Utilidades de la base de datos

Utilidades de la base de datos Utilidades de la base de datos Desde esta opcion del menú de Access, podemos realizar las siguientes operaciones: Convertir Base de datos Compactar y reparar base de datos Administrador de tablas vinculadas

Más detalles

Propuesta de Portal de la Red de Laboratorios Virtuales y Remotos de CEA

Propuesta de Portal de la Red de Laboratorios Virtuales y Remotos de CEA Propuesta de Portal de la Red de Laboratorios Virtuales y Remotos de CEA Documento de trabajo elaborado para la Red Temática DocenWeb: Red Temática de Docencia en Control mediante Web (DPI2002-11505-E)

Más detalles

IAP 1009 - TÉCNICAS DE AUDITORÍA APOYADAS EN ORDENADOR (TAAO)

IAP 1009 - TÉCNICAS DE AUDITORÍA APOYADAS EN ORDENADOR (TAAO) IAP 1009 - TÉCNICAS DE AUDITORÍA APOYADAS EN ORDENADOR (TAAO) Introducción 1. Como se indica en la Norma Internacional de Auditoría 401, "Auditoría en un contexto informatizado", los objetivos globales

Más detalles

App para realizar consultas al Sistema de Información Estadística de Castilla y León

App para realizar consultas al Sistema de Información Estadística de Castilla y León App para realizar consultas al Sistema de Información Estadística de Castilla y León Jesús M. Rodríguez Rodríguez rodrodje@jcyl.es Dirección General de Presupuestos y Estadística Consejería de Hacienda

Más detalles

Mineria de datos y su aplicación en web mining data Redes de computadores I ELO 322

Mineria de datos y su aplicación en web mining data Redes de computadores I ELO 322 Mineria de datos y su aplicación en web mining data Redes de computadores I ELO 322 Nicole García Gómez 2830047-6 Diego Riquelme Adriasola 2621044-5 RESUMEN.- La minería de datos corresponde a la extracción

Más detalles

Presentación de Pyramid Data Warehouse

Presentación de Pyramid Data Warehouse Presentación de Pyramid Data Warehouse Pyramid Data Warehouse tiene hoy una larga historia, desde 1994 tiempo en el que su primera versión fue liberada, hasta la actual versión 8.00. El incontable tiempo

Más detalles

GLOSARIO. Arquitectura: Funcionamiento, estructura y diseño de una plataforma de desarrollo.

GLOSARIO. Arquitectura: Funcionamiento, estructura y diseño de una plataforma de desarrollo. GLOSARIO Actor: Un actor es un usuario del sistema. Esto incluye usuarios humanos y otros sistemas computacionales. Un actor usa un Caso de Uso para ejecutar una porción de trabajo de valor para el negocio.

Más detalles

INTELIGENCIA DE NEGOCIOS

INTELIGENCIA DE NEGOCIOS INTELIGENCIA DE NEGOCIOS En tiempos de incertidumbre financiera, la toma de decisiones basada en información es crucial para sobrevivir en el mundo de los negocios. Empresas de todas las industrias dependen

Más detalles

Bechtle Solutions Servicios Profesionales

Bechtle Solutions Servicios Profesionales Soluciones Tecnología Bechtle Solutions Servicios Profesionales Fin del servicio de soporte técnico de Windows Server 2003 No hacer nada puede ser un riesgo BECHTLE Su especialista en informática Ahora

Más detalles

3.3.3 Tecnologías Mercados Datos

3.3.3 Tecnologías Mercados Datos 3.3.3 Tecnologías Mercados Datos TECNOLOGIAS DATAMART: Aspect Data Mart es una solución completa de reportes para la empresa, que le proporciona un mayor entendimiento de las operaciones de sus negocios

Más detalles

Toda base de datos relacional se basa en dos objetos

Toda base de datos relacional se basa en dos objetos 1. INTRODUCCIÓN Toda base de datos relacional se basa en dos objetos fundamentales: las tablas y las relaciones. Sin embargo, en SQL Server, una base de datos puede contener otros objetos también importantes.

Más detalles

Unidad 5. Conceptos y Estructuras de Archivos

Unidad 5. Conceptos y Estructuras de Archivos Unidad 5 Conceptos y Estructuras de Archivos En todos los tiempos y más aún en la era en que vivimos, el hombre tiene cada vez mas necesidad de consultar una mayor cantidad de información para poder desarrollar

Más detalles

MINISTERIO DE EDUCACIÓN DIRECCIÓN DE EDUCACIÓN TÉCNICA Y PROFESIONAL PROGRAMA DE LA ASIGNATURA BASE DE DATOS ESPECIALIDAD INFORMÁTICA.

MINISTERIO DE EDUCACIÓN DIRECCIÓN DE EDUCACIÓN TÉCNICA Y PROFESIONAL PROGRAMA DE LA ASIGNATURA BASE DE DATOS ESPECIALIDAD INFORMÁTICA. MINISTERIO DE EDUCACIÓN DIRECCIÓN DE EDUCACIÓN TÉCNICA Y PROFESIONAL PROGRAMA DE LA ASIGNATURA BASE DE DATOS ESPECIALIDAD INFORMÁTICA. AUTORES: MSC. MIREYA LÓPEZ DELGADO LIC. ESPINOSA. CUIDAD HABANA PROGRAMA

Más detalles

Tecnologías de Información y Comunicación II CLASE 10

Tecnologías de Información y Comunicación II CLASE 10 Tecnologías de Información y Comunicación II CLASE 10 Medidas Una medida es un tipo de dato cuya información es usada por los analistas (usuarios) en sus consultas para medir la perfomance del comportamiento

Más detalles

SAP BusinessObjects Edge BI Standard Package La solución de BI preferida para. Empresas en Crecimiento

SAP BusinessObjects Edge BI Standard Package La solución de BI preferida para. Empresas en Crecimiento SAP BusinessObjects Edge BI Standard Package La solución de BI preferida para Empresas en Crecimiento Portfolio SAP BusinessObjects Soluciones SAP para Empresas en Crecimiento Resumen Ejecutivo Inteligencia

Más detalles

Sistemas de Gestión de Calidad. Control documental

Sistemas de Gestión de Calidad. Control documental 4 Sistemas de Gestión de Calidad. Control documental ÍNDICE: 4.1 Requisitos Generales 4.2 Requisitos de la documentación 4.2.1 Generalidades 4.2.2 Manual de la Calidad 4.2.3 Control de los documentos 4.2.4

Más detalles

IMPACTO DEL DESARROLLO TECNOLOGICO EN LA AUDITORIA

IMPACTO DEL DESARROLLO TECNOLOGICO EN LA AUDITORIA V REUNIÓN DE AUDITORES INTERNOS DE BANCA CENTRAL 8 AL 11 DE NOVIEMBRE DE 1999 LIMA - PERÚ IMPACTO DEL DESARROLLO TECNOLOGICO EN LA AUDITORIA Claudio Urrutia Cea Jefe de Auditoría BANCO CENTRAL DE CHILE

Más detalles

INTRODUCCION AL DESARROLLO DE SISTEMAS DE INFORMACION

INTRODUCCION AL DESARROLLO DE SISTEMAS DE INFORMACION INTRODUCCION AL DESARROLLO DE SISTEMAS DE INFORMACION INTRODUCCION AL DESARROLLO DE SISTEMAS DE INFORMACION. Los sistemas que el analista diseña día a día, la tecnología, las personas, que utilizan el

Más detalles

Capítulo 2. Planteamiento del problema. Capítulo 2 Planteamiento del problema

Capítulo 2. Planteamiento del problema. Capítulo 2 Planteamiento del problema Capítulo2 Planteamientodelproblema 38 2.1Antecedentesycontextodelproyecto En lo que respecta a los antecedentes del proyecto, se describe inicialmente el contexto donde se utiliza el producto de software.

Más detalles

CRM. Qué es CRM. Información para la Gestión

CRM. Qué es CRM. Información para la Gestión CRM Qué es CRM Es una estrategia de negocios orientada a la fidelización de clientes, enfocándose en que cada empleado de la empresa tenga información actualizada y confiable de los mismos, con el objetivo

Más detalles

Modificación y parametrización del modulo de Solicitudes (Request) en el ERP/CRM Compiere.

Modificación y parametrización del modulo de Solicitudes (Request) en el ERP/CRM Compiere. UNIVERSIDAD DE CARABOBO FACULTAD DE CIENCIA Y TECNOLOGÍA DIRECCION DE EXTENSION COORDINACION DE PASANTIAS Modificación y parametrización del modulo de Solicitudes (Request) en el ERP/CRM Compiere. Pasante:

Más detalles

M.T.I. Arturo López Saldiña

M.T.I. Arturo López Saldiña M.T.I. Arturo López Saldiña Hoy en día, existen diversas aproximaciones al tema de cómo hacer que las personas trabajen dentro de una organización de manera colaborativa. El problema se vuelve más difícil

Más detalles

LA LOGÍSTICA COMO FUENTE DE VENTAJAS COMPETITIVAS

LA LOGÍSTICA COMO FUENTE DE VENTAJAS COMPETITIVAS LA LOGÍSTICA COMO FUENTE DE VENTAJAS COMPETITIVAS Los clientes compran un servicio basandose en el valor que reciben en comparacion con el coste en el que incurren. Por, lo tanto, el objetivo a largo plazo

Más detalles

INTRANET DE UNA EMPRESA RESUMEN DEL PROYECTO. PALABRAS CLAVE: Aplicación cliente-servidor, Intranet, Área reservada, Red INTRODUCCIÓN

INTRANET DE UNA EMPRESA RESUMEN DEL PROYECTO. PALABRAS CLAVE: Aplicación cliente-servidor, Intranet, Área reservada, Red INTRODUCCIÓN INTRANET DE UNA EMPRESA Autor: Burgos González, Sergio. Director: Zaforas de Cabo, Juan. Entidad colaboradora: Colegio de Ingenieros del ICAI. RESUMEN DEL PROYECTO El proyecto consiste en el desarrollo

Más detalles

DE VIDA PARA EL DESARROLLO DE SISTEMAS

DE VIDA PARA EL DESARROLLO DE SISTEMAS MÉTODO DEL CICLO DE VIDA PARA EL DESARROLLO DE SISTEMAS 1. METODO DEL CICLO DE VIDA PARA EL DESARROLLO DE SISTEMAS CICLO DE VIDA CLÁSICO DEL DESARROLLO DE SISTEMAS. El desarrollo de Sistemas, un proceso

Más detalles

Empresa Financiera Herramientas de SW Servicios

Empresa Financiera Herramientas de SW Servicios Empresa Financiera Herramientas de SW Servicios Resulta importante mencionar que ésta es una empresa cuya actividad principal está enfocada a satisfacer las necesidades financieras de los clientes, a través

Más detalles

Data Warehousing - Marco Conceptual

Data Warehousing - Marco Conceptual Data Warehousing - Marco Conceptual Carlos Espinoza C.* Introducción Los data warehouses se presentan como herramientas de alta tecnología que permiten a los usuarios de negocios entender las relaciones

Más detalles

CAPÍTULO 3 VISUAL BASIC

CAPÍTULO 3 VISUAL BASIC CAPÍTULO 3 VISUAL BASIC 3.1 Visual Basic Microsoft Visual Basic es la actual y mejor representación del viejo lenguaje BASIC, le proporciona un sistema completo para el desarrollo de aplicaciones para

Más detalles

CAPITULO I. Introducción. En la actualidad, las empresas están tomando un papel activo en cuanto al uso de sistemas y

CAPITULO I. Introducción. En la actualidad, las empresas están tomando un papel activo en cuanto al uso de sistemas y CAPITULO I Introducción 1.1 Introducción En la actualidad, las empresas están tomando un papel activo en cuanto al uso de sistemas y redes computacionales. La tecnología ha ido evolucionando constantemente

Más detalles

Procedimiento de Sistemas de Información

Procedimiento de Sistemas de Información Procedimiento de Sistemas de Información DIRECCIÓN DE COORDINACIÓN TÉCNICA Y PLANEACIÓN VIEMBRE DE 2009 PR-DCTYP-08 Índice. 1. INTRODUCCIÓN.... 3 2. OBJETIVO.... 4 3. ALCANCE.... 4 4. MARCO LEGAL.... 4

Más detalles

e-commerce, es hacer comercio utilizando la red. Es el acto de comprar y vender en y por medio de la red.

e-commerce, es hacer comercio utilizando la red. Es el acto de comprar y vender en y por medio de la red. Comercio electrónico. (e-commerce) Las empresas que ya están utilizando la red para hacer comercio ven como están cambiando las relaciones de la empresa con sus clientes, sus empleados, sus colaboradores

Más detalles

UNIVERSIDAD MINUTO DE DIOS PROGRAMA CONTADURÍA PÚBLICA

UNIVERSIDAD MINUTO DE DIOS PROGRAMA CONTADURÍA PÚBLICA UNIVERSIDAD MINUTO DE DIOS PROGRAMA CONTADURÍA PÚBLICA COSTOS II Guía No. 1.- Conceptos Básicos OBJETIVO 1. Asimilar conceptos fundamentales de costos I. CONCEPTOS BASICOS DE COSTOS 1. CONTABILIDAD DE

Más detalles

Sistema para el control y tramitación de documentos SITA MSc. María de la Caridad Robledo Gómez y Ernesto García Fernández.

Sistema para el control y tramitación de documentos SITA MSc. María de la Caridad Robledo Gómez y Ernesto García Fernández. Sistema para el control y tramitación de documentos SITA MSc. María de la Caridad Robledo Gómez y Ernesto García Fernández. CITMATEL Ave 47 e/18 A y 20, Playa, Ciudad de La habana, CP 10300 Cuba. E mail:

Más detalles

<Generador de exámenes> Visión preliminar

<Generador de exámenes> Visión preliminar 1. Introducción Proyecto Final del curso Técnicas de Producción de Sistemas Visión preliminar Para la evaluación de algunos temas de las materias que se imparten en diferentes niveles,

Más detalles

Guía de Apoyo Project Web Access. (Jefe de Proyectos)

Guía de Apoyo Project Web Access. (Jefe de Proyectos) Guía de Apoyo Project Web Access (Jefe de Proyectos) 1 ÍNDICE Contenido INTRODUCCIÓN... 3 CAPITULO I: ELEMENTOS INICIALES DE PROJECT WEB ACCESS... 4 Configuración General... 4 Área de Trabajo del Proyecto...

Más detalles

TOMA DE DECISIONES II

TOMA DE DECISIONES II TOMA DE DECISIONES II Tema Nº 04 1. LAS HERRAMIENTAS TECNOLÓGICAS PARA LAS TOMA DE DECISIONES GERENCIALES 1.1 Importancia de los ERP. 1.2 Aadministración del desempeño corporativo CPM 1. HERRAMIENTAS TECNOLÓGICAS

Más detalles

Capítulo 4. Requisitos del modelo para la mejora de la calidad de código fuente

Capítulo 4. Requisitos del modelo para la mejora de la calidad de código fuente Capítulo 4. Requisitos del modelo para la mejora de la calidad de código fuente En este capítulo definimos los requisitos del modelo para un sistema centrado en la mejora de la calidad del código fuente.

Más detalles

SISTEMAS DE INFORMACION GERENCIAL LIC.PATRICIA PALACIOS ZULETA

SISTEMAS DE INFORMACION GERENCIAL LIC.PATRICIA PALACIOS ZULETA SISTEMAS DE INFORMACION GERENCIAL LIC.PATRICIA PALACIOS ZULETA Qué es inteligencia de negocios? (BI) Business Intelligence es la habilidad para transformar los datos en información, y la información en

Más detalles

Inteligencia de Negocios Introducción. Por Elizabeth León Guzmán, Ph.D. Profesora Ingeniería de Sistemas Grupo de Investigación MIDAS

Inteligencia de Negocios Introducción. Por Elizabeth León Guzmán, Ph.D. Profesora Ingeniería de Sistemas Grupo de Investigación MIDAS Inteligencia de Negocios Introducción Por Elizabeth León Guzmán, Ph.D. Profesora Ingeniería de Sistemas Grupo de Investigación MIDAS Agenda 1.Introducción 2.Definición 3.ETL 4.Bodega de Datos 5.Data Mart

Más detalles

Caso práctico de Cuadro de Mando con Tablas Dinámicas

Caso práctico de Cuadro de Mando con Tablas Dinámicas 1 Caso práctico de Cuadro de Mando con Tablas Dinámicas Luis Muñiz Socio Director de SisConGes & Estrategia Introducción Hay una frase célebre que nos permite decir que: Lo que no se mide no se puede controlar

Más detalles

3.1 INGENIERIA DE SOFTWARE ORIENTADO A OBJETOS OOSE (IVAR JACOBSON)

3.1 INGENIERIA DE SOFTWARE ORIENTADO A OBJETOS OOSE (IVAR JACOBSON) 3.1 INGENIERIA DE SOFTWARE ORIENTADO A OBJETOS OOSE (IVAR JACOBSON) 3.1.1 Introducción Este método proporciona un soporte para el diseño creativo de productos de software, inclusive a escala industrial.

Más detalles

Quienes Somos? Valor. Estrategia

Quienes Somos? Valor. Estrategia Quienes Somos? STGI nace como la respuesta necesaria al mundo empresarial en consultorías para acceder y gestionar la información, estructurada y no estructurada, con el fin de alcanzar procesos eficientes

Más detalles

XBRL extensible Business Reporting Language. Noviembre / 2014

XBRL extensible Business Reporting Language. Noviembre / 2014 XBRL extensible Business Reporting Language Noviembre / 2014 Qué es XBRL o datos interactivos? XBRL es un lenguaje para la comunicación electrónica de datos de negocio y financieros basados en XML utilizada

Más detalles

Introducción. Componentes de un SI. Sistema de Información:

Introducción. Componentes de un SI. Sistema de Información: Introducción. Sistema de Información: Conjunto de elementos relacionados entre sí de acuerdo a ciertas reglas, que aporta a la organización la información necesaria para el cumplimiento de sus fines, para

Más detalles

LOGISTICA D E COMPRAS

LOGISTICA D E COMPRAS LOGISTICA D E COMPRAS 1. - Concepto de compras OBTENER EL (LOS) PRODUCTO(S) O SERVICIO(S) DE LA CALIDAD ADECUADA, CON EL PRECIO JUSTO, EN EL TIEMPO INDICADO Y EN EL LUGAR PRECISO. Muchas empresas manejan

Más detalles

CAPITULO III A. GENERALIDADES

CAPITULO III A. GENERALIDADES CAPITULO III INVESTIGACION DE CAMPO SOBRE EL DISEÑO DE UN SISTEMA AUTOMATIZADO DE CONTROL INVENTARIO Y EXPEDIENTES DE MENORES DE EDAD PARA EL CENTRO DE DESARROLLO INTEGRAL LA TIENDONA EN LA ZONA METROPOLITANA

Más detalles

Universidad de Colima Facultad de Ingeniería Mecánica y Eléctrica. Base de Datos I. Maestra: Martha E. Evangelista Salazar

Universidad de Colima Facultad de Ingeniería Mecánica y Eléctrica. Base de Datos I. Maestra: Martha E. Evangelista Salazar Universidad de Colima Facultad de Ingeniería Mecánica y Eléctrica Base de Datos I Maestra: Martha E. Evangelista Salazar Introducción a los conceptos de Bases de Datos a).- Definiciones básicas sobre bases

Más detalles

Alumna: Adriana Elizabeth Mendoza Martínez. Grupo: 303. P.S.P. Miriam De La Rosa Díaz. Carrera: PTB. en Informática 3er Semestre.

Alumna: Adriana Elizabeth Mendoza Martínez. Grupo: 303. P.S.P. Miriam De La Rosa Díaz. Carrera: PTB. en Informática 3er Semestre. Alumna: Adriana Elizabeth Mendoza Martínez. Grupo: 303. P.S.P. Miriam De La Rosa Díaz. Carrera: PTB. en Informática 3er Semestre. Tema: Sistemas Subtema: Base de Datos. Materia: Manejo de aplicaciones

Más detalles

Gestión de Configuración del Software

Gestión de Configuración del Software Gestión de Configuración del Software Facultad de Informática, ciencias de la Comunicación y Técnicas Especiales Herramientas y Procesos de Software Gestión de Configuración de SW Cuando se construye software

Más detalles

BUSINESS INTELLIGENCE A TRAVÉS

BUSINESS INTELLIGENCE A TRAVÉS 07 de Agosto de 2012 BUSINESS INTELLIGENCE A TRAVÉS DEL COACHING Impartido Por: Andrés Pluma Velázquez No es posible gestionar lo que no se puede medir William Hewlet (HP Company). En este sentido, hay

Más detalles

Guías _SGO. Gestione administradores, usuarios y grupos de su empresa. Sistema de Gestión Online

Guías _SGO. Gestione administradores, usuarios y grupos de su empresa. Sistema de Gestión Online Guías _SGO Gestione administradores, usuarios y grupos de su empresa Sistema de Gestión Online Índice General 1. Parámetros Generales... 4 1.1 Qué es?... 4 1.2 Consumo por Cuentas... 6 1.3 Días Feriados...

Más detalles

Evolución de la Informática en la organización.

Evolución de la Informática en la organización. Evolución de la Informática en la organización. De la sección anterior se desprende la evolución que tienen los Sistemas de Información en las organizaciones. Con frecuencia se implantan en forma inicial

Más detalles