Análisis comercial de los establecimientos de la Red de Tiendas Minorista de la Corporación CIMEX



Documentos relacionados
Tecnologías de Información y Comunicación II CLASE 10

Base de datos II Facultad de Ingeniería. Escuela de computación.

Quienes Somos? Valor. Estrategia

Capítulo 5. Cliente-Servidor.

Parte I: Introducción

Elementos requeridos para crearlos (ejemplo: el compilador)

Los mayores cambios se dieron en las décadas de los setenta, atribuidos principalmente a dos causas:

"Diseño, construcción e implementación de modelos matemáticos para el control automatizado de inventarios

Oracle vs Oracle por Rodolfo Yglesias Setiembre 2008

Portafolio de Servicios y Productos

e-commerce, es hacer comercio utilizando la red. Es el acto de comprar y vender en y por medio de la red.

LOGISTICA D E COMPRAS

Control del Stock, aprovisionamiento y distribución a tiendas.

App para realizar consultas al Sistema de Información Estadística de Castilla y León

Data Mining Técnicas y herramientas

Capítulo 2. Planteamiento del problema. Capítulo 2 Planteamiento del problema

IMPACTO DEL DESARROLLO TECNOLOGICO EN LA AUDITORIA

1.2 Alcance. 1.3 Definición del problema

GeneXus BPM Suite X. Última actualización: 01 de Setiembre de 2008

Metodología básica de gestión de proyectos. Octubre de 2003

MINING SOLUTIONS LIMITADA

SÍNTESIS Y PERSPECTIVAS

LA LOGÍSTICA COMO FUENTE DE VENTAJAS COMPETITIVAS

SAP BusinessObjects Edge BI Standard Package La solución de BI preferida para. Empresas en Crecimiento

Presentación de Pyramid Data Warehouse

Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI)

RESUMEN CUADRO DE MANDO

Ciclo de vida y Metodologías para el desarrollo de SW Definición de la metodología

Resumen General del Manual de Organización y Funciones

Capítulo 2 Tecnología data warehouse

MANEJO DE QUEJAS Y RECLAMOS

BearSoft. SitodeCloud. Rafael Rios Bascón Web: Móvil:

Modificación y parametrización del modulo de Solicitudes (Request) en el ERP/CRM Compiere.

activuspaper Text Mining and BI Abstract


Mejores prácticas para el éxito de un sistema de información. Uno de los problemas de información dentro de las empresas es contar con datos

LOS CINCO GRADOS DE MADUREZ DE UN PROYECTO BI

CAPITULO I. Introducción. En la actualidad, las empresas están tomando un papel activo en cuanto al uso de sistemas y

2.1 Clasificación de los sistemas de Producción.

INGENIERÍA DE SOFTWARE. Sesión 3: Tipos

El participante puede llevar a cabo el proceso de auto-comparación y sobre esa base reforzar los aspectos menos consistentes.


I INTRODUCCIÓN. 1.1 Objetivos

PROGRAMACIÓN ORIENTADA A OBJETOS Master de Computación. II MODELOS y HERRAMIENTAS UML. II.2 UML: Modelado de casos de uso

Sesión No. 12. Contextualización: Nombre de la sesión: SAP segunda parte PAQUETERÍA CONTABLE

MINISTERIO DE EDUCACIÓN DIRECCIÓN DE EDUCACIÓN TÉCNICA Y PROFESIONAL PROGRAMA DE LA ASIGNATURA BASE DE DATOS ESPECIALIDAD INFORMÁTICA.

Maxpho Commerce 11. Gestión CSV. Fecha: 20 Septiembre 2011 Versión : 1.1 Autor: Maxpho Ltd

Propuesta de Portal de la Red de Laboratorios Virtuales y Remotos de CEA

Business Intelligence

CAPÍTULO 1 Instrumentación Virtual

Administración por Procesos contra Funciones

Unidad 1. Fundamentos en Gestión de Riesgos

Términos definiciones

Tecnologías Aplicadas a Business Intelligence Proyecto Práctico

ANEXO A - Plan de Proyecto EDT de la solución EDT GENERAL DEL PROYECTO1

Código del programa: PEMDE. Programa Experto en MANEJO DE DATOS CON EXCEL. Modalidad: Virtual. Descripción del programa

Mineria de datos y su aplicación en web mining data Redes de computadores I ELO 322

dmnet Arquitectura Empresarial de Procesos

Mantenimiento de Sistemas de Información

FUENTES SECUNDARIAS INTERNAS

TECNÓLOGO EN INFORMÁTICA PLAN DE ESTUDIOS

Prácticas ITIL para un mejor flujo de trabajo en el helpdesk

INTELIGENCIA DE NEGOCIOS

CAPÍTULO I. Sistemas de Control Distribuido (SCD).

CREACIÓN DE UN DEPARTAMENTO DE RELACIONES PÚBLICAS PARA LOS ALMACENES EL CHOCHO Y EL CAMPEÓN

Ofrezca la nueva tendencia de innovación empresarial con un entorno de red abierta

ANEXO 26-A COMITÉ PERMANENTE DE INTERPRETACIÓN SIC N 32 ACTIVOS INTANGIBLES COSTOS DE SITIOS WEB. (Modificada en 2008) (IV Difusión)

LINEAMIENTOS ESTÁNDARES APLICATIVOS DE VIRTUALIZACIÓN

Sistemas de información

Día :00h Lugar: Obra Social Ibercaja, Sala De actos, Rambla Ferran 38, 3º, Lleida

Sistemas de Gestión de Calidad. Control documental

3.1 INGENIERIA DE SOFTWARE ORIENTADO A OBJETOS OOSE (IVAR JACOBSON)

El objetivo principal del presente curso es proporcionar a sus alumnos los conocimientos y las herramientas básicas para la gestión de proyectos.

Gestión de proyectos

Ventajas del software del SIGOB para las instituciones

Figure 7-1: Phase A: Architecture Vision

SOLUCIONES E-BUSINESS

Administración del conocimiento y aprendizaje organizacional.

Windows Server 2012: Identidad y Acceso. Módulo 2: Descripción General de Windows Server 2012 Remote Desktop Services.

Introducción a la Firma Electrónica en MIDAS

Gestión de Permisos. Bizagi Suite. Copyright 2014 Bizagi


INTRODUCCIÓN CAPITULO I 1.1 PLANTEAMIENTO DEL PROBLEMA.

INSTRODUCCION. Toda organización puede mejorar su manera de trabajar, lo cual significa un

CRM Gestión de Oportunidades Documento de Construcción Bizagi Process Modeler

CAPITULO III A. GENERALIDADES

1 GLOSARIO. Actor: Es un consumidor (usa) del servicio (persona, sistema o servicio).

WhiteHat Tools. Resumen del Producto

Gestor de Contenidos CMS. Prof: Ing. Henrry Servitá

Bechtle Solutions Servicios Profesionales

Artículo dedicado a la Innovación y Mejores Prácticas en la Ingeniería de Negocios

POLÍTICA DE TECNOLOGÍA DE INFORMACIÓN

Visión General de GXportal. Última actualización: 2009

QUE ES COMLINE MENSAJES? QUE TIPO DE MENSAJES PROCESA COMLINE MENSAJES?

Introducción. Metadatos

DE VIDA PARA EL DESARROLLO DE SISTEMAS

Aproximación práctica a ITIL. Proyecto VeredaCS. F r00

GUIA SOBRE LOS REQUISITOS DE LA DOCUMENTACION DE ISO 9000:2000

Transcripción:

Instituto de Cibernética, Matemática yfísica Análisis comercial de los establecimientos de la Red de Tiendas Minorista de la Corporación CIMEX TESIS EN OPCIÓN AL GRADO DE MASTER EN MINERIA DE DATOS Autora: Lic. Yaisbel Escobar Fernández Tutor: DR. ING. Armando de Jesús Plasencia Salgueiro La Habana Septiembre 2012

Introducción Índice Introducción... 3 Capítulo 1. de Negocios Consideraciones teóricas para el desarrollo de una solución de Inteligencia..8 1.1. Introducción... 8 1.2. Gestión del conocimiento... 8 1.3. Inteligencia de Negocios... 11 1.4. Arquitectura de una solución de Inteligencia de Negocios... 13 1.4.1. Sistemas operacionales... 15 1.4.2. Extracción, Transformación y Carga de los datos... 17 1.4.3. Almacén de Datos... 18 1.4.4. Herramientas de acceso al almacén de datos... 23 1.5. Web 2.0... 28 1.6. Inteligencia de Negocios y la Web 2.0... 31 1.7. Conclusiones... 32 Capítulo 2. Metodología de investigación... Error! Marcador no definido. 2.1. Introducción... Error! Marcador no definido. 2.2 Metodología CRISP-DM... Error! Marcador no definido. Fase 1. Comprensión del negocio... Error! Marcador no definido. Fase 2. Comprensión de los datos... Error! Marcador no definido. Fase 3. Preparación de los datos... Error! Marcador no definido. Fase 4. Modelado... Error! Marcador no definido. Fase 5. Evaluación... Error! Marcador no definido. 1

Introducción Fase 6. Despliegue... Error! Marcador no definido. 2.3. Comprensión del negocio de la Red de Tiendas Minoristas Error! Marcador no definido. 2.4 Comprensión de los datos de la Red de Tiendas Minoristas Error! Marcador no definido. 2.5 Preparación de los datos de la Red de Tiendas Minoristas Error! Marcador no definido. 2.6. Modelado de una solución de minería de datos... Error! Marcador no definido. 2.7. Evaluación del modelado de minería de datos... Error! Marcador no definido. 2.8. Despliegue de modelo desarrollado en SSAS... Error! Marcador no definido. 2.9. Conclusiones... Error! Marcador no definido. Capítulo 3. Análisis comercial de los establecimientos a mostrar en la aplicación web dentro de SAN... E rror! Marcador no definido. 3.1. Introducción... Error! Marcador no definido. 3.2. Selección de los datos para realizar el análisis comercial. Error! Marcador no definido. 3.3. Modelado de una solución de minería usando Analysis Services Error! Marcador no definido. 3.4. Evaluación de los modelos de minería de datos desarrollados Error! Marcador no definido. 3.5. Aplicación de Microsoft Silverlight usando el control PivotViewer... Error! Marcador no definido. 3.6. Conclusiones... 33 Conclusiones... 34 2

Introducción Bibliografía... 35 Anexos... 40 Anexo 1. Estructura de la Corporación CIMEX... 40 Anexo 2. Sucursales Territoriales de la Corporación CIMEX... 41 Anexo 3. Divisiones Especializadas de la Corporación CIMEX... 42 Anexo 4. Subsidiarias de la Corporación CIMEX... 42 Introducción La Corporación CIMEXsurge en el año 1979, con la creación de su primera división, Havanatur, encargada del movimiento de personas entre Cuba y Estados Unidos. En una segunda fase de desarrollo, comprendida hasta 1992, crea otras divisiones con actividades de perfil comercial, fundamentalmente, de carácter mayorista. En 1993, a partir de la despenalización de la tenencia de divisas, el auge del turismo internacional y el inicio de la recuperación económica del país, CIMEX inicia una etapa de expansión al sector de los servicios minoristas, ampliándose su objeto social, que comprende hoy, la realización de actividades productivas, de carácter comercial mayorista, minorista y de servicios, la exportación y la importación; constituyendo su rasgo más significativo el amplio espectro de cada una de estas actividades y su alcance espacial, abarcando todo el territorio nacional. La Corporación CIMEX, es un grupo empresarial, representado a lo largo de todo el territorio nacional, con actividades en importantes sectores de la economía cubana, estructurado en 19 sucursales territoriales, más de 80 empresas, 10 subsidiarias y 13 divisiones especializadascomprenden amplios e importantes sectores de la economía cubana ( ver 3

Introducción Anexo 1). Una de susestructuras más significativa es la Red de Tiendas Minoristas, integrada por las Tiendas Panamericanas, los Servicentros Servicupet, las Cafeterías El Rápido, los Videocentros, las Tiendas Fotográficas Photoservice, los Centros Comerciales y pequeñas tiendas típicas en barrio(corporación CIMEX - Ecured, 2012). La actividad comercial de la Red de Tiendas Minoristas de la Corporación, genera diariamente un gran volumen de información, la que necesita ser almacenada de manera eficiente. Es por ello que la Dirección General de Informática y Comunicaciones de CIMEX, DATACIMEX, desde el año 2008 desarrolló un Almacén de Datos Operacionales, conocido en la literatura como Operational Data Store(ODS, por sus siglas en inglés), que contiene la información comercial minorista. Un ODS es un repositorio de datos operacionales a nivel de detalle, de frecuente actualización, donde se almacena la información unificada y homogeneizada proveniente de diferentes fuentes. A partir del ODS desarrollado, se decidió implementar un Sistema de Administración de Negocios (SAN), con el fin de facilitar la toma de decisiones a los especialistas de la empresa al brindarle información más actualizada. SAN tiene como propósito los siguientes objetivos: Integrar en un portal único los distintos procesos de negocio que se interrelacionan entre sí, facilitando la toma de decisiones. Control de Análisis: Ofrecer un seguimiento de cada uno de los procesos de negocio desde su etapa de Planificación hasta la Evaluación mediante indicadores, cuadros de mando y emisión de boletines: o Planificación: Facilitar la definición de Políticas y Procesos a partir de múltiples referencias históricas (Ejemplo: Ventas, Compras, Rotación, Precios) o Ejecución: Visualizar la ejecución de los diferentes procesos de negocio, a partir de la integración de múltiples fuentes de datos 4

Introducción o Evaluación: Facilitar el análisis y evaluación mediante indicadores y pizarras de mando, de la aplicación de las diferentes políticas, a partir de los datos colectados Este sistema muestra la información individual de los establecimientos a través de algunos reportes previamente diseñados, pero no contiene ningún análisis comercial de los establecimientos que permita tener mayor conocimiento, desde el punto de vista comercial, de cuáles son las principales características que los distinguen o los asemejan. Este análisis es importante para conocer comercialmente cómo se comportan los establecimientos, y así tener una herramienta más que sirva al proceso de toma de decisiones de la Empresa por lo que el presente proyecto de investigación se plantea el siguiente problema científico: Cómo realizar un análisis de los indicadores comerciales de los establecimientos de la Red de Tiendas Minoristas de la Corporación CIMEX a través de una aplicación web dentro del portal SAN que facilite la toma de decisiones? Para dar solución al problema anterior el autor se plantea las siguientes preguntas científicas: Cuáles han sido las herramientas de la Inteligencia de Negocios utilizadas en la Corporación CIMEX para la toma de decisiones? Cuáles son los indicadores comerciales que brindan información sobre la rentabilidad de los establecimientos de la Corporación CIMEX? Cómo desarrollar una aplicación web dentro del portal SAN que muestre el análisis comercial de los establecimientos de la Red de Tiendas Minoristas, para la toma de decisiones de la empresa? El presente proyecto de investigación se propone como objetivo general: 5

Introducción Realizar el análisis comercial de los establecimientos de la Red de Tiendas Minoristas de la Corporación CIMEX en una aplicación web dentro del portal SAN que facilite la toma de decisiones de la empresa. Y como objetivos específicos: Identificar las herramientas de la Inteligencia de Negocios utilizadas en la Corporación CIMEX para la toma de decisiones. Seleccionar los indicadores comerciales que brindan mayor información sobre elcomportamiento de los establecimientos de la Red de Tiendas Minoristas. Seleccionar la metodología de investigación a utilizar. Determinar los algoritmos que permitan el análisis de los indicadores comerciales seleccionados. Desarrollar una aplicación web dentro del portal SAN que muestre el análisis comercial de los establecimientos de la Red de Tiendas Minoristas, facilitandola toma de decisiones de la Corporación CIMEX. El objeto de esta investigación lo constituye la Inteligencia de Negocios y su campo de acción la Minería de Datos para detectar agrupamientos. Con el fin de alcanzar los objetivos planteados se llevarán a cabo las siguientes tareas de investigación: Estudio de herramientas de la Inteligencia de Negocios utilizadas en la Corporación CIMEX para la toma de decisiones. Definición de los indicadores comerciales que brindan mayor información sobre las características de los establecimientos de la Corporación CIMEX. Estudio y adaptación de la metodología de investigación seleccionada. Determinación delos algoritmos que permitan el análisis los indicadores comerciales seleccionados. 6

Introducción Desarrollo de una aplicación web amigable al usuariodentro del portal SAN que muestre el análisis comercial de los establecimientos de la Red de Tiendas Minoristas, para la toma de decisiones de la Corporación CIMEX. Se establece como límite de la investigación desarrollar una aplicación web dentro del portal SAN que permita analizar los indicadores comerciales de los establecimientos independientes de la Red de Tiendas Minoristas de la Corporación CIMEX. Para el desarrollo de esta investigación serán utilizados los siguientes métodos: Histórico lógico: se aplicará en el estudio de documentos e historial de los datos almacenados de la Red de Tiendas Minoristas de la Corporación CIMEX. Análisis: se realizará un análisis de los datos almacenados de los diferentes establecimientos. Modelación: los indicadores comerciales se modelarán como una representación geométrica en la aplicación. Estadístico: utilización de métodos estadísticos para cuantificar los indicadores comerciales. La investigación define como unidades de observaciónalos establecimientos de la Red de Tiendas Minoristas de la Corporación CIMEX y como muestra a todos los establecimientos independientes de la Red de Tiendas Minoristas de la Corporación CIMEX. El presente proyecto de investigación está estructurado en los capítulos siguientes: Capítulo 1: se presenta el marco teórico que apoya la investigación, y que proporciona las ideas principales para desarrollar una solución de Inteligencia de Negocios usando herramientas de la Web 2.0. Capítulo 2: se define y justica la metodología de investigación seleccionada para desarrollar el presente trabajo y se explica cómo se adaptan las fases de la 7

Introducción metodología escogida a nuestra investigación.se presentan las herramientas utilizadas para el desarrollo de la aplicación web. Capítulo 3: se realiza el análisis de los establecimientos usando los indicadores comerciales seleccionados y se desarrolla la aplicación web a incluir en el portal SAN que muestra los resultados obtenidos del análisis comercial, dando respuesta al problema científico planteado. 8

Capítulo 1. Consideraciones teóricas para el desarrollo de una solución de Inteligencia de Negocios 1.1. Introducción En la actualidad, lasorganizaciones acumulan gran cantidad de información como resultado de su experiencia.el uso inteligente de la información y su transformación en conocimiento es una fuente de competitividad sosteniblepues permite incrementar la eficiencia y fundamentar la toma de decisiones(ortiz Ortiz, 2007). Esta realidad marca la necesidad de contar con herramientas tecnológicas y organizacionales que apoyen la toma de decisiones basadas en análisis objetivos;como respuesta a estas nuevascondiciones de trabajo, lainteligencia de Negocios brinda una enorme fuente de teorías y metodologías, que posibilitan un mayor desarrollo y evolución de las organizaciones. El desarrollo tecnológico actual permite acceder rápidamente a una cantidad ilimitada de información, haciendo necesario definir la manera de incorporar este flujo de información a los procesos de dirección de las empresas como base para la toma de decisiones. En este sentido, podríamos decir que la gestióndel conocimiento es la teoría que responde a la adaptación de las últimasinnovaciones tecnológicas en el tratamiento de la información(bustelo Ruesta & Amarilla Iglesias, 2001). A continuación abordaremos el tema de la gestión del conocimiento. 1.2. Gestión del conocimiento La gestión del conocimiento implica la adquisición, almacenamiento, recuperación, aplicación, generación y el análisis de los recursos de una organización de forma controlada; por tanto aporta valor a la organización al obtener capacidades y 9

competencias esenciales distintivas(watson, 2003: 5). Para entender de dónde surge el conocimiento y posteriormente la gestión del conocimiento, primero hay que analizar los conceptos de datos e información. Los datos son la mínima unidad semántica, y se corresponden con elementos primarios de información que por sí solos son irrelevantes como apoyo a la toma de decisiones. Se refieren a los registros numéricos, lingüísticos, lógicos o matemáticos a través de los cuales se representan hechos, conceptos o instrucciones. Pueden verse, entonces, como un conjunto discreto de valores, que no tienen relevancia sobre el porqué de las cosas, pudiendo ser, por tanto, una colección de hechos almacenados en algún lugar físico como un papel o un dispositivo electrónico. Los datos son la base para la creación de la información en las organizaciones. A diferencia de los datos, la información tiene un significado, una relevancia o propósito(carrion, Diferencia entre dato, informacion y conocimiento, 2006).Los datos se convierten en información añadiéndoles valor en varios sentidos, algunos de ellos son: Contextualizando: se sabe en qué contexto y para qué propósito se generaron. Categorizando: se conocen las unidades de medida que ayudan a interpretarlos. Calculando: los datos pueden haber sido procesados matemática o estadísticamente. Corrigiendo: se han eliminado errores e inconsistencias de los datos. Condensando: los datos se han podido resumir de forma más concisa. La informacióntiene la capacidad de cambiar la forma en que el receptor percibe algo y es capaz de impactar sobre su opinión y comportamiento El conocimiento, a diferencia de la información, se origina y aplica en la mente de los personas. El conocimiento se deriva de la información, así como la información se deriva de los datos(carrion, Diferencia entre dato, informacion y conocimiento, 2006). 10

En las empresas con frecuencia no sólo se encuentra dentro de documentos o almacenes de datos, sino que también está en rutinas organizativas, procesos, prácticas, y normas. El conocimiento puede ser visto como un proceso, un flujo continuo que tiene una estructura formalizada, es intuitivo y difícil de captar en palabras o de entender plenamente de forma lógica yexiste dentro de las personas, como parte de la complejidad humana. Las actividades de creación de conocimiento tienen lugar dentro y entre personas. Al igual que encontramos datos en registros e información en mensajes, obtenemos conocimiento de individuos, grupos de individuos, o incluso en rutinas organizativas. La gestióndel conocimiento está determinada por la intervención de diferentesprocesos y de la acción de las personas(watson, 2003). En una organización puede existir un perfectomodelo de gestión de la información, pero si los individuos no lo utilizanpara la resolución de unproblema es imposible que se cree conocimiento. La gestión del conocimiento, permite realizar más eficazmente el trabajoencomendado a la organización. El ciclo de la gestión del conocimiento se compone de cuatro actividades: adquisición, análisis, preservación y uso(watson, 2003).La adquisición del conocimiento está dada por el aprendizaje y la creación del conocimiento. Este conocimiento necesita ser analizado y preservado, para ser accedido y utilizado en un futuro. La actividad que cierra el ciclo es el uso del conocimiento pues cuando se usael conocimiento, se puede crear nuevo entendimiento dentro del conocimiento. Este nuevo conocimiento, a su vezpuede ser adquirido, analizado y preservado para su uso posterior, por tanto el ciclo de gestión del conocimiento es un proceso continuo. A pesar del desarrollo alcanzado para la obtención de conocimiento, los sistemas de información tradicionales, suelen presentar una estructura muy inflexible para obtener 11

el conocimiento almacenado en el día a día. La capacidad para tomar decisiones de negocio precisas y de forma rápida se ha convertido en una de las claves para que una empresa llegue al éxito(pareek, 2007), es por ello que para superar las limitacionesde los sistemas de información tradicionales, la Inteligencia de Negocios o Business Intelligence (BI, por sus siglas en ingles), actúa como un factor estratégico para una empresa u organización, generando una potencial ventaja competitiva, que no es otra que proporcionar información privilegiada para responder a los problemas del negocio(sinnexus, Qué es Business Intelligence?, 2011). El siguiente epígrafe hace una breve introducción a la Inteligencia de Negocios. 1.3. Inteligencia de Negocios El termino Inteligencia de Negocios (Pareek, 2007: 39) fue adoptado a finales de la década de los 80, con él se pretendía definir el proceso de acceder yexplotar áreasespecíficas de la información, analizando las mismas, desarrollandonuevas perspectivas y conocimientos y finalmente aplicando resultados asoluciones empresariales. La Inteligencia de Negocios se basa en un conjunto de estrategias y herramientas enfocadas a la administración y creación de conocimiento que tienen en común: Conversión de los datos en información. Apoyo en la toma de decisiones:posibilita el acceso a herramientas de análisis que permitanseleccionar y manipular aquellos datos de interés en la toma de decisiones. La Inteligencia de Negocios es el proceso de analizar los bienes o datos acumulados de la empresa y extraer una cierta inteligencia o conocimiento de ellos(ranjan, 2009). Dentro de la categoría de bienes se incluyen las bases de datos de clientes, información de la cadena de suministro, ventas personales y cualquier actividad comercial o fuente de información relevante para la empresa. 12

La Inteligencia de Negocios,asociándola directamente con las tecnologías de la información, se puede definir como el conjunto de metodologías, aplicaciones y tecnologías que permiten transformar datos de los sistemas transaccionales e información desestructurada, ya sea interna o externa a la compañía, en información estructurada, para su explotación directa o para su análisis y conversión en conocimiento, dando así soporte a la toma de decisiones sobre el negocio. La Inteligencia de Negocios representa al ciclo en el que las empresas establecen sus objetivos, analizan sus progresos, reflexionan, actúan, miden su éxito y empiezan una nueva fase. Su ciclo se compone de cuatro etapas: análisis, reflexión, acción y medición(pareek, 2007:10). A continuación se explican brevemente las etapas del ciclo de Inteligencia de Negocios: 1. El análisis: comienza por determinar los datos a recopilar, la selección se basa en un entendimiento básico de cómo opera la organización, considerando aquello que es relevante a los clientes, proveedores, empleados, los factores que afectan los insumos, la producción, el costo y la calidad. 2. La reflexión: implica el estudio minucioso de los hechos y de la situación, además de considerar el rumbo que puede tomar el caso de estudio. El escenario que abarca la reflexión depende del nivel jerárquico que la está realizando y la consideración del ambiente externo. La reflexión nace de un análisis libre de preguntas que solo los ejecutivos pueden formular y que se encaminan al descubrimiento de patrones relevantes. 3. La acción: se realiza a través del proceso de toma de decisiones, en donde las acciones se suceden como resultado de las decisiones. La toma de decisiones al estar basada en la Inteligencia de Negocios ofrece mejores condiciones para identificar oportunidades, orientar las acciones, la experimentación, la prueba y la retroalimentación. 4. Lamedición: evalúa los resultados al compararlos contra los estándares cuantitativos y las expectativas planteadas originalmente; con lo cual se da vida a otro ciclo de análisis, reflexión, acción y medida. En la Inteligencia de Negocios 13

se pueden establecer estándares para pruebas de comparación que faciliten monitorear el desempeño y proveer retroalimentación para cada área funcional del negocio. La métricas corresponden a los indicadores clave de desempeño que se generan a partir de explorar grandes cantidades de datos integrados de fuentes heterogéneas que son evaluados por algoritmos para descubrir, inferir, y calcular información relevante, dando como resultado reportes consistentes sobre criterios de actividad que los ejecutivos consideran y usan como argumentos para sus decisiones. Para desarrollar una solución de Inteligencia de Negocios se debe desarrollar una arquitectura como se explica a continuación. 1.4. Arquitectura de una solución de Inteligencia de Negocios Una solución de Inteligencia de Negocios, como se muestra en lafigura. 1, parte de los sistemas de origen de datos de una empresa u organización, algunos de ellos son las bases de datos y los ficheros de texto. Sobre los sistemas de origen suele ser necesario aplicar una transformación estructural para optimizar su proceso analítico, para ello se realiza una fase de extracción, transformación y carga de datos. Esta etapa suele apoyarse en un almacén intermedio, que actúa como pasarela entre los sistemas fuente y los sistemas destino, y cuyo principal objetivo consiste en evitar la saturación de los servidores funcionales de la organización. 14

Figura. 1 Arquitectura de una solución de inteligencia de Negocios. La información resultante, ya unificada, depurada y consolidada, se almacena en un almacén de datos, que puede servir como base para la construcción de distintos almacenes de datos departamentales o datamarts. Estos datamarts se caracterizan por 15

poseer la estructura óptima para el análisis de los datos de esa área de la empresa, ya sea mediante bases de datos transaccionales o mediante bases de datos analíticas. La explotación de los datos albergados en el almacén de datos o en cada datamartse realiza a través de herramientas de análisis, reportes, consultas o minería de datos. En estas herramientas se basa también la construcción de productos de Inteligencia de Negocios más completos, como los Sistemas de Información Ejecutiva (EIS), entre otros(sinnexus, Arquitectura de una solución de Business Intelligence, 2011). Desde la perspectiva tecnológica, la arquitectura de la Inteligencia de Negocioscuenta con un gran número de herramientas, tecnologías y técnicas, algunas de estas son(sinnexus, Arquitectura de una solución de Business Intelligence, 2011): Sistemas operacionales. Proceso de Extracción, Transformación y Carga de Datos (ETL, por sus siglas en inglés) Almacenes de datos. Herramientas de acceso al almacén de datos. En el próximo epígrafe se hará una breve descripción de cada una de las partes que forman la arquitectura de una solución de Inteligencia de Negocios. 1.4.1. Sistemas operacionales Los sistemas operacionales se utilizan para poblar el componente de almacenamiento físico de un almacén de datos. El origen de los datos en los sistemas operacionales son los sistemas transaccionales internos de la organización y también los datos externos a la misma.estos sistemas manipulan un gran número de transacciones simples de lectura o escritura y se basan en datos actuales del estado de la empresa. Además, juegan un papel fundamental para cualquier organización, pues garantizan la automatización de los procesos y el flujo de la información a través de la misma. 16

El diseño e implementación de los sistemas operacionales están dirigidos a cumplir los siguientes objetivos: Apoyar las funciones diarias de la entidad u organización. Brindar servicios de oficina. Entregar la información de manera automatizada. Asegurar la calidad y la protección de la información. El procesamiento transaccional en línea (en inglés,on Line TransactionProcessing, OLTP)(Withee, 2010), conocido también como procesamiento operacional, sustenta las operaciones diarias de la empresa y describe los requerimientos operacionales del sistema. Este procesamiento se refiere a un tipo de cálculo en el cual el énfasis está en el procesamiento de las transacciones tal y como son recibidas por las aplicaciones. Las aplicaciones de bases de datos con procesamiento transaccional en línea son óptimas en el manejo de los datos que constantemente están cambiando y usualmente tienen un gran número de usuarios que están ejecutando transacciones simultáneamente y que actualizan o modifican los datos en tiempo real. Aunque los requerimientos individuales por usuarios sobre los datos tienden a referenciar pocos artículos, muchos de estos requerimientos son solicitados al mismo tiempo. De ahí que las principales preocupaciones en este tipo de aplicación sean la concurrencia y la atomicidad(fouché & Langit, 2011). Los controles de la concurrencia en un sistema de bases de datos aseguran que dos usuarios no puedan cambiar o modificar el mismo tipo de dato o que un usuario no pueda modificar un dato antes de que otro usuario haya terminado de usarlo. Por otra parte, la atomicidad asegura que todos los pasos relacionados en una transacción se completen satisfactoriamente como un todo(withee, 2010). Si algún paso falla, ningún otro paso debe ser completado. 17

Los sistemas de bases de datos con procesamiento transaccional deben ser diseñados para promover, entre otros aspectos: una buena colocación de los datos, transacciones que minimicen los bloqueos producto de la concurrencia, una alta normalización de la base de datos yel uso cuidadoso de los índices. 1.4.2. Extracción, Transformación y Carga de los datos El proceso de Extracción, Transformación y Carga conocido como ETL (por sus siglas en inglés, Extract, Transform and Load) (Withee, 2010) permite a las organizaciones mover datos desde múltiples fuentes, transformarlos y limpiarlos, y cargarlos en otra base de datos para analizar o apoyar un proceso de negocio. Este proceso se divide en tres partes: Extracción. Transformación Carga La primera parte del proceso ETL consiste en extraer los datos desde los sistemas de origen. La mayoría de los proyectos de almacenamiento de datos fusionan datos provenientes de diferentes sistemas de origen. Cada sistema separado puede usar una organización diferente de los datos o formatos distintos. Los formatos de las fuentes normalmente se encuentran en bases de datos relacionales o ficheros planos, pero pueden incluir bases de datos no relacionales u otras estructuras diferentes. Una parte importante del proceso de extracción es la de analizar los datos extraídos, la que se realiza a través de un chequeo que verifica si los datos cumplen la estructura esperada. Si los datos no tienen la estructura requerida serán rechazados. La extracción convierte los datos a un formato preparado para iniciar el proceso de transformación. La fase de transformación aplica una serie de reglas o funciones sobre los datos extraídos para convertirlos en datos que serán cargados. Algunas fuentes de datos 18

requerirán alguna manipulación de los datos. No obstante en otros casos pueden ser necesarias aplicar algunas de las siguientes transformaciones: Seleccionar sólo ciertas columnas para cargar. Dividir una columna en varias. Transponer o pivotar, convirtiendo filas en columnas o viceversa. Traducir códigos. Codificar valores libres. Obtener nuevos valores calculados. Unir datos de múltiples fuentes. La aplicación de una forma simple o compleja, de validación de datos, y la consiguiente aplicación de la acción que en cada caso se requiera: o Datos correctos: Entregar datos a la siguiente etapa, la etapa de carga. o Datos erróneos: Ejecutar políticas de tratamiento de excepciones, como puede ser, rechazar el registro completo o dar al campo erróneo un valor nulo o vacío. La fase de carga comienzacuando los datos provenientes de la fase de transformación son cargados en el sistema de destino. Dependiendo de los requerimientos de la organización, este proceso puede abarcar una amplia variedad de acciones diferentes. En algunas bases de datos se sobrescribe la información antigua con nuevos datos. Los almacenes de datos mantienen un historial de los registros de manera que se pueda disponer de un rastro de toda la historia de un valor a lo largo del tiempo.la fase de carga interactúa directamente con la base de datos de destino. Al realizar esta operación se aplicarán todas las restricciones que se hayan definido en dicha fase, garantizando la calidad de los datos en el proceso ETL. 1.4.3. Almacén de Datos Los sistemas que se utilizan para administrar y controlar la empresa son los llamados sistemas informacionales(inocencio, Inteligencia de negocios, en qué ayuda a tu 19

negocio y cuál es su proceso, 2004). Ellos se apoyan en los datos que sustentan el proceso de toma de decisiones en una organización y en datos estables en el tiempo, periódicos o históricos. Se diseñan principalmente para ejecutar consultas complejas y de sólo lectura, que involucran perspectivas a partir de dichos datos. La mayoría de las organizaciones realiza labores con el fin de conseguirinformación relevante, pero estas acciones no son suficientes, porque la calidad de lainformación también depende del desarrollo tecnológico(inocencio, Inteligencia de negocios, en qué ayuda a tu negocio y cuál es su proceso, 2004).Con el objetivo de dar apoyo y solución a estos problemas surge el almacén de datos o datawarehouse(kimball & Ross, 2010), quereúne y organiza grandes volúmenes de datos provenientes de las diversas unidadesque contienen todos los datos. Además, asegura que los datos estén disponibles conla flexibilidad y velocidad necesarias. Un almacén de datos es un repositorio donde se integran y almacenan diferentes fuentes de información, necesaria para soportar los procesos de toma de decisiones; es la plataforma central de las soluciones de Inteligencia de Negocios que permite entender la información del negocio y soportar el proceso de toma de decisiones. Un almacén de datos es el lugar donde las personas pueden acceder a la información de la organización y debe cumplir con las siguientes características: Provee el acceso a los datos a todos los niveles de la organización. Posee diferentes temas que pueden ser analizados independientes o de manera integrada. Brinda un conjunto de herramientas que permiten consultar, analizar y presentar información. El origen de los datos en un almacén de datoses, en la mayoría de los casos, el entornooperacional. Los datos de un almacén de datos están siempre transformados y separadosfísicamente de la aplicación de dónde proceden.losobjetivos estratégicos 20

generales del negocio son comunes a toda la organización,independientemente del departamento, área o sección. En una organización es normalencontrar diferentes sistemas según la actividad, función y procedimientos querealizan, pero todos ellos deben estar en perfecta armonía para conseguir los objetivosgenerales. Es por esto que todos los sistemas pertenecientes al conjunto deben tener visión sobre el almacén de datos, pues algunos de estos sistemas alimentarán los almacenes de datos y otroslos consultarán. La finalidad de crear un almacén de datosen unaorganización es poder obtener todo el conocimiento necesario para tomar las mejoresdecisiones y diseñar las mejores estrategias de negocio. La principal característica de un almacén de datoses que está orientado al tema. Los clásicossistemas operacionales están orientados a la aplicación y funciones. En un almacén de datoslos datos son estructurados según los aspectos que son de interés enla organización. La información en los almacenes de datosdebe estarsiempre integrada. La integración de datos se manifiesta en muchos aspectos, entrelos cuales se encuentran los siguientes: Codificación. Medida de atributos. Convenciones de nombrado. Fuentes múltiples. En un almacén de datos se almacenan datos históricos en los que el tiempo está implícito en lainformación que contiene. La información contenido en un almacén de datos permite haceranálisis de tendencias, a través del análisis de los distintos valores queuna variable ha tomado en el tiempo. La información contenidaen un almacén no puede ser modificada, es permanente y cuando se realiza una nueva inserción se incluye el tiempo de validez del valor actual y del anterior. 21

1.4.3.1. Almacén de Datos Operacionales Un Almacén de Datos Operacionales(delinglés Operational Data Store,ODS)(TechTarget, 2012)es una base de datos orientada a temas, integrada, variante en el tiempo, no volátil usada para soportar el proceso de toma de decisiones tácticas. El ODS es un sistema que recopila la información existente en los sistemas operacionales y la ofrece a los sistemas informacionales o directamente a los usuarios finales del negocio. Los sistemas ODS se alimentan de datos provenientes de los sistemas de gestión u operacionales, con la periodicidad que se precise. Para esto, es necesario diseñar los procesos de carga de datos de los sistemas al ODS, y configurar las autorizaciones de acceso pertinentes. Sirven para consultar datos, generar informes o realizar estudios y análisis de información. La orientación del sistema ODS es hacia un sistema informacional, no hacia un sistema transaccional, ya que la funcionalidad principal es el ser fuente de información para usuarios finales directamente o a través de sistemas informacionales. Por tanto, la disponibilidad y criticidad del sistema deben ser similares a la de un sistema informacional teniendo en cuenta que los tiempos de respuesta y la disponibilidad de la información son lo más óptimos posible pero sin tener la necesidad de llegar al mismo nivel que un sistema transaccional. Debido a la posible dependencia de información que podría existir entre los distintos sistemas operacionales, el ODS cubre la funcionalidad que estos ofrecen pero teniendo en cuenta las premisas anteriores, es decir, que terceros sistemas que accedan al sistema ODS para recoger información deben tener una necesidad de dicha información similar a la de un sistema informacional, y que la disponibilidad de la información no va ser como si esta se encontrase en un sistema transaccional. 22

Con esto se consigue que el sistema ODS no sea el pivote sobre el que giren todos los demás sistemas, sino únicamente los sistemas informacionales, con lo que una inactividad delods no provocaría dependencias en posibles sistemas críticos(pareek, 2007). 1.4.3.2. Datamarts El acceso a los datos de toda la empresa a veces no es conveniente o necesario para determinados usuarios que sólo necesitan un subconjunto de estos datos, en estos casos se utilizan los datamarts(greenhouse, 2012). El concepto datamart es una especialización del almacén de datos, y está enfocado a un departamento o área específica de la organización. Un datamart es una base de datos departamental, especializada en el almacenamiento de los datos de un área de negocio específica. Se caracteriza por disponer la estructura óptima de datos para analizar la información al detalle desde todas las perspectivas que afecten a los procesos de dicho departamento. Un datamart puede ser alimentado desde los datos de un almacénde datos, o integrar por sí mismo un compendio de distintas fuentes de información. Por tanto, para crear el datamart de un área funcional de la empresa es preciso encontrar la estructura óptima para el análisis de su información, estructura que puede estar montada sobre una base de datos OLTP, como el propio almacén de datos, o sobre una base de datos de procesos analíticos en línea(onlineanalyticalprocessing,olap, por sus siglas en inglés). La designación de una u otra dependerá de los datos, los requisitos y las características específicas de cada departamento. De esta forma se pueden plantear dos tipos de datamarts: Datamart OLAP: Se basan en los cubos OLAP, que se construyen agregando, según los requisitos de cada área o departamento, las dimensiones y los indicadores necesarios de cada cubo relacional. El modo de creación, 23

explotación y mantenimiento de los cubos OLAP es muy heterogéneo, en función de la herramienta final que se utilice. Datamart OLTP: se basan en un simple extracto del almacén de datos, no obstante, lo común es introducir mejoras en su rendimiento (las agregaciones y los filtrados suelen ser las operaciones más usuales) aprovechando las características particulares de cada área de la empresa. Las estructuras más comunes en este sentido son las tablas de reportes y las vistas materializadas, que se construyen con la misma estructura que las anteriores, pero con el objetivo de explotar la reescritura de consultas. Los principales beneficios de utilizar los datamartsson: Aceleran las consultas reduciendo el volumen de datos a recorrer. Estructuran los datos, permitiendo el acceso a los mismos por medio de un gran número de herramientas del mercado, de manera independiente. Validación directa de la información. Permite dividir los datos para imponer estrategias de control de acceso. Segmentan los datos en diferentes plataformas hardware. Facilidad para guardar datos históricamente. A continuación veremos cuáles son las principales herramientas y sistemas que acceden a los almacenes de datos, anteriormente explicados 1.4.4. Herramientas de acceso al almacén de datos Uno de los componentes quedan soporte a la Inteligencia de Negocios, son las herramientas que proveen acceso a los datos, pueden serherramientas de reporte y consultas o técnicas de minería de datos, entre otras específicas de mercado para visualización de bases multidimensionales almacenadas, como también aplicaciones desarrolladas dentro de la organización(kimball & Ross, 2010). A continuación se 24

explican las características principales que poseen algunas de proveen acceso a los datos en la arquitectura de la Inteligencia. herramientas que 1.4.4.1. Herramientas de reporte y consultas Las herramientas de reporte y consultas(en inglés, Query&Reporting Tools) (Penton, 2011)son unacategoría de herramientas de Inteligencia de Negocios yestán orientadas al usuario final. Las mismas permiten mejorar la obtención de información en la organización al disminuir una capa intermedia entre complejidad técnica y usuariofinal.un usuario final es aquel que requiera hacer una consulta o reporte, cualquiera que necesite información procesada de fuentes de datos es un usuario potencial. Las herramientas de reportes orientadas al usuario final aíslan la compleja capa técnica propia del lenguaje de sistemas, tal como lenguaje SQL (del inglés, Simple QueryLanguage), uniones de tablas y nombres crípticos, al organizar los datos de la terminología de negocios. El resultado es que el usuario final tiene una vista mucho más parecida a su concepción del negocio, o al menos lo suficiente como para poder generar sus propios reportes y publicación de los mismos, sin depender de los usuarios técnicos. El usuario de sistemas continúa participando, pero básicamente en el control sobre el acceso a bases de datos, administración, mantenimiento, seguridad, impacto en la red e incluso, creación única de reportes complejos; el usuario final tiene solo un ambiente amigable en el que es posible crear sus propias consultas y reportes. Una herramienta de reporte y consultas puede también publicar los datos contenidos en un almacén de datos. Desde ese punto de vista, se brinda con la tecnología, la posibilidad de que el usuario final no solo consulte y publique la información a detalle, sino información concentrada y agrupada. 25

1.4.4.2. Minería de datos La minería de datos (en inglés, Data Mining)(Olson & Delen, 2008)es la extracción de información oculta y predecible de grandes bases de datos, útil a partir del volumen de información presente en la base de datos, almacenes de datosu otros almacenamientos que dan soporte a los sistemas de información de las organizaciones.los análisis ofrecidos por la automatización delaminería de datos van más allá de los eventos pasados provistos por las herramientasusuales de sistemas de soporte de decisión. La minería de datos permite a empresas einvestigadores hacer el conocimiento explícito y utilizarlo en procesos de toma de decisiones. En la minería de datos, se coleccionan los datos para extraer hipótesis de ellos. El objetivo es que los datos nos describan o indiquen sus características principales.validar esa hipótesis inspirada por los datos en los datos mismos, sería numéricamente significativa, pero en opinión de algunos autores, experimentalmente inválida.la minería de datos abarca, entonces, un terreno más amplio, no es solamente aplicar un algoritmo existente a un conjunto de datos. En los últimos años, la minería de datos ha experimentado un auge como soporte para la gestión de la información y el conocimiento, como alternativa a la modelación matemática(witten & Frank, 2005). La minería de datos usa principios estadísticos contrastados para detectar patrones en los datos, ayudándole a tomar decisiones inteligentes sobre problemas complejos.las herramientas existentes actualmente incluyen mecanismos para la preparación de los datos, su visualización y la interpretación de los resultados, las mismas predicen futuras tendencias y comportamientos.las herramientas de minería de datos pueden responder a preguntas de negociosque tradicionalmente consumen demasiado tiempo para poder ser resueltas.estas herramientas exploran las bases de datos en busca de 26

patrones ocultos,encontrando información predecible que un experto no puede llegar a encontrar. Las compañías colectan y refinan cantidades masivas de datos. Lastécnicas de minería de datos pueden ser implementadas rápidamente en plataformasya existentes para acrecentar el valor de las fuentes deinformación existentes y pueden ser integradas con nuevos productos y sistemas(larose, 2005). Las técnicas de minería de datos crean modelos que son predictivos o descriptivos.un modelo predictivo responde preguntas sobre datos futuros, mientras que un modelo descriptivo proporciona información sobre las relaciones entre los datos y sus características. Algunas de las tareas que llevan a cabo las técnicas de minería de datos son: Clasificación: se puede ver como el esclarecimiento de una dependencia, en la que el atributo dependiente puede tomar un valor entre varias clases, ya conocidas. Regresión:el objetivo es predecir los valores de una variable continua a partir de la evolución sobre otra variable continua, generalmente el tiempo. Asociaciones: una asociación entre dos atributos ocurre cuando la frecuencia de que se den dos valores determinados de cada uno conjuntamente es relativamente alta. Dependencias: una dependencia funcional, aproximada o absoluta, es un patrón en el que se establece que uno o más atributos determinan el valor de otro. Agrupamiento: el agrupamiento (del inglés,clustering) es la detección de grupos de individuos. Se diferencia de la clasificación en el que no se conocen ni las clases ni su número, con lo que el objetivo es determinar grupos diferenciados del resto. 1.4.4.3. Sistemas de Información Ejecutiva 27

Los Sistemas de Información Ejecutiva, (ExecutiveInformationsSystem, EIS, por sus siglas en inglés)(pareek, 2007) son aplicaciones que muestran información ejecutiva de las diferentes áreas del negocio en un solo sistema, facilitando el monitoreo de la empresa. El EIS es una técnica del más alto nivel dentro de las herramientas de Inteligencia de Negocios,tiene como objetivo principal proveer la información necesaria para la toma decisiones, de modo fácil y con una mínima interacción con el sistema. Un EIS permite a los ejecutivos un acceso rápido y efectivo a información compartida, crítica para el negocio, utilizando interfases gráficas. Las interfases que son utilizadas en estos sistemas deben ser más sofisticadas que los sistemas transaccionales y deben incluir, la mayor cantidad de información que el usuario necesita para monitorear su empresa. La función principal de un EIS es el monitoreo de la empresa o de una área de negocio específica. Se debe entender que el monitoreo implica una visualización de lo que se quiere controlar y, por tal motivo, no debe existir mayor esfuerzo por parte del usuario que simplemente ver las consultas que cotidianamente realiza. La información que un EIS presenta es producto de indicadores empresariales que cotidianamente son evaluados para analizar su comportamiento y lo que permite determinar su cualidad son las propiedades que le son asignadas a cada indicador. Los EIS interpretan y manipulan de forma diferente la información, pues trabajan con formatos de datos no típicos, tales como almacenes de datos o datamart. Prácticamente todos los EIS obtienen sus datos de matrices multidimensionales y las herramientas en las que se desarrollan estos sistemas tienen tecnología que permite realizar consultas amplias y complejas de diversas fuentes de datos en tiempos mínimos. Las partes importantes de un EIS son: la interfaz de usuario y la base de datos multidimensional. Normalmente los escenarios que se le presentan al usuario final 28

poseen información que se obtiene de forma consolidada, proveniente de múltiples fuentes de datos. El cliente es precisamente el usuario final, a quien se le debe presentar, de una forma amigable y sencilla, la mayor cantidad de información posible para que le apoye a visualizar sus variables de control del área específica que gestiona. Cada escenario en un EIS se adecua a los casos particulares de cada usuario, proveyendo la información necesaria para tomar decisiones. En la mayoría de los casos, los EIS tienen en la gráfica su principal medio de representar información al usuario, pues es la forma más sencilla de realizar comparaciones entre variables. También las tablas son una forma bastante sencilla, y útil para brindar información al usuario, pero esos componentes deben complementarse con otras utilerías y componentes que permitan no solo ver, sino también analizar lo que está pasando en la empresa de manera rápida y cómoda. En términos prácticos, un tomador de decisiones puede entender más el comportamiento de su empresa si ve escenarios en donde no sea necesario interactuar, pero que tenga la información que necesita para controlar su negocio. Después de esta breve reseña de la arquitectura de Inteligencia de Negocios, en el siguiente epígrafe se describen las principales características de la Web 2.0 y su interrelación con la Inteligencia de Negocios. 1.5. Web 2.0 La Web(Wikilibros, 2012)es un sistema de hipermedia que maneja acceso interactivo. Un sistema hipermedia es una extensión directa del sistema tradicional de hipertexto,en la cual la información se almacena como documentos, los que pueden tener apuntadores a otros documentos del grupo. La Web distribuye los documentos entre varias computadoras. Los vínculos no siempre son congruentes, entre los documentos pueden invalidarse. Los documentos de la Web emplean la representación de lenguaje de marcaje de hipertexto (HTML), en lugar de especificar un formato detallado del 29

documento, el HTML permite que este tenga guías generales de presentación y que el visualizador se encargue de los detalles;en consecuencia, dos visualizadores pueden presentar de manera diferente un documento HTML. La Web desde su surgimiento, ha crecido y ha pasado de ser un grupo de herramientas de trabajo a convertirse en un espacio global de información con más de mil millones de usuarios. En la actualidad está simultáneamente volviendo a sus raíces como herramienta de lectura o escritura y entrando en una fase más social y participativa. Estas tendencias han generado la sensación de que la web estáalcanzando una segunda fase, una versión nueva y con más funcionalidades: la Web 2.0(Czernicki, 2009). La Web 2.0 corresponde a una segunda generación de comunidades basadas en la web y de servicios residentes en ella; tales como sitios que permiten establecer o generar redes sociales, wikis y folksonomiesque buscan facilitar la creatividad, la colaboración y dan la posibilidad de compartir contenidos y otros recursos entre usuarios. La Web 2.0 es mucho más que una serie de nuevas tecnologías y servicios atractivos puestiene como punto central un conjunto de ideas poderosas que están cambiando la forma en la que algunas personas interactúan. Es importante notar que esas ideas no necesariamente garantizan la existencia de la Web 2.0(Czernicki, 2010); de hecho, son un reflejo directo o indirecto esto se contradice o es directo o indirecto del poder de la red: los extraños efectos y las topologías que producen a nivel micro y macro mil millones de usuarios de Internet. El cubrimiento mediático de la Web 2.0 se concentra en los servicios o aplicaciones comunes de esta, tales como los blogs, el compartir video y las redes sociales ; una web con una interconexión social mucho mayor en la que las personas pueden realizar contribuciones en la misma medida en la que consumen información y utilizan 30

servicios(czernicki, 2009). Si nos atenemos a cómo se articuló originalmente la Web 2.0 nos encontramos que de hecho es un término que intenta expresar claramente el conjunto de ideas que la sostienen para tratar de entender las manifestaciones de las novedades que ofrecen esos servicios web dentro del contexto de las tecnologías de la información que los han producido. La Web 2.0 hace referencia a un grupo de tecnologías que se consideran profundamente asociadas con el término, tales como los blogs, wikis, sistemas de sindicación simple (del inglés, Really Simple Sindication,RSS)(mrpooper, 2010), entre otros, que facilitan una web socialmente más conectada en la que los usuarios puede agregar o editar la información presentada. El usuario es un contribuyente importante, pues se puede aprovechar el poder de la multitud a través de las experiencias enriquecidas. La Web 2.0 también tiene que ver con economía, tecnología y nuevas ideas sobre la sociedad conectada. La Web 2.0 debe considerarse no como algo diferente sino como una Web 1.0 con mayores implementaciones. Aunque el término sugiere una nueva versión de la web, no se refiere a una actualización o a cambios técnicos específicos de esta, sino a modificaciones hechas por los desarrolladores de software y a la manera en que los usuarios finales utilizan la web. La Web 2.0 constituye un espacio social horizontal y rico en fuentes de información donde el conocimiento no está cerrado, supone una alternativa a la jerarquización y unidireccionalidad tradicional de los entornos formativos(torre, 2011), además tiene innumerables ventajas, algunas de ellas son: Permite buscar, crear, compartir e interactuar en línea, Implica nuevos roles para profesores y alumnos orientados al trabajo autónomo y colaborativo, crítico y creativo, la expresión personal, investigar y compartir recursos, crear conocimiento y aprender. Con sus aplicaciones de edición 31

profesores y estudiantes pueden elaborar fácilmente materiales de manera individual o grupal, compartirlos y someternos a los comentarios de los lectores. Sus fuentes de información, aunque no todas son fiables, y canales de comunicación facilitan un aprendizaje más autónomo y permiten una mayor participación en las actividades grupales, que suele aumentar el interés y la motivación de los estudiantes. Proporciona espacios on-line para el almacenamiento, clasificación y publicación o difusión de contenidos textuales y audiovisuales, a los que luego todos podrán acceder. Facilita la realización de nuevas actividades de aprendizaje y de evaluación y la creación de redes de aprendizaje. Se desarrollan competencias digitales, desde la búsqueda y selección de información y su proceso para convertirla en conocimiento, hasta su publicación y transmisión por diversos soportes. 1.6. Inteligencia de Negocios y la Web 2.0 La Inteligencia de Negocios y la Web 2.0 se han combinado en lo que podría denominarse Business Intelligence 2.0 (BI 2.0). BI 2.0 se basan en la idea de una Inteligencia de Negocio más democrática y colaborativa, no gestionada desde los departamentos de tecnología, ni por analistas especializados, sino directamente desde los responsables de la toma de decisiones, gestores, e incluso, empleados en general. BI 2.0 permite que una más amplia diversidad de usuarios del negocio de todos los niveles, no sólo los estadísticos o analistas de datos, puedan aprovechar las innovadoras tecnologías y capacidades de esta tecnología basadas en la web. Todas las nuevas herramientas que cabría incluir bajo la denominación BI 2.0 pretenden ofrecer al usuario sin conocimientos técnicos la posibilidad de aplicar la Inteligencia de Negocios según sus necesidades en cada momento(czernicki, 2010). 32

Están orientadas a hacer más fácil la creación y el uso de aplicaciones analíticas. BI 2.0 posibilita un mayor despliegue de las aplicaciones de Inteligencia de Negocio que puedan ser usadas tanto por desarrolladores como usuarios finales, gracias a la creciente disponibilidad de interfaces de usuario basados en web. También están contribuyendo a este cambio las mejoras en los esquemas de acceso y gestión de la información, como son las arquitecturas de datos orientadas a servicios, que permiten a los usuarios entrelazar datos de una diversidad de fuentes en formatos cada vez más estandarizados. 1.7. Conclusiones En este capítulo se han presentado los aspectos teóricos relacionados con la Inteligencia de Negocios, disciplina que combinaconsultas, servicios, aplicaciones y tecnologías para obtener, administrar, analizar y transformardatos en información útil para desarrollar el entendimiento necesario para tomar decisionesadecuadas. No obstante las tecnologías y herramientas de Inteligencia de Negociosno pueden presentarse como una solución única y completa a la gestión empresarial, por el contrario seinvolucra un grado de complejidad alto, donde abarca gran número denecesidades de análisis de información que son resueltas por diferentestecnologías y herramientas. En el siguiente capítulo se describe la metodología escogida para desarrollar nuestra investigación y cómo la adaptamos a nuestro problema de Inteligencia de Negocios. 33

Capítulo 3.Análisis comercial de los establecimientos a mostrar en la aplicación web dentro de SAN 3.1. Conclusiones El análisis comercial realizado a los establecimientos permitió observar la relación que existe entre los distintos indicadores comerciales y los resultados de las mediciones estadísticas. Se integró nuestro modelo de minería a SAN y se usó un diseño que se permite brindar la información comercial de los establecimientos a través de una interfaz web amigable al usuario. La aplicación web desarrollada usando el control PivotViewerpermite,de una manera sencilla y fácil, no solo ver los resultados del análisis comercial realizado a los establecimientos de la Red de Tiendas Minoristas de la Corporación CIMEX, sino también conocer otros indicadores del comportamiento de los establecimientos.pivotviewer nos ofrece un sistema de visualización de la información, filtrado y organización de la misma muy eficiente, permitiéndonos realizar búsquedas y categorizaciones de manera rápida y confiable. 34

Conclusiones Conclusiones Los objetivos propuestos para este trabajo de investigación se cumplieron de manera satisfactoria pues se desarrolló el análisis de los indicadores comerciales de los establecimientos de la Red de Tiendas Minoristas de la Corporación CIMEX. Además se creó una aplicación web dentro del portal SAN que muestra los resultados del análisis comercial realizado y otros tipos de información que sirven para tener una mayor información comercial de los establecimientos, facilitando la toma de decisiones. Para alcanzar dicho objetivo se realizaron las siguientes tareas: Se realizó un estudio de las herramientas de Inteligencia de Negocios utilizadas en la Corporación CIMEX para la toma de decisiones. Se definieron los indicadores comerciales, mediante la selección o la creación de nuevos indicadores que responden a las características distintivas de los establecimientos de la Corporación CIMEX, los cualesbrindan información comercial relevante sobre el comportamiento de los mismos. Se estudió la metodología de investigación seleccionada y se hizo una adaptación de sus fases y tareas a nuestra investigación. Se estudió la herramienta SQL Server AnalysisServices,lo que permitió definir las estructuras y los modelos de minería que responden a las necesidades del negocio. Se implementó el algoritmo de agrupamiento para realizar el análisis comercial de los establecimientos. Se diseñó e implementó una aplicación web dentro del portal SANamigable al usuario, usando herramientas y tecnologías modernas, para mostrar el análisis comercial realizado a los establecimientos de la Red de Tiendas Minoristas, facilitando la toma de decisiones de la Corporación CIMEX. 35

Bibliografía Bibliografía 1. Corporación CIMEX - Ecured. (2012). Consultado Junio 18, 2012, URL:Ecured: http://www.ecured.cu/index.php/corporación_cimex.htm 2. Aminer. (30 de Juniode 2010).Pivot Collection Tool for the Command Line. Consultado Mayo 10, 2012, URL:http://pauthor.codeplex.com/ 3. Bustelo Ruesta, C., & Amarilla Iglesias, R. (2001). Gestión del conocimiento y gestión de la información. Boletín del Instituto Andaluz de Patrimonio Histórico, 226-230. 4. Carrion, J. (2006). Diferencia entre dato, información y conocimiento. Consultado Marzo 2012, 19, URL:http://www.gestiondelconocimiento.com/conceptos_diferenciaentredato.htm 5. Carrion, J. (n.d.). Diferencia entre dato, información y conocimiento. Consultado Marzo 2012, 19, URL:http://www.gestiondelconocimiento.com/conceptos_diferenciaentredato.htm 6. Chapman, P., Clinton, J., &Kerber, R. (n.d.). Metodología CRISP-DM para minería de datos. Consultado Marzo 26, 2012, URL:http://www.dataprix.com/book/export/html/107 7. Czernicki, B. (2009). Next-Generation Business Intelligence Software with Silverlight 3.United Statesof America: Bart Czernicki. 8. Czernicki, B. (2010). Silverlight 4 Business Intelligence Software. United States of America: Bart Czernicki. 9. DATACIMEX, P. I. (n.d.). Acerca de Cimex. Consultado Marzo 2012, URL: Acerca de Cimex: www.cimexweb.com 10. Fouché, G., &Langit, L. (2011). Foundations of SQL Server 2008 R2 Business Intelligence. United States of America: Guy Fouché and Lynn Langit. 11. Goicochea, A. (2009, Agosto 11). CRISP-DM, Una metodología para proyectos de Minería de Datos. Consultado Marzo 26, 2012, 36

Bibliografía URL:http://anibalgoicochea.com/2009/08/11/crisp-dm-una-metodologia-paraproyectos-de-mineria-de-datos/ 12. Greenhouse, S. (2012). Data Mart. ConsultadoMarzo 19, 2012, URL:http://www.swgreenhouse.com/Productos/Hi-Spins/DataMart.html 13. Inocencio, B. C. (2004). Inteligencia de negocios, en qué ayuda a tu negocio y cuál es su proceso. Consultado Marzo 15, 2012, URL:http://www.gestiopolis.com/inteligencia-negocios/ 14. Inocencio, B. C. (n.d.). Inteligencia de negocios, en qué ayuda a tu negocio y cuál es su proceso. Consultado Marzo 15, 2012, URL:http://www.gestiopolis.com/inteligencia-negocios/ 15. Kimball, R., & Ross, M. (2010). The Kimball Group Reader; Relentlessly Practical Tools for Data Warehousing and Business Intelligence. Indiana: Wiley Publishing, Inc. 16. Larose, D. T. (2005). Discovering knowledge in data: an introduction to data mining. New Jersey: John Wiley & Sons, Inc. 17. MacLennan, J., Crivat, B., & Tang, Z. (2009). Data Mining with SQL Server 2008.Indianapolis: Wiley Publishing, Inc. 18. Microsoft, M. (2012). Consultar un modelo de agrupación en clústeres (AnalysisServices - Minería de datos). Consultado Mayo 21, 2012, URL:http://msdn.microsoft.com/es-es/library/cc280440%28v=sql.105%29 19. Microsoft, M. (2012). Estructuras de minería de datos (AnalysisServices - Minería de datos). Consultado Mayo 21, 2012, URL:http://technet.microsoft.com/es-es/library/ms174757.aspx 20. Microsoft, M. (2012). Modelos de minería de datos (AnalysisServices - Minería de datos). Consultado Mayo 21, 2012, URL:http://technet.microsoft.com/eses/library/cc645779.aspx 21. Microsoft, M. (2012). Validar modelos de minería de datos (AnalysisServices - Minería de datos). Consultado Mayo 21, 2012, URL:http://msdn.microsoft.com/es-es/library/ms174493%28v=sql.105%29.aspx 37

Bibliografía 22. Microsoft, T. (n.d.). Analysis Services.Consultado Mayo 21, 2012, URL:http://technet.microsoft.com/es-es/library/bb522607.aspx 23. mrpooper. (2010, Septiembre 8). An Overview of The Concept Behind Rss Feeds. Consultado Abril 26, 2012, URL:http://www.bukisa.com/articles/350748_an-overview-of-the-concept-behindrss-feeds 24. MSDN. (2012). Consultar un modelo de agrupación en clústeres (AnalysisServices - Minería de datos). Consultado Mayo 21, 2012, URL:http://msdn.microsoft.com/es-es/library/cc280440%28v=sql.105%29 25. MSDN. (2012). Estructuras de minería de datos (AnalysisServices - Minería de datos). Consultado Mayo 21, 2012, URL:http://technet.microsoft.com/eses/library/ms174757.aspx 26. MSDN. (2012). Validar modelos de minería de datos (AnalysisServices - Minería de datos). Consultado Mayo 21, 2012, URL:http://msdn.microsoft.com/eses/library/ms174493%28v=sql.105%29.aspx 27. Olson, D. L., &Delen, D. (2008). Advanced Data Mining Techniques. Germany: Springer-Verlag Berlin Heidelberg. 28. Ortiz Ortiz, M. C. (2007). La inteligencia de negocios aplicada a las organizaciones en Latinoamérica. Seminario de FormaciónInvestigativa, (pp. 2-19). Medellin. 29. Pareek, D. (2007). Business Intelligence for Telecommunications. New York: Taylor & Francis Group, LLC. 30. Penton. (2011, Junio 11). When Does a Query Tool Become a BI App? - Productos Lines Blog.Consultado Abril 26, 2012, URL:http://www.iprodeveloper.com/blog/product-lines-19/-no-topic/when-does-aquery-tool-become-a-bi-app-699200 31. Proaño, D. (2011, Febrero 20). Introducción a AnalysisServices SQL Server 2008 R2. Consultado Abril 16, 2012, URL:http://darwinproanioorellana.blogspot.com/2011/02/introduccion-analysisservices-en-sql.html 38

Bibliografía 32. RANJAN, J. (2009). BUSINESS INTELLIGENCE: CONCEPTS, COMPONENTS, TECHNIQUES AND BENEFITS. Journal of Theoretical and Applied Information Technology, pp. 60-70. 33. Sinnexus. (2011). Quées Business Intelligence?Consultado Marzo 15, 2012, URL:http://www.sinnexus.com/business_intelligence/ 34. Sinnexus. (2011). Arquitectura de una solución de Business Intelligence. Consultado Marzo 15, 2012, URL:http://www.sinnexus.com/arquitectura/ 35. Team, M. S. (2011, Julio 18). CollectionDesign. Consultado Enero 2012, 24, URL:http://www.silverlight.net/learn/data-networking/pivot-viewer/collectiondesign 36. Team, M. S. (2011, Julio 18). CollectionHosting. Consultado Enero 24, 2012, URL:http://www.silverlight.net/learn/data-networking/pivot-viewer/collectionhosting 37. Team, M. S. (2011, Julio 18). Collection Tools.Consultado Enero 24, 2012, URL:http://www.silverlight.net/learn/data-networking/pivot-viewer/collection-tools 38. TechTarget. (2012). operational data store (ODS). Consultado Marzo 19, 2012, URL:TechTarget: http://searchoracle.techtarget.com/definition/operational-datastore 39. Torre, A. d. (2011, Mayo 3). Definición de Web 2.0. Consultado Marzo 20, 2012, URL:http://www.adelat.org/index.php?title=conceptos_clave_en_la_web_2_0_y_i ii&more=1&c=1&tb=1&pb=1 40. Torres, L. (2008, Marzo 12). SQL Server 2008, nuevas características. Consultado Abril 16, 2012, URL:http://www.gravitar.biz/index.php/sql-server/sqlserver-2008/ 41. Van Der Henst S., C. (n.d.). Qué es la Web 2.0? Consultado Marzo 26, 2012, URL:http://www.maestrosdelweb.com/editorial/web2/ 42. Watson, I. (2003). Applying Knowledge Management, Techniques for Building Corporate Memories. San Francisco: Morgan Kaufmann Publishers. 43. Wenz, C. (2007). Essential Silverlight. Sebastopol: O Reilly Media, Inc. 39

Bibliografía 44. Wikilibros. (2012, Marzo 20). Web 2.0/Definición y características más importantes - Wikilibros. Consultado Abril 26, 2012, URL:http://es.wikibooks.org/wiki/Web_2.0/Definición_y_características_más_imp ortantes 45. Withee, K. (2010). Business Intelligence For Dummies. Indiana: Wiley Publishing, Inc. 46. Witten, I. H., & Frank, E. (2005). Data mining: practical machine learning tools and techniques. San Francisco: Elsevier Inc. 40

Anexos Anexos Anexo 1. Estructura de la Corporación CIMEX DIVISIONES SUCURSALES SUBSIDIARIAS 41