Modelado de Datos. Jose Aguilar CEMISID, Escuela de Sistemas Facultad de Ingeniería Universidad de Los Andes Mérida, Venezuela
|
|
- Emilio García Alarcón
- hace 8 años
- Vistas:
Transcripción
1 Modelado de Datos Jose Aguilar CEMISID, Escuela de Sistemas Facultad de Ingeniería Universidad de Los Andes Mérida, Venezuela
2 Modelado de Datos y de Información Usuarios tienen diferentes vistas de los datos OLAP Turistas: Navegar por la información recolectada Agricultores: información de los caminos a los datos, etc. Organización Exploradores: Busca cosas desconocidos que se esconden en los datos detallados 2
3 Consideraciones para el Diseño Data warehouse Para abordar un proyecto de data warehouse es necesario hacer un estudio de algunos temas generales de la organización: Situación actual: Cualquier solución propuesta de data warehouse debe estar muy orientada por las necesidades del negocio, debe ser compatible con la arquitectura técnica existente y planeada de la compañía. Tipo y características del negocio: Tener el conocimiento exacto sobre el tipo de negocios de la organización y el soporte que representa la información dentro de todo su proceso de toma de decisiones.
4 Consideraciones para el Diseño Data warehouse Para abordar un proyecto de data warehouse es necesario hacer un estudio de algunos temas generales de la organización: Entorno técnico: hardware (servidores, redes,...) así como aplicaciones y herramientas. Se dará énfasis a los Sistemas de Soporte a Decisiones (DSS). Expectativas de los usuarios: Es una forma de vida de las organizaciones y como tal, tiene que contar con el apoyo de todos los usuarios y su convencimiento sobre su bondad. 4
5 Un enfoque de desarrollo de Data Warehouse Data Warehouse Data Marts Distribuidos multicapa Data Mart Data Mart Data Warehouse Empresarial modelo de datos corporativo 5
6 Modelos dimensionales Es una técnica de diseño lógico comúnmente utilizada para Data Warehouses, que busca presentar los datos en una arquitectura estándar y permita una alta performance de acceso a los usuarios finales. El modelo se basa en esquemas estrella, conformados por Tablas de Hechos y Tablas Dimensionales (p.ej. cubos). 6
7 Modelos dimensionales Un modelo relacional desnormalizado Compuesto por tablas con atributos Las relaciones son definidas por claves nuevas y claves externas Organizado para la comprensibilidad y facilidad de presentación de informes en lugar de facilitar la actualización Consultado y mantenido por herramientas especiales de gestión analítica
8 Diseño de Esquemas Los datos se organizan por temas importantes: Los clientes, los productos, las ventas,... Tema = datos + dimensiones Recopilación de datos útiles sobre un tema Ejemplo: ventas Sintetizar una visión única de los temas a analizar Ejemplo: Ventas (producto, período, tienda, número) Detallar la vista según dimensiones Ejemplo: Productos (IDprod, descripción, color, tamaño...) Tiendas (IDmag, nombre, ciudad, departamento, país) Periodo (IDper, año, trimestre, mes, día)
9 Diseño de Esquemas Los tipos de Esquema En estrella Constelación Copo de nieve 1. Aislar Datos a tener en cuenta Esquemas de las Tablas de hechos 2. Definir las dimensiones Ejes de análisis 3. Estandarizar dimensiones Dividir en varias tablas unidas por referencias 4. Integrar todo Varias tablas de hechos comparten algunas tablas de dimensiones (constelación de la estrella) 9
10 10 Esquema en estrella CATEGORIAS_PROF # c_categoria * descripción * salario_min * salario_max Tablas dimensiones PROF_OFERTAS # c_persona # c_categoria # c_oferta # c_trabajo * salario_deseado PERSONAS # c_persona * nombre * apellido1 * apellido2 * c_categoria * direccion TRABAJO # c_trabajo * descripcion Tabla de Hechos OFERTAS # c_oferta * descripción * salario
11 Esquema en estrella Modelado relacional actual no satisface las necesidades actuales Representaciones de datos multidimensionales Optimizar las operaciones de consulta de datos en lugar de las operaciones de actualización de datos Los datos no representan una transacción del negocio en particular. Los datos pueden obtenerse mediante cálculos o agregaciones.
12 Esquema en estrella El modelo estrella es una representación de una vista de la organización. Ventas Mercadeo El modelo estrella consolida hechos en relación a dimensiones o filtros. Esquema en estrella Hecho rodeado de varias (4-15= dimensiones Las dimensiones se de-normalizan Una tabla de hechos en el medio conectado a un conjunto de tablas de dimensiones
13 Esquema en estrella Una sola tabla de hechos y para cada dimensión una tabla de dimensiones No captura jerarquías directamente fecha, cliennum, prodnum, sitionom, venta Tiempo Producto hecho Cliente Sitio 13
14 Esquema en estrella: Componentes Datos (hechos) Dimensiones Atributos Jerarquías de atributos
15 Tablas de hechos Contienen los hechos que serán utilizados por los analistas para apoyar el proceso de toma de decisiones. Toma los datos desde los sistemas transaccionales Recibe enlace dimensiones Realiza las transformaciones requeridas en los datos Enlaza dimensiones a través de sus claves
16 Esquema en estrella: Hechos Mediciones numéricas (valores) que representan un aspecto del negocio o actividad específica Almacenado en una tabla de hechos en el centro del esquema de estrella Contiene hechos caracterizados a través de sus dimensiones Se pueden calcular o derivar en tiempo de ejecución Actualizado periódicamente con los datos de las bases de datos operacionales
17 Esquema en estrella: Tabla de Hechos Tabla central Representa un proceso o reporta el entorno que es de valor para la organización Especifica exactamente lo que representa. Por lo general, corresponden a una entidad asociativa en el modelo ER Guarda Medidas de interés del negocio Varían bastante sus datos
18 Esquema en estrella: Tabla de Hechos Tabla central Gran número de filas (millones a un mil millones) Algunas columnas como máximo Acceso por dimensiones: Enlaces directos a las dimensiones Contiene dos o más claves foráneas Clave principal de varias partes
19 Tablas de dimensión Definen como están los datos organizados lógicamente y proveen el medio para analizar el contexto organizacional. Toma los datos desde los sistemas transaccionales Depura los valores de los atributos para incorporarlos al modelo dimensional Mantiene las claves Mantiene la tabla de referencias cruzadas
20 Esquema en estrella: Dimensiones Características cualitativas que proveen perspectivas adicionales a un hecho Las dimensiones se almacenan en tablas de dimensiones Dimensiones comunes: períodos de tiempo, áreas geográficas (mercados, ciudades), productos, clientes, vendedores, etc. Típicamente contienen atributos para consultas
21 Esquema en estrella: Tabla de Dimensiones Se enlaza a la tabla de hechos (clave primaria única) Guarda los Atributos del negocio Más o menos constante los datos Contiene información textual descriptiva Filas anchas (muchos campos, inclusos descriptivos) Tablas pequeñas (alrededor de un millón de filas) Ingresó a la tabla de hechos mediante una clave externa Fuertemente indexados
22 Esquema en estrella: Atributos Tablas de dimensiones contienen atributos Los atributos se utilizan para buscar, filtrar o clasificar los hechos Dimensiones proporcionan características descriptivas acerca de los hechos a través de sus atributos Debe definir los atributos comunes que se utilizará para reducir la búsqueda, agrupar información, o describir las dimensiones (por ejemplo, tiempo/lugar/producto) Sin límite matemático para el número de dimensiones (3D hace que sea fácil modelar)
23 Esquema en estrella: Atributos
24 Ejemplo de esquema en estrella para ventas Tablas de Dimensiones Relación M-1 Tabla de hechos
25 Ejemplo de esquema en estrella para Ventas Dimensión Tiempo Tiempo_id Dia_semana Numero_semana Mes Dimensión Almácen Almacen_id Codigo_Almacen Nombre_Almacen Distrito Region Tabla hecho Ventas Tiempo_id (FK) Almacen_id (FK) Producto_id (FK) Promocion_id (FK) Dolares Utilidad Unidades Dimensión Producto Producto_id Codigo Producto Descripcion Producto Marca Categoria Costo Dimensión Promoción Promocion_id Nombre_Promocion Tipo_Promocion Distrito Marca Total Dolares Total Costo Utilidad Unidades Atherton Clean Fast $ 1,233 $ 1,058 $ Atherton More Power $ 2,239 $ 2,200 $ 39 2 Atherton Zippy $ 848 $ 650 $ Belmont Clean Fast $ 2,097 $ 1,848 $ Belmont More Power $ 2,428 $ 2,350 $ 78 3 Belmont Zippy $ 633 $ 580 $ 53 5
26 Conclusiones Esquema en Estrella Las tablas de hechos están relacionados a cada tabla de dimensión en una relación Muchos a Uno Tabla de hechos está relacionado con muchas tablas de dimensiones La clave principal de la tabla de hechos es compuesta de las claves principales de las tablas de dimensiones Cada tabla de hecho está diseñada para responder a una pregunta específica de IN
27 Ejemplo de esquema en estrella para ventas Dim_Empleado Dim_Empleado Dim_Empleado EmployeeKey EmployeeKey Empleado_ID... Empleado_ID... Dim_Empleado Dim_Empleado Dim_Empleado EmployeeKey EmployeeKey Empleado_ID... Empleado_ID... Cod_Empleado Dim_Tiempo Dim_Tiempo Dim_Tiempo TimeKey TimeKey Fecha... Fecha... Dim_Tiempo Dim_Tiempo Dim_Tiempo TimeKey TimeKey Fecha... Fecha... Cod_Tiempo Dim_Producto Dim_Producto Dim_Producto ProductKey ProductKey Producto_ID... Producto_ID... Dim_Producto Dim_Producto Dim_Producto ProductKey ProductKey Producto_ID... Producto_ID... Cod_Producto Dim_Cliente Dim_Cliente Dim_Cliente CustomerKey CustomerKey Cliente_ID... Cliente_ID... Dim_Cliente Dim_Cliente Dim_Cliente CustomerKey CustomerKey Cliente_ID... Cliente_ID... Cod_Cliente Dim_Proveedor Dim_Proveedor Dim_Proveedor ShipperKey ShipperKey Proveedor_ID... Proveedor_ID... Dim_Proveedor Dim_Proveedor Dim_Proveedor ShipperKey ShipperKey Proveedor_ID... Proveedor_ID... Cod_Proveedor Fact_Ventas Fact_Ventas TimeKey EmployeeKey ProductKey CustomerKey ShipperKey TimeKey EmployeeKey ProductKey CustomerKey ShipperKey Monto_Ventas... Monto_Ventas... Fact_Ventas Fact_Ventas TimeKey EmployeeKey ProductKey CustomerKey ShipperKey TimeKey EmployeeKey ProductKey CustomerKey ShipperKey Monto_Ventas... Monto_Ventas... Cod_Tiempo Cod_Cliente Cod_Proveedor Cod_Producto Cod_Empleado Clave Múltiple Clave Clave Múltiple ltiple Clave Múltiple Clave Clave Múltiple ltiple Medidas Medidas Medidas Medidas Medidas Medidas Claves Dimensionales Claves Claves Dimensionales Dimensionales
28 Esquema Copo de nieve Un refinamiento del esquema en estrella donde alguna jerarquía dimensional se despliega en un conjunto de tablas de dimensiones más pequeñas, Forma similar a la del copo de nieve Esquema en estrella con dimensiones secundarias Fácil de mantener y ahorra almacenamiento Copo de nieve cuando las dimensiones tienen muchos atributos
29 Esquema Copo de nieve Representa jerarquía dimensional fecha, cliennum, prodnum, sitionom, venta Tiempo Producto hecho Cliente Sitio región 29
30 Esquema Copo de nieve Beneficios Evita la duplicación Conduce a las constelaciones (varias tablas de hechos con dimensiones compartidas) Ventas Producto IDprod descripción color tamaño IDprov Proveedor IDprov descripción tipo Dirección
31 Esquema Copo de nieve Dimensión del almácen Clave Almacen Descripción Ciudad Estado ID Distrito ID Distrito Desc_distrito ID_Región ID Región Descrip Región Gerente Región.. Tabla hecho almácen Clave Almacen Clave producto Clave Periodo Monto Unidades Utilidad
32 Esquema Copo de nieve Tiempo Clave_tiempo día semana mes periodo año Tabla Hechos Ventas clave_tiemp Clave_prod producto Clave_prod nombre descrp tipo Clave_prov proveedor Clave_prov Tipo_prov cliente clave_cliente nombre Tipo Medidas clave_cliente Clave_localidad unidad_vend dolares_vend prom_vent localidad Clave_localidad calle Clave_ciudad ciudad Clave_ciudad ciudad provincia país
33 Esquema de Constelación de hechos Varias tablas de hechos comparten tablas de dimensiones, vistos como una colección de estrellas, por lo tanto, llamados esquema de galaxia o constelación de hecho 33
34 Esquema de Constelación de hechos Reservas y Checkout pueden compartir tablas de dimensiones en la industria hotelera Hoteles Agentes de viajes Reservas Clientes Checkout Promoción Tipo de hab.
35 Tiempo Clave_tiempo día semana mes periodo año Esquema de Constelación de hechos Tabla Hechos Ventas clave_tiemp Clave_prod Clave_cliente Producto Clave_prod nombre descrp tipo Clave_prov Tabla Hechos Envios clave_tiemp Clave_prod Clave_env. Desde_localidad Cliente clave_cliente nombre Tipo Cualquier calculo Medidas Clave_localidad unidad_vend units_sold dolares_vend dollars_sold prom_vent avg_sales Localidad Clave_localidad calle Clave_ciudad hasta_localidad costo_dolares unidades_enviad Enviador Clave_env. Nombre Localidad 35 tipo
36 De las Tablas a los cubos de datos Un data warehouse se basa en un modelo de datos multidimensional Todo los datos se pueden ver en la forma de un cubo de datos Un cubo de datos permite ver múltiples dimensiones Un cubo n-d se llama un paralelepípedo. 36
37 Base de datos relacional Atributo 1 Nombre Atributo 2 edad Atributo 3 sexo Atributo 4 No. Emp Fila 1 Fila 2 Anderson Green F M Fila 3 Lee 22 M 1010 Fila 4 Ramos 32 F 1020 Tabla de empleados
38 Modelo BD multidimensional Cliente Tienda Tienda Tiempo Tiempo VENTAS FINANZAS Producto Dept Los datos se encuentra en la intersección de las dimensiones
39 Dos dimensiones
40 Tres dimensiones
41 La granularidad de las dimensiones Tiempo Dia Mes Trimestre Años Geografía Ciudad Región País Productos Números Tipos Clases Marcas
42 Jerarquía Dimensional Año País Tipo de producto Mes Estado Producto Semana Ciudad Item Día Tienda
43 Jerarquía Dimensional (localidad) todo todo región Europa... Sur_America país Alemania... España Venezuela... Ecuador ciudad Frankfurt... Caracas... Mérida oficina Boleita... M. Chacao 43
44 Jerarquía Dimensional jerarquía de esquema día < mes < cuatrimestre < año Se pueden agrupar las jerarquías {día 1 al 10} {días} < 30 44
45 Las multidimensiones Dimensiones: Tiempo Geografía Productos Clientes Canales de ventas... Indicadores: Número de unidades vendidas Costo
46 Cubo de dato y las dimensiones Eje de análisis: geografía (País - región - ciudad) Variables análisis: Nb unidades, costo... Eje de análisis: productos (clase, producto) Eje de análisis: tiempo (Año, mes, semana) Eje de análisis : dimensiones Variables análisis: indicadores
47 Producto Datos Multidimensionales El volumen de ventas en función del producto, el mes, y el área Dimensiones: Producto, Localidad, Tiempo Caminos jerarquicos Industria Región Año Mes Categoria País Product o Ciudad Oficina Cuatrim Mes seman Dia
48 Cubo Multidimensional Mostrar las ventas de Coca-Cola en la sección de alimentos, para la 4ta. semana. Fanta Coca-Cola Marcas Sección Hogar Informática 23.5 MM UNIDADES 28.3 VENTA BRUTA 26.8 COSTO Pepsi-Cola Gatorade Red Bull Alimentos Semana del mes 24
49 Cubo Multidimensional Pais Producto Producto Cliente Ventas Perú 56 grm Tipo A 100 Perú 35 grm Tipo B 109 Perú 25 grm Tipo C 423 Ecuador 56 grm Tipo A 5363 Ecuador 35 grm Tipo B 342 Bolivia 25 grm Tipo C M Unidades 56 grm $100 Venta $25.3 Costo 35 grm 25 grm Ventas Mostrar las Ventas y Costo del producto de 56 grm en Ecuador para el Tipo de Cliente A Tipo A Tipo B Tipo C Cliente
50 Cuboides correspondientes al Cubo todos producto fecha paìs producto,fecha producto,paìs Fecha,pais 0-D cuboide 1-D cuboides 2-D cuboides producto, fecha, país 3-D cuboides 50
51 Cuboides correspondientes al Cubo todo tiempo item localidad Proveedor 0-D cuboide 1-D cuboides tiempo,item tiempo,locatidad item,localidad Localidad, prov tiempo,prov item,prov 2-D cuboides tiempo,item,localidad time,localidad,prov 3-D cuboides tiempo,item,prov item,localidad,prov tiempo, item, localidad, prov 4-D cuboides 51
52 Navegar por un cubo de datos Visualización OLAP 52
53 Navegar por un cubo de datos Productos 2 dimensiones Ventas 3 dimensiones Copo de nieve Productos Por región ventas 1 dimensión Productos Región Zoom a una dimensión France Tiempo en semana Ventas Est Sud Ouest Tiempo en mes Lyon Marseille Nice
54 Modelo de consulta Metodo Envio AEREO Ordenes Clientes CONTRATO Cliente Tiempo ANUAL TERREST MES DIARIO CIUDAD PAIS ORDEN LINEA PRODUCTO Producto PRODUCTO GRUPO PRODUCTO PERSONA DISTRITO REGION Localidad Promoción DIVISION Organización 54
55 Navegar por un cubo de datos Un cubo se puede rotar, agrupar, etc. Se obtienen retículas de puntos de vista NumPro, Numprof, fecha NumPro, NumProv NumPro, fecha NumProv fecha NumPro NumProv Fecha
56 Herramientas para explotación del Datawarehouse Análisis multidimensional (OLAP online analytical processing) Facilitan el análisis de datos a través de dimensiones y jerarquías, uutilizando consultas rápidas predefinidas
57 Market On-Line Analytical Processing (OLAP) Idea básica: los usuarios deben poder manipular los modelos de datos organizacionales a través de muchas dimensiones para comprender que se está ocurriendo. Los datos utilizados en OLAP deberían estar en la forma de un cubo multidimensional. Product
58 Herramienta Multidimensional Especializada Beneficios: Acceso rápido a grandes volúmenes de datos Bibliotecas extensas de funciones complejas de análisis Capacidades de modelado y predicción Puede acceder a las estructuras de bases de datos multidimensionales y relacionales
59 Arquitecturas OLAP OLAP Relacional (ROLAP) Usa un esquema relacional para manejar la navegación y administrar los datos consolidados Incluye agregación Gran escalabilidad OLAP Multidimensional (MOLAP) Almacenamiento con técnicas multidimensionales Acceso rápido a datos pre-calculados previamente OLAP Híbrido (HOLAP) Bajo nivel MOLAP, Alto nivel ROLAP Motores de BD especializados Manejan consultas especializadas (como las de SQL)con esquemas estrella o copo de nieve
60 Operaciones clásicas OLAP Roll up (drill-up): agrega medidas que van de un nivel Ni a un nivel mas general Nj de una dimensión. Drill down (roll down): es la operación inversa. A partir de un nivel superior este operador permitir bajar de nivel. 60
61 Operaciones clásicas OLAP Slice and dice: permite restringir los valores asociados a una o varias dimensiones del cubo, es decir, toma un subconjunto de dimensiones y de niveles seleccionados del DW. Otras operaciones drill across navegar a través de más de una tabla de hechos drill through navegar a través del nivel inferior del cubo a tablas relacionales Pivote (rotar) Rotar el cubo 61
62 Cortando/rebanando un cubo de datos 62
63 Slice and dice Roll up Drill down Pivote (rotar): 63
64 Resumen Operaciones clásicas OLAP Rollup: decrese nivel de detalle Drill-down: aumenta nivel de detalle Slice-and-dice: selección y proyección Pivot: re-orienta vista multidimensional
65 Agregación en Cubos dia 2 dia 1 c1 c2 c3 p p2 c1 c2 c3 p p venta(cliente,items,día)... c1 c2 c3 p p c1 c2 c3 sum sum p1 110 p2 19 rollup 129 drill-down
66 Agregación en Cubos venta(cliente,items,día) dia 2 dia 1 c1 c2 c3 p p2 c1 c2 c3 p p venta(c1,*,*) c1 c2 c3 p p venta(c2,p2,*) c1 c2 c3 sum sum p1 110 p venta(*,*,*)
67 Cara de Cubos venta(cliente,items,día) dia 1 dia 2 * c1 c2 c3 * p p * c1 c2 c3 * p p2 c1 c2 c3 * p p * * venta(*,p2,*)
68 Agregación usando jerarquía venta(cliente,items,día) Dia 2 Dia 1 c1 c2 c3 p p2 c1 c2 c3 p p cliente region país region A region B p p (cliente c1 en Region A; cliente c2, c3 en Region B)
69 Agregación en Cubos 129 todo venta(cliente,items,día) c1 c2 c3 p ciudad producto fecha ciudad, producto Ciudad, fecha producto, fecha c1 c2 c3 p p day 2 day 1 c1 c2 c3 p p2 c1 c2 c3 p p ciudad, producto, fecha Algoritmos especiales para Calcular a diferentes niveles
70 Estructuras Índices Métodos de acceso tradicional Árboles B, tablas hash, Popular en Warehouses Listas invertidas Índices de mapa de bits (bit map) Índices de unión (join indexes) Índices de texto
71 ... Listas invertidas r4 r18 r34 r35 r5 r19 r37 r40 rid name age r4 joe 20 r18 fred 20 r19 sally 21 r34 nancy 20 r35 tom 20 r36 pat 25 r5 dave 21 r41 jeff 26 Indice de edad Lista invertida registros
72 ... Bit Maps Indice de edad bit maps id name age 1 joe 20 2 fred 20 3 sally 21 4 nancy 20 5 tom 20 6 pat 25 7 dave 21 8 jeff 26 registros
73 Join Indexes product id name price jindex p1 bolt 10 r1,r3,r5,r6 p2 nut 5 r2,r4 join index sale rid prodid storeid date amt r1 p1 c r2 p2 c r3 p1 c r4 p2 c2 1 8 r5 p1 c r6 p1 c2 2 4 Relaciona los valores de las dimensiones de un esquema en estrella a filas de la tabla de hechos. Por ejemplo, la tabla de hecho ventas y la de dimensión producto Un índice join en producto guarda para cada producto una lista de los IDs de las tuplas que registran las ventas de ese producto
74 Consultas con OLAP Determinar cuales operaciones están disponibles Determinar que medidas es posible materializar en el cubo (relevantes a aplicar) total ventas día 2 día 1 c1 c2 c3 p p2 c1 c2 c3 p p materializar c1 c2 c3 p p c1 c2 c3 p c1 p1 110 p
75 Extension de SQL ROLLUP: SELECT <column list> FROM <table > GROUP BY ROLLUP(column_list); CUBO: SELECT <column list> FROM <table > GROUP BY CUBE(column_list); Hace n+1 agregaciones en una columna, Crea n combinaciones, n será el numero de columnas del grupo
76 Ejemplo CUBO Animaux Animal Lieu Quantite Chat Paris 18 Chat Naples 9 Chat - 27 Chien Paris 12 Chien Naples 5 Chien Rome 14 Chien - 31 Tortue Naples 1 Tortue Rome 4 Tortue Paris 30 - Naples 15 - Rome 18 Animal Lieu Quantite Chien Paris 12 Chat Paris 18 Tortue Rome 4 Chien Rome 14 Chat Naples 9 Chien Naples 5 Tortue Naples 1 SELECT Animal, Lieu, SUM(Quantite) as Quantite FROM Animaux GROUP BY ROLLUP Animal
77 Ejemplo CUBO SELECT item, city, year, SUM (amount) FROM SALES CUBE BY item, city, year Se debe calcular (item, city, year), (item, city), (item, year), (city, year), (item), (city), (year) () (city) () (item) (year) (city, item) (city, year) (item, year) (city, item, year)
78 Extension de SQL Agrupar todos los subconjuntos de {item, región, mes}, encontrar el precio máximo en 1997 de cada grupo, y el total de ventas entre todas las tuplas de precios máximos select item, región, mes, max(precio), sum(r.ventas) from compras where año = 1997 cube by item, region, mes: R such that R.precio = max(precio) 78
79 Modelado en Data Warehouse 1. Definir el modelo de negocio 2. Crear el modelo dimensional 3. Identificar resumenes de datos 4. Crear el modelo fisico 1 2, 3 Seleccionar proceso negocio 4 Modelo fisico
80 Granularidad (unidad de análisis) Determina lo que representa cada registro de la tabla de hechos: el nivel de detalles. Ejemplos Puntos en el tiempo Lineas en un documento Depende del proyecto de IN
81 Crear Modelo Dimensional Seleccionar una entidad para comenzar a armar tabla de hechos Determinar granularidad Identificar claves operacionales para tabla de hechos Buscar jerarquías Añadir dimensiones Caracterizar los atributos de las dimensiones
82 Crear Modelo Dimensional Identificar tablas de hechos Traducir medidas pregunta madre en tablas de hechos Analizar las fuentes de datos para las medidas Identificar tablas de dimensiones Enlazar tabla de hechos con las tablas de dimensiones Crear vistas para los usuarios (operaciones OLAP)
83 Identificar resumenes de datos Proporciona un acceso rápido a datos precalculados Reduce el uso de E/S, CPU y memoria Se calcula desde las fuentes de datos y otros resúmenes pre-calculados Por lo general, se guardan en las tablas de hechos
84 Identificar resumenes de datos Promedio Máximo Total Porcentaje Unidad Venta Tienda Producto A Total Producto B Total Producto C Total
85 Implementación de un Data Warehouse Un proyecto de Data Warehouse debe basarse en satisfacer necesidades organizacionales Los datos se deben presentar de acuerdo con las variables organizacionales Un Data Warehouse está en permanente evolución Cada proyecto de Data Warehouse debe tener un principio y un fin
86 Ciclo de vida Diseño Arquitectónico Productos Requerimientos Planificación Modelo Dimensional Diseño Físico Data Staging Implementa ción Mantenimiento Crecimiento Especificación Aplicaciones Desarrollo Aplicaciones Administración del Proyecto
87 Planificación Diseño Arquitectónico Productos Requerimientos Planificación Modelo Dimensional Diseño Físico Data Staging Implementa ción Mantenimiento Crecimiento Especificación Aplicaciones Desarrollo Aplicaciones Administración del Proyecto
88 Planificación Predisposición de la organización Alcance Justificación Aspectos humanos Plan del proyecto
89 Predisposición de la organización Apoyo de la Gerencia (Sponsor) Motivación en la organización Participación de la gente vinculada al problema a analizar y de Sistemas Cultura actual de análisis de información Factibilidad
90 Puntos clave Buscar un patrocinante bien ubicado Hacer un balance entre valor para la organización y manejabilidad Desarrollar cuidadosamente el plan del proyecto Ser un director de proyecto con capacidad de motivar, administrar y comunicar a todos los niveles
91 Requerimientos Diseño Arquitectónico Productos Requerimientos Planificación Modelo Dimensional Diseño Físico Data Staging Implementa ción Mantenimiento Crecimiento Especificación Aplicaciones Desarrollo Aplicaciones Administración del Proyecto
92 Desarrollo del proyecto El desarrollo del proyecto se realiza en tres líneas Línea de Tecnología Requerimientos Línea de Aplicaciones Línea de Datos
93 Línea de Tecnología Diseño Arquitectónico Productos Requerimientos Planificación Modelo Dimensional Diseño Físico Data Staging Implementa ción Mantenimiento Crecimiento Especificación Aplicaciones Desarrollo Aplicaciones Administración del Proyecto
94 Selección de productos Política de compras Matriz de evaluación Requerimientos técnicos Factores de ponderación
95 Línea de Datos Diseño Arquitectónico Productos Requerimientos Planificación del Negocio Modelo Dimensional Diseño Físico Data Staging Implementa ción Mantenimiento Crecimiento Especificación Aplicaciones Desarrollo Aplicaciones Administración del Proyecto
96 Línea de Datos Modelado dimensional Procesos Granularidad Tablas de hechos Tablas de dimensión Claves
97 Línea de Datos Diseño físico de la base de datos Nombres de columnas Tipos de datos Estrategia de consolidación/actualización Qué consolidaciones se incluyen Estrategia de indexación
98 Línea de Datos Diseño y desarrollo del ETL Herramientas y técnicas Organización de las tablas de dimensión Organización de las tablas de hechos
99 Línea de Aplicaciones Diseño Arquitectónico Productos Requerimientos Planificación Modelo Dimensional Diseño Físico Data Staging Implementa ción Mantenimiento Crecimiento Especificación Aplicaciones Desarrollo Aplicaciones Administración del Proyecto
100 Línea de Aplicaciones Especificación y desarrollo de aplicaciones Vías de acceso Internet Correo electrónico Tableros de control Personalización de herramientas
101 Implementación Diseño Arquitectónico Productos Requerimientos Planificación Modelo Dimensional Diseño Físico Data Staging Implementa ción Mantenimiento Crecimiento Especificación Aplicaciones Desarrollo Aplicaciones Administración del Proyecto
102 Implementación Convergencia de las tres líneas La línea de datos es la más impredecible Asegurarse de que el Data Warehouse esté en condiciones Educación: Gestión de conocimiento en la organización
103 Mantenimiento y Crecimiento Diseño Arquitectónico Productos Requerimientos Planificación Modelo Dimensional Diseño Físico Data Staging Implementa ción Mantenimiento Crecimiento Especificación Aplicaciones Desarrollo Aplicaciones Administración del Proyecto
104 Mantenimiento y Crecimiento Soporte a los usuarios Si no hay consultas, posiblemente no estén usando el Data Warehouse Detectar áreas de datos o de aplicaciones no cubiertas Calidad del Data Warehouse Educación Cursos de gestión de conocimiento Usuarios calificados
105 Mantenimiento y Crecimiento Demandas de crecimiento Nuevos usuarios Nuevos datos Nuevas aplicaciones Mejoras de las aplicaciones existentes Revisión de las prioridades establecidas Identificar los productos objetos de gestión de conocimiento organizacional
106 Inconvenientes El almacén de datos no suele ser estático. Los costos de mantenimiento son elevados. Ante una petición de información estos pueden devolver una información sub-óptima, que también supone una perdida para la organización. Se pueden quedar obsoletos relativamente pronto
107 Modelado de Datos (algunos comentarios finales) Jose Aguilar CEMISID, Escuela de Sistemas Facultad de Ingeniería Universidad de Los Andes Mérida, Venezuela
108 Expresiones multidimensionales (MDX ) Es el acrónimo de MultiDimensional expressions Es un lenguaje de consulta para bases de datos multidimensionales sobre cubos OLAP Fue creado en 1997 por Microsoft. No es un lenguaje estándar, sin embargo diferentes fabricantes de herramientas OLAP lo han adoptado. Se utiliza para generar reportes para la toma de decisiones basados en datos históricos, usando la estructura o rotación del cubo 108
109 Expresiones multidimensionales (MDX ) Una consulta MDX es muy similar a una consulta SQL, devuelve un conjunto de celdas, que es resultado de tomar un subconjunto de las celdas del cubo original. MDX utiliza en varias situaciones las jerarquías. Por ejemplo, si una dimensión se denomina región, esta puede contener países. Los países a su vez contienen provincias y las provincias ciudades. Para manejar estos componentes MDX tiene funciones como Children (hijos), cousin (primos) y parents (padres). Su cliente OLAP puede manipular el cubo de distintas formas: Rotarlo Rebanarlo Cortarlo 109
110 Expresiones multidimensionales (MDX ) Sintaxis: Consulta MDX Básica: SELECT <especificación del eje y> on columns, <especificación de eje x> on rows FROM <especificación del cubo> WHERE <especificación Slicer (rebanador)> 110
111 Expresiones multidimensionales (MDX ) CREATE CUBE Sales ( DIMENSION Time TYPE TIME, HIERARCHY [Fiscal], LEVEL [Fiscal Year] TYPE YEAR, LEVEL [Fiscal Qtr] TYPE QUARTER, LEVEL [Fiscal Month] TYPE MONTH OPTIONS (SORTBYKEY, UNIQUE_KEY), HIERARCHY [Calendar], LEVEL [Calendar Year] TYPE YEAR, LEVEL [Calendar Month] TYPE MONTH, DIMENSION Products, LEVEL [All Products] TYPE ALL, LEVEL Category, LEVEL [Sub Category], LEVEL [Product Name], DIMENSION Geography, LEVEL [Whole World] TYPE ALL, LEVEL Region, LEVEL Country, LEVEL City, MEASURE [Sales] FUNCTION SUM FORMAT 'Currency', MEASURE [Units Sold] FUNCTION SUM TYPE DBTYPE_UI4 ) 111
112 Metadatos de un ejemplo Nombre del cubo: CuboNW Medidas: Total y Quantity. Dimensiones: - Products: Jerarquias: Category name-productname. - Vw_ordenes2: Jerarquias:Año-Mes-Dia - Clientes. Jerarquia: Country-Region-City-Company name - Empleados. Jerarquia: Empcountry-Empregion-EmpCity-Lastname
113 Expresión con los nombres de las categorías y todas las medidas. SELECT Measures.MEMBERS ON COLUMNS, [category name].members ON ROWS FROM [cubonw] Totales y cantidad para todos los productos
114 Cambio de ejes de los resultados SELECT [category name].members ON COLUMNS, Measures.MEMBERS ON ROWS FROM [cubonw] Ejemplos donde se tiene en un de los renglones una dimensión y en las columnas medidas,
115 Lista de elementos en ejes ahora vamos a combinar en ambos ejes dos dimensiones: año y las categorias SELECT { [AÑO].members } ON COLUMNS, [products].[category name].members ON ROWS FROM [cubonw] WHERE MEASURES.TOTAL Es necesario especificarle en WHERE la medida que se desea ver (p. e TOTAL)
116 Herramientas de inteligencia de negocios Razones Permitir extraer, depurar, consolidar, sintetizar y presentar datos-información-conocimiento de forma automatizada Posibilitar el análisis y la toma de decisiones de manera ágil, flexible y fiable, en el formato adecuado a cada uno, con posibilidad de navegación OLAP Homogeneidad en la utilización de la información Son diferentes a las Plataformas de inteligencia de negocios 116
117 Herramientas de inteligencia de negocios Características Cubos de análisis. Vistas Ad Hoc Query: navegación por grandes volúmenes de información. Herramientas OLAP para visualizar de manera interactiva grandes volúmenes de información desde varias perspectivas. Debe permitir generar vistas de datos agregadas para mantener a la gerencia informada Cuadros de Mando por indicadores (Balanced Scorecard): información muy resumida, para la toma de decisiones. Digital Dashboards o paneles de Control Digital: resúmenes visuales de información del negocio, con métricas e Indicadores Clave de Desempeño (KPIs). Sistemas para Reporting: Aplicaciones para generar Informes, motores de distribución de reportes para entrega de reportes y alertas, etc. Minería de datos y análisis estadísticos: modelado predictivo, para diagnóstico (descubrir relaciones causa efecto), etc. 117
118 Herramientas código abierto de inteligencia de negocios Eclipse BIRT Project: Generador de informes basado en Eclipse JasperReports LogiReport: Aplicación basada en Web de LogiXML OpenI: Aplicación Web simple orientada a OLAP. Pentaho RapidMiner (antes YALE) SpagoBI 118
119 Algunas Herramientas Comerciales ApeSoft ( Bitool: Herramienta de ETL y Visualizacion BiyCloud Smart: QlikView + Cloud + Social Business Business Objects (SAP company) Business Objects IBM Cognos Microstrategy: Oracle BI WorkMeter Microsoft Office SharePoint Server y PerformancePoint Server JetReports 119
120 PENTAHO Jose Aguilar CEMISID, Escuela de Sistemas Facultad de Ingeniería Universidad de Los Andes Mérida, Venezuela 120
121 Pentaho: La solucion Open Source Business Intelligence Plataforma de IN que incluye todos los principales componentes requeridos para implementar soluciones. Pentaho incluye herramientas para hacer: Reportes Análisis Vizualización (Dahsboards) Manejo de Datos 121
122 Componentes independentes Dashboards Plataforma Web para publicar y visualizar la información Reportes Report Designer Jfree Report: (Motor para reportes) Análisis Weka ETL: Kettle (Spoon/Pan) Datos High Cube designer, WorkBench ETL: Kettle (Spoon/Pan) Mondrian: Motor para cubos Minería Weka: Motor para minería de datos a 122
123 PENTAHO Pentaho ha sido desarrollado desde el año Bajo Java Open Source: Tiene una comunidad de usuarios Corre bien bajo múltiples plataformas (Windows, Linux, Macintosh, Solaris, etc. 123
124 124
125 Pentaho Dashboard Brinda a los usuarios la información crítica que necesitan para comprender y mejorar el desempeño organizacional. Proporciona una visión inmediata del rendimiento individual, departamental, o de la organización, mediante la entrega de métricas claves a través de una interfaz visual atractiva e intuitiva. 125
126 Pentaho Dashboard Interactivo 126
127 Pentaho Dashboard: Geo Location 127
128 Reporting La solución de Reporting que plantea Pentaho, incluida dentro de su suite, es Jfree Report.. 128
129 Reporting Permite a las organizaciones fácilmente acceder, formatear y entregar reportes a los empleados, clientes y socios. 129
130 Mondrian permite Alto rendimiento, análisis interactivo de volúmenes grandes o pequeños de la información Exploración «dimensional" de datos, por ejemplo, el análisis de las ventas por línea de productos, por regiones, para un período de tiempo Convertir consultas multidimensionales en MDX en SQL para hacer consultas Consultas de alta velocidad Cálculos avanzados utilizando expresiones de cálculo del lenguaje MDX 130
131 Mondrian permite 131
132 OLAP en Pentaho Permite realizar todas las típicas funcionalidades de un sistema OLAP a una gran velocidad Hace uso de diversas Bases de Datos: Oracle DB2 SQL-Server MySQL Postgre 132
133 OLAP en Pentaho Pentaho OLAP Permite diseñar cubos dinámicos, para un análisis de la información mucho más rápida y detallada, que apoya la Toma de Decisiones dentro de una organización 133
134 OLAP en Pentaho Cube Designer incorpora arrastrar y soltar para un manejo más fácil. 134
135 OLAP en Pentaho Crea las dimensiones del Cubo que luego seran mostradas en la Suite de Pentaho 135
136 Gráficas de Resultados Estadistica por Usuario Estadistica por Mes 136
137 Gráficas de Resultados Todos los gráficos y estadísticas se generan dinamicamente, sólo con solicitar la información los gráficos van cambiando 137
138 Kettle tiene capacidades de accesar, limpiar e integrar datos desde cualquier lugar de la organización. ofrece una poderosa mecanismo de extracción, transformación y carga (ETL), con un diseño intuitivo y una arquitectura escalable basada en estándares probados. Kitchen : Job Execution Suite Spoon : GUI Designer Carte : Cluster Web Server Pan : Transformation Execution 138
139 Kettle 139
140 Integración de datos 140
141 Modelo de Kettle 141
142 Integración de datos: crear metadatos 142
143 Weka Descubrir relaciones ocultas en los datos y descubrir indicadores de desempeño futuro. Análisis predictivo y exploración de correlaciones en los datos para mejorar el desempeño organizacional 143
144 Weka 144
145 Weka 145
146 Gestión Big Data Integración Datos Análisis BigData Pentaho y Big Data Pentaho Business Analytics Integración de Datos Orquestación de tareas Workflow Planificación Alto Rendimiento IDE Hadoop Java MapReduce, Pig Pentaho MapReduce NoSQL Databases Analytic Databases 146
147 Orquestación virtual de tareas con diferentes fuentes de datos Planificación 147
148 Iteration 2 Definir las fuentes de datos disponibles Diseñar el modelo de datos dimensional para el proyecto de IN Especificar y realizar las operaciones ETL para construir el DW (Data Marts) Diseñar las operaciones OLAP requeridas para el proyecto de IN: métricas e indicadores clave de desempeño, reportes y alertas. Hacer pruebas sobre el Data Marts (tanto de las operaciones OLAP diseñadas como otras consultas) 148
MOLAP REALIZADO POR: JOSE E. TABOADA RENNA
MOLAP REALIZADO POR: JOSE E. TABOADA RENNA BASE DE DATOS Conjunto de datos estructurados, fiables y homogéneos organizados independientemente en máquina, m accesibles en tiempo real, compatible por usuarios
Capítulo 2 Tecnología data warehouse
Capítulo 2 Tecnología data warehouse El objetivo de éste capítulo es mostrar la tecnología data warehouse (DW) como una herramienta para analizar la información. Este capítulo se encuentra organizado de
SISTEMA DE INFORMACION GERENCIAL. Lic.Patricia Palacios Zuleta
SISTEMA DE INFORMACION GERENCIAL Lic.Patricia Palacios Zuleta Pentaho Open BI Suite La suite Pentaho cubre principalmente las siguientes áreas: integración de datos, reportes, análisis, alertas y dashboards,
Datawarehousing: Modelado de Datos y OLP. Jose Aguilar CEMISID, Escuela de Sistemas Facultad de Ingeniería Universidad de Los Andes Mérida, Venezuela
Datawarehousing: Modelado de Datos y OLP Jose Aguilar CEMISID, Escuela de Sistemas Facultad de Ingeniería Universidad de Los Andes Mérida, Venezuela Modelado de Datos y de Información Usuarios tienen diferentes
Definición. Data Warehousing: almacenamiento, transformación y distribución de datos útiles para los responsables de tomar decisiones 9/29/2006 4
Definición Data Warehousing: almacenamiento, transformación y distribución de datos útiles para los responsables de tomar decisiones 9/29/2006 4 Definición (cont.) Un Data Warehouse es una colección de
Sistemas de Información 12/13 La organización de datos e información
12/13 La organización de datos e información Departamento Informática e Ingeniería de Sistemas Universidad de Zaragoza (raqueltl@unizar.es) " Guión Introducción: Data Warehouses Características: entornos
Estos documentos estarán dirigidos a todas las personas que pertenezcan a equipos de implementación de Oracle BI, incluyendo a:
Oracle Business Intelligence Enterprise Edition 11g. A lo largo de los siguientes documentos trataré de brindar a los interesados un nivel de habilidades básicas requeridas para implementar efectivamente
OLAP 2 OLAP 1 OLAP 4 OLAP 3 OLAP 5 OLAP 6
OLAP EXPLOTACIÓN UN DW: EXPLOTACIÓN UN DW:... OLAP 1 OLAP 2 EXPLOTACIÓN UN DW: MOLO UN AMBIENTE OLAP EXPLOTACIÓN UN DW: LAS HERRAMIENTAS OLAP PRESENTAN AL USUARIO UNA VISIÓN MULTIDIMENSIONAL LOS DATOS
Presentación de Pyramid Data Warehouse
Presentación de Pyramid Data Warehouse Pyramid Data Warehouse tiene hoy una larga historia, desde 1994 tiempo en el que su primera versión fue liberada, hasta la actual versión 8.00. El incontable tiempo
SAP BusinessObjects Edge BI Standard Package La solución de BI preferida para. Empresas en Crecimiento
SAP BusinessObjects Edge BI Standard Package La solución de BI preferida para Empresas en Crecimiento Portfolio SAP BusinessObjects Soluciones SAP para Empresas en Crecimiento Resumen Ejecutivo Inteligencia
Gelka Consultores de Negocios y Proyectos Ltda.
BUSINES INTELLIGENCE OPEN SOURCE En el área de Business Intelligence, se ha producido recientemente un despegue espectacular en el desarrollo de soluciones open Source La cantidad de proyectos de Open
SpagoBI Open Source Business Intelligence
SpagoBI Open Source Business Intelligence La plataforma SpagoBI Open Source Business Intelligence Conceptos Inteligencia empresarial (Business Intelligence) es un agregado de aplicaciones y herramientas
Microsoft SQL Server Conceptos.
Microsoft Conceptos. Microsoft 2005 es una plataforma de base de datos a gran escala de procesamiento de transacciones en línea (OLTP) y de procesamiento analítico en línea (OLAP). La siguiente tabla muestra
Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 5 -
Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos - Sesión 5 - Juan Alfonso Lara Torralbo 1 Índice de contenidos Data Warehouse Modelo multidimensional Diagrama
Facultad de Ciencias Económicas. Departamento de Sistemas. Asignatura: INTELIGENCIA DE NEGOCIOS. Plan 1997
UNIVERSIDAD DE BUENOS AIRES Facultad de Ciencias Económicas Departamento de Sistemas Asignatura: INTELIGENCIA DE NEGOCIOS Código: 715 Plan 1997 Cátedra: DEPARTAMENTO DE SISTEMAS Carrera: Licenciado en
ANEXO A - Plan de Proyecto. 1. - EDT de la solución EDT GENERAL DEL PROYECTO1
ANEXO A - Plan de Proyecto 1. - EDT de la solución EDT GENERAL DEL PROYECTO1 2.- Diagrama de Gantt de la Solución DIAGRAMA DE GANTT- FASE INICIAL DOCUMENTACION Y ANALISIS2 DIAGRAMA DE GANTT- FASE FINAL
CREACIÓN DE PROYECTOS DE BUSINESS INTELLIGENCE CON SQL SERVER. 40 horas 60 días
CREACIÓN DE PROYECTOS DE BUSINESS INTELLIGENCE CON SQL SERVER DURACIÓN DÍAS DE CONEXIÓN 40 horas 60 días CONTACTO: formacion@fgulem.es El Campus Virtual ha sido concebido con una metodología dinámica e
Oracle vs Oracle por Rodolfo Yglesias Setiembre 2008
Oracle vs Oracle por Rodolfo Yglesias Setiembre 2008 Introducción Aunque la estrategia de adquisiciones que Oracle ha seguido en los últimos años siempre ha buscado complementar y fortalecer nuestra oferta
Sistema de análisis de información. Resumen de metodología técnica
Sistema de análisis de información Resumen de metodología técnica Tabla de Contenidos 1Arquitectura general de una solución de BI y DW...4 2Orígenes y extracción de datos...5 2.1Procesos de extracción...5
BUSINESS INTELLIGENCE
BUSINESS INTELLIGENCE PRESENTACIÓN Ramón Díaz Hernández Gerente (1.990) Nuestro Perfil Inversión permanente en formación y nuevas tecnologías. Experiencia en plataforma tecnológica IBM (Sistema Operativo
3.3.3 Tecnologías Mercados Datos
3.3.3 Tecnologías Mercados Datos TECNOLOGIAS DATAMART: Aspect Data Mart es una solución completa de reportes para la empresa, que le proporciona un mayor entendimiento de las operaciones de sus negocios
Día 5-6-2012 17:00h Lugar: Obra Social Ibercaja, Sala De actos, Rambla Ferran 38, 3º, Lleida
Resumen de la conferencia Día 5-6-2012 17:00h Lugar: Obra Social Ibercaja, Sala De actos, Rambla Ferran 38, 3º, Lleida Ponente: Luis Muñiz Socio Director de Sisconges & Estrategia y experto en Sistemas
Construcción de cubos OLAP utilizando Business Intelligence Development Studio
Universidad Católica de Santa María Facultad de Ciencias e Ingenierías Físicas y Formales Informe de Trabajo Construcción de cubos OLAP utilizando Business Intelligence Development Studio Alumnos: Solange
SISTEMAS DE INFORMACION GERENCIAL LIC.PATRICIA PALACIOS ZULETA
SISTEMAS DE INFORMACION GERENCIAL LIC.PATRICIA PALACIOS ZULETA Qué es inteligencia de negocios? (BI) Business Intelligence es la habilidad para transformar los datos en información, y la información en
SQL Server Business Intelligence parte 1
SQL Server Business Intelligence parte 1 Business Intelligence es una de las tecnologías de base de datos más llamativas de los últimos años y un campo donde Microsoft ha formado su camino a través de
Módulo Minería de Datos
Módulo Minería de Datos Diplomado Por Elizabeth León Guzmán, Ph.D. Profesora Ingeniería de Sistemas Grupo de Investigación MIDAS Análsis Dimensional OLAP On-Line Analytical Processing Estructura del Proceso
Incorpora la localización en tu compañía. Mejora la rentabilidad con la solución Location Analytics de Esri
Incorpora la localización en tu compañía Mejora la rentabilidad con la solución Location Analytics de Esri Qué es la pregunta Dónde es la respuesta En la era actual de sobrecarga de datos el éxito en los
Almacén de datos - concepto. Arquitectura de un sistema de almacén de datos
Almacén de datos - concepto Almacén de datos (Bodega de Datos, Data warehouse) es una integrada colección de datos que contiene datos procedentes de sistemas del planeamiento del recurso de la empresa
Sistemas de Información para la Gestión. Unidad 3 Aplicaciones de Sistemas
para la Gestión Unidad 3 Aplicaciones de Sistemas U.N.Sa. Facultad de Cs.Económicas SIG 2010 UNIDAD 3: APLICACIONES DE SISTEMAS Aplicaciones empresariales: Sistemas empresariales. Sistemas de administración
DISEÑO E IMPLEMENTACIÓN DE SOLUCIONES BUSINESS INTELLIGENCE CON SQL SERVER 2012
DISEÑO E IMPLEMENTACIÓN DE SOLUCIONES BUSINESS INTELLIGENCE CON SQL SERVER 2012 FLUJO DE CAPACITACIÓN Prerrequisitos Fundamentos de Programación Sentencias SQL Server 2012 Duración: 12 horas 1. DESCRIPCIÓN
Diseño dinámico de arquitecturas de información
Diseño dinámico de arquitecturas de información CARACTERISTICAS DEL SISTEMA Las organizaciones modernas basan su operación en la gestión del conocimiento, es decir, en el manejo de información que se presenta
GUÍA TÉCNICA. Desarrollo de Sistemas de Información la plataforma Business Intellingence Pentaho
Desarrollo de Sistemas de Información la plataforma Business Intellingence Página 1 de 11 Control de versiones Ver. Fecha Descripción Autores 1 04/07/14 Versión inicial SDP Página 2 de 11 Índice del Documento
El almacén de indicadores de proceso de negocio en ejecución
X Congreso de Ingeniería de Organización Valencia, 7 y 8 de septiembre de 2006 El almacén de indicadores de proceso de negocio en ejecución Andrés Boza García 1, Angel Ortiz Bas 1, Llanos Cuenca Gonzalez
Unidad 5. Conceptos y Estructuras de Archivos
Unidad 5 Conceptos y Estructuras de Archivos En todos los tiempos y más aún en la era en que vivimos, el hombre tiene cada vez mas necesidad de consultar una mayor cantidad de información para poder desarrollar
Introducción a BusinessObjects XI Release 2 Service Pack 2 / Productivity Pack
Introducción a BusinessObjects XI Release 2 Service Pack 2 / Productivity Pack Acerca de este manual Acerca de este manual Este manual proporciona información para empezar a utilizar BusinessObjects XI
Inteligencia de Negocios. & Microsoft Excel 2013
Inteligencia de Negocios (Business Intelligence - BI) & Microsoft Excel 2013 Instructor: Germán Zelada Contenido del Curso Fundamentos de Data Warehousing y BI Qué es Business Intelligence? Definiendo
DATA WAREHOUSE DATA WAREHOUSE
DATA WAREHOUSE DATA WAREHOUSE Autor: Roberto Abajo Alonso Asignatura: Sistemas Inteligentes, 5º Curso Profesor: José Carlos González Dep. Ing. Sistemas Telemáticos, E.T.S.I. Telecomunicación Universidad
Sistemas de Información para la Gestión. UNIDAD 2: RECURSOS DE TI Información y Aplicaciones
UNIDAD 2: RECURSOS DE TI Información y Aplicaciones UNIDAD 2: RECURSOS DE TI Información y Aplicaciones 1. La Información: Propiedades de la Información. Sistemas de Información. Bases de Datos. 2. Administración
Visión General GXplorer. Última actualización: 2009
Última actualización: 2009 Copyright Artech Consultores S. R. L. 1988-2009. Todos los derechos reservados. Este documento no puede ser reproducido en cualquier medio sin el consentimiento explícito de
Fundamentos de la Inteligencia de Negocios
Sistemas de Información para la Gestión UNIDAD 2: Infraestructura de Tecnología de la Información Unidad 2 Infraestructura de Tecnología de la Información Estructura de TI y tecnologías emergentes. Estructura
FACULTAD DE INGENIERÍA. Bases de Datos Avanzadas
FACULTAD DE INGENIERÍA Ingeniería en Computación Bases de Datos Avanzadas Datawarehouse Elaborado por: MARÍA DE LOURDES RIVAS ARZALUZ Septiembre 2015 Propósito Actualmente las empresas necesitan contar
UNIVERSIDAD DE SANTIAGO DE CHILE INGENIERIA COMERCIAL APLICACIÓN COMPUTACIONAL I INTELIGENCIA DE NEGOCIOS
UNIVERSIDAD DE SANTIAGO DE CHILE INGENIERIA COMERCIAL APLICACIÓN COMPUTACIONAL I INTELIGENCIA DE NEGOCIOS Integrante: Profesor: Maximiliano Heise Luis Ríos Fecha de entrega: miércoles 18 de abril de 2012
Tecnologías de Información y Comunicación II CLASE 10
Tecnologías de Información y Comunicación II CLASE 10 Medidas Una medida es un tipo de dato cuya información es usada por los analistas (usuarios) en sus consultas para medir la perfomance del comportamiento
Estrategias de Mercadeo y Negocios en Internet para PYMES. Intranets
Estrategias de Mercadeo y Negocios en Internet para PYMES Intranets Agenda Introducción, Conceptos y Niveles Funcionalidades de una Intranet Aplicaciones Mercadeo y Ventas Recursos Humanos Ingeniería Soporte
La Base de Datos OLAP Analysis Services (SSAS) Agenda. Agenda. Construyendo una Solución de BI paso a paso con SQL Server 2005
Construyendo una Solución de BI paso a paso con SQL Server 2005 La Base de Datos OLAP Analysis Services (SSAS) Ing. José Mariano Alvarez Jose.Mariano.Alvarez@SqlTotalConsulting.com Agenda Por qué Analysis
Fundamentos de la Inteligencia de Negocios
Universidad Nacional de Salta Facultad de Ciencias Económicas, Jurídicas y Sociales Sistemas de Información para la Gestión Fundamentos de la Inteligencia de Negocios Administración de Bases de Datos e
CAPÍTULO 2 DATA WAREHOUSES
CAPÍTULO 2 DATA WAREHOUSES Un Data Warehouse (DW) es un gran repositorio lógico de datos que permite el acceso y la manipulación flexible de grandes volúmenes de información provenientes tanto de transacciones
Sistemas de Data Warehousing
Federación Médica del Interior (FEMI) Sociedad Uruguaya de Informática en la Salud (SUIS) Información en Salud Edición 2009 Sistemas de Data Warehousing Dr. Ing. Adriana Marotta (In.Co - F.Ing - UDELAR)
SISTEMA DE INFORMACION DE GESTION DE TARJETAS DE CREDITO USANDO DATA MART E INTELIGENCIA DE NEGOCIOS PARA EL AREA COMERCIAL DEL BANCO RIPLEY PERU
SISTEMA DE INFORMACION DE GESTION DE TARJETAS DE CREDITO USANDO DATA MART E INTELIGENCIA DE NEGOCIOS PARA EL AREA COMERCIAL DEL BANCO RIPLEY PERU AGENDA INTRODUCCION PLANTEAMIENTO METODOLOGICO ANTECEDENTES
Contenido XIII. Capítulo 1. Capítulo 2. Alfaomega. Bases de datos - Reinosa, Maldonado, Muñoz, Damiano, Abrutsky
XIII Contenido Capítulo 1 Estructura y tipos de bases de datos...1 1.1 Introducción... 2 1.2 Definición de base de datos... 3 1.3 Sistema de Gestión de Bases de Datos... 4 1.4 Usuarios de la base de datos...
Business Intelligence (Inteligencia de Negocios) Bases de Datos Masivas (11088) Universidad Nacional de Luján
Business Intelligence (Inteligencia de Negocios) Bases de Datos Masivas (11088) Universidad Nacional de Luján Qué es Business Intelligence (BI)? Se entiende por Business Intelligence al conjunto de metodologías,
BI Business Intelligence Un Mercado de Alto Crecimiento
BI Business Intelligence Un Mercado de Alto Crecimiento BI Business Intelligence Un Mercado de Alto Crecimiento 1 PROLOGO Vivimos en la sociedad de la información. Gracias a Internet y al desarrollo de
BearSoft. SitodeCloud. Rafael Rios Bascón Web: http://www.bearsoft.com.bo Móvil: +591 77787631 Email: rafael.rios@bearsoft.com.bo
BearSoft Rafael Rios Bascón Web: http://www.bearsoft.com.bo Móvil: +591 77787631 Email: rafael.rios@bearsoft.com.bo CONTENIDO 1. Resumen. 3 2. Business Intelligence.. 4 3. Características del software.
Visión Ampliada del Management: Enterprise Performance Management
[VISIÓN AMPLIADA DEL MANAGEMENT: ENTERPRISE PERFORMANCE MANAGEMENT] Visión Ampliada del Management: Enterprise Performance Management Rodolfo Bollatti Universidad Abierta Interamericana Facultad de Tecnología
Novedades. Introducción. Potencia
Introducción Basado en el demostrado rendimiento y flexibilidad de la versión 8.5, Crystal Reports 9 presenta una amplia variedad de avanzadas funciones para que el diseño, entrega e integración de informes
UNICLASS ACTIVOS FIJOS LA SOLUCIÓN ANALÍTICA BASADA EN UN MODELO DE BUSINESS INTELLIGENCE
UNICLASS ACTIVOS FIJOS LA SOLUCIÓN ANALÍTICA BASADA EN UN MODELO DE BUSINESS INTELLIGENCE UN PRODUCTO DE DISTRIBUIDO POR T&G LA SOLUCIÓN QUE ANALIZA LOS PROCESOS DE SU NEGOCIO MÁS DIMENSIONALIDAD EN LOS
Capítulo 12: Indexación y asociación
Capítulo 12: Indexación y asociación Conceptos básicos Índices ordenados Archivos de índice de árbol B+ Archivos de índice de árbol B Asociación estática Asociación dinámica Comparación entre indexación
UN PASEO POR BUSISNESS INTELLIGENCE
UN PASEO POR BUSISNESS INTELLIGENCE Ponentes: Agreda, Rafael Chinea, Linabel Agenda Sistemas de Información Transaccionales Qué es Business Intelligence? Usos y funcionalidades Business Intelligence Ejemplos
Visión General de GXportal. Última actualización: 2009
Última actualización: 2009 Copyright Artech Consultores S. R. L. 1988-2009. Todos los derechos reservados. Este documento no puede ser reproducido en cualquier medio sin el consentimiento explícito de
Definición Historia y Evolución Conceptos Importantes Beneficios Soluciones Aplicaciones Business Intelligence Hoy Futuro del Business Intelligence
Definición Historia y Evolución Conceptos Importantes Beneficios Soluciones Aplicaciones Business Intelligence Hoy Futuro del Business Intelligence Conclusiones Conjunto de productos y servicios que permiten
Esta solución de fácil uso está orientada a cualquier industria, ya sea una empresa del sector privado o del sector público.
1 En la actualidad el 80% de la información de una empresa está relacionada a un lugar. La variable de ubicación está presente en todas las áreas críticas de un negocio. Sin embargo, las organizaciones
Inteligencia de Negocios Introducción. Por Elizabeth León Guzmán, Ph.D. Profesora Ingeniería de Sistemas Grupo de Investigación MIDAS
Inteligencia de Negocios Introducción Por Elizabeth León Guzmán, Ph.D. Profesora Ingeniería de Sistemas Grupo de Investigación MIDAS Agenda 1.Introducción 2.Definición 3.ETL 4.Bodega de Datos 5.Data Mart
SolucionesAnalíticas con Pentaho.
SolucionesAnalíticas con Pentaho. Objetivo Obtener experiencia práctica con los siguientes componentes de la plataforma Pentaho: Pentaho Data Integration (Kettle) Pentaho Analysis Services (Mondrian) Pentaho
Artículo dedicado a la Innovación y Mejores Prácticas en la Ingeniería de Negocios
Herramienta para Indicadores de Gestión Se ha dado cuenta de lo difícil que es conseguir que todos los miembros de su organización vean "la gran foto" y trabajen juntos para lograr los objetivos estratégicos
IWG-101: Introducción a la Ingeniería. Departamento de Informática, UTFSM 1
IWG-101: Introducción a la Ingeniería Departamento de Informática, UTFSM 1 Gestión de Bases de Datos Gestión de Bases de Datos Base de datos una colección de datos relacionados organizados de manera de
Unidad 1: Componentes del sistema
Unidad 1: Componentes del sistema Identificar los elementos del sistema de información de mercados de la organización. M.I.A. Gabriel Ruiz Contreras gabriel2306@prodigy.net.mx Contenido 1. Elementos del
Libere el conocimiento que vive en cualquier dato. Mario Ochoa 10/09/2014
Libere el conocimiento que vive en cualquier dato Mario Ochoa 10/09/2014 En qué se diferencian las empresas exitosas de la actualidad? Datos. Valor La innovación de tecnología acelera el valor Machine
INTELIGENCIA DE NEGOCIOS
INTELIGENCIA DE NEGOCIOS A P R O X I M A C I Ó N A U N A E X P E R I E N C I A D E A P L I C A C I Ó N E N I N S T I T U C I O N E S D E L A R E G I Ó N Ing. Patricia Uceda Martos Agenda Introducción Definición
Pentaho BI. Lic. Patricia Palacios Zuleta
Pentaho BI. Lic. Patricia Palacios Zuleta Conociendo el pentaho Conociendo el pentaho 1. Barra de Menus: Estas localizada en la parte alta de la ventana, donde se puede ver alguno standares de menus como
Sistema de Gestión de Proyectos Estratégicos.
[Documento versión 2.0 del 24/06/2015] Sistema de Gestión de Proyectos Estratégicos. El sistema de Gestión de Proyectos Estratégicos (GPE), es una poderosa herramienta para administrar y gestionar los
Implantación de Datawarehouse Open Free
Universidad de la República Facultad de Ingeniería Instituto de Computación Proyecto de Grado Implantación de Datawarehouse Open Free 19 de Agosto de 2011 Nicolás Gerolami - Esteban Revello - Germain Venzal
e-commerce, es hacer comercio utilizando la red. Es el acto de comprar y vender en y por medio de la red.
Comercio electrónico. (e-commerce) Las empresas que ya están utilizando la red para hacer comercio ven como están cambiando las relaciones de la empresa con sus clientes, sus empleados, sus colaboradores
10778 Implementing Data Models and Reports with Microsoft SQL Server 2012
10778 Implementing Data Models and Reports with Microsoft SQL Server 2012 Introducción Inteligencia de negocio (BI) se está convirtiendo incrementalmente importante para compañías de diferentes tamaños
916 638683 info@danysoft.com www.danysoft.com. Temario
SQL SQL Server 2012 Office 2013 XI Encuentro Danysoft en Microsoft Visualizar modelos analíticos con herramientas Microsoft BI Ana María Bisbé York a.bisbe@danysoft.com 916 638683 info@danysoft.com www.danysoft.com
Data Mining Técnicas y herramientas
Data Mining Técnicas y herramientas Introducción POR QUÉ? Empresas necesitan aprender de sus datos para crear una relación one-toone con sus clientes. Recogen datos de todos lo procesos. Datos recogidos
INFORME TÉCNICO PREVIO DE EVALUACIÓN DE SOFTWARE No 071 1 GTIOOO
INFORME TÉCNICO PREVIO DE EVALUACIÓN DE SOFTWARE No 071 1 GTIOOO "RENOVACI~N O ADQUISICI~N DEL MANTENIMIENTO Y SOPORTE TECNICO DE LICENCIAS DE SOFTWARE PARA LA EXPLOTACIÓN Y ANÁLISIS DIMENSIONAL DE GRANDES
w w w. l o c a t i o n - w o r l d. c o m
1 En la actualidad el 80% de la información de una empresa está relacionada a un lugar. La variable de ubicación está presente en todas las áreas críticas de un negocio. Sin embargo, las organizaciones
Consultas con combinaciones
UNIDAD 1.- PARTE 2 MANIPULACIÓN AVANZADA DE DATOS CON SQL. BASES DE DATOS PARA APLICACIONES Xochitl Clemente Parra Armando Méndez Morales Consultas con combinaciones Usando combinaciones (joins), se pueden
Business Intelligence
Business Intelligence Definición Business Intelligence es una aproximación estratégica para identificar, vigilar, comunicar y transformar, sistemáticamente, signos e indicadores en información activa en
Tutorial JPivot Del Giudice Glenda Della Mea Mariela Universidad Nacional de Córdoba 18-08-2011
Del Giudice Glenda Della Mea Mariela Universidad Nacional de Córdoba 18-08-2011 Contenido Introducción... 2 Qué es JPivot y para que se utiliza?... 2 Qué es OLAP?... 2 Primeros Pasos... 2 1. Login... 2
http://www.statum.biz http://www.statum.info http://www.statum.org
ApiaMonitor Monitor de Infraestructura BPMS Por: Ing. Manuel Cabanelas Product Manager de Apia Manuel.Cabanelas@statum.biz http://www.statum.biz http://www.statum.info http://www.statum.org Abstract A
IBM Cognos Enterprise: Inteligencia de negocio y gestión del rendimiento potente y escalable
: Inteligencia de negocio y gestión del rendimiento potente y escalable Puntos destacados Dota a los usuarios de su organización de las capacidades de business intelligence y de gestión del rendimiento
MICROSOFT DYNAMICS AX 2009
Nombre: Alan Rodrigo Santos Siñani Docente: Lic. Indira Guzmán Tema: Dynamics AX 2009 Fecha de entrega: 05/04/10 MICROSOFT DYNAMICS AX 2009 Microsoft Dynamics AX 2009 es una solución de gestión empresarial
LOS CINCO GRADOS DE MADUREZ DE UN PROYECTO BI
LOS CINCO GRADOS DE MADUREZ DE UN PROYECTO BI INTRODUCCIÓN Se habla en multitud de ocasiones de Business Intelligence, pero qué es realmente? Estoy implementando en mi organización procesos de Business
Social Big Data. Ignacio Bustillo Ignacio.Bustillo@stratebi.com Twitter: @IgnacioBustillo Fecha presentación: 13 de Noviembre de 2014
Social Big Data Ignacio Bustillo Ignacio.Bustillo@stratebi.com Twitter: @IgnacioBustillo Fecha presentación: 13 de Noviembre de 2014 'Hello world!' Creador & Organizador Docente universitario El mundo
Carta de constitución de la PMO para IDlink
TALLER CARTA DE LA PMO Carta de constitución de la PMO para IDlink Versión Fecha Descripción de cambios Autor / Editor Aprobado por 1.0 08-02-2014 Daniel Gómez Daniel Gómez González Patrocinador Ejecutivo
Brindamos asesorías que involucran tecnología y personal calificado, estos hacen de DOCTUM su mejor aliado.
SOFTWARE DE GESTÓN Doctum sabe que es necesario entregar servicios que otorguen un valor agregado, sobre todo para la gestión documental de la empresa, lo que reduce los costos asociados a mano de obra
www.itconsulting.com.bo
Señor(a): Cliente Presente.- Santa Cruz, 23 de octubre del 2012 Distinguido Señores: REF.: COTIZACION CURSO BUSINESS INTELLIGENCE & DATAWAREHOUSE & CUBOS OLAP EN EXCEL 2010 Consultores en Tecnologías de
Business Intelligence
2012 Business Intelligence Agenda Programas Diferencias de OLTP vs OLAP Arquitectura de una solución de BI Tecnologías Microsoft para BI Diferencias entre OLTP v/s OLAP Alineación de Datos OLTP Datos organizados
Business Intelligence y Cuadro de Mando Integral: Herramientas para la Dirección Estratégica de las Organizaciones
Business Intelligence y Cuadro de Mando Integral: Herramientas para la Dirección Estratégica de las Organizaciones Facultad de Ingeniería 2005 Cra. Isabel Rodríguez Ramos Ideasoft AGENDA: 1. Business Intelligence,
Estándares para el Uso de Herramientas de Desarrollo y Plataformas de Aplicaciones Web
Secretaría de Planificación Estratégica Oficina de Informática Estándares para el Uso de Herramientas de Desarrollo y Plataformas de Aplicaciones Web VERSIÓN 4 Julio 2009 Índice 1. Generalidades... 3 1.1
w w w. l o c a t i o n - w o r l d. c o m
1 En la actualidad el 80% de la información de una empresa está relacionada a un lugar. La variable de ubicación está presente en todas las áreas críticas de un negocio. Sin embargo, las organizaciones
Location Business Solutions
1 En la actualidad el 80% de la información de una empresa está relacionada a un lugar. La variable de ubicación está presente en todas las áreas críticas de un negocio. Sin embargo, las organizaciones
Gobierno de Aragón. Herramienta Análisis Multidimensional para el Observatorio de Empleo
Instituto Aragonés de Empleo Herramienta Análisis Multidimensional para el Observatorio de Empleo Índice 1 FICHA... 3 2 SITUACIÓN INICIAL... 5 3 OBJETIVOS... 6 4 SOLUCIÓN... 8 5 RESULTADOS...10 Página
Reporte Registro de Personas con Discapacidad
SISTEMA INTEGRAL DE LA PROTECCION SOCIAL SISPRO SISTEMA DE GESTION DE DATOS SGD Reporte Registro de Personas con Discapacidad CÓDIGO: VERSIÓN: 3 FECHA: 201310 Reporte Registro de Personas con Discapacidad
Convertimos lo complicado en sencillo, lo fácil en operativo y eliminamos lo ineficaz
Convertimos lo complicado en sencillo, lo fácil en operativo y eliminamos lo ineficaz Quiénes somos SDManalytics es una compañía especializada en el análisis de datos y en el desarrollo de soluciones para
Modelado dimensional de datos
MODELADO DE DATOS DATA WAREHOUSE Ana María Bisbé York a.bisbe@danysoft.com, Servicios Profesionales sp@danysoft.com www.danysoft.com 18.04.2013 Temario Datawarehouse vs Transaccional Modelado dimensional
TUTORIAL DATA WAREHOUSE: OLAP - Analysis Services
TUTORIAL DATA WAREHOUSE: OLAP - Analysis Services Este documento consta de: Descripción general del Tutorial Prerrequisitos Pasos generales a seguir Pasos específicos a seguir Anexo I - Almacenamiento