Área Académica: Sistemas Computacionales. Tema: Explotación de un Almacén de Datos: Herramientas OLAP. Profesor: Mtro Felipe de Jesus Nuñez Cardenas

Documentos relacionados
Área Académica: Sistemas Computacionales. Profesor: Felipe de Jesús Núñez Cárdenas

Área Académica: Sistemas Computacionales. Tema: Arquitectura de un sistema de almacén de datos. Profesor: Mtro Felipe de Jesús Núñez Cárdenas

Área Académica: Sistemas Computacionales. Tema: Introducción a almacén de datos. Profesor: Mtro Felipe de Jesús Núñez Cárdenas

Keywords: Minería de Datos, Datawarehouse, OLAP, OLTP

OLAP 2 OLAP 1 OLAP 4 OLAP 3 OLAP 5 OLAP 6

Extracción Automática de Conocimiento en Bases de Datos e Ingeniería del Software

Bases de datos y bases de conocimiento

OPTATIVA I: MINERIA DE DATOS

Benemérita Universidad Autónoma de Puebla Vicerrectoría de Docencia Dirección General de Educación Superior Facultad de Ciencias de la Computación

Extracción Automática de Conocimiento en Bases de Datos e Ingeniería del Software

Inteligencia de Negocios

Introducción a la Prospección de Datos Masivos ( Data Mining )

Introducción a la Prospección de Datos Masivos ( Data Mining )

DES: Programa(s) Educativo(s): Tipo de materia: Clave de la materia: Semestre:

Sistemas de Información 12/13 La organización de datos e información

Aprendizaje Computacional. Eduardo Morales y Jesús González

ASIGNATURA: Tecnologías de Información y Comunicación II

Secretaría de Docencia Dirección de Estudios Profesionales

Diseño multidimensional. Jordi Conesa i Caralt Isabel Guitart Hormigo M. Elena Rodríguez González

Carrera : Ingeniería Informática SATCA

Módulo Minería de Datos

ALMACENES DE DATOS * Transparencias basadas parcialmente en el tutorial DW de Matilde Celma

GUÍA DOCENTE. Minería Web

Informe sobre las presentaciones Miren B. Amorrortu Fernández

Definición. Data Warehousing: almacenamiento, transformación y distribución de datos útiles para los responsables de tomar decisiones 9/29/2006 4

PLAN DE TRABAJO DOCENTE 2013

UNIVERSIDAD DEL VALLE DE MÉXICO PROGRAMA DE ESTUDIO DE LICENCIATURA PRAXIS MES XXI

BUSINESS INTELLIGENCE

Facultad de Ciencias Económicas. Departamento de Sistemas. Asignatura: INTELIGENCIA DE NEGOCIOS. Plan 1997

MOLAP REALIZADO POR: JOSE E. TABOADA RENNA

Aplicación de técnicas de minería de datos para la evaluación del rendimiento académico y la deserción estudiantil

Facultad de Ingeniería y Tecnología Informática Licenciatura en Sistemas de Información Plan: 2012 Ciclo: 2014 Programa Analítico Base de Datos II

Minería de Datos. Vallejos, Sofia

Integración de datos espaciales de dos dimensiones en la construcción de hipercubos dentro del procesamiento analítico en línea

INTELIGENCIA DE NEGOCIO

Resumen Inteligencia de Negocios

INTELIGENCIA DE NEGOCIO

GUÍA DOCENTE TITULACIONES DE GRADO

UNIVERSIDAD AUTÓNOMA DE CHIAPAS LICENCIATURA EN SISTEMAS COMPUTACIONALES

Bases de Datos Otoño 2012 Maestría en Ingeniería de Software L.I Yessica Sugeidy Morales Mateo. 22/09/2012 Bases de Datos

Minería de datos (Presentación del curso)

TÓPICOS AVANZADOS DE BASES DE DATOS

MINERÍA DE DATOS: ÁREA DE OPORTUNIDADES

Text Mining. Laura Alonso i Alemany. Facultad de Matemática, Astronomía y Física UNC, Córdoba (Argentina)

DATA WAREHOUSE Y DATA MINING APLICADOS AL ESTUDIO DEL RENDIMIENTO ACADÉMICO Y DE PERFILES DE ALUMNOS

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 5 -

UNIVERSIDAD NACIONAL DEL CALLAO

SQL Server Business Intelligence parte 1

Dirección General de Educación Superior Tecnológica

CAPÍTULO 2 DATA WAREHOUSES

UNIVERSIDAD RICARDO PALMA FACULTAD DE INGENIERÍA

Construcción de cubos OLAP utilizando Business Intelligence Development Studio

Data Mining, OLAP y Data Warehousing. Robert Antonio Romero Flores Mg. Ingeniería de Sistemas Mg. Administración

LA MINERÍA DE DATOS EN LA EXTRACCIÓN DE CONOCIMIENTOS APLICADOS A PROBLEMAS RELACIONADOS CON LA EDUCACIÓN

Guía docente de la asignatura

CENTRO UNIVERSITARIO DE CIENCIAS EXACTAS E INGENIERÍAS DIVISIÓN DE ELECTRÓNICA Y COMPUTACIÓN

Universidad Católica San Pablo Facultad de Ingeniería y Computación Programa Profesional de Ciencia de la Computación SILABO

Herramientas de Business Intelligence

Introducción a la Minería de Datos y al Aprendizaje Automático

FACULTAD DE INGENIERÍA. Bases de Datos Avanzadas

IFF SATCA 1 : Carrera:

CREACIÓN DE PROYECTOS DE BUSINESS INTELLIGENCE CON SQL SERVER. 40 horas 60 días

Minería de la Web Tema 1

Cátedra: BI Business Intelligence. Asignatura BI Business Intelligence Ciclo Lectivo 2012 Vigencia del Ciclo lectivo 2012.

Detección de Patrones de Bajo Rendimiento Académico y Deserción Estudiantil con Técnicas de Minería de Datos

Programa Internacional Business Intelligence

Minería de Datos. Vallejos, Sofia

Bases de Datos II. Programa de la Asignatura:

Carrera: Ingeniería en Sistemas Computacionales PRESENTACIÓN

Mate-tree: un algoritmo para la. en operadores algebraicos y primitivas SQL* 1

UNIVERSIDAD AUTÓNOMA DE CHIAPAS LICENCIATURA EN CONTADURÍA

Metodología de descripción de indicadores de rendimiento de procesos para su implementación en un almacén de datos

Universidad Politécnica de Valencia ETSI Telecomunicación Área de Ingeniería Telemática Transmisión de Datos

Un modelo predictivo para reducir la tasa de ausentismo en atenciones médicas programadas

CUBOS GRÁFICOS OLAP. Compiladores CEO

Soluciones OLAP con Microsoft Analysis Services

Formalización de Web Mining como Conocimiento Estructurado

Introducción a selección de. Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012

Semestre de cursado: primero Cantidad de horas semanales: 8. Hoja 1 de 10 Profesor Asociado: María Eugenia Stefanoni. J:T:P: Higinio Facchini

6º Congreso Argentino de AgroInformática, CAI Plataforma web para la gestión Agro-ganadera

Visión global del KDD

1 10. Carga horaria. DEPARTAMENTO DE SISTEMAS DE INFORMACI~N Academia de Software Especializado PROGRAMA DE ESTUDIOS. asignatura 9. Tipo de Asignatura

Text Mining. Laura Alonso i Alemany. Facultad de Matemática, Astronomía y Física UNC, Córdoba (Argentina)

Bases de Datos Masivas

Unidad 10. Almacenes de Datos

Unidad 10: DATAWAREHOUSING y OLAP. Cátedra Bases de Datos

Sistemas de Información Orientados a la Toma de Decisiones: el enfoque multidimensional

Virtual 100%. Disponibilidad del aula 24 horas. Servidores Universidad El Bosque. $ (Un Millón de Pesos)

IIC Sistemas Recomendadores

Introducción a la Minería de Datos y el Data Warehousing

GUÍA DOCENTE. Curso Académico 2015/16. Minería de Datos: Modelos Integrados de Extracción de

Data Warehouse y Data Mining Aplicados al Estudio del Rendimiento Académico

EXTRACCIÓN DE ESTRUCTURAS DE CONOCIMIENTO EN CAMPOS TEXTUALES

Inteligencia de Negocios Introducción. Por Elizabeth León Guzmán, Ph.D. Profesora Ingeniería de Sistemas Grupo de Investigación MIDAS

FILTRADO DE CONTENIDOS WEB EN ESPAÑOL DENTRO DEL PROYECTO POESIA

MSc. Francisco García

Concepto de vista. (con ciertas limitaciones). nivel físico) Una vista es una tabla virtual (no tiene una correspondencia a

WEB MINING FOR IDENTIFYING PATTERNS

Academia de la carrera de Licenciatura Informática del Instituto Tecnológico Aguascalientes

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE ESTUDIOS SUPERIORES ACATLÁN HORAS SEMANA

Transcripción:

Área Académica: Sistemas Computacionales Tema: Explotación de un Almacén de Datos: Herramientas OLAP Profesor: Mtro Felipe de Jesus Nuñez Cardenas Periodo:Agosto Noviembre 2011 Keywords Herramientas OLAP, OLTP.

Tema: Explotación de un Almacen de Datos: Herramientas OLAP Abstract Datawarehouse are used by different OLAP tools, which help you get a better analysis of information from them reports we can generate. Keywords: Herramientas OLAP, OLTP

Las herramientas de OLAP presentan al usuario una visión multidimensional de los datos (esquema multidimensional) para cada actividad que es objeto de análisis. El usuario formula consultas a la herramienta OLAP seleccionando atributos de este esquema multidimensional sin conocer la estructura interna (esquema físico) del almacén de datos. La herramienta OLAP genera la correspondiente consulta y la envía al gestor de consultas del sistema (p.ej. mediante una sentencia SELECT).

una consulta a un almacén de datos consiste generalmente en la obtención de medidas sobre los hechos parametrizadas por atributos de las dimensiones y restringidas por condiciones impuestas sobre las dimensiones medida hecho Importe total de las ventas durante este año de los productos del departamento Bebidas, por trimestre y por categoría?. Restricciones: productos del departamento Bebidas, ventas durante este año Parámetros de la consulta: por categoría de producto y por trimestre

Marca Bebidas Categoría Día de la semana Departamento Tipo Nro_producto Día Año Mes Trimestre importe 2002 unidades Almacén Importe total de ventas en este año, del departamento de Bebidas, por categoría y trimestre Ciudad Región Tipo

trimestre categoría importe

Categoría Trimestre Ventas T1 2000000 Presentación tabular (relacional) de los datos seleccionados T2 1000000 T3 T4 3000000 2000000 T1 1000000 T2 T3 T4 1500000 8000000 2400000 Se asumen dos categorías en el departamento de Bebidas: y.

trimestre categoría T1 T2 T3 T4 2000000 1000000 3000000 2000000 Presentación matricial (multidimensional) de los datos seleccionados 1000000 1500000 8000000 2400000 Los parámetros de la consulta ( por trimestre y por categoría ) determinan los criterios de agrupación de los datos seleccionados (ventas de productos del departamento Bebidas durante este año). La agrupación se realiza sobre dos dimensiones (Producto, Tiempo).

Lo interesante no es poder realizar consultas que, en cierto modo, se pueden hacer con selecciones, proyecciones, concatenaciones y agrupamientos tradicionales. Lo realmente interesante de las herramientas OLAP son sus operadores de refinamiento o manipulación de consultas. DRILL ROLL SLICE & DICE PIVOT

El carácter agregado de las consultas en el Análisis de Datos, aconseja la definición de nuevos operadores que faciliten la agregación (consolidación) y la disgregación (división) de los datos: agregación (roll): permite eliminar un criterio de agrupación en el análisis, agregando los grupos actuales. disgregación (drill): permite introducir un nuevo criterio de agrupación en el análisis, disgregando los grupos actuales.

Si se desea introducir la dimensión Almacén en el análisis anterior e incluir un nuevo criterio de agrupación sobre la ciudad del almacén: Importe total de las ventas durante este año de los productos del departamento Bebidas, por trimestre, por categorías y por ciudad del almacén?. Restricciones: productos del departamento Bebidas, ventas durante este año Parámetros de la consulta: por categoría de producto, por trimestre y por ciudad del almacén.

Marca Bebidas Categoría Día de la semana Departamento Tipo Nro_producto Día Año Mes Trimestre importe 2002 unidades Almacén Importe total de ventas en este año, del departamento de Bebidas, por categoría, trimestre y ciudad Ciudad Región Tipo

trimestre categoría importe la operación de DRILL se realiza sobre el informe original!

Categoría Trimestre Ventas Categoría Trimestre Ciudad Ventas T1 2000000 T1 T1 Valencia León 1000000 1000000 T2 1000000 T2 Valencia 400000 T3 3000000 T2 León 700000 T4 T1 1000000 T2 T3 2000000 1500000 8000000 Cada grupo (categoría-trimestre) de la consulta original se disgrega en dos nuevos grupos (categoría-trimestreciudad) para las ciudades de León y Valencia. T4 2400000 * Se asumen dos ciudades: Valencia y León.

Herramientas OLAP 300000 500000 200000 2000000 1000000 400000 100000 500000 T3 T4 Presentación matricial de los datos seleccionados.

Si se desea eliminar el criterio de agrupación sobre la dimensión Tiempo en la consulta original: Importe total de las ventas durante este año de los productos del departamento Bebidas, por categorías?

Marca Bebidas Categoría Día de la semana Departamento Tipo Nro_producto Día Año Mes Trimestre importe 2002 unidades Almacén Importe total de ventas en este año, del departamento de Bebidas, por categorías Ciudad Región Tipo

trimestre categoría importe la operación de ROLL se realiza sobre el informe original!

Categoría Trimestre Ventas T1 2000000 T2 1000000 T3 3000000 Categoría Ventas T4 2000000 8000000 T1 1000000 12900000 T2 T3 T4 1500000 8000000 2400000

Las operaciones de agregación (DRILL) y disgregación (ROLL) se pueden hacer sobre: atributos de una dimensión sobre los que se ha definido una jerarquía: DRILL-DOWN, ROLL-UP departamento categoría - producto (Producto) año - trimestre mes - día (Tiempo) sobre dimensiones independientes: DRILL-ACROSS, ROLL-ACROSS Producto Almacén -Tiempo

trimestre categoría importe la operación de DRILL se realiza sobre el informe original!

Categoría Trimestre Ventas Categoría Trimestre Mes Ventas T1 2000000 T1 T1 Enero Febrero 1000000 500000 T2 1000000 T1 Marzo 500000 T3 3000000 T4 T1 1000000 T2 2000000 1500000 Cada grupo (categoría-trimestre) de la consulta original se disgrega en dos nuevos grupos (categoría-trimestre-mes). T3 T4 8000000 2400000

Otras operaciones de OLAP: SLICE & DICE: seleccionar y proyectar datos en el informe. PIVOT: reorientación de las dimensiones en el informe.

Q2 Store 2 Q1 Store 1 Herramientas OLAP Ventas Productos Store1 Store2 Ventas Productos Q1 Q2 Electronics Toys Clothing Cosmetics $5,2 $1,9 $2,3 $1,1 $5,6 $1,4 $2,6 $1,1 Electronics Toys Clothing Cosmetics $5,2 $1,9 $2,3 $1,1 $8,9 $0,75 $4,6 $1,5 Electronics Toys Clothing Cosmetics $8,9 $0,75 $4,6 $1,5 $7,2 $0,4 $4,6 $0,5 PIVOT Electronics Toys Clothing Cosmetics $5,6 $1,4 $2,6 $1,1 $7,2 $0,4 $4,6 $0,5

Q2 Q2 Q1 Q1 Herramientas OLAP Ventas Productos Store1 Store2 Ventas Electronics Toys Clothing Cosmetics $5,2 $1,9 $2,3 $1,1 $5,6 $1,4 $2,6 $1,1 Productos Store1 Electronics Toys $5,2 $1,9 Electronics Toys Clothing Cosmetics $8,9 $0,75 $4,6 $1,5 $7,2 $0,4 $4,6 $0,5 SLICE & DICE Electronics Toys $8,9 $0,75

Las herramientas de OLAP se caracterizan* por: ofrecer una visión multidimensional de los datos (matricial). no imponer restricciones sobre el número de dimensiones. ofrecer simetría para las dimensiones. permitir definir de forma flexible (sin limitaciones) sobre las dimensiones: restricciones, agregaciones y jerarquías entre ellas. ofrecer operadores intuitivos de manipulación: drill-down, roll-up, slice-anddice, pivot. ser transparentes al tipo de tecnología que soporta el almacén de datos (ROLAP o MOLAP). *Subconjunto de las 12 reglas propuestas por E.F. Codd para A.D.

Bibliografía Hand, D.J.; Mannila, H. and Smyth, P. Principles of Data Mining, The MIT Press, 2000. Hernández, J.; Ramírez, MJ.; Ferri, C. Introducción a la Minería de Datos Pearson Prentice Hall, 2004. Kosala, R.; Blockeel, H. Web Mining Research: A Survey ACM SIGKDD Explorations, Newsletter of the ACM SIG on Knowledge Discovery and Data Mining, June 2000, Vol. 2, nº1, pp. 1-15. Mena, Jesus Data Mining Your Website, Digital Press, July 1999. Mitchell, T.M. Machine Learning McGraw-Hill 1997. Pyle, D. Data Preparation for Data Mining Morgan Kaufmann, Harcourt Intl., 1999. Thuraisingham, B. Data Mining. Technologies, Techniques, Tools, and Trends, CRC Press, 1999. Witten, I.H.; Frank, E. Tools for Data Mining, Morgan Kaufmann, 1999. Wong, P. C. Visual Data Mining, Special Issue of IEEE Computer Graphics and Applications, Sep/ Oct 1999, pp. 20-46. Material extraído del Análisis y Extracción de Conocimiento en Sistemas de Información:Datawarehouse y Datamining de José Hernández Orallo, Universidad Politécnica de Valencia