Área Académica: Sistemas Computacionales. Tema: Introducción a almacén de datos. Profesor: Mtro Felipe de Jesús Núñez Cárdenas



Documentos relacionados
Área Académica: Sistemas Computacionales. Profesor: Felipe de Jesús Núñez Cárdenas

Área Académica: Sistemas Computacionales. Tema: Arquitectura de un sistema de almacén de datos. Profesor: Mtro Felipe de Jesús Núñez Cárdenas

Área Académica: Sistemas Computacionales. Tema: Explotación de un Almacén de Datos: Herramientas OLAP. Profesor: Mtro Felipe de Jesus Nuñez Cardenas

Keywords: Minería de Datos, Datawarehouse, OLAP, OLTP

OPTATIVA I: MINERIA DE DATOS

Extracción Automática de Conocimiento en Bases de Datos e Ingeniería del Software

Datawarehouse. Ing. Adan Jaimes Jaimes. Datawarehouse

Bases de datos y bases de conocimiento

DES: Programa(s) Educativo(s): Tipo de materia: Clave de la materia: Semestre:

Sistemas de Inteligencia de Negocios

El almacén de indicadores de proceso de negocio en ejecución

Sistemas de Información 12/13 La organización de datos e información

Extracción Automática de Conocimiento en Bases de Datos e Ingeniería del Software


Definición. Data Warehousing: almacenamiento, transformación y distribución de datos útiles para los responsables de tomar decisiones 9/29/2006 4

Sistemas de Información para la Gestión. Unidad 3 Aplicaciones de Sistemas

Karem Jaquelin Peralta Venegas RESUMEN

José Hernández Orallo Mª. José Ramírez Quintana

UNIVERSIDAD DEL VALLE DE MÉXICO PROGRAMA DE ESTUDIO DE LICENCIATURA PRAXIS MES XXI

TÓPICOS AVANZADOS DE BASES DE DATOS

Academia de la carrera de Licenciatura Informática del Instituto Tecnológico Aguascalientes

Fundamentos de la Inteligencia de Negocios

DATA WAREHOUSE DATA WAREHOUSE

Inteligencia de Negocios Introducción. Por Elizabeth León Guzmán, Ph.D. Profesora Ingeniería de Sistemas Grupo de Investigación MIDAS

CONTENIDO LOS AUTORES...15 PRÓLOGO...17 NOVEDADES DE ESTA TERCERA EDICIÓN...21 AGRADECIMIENTOS...27

Guía docente de la asignatura

BUSINESS INTELLIGENCE

LOS CINCO GRADOS DE MADUREZ DE UN PROYECTO BI

Los Datos que generan la Información

INTELIGENCIA DE NEGOCIOS. Business Intelligence. Alumno: Toledo Paucar Jorge

MOLAP REALIZADO POR: JOSE E. TABOADA RENNA

ASIGNATURA: Tecnologías de Información y Comunicación II

REPOSITORIO COR O P R OR O A R T A I T VO V

Inteligencia de Negocios. Cecilia Ruz

Sistemas de Información para la Gestión. UNIDAD 2: RECURSOS DE TI Información y Aplicaciones

Fundamentos de la Inteligencia de Negocios

Business Intelligence y Cuadro de Mando Integral: Herramientas para la Dirección Estratégica de las Organizaciones

UNIVERSIDAD DE SANTIAGO DE CHILE INGENIERIA COMERCIAL APLICACIÓN COMPUTACIONAL I INTELIGENCIA DE NEGOCIOS

GUÍA DOCENTE TITULACIONES DE GRADO

Informática II Ing. Industrial. Data Warehouse. Data Mining

SISTEMAS DE INFORMACION GERENCIAL LIC.PATRICIA PALACIOS ZULETA

Universidad Autónoma del Estado de México. La minería de datos en el proceso de KDD ( Knowledge Discovery and Data Mining)

FUENTES SECUNDARIAS INTERNAS

UN PASEO POR BUSISNESS INTELLIGENCE

TEMA 1 Sistemas de información

Botón menú Objetivo de la Minería de datos.

Business Intelligence

CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN.

Concepto y Objetivos de las Bases de Datos

UNIVERSIDAD NACIONAL ABIERTA VICERRECTORADO ACADÉMICO AREA: INGENIERÍA. FECHA DE ENTREGA AL ESTUDIANTE: Adjunto a la Primera Prueba Parcial.

Bases de datos para toma de decisiones

Capítulo 2 Tecnología data warehouse

Secretaría de Docencia Dirección de Estudios Profesionales

ARTÍCULOS Y REFLEXIONES

TECNOLOGÍA SOFTWARE PARA EL DESARROLLO DE SISTEMAS DE INFORMACIÓN. Sistemas Informacionales (BI Business Intelligence) Sonia Marrero Cáceres

Sistema de análisis de información. Resumen de metodología técnica

Sistemas de Información Ejecutiva Concepto Data Warehousing Concepto Data Mart Data Warehouse empresarial El Data Warehouse como herramienta

Dirección General de Educación Superior Tecnológica

Data Warehousing. Introducción. Facultad de Ingeniería Escuela de Ingeniería de Sistemas y Computación

ARQUITECTURA DE UNA BODEGA DE DATOS

INTELIGENCIA DE NEGOCIO

Aprendizaje Computacional. Eduardo Morales y Jesús González

Máster en Economía Finanzas y Computación. Universidad de Huelva Universidad Internacional de Andalucía.

FUNDAMENTOS DE DATA WAREHOUSE

Almacén de datos - concepto. Arquitectura de un sistema de almacén de datos

INTELIGENCIA DE NEGOCIO

DESARROLLO E IMPLANTANCIÓN DE UN SISTEMA ACADEMICO PARA EL ICM

Nombre de la asignatura: Base de Datos Avanzadas. Carrera: Licenciatura en Informática. Clave de la Asignatura: BDC-0702

Universidad Autónoma del Estado de México Licenciatura en Informática Administrativa 2003 Programa de Estudios:

Fundamentos de la Inteligencia de Negocios

Curso del Data Mining al Big Data

SISTEMAS DE SOPORTE GERENCIAL

BASE DE DATOS DISTRIBUIDAS 1. DATOS DE LA ASIGNATURA

Universidad Católica San Pablo Facultad de Ingeniería y Computación Programa Profesional de Ciencia de la Computación SILABO

UNIVERSIDAD DEL VALLE DE MÉXICO PROGRAMA DE ESTUDIO DE LICENCIATURA PRAXIS MES XXI

Fundamentos de Data Warehouse

Business Intelligence. Octubre

BI Business Intelligence Un Mercado de Alto Crecimiento

Los mayores cambios se dieron en las décadas de los setenta, atribuidos principalmente a dos causas:

CAPÍTULO 2 DATA WAREHOUSES

RECURSOS DE TI Aplicaciones - Bibliografía FUNDAMENTOS DE LA INTELIGENCIA DE NEGOCIOS

Los futuros desafíos de la Inteligencia de Negocios. Richard Weber Departamento de Ingeniería Industrial Universidad de Chile

Introducción a selección de. Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012

UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS MAESTRÍA EN CIENCIAS DE LA INFORMACIÓN Y LAS COMUNICACIONES MINERÍA DE DATOS

SÍLABO. : Electivo : Ingeniería de Sistemas : IS0806. : VIII Ciclo : 2 de Teoría y 2 de Práctica : 03 : Ninguno

activuspaper Text Mining and BI Abstract

BUSINESS INTELLIGENCE

Mineria de datos y su aplicación en web mining data Redes de computadores I ELO 322

Definición Historia y Evolución Conceptos Importantes Beneficios Soluciones Aplicaciones Business Intelligence Hoy Futuro del Business Intelligence

Facultad de Ciencias Económicas. Departamento de Sistemas. Asignatura: INTELIGENCIA DE NEGOCIOS. Plan 1997

TÓPICOS SELECTOS DE OTROS CURSOS

FECHA DE ENTREGA AL ESTUDIANTE: Adjunto a la primera Prueba Parcial. FECHA DE DEVOLUCIÓN POR PARTE DEL ESTUDIANTE: Adjunto a la Prueba Integral

UNIVERSIDAD AUTONOMA DE GUADALAJARA ACP06 ALUMNO: JOSE ANGEL DEHESA JIMENEZ REGISTRO: C R M

CONSIDERACIONES GENERALES DEL WEB MINING

Minería de Procesos. Octubre 2013 Ing. Diego Karbuski


MINERÍA DE DATOS: ÁREA DE OPORTUNIDADES

DATA WAREHOUSING (ENERO DE 2003) Documento creado por Ing. Héctor H. Martínez Orpinel

Aplicación de herramientas de inteligencia de negocios en modelamiento geometalúrgico

Transcripción:

Área Académica: Sistemas Computacionales Tema: Introducción a almacén de datos Profesor: Mtro Felipe de Jesús Núñez Cárdenas Periodo: Agosto Noviembre 2011 Keywords Almacén de Datos, Datawarehouse, Arquitectura

Tema: Introducción a almacén de datos Abstract Datawarehouses are tools that help us analize information and whose main features are information-oriented,integrate,time-varying and nonvolatile. Keywords: Almacen de Datos, Datawarehouse, Arquitectura

OBJETIVO: Análisis de Datos para el Soporte en la Toma de Decisiones. Generalmente, la información que se quiere investigar sobre un cierto dominio de la organización se encuentra en bases de datos y otras fuentes muy diversas, tanto internas como externas. Muchas de estas fuentes son las que se utilizan para el trabajo diario (bases de datos operacionales).

Sobre estas mismas bases de datos de trabajo ya se puede extraer conocimiento (visión tradicional). Uso de la base de datos transaccional para varios cometidos: Se mantiene el trabajo transaccional diario de los sistemas de información originales (conocido como OLTP, On-Line Transactional Processing). Se hace análisis de los datos en tiempo real sobre la misma base de datos (conocido como OLAP, On-Line Analytical Processing).

Uso de la base de datos transaccional para varios cometidos: PROBLEMAS: perturba el trabajo transaccional diario de los sistemas de información originales ( killer queries ). Se debe hacer por la noche o en fines de semana. la base de datos está diseñada para el trabajo transaccional, no para el análisis de los datos. Generalmente no puede ser en tiempo real (era AP pero no OLAP).

Se desea operar eficientemente con esos datos... los costes de almacenamiento masivo y conectividad se han reducido drásticamente en los últimos años, parece razonable recoger los datos (información histórica) en un sistema separado y específico. NACE EL DATA-WAREHOUSING Datawarehouses (Almacenes o Bodegas de Datos)

Almacenes de Datos (AD) (data warehouse) motivación disponer de Sistemas de Información de apoyo a la toma de decisiones* disponer de bases de datos que permitan extraer conocimiento de la información histórica almacenada en la organización objetivos análisis de la organización previsiones de evolución diseño de estrategias * DSS: Decision Support Systems

Almacenes de datos Base de Datos diseñada con un objetivo de explotación distinto que el de las bases de datos de los sistemas operacionales. Sistema Operacional (OLTP) BD orientada al proceso Sistema de Almacén de Datos (DW) BD orientada al análisis

Almacenes de Datos colección de datos diseñada para dar apoyo a los procesos de toma de decisiones características definición orientada hacia la información* relevante de la organización integrada variable en el tiempo no volátil * subject oriented, not process oriented

AD: Orientado hacia la información relevante de la organización Base de Datos Transaccional se diseña para consultar eficientemente información relativa a las actividades (ventas, compras, producción,...) básicas de la organización, no para soportar los procesos que se realizan en ella (gestión de pedidos, facturación, etc). CURSO... REUNION... PAÍS... PROTOTIPO... VENTA... GAMA... PRODUCTO... Información Necesaria

AD: Integrado integra datos recogidos de diferentes sistemas operacionales de la organización (y/o fuentes externas). Base de Datos Transaccional 1 Fuentes Internas texto Fuente de Datos 1 Fuente de Datos 3 HTML Fuentes Externas Fuente de Datos 2 Base de Datos Transaccional 2 Almacén de Datos

AD: Variable en el tiempo los datos son relativos a un periodo de tiempo y deben ser incrementados periódicamente. Los datos son almacenados como fotos (snapshots) correspondientes a periodos de tiempo. Tiempo 01/2003 02/2003 03/2003 Datos Datos de Enero Datos de Febrero Datos de Marzo

AD: No volátil los datos almacenados no son actualizados, sólo son incrementados. Carga Bases de datos operacionales Almacén de Datos INSERT READ UPDATE DELETE READ El periodo de tiempo cubierto por un AD varía entre 2 y 10 años.

Almacenes de Datos ventajas para las organizaciones rentabilidad de las inversiones realizadas para su creación aumento de la competitividad en el mercado aumento de la productividad de los técnicos de dirección

Almacenes de Datos problemas infravaloración del esfuerzo necesario para su diseño y creación infravaloración de los recursos necesarios para la captura, carga y almacenamiento de los datos incremento continuo de los requisitos de los usuarios privacidad de los datos

Sistema Operacional (OLTP) Almacén de datos (DW) - almacena datos actuales - almacena datos históricos - almacena datos de detalle - almacena datos de detalle y datos agregados a distintos niveles -bases de datos medianas (100Mb-1Gb) - bases de datos grandes (100Gb-1Tb) - los datos son dinámicos (actualizables) - los datos son estáticos - los procesos (transacciones) son repetitivos - los procesos no son previsibles - el número de transacciones es elevado - el número de transacciones es bajo o medio - tiempo de respuesta pequeño (segundos) - tiempo de respuesta variable (segundos-horas) - dedicado al procesamiento de transacciones - dedicado al análisis de datos - orientado a los procesos de la organización - orientado a la información relevante - soporta decisiones diarias - soporta decisiones estratégicas - sirve a muchos usuarios (administrativos) - sirve a técnicos de dirección

Bibliografía Hand, D.J.; Mannila, H. and Smyth, P. Principles of Data Mining, The MIT Press, 2000. Hernández, J.; Ramírez, MJ.; Ferri, C. Introducción a la Minería de Datos Pearson Prentice Hall, 2004. Kosala, R.; Blockeel, H. Web Mining Research: A Survey ACM SIGKDD Explorations, Newsletter of the ACM SIG on Knowledge Discovery and Data Mining, June 2000, Vol. 2, nº1, pp. 1-15. Mena, Jesus Data Mining Your Website, Digital Press, July 1999. Mitchell, T.M. Machine Learning McGraw-Hill 1997. Pyle, D. Data Preparation for Data Mining Morgan Kaufmann, Harcourt Intl., 1999. Thuraisingham, B. Data Mining. Technologies, Techniques, Tools, and Trends, CRC Press, 1999. Witten, I.H.; Frank, E. Tools for Data Mining, Morgan Kaufmann, 1999. Wong, P. C. Visual Data Mining, Special Issue of IEEE Computer Graphics and Applications, Sep/ Oct 1999, pp. 20-46. Material extraído del Análisis y Extracción de Conocimiento en Sistemas de Información:Datawarehouse y Datamining de José Hernández Orallo, Universidad Politécnica de Valencia