Introducción a la minería de datos. Necesidades asociadas

Save this PDF as:
 WORD  PNG  TXT  JPG

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Introducción a la minería de datos. Necesidades asociadas"

Transcripción

1 Universidad Nacional de La Pampa Facultad de Ciencias Económicas y Jurídicas Introducción a la minería de datos. Necesidades asociadas Mg. Ing. Mario José Diván

2 Temario 1. Qué es data mining? 2. Que no es data mining? 3. Causas del surgimiento del data mining 4. El proceso Knowledge Discovery in Databases (KDD) 5. Contexto de las bases de datos frente al data mining 6. Principales funciones del data mining 7. Aplicaciones actuales 8. Tendencias 30/10/2006 Total de diapositivas: 43 2

3 Temario 1. Qué es data mining? 2. Que no es data mining? 3. Causas del surgimiento del data mining 4. El proceso Knowledge Discovery in Databases (KDD) 5. Contexto de las bases de datos frente al data mining 6. Principales funciones del data mining 7. Aplicaciones actuales 8. Tendencias 30/10/2006 Total de diapositivas: 43 3

4 Qué es data mining? [1/6] La aplicación de técnicas en grandes volúmenes de datos para descubrir información interesante, útil, aplicable y no trivial 1. Características fundamentales de la definición: 1. Very large databases (VLDB) 2. Descubrir 3. Información 4. Interesante 5. Útil 6. Aplicable 7. No trivial 30/10/2006 Total de diapositivas: 43 4

5 Qué es data mining? [2/6] 1. Qué es un patrón? Síntesis o representación del conocimiento obtenido desde una base de datos 2. Cuándo un patrón es interesante? 1. Interés 2. Oportuno 3. Aplicable 4. No trivial 5. Nuevo 6. Fácil de entender 3. Un algoritmo debe buscar todos los patrones interesantes? 4. Importancia del conocimiento del dominio del negocio donde se aplicará data mining 30/10/2006 Total de diapositivas: 43 5

6 Qué es data mining? [3/6] Importancia del conocimiento del dominio del negocio donde se aplicará data mining Detección de los procesos de negocios centrales (Core Business) Detección de los procesos de negocios de soporte Trazabilidad del dato hasta la fuente de generación Nivel Estratégico Procesos de Negocios Nivel Táctico Sistemas de Información Nivel Operativo información 30/10/2006 Total de diapositivas: 43 6

7 Qué es data mining? [4/6] 1. Información versus dato Características: Interés Oportuna Veraz Consistente 2. Concepto de modelo, adaptación del modelo y error 30/10/2006 Total de diapositivas: 43 7

8 Qué es data mining? [5/6] [ ] Most data mining algorithms can be viewed as compositions of a few basics techniques and principles [ ], consist largely of some specific mix of three components: The model: There are two relevants factors: Function of the model: Eg. Classification and clustering and the Representational form: linear function of multiple variables and a gaussian probability density function. A model contains parameters that are to be determinated from the data. [ ] The preference criterion: [ ] The search algorithm: The specification of an algorithm for finding particular models and parameters, given data, model and a preference criterion.[ ] A parituclar data mining algorithm is usually a instantiation of the model/preference/search components (*) (*) Usama Fayyad & Ramazamy Uthurusamy; Data mining and Knowledge Discovery in Databases ; Communications of ACM, vol 39 Nro. 11, Noviembre de /10/2006 Total de diapositivas: 43 8

9 Qué es data mining? [6/6] Siempre es necesario utilizar data mining? SQL Reporting OLAP Planillas de cálculo Entre otras (*) Chris Rogers; Database Desgins for Data Warehouse Solutions ; Sysbase, /10/2006 Total de diapositivas: 43 9

10 Temario 1. Qué es data mining? 2. Que no es data mining? 3. Causas del surgimiento del data mining 4. El proceso Knowledge Discovery in Databases (KDD) 5. Contexto de las bases de datos frente al data mining 6. Principales funciones del data mining 7. Aplicaciones actuales 8. Tendencias 30/10/2006 Total de diapositivas: 43 10

11 Qué no es data mining? 1. No es un software estadístico 2. No es un sistema experto 3. No es consulta sobre bases de datos 30/10/2006 Total de diapositivas: 43 11

12 Temario 1. Qué es data mining? 2. Que no es data mining? 3. Causas del surgimiento del data mining 4. El proceso Knowledge Discovery in Databases (KDD) 5. Contexto de las bases de datos frente al data mining 6. Principales funciones del data mining 7. Aplicaciones actuales 8. Tendencias 30/10/2006 Total de diapositivas: 43 12

13 Causas del surgimiento del DM&KDD 1. Crecimiento del volumen de datos Costos de almacenamiento en decrecimiento Poca información ejecutiva, demasiados datos operativos Poco aprovechamiento de los datos históricos 2. Problemas en la exposición de información 3. Surgimiento e implementación del concepto de data warehouse, data marts, corporate informatio factory (CIF) 30/10/2006 Total de diapositivas: 43 13

14 Causas del surgimiento del DM&KDD 1. Componentes del Corporate Information Factory (CIF) 30/10/2006 Total de diapositivas: 43 14

15 Temario 1. Qué es data mining? 2. Que no es data mining? 3. Causas del surgimiento del data mining 4. El proceso Knowledge Discovery in Databases (KDD) 5. Contexto de las bases de datos frente al data mining 6. Principales funciones del data mining 7. Aplicaciones actuales 8. Tendencias 30/10/2006 Total de diapositivas: 43 15

16 Knowledge Discovery in Databases (KDD) Selección Preprocesamiento de datos Escoger la función de data mining Ejecutar el algoritmo Escoger el algoritmo de data mining Interpretación Uso del conocimiento Datos trabajados Conjunto de datos objetivo Fuentes de datos Conocimiento del negocio 30/10/2006 Total de diapositivas: 43 16

17 KDD -> Conocimiento del Negocio Qué es conocer el negocio? Identificar los procesos centrales de la empresa (Core Business) Identificar los procesos de soporte de la empresa Identificar el proceso de generación de datos a través de los procesos empresariales Esquema conceptual de los procesos funcionales del laboratorio de análisis de la Administración Provincial del Agua (APA) La Pampa, Argentina- 30/10/2006 Total de diapositivas: 43 17

18 KDD -> Fuentes de datos Sobre qué datos puede aplicarse minería de datos? Identificar las fuentes de datos de los sistemas de información Identificar las fuentes de datos transaccionales Obtener la estructura de las fuentes de datos Analizar si existe redundancia intra e inter fuentes de datos Analizar si existe riesgos de pérdida de información en la estructura Analizar la semántica de la estructura de datos (Precaución con las unidades de medida de los datos) Ver esquema relacional Identificar las fuentes de datos orientadas a las consultas Obtener el modelado del esquema de bases de datos orientado a consultas Hechos versus métricas Identificar hechos y métricas de la estructura multidimensional Ver esquema multidimensional 30/10/2006 Total de diapositivas: 43 18

19 KDD -> Fuentes de datos -Selección- OLTP Data warehouse Data Mart OLAP Sistemas legados y otras fuentes Selección Problemas comunes de la integración y transformación Redundancia directa e indirecta Inconsistencia (debe decidirse) Unidades de medida para el mismo atributo en diferentes BD Conjunto de datos objetivo 30/10/2006 Total de diapositivas: 43 19

20 KDD -> Datos trabajados -Preprocesamiento- Preprocesamiento Depurar la fuente de datos, problemas comunes: Ruido en los datos & Análisis de Outliers Inconsistencias Incompleto Valores faltantes Conjunto de datos objetivo Agregar información complementaria al conjunto de datos (dataset) Ejemplo: Medidas descriptivas y/o de tendencia, datos contextuales al dato como paridades cambiarias si son divisas, etc. Datos trabajados 30/10/2006 Total de diapositivas: 43 20

21 KDD -> Escoger el algoritmo de data mining Datos trabajados Elegir la función de data mining: Agrupamiento (Clustering) Reglas de asociación (Association Rules) Patrones secuenciales (Sequential Patterns) Series temporales Clasificación Predicción Función seleccionada Ejemplo: Clasificación, Algoritmos disponibles: CHAID CART C4.5 J48 ID3 CART Naive Bayes Entre otros 30/10/2006 Total de diapositivas: 43 21

22 KDD -> Interpretación CART 30/10/2006 Total de diapositivas: 43 22

23 KDD -> Uso del conocimiento Uso del conocimiento if (cliente_antiguedad <= 10,12 AND mcaja_ahorro_paquete<=611,85 AND mcajeros_propiso_descuentos<=2,36) { } Prob(No)=0,558 (*) No: El cliente del banco no va a comprar una nueva tarjeta de crédito 30/10/2006 Total de diapositivas: 43 23

24 KDD -> Metodologías de data mining CRISP-DM CRoss Industry Standard Process for Data Mining ( Basado en el proceso KDD Iniciativa de la industria patrocinada por SPSS, Teradata, DaimlerChrysler & Ohra. Etapas: Business understanding Data understanding Data preparation Modeling Evaluation Deployment 30/10/2006 Total de diapositivas: 43 24

25 KDD -> Metodologías de data mining SEMMA Sample, Explore, Modify, Model, Asses Acercamiento que combina un proceso estructurado con la organización lógica de las herramientas necesarias para soportar cada uno de los pasos Propiedad de SAS Institute Etapas: Sample Explore Modify Model Asses 30/10/2006 Total de diapositivas: 43 25

26 Temario 1. Qué es data mining? 2. Que no es data mining? 3. Causas del surgimiento del data mining 4. El proceso Knowledge Discovery in Databases (KDD) 5. Contexto de las bases de datos frente al data mining 6. Principales funciones del data mining 7. Aplicaciones actuales 8. Tendencias 30/10/2006 Total de diapositivas: 43 26

27 Contexto de las bases de datos frente al data mining Heterogeneidad en las fuentes de datos Tipología de las fuentes de datos: Estructuradas: Sistemas legados Archivos de texto BD relacionales BD orientadas a objetos BD temporales BD espaciales BD orientadas a consultas Entre otras Semi estructuradas: HTML XML Entre otras 30/10/2006 Total de diapositivas: 43 27

28 Contexto de las bases de datos frente al data mining Fuertemente recomendable: No desarrollar actividades asociadas a data mining sobre la misma plataforma (Hardware) que utilizan los sistemas transaccionales de la empresa. Razones: Los algoritmos de data mining son en general intensivos en procesamiento Los algoritmos hacen uso intensivo de memoria Data mining trabaja sobre VLDB, por lo que el tiempo de ejecución de los algoritmos puede ser elevado 30/10/2006 Total de diapositivas: 43 28

29 Temario 1. Qué es data mining? 2. Que no es data mining? 3. Causas del surgimiento del data mining 4. El proceso Knowledge Discovery in Databases (KDD) 5. Contexto de las bases de datos frente al data mining 6. Principales funciones del data mining 7. Aplicaciones actuales 8. Tendencias 30/10/2006 Total de diapositivas: 43 29

30 Principales funciones del data mining: Reglas de asociación (Association rules) Dado I = {i 1, i 2, i 3,, i n } Sea D un conjunto de datos relevantes a la tarea Sea T un conjunto de ítems / T I Cada transacción T es identificado por un atributo al que denominamos TID Una regla de asociación es una regla de la forma: A B/ A I B I A B φ Soporte (s): % de transacciones en D que contienen A U B, en términos estadísticos es la P(AUB) Confianza(s): % de transacciones en D que contienen A B, en términos estadísticos es la P( A B) 30/10/2006 Total de diapositivas: 43 30

31 Principales funciones del data mining: Reglas de asociación (Association rules) Reglas fuertes: Así se denomina a aquellas reglas que satisfacen un soporte mínimo (min_sup) y una confianza o confidencia mínima (min_conf). Frecuencia de ocurrencia de un itemset (conjunto de ítems): es el número de transacciones que contienen el itemset. Un itemset satisface un soporte mínimo si y solo si su frecuencia de ocurrencia es superior o igual a min_sup e inferior o igual al número de transacciones en D. Si el itemset satisface el soporte mínimo entonces se lo denomina itemset frecuente Principio A priori : Cualquier subconjunto no vacío de un itemset frecuente debe ser frecuente. 30/10/2006 Total de diapositivas: 43 31

32 Principales funciones del data mining: Reglas de asociación (Association rules) Ejemplos de reglas de asociación: Basadas en un tipo de valor: Compra(X, CD ) y Compra(X, Reproductor de CD ) => Compra(X, Reproductor MP3 ) Basadas en la dimensión del dato asociado: edad(x, ) e Ingreso(X, 24k 48k ) => Compra(X, Palm ) Basadas en niveles de abstracción: edad(x, ) => Compra(X, Notebooks ) edad(x, ) => Compra(X, Computadoras ) Se tiene diferentes niveles de granularidad en las reglas Se dispone de una jerarquía de conceptos (productos para el ejemplo) Los ítems de niveles inferiores dispondrán de menos soporte 30/10/2006 Total de diapositivas: 43 32

33 Principales funciones del data mining: Reglas de asociación (Association rules) Si exige que las reglas expuestas posean igual soporte en todos los niveles: Cuanto más descienda en la jerarquía, menos soporte dispondrá. Esto implica que perder algunas reglas pero aquellas que cumplan las condiciones valdrían en un contexto general. Si cede a menores soportes en los niveles inferiores: Se corre el riesgo de que la regla no sirva para el contexto general. Una regla es redundante si su soporte está cercano a un valor esperado basado en la regla de un ancestro. En otras palabras, si bien desciende en el nivel de granularidad de la información, ésta no se traduce en el incremento del conocimiento. Ver ejemplo con WEKA 30/10/2006 Total de diapositivas: 43 33

34 Principales funciones del data mining: Concepto de patrones secuenciales (Sequential patterns) Una secuencia es una lista ordenada de itemsets Una secuencia es maximal si no es contenida por otra Cada secuencia maximal es un patrón secuencial Series temporales son un caso particular de los patrones secuenciales. La secuencia está dada por algún parámetros asociado al tiempo. Aplicaciones específicas: Retención de clientes Marketing focalizado 30/10/2006 Total de diapositivas: 43 34

35 Principales funciones del data mining: Clasificación y predicción Clasificación versus Predicción: Predice etiquetas de clases categóricas mientras que la predicción se basa en modelos de funciones valuadas-continua. Clasificación: Método supervisado Se compone de 2 etapas: 1. Construcción (Entrenamiento) 2. Poda (Pruning) Overfitting Objetivo del pruning Función de splitting Frena la construcción del árbol si: No existen más atributos que analizar o No existen más ejemplos que procesar o Todos los ejemplos para un nodo determinado poseen igual clase 30/10/2006 Total de diapositivas: 43 35

36 Principales funciones del data mining: Clasificación y predicción Clasificación Ver ejemplo en SPSS Predicción Predice el valor para una variable continua Modelos de funciones valuadas continua Ejemplos: Regresión lineal simple [Y= Bo + B1*X] Regresión lineal múltiple [Y= Bo + B1*x1+ B2*x2 + + Bn*Xn] Entre otros Ver ejemplo con Infostat Particionamiento del conjunto de datos para evitar el overfitting 30/10/2006 Total de diapositivas: 43 36

37 Principales funciones del data mining: Agrupamiento (Clustering) Conjunto de datos u objetos reunidos bajo una misma agrupación en función de alguna medida de similaridad que maximiza la varianza entre grupos y la minimiza dentro del mismo No supervisado Tipo de acercamientos Orientados al particionamiento: K-means: Relativamente eficiente Necesita que se especifique el k (cantidad de grupos a armar) No es capaz de manejar ruido y outliers (Efecto similar a la media aritmética) K-medoids Ver ejemplo con Infostat No escala bien Buen desempeño en grupos de datos relativamente pequeños 30/10/2006 Total de diapositivas: 43 37

38 Principales funciones del data mining: Agrupamiento (Clustering) Tipo de acercamientos Continua Orientados al particionamiento: La principal diferencia entre K-means y k-medoids, es que en el primero el centro del cluster no necesariamente es un elemento, mientras que el segundo requiere que el centro sea un elemento representativo del grupo. Jerárquico Tiene la ventaja de no necesitar especificar la cantidad de grupos a generar Emplea una matriz de distancia entre los registros, para n datos genera una matriz nxn que contiene dichas distancias y cuya diagonal principal es 0 Existen dos variantes: Aglomerativo: Va reuniendo elementos desde lo más particular hasta obtener el conjunto de datos completo Divisivo: Va particionando el conjunto de datos completo hasta llegar a la división mínima de los mismos Ver ejemplo con Infostat Otros acercamientos: Basados en densidad, basados en grilla (detalles a diferentes niveles de granularidad), etc. 30/10/2006 Total de diapositivas: 43 38

39 Temario 1. Qué es data mining? 2. Que no es data mining? 3. Causas del surgimiento del data mining 4. El proceso Knowledge Discovery in Databases (KDD) 5. Contexto de las bases de datos frente al data mining 6. Principales funciones del data mining 7. Aplicaciones actuales 8. Tendencias 30/10/2006 Total de diapositivas: 43 39

40 Algunas aplicaciones 1. Minería de datos aplicado al audio, por ejemplo: Detector de mentiras, Patrones secuenciales aplicados a seguridad, etc. 2. Minería de datos aplicado a la calidad de datos 3. Minería de datos como parte del proceso ETL (Extraction, Trasnformation & Load en Data Warehousing) 4. Minería de datos aplicado a la exploración de cuencas petroleras 5. Minería de datos aplicado al tráfico de comunicaciones (Detección de fraudes) 6. Web mining (Entorno semiestructurado): 1. Web usage mining: Análisis de logs de servidores para análisis del patrón de recorrido y consumo del cybernauta [Ej: Amazon] 2. Web content mining: hincapie en el contenido de los documentos 3. Web structure mining: se enfoca la web como grafo dirigido (Page rank, comunidades, etc) 7. Entre otras 30/10/2006 Total de diapositivas: 43 40

41 Temario 1. Qué es data mining? 2. Que no es data mining? 3. Causas del surgimiento del data mining 4. El proceso Knowledge Discovery in Databases (KDD) 5. Contexto de las bases de datos frente al data mining 6. Principales funciones del data mining 7. Aplicaciones actuales 8. Tendencias 30/10/2006 Total de diapositivas: 43 41

42 Alguna de las líneas en desarrollo 1. Web mining: 1. Algoritmos 2. Semantic web 2. Minería de datos sobre data streams: 1. Data streams propiamente dicho dentro del área de bases de datos 2. Adecuación de funciones y algoritmos de data mining para data streams considerando respuestas on line y off line 3. Text Mining: 1. Problemática asociada al procesamiento del lenguaje natural 2. Adecuación y desarrollo de algoritmos para entornos semiestructurados 30/10/2006 Total de diapositivas: 43 42

43 Muchas gracias por su atención Es solo el inicio 30/10/2006 Total de diapositivas: 43 43

Introducción a la minería de datos y el descubrimiento del conocimiento en bases de datos

Introducción a la minería de datos y el descubrimiento del conocimiento en bases de datos Universidad Nacional de La Pampa Facultad de Ciencias Económicas y Jurídicas Introducción a la minería de datos y el descubrimiento del conocimiento en Mg. Ing. Mario José Diván Temario 1. Qué es data

Más detalles

CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN.

CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN. SISTEMA EDUCATIVO inmoley.com DE FORMACIÓN CONTINUA PARA PROFESIONALES INMOBILIARIOS. CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN. Business Intelligence. Data Mining. PARTE PRIMERA Qué es

Más detalles

MINERIA DE DATOS Y Descubrimiento del Conocimiento

MINERIA DE DATOS Y Descubrimiento del Conocimiento MINERIA DE DATOS Y Descubrimiento del Conocimiento UNA APLICACIÓN EN DATOS AGROPECUARIOS INTA EEA Corrientes Maximiliano Silva La información Herramienta estratégica para el desarrollo de: Sociedad de

Más detalles

Inteligencia en Redes de Comunicaciones. Tema 7 Minería de Datos. Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda

Inteligencia en Redes de Comunicaciones. Tema 7 Minería de Datos. Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda Inteligencia en Redes de Comunicaciones Tema 7 Minería de Datos Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda {jvillena, rcrespo, rueda}@it.uc3m.es Índice Definición y conceptos

Más detalles

EPB 603 Sistemas del Conocimiento!"#$ %& $ %'

EPB 603 Sistemas del Conocimiento!#$ %& $ %' Metodología para el Desarrollo de Proyectos en Minería de Datos CRISP-DM EPB 603 Sistemas del Conocimiento!"#$ %& $ %' Modelos de proceso para proyectos de Data Mining (DM) Son diversos los modelos de

Más detalles

Minería de Datos. Vallejos, Sofia

Minería de Datos. Vallejos, Sofia Minería de Datos Vallejos, Sofia Contenido Introducción: Inteligencia de negocios (Business Intelligence). Descubrimiento de conocimiento en bases de datos (KDD). Minería de Datos: Perspectiva histórica.

Más detalles

v.1.0 Clase 5 Docente: Gustavo Valencia Zapata

v.1.0 Clase 5 Docente: Gustavo Valencia Zapata v.1.0 Clase 5 Docente: Gustavo Valencia Zapata Temas Clase 5: Conceptos de Minería de Datos Herramientas de DM Referencias Minería de datos Proceso de DM www.gustavovalencia.com Minería de datos La minería

Más detalles

MINERÍA DE DATOS. Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE. Octubre - 2003

MINERÍA DE DATOS. Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE. Octubre - 2003 MINERÍA DE DATOS Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE Octubre - 2003 CONTENIDO Qué es Data Warehousing Data Warehouse Objetivos del Data Warehouse

Más detalles

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING Aprendizaje Automático y Data Mining Bloque IV DATA MINING 1 Índice Definición y aplicaciones. Grupos de técnicas: Visualización. Verificación. Descubrimiento. Eficiencia computacional. Búsqueda de patrones

Más detalles

Introducción a la Minería de Datos

Introducción a la Minería de Datos Introducción a la Minería de Datos Abdelmalik Moujahid, Iñaki Inza y Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del País Vasco Índice 1 Minería de

Más detalles

CONSIDERACIONES GENERALES DEL WEB MINING

CONSIDERACIONES GENERALES DEL WEB MINING CONSIDERACIONES GENERALES DEL WEB MINING Sandra Milena Leal Elizabeth Castiblanco Calderón* RESUMEN: el presente artículo describe los conceptos básicos para la utilización del Webmining, dentro de los

Más detalles

Minería de Datos. Vallejos, Sofia

Minería de Datos. Vallejos, Sofia Minería de Datos Contenido Introducción: Inteligencia de negocios (Business Intelligence). Componentes Descubrimiento de conocimiento en bases de datos (KDD). Minería de Datos: Perspectiva histórica. Fases

Más detalles

Visión global del KDD

Visión global del KDD Visión global del KDD Series Temporales Máster en Computación Universitat Politècnica de Catalunya Dra. Alicia Troncoso Lora 1 Introducción Desarrollo tecnológico Almacenamiento masivo de información Aprovechamiento

Más detalles

Sistemas de Información para la Gestión. Unidad 3 Aplicaciones de Sistemas

Sistemas de Información para la Gestión. Unidad 3 Aplicaciones de Sistemas para la Gestión Unidad 3 Aplicaciones de Sistemas U.N.Sa. Facultad de Cs.Económicas SIG 2010 UNIDAD 3: APLICACIONES DE SISTEMAS Aplicaciones empresariales: Sistemas empresariales. Sistemas de administración

Más detalles

Trabajo final de Ingeniería

Trabajo final de Ingeniería UNIVERSIDAD ABIERTA INTERAMERICANA Trabajo final de Ingeniería Weka Data Mining Jofré Nicolás 12/10/2011 WEKA (Data Mining) Concepto de Data Mining La minería de datos (Data Mining) consiste en la extracción

Más detalles

1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2.

1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2. 1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2. GENERALIDADES SOBRE LAS TÉCNICAS DE INVESTIGACIÓN SOCIAL Y DE MERCADOS

Más detalles

Minería de Datos JESÚS ANTONIO GONZÁLEZ BERNAL. Universidad UPP

Minería de Datos JESÚS ANTONIO GONZÁLEZ BERNAL. Universidad UPP Universidad Politécnica de Puebla UPP JESÚS ANTONIO GONZÁLEZ BERNAL 1 2 Evolución de la Tecnología BD 1960 s y antes Creación de las BD en archivos primitivos 1970 s hasta principios de los 1980 s BD Jerárquicas

Más detalles

Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI)

Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI) Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI) OFERTAS TECNOLÓGICAS 1) GESTIÓN ORGANIZACIONAL Y LOGÍSTICA INTEGRADA: TÉCNICAS Y SISTEMAS DE INFORMACIÓN 2) GESTIÓN

Más detalles

Base de datos II Facultad de Ingeniería. Escuela de computación.

Base de datos II Facultad de Ingeniería. Escuela de computación. Base de datos II Facultad de Ingeniería. Escuela de computación. Introducción Este manual ha sido elaborado para orientar al estudiante de Bases de datos II en el desarrollo de sus prácticas de laboratorios,

Más detalles

Fundamentos de la Inteligencia de Negocios

Fundamentos de la Inteligencia de Negocios Universidad Nacional de Salta Facultad de Ciencias Económicas, Jurídicas y Sociales Sistemas de Información para la Gestión Fundamentos de la Inteligencia de Negocios Administración de Bases de Datos e

Más detalles

Apoyo a la toma de Decisiones. Carlos A. Olarte Bases de Datos II

Apoyo a la toma de Decisiones. Carlos A. Olarte Bases de Datos II Carlos A. Olarte Bases de Datos II Contenido 1 Introducción 2 OLAP 3 Data Ware Housing 4 Data Mining Introducción y Motivación Cómo puede analizarse de forma eficiente volúmenes masivos de datos? La consulta,

Más detalles

PLAN DE TRABAJO DOCENTE 2013

PLAN DE TRABAJO DOCENTE 2013 PLAN DE TRABAJO DOCENTE 2013 1. DATOS DE LA ASIGNATURA Nombre: Procesamiento Analítico de Datos Código: Nivel: Grado Carácter: Optativo Área curricular a la que pertenece: Administración Carrera: Contador

Más detalles

SISTEMAS DE INFORMACION GERENCIAL LIC.PATRICIA PALACIOS ZULETA

SISTEMAS DE INFORMACION GERENCIAL LIC.PATRICIA PALACIOS ZULETA SISTEMAS DE INFORMACION GERENCIAL LIC.PATRICIA PALACIOS ZULETA Qué es inteligencia de negocios? (BI) Business Intelligence es la habilidad para transformar los datos en información, y la información en

Más detalles

Ingeniería del conocimiento. Sesión 1 Por qué estudiar aprendizaje automático?

Ingeniería del conocimiento. Sesión 1 Por qué estudiar aprendizaje automático? Ingeniería del conocimiento Sesión 1 Por qué estudiar aprendizaje automático? 1 Agenda Qué vamos a ver en la asignatura? Para qué sirve todo esto? Cómo aprobar la asignatura? 2 Extracción del conocimiento

Más detalles

PREPROCESADO DE DATOS PARA MINERIA DE DATOS

PREPROCESADO DE DATOS PARA MINERIA DE DATOS Ó 10.1007/978-3-319-02738-8-2. PREPROCESADO DE DATOS PARA MINERIA DE DATOS Miguel Cárdenas-Montes Frecuentemente las actividades de minería de datos suelen prestar poca atención a las actividades de procesado

Más detalles

DES: Programa(s) Educativo(s): Tipo de materia: Clave de la materia: Semestre:

DES: Programa(s) Educativo(s): Tipo de materia: Clave de la materia: Semestre: : : lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. 12 6 lemas propios de la. 12 6 lemas propios de la.

Más detalles

DATA WAREHOUSE DATA WAREHOUSE

DATA WAREHOUSE DATA WAREHOUSE DATA WAREHOUSE DATA WAREHOUSE Autor: Roberto Abajo Alonso Asignatura: Sistemas Inteligentes, 5º Curso Profesor: José Carlos González Dep. Ing. Sistemas Telemáticos, E.T.S.I. Telecomunicación Universidad

Más detalles

TÉCNICAS DE MINERÍA DE DATOS Y TEXTO APLICADAS A LA SEGURIDAD AEROPORTUARIA

TÉCNICAS DE MINERÍA DE DATOS Y TEXTO APLICADAS A LA SEGURIDAD AEROPORTUARIA TÉCNICAS DE MINERÍA DE DATOS Y TEXTO APLICADAS A LA SEGURIDAD AEROPORTUARIA MSC ZOILA RUIZ VERA Empresa Cubana de Aeropuertos y Servicios Aeronáuticos Abril 2010 ANTECEDENTES El proyecto Seguridad es una

Más detalles

2. CLASIFICACIÓN DE LA ACTIVIDAD CURRICULAR, FORMACIÓN PRÁCTICA Y CARGA HORARIA

2. CLASIFICACIÓN DE LA ACTIVIDAD CURRICULAR, FORMACIÓN PRÁCTICA Y CARGA HORARIA CÓDIGO ASIGNATURA 1131-3 DEPARTAMENTO: Ingeniería e Investigaciones Tecnológicas ASIGNATURA: DATA MINING y DATA WAREHOUSE Plan 2009 Ingeniería en Informática Año: 5 (Electiva - Ingeniería de Software)

Más detalles

Introducción a la Minería de Datos (Data Mining)

Introducción a la Minería de Datos (Data Mining) a la Minería de Datos (Data Mining) IT-Nova Facultad de Ingeniería Informática y Telecomunicaciones Iván Amón Uribe, MSc Minería de Datos Diapositivas basadas parcialmente en material de Inteligencia Analítica

Más detalles

Habilidades y Herramientas para trabajar con datos

Habilidades y Herramientas para trabajar con datos Habilidades y Herramientas para trabajar con datos Marcelo Ferreyra X Jornadas de Data Mining & Business Intelligence Universidad Austral - Agenda 2 Tipos de Datos Herramientas conceptuales Herramientas

Más detalles

PROPUESTA METODOLOGICA PARA LA EDUCCIÓN DE REQUISITOS EN PROYECTOS DE EXPLOTACIÓN DE INFORMACIÓN

PROPUESTA METODOLOGICA PARA LA EDUCCIÓN DE REQUISITOS EN PROYECTOS DE EXPLOTACIÓN DE INFORMACIÓN PROPUESTA METODOLOGICA PARA LA EDUCCIÓN DE REQUISITOS EN PROYECTOS DE EXPLOTACIÓN DE INFORMACIÓN Paola Britos 1,2, Enrique Fernandez 1,2, Ramón García-Martinez 1,2 Centro de Ingeniería del Software e Ingeniería

Más detalles

Proyecto técnico MINERÍA DE DATOS. Febrero 2014. www.osona-respon.net info@osona-respon.net

Proyecto técnico MINERÍA DE DATOS. Febrero 2014. www.osona-respon.net info@osona-respon.net Proyecto técnico MINERÍA DE DATOS Febrero 2014 www.osona-respon.net info@osona-respon.net 0. Índice 0. ÍNDICE 1. INTRODUCCIÓN... 2 2. LOS DATOS OCULTOS... 3 2.1. Origen de la información... 3 2.2. Data

Más detalles

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 9 -

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 9 - Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos - Sesión 9 - Juan Alfonso Lara Torralbo 1 Índice de contenidos Actividad. Qué es un modelo de Data Mining Qué es

Más detalles

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 2 -

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 2 - Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos - Sesión 2 - Juan Alfonso Lara Torralbo 1 Índice de contenidos (I) Introducción a Data Mining Actividad. Tipos

Más detalles

Facultad de Ciencias Económicas. Departamento de Sistemas. Asignatura: INTELIGENCIA DE NEGOCIOS. Plan 1997

Facultad de Ciencias Económicas. Departamento de Sistemas. Asignatura: INTELIGENCIA DE NEGOCIOS. Plan 1997 UNIVERSIDAD DE BUENOS AIRES Facultad de Ciencias Económicas Departamento de Sistemas Asignatura: INTELIGENCIA DE NEGOCIOS Código: 715 Plan 1997 Cátedra: DEPARTAMENTO DE SISTEMAS Carrera: Licenciado en

Más detalles

Sistemas de Información 12/13 La organización de datos e información

Sistemas de Información 12/13 La organización de datos e información 12/13 La organización de datos e información Departamento Informática e Ingeniería de Sistemas Universidad de Zaragoza (raqueltl@unizar.es) " Guión Introducción: Data Warehouses Características: entornos

Más detalles

Cátedra: BI Business Intelligence. Asignatura BI Business Intelligence Ciclo Lectivo 2012 Vigencia del Ciclo lectivo 2012.

Cátedra: BI Business Intelligence. Asignatura BI Business Intelligence Ciclo Lectivo 2012 Vigencia del Ciclo lectivo 2012. Asignatura BI Business Intelligence Ciclo Lectivo 2012 Vigencia del Ciclo lectivo 2012 programa Plan 2008 Área Complementaria Carga horaria semanal Anual/ cuatrimestral Coordinador de Cátedra Objetivos

Más detalles

Fundamentos de la Inteligencia de Negocios

Fundamentos de la Inteligencia de Negocios Sistemas de Información para la Gestión UNIDAD 2: Infraestructura de Tecnología de la Información Unidad 2 Infraestructura de Tecnología de la Información Estructura de TI y tecnologías emergentes. Estructura

Más detalles

Artículos de Minería de Datos de Dataprix Introducción a la minería de datos

Artículos de Minería de Datos de Dataprix Introducción a la minería de datos Published on Dataprix (http://www.dataprix.com) Principal > Artículos de Minería de Datos de Dataprix By Dataprix Created 26/12/2009-17:13 Artículos de Minería de Datos de Dataprix Introducción a la minería

Más detalles

DISEÑO E IMPLEMENTACIÓN DE SOLUCIONES BUSINESS INTELLIGENCE CON SQL SERVER 2012

DISEÑO E IMPLEMENTACIÓN DE SOLUCIONES BUSINESS INTELLIGENCE CON SQL SERVER 2012 DISEÑO E IMPLEMENTACIÓN DE SOLUCIONES BUSINESS INTELLIGENCE CON SQL SERVER 2012 FLUJO DE CAPACITACIÓN Prerrequisitos Fundamentos de Programación Sentencias SQL Server 2012 Duración: 12 horas 1. DESCRIPCIÓN

Más detalles

Curso del Data Mining al Big Data

Curso del Data Mining al Big Data Curso del Data Mining al Big Data Instructor: Dr. Luis Carlos Molina Félix Presentación. Las bases de datos y los sistemas de administración de datos han jugado un papel primordial en el crecimiento y

Más detalles

Mejores prácticas para el éxito de un sistema de información. Uno de los problemas de información dentro de las empresas es contar con datos

Mejores prácticas para el éxito de un sistema de información. Uno de los problemas de información dentro de las empresas es contar con datos ANEXO VI. Mejores prácticas para el éxito de un sistema de información Uno de los problemas de información dentro de las empresas es contar con datos importantes del negocio y que éstos estén aislados

Más detalles

Informática II Ing. Industrial. Data Warehouse. Data Mining

Informática II Ing. Industrial. Data Warehouse. Data Mining Data Warehouse Data Mining Definición de un Data Warehouses (DW) Fueron creados para dar apoyo a los niveles medios y altos de una empresa en la toma de decisiones a nivel estratégico en un corto o mediano

Más detalles

Contenido del Curso. Descubrimiento de Conocimiento a partir de datos. Introducción. Motivación

Contenido del Curso. Descubrimiento de Conocimiento a partir de datos. Introducción. Motivación Contenido del Curso Descubrimiento de Conocimiento a partir de Datos ISISTAN UNCPBA sschia@exa.unicen.edu.ar http://www.exa.unicen.edu.ar/catedras/dbdiscov/ Introducción al KDD Etapas Pre-procesamiento

Más detalles

UNIVERSIDAD DE COSTA RICA SISTEMA DE ESTUDIOS DE POSGRADO POSGRADO EN COMPUTACION E INFORMATICA JUSTIFICACIÓN OBJETIVO GENERAL OBJETIVOS ESPECÍFICOS

UNIVERSIDAD DE COSTA RICA SISTEMA DE ESTUDIOS DE POSGRADO POSGRADO EN COMPUTACION E INFORMATICA JUSTIFICACIÓN OBJETIVO GENERAL OBJETIVOS ESPECÍFICOS UNIVERSIDAD DE COSTA RICA SISTEMA DE ESTUDIOS DE POSGRADO POSGRADO EN COMPUTACION E INFORMATICA PF-3808 Minería de Datos II Semestre del 2009 Profesor: Dr. Francisco J. Mata (correo: fmatach@racsa.co.cr;

Más detalles

Business Intelligence

Business Intelligence 2012 Business Intelligence Agenda Programas Diferencias de OLTP vs OLAP Arquitectura de una solución de BI Tecnologías Microsoft para BI Diferencias entre OLTP v/s OLAP Alineación de Datos OLTP Datos organizados

Más detalles

Licencia GNU FDL. Detalle del cambio. Ing. Bernabeu Ricardo Dario, Ing. García Mattío Mariano Alberto. Versión incial. 05/11/2009

Licencia GNU FDL. Detalle del cambio. Ing. Bernabeu Ricardo Dario, Ing. García Mattío Mariano Alberto. Versión incial. 05/11/2009 Licencia GNU FDL Copyright 2009 Ing. Bernabeu Ricardo Dario, Ing. García Mattío Mariano Alberto. Se otorga permiso para copiar, distribuir y/o modificar este documento bajo los términos de la Licencia

Más detalles

Sistemas de Data Warehousing

Sistemas de Data Warehousing Federación Médica del Interior (FEMI) Sociedad Uruguaya de Informática en la Salud (SUIS) Información en Salud Edición 2009 Sistemas de Data Warehousing Dr. Ing. Adriana Marotta (In.Co - F.Ing - UDELAR)

Más detalles

Inteligencia de Negocios Introducción. Por Elizabeth León Guzmán, Ph.D. Profesora Ingeniería de Sistemas Grupo de Investigación MIDAS

Inteligencia de Negocios Introducción. Por Elizabeth León Guzmán, Ph.D. Profesora Ingeniería de Sistemas Grupo de Investigación MIDAS Inteligencia de Negocios Introducción Por Elizabeth León Guzmán, Ph.D. Profesora Ingeniería de Sistemas Grupo de Investigación MIDAS Agenda 1.Introducción 2.Definición 3.ETL 4.Bodega de Datos 5.Data Mart

Más detalles

Text Mining Introducción a Minería de Datos

Text Mining Introducción a Minería de Datos Text Mining Facultad de Matemática, Astronomía y Física UNC, Córdoba (Argentina) http://www.cs.famaf.unc.edu.ar/~laura SADIO 12 de Marzo de 2008 qué es la minería de datos? A technique using software tools

Más detalles

Diplomado Business Management

Diplomado Business Management Diplomado Business Management Duración 112 horas Objetivo general: Business Management es un programa innovador que permite que el alto directivo de reciente nombramiento en el puesto (con poco tiempo

Más detalles

Presentación de Pyramid Data Warehouse

Presentación de Pyramid Data Warehouse Presentación de Pyramid Data Warehouse Pyramid Data Warehouse tiene hoy una larga historia, desde 1994 tiempo en el que su primera versión fue liberada, hasta la actual versión 8.00. El incontable tiempo

Más detalles

Data Warehousing - Marco Conceptual

Data Warehousing - Marco Conceptual Data Warehousing - Marco Conceptual Carlos Espinoza C.* Introducción Los data warehouses se presentan como herramientas de alta tecnología que permiten a los usuarios de negocios entender las relaciones

Más detalles

Tecnología aplicada a la toma de decisiones o malas decisiones en tecnología?

Tecnología aplicada a la toma de decisiones o malas decisiones en tecnología? Tecnología aplicada a la toma de decisiones o malas decisiones en tecnología? DUTI 2007 LA PLATA AGOSTO 2007 Ernesto Chinkes Facultad de Ciencias Económicas Universidad de Buenos Aires Esquema del trabajo

Más detalles

Fundamentos de la Inteligencia de Negocios

Fundamentos de la Inteligencia de Negocios para la Gestión UNIDAD 3: APLICACIONES DE SISTEMAS Unidad 3 Aplicaciones de Sistemas Aplicaciones empresariales: Sistemas empresariales. Sistemas de administración de la cadena de suministros. Sistemas

Más detalles

Introducción a selección de. Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012

Introducción a selección de. Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012 Introducción a selección de atributos usando WEKA Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012 Contenido 1 Introducción a WEKA El origen Interfaces

Más detalles

Encuesta Permanente de Hogares

Encuesta Permanente de Hogares Minería de Datos Aplicada a la Encuesta Permanente de Hogares Disertante: Luis Alfonso Cutro Adscripto a la asignatura Diseño y Administración de Datos. Prof. Coordinador: Mgter. David Luís la Red Martínez

Más detalles

Sistemas de Información para la Gestión. UNIDAD 2: RECURSOS DE TI Información y Aplicaciones

Sistemas de Información para la Gestión. UNIDAD 2: RECURSOS DE TI Información y Aplicaciones UNIDAD 2: RECURSOS DE TI Información y Aplicaciones UNIDAD 2: RECURSOS DE TI Información y Aplicaciones 1. La Información: Propiedades de la Información. Sistemas de Información. Bases de Datos. 2. Administración

Más detalles

Botón menú Objetivo de la Minería de datos.

Botón menú Objetivo de la Minería de datos. Titulo de Tutorial: Minería de Datos N2 Botón menú: Introducción. Las instituciones y empresas privadas coleccionan bastante información (ventas, clientes, cobros, pacientes, tratamientos, estudiantes,

Más detalles

ASIGNATURA: Tecnologías de Información y Comunicación II

ASIGNATURA: Tecnologías de Información y Comunicación II ASIGNATURA: Tecnologías de Información y Comunicación II 53 HORAS DESCRIPCIÓN DE LA ASIGNATURA: Esta asignatura proporciona al alumno las competencias y herramientas teóricas necesarias para la aplicación

Más detalles

Minería de Datos Web. 1 er Cuatrimestre 2015. Página Web. Prof. Dra. Daniela Godoy. http://www.exa.unicen.edu.ar/catedras/ageinweb/

Minería de Datos Web. 1 er Cuatrimestre 2015. Página Web. Prof. Dra. Daniela Godoy. http://www.exa.unicen.edu.ar/catedras/ageinweb/ Minería de Datos Web 1 er Cuatrimestre 2015 Página Web http://www.exa.unicen.edu.ar/catedras/ageinweb/ Prof. Dra. Daniela Godoy ISISTAN Research Institute UNICEN University Tandil, Bs. As., Argentina http://www.exa.unicen.edu.ar/~dgodoy

Más detalles

Esta solución de fácil uso está orientada a cualquier industria, ya sea una empresa del sector privado o del sector público.

Esta solución de fácil uso está orientada a cualquier industria, ya sea una empresa del sector privado o del sector público. 1 En la actualidad el 80% de la información de una empresa está relacionada a un lugar. La variable de ubicación está presente en todas las áreas críticas de un negocio. Sin embargo, las organizaciones

Más detalles

Estos documentos estarán dirigidos a todas las personas que pertenezcan a equipos de implementación de Oracle BI, incluyendo a:

Estos documentos estarán dirigidos a todas las personas que pertenezcan a equipos de implementación de Oracle BI, incluyendo a: Oracle Business Intelligence Enterprise Edition 11g. A lo largo de los siguientes documentos trataré de brindar a los interesados un nivel de habilidades básicas requeridas para implementar efectivamente

Más detalles

Inteligencia de Negocios. & Microsoft Excel 2013

Inteligencia de Negocios. & Microsoft Excel 2013 Inteligencia de Negocios (Business Intelligence - BI) & Microsoft Excel 2013 Instructor: Germán Zelada Contenido del Curso Fundamentos de Data Warehousing y BI Qué es Business Intelligence? Definiendo

Más detalles

CURSO MINERÍA DE DATOS AVANZADO

CURSO MINERÍA DE DATOS AVANZADO CURSO MINERÍA DE DATOS AVANZADO La minería de datos (en inglés, Data Mining) se define como la extracción de información implícita, previamente desconocida y potencialmente útil, a partir de datos. En

Más detalles

BASE DE DATOS UNIVERSIDAD DE LOS ANDES FACULTAD DE MEDICINA T.S.U. EN ESTADISTICA DE SALUD CATEDRA DE COMPUTACIÓN II. Comenzar presentación

BASE DE DATOS UNIVERSIDAD DE LOS ANDES FACULTAD DE MEDICINA T.S.U. EN ESTADISTICA DE SALUD CATEDRA DE COMPUTACIÓN II. Comenzar presentación UNIVERSIDAD DE LOS ANDES FACULTAD DE MEDICINA T.S.U. EN ESTADISTICA DE SALUD CATEDRA DE COMPUTACIÓN II BASE DE DATOS Comenzar presentación Base de datos Una base de datos (BD) o banco de datos es un conjunto

Más detalles

Data Mining Técnicas y herramientas

Data Mining Técnicas y herramientas Data Mining Técnicas y herramientas Introducción POR QUÉ? Empresas necesitan aprender de sus datos para crear una relación one-toone con sus clientes. Recogen datos de todos lo procesos. Datos recogidos

Más detalles

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 5 -

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 5 - Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos - Sesión 5 - Juan Alfonso Lara Torralbo 1 Índice de contenidos Data Warehouse Modelo multidimensional Diagrama

Más detalles

CLASIFICACIÓN NO SUPERVISADA

CLASIFICACIÓN NO SUPERVISADA CLASIFICACIÓN NO SUPERVISADA CLASIFICACION IMPORTANCIA PROPÓSITO METODOLOGÍAS EXTRACTORES DE CARACTERÍSTICAS TIPOS DE CLASIFICACIÓN IMPORTANCIA CLASIFICAR HA SIDO, Y ES HOY DÍA, UN PROBLEMA FUNDAMENTAL

Más detalles

De qué tratará el curso. Otras consideraciones. Objetivos. Introducción. Motivación Explosión en la disponibilidad de información:

De qué tratará el curso. Otras consideraciones. Objetivos. Introducción. Motivación Explosión en la disponibilidad de información: Datamining y Aprendizaje Automatizado Prof. Carlos Iván Chesñevar Email: cic@cs.uns.edu.ar Http:\\cs.uns.edu.ar\~cic Departamento de Cs. e Ing. de la Computación Universidad Nacional del Sur Bahía Blanca,

Más detalles

Estructura de Bases de datos. Leonardo Víquez Acuña

Estructura de Bases de datos. Leonardo Víquez Acuña Estructura de Bases de datos Leonardo Víquez Acuña Lenguajes de Bases de Datos Un sistema de bases de datos proporciona Un lenguaje de definición de datos para especificar el esquema de la base de datos

Más detalles

Proceso del KDD (minería de datos o DataMining)

Proceso del KDD (minería de datos o DataMining) Qué es el KDD? Es un proceso no trivial que identifica patrones validos, previamente desconocidos, potencialmente utiles y fundamentalmente entendibles en los datos. es como se reconoce de manera teoria

Más detalles

MOLAP REALIZADO POR: JOSE E. TABOADA RENNA

MOLAP REALIZADO POR: JOSE E. TABOADA RENNA MOLAP REALIZADO POR: JOSE E. TABOADA RENNA BASE DE DATOS Conjunto de datos estructurados, fiables y homogéneos organizados independientemente en máquina, m accesibles en tiempo real, compatible por usuarios

Más detalles

Servicio de Difusión de la Creación Intelectual (SeDiCI)

Servicio de Difusión de la Creación Intelectual (SeDiCI) Servicio de Difusión de la Creación Intelectual (SeDiCI) SeDiCI es el repositorio institucional de la Universidad Nacional de La Plata (UNLP), creado con dos objetivos prioritarios: Para atender al rol

Más detalles

Curso Data Mining y Aplicaciones en Riesgo de Crédito

Curso Data Mining y Aplicaciones en Riesgo de Crédito RW.02 RW.01 Transferencia Internacional de Curso Data Mining y Aplicaciones en Riesgo de Crédito RICHARD WEBER PhD. En Investigación de Operaciones del Instituto de Tecnología de Aachen, Alemania La actividad

Más detalles

Juan Carlos Olarte B Innovation and Business Development Management. BIG DATA & ANALYTICS: El Futuro es Ahora

Juan Carlos Olarte B Innovation and Business Development Management. BIG DATA & ANALYTICS: El Futuro es Ahora Juan Carlos Olarte B Innovation and Business Development Management BIG DATA & ANALYTICS: El Futuro es Ahora Temas a Tratar Evolución y Tendencias Big Data & Analytics Data Mining, Data Science y Big Data

Más detalles

UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE INGENIERÍA, CIENCIAS FÍSICAS Y MATEMÁTICA CARRERA DE INGENIERÍA INFORMÁTICA

UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE INGENIERÍA, CIENCIAS FÍSICAS Y MATEMÁTICA CARRERA DE INGENIERÍA INFORMÁTICA UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE INGENIERÍA, CIENCIAS FÍSICAS Y MATEMÁTICA CARRERA DE INGENIERÍA INFORMÁTICA ANÁLISIS DE DATOS USANDO MODELOS ESTADÍSTICOS SOBRE UN DATAWAREHOUSE ACADÉMICO PARA

Más detalles

Cómo se usa Data Mining hoy?

Cómo se usa Data Mining hoy? Cómo se usa Data Mining hoy? 1 Conocer a los clientes Detectar segmentos Calcular perfiles Cross-selling Detectar buenos clientes Evitar el churning, attrition Detección de morosidad Mejora de respuesta

Más detalles

BearSoft. SitodeCloud. Rafael Rios Bascón Web: http://www.bearsoft.com.bo Móvil: +591 77787631 Email: rafael.rios@bearsoft.com.bo

BearSoft. SitodeCloud. Rafael Rios Bascón Web: http://www.bearsoft.com.bo Móvil: +591 77787631 Email: rafael.rios@bearsoft.com.bo BearSoft Rafael Rios Bascón Web: http://www.bearsoft.com.bo Móvil: +591 77787631 Email: rafael.rios@bearsoft.com.bo CONTENIDO 1. Resumen. 3 2. Business Intelligence.. 4 3. Características del software.

Más detalles

Resultados de Marketing Directo Utilizando Conceptos de Segmentación. RFM: Recency, Frequency, Monetary Value.

Resultados de Marketing Directo Utilizando Conceptos de Segmentación. RFM: Recency, Frequency, Monetary Value. Resultados de Marketing Directo Utilizando Conceptos de Segmentación. RFM: Recency, Frequency, Monetary Value. Luis Aburto Lafourcade Gerente de Desarrollo luaburto@analytics.cl Agenda CRM: Entendiendo

Más detalles

DATA WAREHOUSING (ENERO DE 2003) Documento creado por Ing. Héctor H. Martínez Orpinel

DATA WAREHOUSING (ENERO DE 2003) Documento creado por Ing. Héctor H. Martínez Orpinel DATA WAREHOUSING (ENERO DE 2003) DEFINICIÓN UN DATA WAREHOUSING ES UN CONJUNTO DE DATOS INTEGRADOS ORIENTADOS A UNA MATERIA, QUE VARIA CON EL TIEMPO Y QUE NO SON TRANSITORIOS, LOS CUALES SOPORTAN EL PROCESO

Más detalles

PROGRAMA DE CURSO. Personal 6 10 3.0 0 7. Electivo para ICC FI2002 Electromagnetismo. Competencia a la que Tributa el Curso. Propósito del Curso

PROGRAMA DE CURSO. Personal 6 10 3.0 0 7. Electivo para ICC FI2002 Electromagnetismo. Competencia a la que Tributa el Curso. Propósito del Curso PROGRAMA DE CURSO Código Nombre CC5206 Introducción a la Minería de Datos Nombre en Inglés Introduction to Data Mining SCT es Horas de Horas Docencia Horas de Trabajo Docentes Cátedra Auxiliar Personal

Más detalles

ARQUITECTURA DE UNA BODEGA DE DATOS

ARQUITECTURA DE UNA BODEGA DE DATOS ARQUITECTURA DE UNA BODEGA DE DATOS Estructura de contenidos INTRODUCCIÓN... 3 1. ARQUITECTURA DE UNA BODEGA DE DATOS... 3 1.1 PROPIEDADES... 3 1.2 ARQUITECTURA DE UNA CAPA... 4 1.3 ARQUITECTURA DE DOS

Más detalles

Minería de datos (Introducción a la minería de datos)

Minería de datos (Introducción a la minería de datos) Minería de datos (Introducción a la minería de datos) M. en C. Sergio Luis Pérez Pérez UAM CUAJIMALPA, MÉXICO, D. F. Trimestre 12-O. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 1 / 21

Más detalles

OLAP y Minería de Datos: Introducción

OLAP y Minería de Datos: Introducción OLAP y Minería de Datos: Introducción Carlos Hurtado L. churtado@dcc.uchile.cl Departamento de Ciencias de la Computación Universidad de Chile OLAP y Minería de Datos: Introducción, DCC, U. de Chile, 2do

Más detalles

Un modelo predictivo para reducir la tasa de ausentismo en atenciones médicas programadas

Un modelo predictivo para reducir la tasa de ausentismo en atenciones médicas programadas Un modelo predictivo para reducir la tasa de ausentismo en atenciones médicas programadas Ing. Juan Miguel Moine Ing. Cristian Germán Bigatti Ing. Guillermo Leale Est. Graciela Carnevali Est. Esther Francheli

Más detalles

Sistema de análisis de información. Resumen de metodología técnica

Sistema de análisis de información. Resumen de metodología técnica Sistema de análisis de información Resumen de metodología técnica Tabla de Contenidos 1Arquitectura general de una solución de BI y DW...4 2Orígenes y extracción de datos...5 2.1Procesos de extracción...5

Más detalles

Evaluación, limpieza y construcción de los datos: un enfoque desde la inteligencia artificial

Evaluación, limpieza y construcción de los datos: un enfoque desde la inteligencia artificial Universidad del Cauca Facultad de Ingeniería Electrónica y Telecomunicaciones Programas de Maestría y Doctorado en Ingeniería Telemática Seminario de Investigación Evaluación, limpieza y construcción de

Más detalles

DEL MODELO DE NEGOCIOS AL MODELO DE DATOS

DEL MODELO DE NEGOCIOS AL MODELO DE DATOS 1er. Foro CIO PERÚ Inteligencia de negocios DEL MODELO DE NEGOCIOS AL MODELO DE DATOS (Estrategia de Gestión de Información) Marita Huamán Peralta CEO Abril 2013 QUÉ HERRAMIENTAS? Muy poca Información

Más detalles

Familia de Windows Server 2003

Familia de Windows Server 2003 Familia de Windows Server 2003 Windows Server 2003 está disponible en cuatro ediciones. Cada edición se ha desarrollado para una función de servidor específica, como se describe en la tabla siguiente:

Más detalles

6.FUNDAMENTOS DE LA INTELIGENCIA DE NEGOCIOS: ADMINISTRACION DE BASES DE DATOS E INFORMACION

6.FUNDAMENTOS DE LA INTELIGENCIA DE NEGOCIOS: ADMINISTRACION DE BASES DE DATOS E INFORMACION 6.FUNDAMENTOS DE LA INTELIGENCIA DE NEGOCIOS: ADMINISTRACION DE BASES DE DATOS E INFORMACION CAJERO AUTOMATICO RESTAURANTE SUPERMERCADO YOUTUBE CINE UNIVERSIDAD BIBLIOTECA Administrador de Base de Datos

Más detalles

Presentación. Introducción a las técnicas de reconocimiento de patrones. Materia de doctorado en ingeniería/informática

Presentación. Introducción a las técnicas de reconocimiento de patrones. Materia de doctorado en ingeniería/informática Presentación Introducción a las técnicas de reconocimiento de patrones Materia de doctorado en ingeniería/informática Tópicos de minería de datos Materia optativa de LCC Docente: Pablo M. Granitto Horarios:

Más detalles

Definición. Data Warehousing: almacenamiento, transformación y distribución de datos útiles para los responsables de tomar decisiones 9/29/2006 4

Definición. Data Warehousing: almacenamiento, transformación y distribución de datos útiles para los responsables de tomar decisiones 9/29/2006 4 Definición Data Warehousing: almacenamiento, transformación y distribución de datos útiles para los responsables de tomar decisiones 9/29/2006 4 Definición (cont.) Un Data Warehouse es una colección de

Más detalles

BUSINESS INTELLIGENCE

BUSINESS INTELLIGENCE BUSINESS INTELLIGENCE PRESENTACIÓN Ramón Díaz Hernández Gerente (1.990) Nuestro Perfil Inversión permanente en formación y nuevas tecnologías. Experiencia en plataforma tecnológica IBM (Sistema Operativo

Más detalles

Gestión del Fraude. Pilar Sirvent, Arquitecto Senior de Software

Gestión del Fraude. Pilar Sirvent, Arquitecto Senior de Software Gestión del Fraude Pilar Sirvent, Arquitecto Senior de Software Áreas de Apoyo Gestión del Fraude Grandes Cantidades de Datos (Big Data) Volumen - Variedad - Velocidad Integración Visión 360º Análisis

Más detalles

CONSTRUCCION DE INDICADORES DE GESTION Y HERRAMIENTAS OLAP PARA PEQUEÑAS Y MEDIANAS EMPRESAS

CONSTRUCCION DE INDICADORES DE GESTION Y HERRAMIENTAS OLAP PARA PEQUEÑAS Y MEDIANAS EMPRESAS CONSTRUCCION DE INDICADORES DE GESTION Y HERRAMIENTAS OLAP PARA PEQUEÑAS Y MEDIANAS EMPRESAS 1. RESEÑA HISTORICA Las exigencias competitivas del mercado hacen que las organizaciones busquen mecanismos

Más detalles

Los futuros desafíos de la Inteligencia de Negocios. Richard Weber Departamento de Ingeniería Industrial Universidad de Chile rweber@dii.uchile.

Los futuros desafíos de la Inteligencia de Negocios. Richard Weber Departamento de Ingeniería Industrial Universidad de Chile rweber@dii.uchile. Los futuros desafíos de la Inteligencia de Negocios Richard Weber Departamento de Ingeniería Industrial Universidad de Chile rweber@dii.uchile.cl El Vértigo de la Inteligencia de Negocios CRM: Customer

Más detalles

Datamining Introducción

Datamining Introducción Pontificia Universidad Católica de Chile Escuela de Ingeniería Departamento de Ingeniería Industrial y de Sistemas Datamining Introducción Yerko Halat 2 de Octubre del 2001 1 Cuál es la diferencia entre

Más detalles