Visión global del KDD



Documentos relacionados
CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN.

MINERIA DE DATOS Y Descubrimiento del Conocimiento

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING

Introducción a la Minería de Datos

Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI)

Data Mining Técnicas y herramientas

Parte I: Introducción

OPTATIVA I: MINERIA DE DATOS

Introducción a la Minería de Datos (Data Mining)

Ingeniería del conocimiento. Sesión 1 Por qué estudiar aprendizaje automático?

Trabajo final de Ingeniería

EPB 603 Sistemas del Conocimiento!"#$ %& $ %'

v.1.0 Clase 5 Docente: Gustavo Valencia Zapata

Artículos de Minería de Datos de Dataprix Introducción a la minería de datos

MINERÍA DE DATOS Y DESCUBRIMIENTO DE CONOCIMIENTO (DATA MINING AND KNOWLEDGE DISCOVERY)

Minería de Datos JESÚS ANTONIO GONZÁLEZ BERNAL. Universidad UPP

Inteligencia de Negocio

TÉCNICAS DE MINERÍA DE DATOS Y TEXTO APLICADAS A LA SEGURIDAD AEROPORTUARIA

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 9 -

INTELIGENCIA DE NEGOCIOS. Business Intelligence. Alumno: Toledo Paucar Jorge

Los futuros desafíos de la Inteligencia de Negocios. Richard Weber Departamento de Ingeniería Industrial Universidad de Chile

DISEÑO E IMPLEMENTACIÓN DE SOLUCIONES BUSINESS INTELLIGENCE CON SQL SERVER 2012

Inteligencia en Redes de Comunicaciones. Tema 7 Minería de Datos. Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda

Grupo de investigación en Minería de Datos

Base de datos II Facultad de Ingeniería. Escuela de computación.

Datamining Introducción

Minería de datos (Introducción a la minería de datos)

forma de entrenar a la nuerona en su aprendizaje.

Mineria de datos y su aplicación en web mining data Redes de computadores I ELO 322

Minería de Datos. Vallejos, Sofia

Minería de Datos. Abstract. Existencia de herramientas automáticas que no hacen necesario el ser un experto en estadística Potencia de computo

Informática II Ing. Industrial. Data Warehouse. Data Mining

Aprendizaje Automatizado

Minería de datos (Introducción a la minería de datos)

Minería de Datos. Vallejos, Sofia

Encuesta Permanente de Hogares

MINERÍA DE DATOS. Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE. Octubre

Proceso del KDD (minería de datos o DataMining)

Una metaheurística para la extracción de reglas de asociación. Aplicación a terremotos.

LOS CINCO GRADOS DE MADUREZ DE UN PROYECTO BI

UN PASEO POR BUSISNESS INTELLIGENCE

ETL: Extractor de datos georreferenciados

MINERÍA DE DATOS: ÁREA DE OPORTUNIDADES

PREPROCESADO DE DATOS PARA MINERIA DE DATOS

Implantación de un proyecto de Knowledge Center con una herramienta comercial (Synera)

Introducción Qué es Minería de Datos?

Aplicación de técnicas de minería de datos para la evaluación del rendimiento académico y la deserción estudiantil

Tema 7. Introducción al reconocimiento de objetos

1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2.

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 2 -

Aprendizaje Computacional. Eduardo Morales y Jesús González

O jeto de apre r ndizaje

POSIBLE APLICACIÓN DE LA MINERÍA DE TEXTOS A LOS TRABAJOS DE LA COMISIÓN MINISTERIAL DE INFORMÁTICA

Contenido del Curso. Descubrimiento de Conocimiento a partir de datos. Introducción. Motivación

HERRAMIENTAS DE LA CALIDAD

ARIS Process Performance Manager

Código del programa: PEMDE. Programa Experto en MANEJO DE DATOS CON EXCEL. Modalidad: Virtual. Descripción del programa

Introducción. Francisco J. Martín Mateos. Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla

Objeto del informe. ALUMNO 1 Página: 1

Autor: Ing. Mario Lázaro Basulto Núñez

Portafolio de Servicios y Productos

Unidad 1. Fundamentos en Gestión de Riesgos

GedicoPDA: software de preventa

Minería de Datos. Universidad Politécnica de Victoria

Sistemas de Información 12/13 La organización de datos e información

Evaluación, limpieza y construcción de los datos: un enfoque desde la inteligencia artificial

Un modelo predictivo para reducir la tasa de ausentismo en atenciones médicas programadas

Botón menú Objetivo de la Minería de datos.

Finanzas e Investigación de Mercados"

ANALIZANDO GRAFICADORES

SISTEMAS DE SEGURIDAD DE RECONOCIMIENTO FACIAL

Curso Data Mining y Aplicaciones en Riesgo de Crédito

SISTEMAS DATAMINING: Implantación e impacto en la estrategia empresarial

UNIVERSIDAD DE COSTA RICA SISTEMA DE ESTUDIOS DE POSGRADO POSGRADO EN COMPUTACION E INFORMATICA JUSTIFICACIÓN OBJETIVO GENERAL OBJETIVOS ESPECÍFICOS

Materia: Inteligencia de negocios

MINING SOLUTIONS LIMITADA

Sistemas de Sensación Segmentación, Reconocimiento y Clasificación de Objetos. CI-2657 Robótica M.Sc. Kryscia Ramírez Benavides

Palabras clave: Minería de datos, extracción de patrones, aplicaciones, sistemas de abastecimiento de agua.

PROPÓSITO... 2 DETERMINANTES PARA UNA BUENA EXPERIENCIA DE USO...

TECNÓLOGO EN INFORMÁTICA PLAN DE ESTUDIOS

CARACTERÍSTICAS GENERALES. a) Nombre del Proyecto Curricular Licenciatura de Ingeniería en Sistemas Inteligentes 2007

Título: Árboles de Decisión automáticos para el Pronóstico del Rendimiento Docente (aplicable al Control de Procesos).

Clasificación Bayesiana de textos y páginas web

CLASIFICACIÓN NO SUPERVISADA

Acerca de esté Catálogo

Trabajo Practico N 12

Capítulo 2 Tecnología data warehouse

Sistema de Gestión de Proyectos Estratégicos.

Minería de datos educativa: Una herramienta para la investigación de patrones de aprendizaje sobre un contexto educativo

RW.02 RW.01. Curso Data Mining y Aplicaciones en Riesgo de Crédito

Transcripción:

Visión global del KDD Series Temporales Máster en Computación Universitat Politècnica de Catalunya Dra. Alicia Troncoso Lora 1

Introducción Desarrollo tecnológico Almacenamiento masivo de información Aprovechamiento de esa información: Tradicionalmente Técnicas estadísticas Avance de la tecnología Data Mining 2

Introducción Tradicionalmente: CONSULTAS DE BDS y TÉCNICAS ESTADÍSTICAS (resúmenes: medias, desviaciones, distribuciones, correlaciones, etc) Respuesta a preguntas como: Cuáles fueron las ventas en el tercer trimestre en la región norte? Qué ventas se prevén en el tercer trimestre del año próximo en la región norte? Insuficiente para la toma de decisiones conocimiento muy limitado del comportamiento de los datos. 3

Introducción Minería de datos: Gran cantidad de datos: Extracción AUTOMÁTICA de información verdaderamente útil CONOCIMIENTO Respuesta a preguntas como: Cómo aumentar las ventas en el tercer trimestre en la región norte? Relaciones entre venta de determinados productos y cliente Posición de los artículos en la tienda Envío personificado de publicidad Etc. 4

Introducción Minería de datos: Análisis de bases de datos con el fin de descubrir o extraer información inherente a los datos objeto de análisis, de modo que sea de utilidad en la toma de decisiones. Para obtener conclusiones válidas y útiles al aplicar minería de datos, es necesario complementar este proceso con una adecuada preparación de los datos previa al proceso de minería y un análisis posterior de resultados obtenidos. KDD (Knowledge Discovery in Databases) 5

Tareas de la Minería de Datos

KDD: Knowledge Discovery in Databases El Descubrimiento de Conocimiento en Bases de Datos es el proceso no trivial de identificación de patrones válidos, novedosos, potencialmente útiles y fundamentalmente comprensibles en los datos, Fayyad, Piatetsky-Shapiro y Padhraic Smyth (1996). Proceso no trivial: secuencia de pasos que implican una inferencia compleja sobre los datos en busca de conclusiones Patrones: Descripción a alto nivel de los datos (estructuras/modelos de comportamiento) Válidos: Los patrones o modelos descubiertos deben gozar de cierto grado de certeza. Novedosos: Los patrones deben aportar conocimiento nuevo. Potencialmente útiles: El modelo debe ser aplicable para la toma de decisiones que impliquen beneficio. Comprensibles: Se debe generar un modelo fácilmente interpretable por el usuario, si no directamente, sí tras un procesado posterior. 7

KDD: Knowledge Discovery in Databases El KDD no es un campo aislado, sino la convergencia de otros campos: Estadística: Inferir información de datos (principalmente de datos numéricos) Base de Datos / Data Warehouse (OLAP: On line Analytical Processing): SELECT, INSERT, UPDATE, DELETE Machine Learning: Algoritmos implementados que aprenden automáticamente a través de la experiencia (principalmente datos simbólicos) 8

KDD: Knowledge Discovery in Databases El KDD no es un campo aislado, sino la convergencia de otros campos Inferir información de datos (principalmente de datos numéricos) Estadística Base de Datos Data Warehouse OLAP, SELECT, INSERT, UPDATE, DELETE KDD Algoritmos implementados que aprenden automáticamente a través de la experiencia Machine Learning 9

Proceso KDD $! "#$ #% &$# $ 10

Proceso KDD 1.- Determinación de Objetivos: Precisar qué objetivos quieren cumplirse desde el punto de vista del usuario. Datos a usar. Elección de las técnicas. 2.- Preparación de los datos: Ambigüedades, ruido o no estar en el formato adecuado. Acelera el algoritmo de minería Mejora la calidad del modelo de conocimiento. Subfases: Filtros: valores ausentes, ruido, transformación (normalizar, discretizar, etc). Selección y Editado: distinguir los subconjuntos de datos significativos. 11

Proceso KDD 3.- Minería de Datos La elección del método de minería es fundamental dentro del proceso KDD. La validez y utilidad del modelo depende en gran parte de esta fase. Algoritmo de aprendizaje + validación del modelo 4.- Análisis: Estudia, interpreta y evalúa el modelo de conocimiento. El uso de técnicas de visualización facilitan al usuario la comprensión. 5.- Aplicación: Integración del conocimiento adquirido al campo real de aplicación mediante la toma de decisiones. Comparación con el conocimiento previo a la aplicación del proceso 12

Minería de Datos $ #'# Aprendizaje: El Aprendizaje Automático (Machine Learning) es la rama de la Inteligencia Artificial que estudia el desarrollo de técnicas para extraer de forma automática conocimiento subyacente en la vasta información. '#( $ Aprendizaje inductivo, que engloba todas aquellas técnicas que aplican inferencias inductivas sobre un conjunto de datos para adquirir el conocimiento inherente a ellos. Dos tipos de aprendizaje inductivo: Aprendizaje Supervisado, los casos tienen a priori asignada una clase o categoría, siendo el objetivo encontrar patrones o tendencias de los casos pertenecientes a una misma clase. Aprendizaje no supervisado: no goza de una agrupación previa, por los que se limita a buscar la regularidades entre éstos. (Clustering) 13

Minería de Datos $ #'# '#( Representación del Conocimiento: Sin representación (Lazy Learning): KNN, Redes Neuronales Reglas, árboles Validación Precisión (Tasa de error) Complejidad Comprensibilidad Legibilidad $ 14

Minería de Datos Tareas Principales Clasificación Clustering Regresión? Modelado de dependencias 15

Nuestro Contexto Expertos Representación de Reglas, patrones, $! "#$ #% &$# $ Bases de datos temporales Selección de atributos Regresión Clasificación Clustering 16