Datamining Introducción



Documentos relacionados
Pontificia Universidad Católica de Chile Escuela de Ingeniería Departamento de Ingeniería Industrial y de Sistemas. Datamining Técnicas

CRM Customer Relationship Manager

Resultados de Marketing Directo Utilizando Conceptos de Segmentación. RFM: Recency, Frequency, Monetary Value.

Visión global del KDD

MINERIA DE DATOS Y Descubrimiento del Conocimiento

SISTEMAS DE INFORMACION GERENCIAL LIC.PATRICIA PALACIOS ZULETA

CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN.

Introducción a la Minería de Datos (Data Mining)

Inteligencia en Redes de Comunicaciones. Tema 7 Minería de Datos. Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda

Los futuros desafíos de la Inteligencia de Negocios. Richard Weber Departamento de Ingeniería Industrial Universidad de Chile

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING

MINERÍA DE DATOS. Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE. Octubre

Minería de Datos. Vallejos, Sofia

Curso Data Mining y Aplicaciones en Riesgo de Crédito

IWG-101: Introducción a la Ingeniería. Departamento de Informática, UTFSM 1

PROGRAMA DEL DIPLOMADO DE PROCESO BENCHMARKING. TEMA 7. MANEJO DE LA INFORMACIÓN.

RW.02 RW.01. Curso Data Mining y Aplicaciones en Riesgo de Crédito

Sistemas de Inteligencia de Negocios

Sistemas de Información para la Gestión. Unidad 3 Aplicaciones de Sistemas

DATA WAREHOUSE DATA WAREHOUSE

INTELIGENCIA DE NEGOCIOS: GESTIÓN ESTRATÉGICA DE LA INFORMACIÓN

TransUnion República Dominicana. Preguntas frecuentes sobre los modelos de score de TransUnion

Introducción a la Minería de Datos

II. Relación con Terceros

Trabajo final de Ingeniería

Introducción a la Recuperación de Información. UCR ECCI CI-2414 Recuperación de Información Prof. M.Sc. Kryscia Daviana Ramírez Benavides

Base de datos II Facultad de Ingeniería. Escuela de computación.

Minería de Datos. Vallejos, Sofia

Control Informático de Gestión. Tema 5: Sistemas de Apoyo a la Toma de Decisiones

Minería de datos (Introducción a la minería de datos)

Modelos y Bases de Datos

Parte I: Introducción

Tema 11 Bases de datos. Fundamentos de Informática

Bases de Datos: Structured Query Language (SQL)

INTRODUCCION. entidades. Modelo lógico de la base de datos. Matricula. carne. codigo_curso. año semestre nota. propiedades

Sistemas de información

Ingeniería del conocimiento. Sesión 1 Por qué estudiar aprendizaje automático?

IMPACTO DEL DESARROLLO TECNOLOGICO EN LA AUDITORIA

Manual de Usuario Comprador Presupuesto

Repaso de Conceptos Básicos de Bases de Datos

BASE DE DATOS QUÉ ES UNA BASE DE DATOS?

Data Warehousing - Marco Conceptual

CRM (Customer Relationship Management)

ESCUELA DE CIENCIAS BASICAS TECNOLOGIA E INGENIERIA Programación de sitios web Act 11: Reconocimiento de la unidad 3

REGISTRO DE EMPRESAS Y PERSONAS BASE DE INFORMACIÓN DE CLIENTES & CONTACTOS

FUENTES SECUNDARIAS INTERNAS

Data Mining Técnicas y herramientas

Consultas con combinaciones

La Tecnología líder en Simulación

De qué tratará el curso. Otras consideraciones. Objetivos. Introducción. Motivación Explosión en la disponibilidad de información:

DIPLOMADO MARKETING DIGITAL

Bases de Datos: Teoría General y Aplicaciones

ESTRATEGIAS DIRECTIVAS

SISTEMA DE INFORMACION GERENCIAL. Lic.Patricia Palacios Zuleta

Tecnología de Gestión y Comunicación - TGC

MOLAP REALIZADO POR: JOSE E. TABOADA RENNA

Quienes Somos? Valor. Estrategia

Minería de Datos JESÚS ANTONIO GONZÁLEZ BERNAL. Universidad UPP

Compromisos. Innovadores Honestos Comprometidos Leales. Responsables. Auténticos

DEPARTAMENTO: Computación y diseño NOMBRE DEL CURSO: Base de datos I CLAVE: ACADEMIA A LA QUE PERTENECE: Base de datos I

UN PASEO POR BUSISNESS INTELLIGENCE

Panel: Minería de datos para la administración tributaria

EXPLOTACIÓN DE BASES DE DATOS CON ACCESS

HERRAMIENTAS Y TECNICAS DE LA PLANEACIÓN

EASY Software & Innovation

TEMA 1 INTRODUCCIÓN AL MARKETING TURÍSTICO. Juan Luis Nicolau Facultad de Ciencias Económicas y Empresariales Universidad de Alicante

Microsoft SQL Server Conceptos.

ENMKT663 MARKETING RELACIONAL

ENMKT616 Inteligencia de clientes y estrategia de relacionamiento

v.1.0 Clase 5 Docente: Gustavo Valencia Zapata

UNIVERSIDAD DE COSTA RICA SISTEMA DE ESTUDIOS DE POSGRADO POSGRADO EN COMPUTACION E INFORMATICA JUSTIFICACIÓN OBJETIVO GENERAL OBJETIVOS ESPECÍFICOS

Tecnología aplicada a la toma de decisiones o malas decisiones en tecnología?

SQL (Structured Query Language)

Ventas 2.0. Juan Francisco Ruiz. twitter.com/laminarrieta. facebook.com/juanfran.ruiz. linkedin.com/in/juanfranciscoruiz

09/01/2009. Diseño e implementación de Datawarehouse con Analysis Services Universidad de Guadalajara. Mario Octavio II Muñoz Camacho

El almacén de indicadores de proceso de negocio en ejecución

ANDGES es una solución ERP integrada y adaptable para el manejo de su negocio.

DISEÑO E IMPLEMENTACIÓN DE SOLUCIONES BUSINESS INTELLIGENCE CON SQL SERVER 2012

Habilidades y Herramientas para trabajar con datos

REGISTRO DE PEDIDOS DE CLIENTES MÓDULO DE TOMA DE PEDIDOS E INTEGRACIÓN CON ERP

Bases de Datos Relacionales

Figura 4.1 Clasificación de los lenguajes de bases de datos

Cybersudoe Innov: Una red de expertos sobre TIC e Innovación del SUDOESTE europeo

How organizations are influenced by Business Analytics? Octubre 2014

activuspaper Text Mining and BI Abstract

Un presente y futuro de RR.HH. basado en datos: Aplicaciones de Data Mining en la Gestión de Personas. Prof. Lic. Juan M. Bodenheimer jb@instare.

Data Mining o Minería de Datos

Marketing Mix Tradicional

Tema 1: Introducción

Inteligencia Artificial. Facultad de Ciencias Exactas y Tecnología Universidad Nacional de Tucumán Prof. Ing. Franco D. Menendez

Procesamiento y Optimización de consultas Material Preliminar en preparación

Data Mining en el Periodismo

Business Intelligence y Cuadro de Mando Integral: Herramientas para la Dirección Estratégica de las Organizaciones

UNIVERSIDAD DON BOSCO FACULTAD DE ESTUDIOS TECNOLÓGICOS COORDINACION DE COMPUTACIÓN PROYECTO DE CÁTEDRA. MATERIA: Introducción a la Programación

ÍNDICE PRIMERA PARTE... 17

FERREYROS S.A. POLITICAS DE ENTREGA DE REPUESTOS CATERPILLAR

Apoyo a la toma de Decisiones. Carlos A. Olarte Bases de Datos II

Transcripción:

Pontificia Universidad Católica de Chile Escuela de Ingeniería Departamento de Ingeniería Industrial y de Sistemas Datamining Introducción Yerko Halat 2 de Octubre del 2001 1 Cuál es la diferencia entre datos, información y conocimiento? 3...es un dato 3 perros...es un dato 3 perros guardianes...es un dato 3 perros guardianes cuidando una casa en verano...es información 2 1

Cuál es la diferencia entre datos, información y conocimiento? 3 perros guardianes cuidando una casa en verano, implica que no hay moradores...esto es conocimiento!!!! Pues existen reglas de asociación no trivial 3...los pañales y la cerveza... Una tienda estadounidense descubrió un patrón extraño: existía una alta correlación entre las ventas de pañales y cervezas los días Jueves de 18:00 a 22:00 Acomodaron ambos juntos y la venta se acrecentó significativamente. Esto es Datamining!!!!! 4 2

Modelo para la Gestión de la Información Base de datos Operacionales Datamarts Datawarehouse Reporting Análisis Olap Cubos InfoPortales Consultas Proyecciones Tendencias Gestión de la Información 5 Motivaciones para almacenar datos Razones iniciales: En telecomunicación: Facturación de llamadas En supermercados: Gestión del inventario En bancos: Manejo de cuentas En empresas de producción: Control de procesos Potenciales: En telecomunicación: Detección de fraude En supermercados: Asociación de ventas En bancos: Segmentación de clientes En empresas de producción: Mantención preventivo 6 3

Evolución del Marketing/Potencial del Conocimiento Conocimiento del cliente (-) (+) Masivo Productos Segmentos Uno a Uno o en Tiempo Real! 1 Etapa: Producto único sin diferenciación de clientes! 2 Etapa: Diferenciación de productos basados en sus atributos! 3 Etapa: Segmentación, Ofertas de productos en base a una diferenciación por clases de clientes! 4 Etapa: Oferta de productos especializada en base a un conocimiento específico del cliente 7 Idea básica y potenciales del Datamining Empresas y Organizaciones tienen gran cantidad de datos almacenados. Los datos disponibles contienen información importante. La información está escondida en los datos. Datamining puede encontrar información nueva y potencialmente útil en los datos 8 4

Proceso de Aprendizaje Se comienza observando... Observación Predecir nuevos fenómenos que pueden ser verificables a través de nuevas observaciones Predicción Análisis Intentar hallar patrones en esas observaciones Teoría Si se hallan regularidades, se formulan teorías (hipótesis) explicando los hechos 9 Proceso de Aprendizaje con Consecuencia Conocida Con suficiente información es posible reconstruir el pasado para identificar los factores y elementos que implicaron un estado futuro conocido 12 meses atrás Estados e1,e2,e3... Hoy Hoy Ejemplos: deterioro financiero, venta de productos de mayor valor, salud, modelos de fuga, etc... 10 5

Proceso KDD Knowledge Discovery in Databases KDD es el proceso no-trivial de identificar patrones previamente desconocidos, válidos, nuevos, potencialmente útiles y comprensibles dentro de los datos 11 KDD y el Negocio Debe contribuir al crecimiento y mejoramiento del negocio a través de planes/acciones concretos. 12 6

KDD y Datamining Datamining es una técnica multidisciplinaria: Sistemas Expertos Máquinas de Aprendizaje Si... Entonces... KDD Base de Datos Estadísticas Visualización 13 Aplicaciones del Datamining Customer Relationship Management (CRM) Segmentación de clientes Database Marketing Predicción de compra Retención de clientes Predicción de fuga Detección de Fraude Tarjetas de crédito Uso de teléfonos (celulares) Predicción de series de tiempo 14 7

Métodos de Datamining Estadística Agrupamiento (Clustering) Análisis Discriminante Redes Neuronales Árboles de Decisión Reglas de Asociación Bayesian (Belief) Networks 15 Relevancia del Datamining Descubrimiento de herramientas y técnicas del dataminong como una fuente de ventaja competitiva. Sin embargo, en un futuro cercano se tornará un factor crítico en vez de un factor clave 16 8

Datamining y Datawarehouse Para aplicar técnicas de datamining no es estrictamente necesario contar con datawarehouse, pero en la práctica es absolutamente habilitador. Las ventajas y beneficios de contar con un DWH como soporte son: El tiempo como dimensión No volátiles: no son actualizables, modificables ni borradas Orientadas al asunto: modelamiento integral 17 Datamining y Datawarehouse Fuentes integradas, de las distintas bases operacionales Metadata, existe una máscara que cubre los tecnicismos de los programadores Riesgo de alterar alguna fuente operacional Costos (velocidad, complejidad, repetición, perfil de los analistas) 18 9

SQL (structured query language) Lenguaje de consulta de base de datos relacionales SELECT DISTINCTROW Empleados.País, Empleados.Apellidos, Empleados.Nombre, Pedidos.IdPedido, Sum([Subtotales por pedido].subtotal) AS ImporteVenta FROM Empleados INNER JOIN (Pedidos INNER JOIN [Subtotales por pedido] ON Pedidos.IdPedido = [Subtotales por pedido].idpedido) ON Empleados.IdEmpleado = Pedidos.IdEmpleado GROUP BY Empleados.País, Empleados.Apellidos, Empleados.Nombre, Pedidos.IdPedido; 19 Datamining vs query tools (SQL) Son complementarias y no reemplazables SQL responde a preguntas preformuladas, datamining permite hallar patrones. En queries el conocimiento es aplicado/ratificado en base a la experiencia del analista. Datamining deduce conocimiento Dataming es optimizante 20 10

Datamining vs query tools (SQL) Dataming permite relacionar un conjunto indefinido de variables. SQL maneja un número limitado de variables, pues la menta humana soporta 8 (+- 2) variables relacionadas simultáneamente. SQL es útil para pruebas aproximativas de análisis. Problemática del datamining: garbage in, garbage out, que enturbian el KDD. 21 Datamining vs query tools (SQL) Conclusión Desde el punto de vista del tipo y complejidad del análisis, la complementaridad se observa como un continuo: Experiencia del analista Técnicas dataminig Proceso de Descubrimiento de Conocimiento (KDD) SQL Datamining 22 11