Métodos Predictivos en Minería de Datos

Documentos relacionados
Métodos Predictivos en Minería de Datos

Métodos de Regresión en Minería de Datos

Métodos Descriptivos en Minería de Datos

Predicción de Inventarios Series de Tiempo

Métodos Exploratorios en Minería de Datos

Programación en Lenguaje R

Ciencia de Datos con Python

Seminario-Taller Ciencia de Datos con Python

Fundamentos de SQL para Minería de Datos

Complementación y ampliación de la currícula de la Maestría 2017 Maestría en Generación y Análisis de Información Estadística

MD - Minería de Datos

MD - Minería de Datos

Minería de datos. Unidad 2. El proceso KDD Evaluación, difusión y uso. M en I Sara Vera Noguez

ESCUELA POLITÉCNICA SUPERIOR DE CÓRDOBA GRADO DE INGENIERÍA INFORMÁTICA CURSO 2013/14 ASIGNATURA: INTRODUCCIÓN A LOS MODELOS COMPUTACIONALES

XS-41100: INTRODUCCION AL ANALISIS MULTIVARIADO PROGRAMA II SEMESTRE 2018

Universidad Autónoma del Estado de México. La minería de datos en el proceso de KDD ( Knowledge Discovery and Data Mining)

APA - Aprendizaje Automático

APE - Aprendizaje Estadístico

APA - Aprendizaje Automático

Datos Generales. 1. Nombre de la Asignatura Estructura de Datos Avanzados y Minería de Datos. 2. Nivel de formación Doctoral

GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC)

Programa Educativo: Licenciatura en PROGRAMA DE ESTUDIO

GUÍA DOCENTE CURSO FICHA TÉCNICA DE LA ASIGNATURA. Datos de la asignatura Nombre. Estadística II Código

Aprendizaje Supervisado Máquinas Vectoriales de Soporte

R for Data Mining Análisis de datos, segmentación y técnicas de predicción con R. web

Escuela Técnica Superior de Ingeniería Informática

BIG DATA SCIENCE & ANALYTICS

1.-DATOS DE LA ASIGNATURA

MINERÍA DE DATOS: PREPROCESAMIENTO Y CLASIFICACIÓN

ESTADÍSTICA BAYESIANA Y TEORÍA DE DECISIONES

ESCUELA POLITÉCNICA SUPERIOR DE CÓRDOBA

PROGRAMA OFICIAL DE POSTGRADO EN ESTADÍSTICA E INVESTIGACIÓN OPERATIVA

Minería de datos Unidad 2. El proceso KDD

Licenciatura en Actuaría PROGRAMA DE ESTUDIO. Integral Profesional Horas teóricas: 3 Horas prácticas: 2 Total de Horas: 5 Confiabilidad

MODALIDAD ACADÉMICA. Unidad Nro. 1: TITULO Teoría de la Decisión y Sistemas de Información actuales

Cátedra: SISTEMAS de GESTIÓN. SISTEMAS de GESTIÓN Ciclo Lectivo 2012 Vigencia del programa Ciclo lectivo 2012 Plan 2008 Área.

GUIA DOCENTE. Titulación Máster en Ingeniería Ambiental. Profesores (*) Responsable. Juan José Egozcue Rubí. Otros. Maribel Ortego Martínez

Segmentación de una cartera de clientes usando aprendizaje de máquina

Índice general. Prefacio...5

Análisis de Datos para la Industria y los Servicios

FUNDAMENTOS Y APLICACIONES DE APRENDIZAJE AUTOMÁTICO

Cuestiones administrativas Sistemas Inteligentes de Gestión Segundo cuatrimestre, curso 2011/2012 Horario de clases Teoría Miércoles, de 17:00 a 19:00

MÓDULO MATERIA CURSO SEMESTRE CRÉDITOS TIPO

ANÁLISIS MULTIVARIANTE Y APLICACIONES (Postgrado en Economía)

Proyecto Nº de referencia SPIP Cantidad concedida: Realizado por INSIA (Instituto Universitario de Investigación del Automóvil)

Aprendizaje Computacional. Eduardo Morales y Jesús González

DESCRIPCIÓN Y HORARIO DE CURSOS II-2018

DEPARTAMENTO DE MATEMÁTICAS Página 1

Carrera de Posgrado: Doctorado en Ingeniería Curso: TÓPICOS SELECTOS EN APRENDIZAJE MAQUINAL Año Académico: 2012

Escuela de Administración de Empresas Actualización Empresarial. Plan de Estudios

UNIVERSIDAD TECNOLÓGICA DE PEREIRA FACULTAD DE INGENIERÍAS MAESTRÍA EN INGENIERÍA DE SISTEMAS Y COMPUTACIÓN APRENDIZAJE DE MÁQUINA

Universidad de Puerto Rico Recinto de Río Piedras Facultad de Ciencias Naturales Departamento de Matemáticas

DIPLOMADO EN DATA MINING

ANX-PR/CL/ GUÍA DE APRENDIZAJE

Curso: R for Data Mining. Análisis de datos, segmentación y técnicas de predicción con R

Guía docente de la asignatura

ANX-PR/CL/ GUÍA DE APRENDIZAJE

GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC)

ATV - Análisis de Tiempo de Vida

Curso: Python for Analytics. Aprende Python orientado a la ciencia y minería de datos

ANX-PR/CL/ GUÍA DE APRENDIZAJE

Benemérita Universidad Autónoma de Puebla Vicerrectoría de Docencia Dirección General de Educación Superior Facultad de Ciencias Físico Matemáticas

Guía docente de la asignatura

XS-3150: PRINCIPIOS DE DISEÑOS EXPERIMENTALES PROGRAMA I SEMESTRE 2018

ANX-PR/CL/ GUÍA DE APRENDIZAJE. ASIGNATURA Data warehousing y data mining. CURSO ACADÉMICO - SEMESTRE Segundo semestre

Data Mining Introduction Convierte Datos en Conocimiento y Aplicalos al Marketing

CEO - Computación en Estadística y en Optimización

CEO - Computación en Estadística y en Optimización

Programa(s) Educativo(s): Clave de la materia: Semestre:

Totales: Teóricos: Prácticos: Créditos L. R. U.: 9,0 3,0 6,0 Créditos Europeos: 7,7

PROYECTO DOCENTE ASIGNATURA: "Inteligencia Artificial y Estadística"

Análisis Factorial clásico. Análisis de Correlación Canónica. Análisis Discriminante. Modelos Lineales multivariantes.

UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS MAESTRÍA EN CIENCIAS DE LA INFORMACIÓN Y LAS COMUNICACIONES MINERÍA DE DATOS

ENSIA 605 Inteligencia de Negocios y Minería de Datos

d E I O Proyecto Docente DEPARTAMENTO DE ESTADÍSTICA E INVESTIGACIÓN OPERATIVA UNIVERSIDAD DE VALLADOLID COMPUTACIÓN ESTADÍSTICA

Curso: Python for Analytics

R for Business Analytics

Guía docente de la asignatura

Técnicas de análisis estadístico basado en inteligencia artificial

Aprendizaje Automático

PROGRAMA OFICIAL DE POSTGRADO EN ESTADÍSTICA E INVESTIGACIÓN OPERATIVA

Cátedra: SISTEMAS de GESTIÓN. SISTEMAS de GESTIÓN Ciclo Lectivo 2010 Vigencia del programa Ciclo lectivo 2010 Plan 2008 Área.

Curso: Python for Analytics

Credit Scoring for Risk Baking Aplicaciones en la Gestión de Riesgo Crediticio. web

José Hernández Orallo Mª. José Ramírez Quintana

TÓPICOS SELECTOS DE OTROS CURSOS

Pontificia Universidad Católica del Ecuador

Wenceslao González Manteiga.

TABLA DE CONTENIDO. Resumen Introducción Entorno relevante asociado al proyecto Contexto de la Industria...

AD - Análisis de Datos

R for Business Analytics

El Plan de Estudios no establece ningún prerrequisito para poder cursar esta asignatura.

MÉTODO DE CLASIFICACIÓN SUPERVISADA SUPPORT VECTOR MACHINE: UNA APLICACIÓN A LA CLASIFICACIÓN AUTOMÁTICA DE TEXTOS.

"Big Data Analysis" (Métodos especiales para bases de datos gigantes)

Transcripción:

Métodos Predictivos en Minería de Datos

Tutor: El curso será impartido por Dr. Oldemar Rodríguez graduado de la Universidad de París IX y con un postdoctorado en Minería de Datos de la Universidad de Stanford. Duración: Cuatro semanas. Descripción: En este curso se presentarán los principales métodos en Minería de Datos, especialmente enfocados en métodos predictivos, conocidos también como métodos de aprendizaje supervisado. El énfasis principal del curso será examinar dichos métodos desde un punto de vista algorítmico y de sus aplicaciones en casos reales. Se le dará especial importancia al uso de los conceptos de minería de datos en aplicaciones reales con bases de datos de gran tamaño, para esto se utilizarán los programas especializados en Minería de Datos, como son la plataforma de desarrollo R y el paquete PROMiDAT-Predictivo. A quién va dirigido? Se orienta especialmente a analistas de riesgo, marketing y mercadeo, personal involucrado en proyectos de pronóstico y predicción o en proyectos de Business Intelligence, administradores de bases de datos, analistas de sistemas, profesionales en estadística o economía y en general a personas que, basados en los datos de la organización, colaboran en la toma de decisiones. Objetivos: En este curso el estudiante será capaz de: 1. Comprender la diferencia entre modelos de aprendizaje supervisado (minería predictiva) y modelos de aprendizaje no supervisado (minería descriptiva). 2. Comprender la diferencia entre bases de datos de aprendizaje y bases de datos de testing. 3. Comprender la necesidad de la utilización de modelos, algoritmos, software para predecir el comportamiento futuro. 4. Conocer los principales modelos predictivos, técnicas y algoritmos utilizados para predecir conductas a partir de grandes volúmenes de datos históricos.

5. Utilizar la plataforma R y el paquete PROMiDAT-Predictivo para analizar y desarrollar ejemplos con datos reales. Metodología: Basado en la teoría y en la aplicación directa de los conceptos aprendidos. Para esto se dispondrán de las siguientes herramientas. Una vídeo conferencia semanal, las cuales quedarán grabadas en Webex, para que los alumnos la puedan acceder en cualquier momento. Trabajos prácticos semanales. Foros para plantear dudas al tutor y compañeros. Aula virtual en Moodle. Luego de este curso el estudiante será capaz de: Desarrollar proyectos de Minería de Datos que involucren predicción utilizando modelos predictivos. Contenido: 1. Conceptos de la Minería de Datos Predictiva a. Conceptos y diferencias entre aprendizaje supervisado y aprendizaje no supervisado b. Diseño de bases de datos de aprendizaje c. Diseño de bases de datos de testing d. Variables cuantitativas y variables cualitativas e. Cómo evaluar la calidad de un modelo predictivos? f. Cálculo de la Matriz de confusión e índices de calidad g. Curvas ROC 2. Método de los K vecinos más cercanos a. Estructura General del método b. El mejor valor de K c. Algoritmo de Aprendizaje

d. Aplicaciones en casos reales con el paquete PROMiDAT-Predictivo 3. Máquinas Vectoriales de Soporte a. Hiperplano de separación de las clases b. Vectores de soporte c. Función discriminante lineal d. Cómo resolver un Problema Optimización? e. MVS no linealmente separables f. Núcleos en Máquinas Vectoriales de Soporte g. Aplicaciones en casos reales con el paquete PROMiDAT-Predictivo 4. Árboles de Decisión (Método CART) a. Algoritmos ID3, C4.5, C5.0 y CART b. Árboles de auto-regresión c. Aplicaciones en casos reales con el paquete PROMiDAT-Predictivo 5. Métodos de consenso y de Potenciación a. Métodos de Consenso (Bagging) b. Bosques Aleatorios (Random forests) c. Métodos de impulso (Boosting) d. Métodos de Potenciación (ADA Boosting) e. Aplicaciones en casos reales con el paquete PROMiDAT-Predictivos. Bibliografía: 1. Berry M. and Linoff G. Data Mining Techniques. John Wiley & Sonsa, 1997. 2. Hastie, Tibshirani and Friedma. The Elements of Statistical Learning: Data Mining, Inference and Prediction. Springer-Verlag, 2009. 3. Giudici Paolo. Applied Data Mining: Statistical Methods for Business and Industry. Wiley, 2005. 4. Dunhan M. Data mining: Introductory and Advanced Topics. Prentice Hall, 2002.

5. Han J. and Kamber M. Data Mining: concepts and techniques, Morgan Kaufman Publishers 2001. 6. Mirkin Boris. Clustering for Data Mining, a data recovery approach. Chapman & Hall. Boca Raton FL, 2005. 7. R Development Core Team. R: A Programming Environment for Data Analysis and Graphics. The R Project for Statistical Computing, 2010. http://www.rproject.org/ 8. R Development Core Team. Writing R Extensions. The R Project for Statistical Computing, 2010. http://www.r-project.org/