Módulo Minería de Datos Diplomado. Por Elizabeth León Guzmán, Ph.D. Profesora Ingeniería de Sistemas Grupo de Investigación MIDAS

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Módulo Minería de Datos Diplomado. Por Elizabeth León Guzmán, Ph.D. Profesora Ingeniería de Sistemas Grupo de Investigación MIDAS"

Transcripción

1 Módulo Minería de Datos Diplomado Por Elizabeth León Guzmán, Ph.D. Profesora Ingeniería de Sistemas Grupo de Investigación MIDAS

2 Error de clasificación Algoritmo de aprendizaje h Entrenamiento DATOS Evaluación Test

3 Error de clasificación Error de entrenamiento: e(modelo, datos) Número de ejemplos de entrenamiento clasificados incorrectamente Conocido como error de re-substitución o error aparente Error de generalización: e (modelo, datos) Error esperado del modelo en ejemplos no usados en el entrenamiento. Un buen modelo debe tener errores de entrenamiento y generalización bajos

4 Sobre-ajuste (Overfitting) Cuando el algoritmo de aprendizaje se ajusta tanto a los datos de entrada que pierde su capacidad de generalizar

5 Epresividad limitada con subajuste Epresividad limmitada con sobreajuste Epresividad mayor con buen ajuste

6 Sobre-ajuste Sobre-ajuste: Bajo error de entrenamiento pero error de generalización alto. Sub-ajuste (underfitting): Errores de entrenamiento y generalización altos

7 Causas sobreajuste Presencia de ruido

8 Sobreajuste Falta de ejemplos representativos

9 Métodos de Estimación Holdout Muestreo Aleatorio Validación Cruzada (Cross validation) Muestreo Estratificado Bootstrap

10 Evaluación de un clasificador Holdout Method Conjunto particionado en 2 conjuntos disjuntos (entrenamiento y prueba) Evaluación con respecto al conjunto de prueba El modelo puede tener dependencia de la composición de la partición Pequeño tamaño del conjunto de entrenamiento varianza alta Mantener un porcentaje de instancias (2/3) para entrenamiento y el resto (1/3) para pruebas Se sugiere que el de entrenamiento sea mayor que el de pruebas

11 Evaluación de un clasificador Random subsampling (muestreo aleatorio) Repite el método holdout muchas veces y calcular estadísticos sobre dicho proceso La eactitud del modelo es dada por el promedio Se sugiere repetir como mínimo 30 veces No hay control sobre los ejemplos que ya han sido usados para entrenamiento

12 Evaluación de un clasificador Cross-validation (validación cruzada) Partir el conjunto de datos en k subgrupos disjuntos k-fold: entrenar con k-1 subgrupos, validar con el restante. Repetir usando cada grupo en validación Cada ejemplo es usado el mismo numero para entrenamiento y una vez para pruebas. 10 fold crossvalidation Leave one out

13 Cross-validation (validación cruzada) Aprendizaje h1 Entrenamiento Test Evaluación Aprendizaje hn Test Evaluación

14 Evaluación de un clasificador Bootstrap Ejemplos de entrenamiento son seleccionados permitiendo remplazo (muestreo con remplazo) El muestreo es realizado b veces para generar b muestras Muchas variaciones de bootstrap: calculo de la eactitud. Ej: bootstrap (eactitud combinando las eactitudes de cada muestra con la del conjunto orignal)

15 Matriz de confusion Clase Predicha Class= Si Class=No Clase verdadera Class=Si a (TP) b (FN) Class=No c (FP) d (TN) Eactitud= a d a b c d = TP TN TP TN FP FN

16 Matriz de confusión Problema de 2 clases

17 Curva ROC At threshold t: TP=0.5, FN=0.5, FP=0.12, FN=0.88

18 Matrices de Confusión Mas de 2 clases

19 Consideremos este problema de dos clases Número de ejemplos de la clase 0 = 9990 Número de ejemplos de la clase 1 = 10 Si el modelo predice todo de la clase 0, la eactitud es 9990/10000 = 99.9 % La medida no es correcta por que no se detectan ejemplos de la clase 1

20 Matriz de Costos Clase predicha C(i j) Clase=Si Clase=No Clase real Clase=Si C(Si Si) C(No Si) Clase=No C(Si No) C(No No) C(i j): Costo de no clasificar ejemplos de la clase j como clase i

21 Matriz De costo Clase predicha Clase real C(i j) Modelo M 1 Clase predicha Modelo M 2 Clase predicha Clase real Clase real Accuracy = 80% Cost = 3910 Accuracy = 90% Cost = 4255

22 Multiclasificadores Ensambladores Original D Training data Step 1: Create Multiple Data Sets... D 1 D 2 D t-1 D t Step 2: Build Multiple Classifiers C 1 C 2 C t -1 C t Step 3: Combine Classifiers C *

23 Multiclasificadores Ensambladores Bagging Boosting

Reconocimiento de Patrones

Reconocimiento de Patrones Reconocimiento de Patrones Técnicas de validación (Clasificación Supervisada) Jesús Ariel Carrasco Ochoa Instituto Nacional de Astrofísica, Óptica y Electrónica Clasificación Supervisada Para qué evaluar

Más detalles

Clasificación de documentos

Clasificación de documentos Minería de Datos Web P r o f. D r. M a r c e l o G. A r m e n t a n o I S I S TA N, F a c. d e C s. E x a c t a s, U N I C E N m a r c e l o. a r m e n t a n o @ i s i s t a n. u n i c e n. e d u. a r

Más detalles

Precisión del Modelo

Precisión del Modelo Precisión del Modelo Gráficas, estadística y minería de datos con python Miguel Cárdenas Montes Centro de Investigaciones Energéticas Medioambientales y Tecnológicas, Madrid, Spain miguel.cardenas@ciemat.es

Más detalles

Evaluación de modelos

Evaluación de modelos Evaluación de modelos José Luis Ruiz Reina Dpto. Ciencias de la Computación e Inteligencia Artificial Razonamiento Asistido por Computador, 2017-2018 Evaluación de modelos Una de las fases principales

Más detalles

Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA. Ricardo Aler Mur

Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA. Ricardo Aler Mur Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA Ricardo Aler Mur EVALUACIÓN Evaluación: entrenamiento y test Una vez obtenido el conocimiento es necesario validarlo para

Más detalles

Análisis de Datos. Validación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Validación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Validación de clasificadores Profesor: Dr. Wilfrido Gómez Flores 1 Introducción La mayoría de los clasificadores que se han visto requieren de uno o más parámetros definidos libremente,

Más detalles

Introducción a los sistemas Multiclasificadores. Carlos J. Alonso González Departamento de Informática Universidad de Valladolid

Introducción a los sistemas Multiclasificadores. Carlos J. Alonso González Departamento de Informática Universidad de Valladolid Introducción a los sistemas Multiclasificadores Carlos J. Alonso González Departamento de Informática Universidad de Valladolid Contenido 1. Combinación de modelos 2. Descomposición bias-varianza 3. Bagging

Más detalles

Conjuntos de Clasificadores (Ensemble Learning)

Conjuntos de Clasificadores (Ensemble Learning) Aprendizaje Automático Segundo Cuatrimestre de 2016 Conjuntos de Clasificadores (Ensemble Learning) Gracias a Ramiro Gálvez por la ayuda y los materiales para esta clase. Bibliografía: S. Fortmann-Roe,

Más detalles

Aprendizaje: Boosting y Adaboost

Aprendizaje: Boosting y Adaboost Técnicas de Inteligencia Artificial Aprendizaje: Boosting y Adaboost Boosting 1 Indice Combinando clasificadores débiles Clasificadores débiles La necesidad de combinar clasificadores Bagging El algoritmo

Más detalles

ANÁLISIS DE DATOS. Jesús García Herrero

ANÁLISIS DE DATOS. Jesús García Herrero ANÁLISIS DE DATOS Jesús García Herrero ANALISIS DE DATOS EJERCICIOS Una empresa de seguros de automóviles quiere utilizar los datos sobre sus clientes para obtener reglas útiles que permita clasificar

Más detalles

Aprendizaje Automatizado

Aprendizaje Automatizado Aprendizaje Automatizado Aprendizaje Automatizado Programas que mejoran su comportamiento con la experiencia. Dos formas de adquirir experiencia: A partir de ejemplos suministrados por un usuario (un conjunto

Más detalles

Métodos de Remuestreo en Aprendizaje Automático

Métodos de Remuestreo en Aprendizaje Automático Métodos de Remuestreo en Aprendizaje Automático en datos, en hipótesis, y algunos otros trucos: Cross-validation, Bootstrap, Bagging, Boosting, Random Subspaces Lo que sabemos hasta ahora: Hemos visto

Más detalles

Evaluación de Hipótesis

Evaluación de Hipótesis Aprendizaje Automático Segundo Cuatrimestre de 2016 Evaluación de Hipótesis Aproximación de Funciones Marco del problema: Conjunto de instancias posibles X Función objetivo desconocida f: X Y Conjunto

Más detalles

Validación Cruzada (cross-validation) y Remuestreo (bootstrapping)

Validación Cruzada (cross-validation) y Remuestreo (bootstrapping) Validación Cruzada (cross-validation) y Remuestreo (bootstrapping) Padres de cross-validation y el bootstrapping Bradley Efron y Rob Tibshirani Bradley Efron Rob Tibshirani Enfoque: tabla de aprendizaje

Más detalles

Aprendizaje Automático Segundo Cuatrimestre de Evaluación de Hipótesis

Aprendizaje Automático Segundo Cuatrimestre de Evaluación de Hipótesis Aprendizaje Automático Segundo Cuatrimestre de 2015 Evaluación de Hipótesis Aproximación de Funciones Marco del problema: Conjunto de instancias posibles X Función objetivo desconocida f: X Y Conjunto

Más detalles

Modelos de Churn Bancarios con R Trabajo Final de la Maestría en Data Mining

Modelos de Churn Bancarios con R Trabajo Final de la Maestría en Data Mining Modelos de Churn Bancarios con R Trabajo Final de la Maestría en Data Mining Presentado por Diego Ariel Oppenheim Director Martin Volpacchio Fecha: 31/7/2017 Objetivos del trabajo final Entender la situación

Más detalles

Methods of Classification in Mining of Meteorological Data

Methods of Classification in Mining of Meteorological Data MÉTODOS DE CLASIFICACIÓN EN MINERÍA DE DATOS METEOROLÓGICOS Methods of Classification in Mining of Meteorological Data 1 Silvia Haro Rivera*, 1 Lourdes Zúñiga Lema, 2 Antonio Meneses Freire, 1 Luis Vera

Más detalles

Perceptrón Simple. Aspectos Prácticos y Algoritmos Redes Neuronales, DC-FCEyN-UBA. Rosana Matuk Primer Cuatrimestre 2018

Perceptrón Simple. Aspectos Prácticos y Algoritmos Redes Neuronales, DC-FCEyN-UBA. Rosana Matuk Primer Cuatrimestre 2018 Perceptrón Simple Aspectos Prácticos y Algoritmos Redes Neuronales, DC-FCEyN-UBA Rosana Matuk Primer Cuatrimestre 2018 Rosana Matuk (DC-FCEyN-UBA) Perceptrón simple Primer Cuatrimestre 2018 1 / 29 Objetivo

Más detalles

Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Introducción al aprendizaje supervisado Profesor: Dr. Wilfrido Gómez Flores 1 Conceptos básicos Reconocimiento de patrones (RP): clasificar objetos en un número de categorías o clases.

Más detalles

Overfit, cross validation y bootstrap

Overfit, cross validation y bootstrap Universisad de San Andrés y CONICET Cueestiones preliminares Sea z n una sucesion de variables aleatorias escalares. Consideremos la siguiente sucesion z n = n i=1 z i n Ley de grandes numeros (Kolmogorov):

Más detalles

El Perceptrón Multicapa

El Perceptrón Multicapa El Perceptrón Multicapa N entradas M neuronas de salida L: neuronas en la capa oculta E = 1 p M ( zi ( k) yi ( k) ) k = 1 i= 1 Implementación de la función XOR Regiones de clasificación en función del

Más detalles

Clasificación mediante conjuntos

Clasificación mediante conjuntos Clasificación mediante conjuntos Gonzalo Martínez Muñoz Director: Dr. Alberto Suárez González Departamento de Ingeniería Informática Escuela Politécnica Superior Universidad Autónoma de Madrid diciembre

Más detalles

Combinación de Clasificadores

Combinación de Clasificadores Combinación de Clasificadores Parte 1: Métodos de comité, Bagging, Boosting Reconocimiento de Patrones Departamento de Procesamiento de Señales Instituto de Ingeniería Eléctrica Facultad de Ingeniería,

Más detalles

Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA. Ricardo Aler Mur

Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA. Ricardo Aler Mur Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA Ricardo Aler Mur CLASIFICACIÓN CON COSTES Y MUESTRAS DESBALANCEADAS R I C A R D O A L E R M U R Organización Evaluación Sensible

Más detalles

Aux 7. Introducción a la Minería de Datos

Aux 7. Introducción a la Minería de Datos Aux 7. Introducción a la Minería de Datos Gastón L Huillier 1,2, Richard Weber 2 glhuilli@dcc.uchile.cl 1 Departamento de Ciencias de la Computación Universidad de Chile 2 Departamento de Ingeniería Industrial

Más detalles

Técnicas Multivariadas Avanzadas

Técnicas Multivariadas Avanzadas Métodos basados en árboles Universidad Nacional Agraria La Molina 2014-2 Introducción Introducción Se describen métodos basados en árboles para regresión y clasicación. Estos métodos requieren estraticar

Más detalles

Aprendizaje Automatizado. Árboles de Clasificación

Aprendizaje Automatizado. Árboles de Clasificación Aprendizaje Automatizado Árboles de Clasificación Árboles de Clasificación Estudiaremos un algoritmo para la creación del árbol. Selección de atributos comenzando en el nodo raíz. Proceso recursivo. Árboles

Más detalles

Examen Parcial. Attr1: A, B Attr2: A, B, C Attr3 1, 2, 3 Attr4; a, b Attr5: 1, 2, 3, 4

Examen Parcial. Attr1: A, B Attr2: A, B, C Attr3 1, 2, 3 Attr4; a, b Attr5: 1, 2, 3, 4 Aprenentatge 0-03 Q Examen Parcial Nombre: (Examen ) Instrucciones. (0 puntos) Este examen dura horas. Responded todas las preguntas en estas hojas. Para las preguntas test poned un circulo alrededor de

Más detalles

ARBOLES DE DECISION. Miguel Cárdenas-Montes. 1 Introducción. Objetivos: Entender como funcionan los algoritmos basados en árboles de decisión.

ARBOLES DE DECISION. Miguel Cárdenas-Montes. 1 Introducción. Objetivos: Entender como funcionan los algoritmos basados en árboles de decisión. ARBOLES DE DECISION Miguel Cárdenas-Montes Los árboles de decisión son estructuras lógicas con amplia utilización en la toma de decisión, la predicción y la minería de datos. Objetivos: Entender como funcionan

Más detalles

Tema 5: Evaluación de Modelos de Clasificación Supervisada p. 1/2

Tema 5: Evaluación de Modelos de Clasificación Supervisada p. 1/2 Tema 5: Evaluación de odelos de lasificación Supervisada Pedro Larrañaga, Iñaki Inza, Abdelmalik oujahid Departamento de iencias de la omputación e Inteligencia Artificial Universidad del País Vasco http://www.sc.ehu.es/isg/

Más detalles

Estadística Multivariada Computacional Introducción al Aprendizaje Automático (parte 1)

Estadística Multivariada Computacional Introducción al Aprendizaje Automático (parte 1) Estadística Multivariada Computacional Introducción al Aprendizaje Automático (parte 1) Mathias Bourel IMERL - Facultad de Ingeniería, Universidad de la República, Uruguay 24 de octubre de 2016 M.Bourel

Más detalles

Estadística con R. Clasificadores

Estadística con R. Clasificadores Estadística con R Clasificadores Análisis discriminante lineal (estadístico) Árbol de decisión (aprendizaje automático) Máquina soporte vector (aprendizaje automático) Análisis discriminante lineal (AD)

Más detalles

10 EXÁMENES

10 EXÁMENES 10 EXÁMENES 2014-2018 Convocatoria Extraordinaria de Septiembre 1 de Septiembre de 2014 1. (1 pto.) a) Aunque por abuso del lenguaje hemos hablado de minería de datos y de KDD como sinónimos, indica las

Más detalles

Apéndice A: Matrices de confusión y resultados de precisión, exhaustividad y medida F

Apéndice A: Matrices de confusión y resultados de precisión, exhaustividad y medida F Apéndices 77 Apéndice A: Matrices de confusión y resultados de precisión, exhaustividad y medida F En este apéndice se presentan seis tablas con otros resultados obtenidos. En cada una de las primeras

Más detalles

Evaluación de Modelos (II) Carlos Hurtado L. Departamento de Ciencias de la Computación, U de Chile

Evaluación de Modelos (II) Carlos Hurtado L. Departamento de Ciencias de la Computación, U de Chile Evaluación de Modelos (II) Carlos Hurtado L. Departamento de Ciencias de la Computación, U de Chile Comparación de Modelos Podemos estimar el error de cada modelo y rankear. Una alternativa más sólida

Más detalles

Evaluación, validación y sobre-ajuste

Evaluación, validación y sobre-ajuste Evaluación, validación y sobre-ajuste Eduardo Morales, Hugo Jair Escalante Coordinación Ciencias Computacionales Instituto Nacional Astrofísica, Óptica y Electrónica Agosto, 2015 (INAOE) Agosto, 2015 1

Más detalles

Metodología Experimental

Metodología Experimental Doctorado en Informática Métodos y Técnicas de Minería de Datos Metodología Experimental Juan José Rodríguez Diez jjrodriguez@ubu.es Cuestiones Qué medimos. En principio, tasa de acierto/error. Qué experimentos

Más detalles

Técnicas Multivariadas Avanzadas

Técnicas Multivariadas Avanzadas Métodos de remuestreo Universidad Nacional Agraria La Molina 2014-2 Error de entrenamiento y prueba Estimación del error de predicción Los métodos de remuestreo constituyen una herramienta importante e

Más detalles

Tema 15: Combinación de clasificadores

Tema 15: Combinación de clasificadores Tema 15: Combinación de clasificadores p. 1/21 Tema 15: Combinación de clasificadores Abdelmalik Moujahid, Iñaki Inza, Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial

Más detalles

Clasificación de estados cerebralesusando neuroimágenes funcionales

Clasificación de estados cerebralesusando neuroimágenes funcionales Clasificación de estados cerebralesusando neuroimágenes funcionales Clase 2: Reconocimiento de patrones en datos de neuroimagenes Enzo Tagliazucchi (tagliazucchi.enzo@googlemail.com) Primera clase: introducción

Más detalles

VIII Jornadas de Usuarios de R

VIII Jornadas de Usuarios de R VIII Jornadas de Usuarios de R Análisis del Abandono en el Sector Bancario Predicción del abandono de clientes Albacete, 17 de Noviembre de 2016 I. INDICE : Modelo Abandonos I. COMPRENSIÓN DEL NEGOCIO

Más detalles

Complementos de aprendizaje automático

Complementos de aprendizaje automático Complementos de aprendizaje automático David Soĺıs Martín Dpto. Ciencias de la Computación e Inteligencia Artificial Ampliación de Inteligencia Artificial, 2016-2017 Índice Introducción Métricas Validación

Más detalles

Curso de Formación Continua Nº identificación Propuesta nueva/reedición

Curso de Formación Continua Nº identificación Propuesta nueva/reedición Curso de Formación Continua Nº identificación Propuesta nueva/reedición Aplicaciones Industriales con Minería de Datos y Sistemas Expertos FC1011195 Propuesta nueva Tipo de Créditos Créditos ECTS Campo

Más detalles

CART s. Walter Sosa-Escudero. Universisad de San Andres y CONICET

CART s. Walter Sosa-Escudero. Universisad de San Andres y CONICET Universisad de San Andres y CONICET Motivacion Modelo flexible e interpretable para la relacion entre Y y X. Arboles: partir el espacio de atributos en rectangulos, y ajustar un modelo simple para Y dentro

Más detalles

Introducción al Procesamiento de Lenguaje Natural. Grupo de PLN - InCo

Introducción al Procesamiento de Lenguaje Natural. Grupo de PLN - InCo Introducción al Procesamiento de Lenguaje Natural Grupo de PLN - InCo Clasificación Clasificación Dado un objeto y un conjunto de clases, quiero saber a qué clase pertenece el objeto. Muchas tareas de

Más detalles

Minería de datos. Unidad 2. El proceso KDD Evaluación, difusión y uso. M en I Sara Vera Noguez

Minería de datos. Unidad 2. El proceso KDD Evaluación, difusión y uso. M en I Sara Vera Noguez Minería de datos Unidad 2. El proceso KDD Evaluación, difusión y uso M en I Sara Vera Noguez El proceso KDD Hernández, 2008 p.20 La parte iterativa Una vez obtenido el modelo se debe evaluar Si satisface

Más detalles

Proyecto Elvira. Clasificadores En Elvira (definición y validación) Francisco Javier García Castellano

Proyecto Elvira. Clasificadores En Elvira (definición y validación) Francisco Javier García Castellano Proyecto Elvira Clasificadores En Elvira (definición y validación) Francisco Javier García Castellano fjgc@decsai.ugr.es Uncertainty Treatment in Artificial Intelligence Research Group Department of Computer

Más detalles

Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Introducción al aprendizaje supervisado Profesor: Dr. Wilfrido Gómez Flores 1 Conceptos básicos Desde la antigüedad, el problema de buscar patrones en datos es fundamental en diversas

Más detalles

CRITERIOS DE SELECCIÓN DE MODELOS

CRITERIOS DE SELECCIÓN DE MODELOS Inteligencia artificial y reconocimiento de patrones CRITERIOS DE SELECCIÓN DE MODELOS 1 Criterios para elegir un modelo Dos decisiones fundamentales: El tipo de modelo (árboles de decisión, redes neuronales,

Más detalles

Introducción. Qué es Machine Learning?

Introducción. Qué es Machine Learning? Introducción Qué es Machine Learning? Introducción Hay problemas en Informática que se pueden definir concretamente y son simples de convertir en un algoritmo Ejemplo: Ordenar alfabéticamente una lista,

Más detalles

EVALUACIÓN EN APRENDIZAJE. Eduardo Morales y Jesús González

EVALUACIÓN EN APRENDIZAJE. Eduardo Morales y Jesús González EVALUACIÓN EN APRENDIZAJE Eduardo Morales y Jesús González Significancia Estadística 2 En estadística, se dice que un resultado es estadísticamente significante, cuando no es posible que se presente por

Más detalles

Aplicaciones de apoyo al diagnóstico médico. Identificación de objetos amigos y enemigos. Identificación de zonas afectadas por un desastre natural.

Aplicaciones de apoyo al diagnóstico médico. Identificación de objetos amigos y enemigos. Identificación de zonas afectadas por un desastre natural. Capítulo 5 Evaluación En muchas ocasiones requerimos hacer una evaluación muy precisa de nuestros algoritmos de aprendizaje computacional porque los vamos a utilizar en algún tipo de aplicación que así

Más detalles

MODELADO CALIBRACIÓN MULTIVARIADA

MODELADO CALIBRACIÓN MULTIVARIADA MODELADO CALIBRACIÓN MULTIVARIADA Calibración multivariada aproximaciones multivariadas para crear una curva de calibración: regresión clásica u ordinaria (classical/ordinary least squares, CLS) regresión

Más detalles

Boosting. Miguel Cárdenas-Montes. 1 Boosting. 2 AdaBoost. Objetivos: Entender como funciona la técnica denominada boosting.

Boosting. Miguel Cárdenas-Montes. 1 Boosting. 2 AdaBoost. Objetivos: Entender como funciona la técnica denominada boosting. Ó Boosting Miguel Cárdenas-Montes Tanto en clasificación como en regresión, existen estrategias, basadas en la mezcla de modelos, para mejorar la precisión de los modelos. En estos métodos se establece

Más detalles

Random Subspace Method. Índice. 1. Random Subspace Method. 1. Introducción. 2. Objetivo. 3. Implementación. 4. Evaluación. 5.

Random Subspace Method. Índice. 1. Random Subspace Method. 1. Introducción. 2. Objetivo. 3. Implementación. 4. Evaluación. 5. The Random Subspace Method for Constructing Decision Forests (IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, VOL. 20, NO. 8, AUGUST 1998) Iñigo Barandiaran 1 Índice 1. Random Subspace

Más detalles

Aprendizaje Automatizado

Aprendizaje Automatizado Aprendizaje Automatizado Aprendizaje Automatizado Programas que mejoran su comportamiento con la experiencia. Dos formas de adquirir experiencia: A partir de ejemplos suministrados por un usuario (un conjunto

Más detalles

Aprendizaje Automatizado. Árboles de Clasificación

Aprendizaje Automatizado. Árboles de Clasificación Aprendizaje Automatizado Árboles de Clasificación Árboles de Clasificación Estudiaremos un algoritmo para la creación del árbol. Selección de atributos comenzando en el nodo raíz. Proceso recursivo. Árboles

Más detalles

OTRAS CONSIDERACIONES. Introducción a las Redes Neuronales Artificiales

OTRAS CONSIDERACIONES. Introducción a las Redes Neuronales Artificiales OTRAS CONSIDERACIONES! Estrategias para generalización Existen diversas estrategias para mejorar la generalización: 1) Teoría de Regularización: Agregar una penalidad para lograr mejorar la forma de la

Más detalles

Sistemas de Percepción Visión por Computador

Sistemas de Percepción Visión por Computador Nota: Algunas de las imágenes que aparecen en esta presentación provienen del libro: Visión por Computador: fundamentos y métodos. Arturo de la Escalera Hueso. Prentice Hall. Sistemas de Percepción Visión

Más detalles

ANÁLISIS DE DATOS. Ricardo Aler Mur

ANÁLISIS DE DATOS. Ricardo Aler Mur ANÁLISIS DE DATOS Ricardo Aler Mur EXAMEN DE ANÁLISIS DE DATOS GRADO EN INFORMÁTICA ENERO 2014 10 puntos, 1 hora y media de duración. Responder cada pregunta con respuestas breves (unas pocas líneas).

Más detalles

RECONOCIMIENTO DE PAUTAS

RECONOCIMIENTO DE PAUTAS RECONOCIMIENTO DE PAUTAS ANÁLISIS DISCRIMINANTE (Discriminant analysis) Reconocimiento de pautas supervisado si se cuenta con objetos cuya pertenencia a un grupo es conocida métodos: análisis de discriminantes

Más detalles

Métodos de ensambles

Métodos de ensambles Métodos de ensambles Outline Ensambles en general Bagging Random Forest Boosting Introducción Ensamble: conjunto grande de modelos que se usan juntos como un meta modelo Idea base conocida: usar conocimiento

Más detalles

Desarrollo y optimización de un sistema de estimación del nivel UPDRS de un paciente de Parkinson a partir de grabaciones del habla

Desarrollo y optimización de un sistema de estimación del nivel UPDRS de un paciente de Parkinson a partir de grabaciones del habla Desarrollo y optimización de un sistema de estimación del nivel UPDRS de un paciente de Parkinson a partir de grabaciones del habla Recio Grado en Ingeniería de Tecnologías y Servicios de Telecomunicación

Más detalles

Complementación y ampliación de la currícula de la Maestría 2017 Maestría en Generación y Análisis de Información Estadística

Complementación y ampliación de la currícula de la Maestría 2017 Maestría en Generación y Análisis de Información Estadística ampliación de la currícula Maestría en Generación y Análisis de Información Estadística Programa abierto de ampliación de la currícula Maestría en Generación y Análisis de Información Estadística La Maestría

Más detalles

INAOE. Ensambles de Clasificadores. Eduardo Morales, Hugo Jair Escalante. Introducción. Ensambles de Clasificadores. Algoritmos.

INAOE. Ensambles de Clasificadores. Eduardo Morales, Hugo Jair Escalante. Introducción. Ensambles de Clasificadores. Algoritmos. INAOE (INAOE) 1 / 66 Contenido 1 2 3 4 5 duardo (INAOE) 2 / 66 Motivación Cuando las personas tienen que tomar decisiones difíciles, normalmente toman en cuenta la opinión de varios expertos, buscando

Más detalles

Ricardo Aler Mur CLASIFICADORES KNN-I

Ricardo Aler Mur CLASIFICADORES KNN-I Ricardo Aler Mur CLASIFICADORES KNN-I En esta clase se habla del aprendizaje de modelos de clasificación y regresión basados en instancias o ejemplares. En concreto: Se define la clasificación y regresión

Más detalles

Pangea. Sistema de recomendación de viajes. Speaker: Andrés Pipicello. Lucas Bernardi, Martín Chaia, Bruno Cuervo Parrino. Demo

Pangea. Sistema de recomendación de viajes. Speaker: Andrés Pipicello. Lucas Bernardi, Martín Chaia, Bruno Cuervo Parrino. Demo Pangea Sistema de recomendación de viajes Speaker: Andrés Pipicello Lucas Bernardi, Martín Chaia, Bruno Cuervo Parrino Demo Research (Despegar.com) Pangea Demo 1 / 18 1 Qué es Pangea? 2 Cómo funciona Pangea?

Más detalles

RECONOCIMIENTO DE VINOS POR CULTIVOS CLASIFICACION

RECONOCIMIENTO DE VINOS POR CULTIVOS CLASIFICACION RECONOCIMIENTO DE VINOS POR CULTIVOS CLASIFICACION Miguel Caballero Sierra Guillermo Rubio Escuela Colombiana de Ingeniería Julio Garavito Ingeniería Industrial, Minería de Datos RESUMEN Los modelos de

Más detalles

Aprendizaje Semisupervisado

Aprendizaje Semisupervisado Aprendizaje Semisupervisado Eduardo Morales INAOE (INAOE) 1 / 52 Contenido 1 2 3 4 5 6 7 (INAOE) 2 / 52 Aprendizaje Semisupervisado Actualmente existe una gran cantidad de datos disponibles, sin embargo,

Más detalles

Evaluación de Técnicas de Minería de Datos para la Predicción del Rendimiento Académico

Evaluación de Técnicas de Minería de Datos para la Predicción del Rendimiento Académico Evaluación de Técnicas de Minería de Datos para la Predicción del Rendimiento Académico Leticia Laura Ochoa, Mg 1, Karina Rosas Paredes, Mg 2, César Baluarte Araya, Dr 1 1 Universidad Nacional de San Agustín,

Más detalles

Introducción al Procesamiento del Habla

Introducción al Procesamiento del Habla Escuela de Verano RIO 2016 Departamento de Computación, FCEFQyN Universidad Nacional de Río Cuarto Introducción al Procesamiento del Habla Prof. Agustín Gravano Departamento de Computación, FCEyN Universidad

Más detalles

Práctica 2: Utilización de WEKA desde la línea de comandos.

Práctica 2: Utilización de WEKA desde la línea de comandos. PROGRAMA DE DOCTORADO TECNOLOGÍAS INDUSTRIALES APLICACIONES DE LA INTELIGENCIA ARTIFICIAL EN ROBÓTICA Práctica 2: Utilización de WEKA desde la línea de comandos. Objetivos: Utilización de WEKA desde la

Más detalles

Random Forests. Felipe Parra

Random Forests. Felipe Parra Applied Mathematics Random Forests Abril 2014 Felipe Parra Por que Arboles para Clasificación PERFIL DE RIESGO: definir con qué nivel de aversión al riesgo se toman decisiones Interpretación intuitiva

Más detalles

Posibles trabajos HIA

Posibles trabajos HIA Posibles trabajos HIA Posibles trabajos Comparar otras herramientas de Minería de Datos con Weka Estudiar la influencia del ruido en bagging y boosting Estudiar la influencia del parámetro de poda en J48

Más detalles

Práctica 1: Entorno WEKA de aprendizaje automático y data mining.

Práctica 1: Entorno WEKA de aprendizaje automático y data mining. PROGRAMA DE DOCTORADO TECNOLOGÍAS INDUSTRIALES APLICACIONES DE LA INTELIGENCIA ARTIFICIAL EN ROBÓTICA Práctica 1: Entorno WEKA de aprendizaje automático y data mining. Objetivos: Utilización de funciones

Más detalles

Uso de Algoritmos de Machine Learning en la Construcción de Mapas de Pobreza: Venezuela Omar Zambrano

Uso de Algoritmos de Machine Learning en la Construcción de Mapas de Pobreza: Venezuela Omar Zambrano Uso de Algoritmos de Machine Learning en la Construcción de Mapas de Pobreza: Venezuela 2012-2016 Omar Zambrano Taller regional sobre desagregación de estadísticas sociales mediante metodologías de estimación

Más detalles

SISTEMAS ADAPTADOS DE CLASIFICACION PARA EL RECONOCIMIENTO BIOMÉTRICO

SISTEMAS ADAPTADOS DE CLASIFICACION PARA EL RECONOCIMIENTO BIOMÉTRICO SISTEMAS ADAPTADOS DE CLASIFICACION PARA EL RECONOCIMIENTO BIOMÉTRICO Eric Granger Laboratorio de imágenes, vision e inteligencia artificial École de technologie supérieure Montreal, Canada eric.granger@etsmtl.ca

Más detalles

ÍNDICE. Introducción... Capítulo 1. Técnicas de minería de datos y herramientas... 1

ÍNDICE. Introducción... Capítulo 1. Técnicas de minería de datos y herramientas... 1 ÍNDICE Introducción... XI Capítulo 1. Técnicas de minería de datos y herramientas... 1 Clasificación de las técnicas de minería de datos y herramientas más comunes... 1 Modelado originado por la teoría

Más detalles

GRADO EN INGENIERÍA INFORMÁTICA

GRADO EN INGENIERÍA INFORMÁTICA GRADO EN INGENIERÍA INFORMÁTICA CREACIÓN DE ENSEMBLES UTILIZANDO TÉCNICAS DE BAGGING PARA MEJORAR EL RENDIMIENTO DE SISTEMAS DE CLASIFICACIÓN BASADOS EN REGLAS DIFUSAS TRABAJO DE FIN DE GRADO Autor: Rubén

Más detalles

Aprendizaje Automático

Aprendizaje Automático id3 id3 como búsqueda Cuestiones Adicionales Regresión Lineal. Árboles y Reglas de Regresión Ingeniería Informática Fernando Fernández Rebollo y Daniel Borrajo Millán Grupo de Planificación y Aprendizaje

Más detalles

Comparación de métodos de aprendizaje sobre el mismo problema

Comparación de métodos de aprendizaje sobre el mismo problema Comparación de métodos de aprendizaje sobre el mismo problema Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid Contenido 1. Motivación. Test de

Más detalles

Tema 7: Aprendizaje de árboles de decisión

Tema 7: Aprendizaje de árboles de decisión Inteligencia Artificial 2 Curso 2002 03 Tema 7: Aprendizaje de árboles de decisión José A. Alonso Jiménez Miguel A. Gutiérrez Naranjo Francisco J. Martín Mateos José L. Ruiz Reina Dpto. de Ciencias de

Más detalles

CAPÍTULO 9 CLASIFICACIÓN Y RECONOCIMIENTO DE PATRONES. 9.1 Introducción. María T. GARCÍA-ORDÁS 1, Rocío ALAIZ-RODRÍGUEZ 1, Enrique ALEGRE 1

CAPÍTULO 9 CLASIFICACIÓN Y RECONOCIMIENTO DE PATRONES. 9.1 Introducción. María T. GARCÍA-ORDÁS 1, Rocío ALAIZ-RODRÍGUEZ 1, Enrique ALEGRE 1 CAPÍTULO 9 CLASIFICACIÓN Y RECONOCIMIENTO DE PATRONES María T. GARCÍA-ORDÁS 1, Rocío ALAIZ-RODRÍGUEZ 1, Enrique ALEGRE 1 1 Departamento de Ingeniería Eléctrica y de Sistemas y Automática, Universidad de

Más detalles

Sobreajuste - Overfitting

Sobreajuste - Overfitting Sobreajuste - Overfitting Miguel Cárdenas-Montes Cuando se evalúa la calidad de un modelo o un ajuste, es importante medir el error en el conjunto de entrenamiento y en la predicción. La utilización exclusiva

Más detalles

Réplica del III taller sobre modelización de nichos ecológicos de GBIF

Réplica del III taller sobre modelización de nichos ecológicos de GBIF Réplica del III taller sobre modelización de nichos ecológicos de GBIF Madrid, España. 14-16 marzo 2007 Francisco Javier Bonet García, 2007 Contenidos Ejemplo de una forma sencilla de evaluar modelos Tipos

Más detalles

Tareas de la minería de datos: clasificación. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR

Tareas de la minería de datos: clasificación. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Tareas de la minería de datos: clasificación CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Tareas de la minería de datos: clasificación Clasificación (discriminación) Empareja

Más detalles

Econometría Avanzada FLACSO 2014

Econometría Avanzada FLACSO 2014 Econometría Avanzada FLACSO 2014 Hemos cubierto: Mapa Planteamiento de una pregunta económica de interés Diferencias entre econometría y estadística Métodos: Lineales (MCO) revisión, variables instrumentales

Más detalles

Credit Scoring Advanced

Credit Scoring Advanced 1 Curso: Credit Scoring Advanced Aplicaciones avanzadas en la gestión de riesgo crediticio 2 Presentación Quiénes son los clientes con mayor probabilidad de entrar en default? Cómo identificar, a futuro,

Más detalles

Ricardo Aler Mur EVALUACIÓN DE TÉCNICAS DE APRENDIZAJE-2 COMPARACIÓN DE MODELOS

Ricardo Aler Mur EVALUACIÓN DE TÉCNICAS DE APRENDIZAJE-2 COMPARACIÓN DE MODELOS Ricardo Aler Mur EVALUACIÓN DE TÉCNICAS DE APRENDIZAJE-2 COMPARACIÓN DE MODELOS En esta clase se desarrolla de manera técnica una cuestión introducida en la clase anterior: la comparación de dos modelos.

Más detalles

Apellidos:... Nombre:...

Apellidos:... Nombre:... Ejercicio 1 (1.5 puntos): Cuestiones Contestar a las siguientes preguntas de manera clara y concisa, usando el espacio en blanco que se deja a continuación: 1. Qué es un unificador de dos átomos? Describir

Más detalles

Práctica 5: Clasificación con número variable de ejemplos.

Práctica 5: Clasificación con número variable de ejemplos. 5º INGENIERÍA DE TELECOMUNICACIÓN INTELIGENCIA ARTIFICIAL Y RECONOCIMIENTO DE PATRONES Práctica 5: Clasificación con número variable de ejemplos. Objetivos: Utilización de conjuntos de entrenamiento y

Más detalles

Clasificación Supervisada. Métodos jerárquicos. CART

Clasificación Supervisada. Métodos jerárquicos. CART Clasificación Supervisada. Métodos jerárquicos. CART Ricardo Fraiman 2 de abril de 2010 Descripción del problema Muestra de entrenamiento (X 1, Y 1 ),..., (X n, Y n ) E {1,..., m}. Típicamente E = R d.

Más detalles

Estimar, descomponer y comparar el error de mala clasificación

Estimar, descomponer y comparar el error de mala clasificación Estimar, descomponer y comparar el error de mala clasificación Evaluando y analizando el comportamiento de algoritmos de inducción de clasificadores Aritz Pérez, Pedro Larrañaga e Iñaki Inza Intelligent

Más detalles

[20380] Visió per Computador Prueba 2 (2016) [A] Teoria (10p) (una pregunta test fallada descuenta 1/4 de pregunta acertada)

[20380] Visió per Computador Prueba 2 (2016) [A] Teoria (10p) (una pregunta test fallada descuenta 1/4 de pregunta acertada) 102784 [20380] Visió per Computador Prueba 2 (2016) [A] Teoria (10p) (una pregunta test fallada descuenta 1/4 de pregunta acertada) 1. Queremos reducir la distorsión de barril introducida por el sistema

Más detalles

Examen de Septiembre de TACCIII y TAI (Modelo 2)

Examen de Septiembre de TACCIII y TAI (Modelo 2) Examen de Septiembre de TACCIII y TAI (Modelo 2) 12 de septiembre de 2008 1. La desordenación de la base de datos puede influir en el resultado obtenido mediante a) clasificación por distancia a las medias

Más detalles