Evaluación de modelos

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Evaluación de modelos"

Transcripción

1 Evaluación de modelos José Luis Ruiz Reina Dpto. Ciencias de la Computación e Inteligencia Artificial Razonamiento Asistido por Computador,

2 Evaluación de modelos Una de las fases principales en todo el proceso de análisis de datos En este tema, nos centraremos en evaluación de clasificadores Se trata de evaluar la calidad de un modelo aprendido, cuantificado mediante una varias métricas que cuantifican el rendimiento del modelo La más simple: proporción de aciertos en la clasificación dada (accuracy) Para qué queremos evaluar? Comparar distintos modelos, para elegir el mejor Estimar cómo se comportará el modelo, una vez puesto en producción Convencer al cliente de que el modelo cumplirá su propósito

3 Principio básico en la evaluación de modelos La evaluación final de un modelo nunca debe hacerse sobre los datos que sirven para aprender el modelo Ni siquiera sobre los datos que sirven para ajustar el modelo La manera más básica de hacerlo: Dividir el conjunto de datos disponibles en entrenamiento y prueba Aprender con el conjunto de entrenamiento Evaluar con el de prueba Pero a veces no es posible (pocos datos)

4 Metodología y métricas Metodologías: Cómo diseñamos el experimento de evaluación del modelo? Holdout, validación cruzada, bootstrap,... Métricas: Cómo medimos el rendimiento de un modelo? Accuracy, Precision, Recall, curvas ROC, AUC,...

5 Índice Cómo evaluar: procedimientos de evaluación Qué evaluar: métricas de evaluación Evaluación de modelos en scikit-learn (model selection y metrics)

6 Cómo evaluar: procedimientos de evaluación

7 Procedimiento de evaluación Cuestión metodológica: cómo usamos los datos que tenemos para estimar el rendimiento de un clasificador? cómo ajustamos los distintos parámetros con los datos que tenemos? Necesitamos datos con su valor de clasificación (es decir, tomados de los datos que ya tenemos) Pero para dar el rendimiento final es fundamental no hacerlo sobre conjuntos de datos que: Se hayan usado para el aprendizaje del modelo Se hayan usado para el ajuste del modelo

8 Método Holdout El método holdout consiste en separar de manera aleatoria, una parte de los datos de los que se dispone, obteniendo: Conjunto de entrenamiento Conjunto de prueba Se aprende con el conjunto de entrenamiento y se evalúa el rendimiento sobre el conjunto de prueba

9 Método Holdout con validación y prueba En muchas ocasiones necesitamos un tercer conjunto de datos para ajustar determinados aspectos del modelo que finalmente se aprenda Es importante que una vez se ajuste el modelo, haya una evaluación final, completamente independiente del proceso de ajuste En ese caso, se parten los datos en tres conjuntos: entrenamiento, validación y prueba (porcentajes habituales: 50:20:30, 40:20:40)

10 Validación y prueba frente a sobreajuste El método holdout nos permite tratar de evitar el sobreajuste que se produciría si nos basaramos sólamente en el rendimiento sobre el conjunto de entrenamiento En muchos algoritmos, el sobreajuste ocurre a partir de una cierta iteración. Podemos estimar de esta manera en qué momento empieza a producirse. Misclassification Rate Performance on Training Set Performance on Validation Set Training Iteration

11 Problemas con el método holdout Clases no balanceadas: Ejemplo: 900 datos de clasificación pos y 100 neg, podría hacerse un holdout que no respetara esas proporciones Divisiones estratificadas, se hacen por cada clase A veces no nos podemos permitir ese lujo : pocos datos Puede que en el conjunto de entrenamiento queden los datos fáciles, o viceversa El método de validación cruzada trata de contrarrestar estas ds últimas cuestiones

12 Validación cruzada Validación cruzada en k partes (k-fold cross-validation): Se divide el conjunto de entrenamiento en k partes de igual tamaño, preferentemente estratificadas (valores usuales, k=10, k=5). Se hacen k aprendizajes con sus correspondientes evaluaciones (con una métrica dada) En cada aprendizaje, se usa como test una de las partes y como entrenamiento las k 1 restantes Se devuelve la media de las evaluaciones realizadas Fold*1" Fold*2" Fold*3" Fold*4" Fold*5" Fold*6" Fold*7" Fold*8" Fold*9" Fold*10"

13 Validación cruzada: ventajas y desventajas Ventajas: Si no tenemos muchos datos, nos proporciona una buena manera de realizar el proceso de validación Cada dato aparece exactamente una vez en un conjunto de test: ningún ejemplo se escapa del entrenamiento ni de la evaluación Podemos medir la varianza de las evaluaciones entre distintos conjuntos de prueba Desventajas: Tiempo de computación

14 Validación cruzada: una observación importante Validación cruzada no es un método para aprender un modelo Es una manera de evaluar cómo de bueno será (en términos de generalización) un algoritmo de aprendizaje sobre un conjunto de entrenamiento dado Se suele usar, por ejemplo, para el ajuste de parámetros Finalmente, se suele aprender un modelo sobre todo el conjunto de entrenamiento, y se evalúa ese modelo sobre un conjunto de prueba independiente.

15 Validación cruzada: variantes Validación cruzada dejando uno fuera (leave one out): Es el caso en el que k es igual al total de ejemplos, hacemos N entrenamientos (N total de datos), y N evaluaciones sobre un conjunto de prueba unitario No aconsejable si el conjunto de datos es grande, puede hacer buenas estimaciones sobre conjuntos de datos pequeños Validación cruzada con particiones aleatorias: Se repite k veces la separación del conjunto de datos entrenamiento y prueba, y en cada una se entrena y se evalúa. Cada una de esas separaciones se hace de manera aleatoria, simplemente fijando la proporción de datos para entrenamiento y para prueba Permite subsampling, útil cuando hay muchos datos

16 Bootstrap En cada iteración se obtiene una muestra del mismo tamaño que el conjunto de datos total, pero cada elemento se extrae aleatoriamente con reemplazo Es decir, la muestra puede tener repeticiones y algunos datos pueden no entrar Se entrena con el conjunto extraído, y se evalúa sobre el conjunto original Se devuelve la media de todas las iteraciones Estimación optimista (gran solape entre conjuntos de entrenamiento y prueba)

17 Qué evaluar: métricas de evaluación

18 Métricas de evalución Todas las metodologías necesitan una función de evaluación o métrica Para estimar cuantitativamente la capacidad de generalización del modelo Es decir, su desempeño sobre la distribución completa de posibles datos (y no sólo sobre el conjunto usado para aprender) Para comparar diversas opciones en la fase ajuste y validación La más simple: tasa de aciertos en la predicción (accuracy) Pero hay muchas otras Y no necesariamente tiene que ser un solo número La elección de una medida concreta debe estar guiada por el objetivo final

19 Métricas para clasificación binaria Supondremos dos clases: positiva (1) y negativa (0), y un clasificador aprendido que queremos evaluar Matriz de confusión: tabla que cruza las predicciones con la clasificación real (ground truth) Tipos de predicciones: Verdadero Positivo (TP): ejemplo positivo, predicho positivo Falso Positivo (FP): ejemplo negativo, predicho positivo Verdadero Negativo (TN): ejemplo negativo, predicho negativo Falso Negativo (FN): ejemplo positivo, predicho negativo

20 Ejemplo: clasificando SPAM (Kelleher et al.) Supongamos que tenemos un modelo para detectar posibles correos SPAM (la clase positiva), que aplicamos a un conjunto de 20 correos (cuya clasificación conocemos), con los siguientes resultados: ID Clase Pred. Resultado 1 spam ham FN 2 spam ham FN 3 ham ham TN 4 spam spam TP 5 ham ham TN 6 spam spam TP 7 ham ham TN 8 spam spam TP 9 spam spam TP 10 spam spam TP ID Clase Pred. Resultado 11 ham ham TN 12 spam ham FN 13 ham ham TN 14 ham ham TN 15 ham ham TN 16 ham ham TN 17 ham spam FP 18 spam spam TP 19 ham ham TN 20 ham spam FP En este caso: TP = 6, FP = 2, TN = 9, FN = 3

21 Métricas en clasificación binaria TP+TN Tasa de aciertos= TP+TN+FP+FN 6+9 En el ejemplo: = 0,75 El problema de usar la tasa de aciertos en datos no balanceados Ejemplo: en un conjunto de datos con 990 positivos y 10 negativos, un clasificador que predice siempre positivo, tendría un 0.99 de tasa de aciertos Y sin embargo es malo! Además, no todos los aciertos o errores tienen la misma importancia En el diagnóstico de enfermedades, un FP es más aceptable que un FN, por ejemplo Por tanto, se suelen usar mas de una medida, para captar el impacto de todos los tipos de error

22 Principales métricas en clasificación binaria Precisión: P = TP TP+FP Qué proporción de los clasificados como positivos lo son realmente? Recall (sensibilidad, exhaustividad): R = TP TP+FN Qué proporción de todos los positivos se clasifican como tal? Tasa FP: FPR = FP TN+FP Qué proporción de todos los negativos se clasifican como positivos? Medida F 1 = 2 P R P+R Es la media armónica de P y R

23 Métricas en el clasificador de SPAM Precisión: Qué proporción de los clasificados como SPAM lo son realmente? P = TP TP+FP = = 0,75 Recall: Qué proporción de los que son SPAM se clasifican como tal? R = TP TP+FN = = 2 3 Medida F 1 En nuestro ejemplo F 1 = 2 P R P+R = 0,706 Tasa FP: Qué proporción de los que no son SPAM se clasifican como SPAM? FPR = FP TN+FP = = 2 11

24 Comentarios sobre las métricas de evaluación Precisión (P) alta significa pocos falsos positivos Recall(R) alta significa pocos falsos negativos Hay un compromiso entre P y R: Un clasificador que todo lo predijera positivo, obtendría R = 1, pero habría muchos falsos negativos y P sería muy baja Un clasificador que sólo predijera positivo a un único ejemplo (positivo) y el resto como negativo, tendría R muy baja pero P = 1 Un clasificador perfecto tendría P = R = 1 En la práctica, hay que tratar que ambas sean lo mejor posible La medida F 1 nos sirve para resumir P y R en un solo dato. Se prefiere a la media aritmética, mitiga el impacto de las tasas altas y acentúa el de las tasas bajas.

25 Clasificadores que manejan incertidumbre Hemos visto que muchos clasificadores las predicciones las hacen cuantificando el grado de incertidumbre de las mismas Naive Bayes y regresión logística devuelven probabilidades Máquinas de vectores soporte cuantifican la cercanía a la frontera de decisión... Por defecto se predice la clase positiva cuando la probabilidad es mayor que 0.5 (o en el caso de SVM, cuando la evaluación es positiva)

26 Variando el umbral de clasificación Pero podríamos subir o bajar el umbral de aceptación, para hacer que el clasificador fuera más o menos estricto a la hora de clasificar un ejemplo como positivo. Variando el umbral, obtendríamos para el mismo clasificador y conjunto de datos, distintos valores de las métricas P, R, FPR, F 1,... Nos proporciona una forma de ajustar el compromiso entre P y R, o entre FPR y R

27 Incertidumbre en el clasificador de SPAM (Kelleher et al.) La siguiente tabla muestra las predicciones probabiĺısticas del clasificador de correo SPAM, para cada uno de los datos. Aparecen ordenados de menor a mayor probabilidad en la predicción de la clase positiva: ID Clase Predic. Prob. Resultado 7 ham ham TN 11 ham ham TN 15 ham ham TN 13 ham ham TN 19 ham ham TN 12 spam ham FN 2 spam ham FN 3 ham ham TN 16 ham ham TN 1 spam ham FN ID Clase Predict. Prob. Resultado 5 ham ham TN 14 ham ham TN 17 ham spam FP 8 spam spam TP 6 spam spam TP 10 spam spam TP 18 spam spam TP 20 ham spam FP 9 spam spam TP 4 spam spam TP

28 Clasificador SPAM: variando el umbral de predicción Distintos valores de las métricas, para umbrales 0.1, 0.25, 0.5, 0.75 y 0.9: Pred. Pred. Pred. Pred. Pred. ID Clase Prob. (0.10) (0.25) (0.50) (0.75) (0.90) 7 ham ham ham ham ham ham 11 ham ham ham ham ham ham 15 ham ham ham ham ham ham 13 ham ham ham ham ham ham 19 ham ham ham ham ham ham 12 spam spam ham ham ham ham 2 spam spam ham ham ham ham 3 ham spam ham ham ham ham 16 ham spam ham ham ham ham 1 spam spam spam ham ham ham 5 ham spam spam ham ham ham 14 ham spam spam ham ham ham 17 ham spam spam spam ham ham 8 spam spam spam spam ham ham 6 spam spam spam spam ham ham 10 spam spam spam spam spam ham 18 spam spam spam spam spam ham 20 ham spam spam spam spam ham 9 spam spam spam spam spam spam 4 spam spam spam spam spam spam Tasa de acierto Precisión (R) Recall (R) Tasa Falso Positivo (FPR)

29 Curvas PR y ROC Podemos representar gráficamente cómo varían las métricas, a medida que cambia el umbral Por ejemplo, tres puntos de la curva ROC: True Positive Rate Prediction Thresh = 0.25 spam ham Target spam ham Prediction Thresh = 0.5 spam ham Target spam ham Prediction Thresh = 0.75 spam ham Target spam ham False Positive Rate

30 Curvas PR y ROC Las dos curvas más usadas son: Curva PR (Precision-Recall): representa cómo va cambiando el par (P, R) Curva ROC (Receiver Opeating Characteristic): representa cómo va cambiando el par (FPR, R) La representación gráfica en forma de curva puede ayudar a decidir en qué punto el compromiso entre ambas métricas es satisfactorio (si es que es posible) Y también para comparar clasificadores

31 Curvas ROC: ejemplos True Positive Rate True Positive Rate Model 1 (0.996) Model 2 (0.887) Model 3 (0.764) Model 4 (0.595) False Positive Rate False Positive Rate

32 Curvas PR: ejemplos

33 Curvas PR y ROC: algunos comentarios En curva ROC, lo ideal es que la curva esté cercana a la esquina superior izquierda (recall alto, tasa de falso positivo baja) En curva PR, el ideal está cercano a la esquina superior derecha (precisión y recall altos) Se suele utilizar como métrica el área bajo la curva (AUC): Cuanto más cercano a 1, mejor (y al menos superior a 0.7) Puede interpretarse como la probabilidad de que el modelo haga una predicción más alta para un ejemplo posoitivo que para un ejemplo negativo

34 Evaluación multiclase Para multiclase, podemos definir igualmente la tasa de acierto como la medida más básica Pero de nuevo, si las clases no están balanceadas, puede no ser una métrica adecuada La matriz de confusión nos proporciona la información detallada Matriz de confusión en muticlase:

35 Métricas en multiclase La mayoría de las métricas que se han visto para el caso binario se extienden a más de dos clases Considerando que cada clase es la positiva y el resto la negativa Precisión, Recall, F 1,... Por ejemplo: Recall C = Aciertos en ejemplo de la clase C Total de ejemplos de la clase C Todas las métricas pueden además darse en promedio respecto de las clases Por ejemplo, promedio de la tasa de acierto en cada clase: 1 C i Recall Ci donde C i es el número de ejemplos en la clase i i

36 Evaluación de modelos en scikit-learn (model selection y metrics)

37 Metodología de evaluación y ajuste: model selection cross val score: Validación cruzada Se puede especificar: la manera de realizar las particiones, la métrica usada Devuelve un array con las evaluaciones hechas con cada partición GridSearchCV: Ajuste de parámetros: busca el modelo correspondiente a la mejor combinación de parámetros para un clasificador dado, evaluados sobre el conjunto de entrenamiento usando validación cruzada (grid search) Nota:: se trata de un modelo, no una valoración (es decir, tiene métodos fit, predict, score,... ) Los valores candidatos de los parámetros se dan mediante un diccionario. Por ejemplo: { C :[0.01,0.1,1,10], gamma :[0.001,0.01,0.1,1,10]}

38 Métricas de evaluación: metrics Método score en los modelos, una vez entrenados confusion matrix, f1 score, classification report Reciben dos listas, una con las clases reales y otra con las predicciones, respectivamente Ejemplo de classification report:

39 Métricas de evaluación: metrics precision recall curve y roc curve: curvas PR y ROC Recibe dos listas, una con las clases reales y otra con las predicciones numéricas (probabilidades o funciones de decisión) Devuelve tres listas, con tantos elementos como umbrales distintos de la lista de predicciones: una con valores de precisión, otras con valores de recall, y otra con los umbrales respecxtivos en orden ascendente Esas tres listas permiten dibujar luego las correspondientes curvas. Y calcular el AUC con las funciones auc (PR) y roc auc score (ROC).

40 Bibliografía Aggarwal, C.C.. Data Mining: The Textbook (Springer, 2015) Sección 10.9: Classifier Evaluation Kelleher, J.D., MacNamee, B., D Arcy, A. Machine Learning for Predictive Data Analysis Capítulo 8: Evaluation Müller, A. C. y Guido, S. Introduction to Machine Learning with Python (O Really, 2017) Capítulo 5: Model Evalluation and Improvement

Módulo Minería de Datos Diplomado. Por Elizabeth León Guzmán, Ph.D. Profesora Ingeniería de Sistemas Grupo de Investigación MIDAS

Módulo Minería de Datos Diplomado. Por Elizabeth León Guzmán, Ph.D. Profesora Ingeniería de Sistemas Grupo de Investigación MIDAS Módulo Minería de Datos Diplomado Por Elizabeth León Guzmán, Ph.D. Profesora Ingeniería de Sistemas Grupo de Investigación MIDAS Error de clasificación Algoritmo de aprendizaje h Entrenamiento DATOS Evaluación

Más detalles

Análisis de Datos. Validación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Validación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Validación de clasificadores Profesor: Dr. Wilfrido Gómez Flores 1 Introducción La mayoría de los clasificadores que se han visto requieren de uno o más parámetros definidos libremente,

Más detalles

Reconocimiento de Patrones

Reconocimiento de Patrones Reconocimiento de Patrones Técnicas de validación (Clasificación Supervisada) Jesús Ariel Carrasco Ochoa Instituto Nacional de Astrofísica, Óptica y Electrónica Clasificación Supervisada Para qué evaluar

Más detalles

Precisión del Modelo

Precisión del Modelo Precisión del Modelo Gráficas, estadística y minería de datos con python Miguel Cárdenas Montes Centro de Investigaciones Energéticas Medioambientales y Tecnológicas, Madrid, Spain miguel.cardenas@ciemat.es

Más detalles

Complementos de aprendizaje automático

Complementos de aprendizaje automático Complementos de aprendizaje automático David Soĺıs Martín Dpto. Ciencias de la Computación e Inteligencia Artificial Ampliación de Inteligencia Artificial, 2016-2017 Índice Introducción Métricas Validación

Más detalles

Clasificación de documentos

Clasificación de documentos Minería de Datos Web P r o f. D r. M a r c e l o G. A r m e n t a n o I S I S TA N, F a c. d e C s. E x a c t a s, U N I C E N m a r c e l o. a r m e n t a n o @ i s i s t a n. u n i c e n. e d u. a r

Más detalles

Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA. Ricardo Aler Mur

Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA. Ricardo Aler Mur Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA Ricardo Aler Mur CLASIFICACIÓN CON COSTES Y MUESTRAS DESBALANCEADAS R I C A R D O A L E R M U R Organización Evaluación Sensible

Más detalles

Aprendizaje Automático Segundo Cuatrimestre de Evaluación de Hipótesis

Aprendizaje Automático Segundo Cuatrimestre de Evaluación de Hipótesis Aprendizaje Automático Segundo Cuatrimestre de 2015 Evaluación de Hipótesis Aproximación de Funciones Marco del problema: Conjunto de instancias posibles X Función objetivo desconocida f: X Y Conjunto

Más detalles

Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA. Ricardo Aler Mur

Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA. Ricardo Aler Mur Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA Ricardo Aler Mur EVALUACIÓN Evaluación: entrenamiento y test Una vez obtenido el conocimiento es necesario validarlo para

Más detalles

Clasificación de estados cerebralesusando neuroimágenes funcionales

Clasificación de estados cerebralesusando neuroimágenes funcionales Clasificación de estados cerebralesusando neuroimágenes funcionales Clase 2: Reconocimiento de patrones en datos de neuroimagenes Enzo Tagliazucchi (tagliazucchi.enzo@googlemail.com) Primera clase: introducción

Más detalles

Evaluación de Hipótesis

Evaluación de Hipótesis Aprendizaje Automático Segundo Cuatrimestre de 2016 Evaluación de Hipótesis Aproximación de Funciones Marco del problema: Conjunto de instancias posibles X Función objetivo desconocida f: X Y Conjunto

Más detalles

ANÁLISIS DE DATOS. Jesús García Herrero

ANÁLISIS DE DATOS. Jesús García Herrero ANÁLISIS DE DATOS Jesús García Herrero ANALISIS DE DATOS EJERCICIOS Una empresa de seguros de automóviles quiere utilizar los datos sobre sus clientes para obtener reglas útiles que permita clasificar

Más detalles

Tema 2: Introducción a scikit-learn

Tema 2: Introducción a scikit-learn Tema 2: Introducción a scikit-learn José Luis Ruiz Reina Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla Razonamiento asistido por computador, 2017-18 Ejemplo:

Más detalles

Introducción al Procesamiento de Lenguaje Natural. Grupo de PLN - InCo

Introducción al Procesamiento de Lenguaje Natural. Grupo de PLN - InCo Introducción al Procesamiento de Lenguaje Natural Grupo de PLN - InCo Clasificación Clasificación Dado un objeto y un conjunto de clases, quiero saber a qué clase pertenece el objeto. Muchas tareas de

Más detalles

INTRODUCTION TO MACHINE LEARNING ISABELLE GUYON

INTRODUCTION TO MACHINE LEARNING ISABELLE GUYON INTRODUCTION TO MACHINE LEARNING ISABELLE GUYON 2008-02-31 Notas tomadas por: María Eugenia Rojas Qué es Machine Learning? El proceso de aprendizaje de maquina consiste en tener una gran base de datos

Más detalles

Macro para evaluación de modelos con variables de respuesta dicotómicas con fines de priorización.

Macro para evaluación de modelos con variables de respuesta dicotómicas con fines de priorización. Macro para evaluación de modelos con variables de respuesta dicotómicas con fines de priorización. 21-Ago-2014 Introducción Uno de los principales problemas en la construcción de modelos con variables

Más detalles

Máquinas de vectores soporte con R

Máquinas de vectores soporte con R Máquinas de vectores soporte con R Datos Cargamos la librería en la que se encuentran las funciones que vamos a utilizar y el fichero con los datos necesarios: library(mass) library(e1071) load(url('http://www.uam.es/joser.berrendero/datos/practica-svm-io.rdata'))

Más detalles

Tema 5: Evaluación de Modelos de Clasificación Supervisada p. 1/2

Tema 5: Evaluación de Modelos de Clasificación Supervisada p. 1/2 Tema 5: Evaluación de odelos de lasificación Supervisada Pedro Larrañaga, Iñaki Inza, Abdelmalik oujahid Departamento de iencias de la omputación e Inteligencia Artificial Universidad del País Vasco http://www.sc.ehu.es/isg/

Más detalles

Aprendizaje: Boosting y Adaboost

Aprendizaje: Boosting y Adaboost Técnicas de Inteligencia Artificial Aprendizaje: Boosting y Adaboost Boosting 1 Indice Combinando clasificadores débiles Clasificadores débiles La necesidad de combinar clasificadores Bagging El algoritmo

Más detalles

Análisis de Datos. Combinación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Combinación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Combinación de clasificadores Profesor: Dr. Wilfrido Gómez Flores 1 Introducción Diversos algoritmos de clasificación están limitados a resolver problemas binarios, es decir, con dos

Más detalles

Minería de datos. Unidad 2. El proceso KDD Evaluación, difusión y uso. M en I Sara Vera Noguez

Minería de datos. Unidad 2. El proceso KDD Evaluación, difusión y uso. M en I Sara Vera Noguez Minería de datos Unidad 2. El proceso KDD Evaluación, difusión y uso M en I Sara Vera Noguez El proceso KDD Hernández, 2008 p.20 La parte iterativa Una vez obtenido el modelo se debe evaluar Si satisface

Más detalles

Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Introducción al aprendizaje supervisado Profesor: Dr. Wilfrido Gómez Flores 1 Conceptos básicos Desde la antigüedad, el problema de buscar patrones en datos es fundamental en diversas

Más detalles

Sistemas de Percepción Visión por Computador

Sistemas de Percepción Visión por Computador Nota: Algunas de las imágenes que aparecen en esta presentación provienen del libro: Visión por Computador: fundamentos y métodos. Arturo de la Escalera Hueso. Prentice Hall. Sistemas de Percepción Visión

Más detalles

Apéndice A: Matrices de confusión y resultados de precisión, exhaustividad y medida F

Apéndice A: Matrices de confusión y resultados de precisión, exhaustividad y medida F Apéndices 77 Apéndice A: Matrices de confusión y resultados de precisión, exhaustividad y medida F En este apéndice se presentan seis tablas con otros resultados obtenidos. En cada una de las primeras

Más detalles

Evaluación de Modelos (II) Carlos Hurtado L. Departamento de Ciencias de la Computación, U de Chile

Evaluación de Modelos (II) Carlos Hurtado L. Departamento de Ciencias de la Computación, U de Chile Evaluación de Modelos (II) Carlos Hurtado L. Departamento de Ciencias de la Computación, U de Chile Comparación de Modelos Podemos estimar el error de cada modelo y rankear. Una alternativa más sólida

Más detalles

II. 2. Análisis manual de imágenes médicas: Análisis de la curva ROC (Receiver Operating Characteristic).

II. 2. Análisis manual de imágenes médicas: Análisis de la curva ROC (Receiver Operating Characteristic). II. 2. Análisis manual de imágenes médicas: Análisis de la curva ROC (Receiver Operating Characteristic). Psicofísica: calidad física de una imagen médica y calidad del diagnóstico El análisis de la curva

Más detalles

VIII Jornadas de Usuarios de R

VIII Jornadas de Usuarios de R VIII Jornadas de Usuarios de R Análisis del Abandono en el Sector Bancario Predicción del abandono de clientes Albacete, 17 de Noviembre de 2016 I. INDICE : Modelo Abandonos I. COMPRENSIÓN DEL NEGOCIO

Más detalles

Comparación de dos métodos de aprendizaje sobre el mismo problema

Comparación de dos métodos de aprendizaje sobre el mismo problema Comparación de dos métodos de aprendizaje sobre el mismo problema Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid Contenido 1. Motivación 2.

Más detalles

EVALUACIÓN EN APRENDIZAJE. Eduardo Morales y Jesús González

EVALUACIÓN EN APRENDIZAJE. Eduardo Morales y Jesús González EVALUACIÓN EN APRENDIZAJE Eduardo Morales y Jesús González Significancia Estadística 2 En estadística, se dice que un resultado es estadísticamente significante, cuando no es posible que se presente por

Más detalles

Examen Parcial. Attr1: A, B Attr2: A, B, C Attr3 1, 2, 3 Attr4; a, b Attr5: 1, 2, 3, 4

Examen Parcial. Attr1: A, B Attr2: A, B, C Attr3 1, 2, 3 Attr4; a, b Attr5: 1, 2, 3, 4 Aprenentatge 0-03 Q Examen Parcial Nombre: (Examen ) Instrucciones. (0 puntos) Este examen dura horas. Responded todas las preguntas en estas hojas. Para las preguntas test poned un circulo alrededor de

Más detalles

Validación Cruzada (cross-validation) y Remuestreo (bootstrapping)

Validación Cruzada (cross-validation) y Remuestreo (bootstrapping) Validación Cruzada (cross-validation) y Remuestreo (bootstrapping) Padres de cross-validation y el bootstrapping Bradley Efron y Rob Tibshirani Bradley Efron Rob Tibshirani Enfoque: tabla de aprendizaje

Más detalles

ANÁLISIS DE DATOS. Ricardo Aler Mur

ANÁLISIS DE DATOS. Ricardo Aler Mur ANÁLISIS DE DATOS Ricardo Aler Mur EXAMEN DE ANÁLISIS DE DATOS GRADO EN INFORMÁTICA ENERO 2014 10 puntos, 1 hora y media de duración. Responder cada pregunta con respuestas breves (unas pocas líneas).

Más detalles

Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Introducción al aprendizaje supervisado Profesor: Dr. Wilfrido Gómez Flores 1 Conceptos básicos Reconocimiento de patrones (RP): clasificar objetos en un número de categorías o clases.

Más detalles

Aplicaciones de apoyo al diagnóstico médico. Identificación de objetos amigos y enemigos. Identificación de zonas afectadas por un desastre natural.

Aplicaciones de apoyo al diagnóstico médico. Identificación de objetos amigos y enemigos. Identificación de zonas afectadas por un desastre natural. Capítulo 5 Evaluación En muchas ocasiones requerimos hacer una evaluación muy precisa de nuestros algoritmos de aprendizaje computacional porque los vamos a utilizar en algún tipo de aplicación que así

Más detalles

Aprendizaje Automatizado

Aprendizaje Automatizado Aprendizaje Automatizado Aprendizaje Automatizado Programas que mejoran su comportamiento con la experiencia. Dos formas de adquirir experiencia: A partir de ejemplos suministrados por un usuario (un conjunto

Más detalles

Introducción Aprendizaje de Máquina. Gerardo Gutiérrez Gutiérrez Alexis Rodríguez Gutiérrez

Introducción Aprendizaje de Máquina. Gerardo Gutiérrez Gutiérrez Alexis Rodríguez Gutiérrez Introducción Aprendizaje de Máquina Gerardo Gutiérrez Gutiérrez Alexis Rodríguez Gutiérrez Qué es Aprendizaje de Máquina? "Field of study that gives computers the ability to learn without being explicitly

Más detalles

Introducción a los sistemas Multiclasificadores. Carlos J. Alonso González Departamento de Informática Universidad de Valladolid

Introducción a los sistemas Multiclasificadores. Carlos J. Alonso González Departamento de Informática Universidad de Valladolid Introducción a los sistemas Multiclasificadores Carlos J. Alonso González Departamento de Informática Universidad de Valladolid Contenido 1. Combinación de modelos 2. Descomposición bias-varianza 3. Bagging

Más detalles

Técnicas Multivariadas Avanzadas

Técnicas Multivariadas Avanzadas Métodos de remuestreo Universidad Nacional Agraria La Molina 2014-2 Error de entrenamiento y prueba Estimación del error de predicción Los métodos de remuestreo constituyen una herramienta importante e

Más detalles

Aprendizaje inductivo

Aprendizaje inductivo Inteligencia Artificial Aprendizaje inductivo Ing. Sup. en Informática, 4º Curso académico: 2011/2012 Profesores: Ramón Hermoso y Matteo Vasirani Aprendizaje Resumen: 3. Aprendizaje automático 3.1 Introducción

Más detalles

III JORNADAS DE DATA MINING

III JORNADAS DE DATA MINING III JORNADAS DE DATA MINING EN EL MARCO DE LA MAESTRÍA EN DATA MINING DE LA UNIVERSIDAD AUSTRAL VISIÓN DE MODELOS PREDICTIVOS COMO RANKEADORES Gustavo Denicolay, Socio Gerente Adaptive, Profesor Maestría

Más detalles

Methods of Classification in Mining of Meteorological Data

Methods of Classification in Mining of Meteorological Data MÉTODOS DE CLASIFICACIÓN EN MINERÍA DE DATOS METEOROLÓGICOS Methods of Classification in Mining of Meteorological Data 1 Silvia Haro Rivera*, 1 Lourdes Zúñiga Lema, 2 Antonio Meneses Freire, 1 Luis Vera

Más detalles

Métodos de Remuestreo en Aprendizaje Automático

Métodos de Remuestreo en Aprendizaje Automático Métodos de Remuestreo en Aprendizaje Automático en datos, en hipótesis, y algunos otros trucos: Cross-validation, Bootstrap, Bagging, Boosting, Random Subspaces Lo que sabemos hasta ahora: Hemos visto

Más detalles

Aprendizaje Automático

Aprendizaje Automático id3 id3 como búsqueda Cuestiones Adicionales Regresión Lineal. Árboles y Reglas de Regresión Ingeniería Informática Fernando Fernández Rebollo y Daniel Borrajo Millán Grupo de Planificación y Aprendizaje

Más detalles

Análisis de datos avanzados en la industria. Ibon B. Salbidegoiia. Meteo for Energy BigDa Soluions

Análisis de datos avanzados en la industria. Ibon B. Salbidegoiia. Meteo for Energy BigDa Soluions Análisis de datos avanzados Ibon B. Salbidegoiia Meteo for Energy BigDa Soluions 1 2 Análisis de datos 3 Análisis de datos 4 5 Business intelligence Business intelligence son las técnicas y herramientas

Más detalles

Aprendizaje para Clasificación con Factorización Matricial Basado en Listwise para Filtrado Colaborativo

Aprendizaje para Clasificación con Factorización Matricial Basado en Listwise para Filtrado Colaborativo 2012 Aprendizaje para Clasificación con Factorización Matricial Basado en Listwise para Filtrado Colaborativo Iván López Espejo 22/04/2012 2 Aprendizaje para Clasificación con Factorización Matricial Basado

Más detalles

Conjuntos de Clasificadores (Ensemble Learning)

Conjuntos de Clasificadores (Ensemble Learning) Aprendizaje Automático Segundo Cuatrimestre de 2016 Conjuntos de Clasificadores (Ensemble Learning) Gracias a Ramiro Gálvez por la ayuda y los materiales para esta clase. Bibliografía: S. Fortmann-Roe,

Más detalles

Evaluación, validación y sobre-ajuste

Evaluación, validación y sobre-ajuste Evaluación, validación y sobre-ajuste Eduardo Morales, Hugo Jair Escalante Coordinación Ciencias Computacionales Instituto Nacional Astrofísica, Óptica y Electrónica Agosto, 2015 (INAOE) Agosto, 2015 1

Más detalles

Inteligencia Artificial II (Curso ) Ejercicios propuestos del tema 5

Inteligencia Artificial II (Curso ) Ejercicios propuestos del tema 5 Inteligencia Artificial II (Curso 0-0) Ejercicios propuestos del tema Ejercicio : Diseñar un perceptrón simple con n valores de entrada y función umbral de activación que sirva para calcular la función

Más detalles

Técnicas Multivariadas Avanzadas

Técnicas Multivariadas Avanzadas Métodos basados en árboles Universidad Nacional Agraria La Molina 2014-2 Introducción Introducción Se describen métodos basados en árboles para regresión y clasicación. Estos métodos requieren estraticar

Más detalles

RECONOCIMIENTO DE PAUTAS

RECONOCIMIENTO DE PAUTAS RECONOCIMIENTO DE PAUTAS ANÁLISIS DISCRIMINANTE (Discriminant analysis) Reconocimiento de pautas supervisado si se cuenta con objetos cuya pertenencia a un grupo es conocida métodos: análisis de discriminantes

Más detalles

Introducción al Procesamiento del Habla

Introducción al Procesamiento del Habla Escuela de Verano RIO 2016 Departamento de Computación, FCEFQyN Universidad Nacional de Río Cuarto Introducción al Procesamiento del Habla Prof. Agustín Gravano Departamento de Computación, FCEyN Universidad

Más detalles

Tema 15: Combinación de clasificadores

Tema 15: Combinación de clasificadores Tema 15: Combinación de clasificadores p. 1/21 Tema 15: Combinación de clasificadores Abdelmalik Moujahid, Iñaki Inza, Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial

Más detalles

Aprendizaje Automatizado

Aprendizaje Automatizado Aprendizaje Automatizado Aprendizaje Automatizado Programas que mejoran su comportamiento con la experiencia. Dos formas de adquirir experiencia: A partir de ejemplos suministrados por un usuario (un conjunto

Más detalles

Inteligencia Artificial: Su uso para la investigación

Inteligencia Artificial: Su uso para la investigación Inteligencia Artificial: Su uso para la investigación Dra. Helena Montserrat Gómez Adorno Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas helena.adorno@iimas.unam.mx 1 Introducción

Más detalles

Estadística con R. Clasificadores

Estadística con R. Clasificadores Estadística con R Clasificadores Análisis discriminante lineal (estadístico) Árbol de decisión (aprendizaje automático) Máquina soporte vector (aprendizaje automático) Análisis discriminante lineal (AD)

Más detalles

Aprendizaje Supervisado Máquinas Vectoriales de Soporte

Aprendizaje Supervisado Máquinas Vectoriales de Soporte Aprendizaje Supervisado Máquinas Vectoriales de Soporte Tipos de Variables 10 10 Modelo general de los métodos de Clasificación Id Reembolso Estado Civil Ingresos Anuales 1 Sí Soltero 125K No 2 No Casado

Más detalles

Evaluación de Técnicas de Minería de Datos para la Predicción del Rendimiento Académico

Evaluación de Técnicas de Minería de Datos para la Predicción del Rendimiento Académico Evaluación de Técnicas de Minería de Datos para la Predicción del Rendimiento Académico Leticia Laura Ochoa, Mg 1, Karina Rosas Paredes, Mg 2, César Baluarte Araya, Dr 1 1 Universidad Nacional de San Agustín,

Más detalles

FUNDAMENTOS Y APLICACIONES DE APRENDIZAJE AUTOMÁTICO

FUNDAMENTOS Y APLICACIONES DE APRENDIZAJE AUTOMÁTICO FUNDAMENTOS Y APLICACIONES DE APRENDIZAJE AUTOMÁTICO Año 2016 Carrera/ Plan: Licenciatura en Informática Plan 2015 Licenciatura en Sistemas Plan 2015 Licenciatura en Informática Plan 2003-07/Plan 2012

Más detalles

Proyecto Elvira. Clasificadores En Elvira (definición y validación) Francisco Javier García Castellano

Proyecto Elvira. Clasificadores En Elvira (definición y validación) Francisco Javier García Castellano Proyecto Elvira Clasificadores En Elvira (definición y validación) Francisco Javier García Castellano fjgc@decsai.ugr.es Uncertainty Treatment in Artificial Intelligence Research Group Department of Computer

Más detalles

Uso de Algoritmos de Machine Learning en la Construcción de Mapas de Pobreza: Venezuela Omar Zambrano

Uso de Algoritmos de Machine Learning en la Construcción de Mapas de Pobreza: Venezuela Omar Zambrano Uso de Algoritmos de Machine Learning en la Construcción de Mapas de Pobreza: Venezuela 2012-2016 Omar Zambrano Taller regional sobre desagregación de estadísticas sociales mediante metodologías de estimación

Más detalles

Metodología Experimental

Metodología Experimental Doctorado en Informática Métodos y Técnicas de Minería de Datos Metodología Experimental Juan José Rodríguez Diez jjrodriguez@ubu.es Cuestiones Qué medimos. En principio, tasa de acierto/error. Qué experimentos

Más detalles

Modelos de Churn Bancarios con R Trabajo Final de la Maestría en Data Mining

Modelos de Churn Bancarios con R Trabajo Final de la Maestría en Data Mining Modelos de Churn Bancarios con R Trabajo Final de la Maestría en Data Mining Presentado por Diego Ariel Oppenheim Director Martin Volpacchio Fecha: 31/7/2017 Objetivos del trabajo final Entender la situación

Más detalles

Mejoras a algoritmos genéticos. Inteligencia Computacional Blanca A. Vargas Govea Sep 25, 2012

Mejoras a algoritmos genéticos. Inteligencia Computacional Blanca A. Vargas Govea Sep 25, 2012 Mejoras a algoritmos genéticos Inteligencia Computacional Blanca A. Vargas Govea vargasgovea@itesm.mx Sep 25, 2012 Conocer las mejoras usuales a algoritmos genéticos 2 1. Diseñar una representación 2.

Más detalles

Overfit, cross validation y bootstrap

Overfit, cross validation y bootstrap Universisad de San Andrés y CONICET Cueestiones preliminares Sea z n una sucesion de variables aleatorias escalares. Consideremos la siguiente sucesion z n = n i=1 z i n Ley de grandes numeros (Kolmogorov):

Más detalles

Capítulo 5. Conclusiones

Capítulo 5. Conclusiones Capítulo 5 Conclusiones En este trabajo se desarrolló un sistema capaz de clasificar enunciados dependiendo de la opinión que cada uno expresa acerca de una película. Se cumplió entonces con el objetivo

Más detalles

Científico de datos o data scientist

Científico de datos o data scientist Científico de datos o data scientist La demanda de científicos de datos se ha incrementado de manera constante en los últimos años, existe en el mercado una amplia oferta para los científicos de datos.

Más detalles

Perceptrón Simple. Aspectos Prácticos y Algoritmos Redes Neuronales, DC-FCEyN-UBA. Rosana Matuk Primer Cuatrimestre 2018

Perceptrón Simple. Aspectos Prácticos y Algoritmos Redes Neuronales, DC-FCEyN-UBA. Rosana Matuk Primer Cuatrimestre 2018 Perceptrón Simple Aspectos Prácticos y Algoritmos Redes Neuronales, DC-FCEyN-UBA Rosana Matuk Primer Cuatrimestre 2018 Rosana Matuk (DC-FCEyN-UBA) Perceptrón simple Primer Cuatrimestre 2018 1 / 29 Objetivo

Más detalles

Proyecto Final - Reconocimiento de Patrones

Proyecto Final - Reconocimiento de Patrones Proyecto Final - Reconocimiento de Patrones Salim Perchy Maestría en Ingeniería Énfasis en Computación Pontificia Universidad Javeriana Cali, Valle del Cauca Email: ysperchy@cic.javerianacali.edu.co Mario

Más detalles

Análisis Estadístico de Datos Climáticos. Verificación y valor de los pronósticos

Análisis Estadístico de Datos Climáticos. Verificación y valor de los pronósticos Análisis Estadístico de Datos Climáticos Verificación y valor de los pronósticos A. Díaz M. Bidegain - M. Barreiro Facultad de Ciencias Facultad de Ingeniería 2011 Verificación de pronósticos Una definición:

Más detalles

MASTER DE INGENIERÍA BIOMÉDICA. Métodos de ayuda al diagnóstico clínico. Tema 6: Árboles de decisión.

MASTER DE INGENIERÍA BIOMÉDICA. Métodos de ayuda al diagnóstico clínico. Tema 6: Árboles de decisión. MASTER DE INGENIERÍA BIOMÉDICA. Métodos de ayuda al diagnóstico clínico. Tema 6: Árboles de decisión. 1 Objetivos del tema Conocer en qué consiste un árbol de decisión. Aprender los problemas que pueden

Más detalles

Introducción. Qué es Machine Learning?

Introducción. Qué es Machine Learning? Introducción Qué es Machine Learning? Introducción Hay problemas en Informática que se pueden definir concretamente y son simples de convertir en un algoritmo Ejemplo: Ordenar alfabéticamente una lista,

Más detalles

Jone Echazarra Tecanalia. Más allá del ojo humano: detección precoz del mildiu

Jone Echazarra Tecanalia. Más allá del ojo humano: detección precoz del mildiu Jone Echazarra Tecanalia Más allá del ojo humano: detección precoz del mildiu INDICE 1) Grupo de computer vision Tecnalia, antecedentes, experiencia previa 2) Breve descripción de las tecnologías que se

Más detalles

APRENDIZAJE PROBABILÍSTICO NAIVE BAYES

APRENDIZAJE PROBABILÍSTICO NAIVE BAYES 1 APRENDIZAJE PROBABILÍSTICO NAIVE BAYES Bases de Datos Masivas 9 de Noviembre de 2016 2 Razonamiento Probabilístico Es una herramienta de aprendizaje estadístico. Se trata de razonar en un contexto incierto;

Más detalles

Julio Deride Silva. 4 de junio de 2010

Julio Deride Silva. 4 de junio de 2010 Curvas ROC y Regresión Lineal Julio Deride Silva Área de Matemática Facultad de Ciencias Químicas y Farmcéuticas Universidad de Chile 4 de junio de 2010 Tabla de Contenidos Curvas ROC y Regresión Lineal

Más detalles

CAPÍTULO 8 SIMULACIÓN DE ESCENARIOS

CAPÍTULO 8 SIMULACIÓN DE ESCENARIOS CAPÍTULO 8 SIMULACIÓN DE ESCENARIOS Simulación es el proceso de diseñar y desarrollar un modelo computarizado de un sistema o proceso y conducir experimentos con este modelo con el propósito de entender

Más detalles

Estudio de rampas de producción eólica.

Estudio de rampas de producción eólica. IIC 2012 7 de junio de 2013 Estudio de rampas de producción eólica. Índice Estado del arte. Definición de rampa. Modelos propuestos. Primeros resultados. Problema a resolver. Metodología de evaluación.

Más detalles

Posibles trabajos HIA

Posibles trabajos HIA Posibles trabajos HIA Posibles trabajos Comparar otras herramientas de Minería de Datos con Weka Estudiar la influencia del ruido en bagging y boosting Estudiar la influencia del parámetro de poda en J48

Más detalles

Análisis Estadístico de Datos Climáticos. Verificación y valor de los pronósticos (Wilks, Cap. 7) Facultad de Ciencias Facultad de Ingeniería 2013

Análisis Estadístico de Datos Climáticos. Verificación y valor de los pronósticos (Wilks, Cap. 7) Facultad de Ciencias Facultad de Ingeniería 2013 Análisis Estadístico de Datos Climáticos Verificación y valor de los pronósticos (Wilks, Cap. 7) Facultad de Ciencias Facultad de Ingeniería 2013 Verificación de pronósticos Una definición: La verificación

Más detalles

Lingüística computacional

Lingüística computacional Lingüística computacional Definición y alcance Escuela Nacional de Antropología e Historia (ENAH) Agosto diciembre de 2015 Lingüística Ciencias de la computación Lingüística computacional Estudio del lenguaje

Más detalles

Tópicos Selectos en Aprendizaje Maquinal. Clasificación y Regresión con Datos Reales

Tópicos Selectos en Aprendizaje Maquinal. Clasificación y Regresión con Datos Reales Tópicos Selectos en Aprendizaje Maquinal Guía de Trabajos Prácticos N 2 Clasificación y Regresión con Datos Reales 18 de septiembre de 2014 1. Objetivos Introducir conceptos básicos de aprendizaje automático.

Más detalles

Análisis de Datos. Clasificación Bayesiana para distribuciones normales. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Clasificación Bayesiana para distribuciones normales. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Clasificación Bayesiana para distribuciones normales Profesor: Dr. Wilfrido Gómez Flores 1 Funciones discriminantes Una forma útil de representar clasificadores de patrones es a través

Más detalles

Tema 7: Aprendizaje de árboles de decisión

Tema 7: Aprendizaje de árboles de decisión Inteligencia Artificial 2 Curso 2002 03 Tema 7: Aprendizaje de árboles de decisión José A. Alonso Jiménez Miguel A. Gutiérrez Naranjo Francisco J. Martín Mateos José L. Ruiz Reina Dpto. de Ciencias de

Más detalles

Aux 7. Introducción a la Minería de Datos

Aux 7. Introducción a la Minería de Datos Aux 7. Introducción a la Minería de Datos Gastón L Huillier 1,2, Richard Weber 2 glhuilli@dcc.uchile.cl 1 Departamento de Ciencias de la Computación Universidad de Chile 2 Departamento de Ingeniería Industrial

Más detalles

Combinación de Clasificadores

Combinación de Clasificadores Combinación de Clasificadores Parte 1: Métodos de comité, Bagging, Boosting Reconocimiento de Patrones Departamento de Procesamiento de Señales Instituto de Ingeniería Eléctrica Facultad de Ingeniería,

Más detalles

Estadística Multivariada Computacional Introducción al Aprendizaje Automático (parte 1)

Estadística Multivariada Computacional Introducción al Aprendizaje Automático (parte 1) Estadística Multivariada Computacional Introducción al Aprendizaje Automático (parte 1) Mathias Bourel IMERL - Facultad de Ingeniería, Universidad de la República, Uruguay 24 de octubre de 2016 M.Bourel

Más detalles

Índice general. Prefacio...5

Índice general. Prefacio...5 Índice general Prefacio...5 Capítulo 1 Introducción...13 1.1 Introducción...13 1.2 Los datos...19 1.3 Etapas en los procesos de big data...20 1.4 Minería de datos...21 1.5 Estructura de un proyecto de

Más detalles

Predicción basada en vecinos

Predicción basada en vecinos Predicción basada en vecinos Series Temporales Máster en Computación Universitat Politècnica de Catalunya Dra. Alicia Troncoso Lora 1 Contenido Introducción Esquema de predicción directa Predicción basada

Más detalles

Complementación y ampliación de la currícula de la Maestría 2017 Maestría en Generación y Análisis de Información Estadística

Complementación y ampliación de la currícula de la Maestría 2017 Maestría en Generación y Análisis de Información Estadística ampliación de la currícula Maestría en Generación y Análisis de Información Estadística Programa abierto de ampliación de la currícula Maestría en Generación y Análisis de Información Estadística La Maestría

Más detalles

Inteligencia Artificial (Curso ) Grado en Ingeniería Informática - Ingeniería del Software

Inteligencia Artificial (Curso ) Grado en Ingeniería Informática - Ingeniería del Software Inteligencia Artificial (Curso 0-0) Grado en Ingeniería Informática - Ingeniería del Software Redes neuronales Cuestión : Decir si las siguientes afirmaciones son verdaderas o falsas: Si tomamos la función

Más detalles

Relación 7 - Redes neuronales

Relación 7 - Redes neuronales Sistemas Inteligentes 0-0 Relación - Redes neuronales Problemas Ejercicio. Explicar cómo se usaría una red neuronal para obtener un reconocedor de letras escritas a mano. Describir con precisión qué estructura

Más detalles

Linear regression. Exercise 1

Linear regression. Exercise 1 Problem set, spring 2015 Marta Arias Computació i Sistemes Intel.ligents Master MEI (FIB, UPC) Linear regression Exercise 1 En regresión lineal en datos con una variable dependiente, uno trata de encontrar

Más detalles

Tema 4: Aprendizaje de conceptos

Tema 4: Aprendizaje de conceptos Inteligencia Artificial II Curso 2004 2005 Tema 4: Aprendizaje de conceptos José A. Alonso Jiménez Francisco Jesús Martín Mateos José Luis Ruiz Reina Dpto. de Ciencias de la Computación e Inteligencia

Más detalles

TEORIA DE LA DECISION DE BAYES

TEORIA DE LA DECISION DE BAYES TEORIA DE LA DECISION DE BAYES 1 2 PROBABILIDAD A PRIORI 3 4 5 DENSIDAD DE PROBABILIDAD Además de la probabilidad a priori a menudo se tiene información adicional: el valor de la observación x que se va

Más detalles

RESUMEN DE ALGORITMOS PROBABILÍSTICOS

RESUMEN DE ALGORITMOS PROBABILÍSTICOS RESUMEN DE ALGORITMOS PROBABILÍSTICOS En los algoritmos probabilísticos hay ciertas decisiones que se toman al azar bajo condiciones estadísticamente estables como una distribución uniforme. Normalmente

Más detalles

Inducción de Árboles de Decisión ID3, C4.5

Inducción de Árboles de Decisión ID3, C4.5 Inducción de Árboles de Decisión ID3, C4.5 Contenido 1. Representación mediante árboles de decisión. 2. Algoritmo básico: divide y vencerás. 3. Heurística para la selección de atributos. 4. Espacio de

Más detalles

Modelos de Scoring para Riesgo de Crédito

Modelos de Scoring para Riesgo de Crédito Modelos de Scoring para Riesgo de Crédito Los modelos de scoring de riesgo, dentro del proceso de otorgamiento de crédito, están orientados a anticipar comportamiento futuro. Podemos dividirlos en tres

Más detalles

IAAE - Inteligencia Artificial Aplicada a la Ingeniería

IAAE - Inteligencia Artificial Aplicada a la Ingeniería Unidad responsable: Unidad que imparte: Curso: Titulación: Créditos ECTS: 2017 295 - EEBE - Escuela de Ingeniería de Barcelona Este 723 - CS - Departamento de Ciencias de la Computación GRADO EN INGENIERÍA

Más detalles

IAAE - Inteligencia Artificial Aplicada a la Ingeniería

IAAE - Inteligencia Artificial Aplicada a la Ingeniería Unidad responsable: Unidad que imparte: Curso: Titulación: Créditos ECTS: 2017 295 - EEBE - Escuela de Ingeniería de Barcelona Este 723 - CS - Departamento de Ciencias de la Computación GRADO EN INGENIERÍA

Más detalles