Tema 2: Introducción a scikit-learn

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Tema 2: Introducción a scikit-learn"

Transcripción

1 Tema 2: Introducción a scikit-learn José Luis Ruiz Reina Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla Razonamiento asistido por computador,

2 Ejemplo: predicción de precios de pisos Predecir el precio de un piso en función de sus características (número de habitaciones, distancia al centro, renta per cápita del barrio,... ) Datos:

3 Ejemplo: clasificación de la flor de iris Hay tres géneros de la planta de iris (setosa, virgínica y versicolor); se pretende poder clasificarla en función de medidas (anchura y longitud) de su sépalo y pétalo Datos: Iris-setosa Iris-setosa Iris-setosa Iris-versicolor Iris-versicolor Iris-versicolor Iris-virginica Iris-virginica Iris-virginica......

4 Aprendizaje de modelos El objetivo general del Aprendizaje Automático es poder automatizar la toma de decisiones construyendo un modelo general que se aprende a partir de un conjunto de datos Usalmente por modelo entendemos un modelo matemático, que puede ser implementado en un ordenador Supervisado: en los ejemplos conocemos la entrada y la salida Clasificación de correo spam Identificar un código postal a partir de dígitos escritos a mano Detectar actividades fraudulentas con trahetas de crédito Determinar si un tumor es maligno, a partir de una imagen médica No supervisado: sólo conocemos la entrada Identificar temáticas en un conjunto de textos Agrupar clientes por preferencias Detectar accesos irregulares a un sitio web

5 Conjunto de datos Los datos con los que trataremos una estructura vectorial (valores de atributos), y un valor de clasificación (clase) Importante: supondremos que todos los atributos son numéricos Esto no es ninguna limitación en la práctica (los atributos no numéricos se pueden codificar numéricamente) En scikit-learn, los datos se almacenan en arrays de numpy Ejemplos de datos: Vector de píxeles en una imagen médica o en una imagen de un escrito a mano Representación vectorial de un texto Vector de características de un correo electrónico

6 Aprendizaje y ajuste de parámetros El aprendizaje de un modelo suele consistir en una búsqueda de un modelo de entre todos los modelos de una familia. Por ejemplo: Árboles de decisión Pesos en un clasificador lineal Probabilidades de una red bayesiana Hay que buscar un modelo que se ajuste bien al conjunto de entrenamiento pero que no se ajuste demasiado, y sea capaz de generalizar Huir del sobreajuste Sin caer en el infraajuste

7 Aprendizaje y ajuste de parámetros Un método de aprendizaje de un modelo suele tener una serie de hiper-parámetros (o parámetros, por simplificar) que influyen en el proceso de búsqueda y en el grado de generalización delque se dispone. En un proceso de aprendizaje es importante el algoritmo y los modelos que se usen, pero también lo es el encontrar los parámetros adecuados Ajuste de (hiper-)parámetros Para decidir entre un modelo u otro hay que tener una manera de medirlos (evaluación) Conjuntos de prueba Métricas

8 Scikit-Learn Biblioteca con diversas herramientas para machine learning y análisis de datos: Librería python para aprendizaje automático Dependencias con otras librerías: NumPy, SciPy, matplotlib Proporciona: Ejemplos de trabajo Herramientas de tratamiento de datos Modelos de aprendizaje automático Herramientas de evaluación de modelos

9 Ejemplo de datos en scikit-learn: Iris Base de datos sobre flores Iris Setosa, Iris Versicolor, Iris Virginica ampliamente utilizado como caso de estudio en técnicas de clasificación en aprendizaje automático 50 instancias de cada tipo de flor 4 características: longitud y ancho del sépalo; y longitud y ancho del pétalo

10 Iris: carga de datos Disponible como conjunto de datos en scikit-learn: librería datasets from sklearn.datasets import load_iris iris = load_iris() Campos proporcionados: data: Array de datos. Cada componente es un array con las características de una instancia feature_names: Identificación de cada característica target: Valores de clasificación para cada instancia de datos target_names: Identificación de cada valor de clasificación DESCR: Descripción del conjunto de datos

11 Iris: Recogida de datos Ejemplos >>> iris.feature_names [ sepal length (cm), sepal width (cm), petal length (cm), petal width (cm) ] >>> iris.data.shape (150,4) >>> iris.data[0] array([ 5.1, 3.5, 1.4, 0.2]) >>> iris.target_names array([ setosa, versicolor, virginica ], dtype= <U10 ) >>> iris.target.shape (150,) >>> iris.target[0] 0 Cargamos los datos X_iris, y_iris = iris.data, iris.target X_names, y_names = iris.feature_names, iris.target_names

12 Iris: Visualización de los datos Dificultad para visualizar todos los datos: 150 instancias, 4 características Librería python de gráficos de tipo matemático: matplotlib Representación gráfica de los datos con respecto a un par de características from matplotlib import pyplot as plt plt.clf() for tipo,marca,color in zip(range(len(y_names)),"sod","rgb"): plt.scatter(x_iris[:,0][y_iris == tipo], X_iris[:,1][y_iris == tipo], marker=marca,c=color) plt.xlabel("longitud de sépalo") plt.ylabel("anchura de sépalo") plt.show() Selección de filas o columnas: X_iris[:,0], X_iris[:30,1:3] Selección de los elementos de un array que cumplen una propiedad:

13 Iris: Visualización de los datos

14 Iris: Visualización de los datos Representación gráfica de los datos con respecto a un par de características def representacion_grafica(datos,caracteristicas, objetivo,clases,c1,c2): for tipo,marca,color in zip(range(len(clases)),"sod","rgb"): plt.scatter(datos[objetivo == tipo,c1], datos[objetivo == tipo,c2], marker=marca,c=color) plt.xlabel(caracteristicas[c1]) plt.ylabel(caracteristicas[c2]) plt.legend(clases) plt.show() representacion_grafica(iris.data,x_names,y_iris,y_names,0,1)

15 Iris: Visualización de los datos

16 Conjuntos de entrenamiento, validación y prueba Dividir el conjunto de datos Conjunto de entrenamiento: Conjunto de datos que se utilizará para aprender un modelo Conjunto de validación: Conjunto de datos que se utilizará para ajustar los (hiper-)parámetros del modelo Conjunto de prueba: Conjunto de datos que se utilizará para evaluar el rendimiento del modelo finalmente obtenido Hay veces que no nos podemos permitir el lujo de no usar todos los datos para el entrenamiento Validación cruzada

17 Conjuntos de entrenamiento y prueba Separación de datos en scikit-learn: librería cross_validation from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = \ train_test_split(x_iris,y_iris,test_size = 0.25)

18 Normalización de las características La diferencia de escala entre las características puede dar más importancia a algunas de ellas frente a otras En nuestro caso la longitud tiene una escala mayor que la anchura La normalización de las características unifica la escala, de forma que no influya en la relevancia de las características en la clasificación Normalización de los datos en scikit-learn: librería preprocessing Los parámetros del normalizador se ajustan a partir del conjunto de datos de entrada Ejemplo: normalizador estándar que ajusta una muestra de datos para que la media sea cero y la desviación uno

19 Normalización de las características Normalización de los datos en scikit-learn: librería preprocessing El método fit ajusta los parámetros del normalizador a partir de un conjunto de datos El método transform modifica un conjunto de datos con respecto al normalizador, una vez que sus parámetros han sido ajustados from sklearn.preprocessing import StandardScaler normalizador = StandardScaler().fit(X_train) Xn_train = normalizador.transform(x_train)

20 Normalización de las características Normalización de los datos en scikit-learn: librería preprocessing Los parámetros ajustados se almacenan como valores de atributos del normalizador: mean_, std_ >>> normalizador.mean_ array([ , ]) >>> normalizador.std_ array([ , ]) El conjunto de datos resultado tiene media cero y desviación uno >>> np.mean(xn_train) e-16 >>> np.std(xn_train) 1.0

21 Normalización de las características Resultado tras la normalización

22 Primer ejemplo de clasificador en scikit_learn: knn Clasificación directamente a partir de los ejemplos (aprendizaje basado en instancias) Idea: obtener la clasificación de un nuevo ejemplo a a partir de las categorías de los ejemplos más cercanos. Debemos manejar, por tanto, una noción de distancia entre ejemplos. En la mayoría de los casos la distancia usada es la euclídea. Pero se podría usar otra noción de distancia Ejemplo de aplicación: clasificación de documentos

23 El algoritmo k-nn El algoritmo k-nn (de k nearest neighbors ): Dado un conjunto de entrenamiento (vectores numéricos con una categoría asignada) y un ejemplo nuevo Devolver la categoría mayoritaria en los k ejemplos del conjunto de entrenamiento más cercanos al ejemplo que se quiere clasificar

24 Distancias para k-nn Posibles distancias usadas para definir la cercanía : n Euclídea: d 2 (x, y) = i=1 (x i y i ) 2 Manhattan: d 1 (x, y) = n i=1 x i y i En general, Minkowski: d p (x, y) = ( n i=1 (x i y i ) p ) 1/p La euclídea se usa cuando cada dimensión mide propiedades similares y la Mahattan en caso contrario; Normalización: cuando no todas las dimensiones son del mismo orden de magnitud, se suelen normalizan las componentes

25 Algunas observaciones sobre k-nn Elección de k: Usualmente, basándonos en algún conocimiento específico sobre el problema de clasificación También como resultado de pruebas en conjuntos más pequeños (conjuntos de validación) Si la clasificación es binaria, preferiblemente impar, para intentar evitar empates (k =5, por ejemplo) Variante en knn: cada ejemplo de la vecindad no cuenta de la misma manera Por ejemplo, puede ser inversamente proporcional a la distancia al que se quiere clasificar

26 Clasificador knn en scikit-learn Clase KNeighborsClassifier: >>> from sklearn.neighbors import KNeighborsClassifier >>> knn=kneighborsclassifier(n_neighbors=7) Método fit: >>> knn.fit(xn_train,y_train) Método predict: >>> Xn_test = normalizador.transform(x_test) >>> knn.predict(xn_test) array([2, 2, 0, 1, 2, 2, 2, 2, 2, 2, 0, 1, 2, 2, 1, 1, 1, 0, 0, 2, 1, 2, 2,2, 2, 2, 2, 1, 1, 2, 1, 0, 0, 1, 1, 0, 0, 2]) Método score: >>> knn.score(xn_test,y_test)

27 Clasificador knn en scikit-learn Todos los clasificadores en scikit-learn tienen implementados los métodos fit, predict y score (entre otros) fit: ajustar el modelo a un conjunto de datos dado (entrenamiento, aprendizaje) predict: usar el modelo ajustado para predecir la clase de nuevas instancias score: porcentaje de aciertos sobre un conjunto de prueba del que se conoce su clasificación Además, los clasificadores tienen una serie de (hiper)-parámetros que se proporcionan al constructr de la clase. Por ejemplo, algunos parámetros de knn en scikit-learn: Número de vecinos k Distancia usada Peso de cada vecino

28 Uso de cuadernos Jupyter notebooks Entorno interactivo, que permite integrar: Ejecución de código (no solo python) Texto Gráficos Herramienta muy usada para análisis de datos Ver demo en clase...

29 Bibliografía Andreas C. Müller y Sarah Guido Introduction to Machine Learning with Python (O Really, 2017) Capítulos 1 y 2.

Evaluación de modelos

Evaluación de modelos Evaluación de modelos José Luis Ruiz Reina Dpto. Ciencias de la Computación e Inteligencia Artificial Razonamiento Asistido por Computador, 2017-2018 Evaluación de modelos Una de las fases principales

Más detalles

Perceptrón simple y perceptrón multicapa

Perceptrón simple y perceptrón multicapa UNL - FICH - Departamento de Informática - Ingeniería Informática Inteligencia Computacional Guía de trabajos prácticos Perceptrón simple y perceptrón multicapa. Objetivos Aplicar diferentes arquitecturas

Más detalles

Aprendizaje Automatizado

Aprendizaje Automatizado Aprendizaje Automatizado Aprendizaje Automatizado Programas que mejoran su comportamiento con la experiencia. Dos formas de adquirir experiencia: A partir de ejemplos suministrados por un usuario (un conjunto

Más detalles

Aprendizaje Automatizado

Aprendizaje Automatizado Aprendizaje Automatizado Aprendizaje Automatizado Programas que mejoran su comportamiento con la experiencia. Dos formas de adquirir experiencia: A partir de ejemplos suministrados por un usuario (un conjunto

Más detalles

Aprendizaje Supervisado Máquinas Vectoriales de Soporte

Aprendizaje Supervisado Máquinas Vectoriales de Soporte Aprendizaje Supervisado Máquinas Vectoriales de Soporte Tipos de Variables 10 10 Modelo general de los métodos de Clasificación Id Reembolso Estado Civil Ingresos Anuales 1 Sí Soltero 125K No 2 No Casado

Más detalles

Inteligencia Artificial: Su uso para la investigación

Inteligencia Artificial: Su uso para la investigación Inteligencia Artificial: Su uso para la investigación Dra. Helena Montserrat Gómez Adorno Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas [email protected] 1 Introducción

Más detalles

Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Introducción al aprendizaje supervisado Profesor: Dr. Wilfrido Gómez Flores 1 Conceptos básicos Desde la antigüedad, el problema de buscar patrones en datos es fundamental en diversas

Más detalles

Lingüística computacional

Lingüística computacional Lingüística computacional Definición y alcance Escuela Nacional de Antropología e Historia (ENAH) Agosto diciembre de 2015 Lingüística Ciencias de la computación Lingüística computacional Estudio del lenguaje

Más detalles

Tareas de la minería de datos: clasificación. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR

Tareas de la minería de datos: clasificación. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Tareas de la minería de datos: clasificación CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Tareas de la minería de datos: clasificación Clasificación (discriminación) Empareja

Más detalles

CRITERIOS DE SELECCIÓN DE MODELOS

CRITERIOS DE SELECCIÓN DE MODELOS Inteligencia artificial y reconocimiento de patrones CRITERIOS DE SELECCIÓN DE MODELOS 1 Criterios para elegir un modelo Dos decisiones fundamentales: El tipo de modelo (árboles de decisión, redes neuronales,

Más detalles

Tópicos Selectos en Aprendizaje Maquinal. Clasificación y Regresión con Datos Reales

Tópicos Selectos en Aprendizaje Maquinal. Clasificación y Regresión con Datos Reales Tópicos Selectos en Aprendizaje Maquinal Guía de Trabajos Prácticos N 2 Clasificación y Regresión con Datos Reales 18 de septiembre de 2014 1. Objetivos Introducir conceptos básicos de aprendizaje automático.

Más detalles

Seminario-Taller Ciencia de Datos con Python

Seminario-Taller Ciencia de Datos con Python Seminario-Taller Ciencia de Datos con Python Tutor: El seminario-taller será impartido por el Dr. Oldemar Rodriguez Rojas. El Dr. Rodríguez realizó sus estudios doctorales en la Universidad de París IX

Más detalles

Machine Learning Bases

Machine Learning Bases Machine Learning Bases Programa de Estudio Machine Learning Bases Si te interesa convertirte en un experto en Inteligencia Artificial, en este curso se detallarán los conocimientos imprescindibles para

Más detalles

Ciencia de Datos con Python

Ciencia de Datos con Python Ciencia de Datos con Python Tutor: El curso será impartido por el Dr. Oldemar Rodriguez Rojas. El Dr Rodríguez realizó sus estudios doctorales en la Universidad de París IX Dauphine, Francia y un Posdoctorado

Más detalles

Introducción al Procesamiento de Lenguaje Natural. Grupo de PLN - InCo

Introducción al Procesamiento de Lenguaje Natural. Grupo de PLN - InCo Introducción al Procesamiento de Lenguaje Natural Grupo de PLN - InCo Clasificación Clasificación Dado un objeto y un conjunto de clases, quiero saber a qué clase pertenece el objeto. Muchas tareas de

Más detalles

Aprendizaje Automático

Aprendizaje Automático id3 id3 como búsqueda Cuestiones Adicionales Regresión Lineal. Árboles y Reglas de Regresión Ingeniería Informática Fernando Fernández Rebollo y Daniel Borrajo Millán Grupo de Planificación y Aprendizaje

Más detalles

Clasificación de estados cerebralesusando neuroimágenes funcionales

Clasificación de estados cerebralesusando neuroimágenes funcionales Clasificación de estados cerebralesusando neuroimágenes funcionales Clase 2: Reconocimiento de patrones en datos de neuroimagenes Enzo Tagliazucchi ([email protected]) Primera clase: introducción

Más detalles

Aprendizaje Automatizado. Árboles de Clasificación

Aprendizaje Automatizado. Árboles de Clasificación Aprendizaje Automatizado Árboles de Clasificación Árboles de Clasificación Estudiaremos un algoritmo para la creación del árbol. Selección de atributos comenzando en el nodo raíz. Proceso recursivo. Árboles

Más detalles

Aprendizaje Supervisado Clasificación Bayesiana (Método de Naïve Bayes)

Aprendizaje Supervisado Clasificación Bayesiana (Método de Naïve Bayes) Aprendizaje Supervisado Clasificación Bayesiana (Método de Naïve Bayes) 10 10 Modelo general de los métodos de Clasificación Id Reembolso Estado Civil Ingresos Anuales 1 Sí Soltero 125K No Fraude Algoritmo

Más detalles

Científico de datos o data scientist

Científico de datos o data scientist Científico de datos o data scientist La demanda de científicos de datos se ha incrementado de manera constante en los últimos años, existe en el mercado una amplia oferta para los científicos de datos.

Más detalles

Índice general. Prefacio...5

Índice general. Prefacio...5 Índice general Prefacio...5 Capítulo 1 Introducción...13 1.1 Introducción...13 1.2 Los datos...19 1.3 Etapas en los procesos de big data...20 1.4 Minería de datos...21 1.5 Estructura de un proyecto de

Más detalles

Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Introducción al aprendizaje supervisado Profesor: Dr. Wilfrido Gómez Flores 1 Conceptos básicos Reconocimiento de patrones (RP): clasificar objetos en un número de categorías o clases.

Más detalles

Tareas de la minería de datos: clasificación. PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR

Tareas de la minería de datos: clasificación. PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR Tareas de la minería de datos: clasificación PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR Tareas de la minería de datos: clasificación Clasificación (discriminación) Empareja o asocia datos

Más detalles

Técnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO

Técnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO Técnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO 2 Objetivo El objetivo principal de las técnicas de clasificación supervisada es obtener un modelo clasificatorio válido para permitir tratar

Más detalles

Big Analytics: de la información al conocimiento

Big Analytics: de la información al conocimiento Programa Introducción Arquitectura/Bases de datos relacionados /Infraestructuras (AMAZON) R Introducción al análisis masivo de datos: descriptivos y visualización de Big Data Hackathon + Series Temporales

Más detalles

Aprendizaje Supervisado K - Vecinos más cercanos Knn-Method

Aprendizaje Supervisado K - Vecinos más cercanos Knn-Method Aprendizaje Supervisado K - Vecinos más cercanos Knn-Method 10 10 Modelo general de los métodos de Clasificación Id Reembolso Estado Civil Ingresos Anuales 1 Sí Soltero 125K No 2 No Casado 100K No 3 No

Más detalles

Tópicos Selectos en Aprendizaje Maquinal. Algoritmos para Reconocimiento de Patrones

Tópicos Selectos en Aprendizaje Maquinal. Algoritmos para Reconocimiento de Patrones Tópicos Selectos en Aprendizaje Maquinal Guía de Trabajos Prácticos N 1 (2da. parte) Algoritmos para Reconocimiento de Patrones 20 de Octubre de 2010 1. Objetivos Introducir conceptos básicos de aprendizaje

Más detalles

Jugando a policías y ladrones para detectar anomalías en red con ML. Carmen Torrano Giménez #CyberCamp17

Jugando a policías y ladrones para detectar anomalías en red con ML. Carmen Torrano Giménez #CyberCamp17 Jugando a policías y ladrones para detectar anomalías en red con ML Carmen Torrano Giménez #CyberCamp17 Presentación @ctorranog [email protected] 2 Machine Learning 3 Detección de anomalías 4

Más detalles

INTRODUCTION TO MACHINE LEARNING ISABELLE GUYON

INTRODUCTION TO MACHINE LEARNING ISABELLE GUYON INTRODUCTION TO MACHINE LEARNING ISABELLE GUYON 2008-02-31 Notas tomadas por: María Eugenia Rojas Qué es Machine Learning? El proceso de aprendizaje de maquina consiste en tener una gran base de datos

Más detalles

Machine Learning. Programa de Estudio.

Machine Learning. Programa de Estudio. Machine Learning Programa de Estudio Machine Learning Desarrolla tu perfil técnico en Inteligencia artificial. Introdúcete al mundo de Machine Learning.Comprende los desafíos sociales e industriales que

Más detalles

Introducción Aprendizaje de Máquina. Gerardo Gutiérrez Gutiérrez Alexis Rodríguez Gutiérrez

Introducción Aprendizaje de Máquina. Gerardo Gutiérrez Gutiérrez Alexis Rodríguez Gutiérrez Introducción Aprendizaje de Máquina Gerardo Gutiérrez Gutiérrez Alexis Rodríguez Gutiérrez Qué es Aprendizaje de Máquina? "Field of study that gives computers the ability to learn without being explicitly

Más detalles

Precisión del Modelo

Precisión del Modelo Precisión del Modelo Gráficas, estadística y minería de datos con python Miguel Cárdenas Montes Centro de Investigaciones Energéticas Medioambientales y Tecnológicas, Madrid, Spain [email protected]

Más detalles

Aprendizaje: Boosting y Adaboost

Aprendizaje: Boosting y Adaboost Técnicas de Inteligencia Artificial Aprendizaje: Boosting y Adaboost Boosting 1 Indice Combinando clasificadores débiles Clasificadores débiles La necesidad de combinar clasificadores Bagging El algoritmo

Más detalles

Estadística Multivariada Computacional Introducción al Aprendizaje Automático (parte 1)

Estadística Multivariada Computacional Introducción al Aprendizaje Automático (parte 1) Estadística Multivariada Computacional Introducción al Aprendizaje Automático (parte 1) Mathias Bourel IMERL - Facultad de Ingeniería, Universidad de la República, Uruguay 24 de octubre de 2016 M.Bourel

Más detalles

Perceptrón Simple. Aspectos Prácticos y Algoritmos Redes Neuronales, DC-FCEyN-UBA. Rosana Matuk Primer Cuatrimestre 2018

Perceptrón Simple. Aspectos Prácticos y Algoritmos Redes Neuronales, DC-FCEyN-UBA. Rosana Matuk Primer Cuatrimestre 2018 Perceptrón Simple Aspectos Prácticos y Algoritmos Redes Neuronales, DC-FCEyN-UBA Rosana Matuk Primer Cuatrimestre 2018 Rosana Matuk (DC-FCEyN-UBA) Perceptrón simple Primer Cuatrimestre 2018 1 / 29 Objetivo

Más detalles

Examen Parcial. Attr1: A, B Attr2: A, B, C Attr3 1, 2, 3 Attr4; a, b Attr5: 1, 2, 3, 4

Examen Parcial. Attr1: A, B Attr2: A, B, C Attr3 1, 2, 3 Attr4; a, b Attr5: 1, 2, 3, 4 Aprenentatge 0-03 Q Examen Parcial Nombre: (Examen ) Instrucciones. (0 puntos) Este examen dura horas. Responded todas las preguntas en estas hojas. Para las preguntas test poned un circulo alrededor de

Más detalles

Ricardo Aler Mur CLASIFICADORES KNN-I

Ricardo Aler Mur CLASIFICADORES KNN-I Ricardo Aler Mur CLASIFICADORES KNN-I En esta clase se habla del aprendizaje de modelos de clasificación y regresión basados en instancias o ejemplares. En concreto: Se define la clasificación y regresión

Más detalles

Introducción. Qué es Machine Learning?

Introducción. Qué es Machine Learning? Introducción Qué es Machine Learning? Introducción Hay problemas en Informática que se pueden definir concretamente y son simples de convertir en un algoritmo Ejemplo: Ordenar alfabéticamente una lista,

Más detalles

Complementos de aprendizaje automático

Complementos de aprendizaje automático Complementos de aprendizaje automático David Soĺıs Martín Dpto. Ciencias de la Computación e Inteligencia Artificial Ampliación de Inteligencia Artificial, 2016-2017 Índice Introducción Métricas Validación

Más detalles

Análisis de Datos. Combinación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Combinación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Combinación de clasificadores Profesor: Dr. Wilfrido Gómez Flores 1 Introducción Diversos algoritmos de clasificación están limitados a resolver problemas binarios, es decir, con dos

Más detalles

Tema 7: Aprendizaje de árboles de decisión

Tema 7: Aprendizaje de árboles de decisión Inteligencia Artificial 2 Curso 2002 03 Tema 7: Aprendizaje de árboles de decisión José A. Alonso Jiménez Miguel A. Gutiérrez Naranjo Francisco J. Martín Mateos José L. Ruiz Reina Dpto. de Ciencias de

Más detalles

Introducción a la minería de datos

Introducción a la minería de datos Introducción a la minería de datos 1 Temario Qué es minería de datos? Quién usa minería de datos? Por qué de la minería de datos? Ciclo virtuoso de la minería de datos 2 Definición de minería de datos

Más detalles

ANÁLISIS DE DATOS. Ricardo Aler Mur

ANÁLISIS DE DATOS. Ricardo Aler Mur ANÁLISIS DE DATOS Ricardo Aler Mur EXAMEN DE ANÁLISIS DE DATOS GRADO EN INFORMÁTICA ENERO 2014 10 puntos, 1 hora y media de duración. Responder cada pregunta con respuestas breves (unas pocas líneas).

Más detalles

Aprendizaje Supervisado Árboles de Decisión

Aprendizaje Supervisado Árboles de Decisión Aprendizaje Supervisado Árboles de Decisión 10 10 Modelo general de los métodos de Clasificación Id Reembolso Estado Civil Ingresos Anuales 1 Sí Soltero 125K No 2 No Casado 100K No 3 No Soltero 70K No

Más detalles

SISTEMAS INTELIGENTES

SISTEMAS INTELIGENTES SISTEMAS INTELIGENTES T8: Aprendizaje basado en instancias www.aic.uniovi.es/ssii Índice Aprendizaje basado en instancias Métricas NN Vecino más próximo: Regiones de Voronoi El parámetro K Problemas de

Más detalles

Segmentación de una cartera de clientes usando aprendizaje de máquina

Segmentación de una cartera de clientes usando aprendizaje de máquina Inicio Segmentación de una cartera de clientes usando aprendizaje de máquina Universidad San Ignacio de Loyola I encuentro interdisciplinario de investigación desarrollo y tecnología USIL 2014 Inicio Inicio

Más detalles

Aprendizaje Automático

Aprendizaje Automático Aprendizaje Automático Andrea Mesa 21 de mayo de 2010 Aprendizaje automático Otras denominaciones: machine learning, statistical learning, data mining, inteligencia artificial. Las técnicas de Aprendizaje

Más detalles

Jupyter - Python. Contenido. 1 Sistemas Expertos e Inteligencia Artificial / Guía VII / Ciclo / Ing. Herson Serrano. Objetivos Específicos

Jupyter - Python. Contenido. 1 Sistemas Expertos e Inteligencia Artificial / Guía VII / Ciclo / Ing. Herson Serrano. Objetivos Específicos 1 Sistemas Expertos e Inteligencia Artificial / Guía VII / Ciclo 01 2018 / Ing. Herson Serrano Jupyter - Python Facultad: Ingeniería Escuela: Computación Asignatura: Sistemas Expertos e Inteligencia Artificial

Más detalles

Práctica 5: Clasificación con número variable de ejemplos.

Práctica 5: Clasificación con número variable de ejemplos. 5º INGENIERÍA DE TELECOMUNICACIÓN INTELIGENCIA ARTIFICIAL Y RECONOCIMIENTO DE PATRONES Práctica 5: Clasificación con número variable de ejemplos. Objetivos: Utilización de conjuntos de entrenamiento y

Más detalles

(Reconocimiento de Formas)

(Reconocimiento de Formas) (Reconocimiento de Formas) Guía de Aprendizaje Información al estudiante 1. Datos Descriptivos Asignatura Materia Departamento responsable Reconocimiento de Formas Percepción Computacional y Robótica Inteligencia

Más detalles

Clasificadores Débiles - AdaBoost

Clasificadores Débiles - AdaBoost Capítulo 3 Clasificadores Débiles - AdaBoost El término boosting hace referencia a un tipo de algoritmos cuya finalidad es encontrar una hipótesis fuerte a partir de utilizar hipótesis simples y débiles.

Más detalles

Aprendizaje inductivo

Aprendizaje inductivo Inteligencia Artificial Aprendizaje inductivo Ing. Sup. en Informática, 4º Curso académico: 2011/2012 Profesores: Ramón Hermoso y Matteo Vasirani Aprendizaje Resumen: 3. Aprendizaje automático 3.1 Introducción

Más detalles

Técnicas de aprendizaje sobre series temporales

Técnicas de aprendizaje sobre series temporales Técnicas de aprendizaje sobre series temporales Contenido 1. Motivación. 2. Ejemplo del Problema. 3. Aproximaciones al problema de clasificación de series temporales. 4. Aprendizaje de reglas. 5. Boosting

Más detalles

MÉTODOS AVANZADOS EN APRENDIZAJE ARTIFICIAL: TEORÍA Y APLICACIONES A PROBLEMAS DE PREDICCIÓN

MÉTODOS AVANZADOS EN APRENDIZAJE ARTIFICIAL: TEORÍA Y APLICACIONES A PROBLEMAS DE PREDICCIÓN MÉTODOS AVANZADOS EN APRENDIZAJE ARTIFICIAL: TEORÍA Y APLICACIONES A PROBLEMAS DE PREDICCIÓN Manuel Sánchez-Montañés Luis Lago Ana González Escuela Politécnica Superior Universidad Autónoma de Madrid Teoría

Más detalles

Introducción a los sistemas Multiclasificadores. Carlos J. Alonso González Departamento de Informática Universidad de Valladolid

Introducción a los sistemas Multiclasificadores. Carlos J. Alonso González Departamento de Informática Universidad de Valladolid Introducción a los sistemas Multiclasificadores Carlos J. Alonso González Departamento de Informática Universidad de Valladolid Contenido 1. Combinación de modelos 2. Descomposición bias-varianza 3. Bagging

Más detalles

Redes Neuronales Artificiales El Perceptrón

Redes Neuronales Artificiales El Perceptrón 1 Sistemas Expertos e Inteligencia Artificial / Guía IX / Ciclo 01-2018 Facultad: Ingeniería Escuela: Computación Asignatura: Sistemas Expertos e Inteligencia Artificial Redes Neuronales Artificiales El

Más detalles

Aprendizaje para Clasificación con Factorización Matricial Basado en Listwise para Filtrado Colaborativo

Aprendizaje para Clasificación con Factorización Matricial Basado en Listwise para Filtrado Colaborativo 2012 Aprendizaje para Clasificación con Factorización Matricial Basado en Listwise para Filtrado Colaborativo Iván López Espejo 22/04/2012 2 Aprendizaje para Clasificación con Factorización Matricial Basado

Más detalles

Aprendizaje Automático. Segundo Cuatrimestre de Clasificadores: Naive Bayes, Vecinos Más Cercanos, SVM

Aprendizaje Automático. Segundo Cuatrimestre de Clasificadores: Naive Bayes, Vecinos Más Cercanos, SVM Aprendizaje Automático Segundo Cuatrimestre de 2016 Clasificadores: Naive Bayes, Vecinos Más Cercanos, SVM Naive Bayes Naive Bayes Dada una nueva instancia con valores de atributos a 1, a 2,..., a n, su

Más detalles

Análisis de Datos. Validación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Validación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Validación de clasificadores Profesor: Dr. Wilfrido Gómez Flores 1 Introducción La mayoría de los clasificadores que se han visto requieren de uno o más parámetros definidos libremente,

Más detalles

Buenas prácticas para la implementación de herramientas de Ciencia de Datos Leonardo Alfonso Ramos Corona Facultad de Geografía, UAEM.

Buenas prácticas para la implementación de herramientas de Ciencia de Datos Leonardo Alfonso Ramos Corona Facultad de Geografía, UAEM. Buenas prácticas para la implementación de herramientas de Ciencia de Datos Leonardo Alfonso Ramos Corona Facultad de Geografía, UAEM. Qué es la ciencia de datos? Es muy difícil encontrar una definición

Más detalles

Conjuntos de Clasificadores (Ensemble Learning)

Conjuntos de Clasificadores (Ensemble Learning) Aprendizaje Automático Segundo Cuatrimestre de 2016 Conjuntos de Clasificadores (Ensemble Learning) Gracias a Ramiro Gálvez por la ayuda y los materiales para esta clase. Bibliografía: S. Fortmann-Roe,

Más detalles

Introducción a Minería de Texto. Fabián Latorre

Introducción a Minería de Texto. Fabián Latorre Introducción a Minería de Texto Fabián Latorre [email protected] Contenido Qué es la minería de texto? Por qué es relevante? Por qué la estudiamos? Aplicaciones La complejidad del texto no

Más detalles

Tópicos Selectos en Aprendizaje Maquinal. Algoritmos para Reconocimiento de Patrones

Tópicos Selectos en Aprendizaje Maquinal. Algoritmos para Reconocimiento de Patrones Tópicos Selectos en Aprendizaje Maquinal Guía de Trabajos Prácticos N 1 Algoritmos para Reconocimiento de Patrones 18 de septiembre de 2014 1. Objetivos Introducir conceptos básicos de aprendizaje automático.

Más detalles

ANÁLISIS DE DATOS. Jesús García Herrero

ANÁLISIS DE DATOS. Jesús García Herrero ANÁLISIS DE DATOS Jesús García Herrero ANALISIS DE DATOS EJERCICIOS Una empresa de seguros de automóviles quiere utilizar los datos sobre sus clientes para obtener reglas útiles que permita clasificar

Más detalles

Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA. Ricardo Aler Mur

Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA. Ricardo Aler Mur Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA Ricardo Aler Mur EVALUACIÓN Evaluación: entrenamiento y test Una vez obtenido el conocimiento es necesario validarlo para

Más detalles