Tema 2: Introducción a scikit-learn
|
|
|
- Inmaculada Sofia Saavedra Robles
- hace 7 años
- Vistas:
Transcripción
1 Tema 2: Introducción a scikit-learn José Luis Ruiz Reina Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla Razonamiento asistido por computador,
2 Ejemplo: predicción de precios de pisos Predecir el precio de un piso en función de sus características (número de habitaciones, distancia al centro, renta per cápita del barrio,... ) Datos:
3 Ejemplo: clasificación de la flor de iris Hay tres géneros de la planta de iris (setosa, virgínica y versicolor); se pretende poder clasificarla en función de medidas (anchura y longitud) de su sépalo y pétalo Datos: Iris-setosa Iris-setosa Iris-setosa Iris-versicolor Iris-versicolor Iris-versicolor Iris-virginica Iris-virginica Iris-virginica......
4 Aprendizaje de modelos El objetivo general del Aprendizaje Automático es poder automatizar la toma de decisiones construyendo un modelo general que se aprende a partir de un conjunto de datos Usalmente por modelo entendemos un modelo matemático, que puede ser implementado en un ordenador Supervisado: en los ejemplos conocemos la entrada y la salida Clasificación de correo spam Identificar un código postal a partir de dígitos escritos a mano Detectar actividades fraudulentas con trahetas de crédito Determinar si un tumor es maligno, a partir de una imagen médica No supervisado: sólo conocemos la entrada Identificar temáticas en un conjunto de textos Agrupar clientes por preferencias Detectar accesos irregulares a un sitio web
5 Conjunto de datos Los datos con los que trataremos una estructura vectorial (valores de atributos), y un valor de clasificación (clase) Importante: supondremos que todos los atributos son numéricos Esto no es ninguna limitación en la práctica (los atributos no numéricos se pueden codificar numéricamente) En scikit-learn, los datos se almacenan en arrays de numpy Ejemplos de datos: Vector de píxeles en una imagen médica o en una imagen de un escrito a mano Representación vectorial de un texto Vector de características de un correo electrónico
6 Aprendizaje y ajuste de parámetros El aprendizaje de un modelo suele consistir en una búsqueda de un modelo de entre todos los modelos de una familia. Por ejemplo: Árboles de decisión Pesos en un clasificador lineal Probabilidades de una red bayesiana Hay que buscar un modelo que se ajuste bien al conjunto de entrenamiento pero que no se ajuste demasiado, y sea capaz de generalizar Huir del sobreajuste Sin caer en el infraajuste
7 Aprendizaje y ajuste de parámetros Un método de aprendizaje de un modelo suele tener una serie de hiper-parámetros (o parámetros, por simplificar) que influyen en el proceso de búsqueda y en el grado de generalización delque se dispone. En un proceso de aprendizaje es importante el algoritmo y los modelos que se usen, pero también lo es el encontrar los parámetros adecuados Ajuste de (hiper-)parámetros Para decidir entre un modelo u otro hay que tener una manera de medirlos (evaluación) Conjuntos de prueba Métricas
8 Scikit-Learn Biblioteca con diversas herramientas para machine learning y análisis de datos: Librería python para aprendizaje automático Dependencias con otras librerías: NumPy, SciPy, matplotlib Proporciona: Ejemplos de trabajo Herramientas de tratamiento de datos Modelos de aprendizaje automático Herramientas de evaluación de modelos
9 Ejemplo de datos en scikit-learn: Iris Base de datos sobre flores Iris Setosa, Iris Versicolor, Iris Virginica ampliamente utilizado como caso de estudio en técnicas de clasificación en aprendizaje automático 50 instancias de cada tipo de flor 4 características: longitud y ancho del sépalo; y longitud y ancho del pétalo
10 Iris: carga de datos Disponible como conjunto de datos en scikit-learn: librería datasets from sklearn.datasets import load_iris iris = load_iris() Campos proporcionados: data: Array de datos. Cada componente es un array con las características de una instancia feature_names: Identificación de cada característica target: Valores de clasificación para cada instancia de datos target_names: Identificación de cada valor de clasificación DESCR: Descripción del conjunto de datos
11 Iris: Recogida de datos Ejemplos >>> iris.feature_names [ sepal length (cm), sepal width (cm), petal length (cm), petal width (cm) ] >>> iris.data.shape (150,4) >>> iris.data[0] array([ 5.1, 3.5, 1.4, 0.2]) >>> iris.target_names array([ setosa, versicolor, virginica ], dtype= <U10 ) >>> iris.target.shape (150,) >>> iris.target[0] 0 Cargamos los datos X_iris, y_iris = iris.data, iris.target X_names, y_names = iris.feature_names, iris.target_names
12 Iris: Visualización de los datos Dificultad para visualizar todos los datos: 150 instancias, 4 características Librería python de gráficos de tipo matemático: matplotlib Representación gráfica de los datos con respecto a un par de características from matplotlib import pyplot as plt plt.clf() for tipo,marca,color in zip(range(len(y_names)),"sod","rgb"): plt.scatter(x_iris[:,0][y_iris == tipo], X_iris[:,1][y_iris == tipo], marker=marca,c=color) plt.xlabel("longitud de sépalo") plt.ylabel("anchura de sépalo") plt.show() Selección de filas o columnas: X_iris[:,0], X_iris[:30,1:3] Selección de los elementos de un array que cumplen una propiedad:
13 Iris: Visualización de los datos
14 Iris: Visualización de los datos Representación gráfica de los datos con respecto a un par de características def representacion_grafica(datos,caracteristicas, objetivo,clases,c1,c2): for tipo,marca,color in zip(range(len(clases)),"sod","rgb"): plt.scatter(datos[objetivo == tipo,c1], datos[objetivo == tipo,c2], marker=marca,c=color) plt.xlabel(caracteristicas[c1]) plt.ylabel(caracteristicas[c2]) plt.legend(clases) plt.show() representacion_grafica(iris.data,x_names,y_iris,y_names,0,1)
15 Iris: Visualización de los datos
16 Conjuntos de entrenamiento, validación y prueba Dividir el conjunto de datos Conjunto de entrenamiento: Conjunto de datos que se utilizará para aprender un modelo Conjunto de validación: Conjunto de datos que se utilizará para ajustar los (hiper-)parámetros del modelo Conjunto de prueba: Conjunto de datos que se utilizará para evaluar el rendimiento del modelo finalmente obtenido Hay veces que no nos podemos permitir el lujo de no usar todos los datos para el entrenamiento Validación cruzada
17 Conjuntos de entrenamiento y prueba Separación de datos en scikit-learn: librería cross_validation from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = \ train_test_split(x_iris,y_iris,test_size = 0.25)
18 Normalización de las características La diferencia de escala entre las características puede dar más importancia a algunas de ellas frente a otras En nuestro caso la longitud tiene una escala mayor que la anchura La normalización de las características unifica la escala, de forma que no influya en la relevancia de las características en la clasificación Normalización de los datos en scikit-learn: librería preprocessing Los parámetros del normalizador se ajustan a partir del conjunto de datos de entrada Ejemplo: normalizador estándar que ajusta una muestra de datos para que la media sea cero y la desviación uno
19 Normalización de las características Normalización de los datos en scikit-learn: librería preprocessing El método fit ajusta los parámetros del normalizador a partir de un conjunto de datos El método transform modifica un conjunto de datos con respecto al normalizador, una vez que sus parámetros han sido ajustados from sklearn.preprocessing import StandardScaler normalizador = StandardScaler().fit(X_train) Xn_train = normalizador.transform(x_train)
20 Normalización de las características Normalización de los datos en scikit-learn: librería preprocessing Los parámetros ajustados se almacenan como valores de atributos del normalizador: mean_, std_ >>> normalizador.mean_ array([ , ]) >>> normalizador.std_ array([ , ]) El conjunto de datos resultado tiene media cero y desviación uno >>> np.mean(xn_train) e-16 >>> np.std(xn_train) 1.0
21 Normalización de las características Resultado tras la normalización
22 Primer ejemplo de clasificador en scikit_learn: knn Clasificación directamente a partir de los ejemplos (aprendizaje basado en instancias) Idea: obtener la clasificación de un nuevo ejemplo a a partir de las categorías de los ejemplos más cercanos. Debemos manejar, por tanto, una noción de distancia entre ejemplos. En la mayoría de los casos la distancia usada es la euclídea. Pero se podría usar otra noción de distancia Ejemplo de aplicación: clasificación de documentos
23 El algoritmo k-nn El algoritmo k-nn (de k nearest neighbors ): Dado un conjunto de entrenamiento (vectores numéricos con una categoría asignada) y un ejemplo nuevo Devolver la categoría mayoritaria en los k ejemplos del conjunto de entrenamiento más cercanos al ejemplo que se quiere clasificar
24 Distancias para k-nn Posibles distancias usadas para definir la cercanía : n Euclídea: d 2 (x, y) = i=1 (x i y i ) 2 Manhattan: d 1 (x, y) = n i=1 x i y i En general, Minkowski: d p (x, y) = ( n i=1 (x i y i ) p ) 1/p La euclídea se usa cuando cada dimensión mide propiedades similares y la Mahattan en caso contrario; Normalización: cuando no todas las dimensiones son del mismo orden de magnitud, se suelen normalizan las componentes
25 Algunas observaciones sobre k-nn Elección de k: Usualmente, basándonos en algún conocimiento específico sobre el problema de clasificación También como resultado de pruebas en conjuntos más pequeños (conjuntos de validación) Si la clasificación es binaria, preferiblemente impar, para intentar evitar empates (k =5, por ejemplo) Variante en knn: cada ejemplo de la vecindad no cuenta de la misma manera Por ejemplo, puede ser inversamente proporcional a la distancia al que se quiere clasificar
26 Clasificador knn en scikit-learn Clase KNeighborsClassifier: >>> from sklearn.neighbors import KNeighborsClassifier >>> knn=kneighborsclassifier(n_neighbors=7) Método fit: >>> knn.fit(xn_train,y_train) Método predict: >>> Xn_test = normalizador.transform(x_test) >>> knn.predict(xn_test) array([2, 2, 0, 1, 2, 2, 2, 2, 2, 2, 0, 1, 2, 2, 1, 1, 1, 0, 0, 2, 1, 2, 2,2, 2, 2, 2, 1, 1, 2, 1, 0, 0, 1, 1, 0, 0, 2]) Método score: >>> knn.score(xn_test,y_test)
27 Clasificador knn en scikit-learn Todos los clasificadores en scikit-learn tienen implementados los métodos fit, predict y score (entre otros) fit: ajustar el modelo a un conjunto de datos dado (entrenamiento, aprendizaje) predict: usar el modelo ajustado para predecir la clase de nuevas instancias score: porcentaje de aciertos sobre un conjunto de prueba del que se conoce su clasificación Además, los clasificadores tienen una serie de (hiper)-parámetros que se proporcionan al constructr de la clase. Por ejemplo, algunos parámetros de knn en scikit-learn: Número de vecinos k Distancia usada Peso de cada vecino
28 Uso de cuadernos Jupyter notebooks Entorno interactivo, que permite integrar: Ejecución de código (no solo python) Texto Gráficos Herramienta muy usada para análisis de datos Ver demo en clase...
29 Bibliografía Andreas C. Müller y Sarah Guido Introduction to Machine Learning with Python (O Really, 2017) Capítulos 1 y 2.
Evaluación de modelos
Evaluación de modelos José Luis Ruiz Reina Dpto. Ciencias de la Computación e Inteligencia Artificial Razonamiento Asistido por Computador, 2017-2018 Evaluación de modelos Una de las fases principales
Perceptrón simple y perceptrón multicapa
UNL - FICH - Departamento de Informática - Ingeniería Informática Inteligencia Computacional Guía de trabajos prácticos Perceptrón simple y perceptrón multicapa. Objetivos Aplicar diferentes arquitecturas
Aprendizaje Automatizado
Aprendizaje Automatizado Aprendizaje Automatizado Programas que mejoran su comportamiento con la experiencia. Dos formas de adquirir experiencia: A partir de ejemplos suministrados por un usuario (un conjunto
Aprendizaje Automatizado
Aprendizaje Automatizado Aprendizaje Automatizado Programas que mejoran su comportamiento con la experiencia. Dos formas de adquirir experiencia: A partir de ejemplos suministrados por un usuario (un conjunto
Aprendizaje Supervisado Máquinas Vectoriales de Soporte
Aprendizaje Supervisado Máquinas Vectoriales de Soporte Tipos de Variables 10 10 Modelo general de los métodos de Clasificación Id Reembolso Estado Civil Ingresos Anuales 1 Sí Soltero 125K No 2 No Casado
Inteligencia Artificial: Su uso para la investigación
Inteligencia Artificial: Su uso para la investigación Dra. Helena Montserrat Gómez Adorno Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas [email protected] 1 Introducción
Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores
Análisis de Datos Introducción al aprendizaje supervisado Profesor: Dr. Wilfrido Gómez Flores 1 Conceptos básicos Desde la antigüedad, el problema de buscar patrones en datos es fundamental en diversas
Lingüística computacional
Lingüística computacional Definición y alcance Escuela Nacional de Antropología e Historia (ENAH) Agosto diciembre de 2015 Lingüística Ciencias de la computación Lingüística computacional Estudio del lenguaje
Tareas de la minería de datos: clasificación. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR
Tareas de la minería de datos: clasificación CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Tareas de la minería de datos: clasificación Clasificación (discriminación) Empareja
CRITERIOS DE SELECCIÓN DE MODELOS
Inteligencia artificial y reconocimiento de patrones CRITERIOS DE SELECCIÓN DE MODELOS 1 Criterios para elegir un modelo Dos decisiones fundamentales: El tipo de modelo (árboles de decisión, redes neuronales,
Tópicos Selectos en Aprendizaje Maquinal. Clasificación y Regresión con Datos Reales
Tópicos Selectos en Aprendizaje Maquinal Guía de Trabajos Prácticos N 2 Clasificación y Regresión con Datos Reales 18 de septiembre de 2014 1. Objetivos Introducir conceptos básicos de aprendizaje automático.
Seminario-Taller Ciencia de Datos con Python
Seminario-Taller Ciencia de Datos con Python Tutor: El seminario-taller será impartido por el Dr. Oldemar Rodriguez Rojas. El Dr. Rodríguez realizó sus estudios doctorales en la Universidad de París IX
Machine Learning Bases
Machine Learning Bases Programa de Estudio Machine Learning Bases Si te interesa convertirte en un experto en Inteligencia Artificial, en este curso se detallarán los conocimientos imprescindibles para
Ciencia de Datos con Python
Ciencia de Datos con Python Tutor: El curso será impartido por el Dr. Oldemar Rodriguez Rojas. El Dr Rodríguez realizó sus estudios doctorales en la Universidad de París IX Dauphine, Francia y un Posdoctorado
Introducción al Procesamiento de Lenguaje Natural. Grupo de PLN - InCo
Introducción al Procesamiento de Lenguaje Natural Grupo de PLN - InCo Clasificación Clasificación Dado un objeto y un conjunto de clases, quiero saber a qué clase pertenece el objeto. Muchas tareas de
Aprendizaje Automático
id3 id3 como búsqueda Cuestiones Adicionales Regresión Lineal. Árboles y Reglas de Regresión Ingeniería Informática Fernando Fernández Rebollo y Daniel Borrajo Millán Grupo de Planificación y Aprendizaje
Clasificación de estados cerebralesusando neuroimágenes funcionales
Clasificación de estados cerebralesusando neuroimágenes funcionales Clase 2: Reconocimiento de patrones en datos de neuroimagenes Enzo Tagliazucchi ([email protected]) Primera clase: introducción
Aprendizaje Automatizado. Árboles de Clasificación
Aprendizaje Automatizado Árboles de Clasificación Árboles de Clasificación Estudiaremos un algoritmo para la creación del árbol. Selección de atributos comenzando en el nodo raíz. Proceso recursivo. Árboles
Aprendizaje Supervisado Clasificación Bayesiana (Método de Naïve Bayes)
Aprendizaje Supervisado Clasificación Bayesiana (Método de Naïve Bayes) 10 10 Modelo general de los métodos de Clasificación Id Reembolso Estado Civil Ingresos Anuales 1 Sí Soltero 125K No Fraude Algoritmo
Científico de datos o data scientist
Científico de datos o data scientist La demanda de científicos de datos se ha incrementado de manera constante en los últimos años, existe en el mercado una amplia oferta para los científicos de datos.
Índice general. Prefacio...5
Índice general Prefacio...5 Capítulo 1 Introducción...13 1.1 Introducción...13 1.2 Los datos...19 1.3 Etapas en los procesos de big data...20 1.4 Minería de datos...21 1.5 Estructura de un proyecto de
Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores
Análisis de Datos Introducción al aprendizaje supervisado Profesor: Dr. Wilfrido Gómez Flores 1 Conceptos básicos Reconocimiento de patrones (RP): clasificar objetos en un número de categorías o clases.
Tareas de la minería de datos: clasificación. PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR
Tareas de la minería de datos: clasificación PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR Tareas de la minería de datos: clasificación Clasificación (discriminación) Empareja o asocia datos
Técnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO
Técnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO 2 Objetivo El objetivo principal de las técnicas de clasificación supervisada es obtener un modelo clasificatorio válido para permitir tratar
Big Analytics: de la información al conocimiento
Programa Introducción Arquitectura/Bases de datos relacionados /Infraestructuras (AMAZON) R Introducción al análisis masivo de datos: descriptivos y visualización de Big Data Hackathon + Series Temporales
Aprendizaje Supervisado K - Vecinos más cercanos Knn-Method
Aprendizaje Supervisado K - Vecinos más cercanos Knn-Method 10 10 Modelo general de los métodos de Clasificación Id Reembolso Estado Civil Ingresos Anuales 1 Sí Soltero 125K No 2 No Casado 100K No 3 No
Tópicos Selectos en Aprendizaje Maquinal. Algoritmos para Reconocimiento de Patrones
Tópicos Selectos en Aprendizaje Maquinal Guía de Trabajos Prácticos N 1 (2da. parte) Algoritmos para Reconocimiento de Patrones 20 de Octubre de 2010 1. Objetivos Introducir conceptos básicos de aprendizaje
Jugando a policías y ladrones para detectar anomalías en red con ML. Carmen Torrano Giménez #CyberCamp17
Jugando a policías y ladrones para detectar anomalías en red con ML Carmen Torrano Giménez #CyberCamp17 Presentación @ctorranog [email protected] 2 Machine Learning 3 Detección de anomalías 4
INTRODUCTION TO MACHINE LEARNING ISABELLE GUYON
INTRODUCTION TO MACHINE LEARNING ISABELLE GUYON 2008-02-31 Notas tomadas por: María Eugenia Rojas Qué es Machine Learning? El proceso de aprendizaje de maquina consiste en tener una gran base de datos
Machine Learning. Programa de Estudio.
Machine Learning Programa de Estudio Machine Learning Desarrolla tu perfil técnico en Inteligencia artificial. Introdúcete al mundo de Machine Learning.Comprende los desafíos sociales e industriales que
Introducción Aprendizaje de Máquina. Gerardo Gutiérrez Gutiérrez Alexis Rodríguez Gutiérrez
Introducción Aprendizaje de Máquina Gerardo Gutiérrez Gutiérrez Alexis Rodríguez Gutiérrez Qué es Aprendizaje de Máquina? "Field of study that gives computers the ability to learn without being explicitly
Precisión del Modelo
Precisión del Modelo Gráficas, estadística y minería de datos con python Miguel Cárdenas Montes Centro de Investigaciones Energéticas Medioambientales y Tecnológicas, Madrid, Spain [email protected]
Aprendizaje: Boosting y Adaboost
Técnicas de Inteligencia Artificial Aprendizaje: Boosting y Adaboost Boosting 1 Indice Combinando clasificadores débiles Clasificadores débiles La necesidad de combinar clasificadores Bagging El algoritmo
Estadística Multivariada Computacional Introducción al Aprendizaje Automático (parte 1)
Estadística Multivariada Computacional Introducción al Aprendizaje Automático (parte 1) Mathias Bourel IMERL - Facultad de Ingeniería, Universidad de la República, Uruguay 24 de octubre de 2016 M.Bourel
Perceptrón Simple. Aspectos Prácticos y Algoritmos Redes Neuronales, DC-FCEyN-UBA. Rosana Matuk Primer Cuatrimestre 2018
Perceptrón Simple Aspectos Prácticos y Algoritmos Redes Neuronales, DC-FCEyN-UBA Rosana Matuk Primer Cuatrimestre 2018 Rosana Matuk (DC-FCEyN-UBA) Perceptrón simple Primer Cuatrimestre 2018 1 / 29 Objetivo
Examen Parcial. Attr1: A, B Attr2: A, B, C Attr3 1, 2, 3 Attr4; a, b Attr5: 1, 2, 3, 4
Aprenentatge 0-03 Q Examen Parcial Nombre: (Examen ) Instrucciones. (0 puntos) Este examen dura horas. Responded todas las preguntas en estas hojas. Para las preguntas test poned un circulo alrededor de
Ricardo Aler Mur CLASIFICADORES KNN-I
Ricardo Aler Mur CLASIFICADORES KNN-I En esta clase se habla del aprendizaje de modelos de clasificación y regresión basados en instancias o ejemplares. En concreto: Se define la clasificación y regresión
Introducción. Qué es Machine Learning?
Introducción Qué es Machine Learning? Introducción Hay problemas en Informática que se pueden definir concretamente y son simples de convertir en un algoritmo Ejemplo: Ordenar alfabéticamente una lista,
Complementos de aprendizaje automático
Complementos de aprendizaje automático David Soĺıs Martín Dpto. Ciencias de la Computación e Inteligencia Artificial Ampliación de Inteligencia Artificial, 2016-2017 Índice Introducción Métricas Validación
Análisis de Datos. Combinación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores
Análisis de Datos Combinación de clasificadores Profesor: Dr. Wilfrido Gómez Flores 1 Introducción Diversos algoritmos de clasificación están limitados a resolver problemas binarios, es decir, con dos
Tema 7: Aprendizaje de árboles de decisión
Inteligencia Artificial 2 Curso 2002 03 Tema 7: Aprendizaje de árboles de decisión José A. Alonso Jiménez Miguel A. Gutiérrez Naranjo Francisco J. Martín Mateos José L. Ruiz Reina Dpto. de Ciencias de
Introducción a la minería de datos
Introducción a la minería de datos 1 Temario Qué es minería de datos? Quién usa minería de datos? Por qué de la minería de datos? Ciclo virtuoso de la minería de datos 2 Definición de minería de datos
ANÁLISIS DE DATOS. Ricardo Aler Mur
ANÁLISIS DE DATOS Ricardo Aler Mur EXAMEN DE ANÁLISIS DE DATOS GRADO EN INFORMÁTICA ENERO 2014 10 puntos, 1 hora y media de duración. Responder cada pregunta con respuestas breves (unas pocas líneas).
Aprendizaje Supervisado Árboles de Decisión
Aprendizaje Supervisado Árboles de Decisión 10 10 Modelo general de los métodos de Clasificación Id Reembolso Estado Civil Ingresos Anuales 1 Sí Soltero 125K No 2 No Casado 100K No 3 No Soltero 70K No
SISTEMAS INTELIGENTES
SISTEMAS INTELIGENTES T8: Aprendizaje basado en instancias www.aic.uniovi.es/ssii Índice Aprendizaje basado en instancias Métricas NN Vecino más próximo: Regiones de Voronoi El parámetro K Problemas de
Segmentación de una cartera de clientes usando aprendizaje de máquina
Inicio Segmentación de una cartera de clientes usando aprendizaje de máquina Universidad San Ignacio de Loyola I encuentro interdisciplinario de investigación desarrollo y tecnología USIL 2014 Inicio Inicio
Aprendizaje Automático
Aprendizaje Automático Andrea Mesa 21 de mayo de 2010 Aprendizaje automático Otras denominaciones: machine learning, statistical learning, data mining, inteligencia artificial. Las técnicas de Aprendizaje
Jupyter - Python. Contenido. 1 Sistemas Expertos e Inteligencia Artificial / Guía VII / Ciclo / Ing. Herson Serrano. Objetivos Específicos
1 Sistemas Expertos e Inteligencia Artificial / Guía VII / Ciclo 01 2018 / Ing. Herson Serrano Jupyter - Python Facultad: Ingeniería Escuela: Computación Asignatura: Sistemas Expertos e Inteligencia Artificial
Práctica 5: Clasificación con número variable de ejemplos.
5º INGENIERÍA DE TELECOMUNICACIÓN INTELIGENCIA ARTIFICIAL Y RECONOCIMIENTO DE PATRONES Práctica 5: Clasificación con número variable de ejemplos. Objetivos: Utilización de conjuntos de entrenamiento y
(Reconocimiento de Formas)
(Reconocimiento de Formas) Guía de Aprendizaje Información al estudiante 1. Datos Descriptivos Asignatura Materia Departamento responsable Reconocimiento de Formas Percepción Computacional y Robótica Inteligencia
Clasificadores Débiles - AdaBoost
Capítulo 3 Clasificadores Débiles - AdaBoost El término boosting hace referencia a un tipo de algoritmos cuya finalidad es encontrar una hipótesis fuerte a partir de utilizar hipótesis simples y débiles.
Aprendizaje inductivo
Inteligencia Artificial Aprendizaje inductivo Ing. Sup. en Informática, 4º Curso académico: 2011/2012 Profesores: Ramón Hermoso y Matteo Vasirani Aprendizaje Resumen: 3. Aprendizaje automático 3.1 Introducción
Técnicas de aprendizaje sobre series temporales
Técnicas de aprendizaje sobre series temporales Contenido 1. Motivación. 2. Ejemplo del Problema. 3. Aproximaciones al problema de clasificación de series temporales. 4. Aprendizaje de reglas. 5. Boosting
MÉTODOS AVANZADOS EN APRENDIZAJE ARTIFICIAL: TEORÍA Y APLICACIONES A PROBLEMAS DE PREDICCIÓN
MÉTODOS AVANZADOS EN APRENDIZAJE ARTIFICIAL: TEORÍA Y APLICACIONES A PROBLEMAS DE PREDICCIÓN Manuel Sánchez-Montañés Luis Lago Ana González Escuela Politécnica Superior Universidad Autónoma de Madrid Teoría
Introducción a los sistemas Multiclasificadores. Carlos J. Alonso González Departamento de Informática Universidad de Valladolid
Introducción a los sistemas Multiclasificadores Carlos J. Alonso González Departamento de Informática Universidad de Valladolid Contenido 1. Combinación de modelos 2. Descomposición bias-varianza 3. Bagging
Redes Neuronales Artificiales El Perceptrón
1 Sistemas Expertos e Inteligencia Artificial / Guía IX / Ciclo 01-2018 Facultad: Ingeniería Escuela: Computación Asignatura: Sistemas Expertos e Inteligencia Artificial Redes Neuronales Artificiales El
Aprendizaje para Clasificación con Factorización Matricial Basado en Listwise para Filtrado Colaborativo
2012 Aprendizaje para Clasificación con Factorización Matricial Basado en Listwise para Filtrado Colaborativo Iván López Espejo 22/04/2012 2 Aprendizaje para Clasificación con Factorización Matricial Basado
Aprendizaje Automático. Segundo Cuatrimestre de Clasificadores: Naive Bayes, Vecinos Más Cercanos, SVM
Aprendizaje Automático Segundo Cuatrimestre de 2016 Clasificadores: Naive Bayes, Vecinos Más Cercanos, SVM Naive Bayes Naive Bayes Dada una nueva instancia con valores de atributos a 1, a 2,..., a n, su
Análisis de Datos. Validación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores
Análisis de Datos Validación de clasificadores Profesor: Dr. Wilfrido Gómez Flores 1 Introducción La mayoría de los clasificadores que se han visto requieren de uno o más parámetros definidos libremente,
Buenas prácticas para la implementación de herramientas de Ciencia de Datos Leonardo Alfonso Ramos Corona Facultad de Geografía, UAEM.
Buenas prácticas para la implementación de herramientas de Ciencia de Datos Leonardo Alfonso Ramos Corona Facultad de Geografía, UAEM. Qué es la ciencia de datos? Es muy difícil encontrar una definición
Conjuntos de Clasificadores (Ensemble Learning)
Aprendizaje Automático Segundo Cuatrimestre de 2016 Conjuntos de Clasificadores (Ensemble Learning) Gracias a Ramiro Gálvez por la ayuda y los materiales para esta clase. Bibliografía: S. Fortmann-Roe,
Introducción a Minería de Texto. Fabián Latorre
Introducción a Minería de Texto Fabián Latorre [email protected] Contenido Qué es la minería de texto? Por qué es relevante? Por qué la estudiamos? Aplicaciones La complejidad del texto no
Tópicos Selectos en Aprendizaje Maquinal. Algoritmos para Reconocimiento de Patrones
Tópicos Selectos en Aprendizaje Maquinal Guía de Trabajos Prácticos N 1 Algoritmos para Reconocimiento de Patrones 18 de septiembre de 2014 1. Objetivos Introducir conceptos básicos de aprendizaje automático.
ANÁLISIS DE DATOS. Jesús García Herrero
ANÁLISIS DE DATOS Jesús García Herrero ANALISIS DE DATOS EJERCICIOS Una empresa de seguros de automóviles quiere utilizar los datos sobre sus clientes para obtener reglas útiles que permita clasificar
Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA. Ricardo Aler Mur
Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA Ricardo Aler Mur EVALUACIÓN Evaluación: entrenamiento y test Una vez obtenido el conocimiento es necesario validarlo para
