Conjuntos de Clasificadores (Ensemble Learning)
|
|
- Ángela Carrasco Acuña
- hace 5 años
- Vistas:
Transcripción
1 Aprendizaje Automático Segundo Cuatrimestre de 2016 Conjuntos de Clasificadores (Ensemble Learning) Gracias a Ramiro Gálvez por la ayuda y los materiales para esta clase. Bibliografía: S. Fortmann-Roe, "Understanding the Bias-Variance Tradeoff". Artículo online. G. James et al., "An Introduction to Statistical Learning With Applications in R", Springer. Capítulos 2 y 8.
2 Sesgo Inductivo El sesgo inductivo de un algoritmo de aprendizaje es el conjunto de afirmaciones que el algoritmo utiliza para clasificar instancias nuevas. B incluye la forma de las hipótesis y características de funcionamiento del algoritmo. Si un algoritmo de aprendizaje tiene sesgo fuerte: Mayores restricciones al poder expresivo de las hipótesis. Menores chances de ajustar bien los datos. Menor variabilidad ante distintos conjuntos de datos de entrenamiento. 2
3 Función objetivo (desconocida) Posibles conjuntos de datos de entrenamiento Función discriminante: parábola. Bajo sesgo: el modelo se ajusta mejor a los datos. Alta varianza: el modelo varía mucho con los datos. Función discriminante: recta (constante en y). Alto sesgo: el modelo se ajusta peor a los datos. Baja varianza: el modelo varía poco con los datos.
4 Sesgo vs. Varianza Varianza baja Varianza alta Sesgo bajo Sesgo alto
5 Definiciones Matemáticas (Las veremos en mejor detalle después de introducir Regresión.) datos observados ruido en los datos función objetivo error² del modelo
6 Sesgo vs. Varianza
7 Repaso de Estadística Sea X 1,..., X n una muestra de n observaciones independientes tomadas de una población con media μ y varianza σ 2. Media muestral: Esperanza de la media muestral: Varianza de la media muestral:
8 Conjuntos de Clasificadores Entrenar un modelo, permitir el sobreajuste: Por ejemplo: árboles muy profundos. Bajo sesgo; alta varianza. Entrenar varios modelos, c/u sobre datos distintos. Cada modelo sobreajusta de manera diferente. Cada modelo: bajo sesgo, alta varianza. Votación: Para una nueva instancia, devolver la clase más elegida. Esta votación reduce la varianza de la clasificación. Magia! Si los modelos individuales devuelven probabilidades, se puede hacer una votación ponderada. En regresión, se puede devolver el promedio de los valores devueltos por los modelos individuales.
9 salida 2 Conjuntos de Clasificadores Datos Partición del dataset Conjunto 1 Conjunto 2... Conjunto B Entrenamiento de B modelos distintos Nueva instancia... Clasificación de una nueva instancia salida 1 Votación Salida final salida B Poco práctico: los datos son caros. Veamos cómo refinar esta idea. Es importante que los modelos no estén muy correlacionados.
10 salida 2 Bagging (Bootstrap Aggregating) Construir nuevos conjuntos de entrenamiento usando bootstrap: muestreo con reemplazo de las instancias. Datos Conjuntos generados mediante bootstrap Conjunto 1 Conjunto 2... Conjunto B Entrenamiento de B modelos distintos Nueva instancia... salida 1 salida B Clasificación de una nueva instancia Votación Salida final
11 Random Forest Problema de bagging con árboles: Si pocos atributos son predictores fuertes, todos los árboles se van a parecer entre sí. Esos atributos terminarán cerca de la raíz, para todos los conjuntos generados con bootstrap. Random Forest: Igual a bagging, pero en cada nodo, considerar sólo un subconjunto de atributos elegidos al azar. Algo muy positivo de bagging y random forest es que no sobreajustan a medida que se agregan modelos al ensemble.
12 Bagging vs. Random Forest
13 Conjuntos de Clasificadores Boosting Comenzar con un modelo (simple) entrenado sobre todos los datos: h 0 En cada iteración i, entrenar h i dando (gradualmente) mayor importancia a los datos mal clasificados por las iteraciones anteriores. Terminar al conseguir cierto cubrimiento, o luego de un número de iteraciones. Clasificar nuevas instancias usando una votación ponderada (p.ej.) de todos los clasificadores construidos.
14 salida 2 Conjuntos de Clasificadores Stacking Entrenar diferentes modelos (modelos base) y un modelo más, que decide, dada una instancia nueva, qué modelo usar. Nueva instancia Datos Datos... Datos salida 1... Modelo Modelo Modelo salida B Entrenamiento de B modelos distintos Clasificación de una nueva instancia Modelo Salida final
15 Resumen Sesgo vs. varianza Conjuntos de clasificadores: Bagging Random Forest Boosting Stacking
Métodos de Remuestreo en Aprendizaje Automático
Métodos de Remuestreo en Aprendizaje Automático en datos, en hipótesis, y algunos otros trucos: Cross-validation, Bootstrap, Bagging, Boosting, Random Subspaces Lo que sabemos hasta ahora: Hemos visto
Más detallesIntroducción a los sistemas Multiclasificadores. Carlos J. Alonso González Departamento de Informática Universidad de Valladolid
Introducción a los sistemas Multiclasificadores Carlos J. Alonso González Departamento de Informática Universidad de Valladolid Contenido 1. Combinación de modelos 2. Descomposición bias-varianza 3. Bagging
Más detallesCombinación de Clasificadores
Combinación de Clasificadores Parte 1: Métodos de comité, Bagging, Boosting Reconocimiento de Patrones Departamento de Procesamiento de Señales Instituto de Ingeniería Eléctrica Facultad de Ingeniería,
Más detallesAprendizaje: Boosting y Adaboost
Técnicas de Inteligencia Artificial Aprendizaje: Boosting y Adaboost Boosting 1 Indice Combinando clasificadores débiles Clasificadores débiles La necesidad de combinar clasificadores Bagging El algoritmo
Más detallesMétodos de ensambles
Métodos de ensambles Outline Ensambles en general Bagging Random Forest Boosting Introducción Ensamble: conjunto grande de modelos que se usan juntos como un meta modelo Idea base conocida: usar conocimiento
Más detallesAprendizaje Automático. Segundo Cuatrimestre de Clasificadores: Naive Bayes, Vecinos Más Cercanos, SVM
Aprendizaje Automático Segundo Cuatrimestre de 2016 Clasificadores: Naive Bayes, Vecinos Más Cercanos, SVM Naive Bayes Naive Bayes Dada una nueva instancia con valores de atributos a 1, a 2,..., a n, su
Más detallesMódulo Minería de Datos Diplomado. Por Elizabeth León Guzmán, Ph.D. Profesora Ingeniería de Sistemas Grupo de Investigación MIDAS
Módulo Minería de Datos Diplomado Por Elizabeth León Guzmán, Ph.D. Profesora Ingeniería de Sistemas Grupo de Investigación MIDAS Error de clasificación Algoritmo de aprendizaje h Entrenamiento DATOS Evaluación
Más detallesAprendizaje Automatizado
Aprendizaje Automatizado Aprendizaje Automatizado Programas que mejoran su comportamiento con la experiencia. Dos formas de adquirir experiencia: A partir de ejemplos suministrados por un usuario (un conjunto
Más detallesBoosting. Miguel Cárdenas-Montes. 1 Boosting. 2 AdaBoost. Objetivos: Entender como funciona la técnica denominada boosting.
Ó Boosting Miguel Cárdenas-Montes Tanto en clasificación como en regresión, existen estrategias, basadas en la mezcla de modelos, para mejorar la precisión de los modelos. En estos métodos se establece
Más detallesAprendizaje de Conceptos
Aprendizaje Automático Segundo Cuatrimestre de 2016 Aprendizaje de Conceptos Aprendiendo un Concepto...? Qué es un ave? 2 Aprendizaje de Conceptos Aprender un concepto: inducir una función booleana a partir
Más detallesTema 15: Combinación de clasificadores
Tema 15: Combinación de clasificadores p. 1/21 Tema 15: Combinación de clasificadores Abdelmalik Moujahid, Iñaki Inza, Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial
Más detallesEstadística Multivariada Computacional Introducción al Aprendizaje Automático (parte 1)
Estadística Multivariada Computacional Introducción al Aprendizaje Automático (parte 1) Mathias Bourel IMERL - Facultad de Ingeniería, Universidad de la República, Uruguay 24 de octubre de 2016 M.Bourel
Más detallesINAOE. Ensambles de Clasificadores. Eduardo Morales, Hugo Jair Escalante. Introducción. Ensambles de Clasificadores. Algoritmos.
INAOE (INAOE) 1 / 66 Contenido 1 2 3 4 5 duardo (INAOE) 2 / 66 Motivación Cuando las personas tienen que tomar decisiones difíciles, normalmente toman en cuenta la opinión de varios expertos, buscando
Más detallesExamen Parcial. Attr1: A, B Attr2: A, B, C Attr3 1, 2, 3 Attr4; a, b Attr5: 1, 2, 3, 4
Aprenentatge 0-03 Q Examen Parcial Nombre: (Examen ) Instrucciones. (0 puntos) Este examen dura horas. Responded todas las preguntas en estas hojas. Para las preguntas test poned un circulo alrededor de
Más detallesClasificación mediante conjuntos
Clasificación mediante conjuntos Gonzalo Martínez Muñoz Director: Dr. Alberto Suárez González Departamento de Ingeniería Informática Escuela Politécnica Superior Universidad Autónoma de Madrid diciembre
Más detallesTareas de la minería de datos: clasificación. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR
Tareas de la minería de datos: clasificación CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Tareas de la minería de datos: clasificación Clasificación (discriminación) Empareja
Más detallesEVALUACIÓN EN APRENDIZAJE. Eduardo Morales y Jesús González
EVALUACIÓN EN APRENDIZAJE Eduardo Morales y Jesús González Significancia Estadística 2 En estadística, se dice que un resultado es estadísticamente significante, cuando no es posible que se presente por
Más detallesInferencia Estadística
Inferencia Estadística 2do C. 2018 Mg. Stella Figueroa Clase Nº10 Población y Muestra- Parámetro y Estimación puntual Población: Es el conjunto de todos los elementos o unidades elementales con características
Más detallesRandom Forests. Teoría y ejemplos. Romain Gouron. Conferencia 9, GLAM, Doble titulo Ecole Centrale de Nantes (Francia)
Teoría y ejemplos 1 1 Departamiento de Ingenería Matemática Doble titulo Ecole Centrale de Nantes (Francia) Conferencia 9, GLAM, 2016 Outline 1 Árboles de decisión Construcción 2 3 Rotation forest Gradient
Más detallesEstadística con R. Clasificadores
Estadística con R Clasificadores Análisis discriminante lineal (estadístico) Árbol de decisión (aprendizaje automático) Máquina soporte vector (aprendizaje automático) Análisis discriminante lineal (AD)
Más detallesAprendizaje Automático
Aprendizaje Automático Andrea Mesa 21 de mayo de 2010 Aprendizaje automático Otras denominaciones: machine learning, statistical learning, data mining, inteligencia artificial. Las técnicas de Aprendizaje
Más detallesInducción de Árboles de Decisión ID3, C4.5
Inducción de Árboles de Decisión ID3, C4.5 Contenido 1. Representación mediante árboles de decisión. 2. Algoritmo básico: divide y vencerás. 3. Heurística para la selección de atributos. 4. Espacio de
Más detallesCART s. Walter Sosa-Escudero. Universisad de San Andres y CONICET
Universisad de San Andres y CONICET Motivacion Modelo flexible e interpretable para la relacion entre Y y X. Arboles: partir el espacio de atributos en rectangulos, y ajustar un modelo simple para Y dentro
Más detallesANÁLISIS DE DATOS. Ricardo Aler Mur
ANÁLISIS DE DATOS Ricardo Aler Mur EXAMEN DE ANÁLISIS DE DATOS GRADO EN INFORMÁTICA ENERO 2014 10 puntos, 1 hora y media de duración. Responder cada pregunta con respuestas breves (unas pocas líneas).
Más detallesTareas de la minería de datos: clasificación. PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR
Tareas de la minería de datos: clasificación PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR Tareas de la minería de datos: clasificación Clasificación (discriminación) Empareja o asocia datos
Más detallesComparación de métodos de aprendizaje sobre el mismo problema
Comparación de métodos de aprendizaje sobre el mismo problema Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid Contenido 1. Motivación. Test de
Más detallesCI5438. Inteligencia Artificial II Clase 4: Aprendizaje en Árboles. Cap 18.3: RN
CI5438. Inteligencia Artificial II Clase 4: Aprendizaje en Árboles de Decisión Cap 18.3: RN Universidad Simón Boĺıvar 5 de octubre de 2009 Árboles de Decisión Un árbol de decisión es un árbol de búsqueda
Más detallesClasificación Supervisada
Clasificación Supervisada Ricardo Fraiman 26 de abril de 2010 Resumen Reglas de Clasificación Resumen Reglas de Clasificación Descripción del problema Muestra de entrenamiento (X 1, Y 1 ),..., (X n, Y
Más detallesComplementación y ampliación de la currícula de la Maestría 2017 Maestría en Generación y Análisis de Información Estadística
ampliación de la currícula Maestría en Generación y Análisis de Información Estadística Programa abierto de ampliación de la currícula Maestría en Generación y Análisis de Información Estadística La Maestría
Más detallesARBOLES DE DECISION. Miguel Cárdenas-Montes. 1 Introducción. Objetivos: Entender como funcionan los algoritmos basados en árboles de decisión.
ARBOLES DE DECISION Miguel Cárdenas-Montes Los árboles de decisión son estructuras lógicas con amplia utilización en la toma de decisión, la predicción y la minería de datos. Objetivos: Entender como funcionan
Más detallesMachine Learning El fin de la programación?
Machine Learning El fin de la programación? Pablo Brusco pbrusco@dc.uba.ar Algunos problemas N es múltiplo de 2017? N es primo? Encontrar el máximo en una lista. Ubicar 8 reinas en un tablero y que no
Más detallesAprendizaje Automático Segundo Cuatrimestre de Aprendizaje de Conceptos
Aprendizaje Automático Segundo Cuatrimestre de 2015 Aprendizaje de Conceptos Aprendiendo un Concepto...? Qué es un ave? 2 Aprendizaje de Conceptos Aprender un concepto : inducir una función booleana a
Más detalles3. Árboles de decisión
3.1 Introducción Método para aproximación de funciones objetivo que tengan valores discretos (clasificación) Uno de los métodos mas extensamente usados para inferencia inductiva Capaz de aprender hipótesis
Más detallesVIII Jornadas de Usuarios de R
VIII Jornadas de Usuarios de R Análisis del Abandono en el Sector Bancario Predicción del abandono de clientes Albacete, 17 de Noviembre de 2016 I. INDICE : Modelo Abandonos I. COMPRENSIÓN DEL NEGOCIO
Más detalles07 Estimación puntual e introducción a la estadística inferencial
07 Estimación puntual e introducción a la estadística inferencial Diego Andrés Alvarez Marín Profesor Asistente Universidad Nacional de Colombia Sede Manizales 1 Contenido Qué es la estadística inferencial?
Más detallesPosibles trabajos HIA
Posibles trabajos HIA Posibles trabajos Comparar otras herramientas de Minería de Datos con Weka Estudiar la influencia del ruido en bagging y boosting Estudiar la influencia del parámetro de poda en J48
Más detallesReconocimiento de Patrones
Reconocimiento de Patrones Técnicas de validación (Clasificación Supervisada) Jesús Ariel Carrasco Ochoa Instituto Nacional de Astrofísica, Óptica y Electrónica Clasificación Supervisada Para qué evaluar
Más detallesAplicaciones de apoyo al diagnóstico médico. Identificación de objetos amigos y enemigos. Identificación de zonas afectadas por un desastre natural.
Capítulo 5 Evaluación En muchas ocasiones requerimos hacer una evaluación muy precisa de nuestros algoritmos de aprendizaje computacional porque los vamos a utilizar en algún tipo de aplicación que así
Más detallesAprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA. Ricardo Aler Mur
Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA Ricardo Aler Mur MODELOS: ÁRBOLES DE DECISIÓN Y REGLAS Datos de entrada 91 71 75 81 Nublado 90 72 Nublado 70 75 80 75 70
Más detallesClasificación de estados cerebralesusando neuroimágenes funcionales
Clasificación de estados cerebralesusando neuroimágenes funcionales Clase 2: Reconocimiento de patrones en datos de neuroimagenes Enzo Tagliazucchi (tagliazucchi.enzo@googlemail.com) Primera clase: introducción
Más detallesAprendizaje Automatizado. Árboles de Clasificación
Aprendizaje Automatizado Árboles de Clasificación Árboles de Clasificación Estudiaremos un algoritmo para la creación del árbol. Selección de atributos comenzando en el nodo raíz. Proceso recursivo. Árboles
Más detallesAprendizaje Automático
id3 id3 como búsqueda Cuestiones Adicionales Regresión Lineal. Árboles y Reglas de Regresión Ingeniería Informática Fernando Fernández Rebollo y Daniel Borrajo Millán Grupo de Planificación y Aprendizaje
Más detallesANÁLISIS DE REGRESIÓN
ANÁLISIS DE REGRESIÓN INTRODUCCIÓN Francis Galtón DEFINICIÓN Análisis de Regresión Es una técnica estadística que se usa para investigar y modelar la relación entre variables. Respuesta Independiente Y
Más detalles10 EXÁMENES
10 EXÁMENES 2014-2018 Convocatoria Extraordinaria de Septiembre 1 de Septiembre de 2014 1. (1 pto.) a) Aunque por abuso del lenguaje hemos hablado de minería de datos y de KDD como sinónimos, indica las
Más detallesVerificación de una hipótesis sobre una media
Sesión 14 Verificación de una hipótesis sobre una media Verificación de una hipótesis sobre una media Procedimiento de verificación de una hipótesis si el parámetro de interés es una media poblacional.
Más detallesTema AA-4: Sesgo inductivo
Razonamiento Automático Curso 2002 2003 Tema AA-4: Sesgo inductivo Miguel A. Gutiérrez Naranjo José A. Alonso Jiménez Dpto. de Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla
Más detallesAnálisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores
Análisis de Datos Introducción al aprendizaje supervisado Profesor: Dr. Wilfrido Gómez Flores 1 Conceptos básicos Desde la antigüedad, el problema de buscar patrones en datos es fundamental en diversas
Más detallesPrecisión del Modelo
Precisión del Modelo Gráficas, estadística y minería de datos con python Miguel Cárdenas Montes Centro de Investigaciones Energéticas Medioambientales y Tecnológicas, Madrid, Spain miguel.cardenas@ciemat.es
Más detallesGUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC)
GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC) Curso Académico: 2017-2018 Programa: Centro: Universidad: Máster Universitario en Ingeniería Informática Universidad Autónoma de
Más detallesSegmentación de una cartera de clientes usando aprendizaje de máquina
Inicio Segmentación de una cartera de clientes usando aprendizaje de máquina Universidad San Ignacio de Loyola I encuentro interdisciplinario de investigación desarrollo y tecnología USIL 2014 Inicio Inicio
Más detallesTécnicas Multivariadas Avanzadas
Métodos basados en árboles Universidad Nacional Agraria La Molina 2014-2 Introducción Introducción Se describen métodos basados en árboles para regresión y clasicación. Estos métodos requieren estraticar
Más detallesTema 4: Aprendizaje de conceptos
Inteligencia Artificial II Curso 2004 2005 Tema 4: Aprendizaje de conceptos José A. Alonso Jiménez Francisco Jesús Martín Mateos José Luis Ruiz Reina Dpto. de Ciencias de la Computación e Inteligencia
Más detallesCRITERIOS DE SELECCIÓN DE MODELOS
Inteligencia artificial y reconocimiento de patrones CRITERIOS DE SELECCIÓN DE MODELOS 1 Criterios para elegir un modelo Dos decisiones fundamentales: El tipo de modelo (árboles de decisión, redes neuronales,
Más detallesTema 8: Árboles de decisión
Introducción a la Ingeniería del Conocimiento Curso 2004 2005 Tema 8: Árboles de decisión Miguel A. Gutiérrez Naranjo Dpto. de Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla
Más detallesTema 7: Aprendizaje de árboles de decisión
Inteligencia Artificial 2 Curso 2002 03 Tema 7: Aprendizaje de árboles de decisión José A. Alonso Jiménez Miguel A. Gutiérrez Naranjo Francisco J. Martín Mateos José L. Ruiz Reina Dpto. de Ciencias de
Más detallesProyecto 6. Árboles de decisión: Un árbol de decisión es un modelo de predicción utilizado en el ámbito de la inteligencia artificial.
Árboles de decisión: Un árbol de decisión es un modelo de predicción utilizado en el ámbito de la inteligencia artificial. Funcionamiento: Se realiza un test en cada nodo interno del árbol, a medida que
Más detallesAprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA. Ricardo Aler Mur
Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA Ricardo Aler Mur EVALUACIÓN Evaluación: entrenamiento y test Una vez obtenido el conocimiento es necesario validarlo para
Más detallesTema 2: Introducción a la Inferencia Estadística
Tema 2: Introducción a la Inferencia Estadística 1.- En m.a.s. el estadístico varianza muestral es: a) Un estimador insesgado de la varianza poblacional. b) Un estimador insesgado de la media poblacional.
Más detallesAprendizaje Automático Segundo Cuatrimestre de Árboles de Decisión
Aprendizaje Automático Segundo Cuatrimestre de 2015 Árboles de Decisión Aproximación de Funciones Ejemplo: Un amigo juega al tenis los sábados. Juega o no, dependiendo del estado del tiempo. Cielo: {Sol,
Más detallesClasificación. Aurea Grané. Análisis Discriminante
Diplomatura en Estadística 1 Diplomatura en Estadística 2 Análisis discriminante Análisis Discriminante y Clasificación Aurea Grané Departamento de Estadística Universidad Carlos III de Madrid Supongamos
Más detalles2. Algoritmos genéticos y redes neuronales 3. Inducción de árboles clasificadores. Inducción de árboles de clasificación. Aprendizaje UPM UPM
1. Preliminares Aprendizaje 2. Algoritmos genéticos y redes neuronales 3. Inducción de árboles clasificadores 4. Inducción de reglas 5. Minería de datos c 2010 DIT-ETSIT- Aprendizaje: árboles transp. 1
Más detallesESTIMACIÓN Estas transparencias contienen material adaptado del curso de PATTERN RECOGNITION AND MACHINE LEARNING de Heikki Huttunen y del libro Duda.
ESTIMACIÓN Estas transparencias contienen material adaptado del curso de PATTERN RECOGNITION AND MACHINE LEARNING de Heikki Huttunen y del libro Duda. APRENDIZAJE AUTOMÁTICO, ESTIMACIÓN Y DETECCIÓN Introducción
Más detallesProbabilidad y Estadística
Probabilidad y Estadística Grado en Ingeniería Informática - Curso 2 Pablo Candela Departamento de Matemáticas (despacho 212) Universidad Autónoma de Madrid pablo.candela@uam.es Introducción 1 / 8 Organización
Más detallesRandom Forests. Felipe Parra
Applied Mathematics Random Forests Abril 2014 Felipe Parra Por que Arboles para Clasificación PERFIL DE RIESGO: definir con qué nivel de aversión al riesgo se toman decisiones Interpretación intuitiva
Más detallesAprendizaje Automatizado. Árboles de Clasificación
Aprendizaje Automatizado Árboles de Clasificación Árboles de Clasificación Entrada: Objetos caracterizables mediante propiedades. Salida: En árboles de decisión: una decisión (sí o no). En árboles de clasificación:
Más detallesIntroducción a la inferencia estadística
M. Wiper Estadística 1 / 15 Introducción a la inferencia estadística Michael Wiper Departamento de Estadística Universidad Carlos III de Madrid M. Wiper Estadística 2 / 15 Objetivo Introducir la distribución
Más detallesEjemplos Resueltos Tema 4
Ejemplos Resueltos Tema 4 2012 1. Contraste de Hipótesis para la Media µ (con σ conocida) Dada una muestra de tamaño n y conocida la desviación típica de la población σ, se desea contrastar la hipótesis
Más detallesMD - Minería de Datos
Unidad responsable: Unidad que imparte: Curso: Titulación: Créditos ECTS: 018 70 - FIB - Facultad de Informática de Barcelona 73 - CS - Departamento de Ciencias de la Computación 715 - EIO - Departamento
Más detallesMINERÍA DE DATOS: PREPROCESAMIENTO Y CLASIFICACIÓN
GUIA DOCENTE DE LA ASIGNATURA MINERÍA DE DATOS: PREPROCESAMIENTO Y CLASIFICACIÓN MÓDULO MATERIA ASIGNATURA CURSO SEMESTRE CRÉDITOS CARÁCTER Módulo de Nivelación de Conocimientos Minería de datos: preprocesamie
Más detallesMs. C. Marco Vinicio Rodríguez
Ms. C. Marco Vinicio Rodríguez mvrodriguezl@yahoo.com http://mvrurural.wordpress.com/ Uno de los objetivos de la estadística es saber acerca del comportamiento de parámetros poblacionales tales como:
Más detallesEstadística I Tema 5: Introducción a la inferencia estadística
Estadística I Tema 5: Introducción a la inferencia estadística Tema 5. Introducción a la inferencia estadística Contenidos Objetivos. Estimación puntual. Bondad de ajuste a una distribución. Distribución
Más detallesAnexo I CUESTIONARIO UTILIZADO PARA LA RECOGIDA DE INFORMACIÓN
Anexo I CUESTIONARIO UTILIZADO PARA LA RECOGIDA DE INFORMACIÓN 165 ENCUESTA DE COMPORTAMIENTOS Y TIPOLOGÍAS DE VISITANTES EN EUSKADI 166 ANEXO I. CUESTIONARIO UTILIZADO PARA LA RECOGIDA DE INFORMACIÓN
Más detallesClasificación estadística de patrones
Clasificación estadística de patrones Clasificador gaussiano César Martínez cmartinez _at_ fich.unl.edu.ar Tópicos Selectos en Aprendizaje Maquinal Doctorado en Ingeniería, FICH-UNL 19 de setiembre de
Más detallesBOOSTING CON REDES NEURONALES RBF. ANÁLISIS SESGO-VARIANZA EN UN PROBLEMA DE CLASIFICACIÓN José María Matías Fernández 1 RESUMEN
VI Congreso Galego de Estatística e Investigación de Operacións Vigo 5 7 de Novembro de 3 BOOSTING CON REDES NEURONALES RBF. ANÁLISIS SESGO-VARIANZA EN UN PROBLEMA DE CLASIFICACIÓN José María Matías Fernández
Más detallesCurso de nivelación Estadística y Matemática
Curso de nivelación Estadística y Matemática Tercera clase: Introducción al concepto de probabilidad y Distribuciones de probablidad discretas Programa Técnico en Riesgo, 2017 Agenda 1 Concepto de probabilidad
Más detallesTema 7: Sesgo inductivo
Introducción a la Ingeniería del Conocimiento Curso 2004 2005 Tema 7: Sesgo inductivo Miguel A. Gutiérrez Naranjo Dpto. de Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla IIC
Más detallesInducción de Árboles de Decisión ID3, C4.5
Inducción de Árboles de Decisión ID3, C4.5 Contenido 1. Representación mediante árboles de decisión 2. Algoritmo básico: divide y vencerás 3. Heurística para la selección de atributos 4. Espacio de búsqueda
Más detallesÍndice general. Prefacio...5
Índice general Prefacio...5 Capítulo 1 Introducción...13 1.1 Introducción...13 1.2 Los datos...19 1.3 Etapas en los procesos de big data...20 1.4 Minería de datos...21 1.5 Estructura de un proyecto de
Más detallesEstadística I Solución Examen Final - 28 Mayo de 2009
Estadística I Examen Final - 28 Mayo de 2009 (1 (10 puntos A 16 estudiantes de Filosofía se les preguntó cuántas clases de esta asignatura habían perdido durante el cuatrimestre. Las respuestas obtenidas
Más detallesComparación de dos métodos de aprendizaje sobre el mismo problema
Comparación de dos métodos de aprendizaje sobre el mismo problema Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid Contenido 1. Motivación 2.
Más detallesSISTEMAS INTELIGENTES
SISTEMAS INTELIGENTES T9: Árboles de Decisión www.aic.uniovi.es/ssii Sistemas Inteligentes T9: Árboles de decisión Índice Árboles de decisión para clasificación Mecanismo de inducción: divide y vencerás
Más detallesAnálisis multivariante
Machine Learning 2016-17 1 Aprendizaje automatizado (ML) 2 3 Aprendizaje automatizado (ML) Definiciones Conjunto de herramientas para transformar datos en conocimiento. Conjunto de técnicas que permitan
Más detallesInteligencia Artificial: Su uso para la investigación
Inteligencia Artificial: Su uso para la investigación Dra. Helena Montserrat Gómez Adorno Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas helena.adorno@iimas.unam.mx 1 Introducción
Más detallesRemuestreo importancia y aplicaciones
Remuestreo importancia y aplicaciones Al usar índices de biodiversidad no es razonable suponer una distribución muestral conocida del estimador (índice de Shannon u otro) y por eso se recomienda utilizar
Más detallesUnidad 1 DISTRIBUCIONES MUESTRALES Objetivo particular El alumno identificará distribuciones discretas y continuas, obtendrá la probabilidad de
Nombre de la materia Estadística Inferencial Departamento Ciencias Aplicadas de la Información Academia Ciencias Básicas Clave Horas-teoría Horas-práctica Horas-AI Total-horas Créditos I4863 60 20 0 80
Más detallesUniversidad Nacional Autónoma de México Laboratorio de Cómputo Científico, F. C.
: Un Universidad Nacional Autónoma de México Laboratorio de Cómputo Científico, F. C. : Un presenta México D.F., a 23 de Septiembre de 2010. Historia : Un La estimación de mineral recobrable es muy importante
Más detallesI. CARACTERISTICAS DEL ALGORITMO ID3
I. CARACTERISTICAS DEL ALGORITMO ID3 El investigador J. Ross Quinlan desarrolló el algoritmo conocido como ID3 (Induction Decision Trees) en el año de 1983. Pertenece a la familia TDIDT (Top-Down Induction
Más detallesAnálisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores
Análisis de Datos Introducción al aprendizaje supervisado Profesor: Dr. Wilfrido Gómez Flores 1 Conceptos básicos Reconocimiento de patrones (RP): clasificar objetos en un número de categorías o clases.
Más detallesOverfit, cross validation y bootstrap
Universisad de San Andrés y CONICET Cueestiones preliminares Sea z n una sucesion de variables aleatorias escalares. Consideremos la siguiente sucesion z n = n i=1 z i n Ley de grandes numeros (Kolmogorov):
Más detallesUNIVERSIDAD TECNOLÓGICA DE PEREIRA FACULTAD DE INGENIERÍAS MAESTRÍA EN INGENIERÍA DE SISTEMAS Y COMPUTACIÓN APRENDIZAJE DE MÁQUINA
UNIVERSIDAD TECNOLÓGICA DE PEREIRA FACULTAD DE INGENIERÍAS MAESTRÍA EN INGENIERÍA DE SISTEMAS Y COMPUTACIÓN APRENDIZAJE DE MÁQUINA OBJETIVO GENERAL El objetivo general del Aprendizaje de Máquina (ML por
Más detallesAprendizaje Automático. Objetivos. Funciona? Notas
Introducción Las técnicas que hemos visto hasta ahora nos permiten crear sistemas que resuelven tareas que necesitan inteligencia La limitación de estos sistemas reside en que sólo resuelven los problemas
Más detallesTests de Hipótesis basados en una muestra. ESTADÍSTICA (Q) 5. TESTS DE HIPÓTESIS PARA LA MEDIA DE UNA POBLACIÓN NORMAL CON VARIANZA CONOCIDA
2 5. TESTS DE HIPÓTESIS PARA LA MEDIA DE UNA POBLACIÓN NORMAL CON VARIANZA CONOCIDA 5. Desarrollo de un ejemplo Interesa saber si el método de absorción atómica de vapor frío para determinar mercurio introduce
Más detallesSistemas de Percepción Visión por Computador
Nota: Algunas de las imágenes que aparecen en esta presentación provienen del libro: Visión por Computador: fundamentos y métodos. Arturo de la Escalera Hueso. Prentice Hall. Sistemas de Percepción Visión
Más detallesUniversidad Técnica de Babahoyo INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA
Universidad Técnica de Babahoyo INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA Ateneo Ruperto P. Bonet Chaple UTB-Julio 2016 OBJETIVO Aplicar las técnicas de Muestreo e Inferencia Estadística Determinar el tamaño
Más detallesEXAMEN FINAL ESTADÍSTICA GENERAL (Ejemplo 4)
EXAMEN FINAL ESTADÍSTICA GENERAL (Ejemplo 4) Apellido y nombre: - Este examen contiene 15 preguntas con 5 respuestas propuestas cada una. Identificar y marcar la única respuesta correcta en cada caso.
Más detallesMatemática Aplicada y Estadística - Grado en Farmacia Curso 2014/15 1er. Examen Parcial 6 de noviembre de 2014
Matemática Aplicada y Estadística - Grado en Farmacia Curso 2014/1 1er. Examen Parcial 6 de noviembre de 2014 Apellidos y nombre del alumno/a Grupo 4 1. 2 puntos) En la siguiente tabla se refleja la distribución
Más detallesClasificadores Débiles - AdaBoost
Capítulo 3 Clasificadores Débiles - AdaBoost El término boosting hace referencia a un tipo de algoritmos cuya finalidad es encontrar una hipótesis fuerte a partir de utilizar hipótesis simples y débiles.
Más detallesAnálisis de Datos. Combinación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores
Análisis de Datos Combinación de clasificadores Profesor: Dr. Wilfrido Gómez Flores 1 Introducción Diversos algoritmos de clasificación están limitados a resolver problemas binarios, es decir, con dos
Más detalles