Selección de Atributos. Dr. Jesús Ariel Carrasco Ochoa Oficina 8311

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Selección de Atributos. Dr. Jesús Ariel Carrasco Ochoa Oficina 8311"

Transcripción

1 Selección de Atributos Dr. Jesús Ariel Carrasco Ochoa Oficina 8311

2 Contenido Introducción Estrategias de selección Técnicas filter Técnicas wrapper Técnicas híbridas

3 Selección de atributos Selección de variables (feature selection) Preprocesamiento Clasificación Supervisada Regresión Agrupamiento Caracterización Atributos característicos

4 Selección de atributos Selección de variables (feature selection) Preprocesamiento Clasificación Supervisada Regresión Agrupamiento Caracterización Atributos característicos

5 Selección de atributos Por qué hacer selección de atributos en clasificación supervisada Mejorar los resultados de la clasificación Reducir el costo de la clasificación Acelerar el proceso de clasificación Mejorar el entendimiento del modelo y resultados de la clasificación

6 Selección de atributos El objetivo es seleccionar un subconjunto reducido de atributos útiles para la clasificación eliminando Atributos irrelevantes Atributos redundantes

7 Selección de variables Variables descartadas M x i... x k O 1 x i (O 1 )... x k (O 1 ) : O m x i (O m )... x k (O m ) Muestra reducida Muestra M x 1.. x s M x 1 x 2... x n O 1 x 1 (O 1 ).. x s (O 1 ) O 1 x 1 (O 1 ) x 2 (O 1 )... x n (O 1 ) : : Selecctor O m x 1 (O m ).. x s (O m ) O m x 1 (O m ) x 2 (O m )... x n (O m )

8 Estrategias de Selección filter.- La selección se hace con un criterio independiente del clasificador. wrapper.- La selección se hace usando información del mecanismo de clasificación. Híbridos.- Combinan estrategias filter y wrapper

9 Estrategias filter Usualmente ordenan las variables por algún criterio (ranking). La selección se hace en el orden establecido con algún criterio de corte. Comúnmente un número de variables a seleccionar predefinido por el usuario (parámetro).

10 Estrategias de ordenamiento Entropía Ganancia de información Índice de Gini Rough Set Theory/Teoría de Testores Algoritmo Relief

11 Algoritmo RELIEF Dada una muestra de objetos descritos por n atributos numéricos normalizados. Inicializar en 0 el peso w i de cada variable x i Repetir m veces Seleccionar aleatoriamente un objeto O de la muestra de entrenamiento Buscar en vecino más cercano (O NN ) de O en su misma clase Buscar en vecino más cercano (O NE ) de O fuera de su clase Para cada atributo x i tomar: w i = w i ( x i ( O) x i ( O NN / m + ( x ( O) ( O Ordenar los atributos descendentemente de acuerdo a su peso w )) 2 i x i NE )) 2 / m

12 Estrategias wrapper Evalúan subconjuntos de atributos utilizando un clasificador. Para evitar la búsqueda exhaustiva siguen alguna estrategia de búsqueda. Comúnmente estrategias ávidas o aleatorias

13 Estrategias wrapper Para n variables, el espacio de búsqueda es de tamaño 2 n

14 Estrategias wrapper Búsqueda exhaustiva Búsqueda secuencial Hacia atrás (backward) Hacia adelante (forward) Flotante (floating) Búsqueda aleatoria Algoritmos genéticos Búsqueda tabú.

15 Búsqueda exhaustiva El tamaño del espacio de búsqueda es 2 n Si se busca un número predefinido de variable el espacio de búsqueda es de tamaño Para seleccionar 20 variables de 50 el espacio de búsqueda es de tamaño n k <<

16 Sequential Forward Selection Sea F en conjunto de todas las variables S=Ø Repetir x S = = max( q( S x F \S S { x} { x})) Hasta S =k / q(s)<q(s\{x}) / q(s)>t

17 Sequential Forward Selection

18 Sequential Bacward Selection Sea F en conjunto de todas las variables S=F Repetir x S = = max( q( S x S S \{ x} \{ x})) Hasta S =k / q(s)<q(s {x}) / q(s)>t

19 Sequential Backward Selection

20 Sequential Floating Forward Selection S=Ø Repetir x = S = S max( q( S x F \S Repetir { x} x = { x})) max( q( S x S S = S \{ x} \{ x})) Hasta q(s)<q(s {x}) S {x} Hasta S =k / q(s)>t

21 Sequential Floating Backward Selection S=Ø Repetir x = S = max( q( S x S S Repetir \{ x} x = \{ x})) max( q( S x F \S S = S { x} { x})) Hasta q(s) q(s\{x}) S\{x} Hasta S =k / q(s)>t

22 Selección usando Algoritmos Genéticos Individuos (suponiendo n variables) x 1 x 2... x n 0 1 0/1... 0/1 1

23 Selección usando Algoritmos Genéticos Cruza (combinación de individuos) Punto de cruza Punto de cruza

24 Selección usando Algoritmos Genéticos Mutación (alteración de individuos) Elemento a mutar Elemento mutado

25 Selección usando Algoritmos Genéticos Generar población inicial P Para i=1,..., numgeneraciones evalúa(p) P2 = cruza(p) evalúa(p2) P3 = mutación (P P2) evalúa(p3) P = selecciona(p P2 P3) salida = mejorelemento(p)

26 Evaluación de selectores de variables Utilizando un clasificador Seleccionar un conjunto de bases de datos Utilizar algún método de validación aplicando selección+clasificación Utilizar alguna medida de evaluación de calidad de clasificación Utilizar datos sintéticos en los cuales se conozca cuáles son los atributos importantes

Selección de atributos

Selección de atributos Selección de atributos Series Temporales Máster en Computación Universitat Politècnica de Catalunya Dra. Alicia Troncoso Lora 1 Contenido Introducción Clasificación de las técnicas Esquema General Evaluadores

Más detalles

Reconocimiento de Patrones

Reconocimiento de Patrones Reconocimiento de Patrones Técnicas de validación (Clasificación Supervisada) Jesús Ariel Carrasco Ochoa Instituto Nacional de Astrofísica, Óptica y Electrónica Clasificación Supervisada Para qué evaluar

Más detalles

Selección de Atributos

Selección de Atributos Selección de Atributos Eduardo Morales, Jesús González INAOE Mayo, 2010 (INAOE) Mayo, 2010 1 / 53 1 2 3 4 5 6 (INAOE) Mayo, 2010 2 / 53 Selección de Atributos A partir de los atributos originales selecciona

Más detalles

Reconocimiento de Patrones

Reconocimiento de Patrones Reconocimiento de Patrones Jesús Ariel Carrasco Ochoa Instituto Nacional de Astrofísica Óptica y Electrónica ariel@inaoep.mx Contenido Introducción Enfoques Problemas Selección de Variables Clasificación

Más detalles

Selección de características. Reconocimiento de Patrones 2013

Selección de características. Reconocimiento de Patrones 2013 Selección de características Reconocimiento de Patrones 2013 Selección de características Estrategia de búsqueda óptima o sub-optima para la selección de un sub-conjunto de características para el diseño

Más detalles

Jesús García Herrero METODOLOGÍA DE ANÁLISIS DE DATOS

Jesús García Herrero METODOLOGÍA DE ANÁLISIS DE DATOS Jesús García Herrero METODOLOGÍA DE ANÁLISIS DE DATOS En esta clase concluimos el curso de Análisis de Datos con una visión de las metodologías del análisis de datos. Como se ha visto, este es un campo

Más detalles

Ricardo Aler Mur SELECCIÓN Y GENERACIÓN DE ATRIBUTOS-I

Ricardo Aler Mur SELECCIÓN Y GENERACIÓN DE ATRIBUTOS-I Ricardo Aler Mur SELECCIÓN Y GENERACIÓN DE ATRIBUTOS-I En esta clase se habla de una parte importante del preprocesado de datos: la selección y generación de atributos. La selección de atributos consiste

Más detalles

Tareas de la minería de datos: clasificación. PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR

Tareas de la minería de datos: clasificación. PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR Tareas de la minería de datos: clasificación PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR Tareas de la minería de datos: clasificación Clasificación (discriminación) Empareja o asocia datos

Más detalles

Tareas de la minería de datos: clasificación. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR

Tareas de la minería de datos: clasificación. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Tareas de la minería de datos: clasificación CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Tareas de la minería de datos: clasificación Clasificación (discriminación) Empareja

Más detalles

Examen Parcial. Attr1: A, B Attr2: A, B, C Attr3 1, 2, 3 Attr4; a, b Attr5: 1, 2, 3, 4

Examen Parcial. Attr1: A, B Attr2: A, B, C Attr3 1, 2, 3 Attr4; a, b Attr5: 1, 2, 3, 4 Aprenentatge 0-03 Q Examen Parcial Nombre: (Examen ) Instrucciones. (0 puntos) Este examen dura horas. Responded todas las preguntas en estas hojas. Para las preguntas test poned un circulo alrededor de

Más detalles

Minería de Datos Web. Cursada 2018

Minería de Datos Web. Cursada 2018 Minería de Datos Web Cursada 2018 Proceso de Minería de Texto Clustering de Documentos Clasificación de Documentos Es un método supervisado para dividir documentos en base a categorías predefinidas Los

Más detalles

Posibles trabajos HIA

Posibles trabajos HIA Posibles trabajos HIA Posibles trabajos Comparar otras herramientas de Minería de Datos con Weka Estudiar la influencia del ruido en bagging y boosting Estudiar la influencia del parámetro de poda en J48

Más detalles

Módulo Minería de Datos

Módulo Minería de Datos Módulo Minería de Datos Diplomado Por Elizabeth León Guzmán, Ph.D. Profesora Ingeniería de Sistemas Grupo de Investigación MIDAS Preprocesamiento de Datos Preparación de datos El propósito fundamental

Más detalles

Clasificación mediante conjuntos

Clasificación mediante conjuntos Clasificación mediante conjuntos Gonzalo Martínez Muñoz Director: Dr. Alberto Suárez González Departamento de Ingeniería Informática Escuela Politécnica Superior Universidad Autónoma de Madrid diciembre

Más detalles

Mejoras a algoritmos genéticos. Inteligencia Computacional Blanca A. Vargas Govea Sep 25, 2012

Mejoras a algoritmos genéticos. Inteligencia Computacional Blanca A. Vargas Govea Sep 25, 2012 Mejoras a algoritmos genéticos Inteligencia Computacional Blanca A. Vargas Govea vargasgovea@itesm.mx Sep 25, 2012 Conocer las mejoras usuales a algoritmos genéticos 2 1. Diseñar una representación 2.

Más detalles

Tema 12. Selección de Variables

Tema 12. Selección de Variables Tema 12. Selección de Variables Pedro Larrañaga, Iñaki Inza, Abdelmalik Moujahid Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del País Vasco Euskal Herriko Unibertsitatea

Más detalles

Clasificación Supervisada. Métodos jerárquicos. CART

Clasificación Supervisada. Métodos jerárquicos. CART Clasificación Supervisada. Métodos jerárquicos. CART Ricardo Fraiman 2 de abril de 2010 Descripción del problema Muestra de entrenamiento (X 1, Y 1 ),..., (X n, Y n ) E {1,..., m}. Típicamente E = R d.

Más detalles

Aprendizaje Automático

Aprendizaje Automático id3 id3 como búsqueda Cuestiones Adicionales Regresión Lineal. Árboles y Reglas de Regresión Ingeniería Informática Fernando Fernández Rebollo y Daniel Borrajo Millán Grupo de Planificación y Aprendizaje

Más detalles

para la Selección Simultánea de Instancias y Atributos

para la Selección Simultánea de Instancias y Atributos Algoritmosde Estimaciónde Distribuciones para la Selección Simultánea de Instancias y Atributos MAEB 2012 Albacete 8 10 Febrero Pablo Bermejo, José A. Gámez, Ana M. Martínez y José M. Puerta Universidad

Más detalles

Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Introducción al aprendizaje supervisado Profesor: Dr. Wilfrido Gómez Flores 1 Conceptos básicos Desde la antigüedad, el problema de buscar patrones en datos es fundamental en diversas

Más detalles

Técnicas de aprendizaje sobre series temporales

Técnicas de aprendizaje sobre series temporales Técnicas de aprendizaje sobre series temporales Contenido 1. Motivación. 2. Ejemplo del Problema. 3. Aproximaciones al problema de clasificación de series temporales. 4. Aprendizaje de reglas. 5. Boosting

Más detalles

Método de Selección de Atributos por Clase

Método de Selección de Atributos por Clase Método de Selección de Atributos por Clase por Bárbara Berenice Pineda Bautista Tesis sometida como requisito parcial para obtener el grado de MAESTRO EN CIENCIAS EN EL ÁREA DE CIENCIAS COMPUTACIONALES

Más detalles

Son una clase particular de los algoritmos evolutivos.

Son una clase particular de los algoritmos evolutivos. Algoritmos Genéticos (AGs) Los AGs son técnicas de resolución para problemas de Búsqueda Optimización Aprendizaje en máquinas Son una clase particular de los algoritmos evolutivos. Los AGs intentan resolver

Más detalles

Métodos para Determinar el Atributo Distinguido en Multiredes Bayesianas

Métodos para Determinar el Atributo Distinguido en Multiredes Bayesianas Métodos para Determinar el Atributo Distinguido en Multiredes Bayesianas Andrés Cano Utrera Fco. Javier García Castellano Andrés R. Masegosa Arredondo Serafín Moral Callejón Uncertainty Treatment in Artificial

Más detalles

MASTER DE INGENIERÍA BIOMÉDICA. Métodos de ayuda al diagnóstico clínico. Tema 6: Árboles de decisión.

MASTER DE INGENIERÍA BIOMÉDICA. Métodos de ayuda al diagnóstico clínico. Tema 6: Árboles de decisión. MASTER DE INGENIERÍA BIOMÉDICA. Métodos de ayuda al diagnóstico clínico. Tema 6: Árboles de decisión. 1 Objetivos del tema Conocer en qué consiste un árbol de decisión. Aprender los problemas que pueden

Más detalles

Análisis de Datos. Combinación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Combinación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Combinación de clasificadores Profesor: Dr. Wilfrido Gómez Flores 1 Introducción Diversos algoritmos de clasificación están limitados a resolver problemas binarios, es decir, con dos

Más detalles

Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA. Ricardo Aler Mur

Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA. Ricardo Aler Mur Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA Ricardo Aler Mur KNN: VECINO(S) MAS CERCANO(S) K NEAREST NEIGHBORS (KNN) Altura Niño Adulto Mayor Se guardan todos los ejemplos

Más detalles

Ricardo Aler Mur CLASIFICADORES KNN-I

Ricardo Aler Mur CLASIFICADORES KNN-I Ricardo Aler Mur CLASIFICADORES KNN-I En esta clase se habla del aprendizaje de modelos de clasificación y regresión basados en instancias o ejemplares. En concreto: Se define la clasificación y regresión

Más detalles

Métodos actuales en machine learning

Métodos actuales en machine learning Métodos actuales en machine learning Gracias a los organizadores! Pablo M. Granitto Dr. en Física Docente FCEIA UN Rosario Investigadador en CIFASIS (CONICET) Lucas C. Uzal Dr. en Física Docente FCEIA

Más detalles

Técnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO

Técnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO Técnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO 2 Objetivo El objetivo principal de las técnicas de clasificación supervisada es obtener un modelo clasificatorio válido para permitir tratar

Más detalles

ANÁLISIS DE DATOS. Jesús García Herrero

ANÁLISIS DE DATOS. Jesús García Herrero ANÁLISIS DE DATOS Jesús García Herrero ANALISIS DE DATOS EJERCICIOS Una empresa de seguros de automóviles quiere utilizar los datos sobre sus clientes para obtener reglas útiles que permita clasificar

Más detalles

Índice general. Prefacio...5

Índice general. Prefacio...5 Índice general Prefacio...5 Capítulo 1 Introducción...13 1.1 Introducción...13 1.2 Los datos...19 1.3 Etapas en los procesos de big data...20 1.4 Minería de datos...21 1.5 Estructura de un proyecto de

Más detalles

Lingüística computacional

Lingüística computacional Lingüística computacional Definición y alcance Escuela Nacional de Antropología e Historia (ENAH) Agosto diciembre de 2015 Lingüística Ciencias de la computación Lingüística computacional Estudio del lenguaje

Más detalles

ELVIRA II: APLICACIONES DE LOS MODELOS GRÁFICOS PROBABILÍSTICOS p.1/31

ELVIRA II: APLICACIONES DE LOS MODELOS GRÁFICOS PROBABILÍSTICOS p.1/31 ELVIRA II: APLICACIONES DE LOS MODELOS GRÁFICOS PROBABILÍSTICOS Aprendizaje de modelos gráficos probabilísticos. Aplicación al clustering con datos de expresión genética TIC 2001-2973-C05-03 Departamento

Más detalles

Búsqueda secuencial de subconjuntos de atributos sobre un ranking. Roberto Ruiz, José C. Riquelme y Jesús S. Aguilar Ruiz

Búsqueda secuencial de subconjuntos de atributos sobre un ranking. Roberto Ruiz, José C. Riquelme y Jesús S. Aguilar Ruiz Búsqueda secuencial de subconjuntos de atributos sobre un ranking Roberto Ruiz, José C. Riquelme y Jesús S. Aguilar Ruiz Departamento de Lenguajes y Sistemas Informáticos ETS Ingeniería Informática Universidad

Más detalles

Sistemas de Percepción Visión por Computador

Sistemas de Percepción Visión por Computador Nota: Algunas de las imágenes que aparecen en esta presentación provienen del libro: Visión por Computador: fundamentos y métodos. Arturo de la Escalera Hueso. Prentice Hall. Sistemas de Percepción Visión

Más detalles

3. Árboles de decisión

3. Árboles de decisión 3.1 Introducción Método para aproximación de funciones objetivo que tengan valores discretos (clasificación) Uno de los métodos mas extensamente usados para inferencia inductiva Capaz de aprender hipótesis

Más detalles

Qué es big dimension? Verónica Bolón Canedo 2/30

Qué es big dimension? Verónica Bolón Canedo 2/30 Qué es big dimension? Verónica Bolón Canedo 2/30 Big dimension En esta nueva era de Big Data, los métodos de aprendizaje máquina deben adaptarse para poder tratar con este volumen de datos sin precedentes.

Más detalles

II Unidad EL ALGORITMO GENETICO BINARIO. Rafael Vazquez Perez

II Unidad EL ALGORITMO GENETICO BINARIO. Rafael Vazquez Perez II Unidad EL ALGORITMO GENETICO BINARIO Rafael Vazquez Perez Contenido 2.1.- Algoritmos Genéticos: La Selección Natural en una Computadora 2.2.- Componentes de un Algoritmo Genético 2.2.1.- Selección de

Más detalles

Aprendizaje inductivo no basado en el error Métodos competitivos supervisados.

Aprendizaje inductivo no basado en el error Métodos competitivos supervisados. Aprendizaje inductivo no basado en el error Métodos competitivos supervisados. Aprendizaje basado en instancias Carlos J. Alonso González Departamento de Informática Universidad de Valladolid Contenido

Más detalles

Aplicación a datos de mejora genética en Ovejas Manchegas

Aplicación a datos de mejora genética en Ovejas Manchegas Elvira II - subproyecto 5 (Albacete) Aplicación a datos de mejora genética en Ovejas Manchegas José A. Gámez jgamez@info-ab.uclm.es Instituto de Investigación en Informática de Albacete Universidad de

Más detalles

Aprendizaje: Boosting y Adaboost

Aprendizaje: Boosting y Adaboost Técnicas de Inteligencia Artificial Aprendizaje: Boosting y Adaboost Boosting 1 Indice Combinando clasificadores débiles Clasificadores débiles La necesidad de combinar clasificadores Bagging El algoritmo

Más detalles

SISTEMAS INTELIGENTES

SISTEMAS INTELIGENTES SISTEMAS INTELIGENTES T8: Aprendizaje basado en instancias www.aic.uniovi.es/ssii Índice Aprendizaje basado en instancias Métricas NN Vecino más próximo: Regiones de Voronoi El parámetro K Problemas de

Más detalles

Capítulo 8. Selección de variables Introducción

Capítulo 8. Selección de variables Introducción Capítulo 8 Selección de variables 8.1. Introducción En muchos problemas de regresión es posible considerar un número importante de variables predictoras. Un empresario podría estudiar los factores que

Más detalles

SELECCIÓN DE VARIABLES PARA CLASIFICACIÓN NO SUPERVISADA UTILIZANDO UN ENFOQUE HÍBRIDO FILTER-WRAPPER

SELECCIÓN DE VARIABLES PARA CLASIFICACIÓN NO SUPERVISADA UTILIZANDO UN ENFOQUE HÍBRIDO FILTER-WRAPPER SELECCIÓN DE VARIABLES PARA CLASIFICACIÓN NO SUPERVISADA UTILIZANDO UN ENFOQUE HÍBRIDO FILTER-WRAPPER Por: SAÚL SOLORIO FERNÁNDEZ Tesis sometida como requisito parcial para obtener el grado de MAESTRO

Más detalles

Métodos para la selección de prototipos

Métodos para la selección de prototipos Métodos para la selección de prototipos por M. C. José Arturo Olvera López Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE CIENCIAS COMPUTACIONALES

Más detalles

Conclusiones. Somos la suma de nuestras decisiones. WOODY ALLEN Delitos y Faltas (1989)

Conclusiones. Somos la suma de nuestras decisiones. WOODY ALLEN Delitos y Faltas (1989) Capítulo 7 Conclusiones Somos la suma de nuestras decisiones WOODY ALLEN Delitos y Faltas (1989) En este trabajo se ha presentado una nueva estrategia para construir árboles de decisión que ha conseguido

Más detalles

ANÁLISIS DE DATOS. Ricardo Aler Mur

ANÁLISIS DE DATOS. Ricardo Aler Mur ANÁLISIS DE DATOS Ricardo Aler Mur EXAMEN DE ANÁLISIS DE DATOS GRADO EN INFORMÁTICA ENERO 2014 10 puntos, 1 hora y media de duración. Responder cada pregunta con respuestas breves (unas pocas líneas).

Más detalles

Análisis y Recuperación de Información

Análisis y Recuperación de Información Análisis y Recuperación de Información 1 er Cuatrimestre 2016 Página Web http://www.exa.unicen.edu.ar/catedras/ayrdatos/ Prof. Dra. Daniela Godoy ISISTAN Research Institute UNICEN University Tandil, Bs.

Más detalles

10 EXÁMENES

10 EXÁMENES 10 EXÁMENES 2014-2018 Convocatoria Extraordinaria de Septiembre 1 de Septiembre de 2014 1. (1 pto.) a) Aunque por abuso del lenguaje hemos hablado de minería de datos y de KDD como sinónimos, indica las

Más detalles

Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Introducción al aprendizaje supervisado Profesor: Dr. Wilfrido Gómez Flores 1 Conceptos básicos Reconocimiento de patrones (RP): clasificar objetos en un número de categorías o clases.

Más detalles

Inteligencia Artificial

Inteligencia Artificial Algoritmos genéticos Bases En la naturaleza todos los seres vivos se enfrentan a problemas que deben resolver con éxito, como conseguir más luz solar o conseguir comida. La Computación Evolutiva interpreta

Más detalles

Clasificación Supervisada

Clasificación Supervisada Clasificación Supervisada Ricardo Fraiman 3 de abril de 2010 Resumen Reglas de Clasificación Resumen Reglas de Clasificación Descripción del problema Muestra de entrenamiento (X 1, Y 1 ),..., (X n, Y n

Más detalles

BIOINFORMÁTICA

BIOINFORMÁTICA BIOINFORMÁTICA 2013-2014 PARTE I. INTRODUCCIÓN Tema 1. Computación Basada en Modelos Naturales PARTE II. MODELOS BASADOS EN ADAPTACIÓN SOCIAL (Swarm Intelligence) Tema 2. Introducción a los Modelos Basados

Más detalles

COMPUTACIÓN BIOLÓGICA

COMPUTACIÓN BIOLÓGICA COMPUTACIÓN BIOLÓGICA Pedro Isasi 1 1 Departamento de Informática Universidad Carlos III de Madrid Avda. de la Universidad, 30. 28911 Leganés (Madrid). Spain email: isasi@ia.uc3m.es Presentación TEMARIO

Más detalles

CI5438. Inteligencia Artificial II Clase 4: Aprendizaje en Árboles. Cap 18.3: RN

CI5438. Inteligencia Artificial II Clase 4: Aprendizaje en Árboles. Cap 18.3: RN CI5438. Inteligencia Artificial II Clase 4: Aprendizaje en Árboles de Decisión Cap 18.3: RN Universidad Simón Boĺıvar 5 de octubre de 2009 Árboles de Decisión Un árbol de decisión es un árbol de búsqueda

Más detalles

Este capitulo presenta la metodología utilizada para el problema de. maximización de la disponibilidad con relación al costo por medio de algoritmos

Este capitulo presenta la metodología utilizada para el problema de. maximización de la disponibilidad con relación al costo por medio de algoritmos 3 Metodología Este capitulo presenta la metodología utilizada para el problema de maximización de la disponibilidad con relación al costo por medio de algoritmos genéticos y programación multiobjetivo,

Más detalles

Algoritmos basados en hormigas

Algoritmos basados en hormigas Algoritmos basados en hormigas Inteligencia Artificial Avanzada 1er. Semestre 2008 1 Aspectos Generales La metáfora de los insectos sociales para resolver problemas ha sido un tema importante a partir

Más detalles

Introducción a los sistemas Multiclasificadores. Carlos J. Alonso González Departamento de Informática Universidad de Valladolid

Introducción a los sistemas Multiclasificadores. Carlos J. Alonso González Departamento de Informática Universidad de Valladolid Introducción a los sistemas Multiclasificadores Carlos J. Alonso González Departamento de Informática Universidad de Valladolid Contenido 1. Combinación de modelos 2. Descomposición bias-varianza 3. Bagging

Más detalles

Aprendizaje Automatizado. Árboles de Clasificación

Aprendizaje Automatizado. Árboles de Clasificación Aprendizaje Automatizado Árboles de Clasificación Árboles de Clasificación Estudiaremos un algoritmo para la creación del árbol. Selección de atributos comenzando en el nodo raíz. Proceso recursivo. Árboles

Más detalles

Aprendizaje Automatizado. Árboles de Clasificación

Aprendizaje Automatizado. Árboles de Clasificación Aprendizaje Automatizado Árboles de Clasificación Árboles de Clasificación Entrada: Objetos caracterizables mediante propiedades. Salida: En árboles de decisión: una decisión (sí o no). En árboles de clasificación:

Más detalles

Introducción a selección de. Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012

Introducción a selección de. Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012 Introducción a selección de atributos usando WEKA Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012 Contenido 1 Introducción a WEKA El origen Interfaces

Más detalles

Optimización Heurística

Optimización Heurística Recocido Simulado (RS) Optimización Heurística Recocido Simulado Problema de la búsqueda local: Como siempre trata de mejorar, se atora en los máximos locales Idea: Escapar de máximos locales permitiendo

Más detalles

Taller #3. Carlos Reveco Cinthya Vergara

Taller #3. Carlos Reveco Cinthya Vergara Taller #3 Carlos Reveco creveco@dcc.uchile.cl Cinthya Vergara cvergarasilv@ing.uchile.cl 1 Taller#3 - Uso de RapidMiner 5.0 Limpieza y selección de datos Data Cleansing: Eliminación de valores nulos o

Más detalles

Análisis de imágenes digitales

Análisis de imágenes digitales Análisis de imágenes digitales SEGMENTACIÓN DE LA IMAGEN Segmentación basada en texturas INTRODUCCIÓN La textura provee información sobre la distribución espacio-local del color o niveles de intensidades

Más detalles

Capítulo 4. Reconocimiento de patrones. A lo largo del siglo pasado, se llevó a cabo investigación en el área de

Capítulo 4. Reconocimiento de patrones. A lo largo del siglo pasado, se llevó a cabo investigación en el área de Capítulo 4 Reconocimiento de patrones 4.1 Reconocimiento de patrones como un campo de estudios A lo largo del siglo pasado, se llevó a cabo investigación en el área de reconocimiento de patrones en todas

Más detalles

Clasificación de documentos

Clasificación de documentos Minería de Datos Web P r o f. D r. M a r c e l o G. A r m e n t a n o I S I S TA N, F a c. d e C s. E x a c t a s, U N I C E N m a r c e l o. a r m e n t a n o @ i s i s t a n. u n i c e n. e d u. a r

Más detalles

ALGORÍTMICA

ALGORÍTMICA ALGORÍTMICA 2012 2013 Parte I. Introducción a las Metaheurísticas Tema 1. Metaheurísticas: Introducción y Clasificación Parte II. Métodos Basados en Trayectorias y Entornos Tema 2. Algoritmos de Búsqueda

Más detalles

Métodos de Inteligencia Artificial

Métodos de Inteligencia Artificial Métodos de Inteligencia Artificial L. Enrique Sucar (INAOE) esucar@inaoep.mx ccc.inaoep.mx/esucar Tecnologías de Información UPAEP Agentes que Aprenden: Clasificador Bayesiano Clasificación Clasificador

Más detalles

GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC)

GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC) GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC) Curso Académico: 2015-2016 Programa: Centro: Universidad: Máster Universitario en Ingeniería Informática Escuela Politécnica Superior

Más detalles

Combinación de Clasificadores

Combinación de Clasificadores Combinación de Clasificadores Parte 1: Métodos de comité, Bagging, Boosting Reconocimiento de Patrones Departamento de Procesamiento de Señales Instituto de Ingeniería Eléctrica Facultad de Ingeniería,

Más detalles

ordenan de modo tal que unas pocas (las primeras) retengan la mayor cantidad de variación presente en el conjunto original de características [3].

ordenan de modo tal que unas pocas (las primeras) retengan la mayor cantidad de variación presente en el conjunto original de características [3]. Scientia et Technica Año XIII, No 35, Agosto de 2007. Universidad Tecnológica de Pereira.. ISSN 0122-1701 139 SELECCIÓN DE CARACTERÍSTICAS ORIENTADA A SISTEMAS DE RECONOCIMIENTO DE GRANOS MADUROS DE CAFÉ.

Más detalles

Minería de Datos. Arturo Olvera López

Minería de Datos. Arturo Olvera López Benemérita Universidad Autónoma de Puebla Facultad de Ciencias de la Computación Minería de Datos Arturo Olvera López aolvera@cs.buap.mx 1 1 Data Warehouse and OLAP 66 Data Warehouse 67 OLTP, OLAP 68 Data

Más detalles

Procedimientos de búsqueda miopes aleatorizados y adaptativos (GRASP)

Procedimientos de búsqueda miopes aleatorizados y adaptativos (GRASP) Procedimientos de búsqueda miopes aleatorizados y adaptativos (GRASP) Se basan en la premisa de que soluciones iniciales diversas y de buena calidad juegan un papel importante en el éxito de métodos de

Más detalles

Preprocesamiento: Dr. Edgar Acuña Departamento de Ciencias Matemáticas Universidad de Puerto Rico-Mayaguez

Preprocesamiento: Dr. Edgar Acuña Departamento de Ciencias Matemáticas Universidad de Puerto Rico-Mayaguez Minería de Datos Preprocesamiento: Reducción de dimensionalidad Dr. Edgar Acuña Departamento de Ciencias Matemáticas Universidad de Puerto Rico-Mayaguez E-mail: edgar@math.uprm.edu, eacunaf@gmail.com Website:

Más detalles

Carteras minoristas. árbol de decisión. Ejemplo: Construcción de un scoring de concesión basado en un DIRECCIÓN GENERAL DE SUPERVISIÓN

Carteras minoristas. árbol de decisión. Ejemplo: Construcción de un scoring de concesión basado en un DIRECCIÓN GENERAL DE SUPERVISIÓN Carteras minoristas Ejemplo: Construcción de un scoring de concesión basado en un árbol de decisión Grupo de Tesorería y Modelos de Gestión de Riesgos Sergio Gavilá II Seminario sobre Basilea II Validación

Más detalles

Redes Neuronales Artificiales

Redes Neuronales Artificiales Algoritmo de retropropagación Back propagation Es utilizado para entrenar redes neuronales multicapa. Exige que la función de activación de las neuronas sea derivable y creciente. Las funciones comúnmente

Más detalles

Introducción Aprendizaje de Máquina. Gerardo Gutiérrez Gutiérrez Alexis Rodríguez Gutiérrez

Introducción Aprendizaje de Máquina. Gerardo Gutiérrez Gutiérrez Alexis Rodríguez Gutiérrez Introducción Aprendizaje de Máquina Gerardo Gutiérrez Gutiérrez Alexis Rodríguez Gutiérrez Qué es Aprendizaje de Máquina? "Field of study that gives computers the ability to learn without being explicitly

Más detalles

GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC)

GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC) GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC) Curso Académico: 2017-2018 Programa: Centro: Universidad: Máster Universitario en Ingeniería Informática Universidad Autónoma de

Más detalles

Anexo 2. Te cnicas de Modelado y Disen o de Pruebas

Anexo 2. Te cnicas de Modelado y Disen o de Pruebas Anexo 2. Te cnicas de Modelado y Disen o de Pruebas Contenido 1. Introducción... 2 2. Técnicas de Minería de Datos Seleccionadas... 2 2.1 Técnica de Reglas de Asociación... 2 2.1.1 Objetivo al aplicar

Más detalles

CAPÍTULO 2 MARCO TEÓRICO

CAPÍTULO 2 MARCO TEÓRICO CAPÍTULO 2 MARCO TEÓRICO Reconocimiento de Patrones El reconocimiento de patrones es utiliza actualmente para la solución de tareas tales como el reconocimiento de caracteres, de huellas digitales y reconocimiento

Más detalles

Inteligencia Artificial: Su uso para la investigación

Inteligencia Artificial: Su uso para la investigación Inteligencia Artificial: Su uso para la investigación Dra. Helena Montserrat Gómez Adorno Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas helena.adorno@iimas.unam.mx 1 Introducción

Más detalles

Tema 02: Algoritmia y pseudocódigo

Tema 02: Algoritmia y pseudocódigo M. en C. Edgardo Adrián Franco Martínez http://www.eafranco.com edfrancom@ipn.mx @edfrancom edgardoadrianfrancom Estructuras de datos (Prof. Edgardo A. Franco) 1 Contenido Pseudocódigo Ejemplo 01 Ejemplo

Más detalles

Tema 2: Algoritmos Genéticos

Tema 2: Algoritmos Genéticos Tema 2: Algoritmos Genéticos p. 1/3 Tema 2: Algoritmos Genéticos Abdelmalik Moujahid, Iñaki Inza y Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del País

Más detalles

Aplicación a la Computación Distribuida

Aplicación a la Computación Distribuida Métodos de Optimización Multiobjetivo. Aplicación a la Computación Distribuida Dr. Miguel Ángel Vega Rodríguez Grupo de Investigación ARCO (http://arco.unex.es) Universidad de Extremadura 0. Índice de

Más detalles

COMBINATORIA. Manuel Cortés Izurdiaga. Preparación Olimpiada RSME

COMBINATORIA. Manuel Cortés Izurdiaga. Preparación Olimpiada RSME COMBINATORIA Manuel Cortés Izurdiaga Preparación Olimpiada RSME COMBINATORIA Combinatoria Consiste en contar el número de elementos de un conjunto finito. COMBINATORIA Combinatoria Consiste en contar el

Más detalles

SISTEMAS INTELIGENTES

SISTEMAS INTELIGENTES SISTEMAS INTELIGENTES T4: Algoritmos Genéticos {jdiez, juanjo} @ aic.uniovi.es La idea es Qué pretende la IA? Producir agentes inteligentes Cuál es el mejor ejemplo de agente inteligente? El Hombre Cómo

Más detalles

Clustering: Algoritmos

Clustering: Algoritmos Clustering: Algoritmos Clasificación no supervisada Javier G. Sogo 10 de marzo de 2015 1 Introducción 2 Algoritmo: K-medias 3 Algoritmo: BFR 4 Algoritmo: CURE Introducción Acotar el problema Complejidad

Más detalles

Aprendizaje basado en ejemplos.

Aprendizaje basado en ejemplos. Aprendizaje basado en ejemplos. In whitch we describe agents that can improve their behavior through diligent study of their own experiences. Porqué queremos que un agente aprenda? Si es posible un mejor

Más detalles

Inteligencia en Redes de Comunicaciones. Aprendizaje. Raquel M. Crespo García Julio Villena Román. {rcrespo,

Inteligencia en Redes de Comunicaciones. Aprendizaje. Raquel M. Crespo García Julio Villena Román. {rcrespo, Inteligencia en Redes de Comunicaciones Aprendizaje Raquel M. Crespo García Julio Villena Román {rcrespo, jvillena}@it.uc3m.es Objetivo El objetivo es dotar a los sistemas de inteligencia artificial con

Más detalles

Clustering: Auto-associative Multivariate Regression Tree (AAMRT)

Clustering: Auto-associative Multivariate Regression Tree (AAMRT) Introducción Tipos Validación AAMRT Clustering: Auto-associative Multivariate Regression Tree (AAMRT) Miguel Bernal C Quantil 12 de diciembre de 2013 Miguel Bernal C Quantil Matemáticas Aplicadas Contenido

Más detalles

CONSTRUCCIÓN AUTOMÁTICA DE REGLAS DE INVERSIÓN UTILIZANDO PROGRAMACIÓN GENÉTICA

CONSTRUCCIÓN AUTOMÁTICA DE REGLAS DE INVERSIÓN UTILIZANDO PROGRAMACIÓN GENÉTICA CONSTRUCCIÓN AUTOMÁTICA DE REGLAS DE INVERSIÓN UTILIZANDO PROGRAMACIÓN GENÉTICA Mario Alberto Llorente Lopez PFC Ingeniería en Informática 24 de Enero de 2012 CONTENIDO Introducción Objetivos Planificación

Más detalles

Índice...i. Notación...vii. Acrónimos...xi. Relación de figuras...xiii. Relación de tablas...xvii

Índice...i. Notación...vii. Acrónimos...xi. Relación de figuras...xiii. Relación de tablas...xvii Índice. Índice.....i Notación....vii Acrónimos.....xi Relación de figuras...xiii Relación de tablas...xvii 1 Introducción...1 1.1 Planteamiento general del problema de optimización...3 1.2 Técnicas de

Más detalles

Método de árbol de cubos para resolver problemas de optimización discreta en la toma de decisiones. CONTENIDO

Método de árbol de cubos para resolver problemas de optimización discreta en la toma de decisiones. CONTENIDO Método de árbol de cubos para resolver problemas de optimización discreta en la toma de decisiones. 1 CONTENIDO Introducción Marco teórico Métodos de optimización Método de árbol de cubos Problema de optimización

Más detalles

Análisis del Error en Redes Neuronales: Corrección de los Datos y Distribuciones no Balanceadas

Análisis del Error en Redes Neuronales: Corrección de los Datos y Distribuciones no Balanceadas Tesis Doctoral 7 de octubre de 2010 Análisis del Error en Redes Neuronales: Corrección de los Datos y Distribuciones no Balanceadas Dr. Roberto Alejo Eleuterio Índice Introducción Medidas de evaluación

Más detalles

Una revisión a algoritmos de selección de atributos que tratan la redundancia en datos microarreglos

Una revisión a algoritmos de selección de atributos que tratan la redundancia en datos microarreglos Tipo de artículo: Artículo de revisión Temática: Inteligencia artificial Recibido: 18/10/2012 Aceptado: 25/10/2013 Publicado: 10/12/2013 Una revisión a algoritmos de selección de atributos que tratan la

Más detalles