Selección de atributos

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Selección de atributos"

Transcripción

1 Selección de atributos Series Temporales Máster en Computación Universitat Politècnica de Catalunya Dra. Alicia Troncoso Lora 1

2 Contenido Introducción Clasificación de las técnicas Esquema General Evaluadores Subconjuntos Ranking Métodos de Búsqueda Referencias 2

3 Introducción (I) Los algoritmos de selección de características tienen dos objetivos principales: Reducir el coste computacional asociado tanto al aprendizaje como al propio modelo de conocimiento generado (eliminando atributos irrelevantes o redundantes) Aumentar la precisión de dicho modelo (eliminando atributos perjudiciales para el aprendizaje). 3

4 Introducción (II) Para llevar a cabo su objetivo, los métodos de selección realizan una búsqueda supervisada sobre el espacio de características, aplicando una función criterio que evalúa la calidad del subconjunto seleccionado. Dicha búsqueda suele ser heurística, ya que una búsqueda exhaustiva supone un problema combinatorio, resultando ésta enormemente costosa. Para su mejor funcionamiento precisa de una limpieza previa de los datos (outliers, valores ausentes, ruido, ) 4

5 Clasificación de las Técnicas Según la función criterio o Evaluador: Wrappers: la función criterio utilizada es el propio conjunto de reglas generadas por el algoritmo de aprendizaje que posteriormente se usará en la clasificación. Filtros: la función de criterio es independiente del algoritmo de aprendizaje, usando medidas de distancia, información o dependencia. Según el resultado: Individual: genera un ranking de atributos con todos Subconjunto: genera un subconjunto de atributos 5

6 Esquema General EVALUADOR: Individual (Ranking) Subconjunto MÉTODO DE BÚSQUEDA: En función del Evaluador 6

7 Esquema General (Weka [1]) Subconjuntos (-SubsetEval) Ranking (-AttributeEval) 7

8 Evaluadores - Subconjuntos (I) CFS [2]: Filtro Evaluador basado en correlaciones: Maximiza la correlación con la clase y minimiza la intercorrelación del subconjunto WEKA: AttributeSelection CfsSubsetEval ClassifierSubsetEval: Wrapper Usa un clasificador para evaluar los diferentes conjuntos que se obtienen con el método de búsqueda sin hacer validación cruzada WEKA: AttributeSelection ClassifierSubsetEval WrapperSubsetEval: Wrapper Igual que el anterior pero con validación cruzada de n folds (n es un parámetro que por defecto es 5) WEKA: AttributeSelection WrapperSubsetEval 8

9 Evaluadores - Subconjuntos (II) ConsistencySubsetEval: Filtro TODOS ATRIBUTOS DISCRETOS O DISCRETIZADOS Elige el subconjunto más consistente respecto a la clase: Inconsistencia: Quita un atributo y si hay ejemplos iguales con distinta clase, hay inconsistencia, luego el atributo es importante. Inconveniente: Atributos como el DNI son seleccionados por ser de consistencia máxima WEKA: AttributeSelection ConsistencySubsetEval 9

10 Evaluadores Ranking RELIEF: Mira el k-vecino más cercano y el k-enemigo más cercano (10 vecinos por defecto) y pondera los atributos mediante una fórmula (depende de la versión) WEKA: AttributeSelection ReliefFAtributeEval Ganancia de Información (atributos discretos): Ganancia(Class, Atrib) = H(Class) - H(Class Attribute) WEKA: AttributeSelection InfogainAttributeEval Razón de Ganancia (atributos discretos): GainR(Class, Attribute) = (H(Class) - H(Class Attribute)) / H(Attribute) WEKA: AttributeSelection GainRatioAttributeEval Chi2 (atributos discretos): Usa estadístico Chi-cuadrado WEKA: AttributeSelection ChiSquaredAttributeEval 10

11 Métodos de Búsqueda El método de búsqueda va a depender del evaluador seleccionado previamente. Si es un Evaluador Individual (Ranking), el único método de búsqueda es Ranker Si es un Evaluador de Subconjuntos: Greedy (GreedyStepwise): Coge el mejor de todos, luego la mejor pareja que lo incluye, luego el mejor trío que incluye a los anteriores. Así hasta que no hay mejora. Primero el mejor (BestFirst): Lo mismo que Greedy pero aplicando Backtracking con un número máximo de regresos (5 por defecto) Exhaustiva (ExhaustiveSearch): Todos los posibles subconjuntos Aleatoria (RandomSearch) Algoritmo Genético (GeneticSearch) Y muchos más. 11

12 Aplicación a Precios de la energía eléctrica 24 horas del dia d Selección atributos-precios horas del día d

13 Aplicación a Precios de la energía eléctrica 24 horas del día d Selección de Atributos-Precios horas del día d

14 Ejercicio 1: Glass2 Eliminar valores perdidos Ejecute los 4 evaluadores de subconjuntos con el método de búsqueda BestFirst sin validación cruzada ( Use full training set) CfsSubsetEval ClassifierSubsetEval (clasificador IB1 y UseTraining = true) WapperSubsetEval (clasificador IB1) ConsistencySubsetEval Anotar en la tabla los atributos seleccionados Clasificar con 1 vecino más cercano anotando en la tabla el error obtenido con las 5 bases de datos (la original y las cuatro nuevas). 14

15 Ejercicio 1: Glass2 Evaluador CfsSubsetEval ClassifierSubsetEval WapperSubsetEval ConsistencySubsetEval Ninguno Atributos seleccionados Todos IB1 (10-CV) 15

16 Ejercicio 2: Repetir el ejercicio 1 con las bases de datos de la UCI autos colic iris wine 16

17 Ejercicio 3: Demanda de energía eléctrica Descripción 24 atributos correspondientes a la demanda de energía de las 24 horas antes (h1,,h24) a la que se quiere predecir que corresponde con el atributo clase (h25) 1) Establecer una comparación entre los atributos seleccionados usando distintos Evaluadores de subconjuntos y distintos métodos de búsqueda. 2) Obtener modelos de regresión lineal CON y SIN selección de atributos (WEKA:ClassifierFunctionsLinearRegression) 3) Usar esos modelos para predecir, comparando los errores de predicción 17

18 Referencias [1] Ian H. Witten and Eibe Frank. Data Mining: Practical Machine Learning Tools and Techniques Morgan Kaufmann, June [2] Mark A. Hall. Correlation-based Feature Selection for Machine Learning. PhD thesis, Waikato University, Hamilton, NZ, [3] Kira, Kenji and Rendell, L.A.: A Practical Approach to Feature Selection. ICML International Conference on Machine Learning, pages , 1992 [4] A. Blum, P. Langley. Selection of relevant features and examples in machine learning. In: R. Greiner, D. Subramanian (Eds) Artificial Intelligence on Relevance: pp , [5] H. Liu, L. Yu. Toward integrating feature selection algorithms for classification and clustering. IEEE Transactions on Knowledge and Data Engineering, Vol. 17, pp. 1-12, [6] R. Ruiz, J. C. Riquelme, J. S. Aguilar-Ruiz. Incremental wrapper-based gene selection from microarray expression data for cancer classification. Pattern Recognition, Vol. 39, pp ,

Introducción a selección de. Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012

Introducción a selección de. Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012 Introducción a selección de atributos usando WEKA Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012 Contenido 1 Introducción a WEKA El origen Interfaces

Más detalles

Predicción basada en vecinos

Predicción basada en vecinos Predicción basada en vecinos Series Temporales Máster en Computación Universitat Politècnica de Catalunya Dra. Alicia Troncoso Lora 1 Contenido Introducción Esquema de predicción directa Predicción basada

Más detalles

Técnicas de Preprocesado

Técnicas de Preprocesado Técnicas de Preprocesado Series Temporales Máster en Computación Universitat Politècnica de Catalunya Dra. Alicia Troncoso Lora 1 Contenido Por qué preprocesar p los datos? Técnicas de filtro Depuración

Más detalles

Búsqueda secuencial de subconjuntos de atributos sobre un ranking. Roberto Ruiz, José C. Riquelme y Jesús S. Aguilar Ruiz

Búsqueda secuencial de subconjuntos de atributos sobre un ranking. Roberto Ruiz, José C. Riquelme y Jesús S. Aguilar Ruiz Búsqueda secuencial de subconjuntos de atributos sobre un ranking Roberto Ruiz, José C. Riquelme y Jesús S. Aguilar Ruiz Departamento de Lenguajes y Sistemas Informáticos ETS Ingeniería Informática Universidad

Más detalles

1.-DATOS DE LA ASIGNATURA

1.-DATOS DE LA ASIGNATURA 1.-DATOS DE LA ASIGNATURA Nombre de la asignatura: Minería de Datos Carrera: Ingeniería en Sistemas Computacionales Clave de la asignatura: ADM-0701 Horas teoría-horas práctica-créditos: 3-2-8 2.-HISTORIA

Más detalles

Selección de Atributos. Dr. Jesús Ariel Carrasco Ochoa Oficina 8311

Selección de Atributos. Dr. Jesús Ariel Carrasco Ochoa Oficina 8311 Selección de Atributos Dr. Jesús Ariel Carrasco Ochoa ariel@inaoep.mx Oficina 8311 Contenido Introducción Estrategias de selección Técnicas filter Técnicas wrapper Técnicas híbridas Selección de atributos

Más detalles

Qué es big dimension? Verónica Bolón Canedo 2/30

Qué es big dimension? Verónica Bolón Canedo 2/30 Qué es big dimension? Verónica Bolón Canedo 2/30 Big dimension En esta nueva era de Big Data, los métodos de aprendizaje máquina deben adaptarse para poder tratar con este volumen de datos sin precedentes.

Más detalles

Tema 12. Selección de Variables

Tema 12. Selección de Variables Tema 12. Selección de Variables Pedro Larrañaga, Iñaki Inza, Abdelmalik Moujahid Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del País Vasco Euskal Herriko Unibertsitatea

Más detalles

M1. FUNDAMENTOS DE MINERÍA DE DATOS

M1. FUNDAMENTOS DE MINERÍA DE DATOS MÁSTER OFICIAL DE LA UNIVERSIDAD DE GRANADA "SOFT COMPUTING Y SISTEMAS INTELIGENTES" M1. FUNDAMENTOS DE MINERÍA DE DATOS J.L. CUBERO, F. BERZAL, F. HERRERA Dpto. Ciencias de la Computación e I.A. Universidad

Más detalles

BENEMÉRITA UNIVERSIDAD AUTÓNOMA DE PUEBLA FACULTAD CIENCIAS DE LA COMPUTACIÓN

BENEMÉRITA UNIVERSIDAD AUTÓNOMA DE PUEBLA FACULTAD CIENCIAS DE LA COMPUTACIÓN BENEMÉRITA UNIVERSIDAD AUTÓNOMA DE PUEBLA FACULTAD CIENCIAS DE LA COMPUTACIÓN PROGRAMA DE LA MATERIA CORRESPONDIENTE A LA INGENIERÍA EN CIENCIAS DE LA COMPUTACIÓN Coordinación: NOMBRE DE LA MATERIA: Área

Más detalles

TÓPICOS SELECTOS DE OTROS CURSOS

TÓPICOS SELECTOS DE OTROS CURSOS UNIVERSIDAD AUTÓNOMA DE CHIHUAHUA Clave: 08MSU007H Clave: 08USU4053W FACULTAD DE INGENIERÍA PROGRAMA DEL CURSO: TÓPICOS SELECTOS DE OTROS CURSOS DES: Ingeniería Ingeniería en Sistemas Programa(s) Educativo(s):

Más detalles

Ricardo Aler Mur SELECCIÓN Y GENERACIÓN DE ATRIBUTOS-I

Ricardo Aler Mur SELECCIÓN Y GENERACIÓN DE ATRIBUTOS-I Ricardo Aler Mur SELECCIÓN Y GENERACIÓN DE ATRIBUTOS-I En esta clase se habla de una parte importante del preprocesado de datos: la selección y generación de atributos. La selección de atributos consiste

Más detalles

Guía docente de la asignatura

Guía docente de la asignatura Guía docente de la asignatura Asignatura Materia TÉCNICAS DE APRENDIZAJE AUTOMÁTICO COMPUTACIÓN Módulo Titulación GRADO EN INGENIERÍA INFORMÁTICA (463) Plan 463 Código 45209 Periodo de impartición 2º CUATRIMESTRE

Más detalles

GUÍA DE APRENDIZAJE ASIGNATURA SISTEMAS BASADOS EN APRENDIZAJE AUTOMATICO. CURSO ACADÉMICO - SEMESTRE Primer semestre

GUÍA DE APRENDIZAJE ASIGNATURA SISTEMAS BASADOS EN APRENDIZAJE AUTOMATICO. CURSO ACADÉMICO - SEMESTRE Primer semestre GUÍA DE APRENDIZAJE ASIGNATURA SISTEMAS BASADOS EN APRENDIZAJE AUTOMATICO CURSO ACADÉMICO - SEMESTRE 2015-16 - Primer semestre FECHA DE PUBLICACIÓN Julio - 2015 Datos Descriptivos Nombre de la Asignatura

Más detalles

Aseguramiento de la calidad y pruebas de software

Aseguramiento de la calidad y pruebas de software Y yo qué hago aquí? Weka Aseguramiento de la calidad y pruebas de software 5- Pruebas del software 2a parte estándar IEEE-1012 Automatización de pruebas unitarias 1a parte Blanca A. Vargas Govea vargasgovea@itesm.mx

Más detalles

Aprendizaje Automático

Aprendizaje Automático id3 id3 como búsqueda Cuestiones Adicionales Regresión Lineal. Árboles y Reglas de Regresión Ingeniería Informática Fernando Fernández Rebollo y Daniel Borrajo Millán Grupo de Planificación y Aprendizaje

Más detalles

Feature selection applying algorithms base on rough set and ant colony optimization

Feature selection applying algorithms base on rough set and ant colony optimization Tipo de artículo: Artículo de revisión Temática: Inteligencia artificial Recibido: 7/05/2013 Aceptado: 2/10/2013 Publicado: 21/01/2014 Selección de atributos relevantes aplicando algoritmos que combinan

Más detalles

Introducción a los sistemas Multiclasificadores. Carlos J. Alonso González Departamento de Informática Universidad de Valladolid

Introducción a los sistemas Multiclasificadores. Carlos J. Alonso González Departamento de Informática Universidad de Valladolid Introducción a los sistemas Multiclasificadores Carlos J. Alonso González Departamento de Informática Universidad de Valladolid Contenido 1. Combinación de modelos 2. Descomposición bias-varianza 3. Bagging

Más detalles

Minería de Datos aplicada a la Detección de factores para la prevención de incidentes informáticos.

Minería de Datos aplicada a la Detección de factores para la prevención de incidentes informáticos. Minería de Datos aplicada a la Detección de factores para la prevención de incidentes informáticos. Corso Cynthia, García Alejandro, Ciceri Leonardo, Romero Fernando. Laboratorio de Sistemas de Información

Más detalles

ANX-PR/CL/ GUÍA DE APRENDIZAJE

ANX-PR/CL/ GUÍA DE APRENDIZAJE PROCESO DE COORDINACIÓN DE LAS ENSEÑANZAS PR/CL/001 ASIGNATURA 615000365 - PLAN DE ESTUDIOS 61SI - CURSO ACADÉMICO Y SEMESTRE 2017/18 - Segundo semestre Índice Guía de Aprendizaje 1. Datos descriptivos...1

Más detalles

Estadística Predictiva para Horarios en el Transporte Urbano

Estadística Predictiva para Horarios en el Transporte Urbano Estadística Predictiva para Horarios en el Transporte Urbano Tomás J. Moreyra FaMAF Resumen En este trabajo presentamos una primera aproximación a la predicción de los horarios de llegada reales de transporte

Más detalles

GUÍA DOCENTE. Curso 2012-2013. Ingeniería Informática en Sistemas de Información Doble Grado:

GUÍA DOCENTE. Curso 2012-2013. Ingeniería Informática en Sistemas de Información Doble Grado: 1. DESCRIPCIÓN DE LA ASIGNATURA Grado: Ingeniería Informática en Sistemas de Información Doble Grado: Asignatura: Minería de Datos Módulo: Modulo 8 Departamento: Deporte e Informática Año académico: 2012/2013

Más detalles

Interfaces de programación de aplicaciones para minería de datos. PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR

Interfaces de programación de aplicaciones para minería de datos. PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR Interfaces de programación de aplicaciones para minería de datos PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR Software a instalar para el curso RapidMiner Community Edition http://rapid-i.com/content/view/181/190/

Más detalles

Interfaces de programación de aplicaciones para minería de datos. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR

Interfaces de programación de aplicaciones para minería de datos. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Interfaces de programación de aplicaciones para minería de datos CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Software instalado para el curso RapidMiner Community Edition

Más detalles

Aproximación evolutiva a la inducción constructiva basada en expresiones algebraicas

Aproximación evolutiva a la inducción constructiva basada en expresiones algebraicas Aproximación evolutiva a la inducción constructiva basada en expresiones algebraicas Manuel Baena García, Rafael Morales Bueno y Carlos Cotta Porras Workshop MOISES Septiembre 2004 1/15 Contenido Inducción

Más detalles

Minería de datos Unidad 2. El proceso KDD

Minería de datos Unidad 2. El proceso KDD Minería de datos Unidad 2. El proceso KDD M en I Sara Vera Noguez 2. La minería de datos en el proceso de KDD Etapas de proceso de KDD: 1) Integración y recopilación 2) Selección, Limpieza (también llamada

Más detalles

Inducción de Árboles de Decisión ID3, C4.5

Inducción de Árboles de Decisión ID3, C4.5 Inducción de Árboles de Decisión ID3, C4.5 Contenido 1. Representación mediante árboles de decisión. 2. Algoritmo básico: divide y vencerás. 3. Heurística para la selección de atributos. 4. Espacio de

Más detalles

Aplicaciones. Inteligencia Computacional Carrera de Ingeniería Informática

Aplicaciones. Inteligencia Computacional Carrera de Ingeniería Informática Aplicaciones Inteligencia Computacional Carrera de Ingeniería Informática Aplicaciones de IC Unidad VIII: Configuración del problema y aplicación de las técnicas de inteligencia computacional en: clasificación

Más detalles

Weka: Waitako Environment for Knowledge Analysis

Weka: Waitako Environment for Knowledge Analysis Weka: Waitako Environment for Knowledge Analysis Introducción Explorer Carlos J. Alonso González Departamento de Informática Universidad de Valladolid Contenidos Fuentes Introducción The Explorer Introducción

Más detalles

Random Subspace Method. Índice. 1. Random Subspace Method. 1. Introducción. 2. Objetivo. 3. Implementación. 4. Evaluación. 5.

Random Subspace Method. Índice. 1. Random Subspace Method. 1. Introducción. 2. Objetivo. 3. Implementación. 4. Evaluación. 5. The Random Subspace Method for Constructing Decision Forests (IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, VOL. 20, NO. 8, AUGUST 1998) Iñigo Barandiaran 1 Índice 1. Random Subspace

Más detalles

INTELIGENCIA DE NEGOCIO

INTELIGENCIA DE NEGOCIO INTELIGENCIA DE NEGOCIO 2016-2017 Tema 1. Introducción a la Inteligencia de Negocio Tema 2. Minería de Datos. Ciencia de Datos Tema 3. Modelos de Predicción: Clasificación, regresión y series temporales

Más detalles

IAAE - Inteligencia Artificial Aplicada a la Ingeniería

IAAE - Inteligencia Artificial Aplicada a la Ingeniería Unidad responsable: Unidad que imparte: Curso: Titulación: Créditos ECTS: 2017 295 - EEBE - Escuela de Ingeniería de Barcelona Este 723 - CS - Departamento de Ciencias de la Computación GRADO EN INGENIERÍA

Más detalles

Clasificación de patrones Introducción

Clasificación de patrones Introducción Clasificación de patrones Introducción Jordi Porta Zamorano Escuela Politécnica Superior Universidad Autónoma de Madrid jordi.porta@uam.es Dept. de Lingü ıstica Computacional Real Academia Española porta@rae.es

Más detalles

Estadística Computacional

Estadística Computacional Estadística Computacional Profesor : Héctor Allende O. Departamento de Informática Universidad Técnica Federico Santa María Estructura del Curso 1.- Introducción. 2.- Análisis Exploratorio de Datos. 3.-

Más detalles

ESTUDIO DEL COMPORTAMIENTO DE LA MORTALIDAD EN CHILE BASADO EN LA MINERÍA DE DATOS Y ANÁLISIS PREDICTIVOS

ESTUDIO DEL COMPORTAMIENTO DE LA MORTALIDAD EN CHILE BASADO EN LA MINERÍA DE DATOS Y ANÁLISIS PREDICTIVOS PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE INGENIERÍA ESCUELA DE INGENIERÍA INFORMÁTICA ESTUDIO DEL COMPORTAMIENTO DE LA MORTALIDAD EN CHILE BASADO EN LA MINERÍA DE DATOS Y ANÁLISIS PREDICTIVOS

Más detalles

Programa(s) Educativo(s): Clave de la materia: Semestre:

Programa(s) Educativo(s): Clave de la materia: Semestre: UNIVERSIDAD AUTÓNOMA DE CHIHUAHUA Clave: 08MSU0017H Clave: 08USU4053W FACULTAD DE INGENIERÍA MINERÍA DE DATOS DES: Programa(s) Educativo(s): Tipo de materia: Clave de la materia: Semestre: Área en plan

Más detalles

Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Introducción al aprendizaje supervisado Profesor: Dr. Wilfrido Gómez Flores 1 Conceptos básicos Desde la antigüedad, el problema de buscar patrones en datos es fundamental en diversas

Más detalles

Jesús García Herrero METODOLOGÍA DE ANÁLISIS DE DATOS

Jesús García Herrero METODOLOGÍA DE ANÁLISIS DE DATOS Jesús García Herrero METODOLOGÍA DE ANÁLISIS DE DATOS En esta clase concluimos el curso de Análisis de Datos con una visión de las metodologías del análisis de datos. Como se ha visto, este es un campo

Más detalles

Evaluación de Rankings de Atributos para Clasificación

Evaluación de Rankings de Atributos para Clasificación Evaluación de Rankings de Atributos para Clasificación Roberto Ruiz, Jesús S. Aguilar Ruiz, and José C. Riquelme Departamento de Lenguajes y Sistemas Informáticos Universidad de Sevilla, Sevilla, España

Más detalles

IAAE - Inteligencia Artificial Aplicada a la Ingeniería

IAAE - Inteligencia Artificial Aplicada a la Ingeniería Unidad responsable: Unidad que imparte: Curso: Titulación: Créditos ECTS: 2016 295 - EEBE - Escuela de Ingeniería de Barcelona Este 723 - CS - Departamento de Ciencias de la Computación GRADO EN INGENIERÍA

Más detalles

Programa Educativo (PE): Ingeniería en Ciencias de la Computación. Área: Tecnología. Programa de Asignatura: Minería de Datos.

Programa Educativo (PE): Ingeniería en Ciencias de la Computación. Área: Tecnología. Programa de Asignatura: Minería de Datos. Programa Educativo (PE): Ingeniería en Ciencias de la Computación Área: Tecnología Programa de Asignatura: Minería de Datos Código: CCOM-606 Créditos: 5 Fecha: Julio de 2009 1 1. DATOS GENERALES Nivel

Más detalles

Posibles trabajos HIA

Posibles trabajos HIA Posibles trabajos HIA Posibles trabajos Comparar otras herramientas de Minería de Datos con Weka Estudiar la influencia del ruido en bagging y boosting Estudiar la influencia del parámetro de poda en J48

Más detalles

Programa Educativo (PE): Licenciatura en Ciencias de la Computación. Área: Tecnología. Programa de Asignatura: Minería de Datos.

Programa Educativo (PE): Licenciatura en Ciencias de la Computación. Área: Tecnología. Programa de Asignatura: Minería de Datos. Programa Educativo (PE): Licenciatura en Ciencias de la Computación Área: Tecnología Programa de Asignatura: Minería de Datos Código: CCOM-606 Créditos: 5 Fecha: Julio de 2009 1 1. DATOS GENERALES Nivel

Más detalles

Proyecto Final Detección de fraude en tarjeta de crédito

Proyecto Final Detección de fraude en tarjeta de crédito Proyecto Final Detección de fraude en tarjeta de crédito Reconocimiento de Patrones Autores Ignacio Gómez Ana Clara Rodríguez Reconocimiento de Patrones Instituto de Ingeniería Eléctrica Montevideo, Uruguay

Más detalles

Métodos para Determinar el Atributo Distinguido en Multiredes Bayesianas

Métodos para Determinar el Atributo Distinguido en Multiredes Bayesianas Métodos para Determinar el Atributo Distinguido en Multiredes Bayesianas Andrés Cano Utrera Fco. Javier García Castellano Andrés R. Masegosa Arredondo Serafín Moral Callejón Uncertainty Treatment in Artificial

Más detalles

Métodos basados en instancias. K-vecinos, variantes

Métodos basados en instancias. K-vecinos, variantes Métodos basados en instancias K-vecinos, variantes Contenido 1. Caracterización 2. K-vecinos más próximos 3. Mejoras al algoritmo básico 4. Bibliografía 2 1. Caracterización Forma más sencilla de aprendizaje:

Más detalles

Autores: Carlos Aguilar Aguilar 1, Viviana R. Toledo Rivero 2, Kadir Hector Ortíz 3, Institución: UMET, Quito, Ecuador Universidad de Cienfuegos, Cuba

Autores: Carlos Aguilar Aguilar 1, Viviana R. Toledo Rivero 2, Kadir Hector Ortíz 3, Institución: UMET, Quito, Ecuador Universidad de Cienfuegos, Cuba Determinación de rasgos útiles al proceso de aprendizaje automático sobre el conjunto de datos en estudiantes de 1er y 2do año de Ingeniería Informática en Cienfuegos Autores: Carlos Aguilar Aguilar 1,

Más detalles

Introducción a la minería de datos

Introducción a la minería de datos Introducción a la minería de datos 1 Temario Qué es minería de datos? Quién usa minería de datos? Por qué de la minería de datos? Ciclo virtuoso de la minería de datos 2 Definición de minería de datos

Más detalles

Inteligencia Artificial: Su uso para la investigación

Inteligencia Artificial: Su uso para la investigación Inteligencia Artificial: Su uso para la investigación Dra. Helena Montserrat Gómez Adorno Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas helena.adorno@iimas.unam.mx 1 Introducción

Más detalles

Selección de características. Reconocimiento de Patrones 2013

Selección de características. Reconocimiento de Patrones 2013 Selección de características Reconocimiento de Patrones 2013 Selección de características Estrategia de búsqueda óptima o sub-optima para la selección de un sub-conjunto de características para el diseño

Más detalles

GUÍA DOCENTE. Ingeniería Informática en Sistemas de Información. Ingeniería del Software, Sistemas de Información y Sistemas Inteligentes

GUÍA DOCENTE. Ingeniería Informática en Sistemas de Información. Ingeniería del Software, Sistemas de Información y Sistemas Inteligentes 1. DESCRIPCIÓN DE LA ASIGNATURA Grado: Ingeniería Informática en Sistemas de Información Asignatura: Inteligencia Artificial Módulo: Ingeniería del Software, Sistemas de Información y Sistemas Inteligentes

Más detalles

Tema 7: Aprendizaje de árboles de decisión

Tema 7: Aprendizaje de árboles de decisión Inteligencia Artificial 2 Curso 2002 03 Tema 7: Aprendizaje de árboles de decisión José A. Alonso Jiménez Miguel A. Gutiérrez Naranjo Francisco J. Martín Mateos José L. Ruiz Reina Dpto. de Ciencias de

Más detalles

Ricardo Aler Mur CLASIFICADORES KNN-I

Ricardo Aler Mur CLASIFICADORES KNN-I Ricardo Aler Mur CLASIFICADORES KNN-I En esta clase se habla del aprendizaje de modelos de clasificación y regresión basados en instancias o ejemplares. En concreto: Se define la clasificación y regresión

Más detalles

MINERIA DE DATOS USANDO SISTEMAS INTELIGENTES

MINERIA DE DATOS USANDO SISTEMAS INTELIGENTES MINERIA DE DATOS USANDO SISTEMAS INTELIGENTES Año 2017 Carrera/Plan: Licenciatura en Sistemas Licenciatura en Informática Área: Algoritmos y Lenguajes Año: 4º o 5º año Régimen de Cursada: Semestral Carácter:

Más detalles

MINERIA DE DATOS USANDO SISTEMAS INTELIGENTES

MINERIA DE DATOS USANDO SISTEMAS INTELIGENTES MINERIA DE DATOS USANDO SISTEMAS INTELIGENTES Año 2015 Carrera/Plan: Licenciatura en Sistemas Licenciatura en Informática Área: Algoritmos y Lenguajes Año: 4º o 5º año Régimen de Cursada: Semestral Carácter:

Más detalles

Introducción Aprendizaje de Máquina. Gerardo Gutiérrez Gutiérrez Alexis Rodríguez Gutiérrez

Introducción Aprendizaje de Máquina. Gerardo Gutiérrez Gutiérrez Alexis Rodríguez Gutiérrez Introducción Aprendizaje de Máquina Gerardo Gutiérrez Gutiérrez Alexis Rodríguez Gutiérrez Qué es Aprendizaje de Máquina? "Field of study that gives computers the ability to learn without being explicitly

Más detalles

IAAE - Inteligencia Artificial Aplicada a la Ingeniería

IAAE - Inteligencia Artificial Aplicada a la Ingeniería Unidad responsable: Unidad que imparte: Curso: Titulación: Créditos ECTS: 2017 295 - EEBE - Escuela de Ingeniería de Barcelona Este 723 - CS - Departamento de Ciencias de la Computación GRADO EN INGENIERÍA

Más detalles

IAAE - Inteligencia Artificial Aplicada a la Ingeniería

IAAE - Inteligencia Artificial Aplicada a la Ingeniería Unidad responsable: Unidad que imparte: Curso: Titulación: Créditos ECTS: 2017 295 - EEBE - Escuela de Ingeniería de Barcelona Este 723 - CS - Departamento de Ciencias de la Computación GRADO EN INGENIERÍA

Más detalles

MÁSTER EN INGENIERÍA DE LOS RECURSOS NATURALES TRABAJO FINAL DE MÁSTER

MÁSTER EN INGENIERÍA DE LOS RECURSOS NATURALES TRABAJO FINAL DE MÁSTER MÁSTER EN INGENIERÍA DE LOS RECURSOS NATURALES TRABAJO FINAL DE MÁSTER ESTUDIO COMPARATIVO SOBRE ACCIDENTES LABORALES EN EL SECTOR MINERO ESPAÑOL, A CIELO ABIERTO Y SUBTERRÁNEO, MEDIANTE EL USO DE TÉCNICAS

Más detalles

A3. Ciencia de datos y aprendizaje automático

A3. Ciencia de datos y aprendizaje automático A3. Ciencia de datos y aprendizaje automático MÁSTER UNIVERSITARIO EN INVESTIGACIÓN EN INTELIGENCIA ARTIFICIAL UNIVERSIDAD INTERNACIONAL MENÉNDEZ PELAYO Este documento puede utilizarse como documentación

Más detalles

Tareas de la minería de datos: clasificación. PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR

Tareas de la minería de datos: clasificación. PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR Tareas de la minería de datos: clasificación PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR Tareas de la minería de datos: clasificación Clasificación (discriminación) Empareja o asocia datos

Más detalles

ESCUELA POLITÉCNICA SUPERIOR DE CÓRDOBA GRADO DE INGENIERÍA INFORMÁTICA CURSO 2013/14 ASIGNATURA: INTRODUCCIÓN A LOS MODELOS COMPUTACIONALES

ESCUELA POLITÉCNICA SUPERIOR DE CÓRDOBA GRADO DE INGENIERÍA INFORMÁTICA CURSO 2013/14 ASIGNATURA: INTRODUCCIÓN A LOS MODELOS COMPUTACIONALES ESCUELA POLITÉCNICA SUPERIOR DE CÓRDOBA GRADO DE INGENIERÍA INFORMÁTICA CURSO 2013/14 ASIGNATURA: INTRODUCCIÓN A LOS MODELOS COMPUTACIONALES DATOS DE LA ASIGNATURA Denominación: INTRODUCCIÓN A LOS MODELOS

Más detalles

Área Académica: Sistemas Computacionales. Tema: Explotación de un Almacén de Datos: Herramientas OLAP. Profesor: Mtro Felipe de Jesus Nuñez Cardenas

Área Académica: Sistemas Computacionales. Tema: Explotación de un Almacén de Datos: Herramientas OLAP. Profesor: Mtro Felipe de Jesus Nuñez Cardenas Área Académica: Sistemas Computacionales Tema: Explotación de un Almacén de Datos: Herramientas OLAP Profesor: Mtro Felipe de Jesus Nuñez Cardenas Periodo:Agosto Noviembre 2011 Keywords Herramientas OLAP,

Más detalles

Método de Selección de Atributos por Clase

Método de Selección de Atributos por Clase Método de Selección de Atributos por Clase por Bárbara Berenice Pineda Bautista Tesis sometida como requisito parcial para obtener el grado de MAESTRO EN CIENCIAS EN EL ÁREA DE CIENCIAS COMPUTACIONALES

Más detalles

Aprendizaje Automatizado. Árboles de Clasificación

Aprendizaje Automatizado. Árboles de Clasificación Aprendizaje Automatizado Árboles de Clasificación Árboles de Clasificación Estudiaremos un algoritmo para la creación del árbol. Selección de atributos comenzando en el nodo raíz. Proceso recursivo. Árboles

Más detalles

Técnicas de Predicción para la Eficiencia Energética en Smart Cities

Técnicas de Predicción para la Eficiencia Energética en Smart Cities Técnicas de Predicción para la Eficiencia Energética en Smart Cities Fernando J. Isorna 1, Alicia Troncoso 1 1 Departamento de Ingeniería Informática, Universidad Pablo de Olavide fjisoret@alumno.upo.es,

Más detalles

BIOINFORMÁTICA

BIOINFORMÁTICA BIOINFORMÁTICA 2013-2014 PARTE I. INTRODUCCIÓN Tema 1. Computación Basada en Modelos Naturales PARTE II. MODELOS BASADOS EN ADAPTACIÓN SOCIAL (Swarm Intelligence) Tema 2. Introducción a los Modelos Basados

Más detalles

MINERIA DE DATOS USANDO SISTEMAS INTELIGENTES

MINERIA DE DATOS USANDO SISTEMAS INTELIGENTES MINERIA DE DATOS USANDO SISTEMAS INTELIGENTES Año 2018 Carrera/Plan: Licenciatura en Sistemas Licenciatura en Informática Área: Algoritmos y Lenguajes Año: 4º o 5º año Régimen de Cursada: Semestral Carácter:

Más detalles

PREPROCESADO DE DATOS PARA MINERIA DE DATOS

PREPROCESADO DE DATOS PARA MINERIA DE DATOS Ó 10.1007/978-3-319-02738-8-2. PREPROCESADO DE DATOS PARA MINERIA DE DATOS Miguel Cárdenas-Montes Frecuentemente las actividades de minería de datos suelen prestar poca atención a las actividades de procesado

Más detalles

GUÍA DOCENTE Minería de Datos

GUÍA DOCENTE Minería de Datos GUÍA DOCENTE 2017-2018 Minería de Datos 1. Denominación de la asignatura: Minería de Datos Titulación Grado en Ingeniería Informática Código 6388 2. Materia o módulo a la que pertenece la asignatura: Sistemas

Más detalles

ANÁLISIS DE DATOS DE LOS ENTORNOS VIRTUALES DE APRENDIZAJE, USANDO TÉCNICAS DE MINERÍA DE DATOS.

ANÁLISIS DE DATOS DE LOS ENTORNOS VIRTUALES DE APRENDIZAJE, USANDO TÉCNICAS DE MINERÍA DE DATOS. ANÁLISIS DE DATOS DE LOS ENTORNOS VIRTUALES DE APRENDIZAJE, USANDO TÉCNICAS DE MINERÍA DE DATOS. Bernabé Ortega, Rodrigo Aguilar, Viviana Quevedo Facultad de Sistemas Mercantiles, Universidad Autónoma

Más detalles

A3. Ciencia de datos y aprendizaje automático

A3. Ciencia de datos y aprendizaje automático A3. Ciencia de datos y aprendizaje automático MÁSTER UNIVERSITARIO EN INVESTIGACIÓN EN INTELIGENCIA ARTIFICIAL UNIVERSIDAD INTERNACIONAL MENÉNDEZ PELAYO Este documento puede utilizarse como documentación

Más detalles

Una revisión a algoritmos de selección de atributos que tratan la redundancia en datos microarreglos

Una revisión a algoritmos de selección de atributos que tratan la redundancia en datos microarreglos Tipo de artículo: Artículo de revisión Temática: Inteligencia artificial Recibido: 18/10/2012 Aceptado: 25/10/2013 Publicado: 10/12/2013 Una revisión a algoritmos de selección de atributos que tratan la

Más detalles

Directores: Dr. D. José C. Riquelme Santos Dr. D. Jesús S. Aguilar Ruiz

Directores: Dr. D. José C. Riquelme Santos Dr. D. Jesús S. Aguilar Ruiz HEURÍSTICAS DE SELECCIÓN DE ATRIBUTOS PARA DATOS DE GRAN DIMENSIONALIDAD DEPARTAMENTO DE LENGUAJES Y SISTEMAS INFORMÁTICOS Memoria de Tesis Doctoral para optar al grado de Doctor en Informática por la

Más detalles

Caracterización de la deserción universitaria en la UNRN utilizando Minería de Datos. Un caso de estudio.

Caracterización de la deserción universitaria en la UNRN utilizando Minería de Datos. Un caso de estudio. Caracterización de la deserción universitaria en la UNRN utilizando Minería de Datos. Un caso de estudio. Sonia Formia 1, Laura Lanzarini 2, Waldo Hasperué 3 1 Laboratorio de Informática Aplicada LIA-

Más detalles

Tareas de la minería de datos: clasificación. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR

Tareas de la minería de datos: clasificación. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Tareas de la minería de datos: clasificación CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Tareas de la minería de datos: clasificación Clasificación (discriminación) Empareja

Más detalles

Optimización global en espacios restringidos mediante el sistema inmune artificial.

Optimización global en espacios restringidos mediante el sistema inmune artificial. Optimización global en espacios restringidos mediante el sistema inmune artificial. Tesista: Daniel Trejo Pérez dtrejo@computacion.cs.cinvestav.mx Director de tesis: Dr. Carlos Artemio Coello Coello CINVESTAV-IPN

Más detalles

Clasificación de estados cerebralesusando neuroimágenes funcionales

Clasificación de estados cerebralesusando neuroimágenes funcionales Clasificación de estados cerebralesusando neuroimágenes funcionales Clase 2: Reconocimiento de patrones en datos de neuroimagenes Enzo Tagliazucchi (tagliazucchi.enzo@googlemail.com) Primera clase: introducción

Más detalles

Módulo Minería de Datos

Módulo Minería de Datos Módulo Minería de Datos Diplomado Por Elizabeth León Guzmán, Ph.D. Profesora Ingeniería de Sistemas Grupo de Investigación MIDAS Preprocesamiento de Datos Preparación de datos El propósito fundamental

Más detalles

Datos Generales. 1. Nombre de la Asignatura Estructura de Datos Avanzados y Minería de Datos. 2. Nivel de formación Doctoral

Datos Generales. 1. Nombre de la Asignatura Estructura de Datos Avanzados y Minería de Datos. 2. Nivel de formación Doctoral Datos Generales 1. Nombre de la Asignatura Estructura de Datos Avanzados y Minería de Datos 2. Nivel de formación Doctoral 3. Clave de la Asignatura F0454 4. Prerrequisitos F0453 Bases de datos 5. Área

Más detalles

Visión global del KDD

Visión global del KDD Visión global del KDD Series Temporales Máster en Computación Universitat Politècnica de Catalunya Dra. Alicia Troncoso Lora 1 Introducción Desarrollo tecnológico Almacenamiento masivo de información Aprovechamiento

Más detalles

para la Selección Simultánea de Instancias y Atributos

para la Selección Simultánea de Instancias y Atributos Algoritmosde Estimaciónde Distribuciones para la Selección Simultánea de Instancias y Atributos MAEB 2012 Albacete 8 10 Febrero Pablo Bermejo, José A. Gámez, Ana M. Martínez y José M. Puerta Universidad

Más detalles

UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS MAESTRÍA EN CIENCIAS DE LA INFORMACIÓN Y LAS COMUNICACIONES MINERÍA DE DATOS

UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS MAESTRÍA EN CIENCIAS DE LA INFORMACIÓN Y LAS COMUNICACIONES MINERÍA DE DATOS UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS MAESTRÍA EN CIENCIAS DE LA INFORMACIÓN Y LAS COMUNICACIONES MINERÍA DE DATOS Programa o Dpto. Maestría en Ciencias de la Información y las Comunicaciones

Más detalles

Análisis de deserción escolar con minería de datos

Análisis de deserción escolar con minería de datos Análisis de deserción escolar con minería de datos José Luis Aguirre Mendiola 1, Rosa María Valdovinos Rosas 2, Juan Alberto Antonio Velazquez 1,3, Roberto Alejo Eleuterio 3, José Raymundo Marcial Romero

Más detalles

GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC)

GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC) GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC) Curso Académico: 2015-2016 Programa: Centro: Universidad: Máster Universitario en Ingeniería Informática Escuela Politécnica Superior

Más detalles

Técnicas de análisis estadístico basado en inteligencia artificial

Técnicas de análisis estadístico basado en inteligencia artificial GUÍA DOCENTE: Técnicas de análisis estadístico basado en inteligencia artificial 1. Técnicas de análisis estadístico basado en inteligencia artificial 1.1. Datos de la asignatura Tipo de estudios Máster

Más detalles

GUÍA DOCENTE DE LA ASIGNATURA CURSO MÁSTER UNIVERSITARIO DE INVESTIGACIÓN EN TECNOLOGÍAS DE LA INFORMACIÓN Y LAS COMUNICACIONES 5 ECTS

GUÍA DOCENTE DE LA ASIGNATURA CURSO MÁSTER UNIVERSITARIO DE INVESTIGACIÓN EN TECNOLOGÍAS DE LA INFORMACIÓN Y LAS COMUNICACIONES 5 ECTS GUÍA DOCENTE DE LA ASIGNATURA CURSO 2016-17 Denominación de la asignatura Materia TECNOLOGÍAS AVANZADAS DE SISTEMAS INTELIGENTES PARADIGMAS Y TECNOLOGÍAS PARA LOS SISTEMAS Y SERVICIOS INFORMÁTICOS Módulo

Más detalles

Exploraciones sobre el soporte Multi-Agente en Minería de Datos

Exploraciones sobre el soporte Multi-Agente en Minería de Datos Exploraciones sobre el soporte Multi-Agente en Minería de Datos Alejandro Guerra-Hernández Nicandro Cruz-Ramírez Rosibelda Mondragón-Becerra Departamento de Inteligencia Artificial Facultad de Física e

Más detalles

FACIL: Incremental Rule Learning from Data Streams

FACIL: Incremental Rule Learning from Data Streams FCIL: Incremental Rule Learning from Data Streams Francisco J. Ferrer Troyano Jesús S. guilar, José C. Riquelme University of Sevilla ferrer@lsi.us.es Motivation Contents FCIL The hybrid knowledge model

Más detalles

Selección de atributos relevantes basada en bootstrapping. Jesús S. Aguilar Ruiz y Norberto Díaz Díaz

Selección de atributos relevantes basada en bootstrapping. Jesús S. Aguilar Ruiz y Norberto Díaz Díaz Selección de atributos relevantes basada en bootstrapping Jesús S. Aguilar Ruiz y Norberto Díaz Díaz Dept.de Lenguajes y Sistemas Informáticos Universidad de Sevilla ETS Ingeniería Informática 41012 Sevilla

Más detalles

Minería de datos. Unidad 2. El proceso KDD Evaluación, difusión y uso. M en I Sara Vera Noguez

Minería de datos. Unidad 2. El proceso KDD Evaluación, difusión y uso. M en I Sara Vera Noguez Minería de datos Unidad 2. El proceso KDD Evaluación, difusión y uso M en I Sara Vera Noguez El proceso KDD Hernández, 2008 p.20 La parte iterativa Una vez obtenido el modelo se debe evaluar Si satisface

Más detalles

Técnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO

Técnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO Técnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO 2 Objetivo El objetivo principal de las técnicas de clasificación supervisada es obtener un modelo clasificatorio válido para permitir tratar

Más detalles

ESCUELA POLITÉCNICA SUPERIOR DE CÓRDOBA

ESCUELA POLITÉCNICA SUPERIOR DE CÓRDOBA Curso 17/1 DENOMINACIÓN DE LA ASIGNATURA Denominación: INTRODUCCIÓN A LOS MODELOS COMPUTACIONALES Código: 11 Plan de estudios: GRADO DE INGENIERÍA INFORMÁTICA Curso: Denominación del módulo al que pertenece:

Más detalles

Índice. Resumen 15 Motivación 15 Desarrollos y aportes 16 Publicaciones derivadas de esta tesis doctoral 19

Índice. Resumen 15 Motivación 15 Desarrollos y aportes 16 Publicaciones derivadas de esta tesis doctoral 19 Índice Resumen 15 Motivación 15 Desarrollos y aportes 16 Publicaciones derivadas de esta tesis doctoral 19 Capítulo 1. Introducción a la Minería de Datos 21 1. Minería de datos 21 1.1. Tipos de datos 24

Más detalles

Guía docente de la asignatura

Guía docente de la asignatura Guía docente de la asignatura Asignatura Materia Módulo Titulación SISTEMAS INTELIGENTES COMPLEMENTOS DE SISTEMAS DE INFORMACIÓN (vacío) GRADO EN INGENIERÍA INFORMÁTICA DE SISTEMAS (464) Plan 464 45280

Más detalles