NEWTON TREES. Árboles de Estimación Estocástica de Probabilidades:
|
|
- Cristina Saavedra Plaza
- hace 7 años
- Vistas:
Transcripción
1 Tesis de Máster en Ingeniería del Software, Métodos Formales y Sistemas de Información Árboles de Estimación Estocástica de Probabilidades: NEWTON TREES Autor: Fernando Martínez Plumed 1 Directores: Cèsar Ferri Ramirez María José Ramírez Quintana
2 2 ÍNDICE 1. Introducción 2. Newton Trees 3. Valores Faltantes 4. Experimentación 5. Conclusiones y Trabajo Futuro
3 1 1.1 Minería de Datos 1.2 Tareas y Técnicas 1.3 Árboles de Decisión 1.4 PET s 1.5 DBDT 1.6 Motivación Introducción 3
4 4 Introducción 1.1 Minería de Datos Definiciones: Proceso de extracción de información y patrones de comportamiento que permanecen ocultos entre grandes cantidades de información. Proceso que a través del descubrimiento y cuantificación de relaciones predictivas en los datos, permite transformar la información disponible en conocimiento útil.
5 5 Introducción 1.1 Minería de Datos Información Relaciones CONOCOMIENTO ÚTIL Y PATRONES OCULTOS
6 6 Introducción 1.2 Tareas y Técnicas Tareas: Predictivas: se trata de problemas y tareas en los que hay que predecir uno o más valores para uno o mas ejemplos. Los ejemplos en la evidencia van acompañados de una salida (clase, categoría o valor numérico) o un orden entre ellos. Dependiendo de como sea la correspondencia entre los ejemplos y los valores de salida y la presentación de los ejemplos podemos definir varias de tareas predictivas: Clasificación y Regresión
7 7 Introducción 1.2 Tareas y Técnicas Tareas: Descriptivas: los ejemplos se presentan como un conjunto δ = {e : eϵe}, sin etiquetar ni ordenar de ninguna manera. El objetivo, por tanto, no es predecir nuevos datos sino describir los existente: Asociaciones, Dependencias, Correlaciones y Agrupamiento.
8 8 Introducción 1.2 Tareas y Técnicas:Taxonomía T A R E A S DESCRIPTIVOS PREDICTIVOS Relación entre Variables (Atributos) Relación entre Individuos (Ejemplos) Asociaciones y Dependencias (si las variables son categoricas) Correlaciones (si las variables son numericas) Agrupamiento Clasificación (si la variable de salida es categórica) Regresión (Si la variable de salida es numérica)
9 9 Introducción 1.2 Tareas y Técnicas:Taxonomía Técnicas: Con Modelo EAGER Reg. Lineal K-means Arboles de Decisión Reglas ILP, IFLP Representables en forma de reglas Sin Modelo o No inteligible Perceptron Learning Radial Basis Functions. Bayes Classifiers Métodos Kernel y SVM LAZY Reg. Lineal Pond. Local CBR K-NN (Nearest Neighbour) Útiles para extracción de conocimiento
10 10 Introducción 1.2 Tareas y Técnicas:Taxonomía TÉCNICA Redes Neuronales Arboles de Decisión Kohonen Regresion Lineal, Regresión Logística Kmeans A priori Analisis Multivariante CN2 K-NN RBF Bayes Classifiers PREDICTIVO / SUPERVISADO DESCRIPTIVO / NO SUPERVISADO Clasificación Regresión Clustering Reglas Asociación Otros (Fact., Correl.)
11 11 Introducción 1.3 Árboles de Decisión Los árboles de decisión son una de las técnicas más populares y potentes en Aprendizaje Automático y Minería de Datos. Clasificadores para clasificar instancias (datos) representadas como vectores de características (features). Se basan en la idea de particionar recursivamente el conjunto de entrenamiento en conjuntos cada vez más pequeños hasta que el conjunto es puro. Nodos Condiciones (atributo seleccionado).
12 12 Introducción 1.3 Árboles de Decisión Ventajas: Buenos resultados en Accuracy. Desventajas: Tratamiento heterogeneo de un limitado número de tipos de datos (nominales y numericos). ID3, C4.5 o C5.0 [Quinlan], CART [Breiman].
13 13 Introducción 1.3 Árboles de Decisión
14 14 Introducción 1.4 PETs Variación de los árboles de decisión clásicos donde la salida proporcionada es una probabilidad. No modifican la manera de construir los árboles: usan criterios, particiones y métodos de poda diseñados para otras tareas o medidas. Buenos resultados en términos del AUC (Area Under the Curve) y MSE (Mean Squared Error). Aunque los PETs retornan probabilidades, no son probabilísticos en términos de cómo se usa el árbol para clasificar nuevas instancias.
15 15 Introducción 1.5 DBDT Distance-Based Decision Trees Uso de distancias y funciones de similitud para diseñar árboles de decisión más flexibles. Permite tratar cualquier tipo de datos en el que se puedan definir distancias. Devuelve un árbol de prototipos de clase (nodos en el árbol). Un ejemplo caerá en un nodo dado dependiendo de su proximidad al prototipo de clase.
16 16 Introducción 1.5 DBDT dnum(x,y) diferencia absoluta dnom(x,y) función identidad
17 17 Introducción 1.6 Motivación Presentación de un nuevo método de inducción de árboles de decisión, los Newton Trees. Trabajan con cualquier tipo de datos. Manejan de forma uniforme las distintas características. Probabilísticos en su uso haciendo que cada instancia recorra todo el árbol y no sólo una rama.
18 2 2.1 Newton Trees 2.2 Particiones Gravitacionales 2.3 Generación del Árbol 2.4 Cálculo Estocástico de la Probabilidad 2.5 Comprensibilidad 18 Newton Trees
19 19 Newton Trees Newton Trees Particiones 2.1 Newton Trees Gravitacionales Árboles de Estimación Estocástica de Probabilidades. Construcción, uso y representación del árbol basados en el principio de atracción. Las probabilidades se derivan también a partir de dicho principio. Árbol de prototipos. Representación gráfica del árbol sencilla de interpretar. Los árboles son univariantes, pero sus particiones no son necesariamente paralelas a los ejes.
20 20 Newton Trees Newton Trees Particiones 2.2 Particiones Gravitacionales Gravitacionales Particiones nodo/cluster por clase. Cada nodo/cluster es caracterizado por un prototipo (medioide). A partir de los medioides calculados, los datos se distribuyen de acuerdo a la siguiente función de atracción:
21 21 Newton Trees Newton Trees Particiones 2.3 Generación del árbol Gravitacionales 1. Para cada atributo Xr y cada clase i, se calcula un prototipo πr,i. 2. Seleccionar el atributo que maximice algún criterio de partición (Gain Ratio). 3. Se asocia cada instancia de entrenamiento a su prototipo más próximo. 4. Si la partición es impura ir a 1, si no Fin.
22 22 Newton Trees 2.4 Cálculo estocástico de la probabilidad Newton Trees Particiones Gravitacionales 1. Computar, desde la raíz a las hojas, la probabilidad de caer en cada nodo. 2. Calcular el vector de probabilidad en cada hoja.
23 23 Newton Trees 2.4 Cálculo estocástico de la probabilidad Newton Trees Particiones Gravitacionales 3. Propagar hacia arriba este vector para obtener en la raíz el vector total de probabilidad p(root,e)
24 Newton Trees p = 11 0 p = p = 2 1 p = 0 Instancia a clasificar: (FEMALE,NO)
25 3 3.1 Valores Faltantes 3.2 Valores Faltantes en C Valores Faltantes en Newton Trees 3.4 Ejemplo Valores Faltantes 25
26 26 Valores Faltantes 3.1 Valores Faltantes Qué pasa cuando parte de los datos están incompletos, como ocurre generalmente con cualquier conjunto de datos de la vida real? Descartar una proporción importante de los datos por incompletos y declarar algunos casos como inclasificables. Adaptar los algoritmos para poder trabajar con atributos con valores faltantes.
27 27 Valores Faltantes 3.2 Valores Faltantes en C4.5 Quinlan mostró que la combinación de todos los posibles resultados con un valor faltante en el ejemplo de test en la fase de clasificación proporciona una mejor precisión general que otros enfoques. Para clasificar un ejemplo e, éste se propaga por todas las ramas para calcular su probabilidad de forma proporcional al número de instancias de entrenamiento (con valores conocidos para el atributo de partición). El algoritmo C4.5 adopta esta aproximación.
28 28 Valores Faltantes 3.3 Valores Faltantes en Newton Trees Aproximación en Newton Trees: para atributos con valores faltantes se asume que la distancia a cualquier prototipo es igual, tal que: Se ignoran los valores faltantes en la fase de aprendizaje. Se establece constante (igual a 1) el valor de la distancia a cualquier prototipo.
29 29 Valores Faltantes 3.4 Ejemplo Instancia de Test: (FEMALE,?)
30 4 4.1 Configuración 4.2 Resultados Experimentación 30
31 31 Experimentación 4.1 Configuración Newton Trees vs J48 (sin poda y con suavizado de Laplace en las hojas) implementado en WEKA. Gain Ratio. 30 Datasets extraídos del repositorio UCI. 20 repeticiones x 5 folds Cross Validation. Métricas de evaluación: Accuracy, AUC y MSE. Tests estadisticos (Wilcoxon signed-ranks)
32 Resultados Tabla 1. Comparativa Global (30 Datasets) Newton Trees Unpruned Laplace J48 Acc. AUC MSE Acc. AUC MSE Media 82,091 0,866 0,100 80,728 0,842 0,110 Media (Binarios) Media (> 2 Clases) 83,650 0,867 0,115 81,339 0,831 0,133 80,308 0,866 0,084 80,031 0,854 0,083 Nominales 90,159 0,931 0,069 87,310 0,894 0,080 Numéricos 79,703 0,860 0,118 79,422 0,848 0,127 Mixtos 77,205 0,810 0,109 75,888 0,781 0,118
33 Resultados Tabla 2. Comparativa Valores Faltantes (7 Datasets) Newton Trees Unpruned Laplace J48 Acc. AUC MSE Acc. AUC MSE Media 83,934 0,874 0,095 83,641 0,860 0,100 Media (Binarios) Media (Clases >2) 84,531 0,853 0,111 83,454 0,838 0,119 82,440 0,926 0,056 84,108 0,914 0,053
34 5 5.1 Conclusiones 5.2 Trabajo futuro 5.3 Artículos Relacionados Conclusiones y Trabajo Futuro 34
35 35 Conclusiones 5.1 Conclusiones Novedoso método de aprendizaje de árboles de estimación estocástica de probabilidad, los Newton Trees. El uso de medioides permite el tratamiento homogéneo de cualquier tipo de datos. Representación grafica inteligible. Adaptación para el tratamiento de valores faltantes.
36 36 Conclusiones 5.1 Conclusiones Los resultados obtenidos en las distintas pruebas llevadas a cabo cumplen nuestras expectativas en cuanto a homogeneidad (en el tratamiento de los tipos de datos), transparencia (tratamiento de los datos inteligible), eficiencia (con un coste bajo) y eficacia (con resultados significativamente mejores a que los obtenidos con el j48).
37 37 Conclusiones 5.2 Trabajo Futuro AUC como criterio de partición. Extensión de los Newton Trees a otros métodos de aprendizaje como la regresión o el clustering. Tratamiento de datos estructurados (cadenas, listas, ). Clasificación de instancias multi-etiqueta.
38 39 Introducción 5.3 Artículos Relacionados F. Martinez-Plumed, V. Estruch, C. Ferri, J. Hernandez- Orallo, and M. J. Ramrez-Quintana. Newton trees, 23rd Australasian Joint Conference on Artificial Intelligence, AI 2010,(LNCS), Adelaide, Australia. F. Martinez-Plumed, V. Estruch, C. Ferri, J. Hernandez- Orallo, and M. J. Ramrez-Quintana. Tratamiento de Valores Faltantes en Newton trees, V Simposio de Teoría y Aplicaciones en Minería de Datos, TAMIDA 2010, Valencia, España. F. Martinez-Plumed, V. Estruch, C. Ferri, J. Hernandez- Orallo, and M. J. Ramrez-Quintana. Newton trees. Extended Technical Report, DSIC UPV 2010,
39 40 Gracias!
Tareas de la minería de datos: clasificación. PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR
Tareas de la minería de datos: clasificación PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR Tareas de la minería de datos: clasificación Clasificación (discriminación) Empareja o asocia datos
Más detallesAprendizaje Automático
id3 id3 como búsqueda Cuestiones Adicionales Regresión Lineal. Árboles y Reglas de Regresión Ingeniería Informática Fernando Fernández Rebollo y Daniel Borrajo Millán Grupo de Planificación y Aprendizaje
Más detallesTareas de la minería de datos: clasificación. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR
Tareas de la minería de datos: clasificación CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Tareas de la minería de datos: clasificación Clasificación (discriminación) Empareja
Más detallesÍndice general. Prefacio...5
Índice general Prefacio...5 Capítulo 1 Introducción...13 1.1 Introducción...13 1.2 Los datos...19 1.3 Etapas en los procesos de big data...20 1.4 Minería de datos...21 1.5 Estructura de un proyecto de
Más detallesJesús García Herrero TÉCNICAS DE REGRESIÓN NO LINEAL
Jesús García Herrero TÉCNICAS DE REGRESIÓN NO LINEAL En esta clase se presenta un método de inducción de modelos numéricos de regresión a partir de datos. En el tema de técnicas clásicas se presentó la
Más detallesAprendizaje Automatizado
Aprendizaje Automatizado Aprendizaje Automatizado Programas que mejoran su comportamiento con la experiencia. Dos formas de adquirir experiencia: A partir de ejemplos suministrados por un usuario (un conjunto
Más detallesClasificación de estados cerebralesusando neuroimágenes funcionales
Clasificación de estados cerebralesusando neuroimágenes funcionales Clase 2: Reconocimiento de patrones en datos de neuroimagenes Enzo Tagliazucchi (tagliazucchi.enzo@googlemail.com) Primera clase: introducción
Más detallesFundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 11 -
Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos - Sesión 11 - Juan Alfonso Lara Torralbo 1 Índice de contenidos Actividad. Resolución manual de clasificación bayesiana
Más detallesTÉCNICAS ESTADÍSTICAS PARA EL ANÁLISIS DE LA INFORMACIÓN CONTABLE
TEMA 8 TÉCNICAS ESTADÍSTICAS PARA EL ANÁLISIS DE LA INFORMACIÓN CONTABLE 8.1.La inferencia estadística: del análisis univariante al análisis multivariante. 8.2.La reducción de la dimensionalidad: el análisis
Más detallesIdentificación de variables asociadas al éxito académico en Estudiantes de la Facultad de Informática Mazatlán
Your logo Identificación de variables asociadas al éxito académico en Estudiantes de la Facultad de Informática Mazatlán Universidad Autónoma de Sinaloa M.C. Rogelio Estrada Lizárraga Abril 16, 2013 Introducción
Más detallesTécnicas de Minería de Datos
Técnicas de Minería de Datos Act. Humberto Ramos S. 1 Qué es Minería de datos? El desarrollo de dispositivos tecnológicos para acumular datos a bajo costo. Acumulación o registro de gran cantidad de datos.
Más detallesLA MINERÍA DE DATOS APLICADA A LA BÚSQUEDA DE PATRONES DE SUPERVIVIENCIA EN LA NEOPLASIA MALIGNA DE TRÁQUEA, BRONQUIOS Y PULMÓN
LA MINERÍA DE DATOS APLICADA A LA BÚSQUEDA DE PATRONES DE SUPERVIVIENCIA EN LA NEOPLASIA MALIGNA DE TRÁQUEA, BRONQUIOS Y PULMÓN Miguel Ángel Negrín; Christian González; Jaime Pinilla; Francisco-José Vázquez-Polo
Más detallesAux 6. Introducción a la Minería de Datos
Aux 6. Introducción a la Minería de Datos Gastón L Huillier 1,2, Richard Weber 2 glhuilli@dcc.uchile.cl 1 Departamento de Ciencias de la Computación Universidad de Chile 2 Departamento de Ingeniería Industrial
Más detallesLingüística computacional
Lingüística computacional Definición y alcance Escuela Nacional de Antropología e Historia (ENAH) Agosto diciembre de 2015 Lingüística Ciencias de la computación Lingüística computacional Estudio del lenguaje
Más detallesAnálisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores
Análisis de Datos Introducción al aprendizaje supervisado Profesor: Dr. Wilfrido Gómez Flores 1 Conceptos básicos Desde la antigüedad, el problema de buscar patrones en datos es fundamental en diversas
Más detallesItinerario: Inteligencia Computacional
Máster Universitario en Investigación e Innovación en Tecnologías de la Información y las Comunicaciones Itinerario: Inteligencia Computacional Escuela Politécnica Superior Universidad Autónoma de Madrid
Más detallesTema 8: Árboles de Clasificación
Tema 8: Árboles de Clasificación p. 1/11 Tema 8: Árboles de Clasificación Abdelmalik Moujahid, Iñaki Inza, Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad
Más detallesClasificación estadística de patrones
Clasificación estadística de patrones Clasificador gaussiano César Martínez cmartinez _at_ fich.unl.edu.ar Tópicos Selectos en Aprendizaje Maquinal Doctorado en Ingeniería, FICH-UNL 19 de setiembre de
Más detallesAnálisis multivariante
Machine Learning 2016-17 1 Aprendizaje automatizado (ML) 2 3 Aprendizaje automatizado (ML) Definiciones Conjunto de herramientas para transformar datos en conocimiento. Conjunto de técnicas que permitan
Más detallesMinería de Datos Web. Cursada 2018
Minería de Datos Web Cursada 2018 Proceso de Minería de Texto Clustering de Documentos Clasificación de Documentos Es un método supervisado para dividir documentos en base a categorías predefinidas Los
Más detallesIAAE - Inteligencia Artificial Aplicada a la Ingeniería
Unidad responsable: Unidad que imparte: Curso: Titulación: Créditos ECTS: 2016 295 - EEBE - Escuela de Ingeniería de Barcelona Este 723 - CS - Departamento de Ciencias de la Computación GRADO EN INGENIERÍA
Más detallesAprendizaje Automático Segundo Cuatrimestre de Árboles de Decisión
Aprendizaje Automático Segundo Cuatrimestre de 2015 Árboles de Decisión Aproximación de Funciones Ejemplo: Un amigo juega al tenis los sábados. Juega o no, dependiendo del estado del tiempo. Cielo: {Sol,
Más detallesTópicos Selectos en Aprendizaje Maquinal. Clasificación y Regresión con Datos Reales
Tópicos Selectos en Aprendizaje Maquinal Guía de Trabajos Prácticos N 2 Clasificación y Regresión con Datos Reales 18 de septiembre de 2014 1. Objetivos Introducir conceptos básicos de aprendizaje automático.
Más detallesMinería de Datos. Arturo Olvera López
Benemérita Universidad Autónoma de Puebla Facultad de Ciencias de la Computación Minería de Datos Arturo Olvera López aolvera@cs.buap.mx 1 1 Data Warehouse and OLAP 66 Data Warehouse 67 OLTP, OLAP 68 Data
Más detallesMASTER DE INGENIERÍA BIOMÉDICA. Métodos de ayuda al diagnóstico clínico. Tema 6: Árboles de decisión.
MASTER DE INGENIERÍA BIOMÉDICA. Métodos de ayuda al diagnóstico clínico. Tema 6: Árboles de decisión. 1 Objetivos del tema Conocer en qué consiste un árbol de decisión. Aprender los problemas que pueden
Más detallesTécnicas de aprendizaje sobre series temporales
Técnicas de aprendizaje sobre series temporales Contenido 1. Motivación. 2. Ejemplo del Problema. 3. Aproximaciones al problema de clasificación de series temporales. 4. Aprendizaje de reglas. 5. Boosting
Más detallesExamen Parcial. Attr1: A, B Attr2: A, B, C Attr3 1, 2, 3 Attr4; a, b Attr5: 1, 2, 3, 4
Aprenentatge 0-03 Q Examen Parcial Nombre: (Examen ) Instrucciones. (0 puntos) Este examen dura horas. Responded todas las preguntas en estas hojas. Para las preguntas test poned un circulo alrededor de
Más detallesAnálisis de Datos. Combinación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores
Análisis de Datos Combinación de clasificadores Profesor: Dr. Wilfrido Gómez Flores 1 Introducción Diversos algoritmos de clasificación están limitados a resolver problemas binarios, es decir, con dos
Más detallesSistemas de Percepción Visión por Computador
Nota: Algunas de las imágenes que aparecen en esta presentación provienen del libro: Visión por Computador: fundamentos y métodos. Arturo de la Escalera Hueso. Prentice Hall. Sistemas de Percepción Visión
Más detallesAprendizaje inductivo no basado en el error Métodos competitivos supervisados.
Aprendizaje inductivo no basado en el error Métodos competitivos supervisados. Aprendizaje basado en instancias Carlos J. Alonso González Departamento de Informática Universidad de Valladolid Contenido
Más detallesInteligencia Artificial: Su uso para la investigación
Inteligencia Artificial: Su uso para la investigación Dra. Helena Montserrat Gómez Adorno Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas helena.adorno@iimas.unam.mx 1 Introducción
Más detallesAnálisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores
Análisis de Datos Introducción al aprendizaje supervisado Profesor: Dr. Wilfrido Gómez Flores 1 Conceptos básicos Reconocimiento de patrones (RP): clasificar objetos en un número de categorías o clases.
Más detallesIAAE - Inteligencia Artificial Aplicada a la Ingeniería
Unidad responsable: Unidad que imparte: Curso: Titulación: Créditos ECTS: 2017 295 - EEBE - Escuela de Ingeniería de Barcelona Este 723 - CS - Departamento de Ciencias de la Computación GRADO EN INGENIERÍA
Más detallesMD - Minería de Datos
Unidad responsable: Unidad que imparte: Curso: Titulación: Créditos ECTS: 018 70 - FIB - Facultad de Informática de Barcelona 73 - CS - Departamento de Ciencias de la Computación 715 - EIO - Departamento
Más detallesAPLICACIONES DE MINERA DE DATOS EN ADUANA DE PERU. Luis Azaña Bocanegra
APLICACIONES DE MINERA DE DATOS EN ADUANA DE PERU Luis Azaña Bocanegra TEMARIO CONCEPTOS DEFINICION DE MINERIA DE DATOS USOS DE LA MINERIA DE DATOS TECNICAS DE MINERIA DE DATOS ETAPAS DE UN PROYECTO DE
Más detallesÍNDICE. Introducción... Capítulo 1. Técnicas de minería de datos y herramientas... 1
ÍNDICE Introducción... XI Capítulo 1. Técnicas de minería de datos y herramientas... 1 Clasificación de las técnicas de minería de datos y herramientas más comunes... 1 Modelado originado por la teoría
Más detallesMinería de Datos. Profra. Heidy Marisol Marin Castro Universidad Politécnica de Victoria
Minería de Datos Profra. Heidy Marisol Marin Castro Universidad Politécnica de Victoria 1 Que es un conjunto de datos? Es una colección de objetos con sus respectivo atributos. Un atributo es una propiedad
Más detallesInducción de Árboles de Decisión ID3, C4.5
Inducción de Árboles de Decisión ID3, C4.5 Contenido 1. Representación mediante árboles de decisión. 2. Algoritmo básico: divide y vencerás. 3. Heurística para la selección de atributos. 4. Espacio de
Más detallesComplementación y ampliación de la currícula de la Maestría 2017 Maestría en Generación y Análisis de Información Estadística
ampliación de la currícula Maestría en Generación y Análisis de Información Estadística Programa abierto de ampliación de la currícula Maestría en Generación y Análisis de Información Estadística La Maestría
Más detallesAprendizaje Automático. Objetivos. Funciona? Notas
Introducción Las técnicas que hemos visto hasta ahora nos permiten crear sistemas que resuelven tareas que necesitan inteligencia La limitación de estos sistemas reside en que sólo resuelven los problemas
Más detallesMinería de Datos. Índice. Raquel M. Crespo García. Julio Villena Román. Definición y conceptos Técnicas y modelos
Inteligencia en Redes de Comunicaciones Minería de Datos Raquel M. Crespo García Julio Villena Román {rcrespo, jvillena}@it.uc3m.es Índice Definición y conceptos Técnicas y modelos IRC - JVR, RCG - 1 1
Más detallesCÁLCULO DE PROBABILIDADES
CÁLCULO DE PROBABILIDADES Tipo de asignatura: Troncal Anual. Créditos ECTS: 15 I.- INTRODUCCIÓN AL CÁLCULO DE PROBABILIDADES. (16 horas presenciales) Tema 1.- La naturaleza del cálculo de probabilidades.
Más detallesCRITERIOS DE SELECCIÓN DE MODELOS
Inteligencia artificial y reconocimiento de patrones CRITERIOS DE SELECCIÓN DE MODELOS 1 Criterios para elegir un modelo Dos decisiones fundamentales: El tipo de modelo (árboles de decisión, redes neuronales,
Más detallesAnálisis comparativo DBDT vs otros Algoritmos para el manejo de datos no escalares.
UNIVERSIDAD POLITÉCNICA DE VALENCIA Análisis comparativo DBDT vs otros Algoritmos para el manejo de datos no escalares. Tesis de Máster José Luis Ramírez Cabrera Departamento de Sistemas Informáticos y
Más detallesIntroducción a los sistemas Multiclasificadores. Carlos J. Alonso González Departamento de Informática Universidad de Valladolid
Introducción a los sistemas Multiclasificadores Carlos J. Alonso González Departamento de Informática Universidad de Valladolid Contenido 1. Combinación de modelos 2. Descomposición bias-varianza 3. Bagging
Más detallesIntroducción a Aprendizaje no Supervisado
Introducción a Aprendizaje no Supervisado Felipe Suárez, Álvaro Riascos 25 de abril de 2017 2 / 33 Contenido 1. Motivación 2. k-medias Algoritmos Implementación 3. Definición 4. Motivación 5. Aproximación
Más detallesAprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA. Ricardo Aler Mur
Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA Ricardo Aler Mur MODELOS: ÁRBOLES DE DECISIÓN Y REGLAS Datos de entrada 91 71 75 81 Nublado 90 72 Nublado 70 75 80 75 70
Más detallesD conjunto de N patrones etiquetados, cada uno de los cuales está caracterizado por n variables predictoras X 1,..., X n y la variable clase C.
Tema 10. Árboles de Clasificación Pedro Larrañaga, Iñaki Inza, Abdelmalik Moujahid Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del País Vasco Euskal Herriko Unibertsitatea
Más detalles2. Algoritmos genéticos y redes neuronales 3. Inducción de árboles clasificadores. Inducción de árboles de clasificación. Aprendizaje UPM UPM
1. Preliminares Aprendizaje 2. Algoritmos genéticos y redes neuronales 3. Inducción de árboles clasificadores 4. Inducción de reglas 5. Minería de datos c 2010 DIT-ETSIT- Aprendizaje: árboles transp. 1
Más detallesMD - Minería de Datos
Unidad responsable: Unidad que imparte: Curso: Titulación: Créditos ECTS: 017 70 - FIB - Facultad de Informática de Barcelona 73 - CS - Departamento de Ciencias de la Computación 715 - EIO - Departamento
Más detalles240AR022 - Reconocimiento de Formas y Aprendizaje Automático
Unidad responsable: Unidad que imparte: Curso: Titulación: Créditos ECTS: 2017 240 - ETSEIB - Escuela Técnica Superior de Ingeniería Industrial de Barcelona 707 - ESAII - Departamento de Ingeniería de
Más detallesPontificia Universidad Católica del Ecuador
1. DATOS INFORMATIVOS: MATERIA O MÓDULO: CÓDIGO: CARRERA: NIVEL: INTELIGENCIA ARTIFICIAL II (Aprendizaje Automático) IS-12653 INGENIERIA DE SISTEMAS SEPTIMO No. CRÉDITOS: 4 CRÉDITOS TEORÍA: 2 CRÉDITOS
Más detallesTÓPICOS SELECTOS DE OTROS CURSOS
UNIVERSIDAD AUTÓNOMA DE CHIHUAHUA Clave: 08MSU007H Clave: 08USU4053W FACULTAD DE INGENIERÍA PROGRAMA DEL CURSO: TÓPICOS SELECTOS DE OTROS CURSOS DES: Ingeniería Ingeniería en Sistemas Programa(s) Educativo(s):
Más detallesPredicción de potencia en el parque eólico de Villonaco, Loja, Ecuador. Alberto Reyes y Tania Guerrero INER Ecuador
Predicción de potencia en el parque eólico de Villonaco, Loja, Ecuador Alberto Reyes y Tania Guerrero INER Ecuador INTRODUCCIÓN El comportamiento del viento presenta alto grado de aleatoriedad, incertidumbre
Más detallesPosibles trabajos HIA
Posibles trabajos HIA Posibles trabajos Comparar otras herramientas de Minería de Datos con Weka Estudiar la influencia del ruido en bagging y boosting Estudiar la influencia del parámetro de poda en J48
Más detallesIAAE - Inteligencia Artificial Aplicada a la Ingeniería
Unidad responsable: Unidad que imparte: Curso: Titulación: Créditos ECTS: 2017 295 - EEBE - Escuela de Ingeniería de Barcelona Este 723 - CS - Departamento de Ciencias de la Computación GRADO EN INGENIERÍA
Más detallesIAAE - Inteligencia Artificial Aplicada a la Ingeniería
Unidad responsable: Unidad que imparte: Curso: Titulación: Créditos ECTS: 2017 295 - EEBE - Escuela de Ingeniería de Barcelona Este 723 - CS - Departamento de Ciencias de la Computación GRADO EN INGENIERÍA
Más detallesIntroducción a la minería de datos. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR
Introducción a la minería de datos CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Minería de datos Detección, interpretación y predicción de patrones cuantitativos y cualitativos
Más detallesDIPLOMADO EN DATA MINING
DIPLOMADO EN DATA MINING DIPLOMADO EN DATA MINING Los datos que tienen relevancia para las decisiones de gestión, se están acumulando a un ritmo increíble, debido a una serie de avances tecnológicos. La
Más detallesPrograma Educativo (PE): Ingeniería en Ciencias de la Computación. Área: Tecnología. Programa de Asignatura: Minería de Datos.
Programa Educativo (PE): Ingeniería en Ciencias de la Computación Área: Tecnología Programa de Asignatura: Minería de Datos Código: CCOM-606 Créditos: 5 Fecha: Julio de 2009 1 1. DATOS GENERALES Nivel
Más detallesAprendizaje Automatizado. Árboles de Clasificación
Aprendizaje Automatizado Árboles de Clasificación Árboles de Clasificación Entrada: Objetos caracterizables mediante propiedades. Salida: En árboles de decisión: una decisión (sí o no). En árboles de clasificación:
Más detallesSISTEMAS INTELIGENTES
SISTEMAS INTELIGENTES T9: Árboles de Decisión www.aic.uniovi.es/ssii Sistemas Inteligentes T9: Árboles de decisión Índice Árboles de decisión para clasificación Mecanismo de inducción: divide y vencerás
Más detallesGUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC)
GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC) Curso Académico: 2015-2016 Programa: Centro: Universidad: Máster Universitario en Ingeniería Informática Escuela Politécnica Superior
Más detalles12/08/2017 AVL. Especificación sobre árboles AVL. AVL: rotaciones
VL Se dice que un árbol binario está balanceado si y sólo si en cada nodo las alturas de sus 2 subárboles difieren como máximo en 1. Todos los árboles perfectamente balanceados son árboles VL. Especificación
Más detallesAutomatización de la Evaluación del Impacto Social en Proyectos de Inversión Publica
Automatización de la Evaluación del Impacto Social en Proyectos de Inversión Publica Ronald René Vergara Pareja 1 Agenda Objetivo de la Investigación. Situación Actual de los Proyectos de Inversión Publica.
Más detalles10 EXÁMENES
10 EXÁMENES 2014-2018 Convocatoria Extraordinaria de Septiembre 1 de Septiembre de 2014 1. (1 pto.) a) Aunque por abuso del lenguaje hemos hablado de minería de datos y de KDD como sinónimos, indica las
Más detallesAprendizaje Automático
Ingeniería Informática Fernando Fernández Rebollo y Daniel Borrajo Millán Grupo de Planificación y Aprendizaje (PLG) Departamento de Informática Escuela Politécnica Superior Universidad Carlos III de Madrid
Más detallesClustering: Auto-associative Multivariate Regression Tree (AAMRT)
Introducción Tipos Validación AAMRT Clustering: Auto-associative Multivariate Regression Tree (AAMRT) Miguel Bernal C Quantil 12 de diciembre de 2013 Miguel Bernal C Quantil Matemáticas Aplicadas Contenido
Más detallesAprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA. Ricardo Aler Mur
Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA Ricardo Aler Mur Regresión simbólica, búsqueda genética y algoritmos de estimación de distribuciones Regresión lineal Regresión:
Más detallesTécnicas del aprendizaje automático para la asistencia en la toma de decisiones
Técnicas del aprendizaje automático para la asistencia en la toma de decisiones Cèsar Ferri Ramírez Departament de Sistemes Informàtics i Computació Universitat Politècnica de València, Valencia, Spain
Más detallesGUÍA DE APRENDIZAJE ASIGNATURA SISTEMAS BASADOS EN APRENDIZAJE AUTOMATICO. CURSO ACADÉMICO - SEMESTRE Primer semestre
GUÍA DE APRENDIZAJE ASIGNATURA SISTEMAS BASADOS EN APRENDIZAJE AUTOMATICO CURSO ACADÉMICO - SEMESTRE 2015-16 - Primer semestre FECHA DE PUBLICACIÓN Julio - 2015 Datos Descriptivos Nombre de la Asignatura
Más detallesPrograma Educativo (PE): Licenciatura en Ciencias de la Computación. Área: Tecnología. Programa de Asignatura: Minería de Datos.
Programa Educativo (PE): Licenciatura en Ciencias de la Computación Área: Tecnología Programa de Asignatura: Minería de Datos Código: CCOM-606 Créditos: 5 Fecha: Julio de 2009 1 1. DATOS GENERALES Nivel
Más detallesINTRODUCTION TO MACHINE LEARNING ISABELLE GUYON
INTRODUCTION TO MACHINE LEARNING ISABELLE GUYON 2008-02-31 Notas tomadas por: María Eugenia Rojas Qué es Machine Learning? El proceso de aprendizaje de maquina consiste en tener una gran base de datos
Más detallesAPRENDIZAJE AUTOMÁTICO
ASIGNATURA DE GRADO: APRENDIZAJE AUTOMÁTICO Curso 2015/2016 (Código:71014023) 1.PRESENTACIÓN DE LA ASIGNATURA El Aprendizaje Automático es una rama de la Inteligencia Artificial que abarca diferentes técnicas,
Más detallesAPRENDIZAJE AUTOMÁTICO
ASIGNATURA DE GRADO: APRENDIZAJE AUTOMÁTICO Curso 2014/2015 (Código:71014023) 1.PRESENTACIÓN DE LA ASIGNATURA El Aprendizaje Automático es una rama de la Inteligencia Artificial que abarca diferentes técnicas,
Más detallesPerceptrón Simple. Aspectos Prácticos y Algoritmos Redes Neuronales, DC-FCEyN-UBA. Rosana Matuk Primer Cuatrimestre 2018
Perceptrón Simple Aspectos Prácticos y Algoritmos Redes Neuronales, DC-FCEyN-UBA Rosana Matuk Primer Cuatrimestre 2018 Rosana Matuk (DC-FCEyN-UBA) Perceptrón simple Primer Cuatrimestre 2018 1 / 29 Objetivo
Más detallesClasificador Jerárquico de Imágenes utilizando Naive Bayes
Clasificador Jerárquico de Imágenes utilizando Naive Bayes Hernandez Torres Julio Noe, Marin Castro Maribel Angelica Instituto Nacional de Astrofísica Óptica y Electrónica {julio.hernandez.t, mmarinc}
Más detallesTema 15: Combinación de clasificadores
Tema 15: Combinación de clasificadores p. 1/21 Tema 15: Combinación de clasificadores Abdelmalik Moujahid, Iñaki Inza, Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial
Más detallesGrado en Estadística Guía Académica Universidad de Salamanca
Grado en Estadística Guía Académica 2015-2016 131 TERCER CURSO. CUATRIMESTRE 2 TÉCNICAS ESTADÍSTICAS EN MINERÍA DE DATOS 1. Datos de la Asignatura Código 100726 Plan 2009 ECTS 6 Carácter Optativa Curso
Más detallesR for Data Mining Análisis de datos, segmentación y técnicas de predicción con R. web
R for Data Mining Análisis de datos, segmentación y técnicas de predicción con R web Presentación R es el lenguaje de programación estadístico por excelencia. Se destaca por que es una las herramientas
Más detallesANX-PR/CL/ GUÍA DE APRENDIZAJE. ASIGNATURA Mineria de datos. CURSO ACADÉMICO - SEMESTRE Segundo semestre
ANX-PR/CL/001-01 GUÍA DE APRENDIZAJE ASIGNATURA Mineria de datos CURSO ACADÉMICO - SEMESTRE 2016-17 - Segundo semestre GA_10II_105000169_2S_2016-17 Datos Descriptivos Nombre de la Asignatura Titulación
Más detallesMÉTODOS AVANZADOS EN APRENDIZAJE ARTIFICIAL: TEORÍA Y APLICACIONES A PROBLEMAS DE PREDICCIÓN
MÉTODOS AVANZADOS EN APRENDIZAJE ARTIFICIAL: TEORÍA Y APLICACIONES A PROBLEMAS DE PREDICCIÓN Manuel Sánchez-Montañés Luis Lago Ana González Escuela Politécnica Superior Universidad Autónoma de Madrid Teoría
Más detallesTema 8: Árboles de decisión
Introducción a la Ingeniería del Conocimiento Curso 2004 2005 Tema 8: Árboles de decisión Miguel A. Gutiérrez Naranjo Dpto. de Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla
Más detallespara la Selección Simultánea de Instancias y Atributos
Algoritmosde Estimaciónde Distribuciones para la Selección Simultánea de Instancias y Atributos MAEB 2012 Albacete 8 10 Febrero Pablo Bermejo, José A. Gámez, Ana M. Martínez y José M. Puerta Universidad
Más detallesProyecto 6. Árboles de decisión: Un árbol de decisión es un modelo de predicción utilizado en el ámbito de la inteligencia artificial.
Árboles de decisión: Un árbol de decisión es un modelo de predicción utilizado en el ámbito de la inteligencia artificial. Funcionamiento: Se realiza un test en cada nodo interno del árbol, a medida que
Más detallesMinería de Datos. Árboles de Decisión. Fac. Ciencias Ing. Informática Otoño de Dept. Matesco, Universidad de Cantabria
Minería de Datos Árboles de Decisión Cristina Tîrnăucă Dept. Matesco, Universidad de Cantabria Fac. Ciencias Ing. Informática Otoño de 2012 Twenty questions Intuición sobre los árboles de decisión Juego
Más detallesPlanificación de las enseñanzas
Planificación de las enseñanzas 1 Estructura de las enseñanzas: a. Descripción general del plan de estudios: De conformidad con la Guía para el Diseño y Tramitación de los Títulos de Grado y Máster de
Más detallesAnálisis de Datos. Red de función de base radial. Profesor: Dr. Wilfrido Gómez Flores
Análisis de Datos Red de función de base radial Profesor: Dr. Wilfrido Gómez Flores 1 Introducción Las funciones de base radial han sido utilizadas en diversas técnicas de reconocimiento de patrones como
Más detallesMinería de Datos. Árboles de Decisión. Fac. Ciencias Ing. Informática Otoño de Dept. Matesco, Universidad de Cantabria
Minería de Datos Árboles de Decisión Cristina Tîrnăucă Dept. Matesco, Universidad de Cantabria Fac. Ciencias Ing. Informática Otoño de 2012 Twenty questions Intuición sobre los árboles de decisión Juego
Más detallesAprendizaje Automatizado. Árboles de Clasificación
Aprendizaje Automatizado Árboles de Clasificación Árboles de Clasificación Estudiaremos un algoritmo para la creación del árbol. Selección de atributos comenzando en el nodo raíz. Proceso recursivo. Árboles
Más detallesRESUMEN PROGRAMACIÓN ESTADÍSTICA I. 3. Diseñar tablas estadísticas para coleccionar y ordenar datos.
RESUMEN PROGRAMACIÓN ESTADÍSTICA I OBJETIVOS 1. Conocer los principales conceptos usados en Estadística: población, muestra e individuo. 2. Diferenciar los tres tipos de variables estadísticas: cualitativas,
Más detallesTópicos Selectos en Aprendizaje Maquinal. Algoritmos para Reconocimiento de Patrones
Tópicos Selectos en Aprendizaje Maquinal Guía de Trabajos Prácticos N 1 (2da. parte) Algoritmos para Reconocimiento de Patrones 20 de Octubre de 2010 1. Objetivos Introducir conceptos básicos de aprendizaje
Más detallesApellidos:... Nombre:...
Ejercicio 1 (1.5 puntos): Cuestiones Contestar a las siguientes preguntas de manera clara y concisa, usando el espacio en blanco que se deja a continuación: 1. Qué es un unificador de dos átomos? Describir
Más detallesGUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC)
GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC) Curso Académico: 2017-2018 Programa: Centro: Universidad: Máster Universitario en Ingeniería Informática Universidad Autónoma de
Más detallesTRABAJO FIN DE ASIGNATURA
INTELIGENCIA EN REDES DE COMUNICACIONES TRABAJO FIN DE ASIGNATURA Luis Javier Duque Cuadrado 1 Breve descripción de los algoritmos elegidos 1.1 Clasificación a) Árboles de decisión de un nivel (decision
Más detallesI. CARACTERISTICAS DEL ALGORITMO ID3
I. CARACTERISTICAS DEL ALGORITMO ID3 El investigador J. Ross Quinlan desarrolló el algoritmo conocido como ID3 (Induction Decision Trees) en el año de 1983. Pertenece a la familia TDIDT (Top-Down Induction
Más detalles