NEWTON TREES. Árboles de Estimación Estocástica de Probabilidades:

Tamaño: px
Comenzar la demostración a partir de la página:

Download "NEWTON TREES. Árboles de Estimación Estocástica de Probabilidades:"

Transcripción

1 Tesis de Máster en Ingeniería del Software, Métodos Formales y Sistemas de Información Árboles de Estimación Estocástica de Probabilidades: NEWTON TREES Autor: Fernando Martínez Plumed 1 Directores: Cèsar Ferri Ramirez María José Ramírez Quintana

2 2 ÍNDICE 1. Introducción 2. Newton Trees 3. Valores Faltantes 4. Experimentación 5. Conclusiones y Trabajo Futuro

3 1 1.1 Minería de Datos 1.2 Tareas y Técnicas 1.3 Árboles de Decisión 1.4 PET s 1.5 DBDT 1.6 Motivación Introducción 3

4 4 Introducción 1.1 Minería de Datos Definiciones: Proceso de extracción de información y patrones de comportamiento que permanecen ocultos entre grandes cantidades de información. Proceso que a través del descubrimiento y cuantificación de relaciones predictivas en los datos, permite transformar la información disponible en conocimiento útil.

5 5 Introducción 1.1 Minería de Datos Información Relaciones CONOCOMIENTO ÚTIL Y PATRONES OCULTOS

6 6 Introducción 1.2 Tareas y Técnicas Tareas: Predictivas: se trata de problemas y tareas en los que hay que predecir uno o más valores para uno o mas ejemplos. Los ejemplos en la evidencia van acompañados de una salida (clase, categoría o valor numérico) o un orden entre ellos. Dependiendo de como sea la correspondencia entre los ejemplos y los valores de salida y la presentación de los ejemplos podemos definir varias de tareas predictivas: Clasificación y Regresión

7 7 Introducción 1.2 Tareas y Técnicas Tareas: Descriptivas: los ejemplos se presentan como un conjunto δ = {e : eϵe}, sin etiquetar ni ordenar de ninguna manera. El objetivo, por tanto, no es predecir nuevos datos sino describir los existente: Asociaciones, Dependencias, Correlaciones y Agrupamiento.

8 8 Introducción 1.2 Tareas y Técnicas:Taxonomía T A R E A S DESCRIPTIVOS PREDICTIVOS Relación entre Variables (Atributos) Relación entre Individuos (Ejemplos) Asociaciones y Dependencias (si las variables son categoricas) Correlaciones (si las variables son numericas) Agrupamiento Clasificación (si la variable de salida es categórica) Regresión (Si la variable de salida es numérica)

9 9 Introducción 1.2 Tareas y Técnicas:Taxonomía Técnicas: Con Modelo EAGER Reg. Lineal K-means Arboles de Decisión Reglas ILP, IFLP Representables en forma de reglas Sin Modelo o No inteligible Perceptron Learning Radial Basis Functions. Bayes Classifiers Métodos Kernel y SVM LAZY Reg. Lineal Pond. Local CBR K-NN (Nearest Neighbour) Útiles para extracción de conocimiento

10 10 Introducción 1.2 Tareas y Técnicas:Taxonomía TÉCNICA Redes Neuronales Arboles de Decisión Kohonen Regresion Lineal, Regresión Logística Kmeans A priori Analisis Multivariante CN2 K-NN RBF Bayes Classifiers PREDICTIVO / SUPERVISADO DESCRIPTIVO / NO SUPERVISADO Clasificación Regresión Clustering Reglas Asociación Otros (Fact., Correl.)

11 11 Introducción 1.3 Árboles de Decisión Los árboles de decisión son una de las técnicas más populares y potentes en Aprendizaje Automático y Minería de Datos. Clasificadores para clasificar instancias (datos) representadas como vectores de características (features). Se basan en la idea de particionar recursivamente el conjunto de entrenamiento en conjuntos cada vez más pequeños hasta que el conjunto es puro. Nodos Condiciones (atributo seleccionado).

12 12 Introducción 1.3 Árboles de Decisión Ventajas: Buenos resultados en Accuracy. Desventajas: Tratamiento heterogeneo de un limitado número de tipos de datos (nominales y numericos). ID3, C4.5 o C5.0 [Quinlan], CART [Breiman].

13 13 Introducción 1.3 Árboles de Decisión

14 14 Introducción 1.4 PETs Variación de los árboles de decisión clásicos donde la salida proporcionada es una probabilidad. No modifican la manera de construir los árboles: usan criterios, particiones y métodos de poda diseñados para otras tareas o medidas. Buenos resultados en términos del AUC (Area Under the Curve) y MSE (Mean Squared Error). Aunque los PETs retornan probabilidades, no son probabilísticos en términos de cómo se usa el árbol para clasificar nuevas instancias.

15 15 Introducción 1.5 DBDT Distance-Based Decision Trees Uso de distancias y funciones de similitud para diseñar árboles de decisión más flexibles. Permite tratar cualquier tipo de datos en el que se puedan definir distancias. Devuelve un árbol de prototipos de clase (nodos en el árbol). Un ejemplo caerá en un nodo dado dependiendo de su proximidad al prototipo de clase.

16 16 Introducción 1.5 DBDT dnum(x,y) diferencia absoluta dnom(x,y) función identidad

17 17 Introducción 1.6 Motivación Presentación de un nuevo método de inducción de árboles de decisión, los Newton Trees. Trabajan con cualquier tipo de datos. Manejan de forma uniforme las distintas características. Probabilísticos en su uso haciendo que cada instancia recorra todo el árbol y no sólo una rama.

18 2 2.1 Newton Trees 2.2 Particiones Gravitacionales 2.3 Generación del Árbol 2.4 Cálculo Estocástico de la Probabilidad 2.5 Comprensibilidad 18 Newton Trees

19 19 Newton Trees Newton Trees Particiones 2.1 Newton Trees Gravitacionales Árboles de Estimación Estocástica de Probabilidades. Construcción, uso y representación del árbol basados en el principio de atracción. Las probabilidades se derivan también a partir de dicho principio. Árbol de prototipos. Representación gráfica del árbol sencilla de interpretar. Los árboles son univariantes, pero sus particiones no son necesariamente paralelas a los ejes.

20 20 Newton Trees Newton Trees Particiones 2.2 Particiones Gravitacionales Gravitacionales Particiones nodo/cluster por clase. Cada nodo/cluster es caracterizado por un prototipo (medioide). A partir de los medioides calculados, los datos se distribuyen de acuerdo a la siguiente función de atracción:

21 21 Newton Trees Newton Trees Particiones 2.3 Generación del árbol Gravitacionales 1. Para cada atributo Xr y cada clase i, se calcula un prototipo πr,i. 2. Seleccionar el atributo que maximice algún criterio de partición (Gain Ratio). 3. Se asocia cada instancia de entrenamiento a su prototipo más próximo. 4. Si la partición es impura ir a 1, si no Fin.

22 22 Newton Trees 2.4 Cálculo estocástico de la probabilidad Newton Trees Particiones Gravitacionales 1. Computar, desde la raíz a las hojas, la probabilidad de caer en cada nodo. 2. Calcular el vector de probabilidad en cada hoja.

23 23 Newton Trees 2.4 Cálculo estocástico de la probabilidad Newton Trees Particiones Gravitacionales 3. Propagar hacia arriba este vector para obtener en la raíz el vector total de probabilidad p(root,e)

24 Newton Trees p = 11 0 p = p = 2 1 p = 0 Instancia a clasificar: (FEMALE,NO)

25 3 3.1 Valores Faltantes 3.2 Valores Faltantes en C Valores Faltantes en Newton Trees 3.4 Ejemplo Valores Faltantes 25

26 26 Valores Faltantes 3.1 Valores Faltantes Qué pasa cuando parte de los datos están incompletos, como ocurre generalmente con cualquier conjunto de datos de la vida real? Descartar una proporción importante de los datos por incompletos y declarar algunos casos como inclasificables. Adaptar los algoritmos para poder trabajar con atributos con valores faltantes.

27 27 Valores Faltantes 3.2 Valores Faltantes en C4.5 Quinlan mostró que la combinación de todos los posibles resultados con un valor faltante en el ejemplo de test en la fase de clasificación proporciona una mejor precisión general que otros enfoques. Para clasificar un ejemplo e, éste se propaga por todas las ramas para calcular su probabilidad de forma proporcional al número de instancias de entrenamiento (con valores conocidos para el atributo de partición). El algoritmo C4.5 adopta esta aproximación.

28 28 Valores Faltantes 3.3 Valores Faltantes en Newton Trees Aproximación en Newton Trees: para atributos con valores faltantes se asume que la distancia a cualquier prototipo es igual, tal que: Se ignoran los valores faltantes en la fase de aprendizaje. Se establece constante (igual a 1) el valor de la distancia a cualquier prototipo.

29 29 Valores Faltantes 3.4 Ejemplo Instancia de Test: (FEMALE,?)

30 4 4.1 Configuración 4.2 Resultados Experimentación 30

31 31 Experimentación 4.1 Configuración Newton Trees vs J48 (sin poda y con suavizado de Laplace en las hojas) implementado en WEKA. Gain Ratio. 30 Datasets extraídos del repositorio UCI. 20 repeticiones x 5 folds Cross Validation. Métricas de evaluación: Accuracy, AUC y MSE. Tests estadisticos (Wilcoxon signed-ranks)

32 Resultados Tabla 1. Comparativa Global (30 Datasets) Newton Trees Unpruned Laplace J48 Acc. AUC MSE Acc. AUC MSE Media 82,091 0,866 0,100 80,728 0,842 0,110 Media (Binarios) Media (> 2 Clases) 83,650 0,867 0,115 81,339 0,831 0,133 80,308 0,866 0,084 80,031 0,854 0,083 Nominales 90,159 0,931 0,069 87,310 0,894 0,080 Numéricos 79,703 0,860 0,118 79,422 0,848 0,127 Mixtos 77,205 0,810 0,109 75,888 0,781 0,118

33 Resultados Tabla 2. Comparativa Valores Faltantes (7 Datasets) Newton Trees Unpruned Laplace J48 Acc. AUC MSE Acc. AUC MSE Media 83,934 0,874 0,095 83,641 0,860 0,100 Media (Binarios) Media (Clases >2) 84,531 0,853 0,111 83,454 0,838 0,119 82,440 0,926 0,056 84,108 0,914 0,053

34 5 5.1 Conclusiones 5.2 Trabajo futuro 5.3 Artículos Relacionados Conclusiones y Trabajo Futuro 34

35 35 Conclusiones 5.1 Conclusiones Novedoso método de aprendizaje de árboles de estimación estocástica de probabilidad, los Newton Trees. El uso de medioides permite el tratamiento homogéneo de cualquier tipo de datos. Representación grafica inteligible. Adaptación para el tratamiento de valores faltantes.

36 36 Conclusiones 5.1 Conclusiones Los resultados obtenidos en las distintas pruebas llevadas a cabo cumplen nuestras expectativas en cuanto a homogeneidad (en el tratamiento de los tipos de datos), transparencia (tratamiento de los datos inteligible), eficiencia (con un coste bajo) y eficacia (con resultados significativamente mejores a que los obtenidos con el j48).

37 37 Conclusiones 5.2 Trabajo Futuro AUC como criterio de partición. Extensión de los Newton Trees a otros métodos de aprendizaje como la regresión o el clustering. Tratamiento de datos estructurados (cadenas, listas, ). Clasificación de instancias multi-etiqueta.

38 39 Introducción 5.3 Artículos Relacionados F. Martinez-Plumed, V. Estruch, C. Ferri, J. Hernandez- Orallo, and M. J. Ramrez-Quintana. Newton trees, 23rd Australasian Joint Conference on Artificial Intelligence, AI 2010,(LNCS), Adelaide, Australia. F. Martinez-Plumed, V. Estruch, C. Ferri, J. Hernandez- Orallo, and M. J. Ramrez-Quintana. Tratamiento de Valores Faltantes en Newton trees, V Simposio de Teoría y Aplicaciones en Minería de Datos, TAMIDA 2010, Valencia, España. F. Martinez-Plumed, V. Estruch, C. Ferri, J. Hernandez- Orallo, and M. J. Ramrez-Quintana. Newton trees. Extended Technical Report, DSIC UPV 2010,

39 40 Gracias!

Tareas de la minería de datos: clasificación. PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR

Tareas de la minería de datos: clasificación. PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR Tareas de la minería de datos: clasificación PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR Tareas de la minería de datos: clasificación Clasificación (discriminación) Empareja o asocia datos

Más detalles

Aprendizaje Automático

Aprendizaje Automático id3 id3 como búsqueda Cuestiones Adicionales Regresión Lineal. Árboles y Reglas de Regresión Ingeniería Informática Fernando Fernández Rebollo y Daniel Borrajo Millán Grupo de Planificación y Aprendizaje

Más detalles

Tareas de la minería de datos: clasificación. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR

Tareas de la minería de datos: clasificación. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Tareas de la minería de datos: clasificación CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Tareas de la minería de datos: clasificación Clasificación (discriminación) Empareja

Más detalles

Índice general. Prefacio...5

Índice general. Prefacio...5 Índice general Prefacio...5 Capítulo 1 Introducción...13 1.1 Introducción...13 1.2 Los datos...19 1.3 Etapas en los procesos de big data...20 1.4 Minería de datos...21 1.5 Estructura de un proyecto de

Más detalles

Jesús García Herrero TÉCNICAS DE REGRESIÓN NO LINEAL

Jesús García Herrero TÉCNICAS DE REGRESIÓN NO LINEAL Jesús García Herrero TÉCNICAS DE REGRESIÓN NO LINEAL En esta clase se presenta un método de inducción de modelos numéricos de regresión a partir de datos. En el tema de técnicas clásicas se presentó la

Más detalles

Aprendizaje Automatizado

Aprendizaje Automatizado Aprendizaje Automatizado Aprendizaje Automatizado Programas que mejoran su comportamiento con la experiencia. Dos formas de adquirir experiencia: A partir de ejemplos suministrados por un usuario (un conjunto

Más detalles

Clasificación de estados cerebralesusando neuroimágenes funcionales

Clasificación de estados cerebralesusando neuroimágenes funcionales Clasificación de estados cerebralesusando neuroimágenes funcionales Clase 2: Reconocimiento de patrones en datos de neuroimagenes Enzo Tagliazucchi (tagliazucchi.enzo@googlemail.com) Primera clase: introducción

Más detalles

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 11 -

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 11 - Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos - Sesión 11 - Juan Alfonso Lara Torralbo 1 Índice de contenidos Actividad. Resolución manual de clasificación bayesiana

Más detalles

TÉCNICAS ESTADÍSTICAS PARA EL ANÁLISIS DE LA INFORMACIÓN CONTABLE

TÉCNICAS ESTADÍSTICAS PARA EL ANÁLISIS DE LA INFORMACIÓN CONTABLE TEMA 8 TÉCNICAS ESTADÍSTICAS PARA EL ANÁLISIS DE LA INFORMACIÓN CONTABLE 8.1.La inferencia estadística: del análisis univariante al análisis multivariante. 8.2.La reducción de la dimensionalidad: el análisis

Más detalles

Identificación de variables asociadas al éxito académico en Estudiantes de la Facultad de Informática Mazatlán

Identificación de variables asociadas al éxito académico en Estudiantes de la Facultad de Informática Mazatlán Your logo Identificación de variables asociadas al éxito académico en Estudiantes de la Facultad de Informática Mazatlán Universidad Autónoma de Sinaloa M.C. Rogelio Estrada Lizárraga Abril 16, 2013 Introducción

Más detalles

Técnicas de Minería de Datos

Técnicas de Minería de Datos Técnicas de Minería de Datos Act. Humberto Ramos S. 1 Qué es Minería de datos? El desarrollo de dispositivos tecnológicos para acumular datos a bajo costo. Acumulación o registro de gran cantidad de datos.

Más detalles

LA MINERÍA DE DATOS APLICADA A LA BÚSQUEDA DE PATRONES DE SUPERVIVIENCIA EN LA NEOPLASIA MALIGNA DE TRÁQUEA, BRONQUIOS Y PULMÓN

LA MINERÍA DE DATOS APLICADA A LA BÚSQUEDA DE PATRONES DE SUPERVIVIENCIA EN LA NEOPLASIA MALIGNA DE TRÁQUEA, BRONQUIOS Y PULMÓN LA MINERÍA DE DATOS APLICADA A LA BÚSQUEDA DE PATRONES DE SUPERVIVIENCIA EN LA NEOPLASIA MALIGNA DE TRÁQUEA, BRONQUIOS Y PULMÓN Miguel Ángel Negrín; Christian González; Jaime Pinilla; Francisco-José Vázquez-Polo

Más detalles

Aux 6. Introducción a la Minería de Datos

Aux 6. Introducción a la Minería de Datos Aux 6. Introducción a la Minería de Datos Gastón L Huillier 1,2, Richard Weber 2 glhuilli@dcc.uchile.cl 1 Departamento de Ciencias de la Computación Universidad de Chile 2 Departamento de Ingeniería Industrial

Más detalles

Lingüística computacional

Lingüística computacional Lingüística computacional Definición y alcance Escuela Nacional de Antropología e Historia (ENAH) Agosto diciembre de 2015 Lingüística Ciencias de la computación Lingüística computacional Estudio del lenguaje

Más detalles

Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Introducción al aprendizaje supervisado Profesor: Dr. Wilfrido Gómez Flores 1 Conceptos básicos Desde la antigüedad, el problema de buscar patrones en datos es fundamental en diversas

Más detalles

Itinerario: Inteligencia Computacional

Itinerario: Inteligencia Computacional Máster Universitario en Investigación e Innovación en Tecnologías de la Información y las Comunicaciones Itinerario: Inteligencia Computacional Escuela Politécnica Superior Universidad Autónoma de Madrid

Más detalles

Tema 8: Árboles de Clasificación

Tema 8: Árboles de Clasificación Tema 8: Árboles de Clasificación p. 1/11 Tema 8: Árboles de Clasificación Abdelmalik Moujahid, Iñaki Inza, Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad

Más detalles

Clasificación estadística de patrones

Clasificación estadística de patrones Clasificación estadística de patrones Clasificador gaussiano César Martínez cmartinez _at_ fich.unl.edu.ar Tópicos Selectos en Aprendizaje Maquinal Doctorado en Ingeniería, FICH-UNL 19 de setiembre de

Más detalles

Análisis multivariante

Análisis multivariante Machine Learning 2016-17 1 Aprendizaje automatizado (ML) 2 3 Aprendizaje automatizado (ML) Definiciones Conjunto de herramientas para transformar datos en conocimiento. Conjunto de técnicas que permitan

Más detalles

Minería de Datos Web. Cursada 2018

Minería de Datos Web. Cursada 2018 Minería de Datos Web Cursada 2018 Proceso de Minería de Texto Clustering de Documentos Clasificación de Documentos Es un método supervisado para dividir documentos en base a categorías predefinidas Los

Más detalles

IAAE - Inteligencia Artificial Aplicada a la Ingeniería

IAAE - Inteligencia Artificial Aplicada a la Ingeniería Unidad responsable: Unidad que imparte: Curso: Titulación: Créditos ECTS: 2016 295 - EEBE - Escuela de Ingeniería de Barcelona Este 723 - CS - Departamento de Ciencias de la Computación GRADO EN INGENIERÍA

Más detalles

Aprendizaje Automático Segundo Cuatrimestre de Árboles de Decisión

Aprendizaje Automático Segundo Cuatrimestre de Árboles de Decisión Aprendizaje Automático Segundo Cuatrimestre de 2015 Árboles de Decisión Aproximación de Funciones Ejemplo: Un amigo juega al tenis los sábados. Juega o no, dependiendo del estado del tiempo. Cielo: {Sol,

Más detalles

Tópicos Selectos en Aprendizaje Maquinal. Clasificación y Regresión con Datos Reales

Tópicos Selectos en Aprendizaje Maquinal. Clasificación y Regresión con Datos Reales Tópicos Selectos en Aprendizaje Maquinal Guía de Trabajos Prácticos N 2 Clasificación y Regresión con Datos Reales 18 de septiembre de 2014 1. Objetivos Introducir conceptos básicos de aprendizaje automático.

Más detalles

Minería de Datos. Arturo Olvera López

Minería de Datos. Arturo Olvera López Benemérita Universidad Autónoma de Puebla Facultad de Ciencias de la Computación Minería de Datos Arturo Olvera López aolvera@cs.buap.mx 1 1 Data Warehouse and OLAP 66 Data Warehouse 67 OLTP, OLAP 68 Data

Más detalles

MASTER DE INGENIERÍA BIOMÉDICA. Métodos de ayuda al diagnóstico clínico. Tema 6: Árboles de decisión.

MASTER DE INGENIERÍA BIOMÉDICA. Métodos de ayuda al diagnóstico clínico. Tema 6: Árboles de decisión. MASTER DE INGENIERÍA BIOMÉDICA. Métodos de ayuda al diagnóstico clínico. Tema 6: Árboles de decisión. 1 Objetivos del tema Conocer en qué consiste un árbol de decisión. Aprender los problemas que pueden

Más detalles

Técnicas de aprendizaje sobre series temporales

Técnicas de aprendizaje sobre series temporales Técnicas de aprendizaje sobre series temporales Contenido 1. Motivación. 2. Ejemplo del Problema. 3. Aproximaciones al problema de clasificación de series temporales. 4. Aprendizaje de reglas. 5. Boosting

Más detalles

Examen Parcial. Attr1: A, B Attr2: A, B, C Attr3 1, 2, 3 Attr4; a, b Attr5: 1, 2, 3, 4

Examen Parcial. Attr1: A, B Attr2: A, B, C Attr3 1, 2, 3 Attr4; a, b Attr5: 1, 2, 3, 4 Aprenentatge 0-03 Q Examen Parcial Nombre: (Examen ) Instrucciones. (0 puntos) Este examen dura horas. Responded todas las preguntas en estas hojas. Para las preguntas test poned un circulo alrededor de

Más detalles

Análisis de Datos. Combinación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Combinación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Combinación de clasificadores Profesor: Dr. Wilfrido Gómez Flores 1 Introducción Diversos algoritmos de clasificación están limitados a resolver problemas binarios, es decir, con dos

Más detalles

Sistemas de Percepción Visión por Computador

Sistemas de Percepción Visión por Computador Nota: Algunas de las imágenes que aparecen en esta presentación provienen del libro: Visión por Computador: fundamentos y métodos. Arturo de la Escalera Hueso. Prentice Hall. Sistemas de Percepción Visión

Más detalles

Aprendizaje inductivo no basado en el error Métodos competitivos supervisados.

Aprendizaje inductivo no basado en el error Métodos competitivos supervisados. Aprendizaje inductivo no basado en el error Métodos competitivos supervisados. Aprendizaje basado en instancias Carlos J. Alonso González Departamento de Informática Universidad de Valladolid Contenido

Más detalles

Inteligencia Artificial: Su uso para la investigación

Inteligencia Artificial: Su uso para la investigación Inteligencia Artificial: Su uso para la investigación Dra. Helena Montserrat Gómez Adorno Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas helena.adorno@iimas.unam.mx 1 Introducción

Más detalles

Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Introducción al aprendizaje supervisado Profesor: Dr. Wilfrido Gómez Flores 1 Conceptos básicos Reconocimiento de patrones (RP): clasificar objetos en un número de categorías o clases.

Más detalles

IAAE - Inteligencia Artificial Aplicada a la Ingeniería

IAAE - Inteligencia Artificial Aplicada a la Ingeniería Unidad responsable: Unidad que imparte: Curso: Titulación: Créditos ECTS: 2017 295 - EEBE - Escuela de Ingeniería de Barcelona Este 723 - CS - Departamento de Ciencias de la Computación GRADO EN INGENIERÍA

Más detalles

MD - Minería de Datos

MD - Minería de Datos Unidad responsable: Unidad que imparte: Curso: Titulación: Créditos ECTS: 018 70 - FIB - Facultad de Informática de Barcelona 73 - CS - Departamento de Ciencias de la Computación 715 - EIO - Departamento

Más detalles

APLICACIONES DE MINERA DE DATOS EN ADUANA DE PERU. Luis Azaña Bocanegra

APLICACIONES DE MINERA DE DATOS EN ADUANA DE PERU. Luis Azaña Bocanegra APLICACIONES DE MINERA DE DATOS EN ADUANA DE PERU Luis Azaña Bocanegra TEMARIO CONCEPTOS DEFINICION DE MINERIA DE DATOS USOS DE LA MINERIA DE DATOS TECNICAS DE MINERIA DE DATOS ETAPAS DE UN PROYECTO DE

Más detalles

ÍNDICE. Introducción... Capítulo 1. Técnicas de minería de datos y herramientas... 1

ÍNDICE. Introducción... Capítulo 1. Técnicas de minería de datos y herramientas... 1 ÍNDICE Introducción... XI Capítulo 1. Técnicas de minería de datos y herramientas... 1 Clasificación de las técnicas de minería de datos y herramientas más comunes... 1 Modelado originado por la teoría

Más detalles

Minería de Datos. Profra. Heidy Marisol Marin Castro Universidad Politécnica de Victoria

Minería de Datos. Profra. Heidy Marisol Marin Castro Universidad Politécnica de Victoria Minería de Datos Profra. Heidy Marisol Marin Castro Universidad Politécnica de Victoria 1 Que es un conjunto de datos? Es una colección de objetos con sus respectivo atributos. Un atributo es una propiedad

Más detalles

Inducción de Árboles de Decisión ID3, C4.5

Inducción de Árboles de Decisión ID3, C4.5 Inducción de Árboles de Decisión ID3, C4.5 Contenido 1. Representación mediante árboles de decisión. 2. Algoritmo básico: divide y vencerás. 3. Heurística para la selección de atributos. 4. Espacio de

Más detalles

Complementación y ampliación de la currícula de la Maestría 2017 Maestría en Generación y Análisis de Información Estadística

Complementación y ampliación de la currícula de la Maestría 2017 Maestría en Generación y Análisis de Información Estadística ampliación de la currícula Maestría en Generación y Análisis de Información Estadística Programa abierto de ampliación de la currícula Maestría en Generación y Análisis de Información Estadística La Maestría

Más detalles

Aprendizaje Automático. Objetivos. Funciona? Notas

Aprendizaje Automático. Objetivos. Funciona? Notas Introducción Las técnicas que hemos visto hasta ahora nos permiten crear sistemas que resuelven tareas que necesitan inteligencia La limitación de estos sistemas reside en que sólo resuelven los problemas

Más detalles

Minería de Datos. Índice. Raquel M. Crespo García. Julio Villena Román. Definición y conceptos Técnicas y modelos

Minería de Datos. Índice. Raquel M. Crespo García. Julio Villena Román. Definición y conceptos Técnicas y modelos Inteligencia en Redes de Comunicaciones Minería de Datos Raquel M. Crespo García Julio Villena Román {rcrespo, jvillena}@it.uc3m.es Índice Definición y conceptos Técnicas y modelos IRC - JVR, RCG - 1 1

Más detalles

CÁLCULO DE PROBABILIDADES

CÁLCULO DE PROBABILIDADES CÁLCULO DE PROBABILIDADES Tipo de asignatura: Troncal Anual. Créditos ECTS: 15 I.- INTRODUCCIÓN AL CÁLCULO DE PROBABILIDADES. (16 horas presenciales) Tema 1.- La naturaleza del cálculo de probabilidades.

Más detalles

CRITERIOS DE SELECCIÓN DE MODELOS

CRITERIOS DE SELECCIÓN DE MODELOS Inteligencia artificial y reconocimiento de patrones CRITERIOS DE SELECCIÓN DE MODELOS 1 Criterios para elegir un modelo Dos decisiones fundamentales: El tipo de modelo (árboles de decisión, redes neuronales,

Más detalles

Análisis comparativo DBDT vs otros Algoritmos para el manejo de datos no escalares.

Análisis comparativo DBDT vs otros Algoritmos para el manejo de datos no escalares. UNIVERSIDAD POLITÉCNICA DE VALENCIA Análisis comparativo DBDT vs otros Algoritmos para el manejo de datos no escalares. Tesis de Máster José Luis Ramírez Cabrera Departamento de Sistemas Informáticos y

Más detalles

Introducción a los sistemas Multiclasificadores. Carlos J. Alonso González Departamento de Informática Universidad de Valladolid

Introducción a los sistemas Multiclasificadores. Carlos J. Alonso González Departamento de Informática Universidad de Valladolid Introducción a los sistemas Multiclasificadores Carlos J. Alonso González Departamento de Informática Universidad de Valladolid Contenido 1. Combinación de modelos 2. Descomposición bias-varianza 3. Bagging

Más detalles

Introducción a Aprendizaje no Supervisado

Introducción a Aprendizaje no Supervisado Introducción a Aprendizaje no Supervisado Felipe Suárez, Álvaro Riascos 25 de abril de 2017 2 / 33 Contenido 1. Motivación 2. k-medias Algoritmos Implementación 3. Definición 4. Motivación 5. Aproximación

Más detalles

Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA. Ricardo Aler Mur

Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA. Ricardo Aler Mur Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA Ricardo Aler Mur MODELOS: ÁRBOLES DE DECISIÓN Y REGLAS Datos de entrada 91 71 75 81 Nublado 90 72 Nublado 70 75 80 75 70

Más detalles

D conjunto de N patrones etiquetados, cada uno de los cuales está caracterizado por n variables predictoras X 1,..., X n y la variable clase C.

D conjunto de N patrones etiquetados, cada uno de los cuales está caracterizado por n variables predictoras X 1,..., X n y la variable clase C. Tema 10. Árboles de Clasificación Pedro Larrañaga, Iñaki Inza, Abdelmalik Moujahid Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del País Vasco Euskal Herriko Unibertsitatea

Más detalles

2. Algoritmos genéticos y redes neuronales 3. Inducción de árboles clasificadores. Inducción de árboles de clasificación. Aprendizaje UPM UPM

2. Algoritmos genéticos y redes neuronales 3. Inducción de árboles clasificadores. Inducción de árboles de clasificación. Aprendizaje UPM UPM 1. Preliminares Aprendizaje 2. Algoritmos genéticos y redes neuronales 3. Inducción de árboles clasificadores 4. Inducción de reglas 5. Minería de datos c 2010 DIT-ETSIT- Aprendizaje: árboles transp. 1

Más detalles

MD - Minería de Datos

MD - Minería de Datos Unidad responsable: Unidad que imparte: Curso: Titulación: Créditos ECTS: 017 70 - FIB - Facultad de Informática de Barcelona 73 - CS - Departamento de Ciencias de la Computación 715 - EIO - Departamento

Más detalles

240AR022 - Reconocimiento de Formas y Aprendizaje Automático

240AR022 - Reconocimiento de Formas y Aprendizaje Automático Unidad responsable: Unidad que imparte: Curso: Titulación: Créditos ECTS: 2017 240 - ETSEIB - Escuela Técnica Superior de Ingeniería Industrial de Barcelona 707 - ESAII - Departamento de Ingeniería de

Más detalles

Pontificia Universidad Católica del Ecuador

Pontificia Universidad Católica del Ecuador 1. DATOS INFORMATIVOS: MATERIA O MÓDULO: CÓDIGO: CARRERA: NIVEL: INTELIGENCIA ARTIFICIAL II (Aprendizaje Automático) IS-12653 INGENIERIA DE SISTEMAS SEPTIMO No. CRÉDITOS: 4 CRÉDITOS TEORÍA: 2 CRÉDITOS

Más detalles

TÓPICOS SELECTOS DE OTROS CURSOS

TÓPICOS SELECTOS DE OTROS CURSOS UNIVERSIDAD AUTÓNOMA DE CHIHUAHUA Clave: 08MSU007H Clave: 08USU4053W FACULTAD DE INGENIERÍA PROGRAMA DEL CURSO: TÓPICOS SELECTOS DE OTROS CURSOS DES: Ingeniería Ingeniería en Sistemas Programa(s) Educativo(s):

Más detalles

Predicción de potencia en el parque eólico de Villonaco, Loja, Ecuador. Alberto Reyes y Tania Guerrero INER Ecuador

Predicción de potencia en el parque eólico de Villonaco, Loja, Ecuador. Alberto Reyes y Tania Guerrero INER Ecuador Predicción de potencia en el parque eólico de Villonaco, Loja, Ecuador Alberto Reyes y Tania Guerrero INER Ecuador INTRODUCCIÓN El comportamiento del viento presenta alto grado de aleatoriedad, incertidumbre

Más detalles

Posibles trabajos HIA

Posibles trabajos HIA Posibles trabajos HIA Posibles trabajos Comparar otras herramientas de Minería de Datos con Weka Estudiar la influencia del ruido en bagging y boosting Estudiar la influencia del parámetro de poda en J48

Más detalles

IAAE - Inteligencia Artificial Aplicada a la Ingeniería

IAAE - Inteligencia Artificial Aplicada a la Ingeniería Unidad responsable: Unidad que imparte: Curso: Titulación: Créditos ECTS: 2017 295 - EEBE - Escuela de Ingeniería de Barcelona Este 723 - CS - Departamento de Ciencias de la Computación GRADO EN INGENIERÍA

Más detalles

IAAE - Inteligencia Artificial Aplicada a la Ingeniería

IAAE - Inteligencia Artificial Aplicada a la Ingeniería Unidad responsable: Unidad que imparte: Curso: Titulación: Créditos ECTS: 2017 295 - EEBE - Escuela de Ingeniería de Barcelona Este 723 - CS - Departamento de Ciencias de la Computación GRADO EN INGENIERÍA

Más detalles

Introducción a la minería de datos. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR

Introducción a la minería de datos. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Introducción a la minería de datos CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Minería de datos Detección, interpretación y predicción de patrones cuantitativos y cualitativos

Más detalles

DIPLOMADO EN DATA MINING

DIPLOMADO EN DATA MINING DIPLOMADO EN DATA MINING DIPLOMADO EN DATA MINING Los datos que tienen relevancia para las decisiones de gestión, se están acumulando a un ritmo increíble, debido a una serie de avances tecnológicos. La

Más detalles

Programa Educativo (PE): Ingeniería en Ciencias de la Computación. Área: Tecnología. Programa de Asignatura: Minería de Datos.

Programa Educativo (PE): Ingeniería en Ciencias de la Computación. Área: Tecnología. Programa de Asignatura: Minería de Datos. Programa Educativo (PE): Ingeniería en Ciencias de la Computación Área: Tecnología Programa de Asignatura: Minería de Datos Código: CCOM-606 Créditos: 5 Fecha: Julio de 2009 1 1. DATOS GENERALES Nivel

Más detalles

Aprendizaje Automatizado. Árboles de Clasificación

Aprendizaje Automatizado. Árboles de Clasificación Aprendizaje Automatizado Árboles de Clasificación Árboles de Clasificación Entrada: Objetos caracterizables mediante propiedades. Salida: En árboles de decisión: una decisión (sí o no). En árboles de clasificación:

Más detalles

SISTEMAS INTELIGENTES

SISTEMAS INTELIGENTES SISTEMAS INTELIGENTES T9: Árboles de Decisión www.aic.uniovi.es/ssii Sistemas Inteligentes T9: Árboles de decisión Índice Árboles de decisión para clasificación Mecanismo de inducción: divide y vencerás

Más detalles

GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC)

GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC) GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC) Curso Académico: 2015-2016 Programa: Centro: Universidad: Máster Universitario en Ingeniería Informática Escuela Politécnica Superior

Más detalles

12/08/2017 AVL. Especificación sobre árboles AVL. AVL: rotaciones

12/08/2017 AVL. Especificación sobre árboles AVL. AVL: rotaciones VL Se dice que un árbol binario está balanceado si y sólo si en cada nodo las alturas de sus 2 subárboles difieren como máximo en 1. Todos los árboles perfectamente balanceados son árboles VL. Especificación

Más detalles

Automatización de la Evaluación del Impacto Social en Proyectos de Inversión Publica

Automatización de la Evaluación del Impacto Social en Proyectos de Inversión Publica Automatización de la Evaluación del Impacto Social en Proyectos de Inversión Publica Ronald René Vergara Pareja 1 Agenda Objetivo de la Investigación. Situación Actual de los Proyectos de Inversión Publica.

Más detalles

10 EXÁMENES

10 EXÁMENES 10 EXÁMENES 2014-2018 Convocatoria Extraordinaria de Septiembre 1 de Septiembre de 2014 1. (1 pto.) a) Aunque por abuso del lenguaje hemos hablado de minería de datos y de KDD como sinónimos, indica las

Más detalles

Aprendizaje Automático

Aprendizaje Automático Ingeniería Informática Fernando Fernández Rebollo y Daniel Borrajo Millán Grupo de Planificación y Aprendizaje (PLG) Departamento de Informática Escuela Politécnica Superior Universidad Carlos III de Madrid

Más detalles

Clustering: Auto-associative Multivariate Regression Tree (AAMRT)

Clustering: Auto-associative Multivariate Regression Tree (AAMRT) Introducción Tipos Validación AAMRT Clustering: Auto-associative Multivariate Regression Tree (AAMRT) Miguel Bernal C Quantil 12 de diciembre de 2013 Miguel Bernal C Quantil Matemáticas Aplicadas Contenido

Más detalles

Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA. Ricardo Aler Mur

Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA. Ricardo Aler Mur Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA Ricardo Aler Mur Regresión simbólica, búsqueda genética y algoritmos de estimación de distribuciones Regresión lineal Regresión:

Más detalles

Técnicas del aprendizaje automático para la asistencia en la toma de decisiones

Técnicas del aprendizaje automático para la asistencia en la toma de decisiones Técnicas del aprendizaje automático para la asistencia en la toma de decisiones Cèsar Ferri Ramírez Departament de Sistemes Informàtics i Computació Universitat Politècnica de València, Valencia, Spain

Más detalles

GUÍA DE APRENDIZAJE ASIGNATURA SISTEMAS BASADOS EN APRENDIZAJE AUTOMATICO. CURSO ACADÉMICO - SEMESTRE Primer semestre

GUÍA DE APRENDIZAJE ASIGNATURA SISTEMAS BASADOS EN APRENDIZAJE AUTOMATICO. CURSO ACADÉMICO - SEMESTRE Primer semestre GUÍA DE APRENDIZAJE ASIGNATURA SISTEMAS BASADOS EN APRENDIZAJE AUTOMATICO CURSO ACADÉMICO - SEMESTRE 2015-16 - Primer semestre FECHA DE PUBLICACIÓN Julio - 2015 Datos Descriptivos Nombre de la Asignatura

Más detalles

Programa Educativo (PE): Licenciatura en Ciencias de la Computación. Área: Tecnología. Programa de Asignatura: Minería de Datos.

Programa Educativo (PE): Licenciatura en Ciencias de la Computación. Área: Tecnología. Programa de Asignatura: Minería de Datos. Programa Educativo (PE): Licenciatura en Ciencias de la Computación Área: Tecnología Programa de Asignatura: Minería de Datos Código: CCOM-606 Créditos: 5 Fecha: Julio de 2009 1 1. DATOS GENERALES Nivel

Más detalles

INTRODUCTION TO MACHINE LEARNING ISABELLE GUYON

INTRODUCTION TO MACHINE LEARNING ISABELLE GUYON INTRODUCTION TO MACHINE LEARNING ISABELLE GUYON 2008-02-31 Notas tomadas por: María Eugenia Rojas Qué es Machine Learning? El proceso de aprendizaje de maquina consiste en tener una gran base de datos

Más detalles

APRENDIZAJE AUTOMÁTICO

APRENDIZAJE AUTOMÁTICO ASIGNATURA DE GRADO: APRENDIZAJE AUTOMÁTICO Curso 2015/2016 (Código:71014023) 1.PRESENTACIÓN DE LA ASIGNATURA El Aprendizaje Automático es una rama de la Inteligencia Artificial que abarca diferentes técnicas,

Más detalles

APRENDIZAJE AUTOMÁTICO

APRENDIZAJE AUTOMÁTICO ASIGNATURA DE GRADO: APRENDIZAJE AUTOMÁTICO Curso 2014/2015 (Código:71014023) 1.PRESENTACIÓN DE LA ASIGNATURA El Aprendizaje Automático es una rama de la Inteligencia Artificial que abarca diferentes técnicas,

Más detalles

Perceptrón Simple. Aspectos Prácticos y Algoritmos Redes Neuronales, DC-FCEyN-UBA. Rosana Matuk Primer Cuatrimestre 2018

Perceptrón Simple. Aspectos Prácticos y Algoritmos Redes Neuronales, DC-FCEyN-UBA. Rosana Matuk Primer Cuatrimestre 2018 Perceptrón Simple Aspectos Prácticos y Algoritmos Redes Neuronales, DC-FCEyN-UBA Rosana Matuk Primer Cuatrimestre 2018 Rosana Matuk (DC-FCEyN-UBA) Perceptrón simple Primer Cuatrimestre 2018 1 / 29 Objetivo

Más detalles

Clasificador Jerárquico de Imágenes utilizando Naive Bayes

Clasificador Jerárquico de Imágenes utilizando Naive Bayes Clasificador Jerárquico de Imágenes utilizando Naive Bayes Hernandez Torres Julio Noe, Marin Castro Maribel Angelica Instituto Nacional de Astrofísica Óptica y Electrónica {julio.hernandez.t, mmarinc}

Más detalles

Tema 15: Combinación de clasificadores

Tema 15: Combinación de clasificadores Tema 15: Combinación de clasificadores p. 1/21 Tema 15: Combinación de clasificadores Abdelmalik Moujahid, Iñaki Inza, Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial

Más detalles

Grado en Estadística Guía Académica Universidad de Salamanca

Grado en Estadística Guía Académica Universidad de Salamanca Grado en Estadística Guía Académica 2015-2016 131 TERCER CURSO. CUATRIMESTRE 2 TÉCNICAS ESTADÍSTICAS EN MINERÍA DE DATOS 1. Datos de la Asignatura Código 100726 Plan 2009 ECTS 6 Carácter Optativa Curso

Más detalles

R for Data Mining Análisis de datos, segmentación y técnicas de predicción con R. web

R for Data Mining Análisis de datos, segmentación y técnicas de predicción con R. web R for Data Mining Análisis de datos, segmentación y técnicas de predicción con R web Presentación R es el lenguaje de programación estadístico por excelencia. Se destaca por que es una las herramientas

Más detalles

ANX-PR/CL/ GUÍA DE APRENDIZAJE. ASIGNATURA Mineria de datos. CURSO ACADÉMICO - SEMESTRE Segundo semestre

ANX-PR/CL/ GUÍA DE APRENDIZAJE. ASIGNATURA Mineria de datos. CURSO ACADÉMICO - SEMESTRE Segundo semestre ANX-PR/CL/001-01 GUÍA DE APRENDIZAJE ASIGNATURA Mineria de datos CURSO ACADÉMICO - SEMESTRE 2016-17 - Segundo semestre GA_10II_105000169_2S_2016-17 Datos Descriptivos Nombre de la Asignatura Titulación

Más detalles

MÉTODOS AVANZADOS EN APRENDIZAJE ARTIFICIAL: TEORÍA Y APLICACIONES A PROBLEMAS DE PREDICCIÓN

MÉTODOS AVANZADOS EN APRENDIZAJE ARTIFICIAL: TEORÍA Y APLICACIONES A PROBLEMAS DE PREDICCIÓN MÉTODOS AVANZADOS EN APRENDIZAJE ARTIFICIAL: TEORÍA Y APLICACIONES A PROBLEMAS DE PREDICCIÓN Manuel Sánchez-Montañés Luis Lago Ana González Escuela Politécnica Superior Universidad Autónoma de Madrid Teoría

Más detalles

Tema 8: Árboles de decisión

Tema 8: Árboles de decisión Introducción a la Ingeniería del Conocimiento Curso 2004 2005 Tema 8: Árboles de decisión Miguel A. Gutiérrez Naranjo Dpto. de Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla

Más detalles

para la Selección Simultánea de Instancias y Atributos

para la Selección Simultánea de Instancias y Atributos Algoritmosde Estimaciónde Distribuciones para la Selección Simultánea de Instancias y Atributos MAEB 2012 Albacete 8 10 Febrero Pablo Bermejo, José A. Gámez, Ana M. Martínez y José M. Puerta Universidad

Más detalles

Proyecto 6. Árboles de decisión: Un árbol de decisión es un modelo de predicción utilizado en el ámbito de la inteligencia artificial.

Proyecto 6. Árboles de decisión: Un árbol de decisión es un modelo de predicción utilizado en el ámbito de la inteligencia artificial. Árboles de decisión: Un árbol de decisión es un modelo de predicción utilizado en el ámbito de la inteligencia artificial. Funcionamiento: Se realiza un test en cada nodo interno del árbol, a medida que

Más detalles

Minería de Datos. Árboles de Decisión. Fac. Ciencias Ing. Informática Otoño de Dept. Matesco, Universidad de Cantabria

Minería de Datos. Árboles de Decisión. Fac. Ciencias Ing. Informática Otoño de Dept. Matesco, Universidad de Cantabria Minería de Datos Árboles de Decisión Cristina Tîrnăucă Dept. Matesco, Universidad de Cantabria Fac. Ciencias Ing. Informática Otoño de 2012 Twenty questions Intuición sobre los árboles de decisión Juego

Más detalles

Planificación de las enseñanzas

Planificación de las enseñanzas Planificación de las enseñanzas 1 Estructura de las enseñanzas: a. Descripción general del plan de estudios: De conformidad con la Guía para el Diseño y Tramitación de los Títulos de Grado y Máster de

Más detalles

Análisis de Datos. Red de función de base radial. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Red de función de base radial. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Red de función de base radial Profesor: Dr. Wilfrido Gómez Flores 1 Introducción Las funciones de base radial han sido utilizadas en diversas técnicas de reconocimiento de patrones como

Más detalles

Minería de Datos. Árboles de Decisión. Fac. Ciencias Ing. Informática Otoño de Dept. Matesco, Universidad de Cantabria

Minería de Datos. Árboles de Decisión. Fac. Ciencias Ing. Informática Otoño de Dept. Matesco, Universidad de Cantabria Minería de Datos Árboles de Decisión Cristina Tîrnăucă Dept. Matesco, Universidad de Cantabria Fac. Ciencias Ing. Informática Otoño de 2012 Twenty questions Intuición sobre los árboles de decisión Juego

Más detalles

Aprendizaje Automatizado. Árboles de Clasificación

Aprendizaje Automatizado. Árboles de Clasificación Aprendizaje Automatizado Árboles de Clasificación Árboles de Clasificación Estudiaremos un algoritmo para la creación del árbol. Selección de atributos comenzando en el nodo raíz. Proceso recursivo. Árboles

Más detalles

RESUMEN PROGRAMACIÓN ESTADÍSTICA I. 3. Diseñar tablas estadísticas para coleccionar y ordenar datos.

RESUMEN PROGRAMACIÓN ESTADÍSTICA I. 3. Diseñar tablas estadísticas para coleccionar y ordenar datos. RESUMEN PROGRAMACIÓN ESTADÍSTICA I OBJETIVOS 1. Conocer los principales conceptos usados en Estadística: población, muestra e individuo. 2. Diferenciar los tres tipos de variables estadísticas: cualitativas,

Más detalles

Tópicos Selectos en Aprendizaje Maquinal. Algoritmos para Reconocimiento de Patrones

Tópicos Selectos en Aprendizaje Maquinal. Algoritmos para Reconocimiento de Patrones Tópicos Selectos en Aprendizaje Maquinal Guía de Trabajos Prácticos N 1 (2da. parte) Algoritmos para Reconocimiento de Patrones 20 de Octubre de 2010 1. Objetivos Introducir conceptos básicos de aprendizaje

Más detalles

Apellidos:... Nombre:...

Apellidos:... Nombre:... Ejercicio 1 (1.5 puntos): Cuestiones Contestar a las siguientes preguntas de manera clara y concisa, usando el espacio en blanco que se deja a continuación: 1. Qué es un unificador de dos átomos? Describir

Más detalles

GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC)

GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC) GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC) Curso Académico: 2017-2018 Programa: Centro: Universidad: Máster Universitario en Ingeniería Informática Universidad Autónoma de

Más detalles

TRABAJO FIN DE ASIGNATURA

TRABAJO FIN DE ASIGNATURA INTELIGENCIA EN REDES DE COMUNICACIONES TRABAJO FIN DE ASIGNATURA Luis Javier Duque Cuadrado 1 Breve descripción de los algoritmos elegidos 1.1 Clasificación a) Árboles de decisión de un nivel (decision

Más detalles

I. CARACTERISTICAS DEL ALGORITMO ID3

I. CARACTERISTICAS DEL ALGORITMO ID3 I. CARACTERISTICAS DEL ALGORITMO ID3 El investigador J. Ross Quinlan desarrolló el algoritmo conocido como ID3 (Induction Decision Trees) en el año de 1983. Pertenece a la familia TDIDT (Top-Down Induction

Más detalles