Tarea 2 Investigación de Operaciones II

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Tarea 2 Investigación de Operaciones II"

Transcripción

1 Tarea 2 Investigación de Operaciones II Víctor A. Peña y Lillo Zumelzu vpena@alumnos.inf.utfsm.cl Departamento de Informática Universidad Técnica Federico Santa María Valparaíso, Chile 29 de mayo de 2006 Resumen En la presente tarea se analiza un conjunto de datos, para en base a ellos realizar árboles de decisión. Para hacer los árboles de decisión utilizan dos programas: CART y See5, para luego realizar una comparación de los dos programas ya que se sabe que trabajan de forma distinta y ofrecen diferentes resultados. 1. Introducción Los árboles de clasificación (también llamados de decisión o de identificación) son uno de los métodos de aprendizaje inductivo supervisado no paramétrico más utilizado. Como forma de representación del conocimiento, los árboles de clasificación destacan por su sencillez. Su dominio de aplicación no está restringido a un ámbito concreto sino que pueden utilizarse en diversas áreas: diagnóstico médico, juegos, predicción meteorológica, control de calidad, etc. Un árbol de clasificación es una forma de representar el conocimiento obtenido en el proceso de aprendizaje inductivo. Puede verse como la estructura resultante de la partición recursiva del espacio de representación a partir del conjunto (numeroso) de prototipos. Esta partición recursiva se traduce en una organización jerárquica del espacio de representación que puede modelarse mediante una estructura de tipo árbol. Cada nodo interior contiene una pregunta sobre un atributo concreto (con un hijo por cada posible respuesta) y cada nodo hoja se refiere a una decisión (clasificación). La clasificación de patrones se realiza en base a una serie de preguntas sobre los valores de sus atributos, empezado por el nodo raíz y siguiendo el camino determinado por las respuestas a las preguntas de los nodos internos, hasta llegar a un nodo hoja. La etiqueta asignada a esta hoja es la que se asignará al patrón a clasificar.

2 2. Definición del problema El problema elegido para resolver mediante árboles de decisión fue el de averiguar si un hongo es venenoso o comestible, utilizando instancias ya conocidas. El conjunto de datos utilizado corresponde a 23 especies de hongos de las familias Agaricus y Lepiota. Cada especie se identifica como definitivamente comestible, definitivamente venenoso, o de comestibilidad desconocida y no recomendado. Esta última clase se combinó con las de los venenosos. Se procesaron 8124 instancias, cada una con 22 atributos, detallados a continuación: 1. Forma de la copa. 2. Superficie de la copa. 3. Color de la copa. 4. Presencia de manchas o moretones. 5. Olor. 6. Posicionamiento de la membrana. 7. Espaciado de la membrana. 8. Tamaño de la membrana. 9. Color de la membrana. 10. Forma del tallo. 11. Forma de la raíz. 12. Superficie sobre el anillo. 13. Superficie bajo el anillo. 14. Color sobre el anillo. 15. Color bajo el anillo. 16. Tipo de velo. 17. Color del velo. 18. Número de anillos. 19. Tipo de anillos. 20. Color de las esporas. 21. Distribución de la población. 22. Hábitat. Aquí se encuentra la descripción de cada variable y los valores que puede tomar, tal como se utilizó en los programas: Nombre de la variable Valores Clase class edible=e, poisonous=p 1 cap-shape bell=b,conical=c,convex=x,flat=f, knobbed=k,sunken=s 2 cap-surface fibrous=f,grooves=g,scaly=y,smooth=s 3 cap-color brown=n,buff=b,cinnamon=c,gray=g,green=r, pink=p,purple=u,red=e,white=w,yellow=y 4 bruises bruises=t,no=f 5 odor almond=a,anise=l,creosote=c,fishy=y,foul=f, musty=m,none=n,pungent=p,spicy=s 6 gill-attachment attached=a,descending=d,free=f,notched=n 7 gill-spacing close=c,crowded=w,distant=d 8 gill-size broad=b,narrow=n 2

3 9 gill-color black=k,brown=n,buff=b,chocolate=h,gray=g, green=r,orange=o,pink=p,purple=u,red=e, white=w,yellow=y 10 stalk-shape enlarging=e,tapering=t 11 stalk-root bulbous=b,club=c,cup=u,equal=e, rhizomorphs=z,rooted=r,missing=? 12 stalk-surface-above-ring ibrous=f,scaly=y,silky=k,smooth=s 13 stalk-surface-below-ring ibrous=f,scaly=y,silky=k,smooth=s 14 stalk-color-above-ring brown=n,buff=b,cinnamon=c,gray=g,orange=o, pink=p,red=e,white=w,yellow=y 15 stalk-color-below-ring brown=n,buff=b,cinnamon=c,gray=g,orange=o, pink=p,red=e,white=w,yellow=y 16 veil-type partial=p,universal=u 17 veil-color brown=n,orange=o,white=w,yellow=y 18 ring-number none=n,one=o,two=t 19. ring-type cobwebby=c,evanescent=e,flaring=f,large=l, none=n,pendant=p,sheathing=s,zone=z 20 spore-print-color black=k,brown=n,buff=b,chocolate=h,green=r, orange=o,purple=u,white=w,yellow=y 21 population abundant=a,clustered=c,numerous=n, scattered=s,several=v,solitary=y 22 habitat grasses=g,leaves=l,meadows=m,paths=p, urban=u,waste=w,woods=d 2.1. CART 2.2. See5 Se analizó la muestra en dos situaciones distintas. La primera situación consistió en construir el árbol de clasificación con la totalidad de los datos, mientras que en la segunda situación se utilizó un porcentaje (25%, 50% y 75%) de los datos para efectuar los tests que midieron la capacidad de clasificación del árbol Construcción del árbol See5 arrojó los siguientes resultados para el conjunto completo de datos: Decision tree: odor = a: e (400) odor = l: e (400) odor = c: p (192) odor = y: p (576) odor = f: p (2160) odor = m: p (36) 3

4 odor = p: p (256) odor = s: p (576) odor = n: :...spore-print-color = u: e (0) spore-print-color = k: e (1296) spore-print-color = n: e (1344) spore-print-color = b: e (48) spore-print-color = h: e (48) spore-print-color = r: p (72) spore-print-color = o: e (48) spore-print-color = y: e (48) spore-print-color = w: :...veil-color in {n,o}: e (0) veil-color = y: p (8) veil-color = w: :...gill-size = b: e (528) gill-size = n: :...gill-spacing = d: e (0) gill-spacing = c: p (32) gill-spacing = w: :...bruises = t: p (8) bruises = f: e (48) Evaluation on training data (8124 cases): 4208 (a): class e 3916 (b): class p Time: 0.2 secs 4

5 2.2.2 Testing Muestra del 25% de los datos: Evaluation on training data (2031 cases): 21 0( 0.0%) << 1060 (a): class e 971 (b): class p Evaluation on test data (2031 cases): 21 0( 0.0%) << 1038 (a): class e 993 (b): class p Muestra del 50% de los datos: Evaluation on training data (4062 cases): 2137 (a): class e 1925 (b): class p 5

6 Evaluation on test data (4062 cases): 2071 (a): class e 1991 (b): class p Muestra del 75% de los datos: Evaluation on training data (6093 cases): 3192 (a): class e 2901 (b): class p Evaluation on test data (2031 cases): 1016 (a): class e 1015 (b): class p 6

7 3. Análisis 3.1 CART 3.2 See5 Del total de instancias, 4208 individuos pertenecen a la clase e (comestibles), mientras que 3916 pertenecen a la clase p (venenosos). Puede apreciarse que el número de nodos terminales u hojas ronda entre los 20 y 21. El error es de 0%, lo que nos indica que todos los casos pudieron ser clasificados. 3. Conclusiones Los resultados que se han obtenido en este trabajo muestran la capacidad del software See5 para responder de manera eficiente al problema de la comestibilidad de un hongo, siendo una alternativa muy fiable a las técnicas estadísticas convencionales. Esta metodología acepta variables tanto de tipo cuantitativo como cualitativo, sin ninguna clase de limitación, así como la existencia de valores perdidos. Su carácter estrictamente no paramétrico le confiere una clara superioridad frente a las técnicas estadísticas en el sentido de que se adecúa más a la información contable, que suele presentar datos interrelacionados, incompletos, adulterados o erróneos; proporciona modelos muy sencillos entendibles fácilmente por el analista humano, ya sea en forma de árboles o reglas de decisión, realizando una clasificación de las empresas entre solventes e insolventes que permite determinar la importancia de cada variable en el proceso de asignación. Además, da buenos resultados incluso cuando se trabaja con escaso número de datos. La técnica CART es superada fuertemente por C4.5, gracias a la inclusión de nuevas características como la partición por características específicas y puntuación de reglas de clasificación. C4.5 provee árboles de clasificación considerablemente pequeños con respecto a CART y a su vez con una mayor fortaleza, en resumen se ven favorecida la simplicidad y una mejora en la eficiencia. El tamaño de la data de aprendizaje es sumamente importante. Una data de aprendizaje pequeña puede provocar la creación de un árbol de clasificación que no considere instancias de individuos poco comunes o con características que lo diferencian de la población. Este hecho se vio reflejado en la experimentación efectuada con el algoritmo CART, en la que una menor data de aprendizaje provocó más errores de clasificación en los datos prueba. 4. Referencias UCI Machine Learning Repository. Bilkent University Function Approximation Repository. 7

Tema 8: Árboles de Clasificación

Tema 8: Árboles de Clasificación Tema 8: Árboles de Clasificación p. 1/11 Tema 8: Árboles de Clasificación Abdelmalik Moujahid, Iñaki Inza, Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad

Más detalles

Tareas de la minería de datos: clasificación. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR

Tareas de la minería de datos: clasificación. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Tareas de la minería de datos: clasificación CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Tareas de la minería de datos: clasificación Clasificación (discriminación) Empareja

Más detalles

Aprendizaje Automatizado

Aprendizaje Automatizado Aprendizaje Automatizado Aprendizaje Automatizado Programas que mejoran su comportamiento con la experiencia. Dos formas de adquirir experiencia: A partir de ejemplos suministrados por un usuario (un conjunto

Más detalles

Tareas de la minería de datos: clasificación. PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR

Tareas de la minería de datos: clasificación. PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR Tareas de la minería de datos: clasificación PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR Tareas de la minería de datos: clasificación Clasificación (discriminación) Empareja o asocia datos

Más detalles

Proyecto 6. Árboles de decisión: Un árbol de decisión es un modelo de predicción utilizado en el ámbito de la inteligencia artificial.

Proyecto 6. Árboles de decisión: Un árbol de decisión es un modelo de predicción utilizado en el ámbito de la inteligencia artificial. Árboles de decisión: Un árbol de decisión es un modelo de predicción utilizado en el ámbito de la inteligencia artificial. Funcionamiento: Se realiza un test en cada nodo interno del árbol, a medida que

Más detalles

Aprendizaje Automatizado

Aprendizaje Automatizado Aprendizaje Automatizado Aprendizaje Automatizado Programas que mejoran su comportamiento con la experiencia. Dos formas de adquirir experiencia: A partir de ejemplos suministrados por un usuario (un conjunto

Más detalles

Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA. Ricardo Aler Mur

Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA. Ricardo Aler Mur Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA Ricardo Aler Mur MODELOS: ÁRBOLES DE DECISIÓN Y REGLAS Datos de entrada 91 71 75 81 Nublado 90 72 Nublado 70 75 80 75 70

Más detalles

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 11 -

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 11 - Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos - Sesión 11 - Juan Alfonso Lara Torralbo 1 Índice de contenidos Actividad. Resolución manual de clasificación bayesiana

Más detalles

Aprendizaje Automatizado. Árboles de Clasificación

Aprendizaje Automatizado. Árboles de Clasificación Aprendizaje Automatizado Árboles de Clasificación Árboles de Clasificación Estudiaremos un algoritmo para la creación del árbol. Selección de atributos comenzando en el nodo raíz. Proceso recursivo. Árboles

Más detalles

D conjunto de N patrones etiquetados, cada uno de los cuales está caracterizado por n variables predictoras X 1,..., X n y la variable clase C.

D conjunto de N patrones etiquetados, cada uno de los cuales está caracterizado por n variables predictoras X 1,..., X n y la variable clase C. Tema 10. Árboles de Clasificación Pedro Larrañaga, Iñaki Inza, Abdelmalik Moujahid Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del País Vasco Euskal Herriko Unibertsitatea

Más detalles

Jesús García Herrero TÉCNICAS DE REGRESIÓN NO LINEAL

Jesús García Herrero TÉCNICAS DE REGRESIÓN NO LINEAL Jesús García Herrero TÉCNICAS DE REGRESIÓN NO LINEAL En esta clase se presenta un método de inducción de modelos numéricos de regresión a partir de datos. En el tema de técnicas clásicas se presentó la

Más detalles

Análisis y Complejidad de Algoritmos. Arboles Binarios. Arturo Díaz Pérez

Análisis y Complejidad de Algoritmos. Arboles Binarios. Arturo Díaz Pérez Análisis y Complejidad de Algoritmos Arboles Binarios Arturo Díaz Pérez Arboles Definiciones Recorridos Arboles Binarios Profundidad y Número de Nodos Arboles-1 Arbol Un árbol es una colección de elementos,

Más detalles

Árboles de Decisión Árboles de Sintaxis

Árboles de Decisión Árboles de Sintaxis Árboles de Decisión Árboles de Sintaxis Estructuras de Datos Andrea Rueda Pontificia Universidad Javeriana Departamento de Ingeniería de Sistemas Árboles de Decisión Árbol de Decisión Forma gráfica de

Más detalles

CAPITULO 4 PROPUESTA DE MEJORAMIENTO DE PROCESOS

CAPITULO 4 PROPUESTA DE MEJORAMIENTO DE PROCESOS CAPITULO 4 PROPUESTA DE MEJORAMIENTO DE PROCESOS 177 Una vez que se ha realizado el análisis de los procesos seleccionados, estableciendo sus costos, eficiencias y novedades encontradas, en el presente

Más detalles

CI5438. Inteligencia Artificial II Clase 4: Aprendizaje en Árboles. Cap 18.3: RN

CI5438. Inteligencia Artificial II Clase 4: Aprendizaje en Árboles. Cap 18.3: RN CI5438. Inteligencia Artificial II Clase 4: Aprendizaje en Árboles de Decisión Cap 18.3: RN Universidad Simón Boĺıvar 5 de octubre de 2009 Árboles de Decisión Un árbol de decisión es un árbol de búsqueda

Más detalles

Identificación de variables asociadas al éxito académico en Estudiantes de la Facultad de Informática Mazatlán

Identificación de variables asociadas al éxito académico en Estudiantes de la Facultad de Informática Mazatlán Your logo Identificación de variables asociadas al éxito académico en Estudiantes de la Facultad de Informática Mazatlán Universidad Autónoma de Sinaloa M.C. Rogelio Estrada Lizárraga Abril 16, 2013 Introducción

Más detalles

Conjuntos de Clasificadores (Ensemble Learning)

Conjuntos de Clasificadores (Ensemble Learning) Aprendizaje Automático Segundo Cuatrimestre de 2016 Conjuntos de Clasificadores (Ensemble Learning) Gracias a Ramiro Gálvez por la ayuda y los materiales para esta clase. Bibliografía: S. Fortmann-Roe,

Más detalles

Estadística con R. Clasificadores

Estadística con R. Clasificadores Estadística con R Clasificadores Análisis discriminante lineal (estadístico) Árbol de decisión (aprendizaje automático) Máquina soporte vector (aprendizaje automático) Análisis discriminante lineal (AD)

Más detalles

Tipos algebraicos y abstractos. Algoritmos y Estructuras de Datos I. Tipos algebraicos

Tipos algebraicos y abstractos. Algoritmos y Estructuras de Datos I. Tipos algebraicos Algoritmos y Estructuras de Datos I 1 cuatrimestre de 009 Departamento de Computación - FCEyN - UBA Programación funcional - clase Tipos algebraicos Tipos algebraicos y abstractos ya vimos los tipos básicos

Más detalles

Clasificación Supervisada. Métodos jerárquicos. CART

Clasificación Supervisada. Métodos jerárquicos. CART Clasificación Supervisada. Métodos jerárquicos. CART Ricardo Fraiman 2 de abril de 2010 Descripción del problema Muestra de entrenamiento (X 1, Y 1 ),..., (X n, Y n ) E {1,..., m}. Típicamente E = R d.

Más detalles

Curso de Estadística Básica

Curso de Estadística Básica Curso de SESION 2 PRESENTACIÓN GRÁFICA DE DATOS MCC. Manuel Uribe Saldaña MCC. José Gonzalo Lugo Pérez Objetivo Aprender cómo presentar y describir conjuntos de datos Agenda Sesión 2 Presentación gráfica

Más detalles

Clasificador Jerárquico de Imágenes utilizando Naive Bayes

Clasificador Jerárquico de Imágenes utilizando Naive Bayes Clasificador Jerárquico de Imágenes utilizando Naive Bayes Hernandez Torres Julio Noe, Marin Castro Maribel Angelica Instituto Nacional de Astrofísica Óptica y Electrónica {julio.hernandez.t, mmarinc}

Más detalles

Aprendizaje Automático

Aprendizaje Automático id3 id3 como búsqueda Cuestiones Adicionales Regresión Lineal. Árboles y Reglas de Regresión Ingeniería Informática Fernando Fernández Rebollo y Daniel Borrajo Millán Grupo de Planificación y Aprendizaje

Más detalles

ESTADISTICA. Tradicionalmente la aplicación del término estadística se ha utilizado en tres ámbitos:

ESTADISTICA. Tradicionalmente la aplicación del término estadística se ha utilizado en tres ámbitos: ESTADISTICA Tradicionalmente la aplicación del término estadística se ha utilizado en tres ámbitos: a) Estadística como enumeración de datos. b) Estadística como descripción, es decir, a través de un análisis

Más detalles

ÁRBOLES DE CLASIFICACIÓN Y REGRESIÓN

ÁRBOLES DE CLASIFICACIÓN Y REGRESIÓN ÁRBOLES DE CLASIFICACIÓN Y REGRESIÓN Los árboles de clasificación y regresión (CART=Classification and Regression Trees) son una alternativa al análisis tradicional de clasificación/discriminación o a

Más detalles

Conclusiones. Somos la suma de nuestras decisiones. WOODY ALLEN Delitos y Faltas (1989)

Conclusiones. Somos la suma de nuestras decisiones. WOODY ALLEN Delitos y Faltas (1989) Capítulo 7 Conclusiones Somos la suma de nuestras decisiones WOODY ALLEN Delitos y Faltas (1989) En este trabajo se ha presentado una nueva estrategia para construir árboles de decisión que ha conseguido

Más detalles

Paradigmas de Programación. Práctica 3. Árboles estrictamente binarios

Paradigmas de Programación. Práctica 3. Árboles estrictamente binarios Paradigmas de Programación Práctica 3 Árboles estrictamente binarios En el módulo Fb_tree, escrito en ocaml, está definido el tipo de dato 'a fb_tree que sirve para representar árboles binarios llenos

Más detalles

Anexo I CUESTIONARIO UTILIZADO PARA LA RECOGIDA DE INFORMACIÓN

Anexo I CUESTIONARIO UTILIZADO PARA LA RECOGIDA DE INFORMACIÓN Anexo I CUESTIONARIO UTILIZADO PARA LA RECOGIDA DE INFORMACIÓN 165 ENCUESTA DE COMPORTAMIENTOS Y TIPOLOGÍAS DE VISITANTES EN EUSKADI 166 ANEXO I. CUESTIONARIO UTILIZADO PARA LA RECOGIDA DE INFORMACIÓN

Más detalles

1º E.S.O. Criterios de evaluación y contenidos mínimos (septiembre 2018)

1º E.S.O. Criterios de evaluación y contenidos mínimos (septiembre 2018) 1º E.S.O. y contenidos mínimos (septiembre 2018) Bloque 1: Procesos, métodos y actitudes matemáticas 1.2 Utilizar procesos de razonamiento y estrategias de resolución de problemas, realizando los cálculos

Más detalles

10 EXÁMENES

10 EXÁMENES 10 EXÁMENES 2014-2018 Convocatoria Extraordinaria de Septiembre 1 de Septiembre de 2014 1. (1 pto.) a) Aunque por abuso del lenguaje hemos hablado de minería de datos y de KDD como sinónimos, indica las

Más detalles

Puestos y Organigramas

Puestos y Organigramas Descripción El Modulo de de Nexus HR es una permitirá representar las diferentes Unidades Organizacionales que constituyen la compañía con sus respectivos niveles jerárquicos, estos últimos definidos teniendo

Más detalles

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO Introducción Un árbol es una estructura no lineal en la que cada nodo puede apuntar a uno o varios nodos. A B C D E F G H I J K Clasificación con respecto a su relación: Nodo hijo: cualquiera de los nodos

Más detalles

CAPITULO IV MEJORAMIENTO DE PROCESOS

CAPITULO IV MEJORAMIENTO DE PROCESOS CAPITULO IV MEJORAMIENTO DE PROCESOS 149 Una vez que se ha realizado el análisis de los procesos seleccionados, estableciendo sus costos, eficiencias y problemas encontrados, en el presente capítulo se

Más detalles

Clasificadores Débiles - AdaBoost

Clasificadores Débiles - AdaBoost Capítulo 3 Clasificadores Débiles - AdaBoost El término boosting hace referencia a un tipo de algoritmos cuya finalidad es encontrar una hipótesis fuerte a partir de utilizar hipótesis simples y débiles.

Más detalles

Árbol ABB equilibrado. Lección: Árboles. Algorítmica II (Tema 4) Lenguajes y Sistemas Informáticos, Universidad Pablo de Olavide 1/ 58

Árbol ABB equilibrado. Lección: Árboles. Algorítmica II (Tema 4) Lenguajes y Sistemas Informáticos, Universidad Pablo de Olavide 1/ 58 Algorítmica II (Tema 4) Lenguajes y Sistemas Informáticos, Universidad Pablo de Olavide 1/ 58 Índice 1 Árbol de búsqueda 2 2/ 58 Índice Árbol de búsqueda 1 Árbol de búsqueda 2 3/ 58 Árbol de búsqueda Es

Más detalles

CART s. Walter Sosa-Escudero. Universisad de San Andres y CONICET

CART s. Walter Sosa-Escudero. Universisad de San Andres y CONICET Universisad de San Andres y CONICET Motivacion Modelo flexible e interpretable para la relacion entre Y y X. Arboles: partir el espacio de atributos en rectangulos, y ajustar un modelo simple para Y dentro

Más detalles

Tema: Métodos de Ordenamiento. Parte 3.

Tema: Métodos de Ordenamiento. Parte 3. Programación IV. Guía No. 5 1 Facultad: Ingeniería Escuela: Computación Asignatura: Programación IV Tema: Métodos de Ordenamiento. Parte 3. Objetivos Específicos Identificar la estructura de algunos algoritmos

Más detalles

VIII Jornadas de Usuarios de R

VIII Jornadas de Usuarios de R VIII Jornadas de Usuarios de R Análisis del Abandono en el Sector Bancario Predicción del abandono de clientes Albacete, 17 de Noviembre de 2016 I. INDICE : Modelo Abandonos I. COMPRENSIÓN DEL NEGOCIO

Más detalles

Aprendizaje inductivo

Aprendizaje inductivo Inteligencia Artificial Aprendizaje inductivo Ing. Sup. en Informática, 4º Curso académico: 2011/2012 Profesores: Ramón Hermoso y Matteo Vasirani Aprendizaje Resumen: 3. Aprendizaje automático 3.1 Introducción

Más detalles

Aprendizaje no supervisado

Aprendizaje no supervisado Aprendizaje no supervisado Algoritmo de K medias Julio Waissman Vilanova Licenciatura en Ciencias de la Computación Universidad de Sonora Curso Inteligencia Artificial Plan del curso Aprendizaje no supervisado

Más detalles

Construcción de Gráficas en forma manual y con programados

Construcción de Gráficas en forma manual y con programados Universidad de Puerto Rico en Aguadilla División de Educación Continua y Estudios Profesionales Proyecto CeCiMaT Segunda Generación Tercer Año Título II-B, Mathematics and Science Partnerships Construcción

Más detalles

4.1 Concepto de árbol.

4.1 Concepto de árbol. Apuntes Estructura de Datos Autor: Ing. Felipe Alanís González Página 1 4.1 Concepto de árbol. Una estructura de árbol es una forma de representar la JERARQUÍA de ciertos objetos en una forma gráfica.

Más detalles

Roberto Carlos Abreu Díaz. October 28, 2009

Roberto Carlos Abreu Díaz. October 28, 2009 Binarios binarios Java October 28, 2009 Binarios binarios Java 1 2 Binarios 3 binarios Java Código Java para búsqueda 4 Código Java para inserción 5 Caso 1 Caso 2 Caso 3 Outline Binarios binarios Java

Más detalles

Árboles de clasificación/decisión mediante R

Árboles de clasificación/decisión mediante R Árboles de clasificación/decisión mediante R Paquete Hay dos paquetes de R que cubren este asunto: tree y rpart. Trabajaremos con el segundo porque 1. Está incluido en la distribución básica de R. 2. La

Más detalles

Introducción a los sistemas Multiclasificadores. Carlos J. Alonso González Departamento de Informática Universidad de Valladolid

Introducción a los sistemas Multiclasificadores. Carlos J. Alonso González Departamento de Informática Universidad de Valladolid Introducción a los sistemas Multiclasificadores Carlos J. Alonso González Departamento de Informática Universidad de Valladolid Contenido 1. Combinación de modelos 2. Descomposición bias-varianza 3. Bagging

Más detalles

Tópicos Selectos en Aprendizaje Maquinal. Clasificación y Regresión con Datos Reales

Tópicos Selectos en Aprendizaje Maquinal. Clasificación y Regresión con Datos Reales Tópicos Selectos en Aprendizaje Maquinal Guía de Trabajos Prácticos N 2 Clasificación y Regresión con Datos Reales 18 de septiembre de 2014 1. Objetivos Introducir conceptos básicos de aprendizaje automático.

Más detalles

Deep Learning. Aplicaciones en Patología. Marcial García Rojo. Patólogo. Cádiz. Gloria Bueno. VISILAB Group. Universidad de Castilla-La Mancha

Deep Learning. Aplicaciones en Patología. Marcial García Rojo. Patólogo. Cádiz. Gloria Bueno. VISILAB Group. Universidad de Castilla-La Mancha Deep Learning. Aplicaciones en Patología Marcial García Rojo. Patólogo. Cádiz. Gloria Bueno. VISILAB Group. Universidad de Castilla-La Mancha Para qué necesitamos análisis de imagen en Patología? Reducir

Más detalles

BASES DE DATOS TEMA 2 MODELOS DE DATOS

BASES DE DATOS TEMA 2 MODELOS DE DATOS SES DE DTOS TEM 2 MODELOS DE DTOS Un modelo de datos es una serie de conceptos que puede utilizarse para describir un conjunto de datos y las operaciones para manipularlos. Hay dos tipos de modelos de

Más detalles

Tema 4: Gramáticas independientes del contexto. Teoría de autómatas y lenguajes formales I

Tema 4: Gramáticas independientes del contexto. Teoría de autómatas y lenguajes formales I Tema 4: Gramáticas independientes del contexto Teoría de autómatas y lenguajes formales I Bibliografía Hopcroft, J. E., Motwani, R., y Ullman, J. D. Introducción a la Teoría de Autómatas, Lenguajes y Computación.

Más detalles

Punto 4 Componentes del servicio DNS. Juan Luis Cano

Punto 4 Componentes del servicio DNS. Juan Luis Cano Punto 4 Componentes del servicio DNS Juan Luis Cano DNS es un sistema complejo y se basa de muchos componentes para su correcta utilización. Algunos de estos elementos son: El espacio de nombres de dominio

Más detalles

Clasificación estadística de patrones

Clasificación estadística de patrones Clasificación estadística de patrones Clasificador gaussiano César Martínez cmartinez _at_ fich.unl.edu.ar Tópicos Selectos en Aprendizaje Maquinal Doctorado en Ingeniería, FICH-UNL 19 de setiembre de

Más detalles

Tema 8: Árboles de decisión

Tema 8: Árboles de decisión Introducción a la Ingeniería del Conocimiento Curso 2004 2005 Tema 8: Árboles de decisión Miguel A. Gutiérrez Naranjo Dpto. de Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla

Más detalles

Aplicaciones: Herramientas clásicas, Redes Neuronales, control borroso

Aplicaciones: Herramientas clásicas, Redes Neuronales, control borroso Indice Inteligencia Artificial Historia Revisión de Técnicas Control automático Jerarquía de control Necesidad de inteligencia Aplicaciones: Herramientas clásicas, Redes Neuronales, control borroso Control

Más detalles

Formación Básica Estadística 1º 1º 6 Obligatoria

Formación Básica Estadística 1º 1º 6 Obligatoria GUIA DOCENTE DE LA ASIGNATURA ESTADÍSTICA Curso 2016-2017 MÓDULO MATERIA CURSO SEMESTRE CRÉDITOS TIPO Formación Básica Estadística 1º 1º 6 Obligatoria PROFESOR(ES) DIRECCIÓN COMPLETA DE CONTACTO PARA TUTORÍAS

Más detalles

Predicción de potencia en el parque eólico de Villonaco, Loja, Ecuador. Alberto Reyes y Tania Guerrero INER Ecuador

Predicción de potencia en el parque eólico de Villonaco, Loja, Ecuador. Alberto Reyes y Tania Guerrero INER Ecuador Predicción de potencia en el parque eólico de Villonaco, Loja, Ecuador Alberto Reyes y Tania Guerrero INER Ecuador INTRODUCCIÓN El comportamiento del viento presenta alto grado de aleatoriedad, incertidumbre

Más detalles

Identificación de tráfico de red basado en Aprendizaje Automático

Identificación de tráfico de red basado en Aprendizaje Automático Identificación de tráfico de red basado en Aprendizaje Automático Santiago Egea Gómez (santiago.egea@alumnos.uva.es) Universidad de Valladolid Jornadas Técnicas RedIRIS 15 de Junio 2017 de Comunicación

Más detalles

95.12 Algoritmos y Programación II Práctica 7: árboles

95.12 Algoritmos y Programación II Práctica 7: árboles Notas preliminares 95.12 Algoritmos y Programación II Práctica 7: árboles El objetivo de esta práctica es introducir distintas clases de estructuras de datos arbóreas y algoritmos para manipularlas. Los

Más detalles

Tema 6: Estructuras de datos recursivas

Tema 6: Estructuras de datos recursivas Tema 6: Estructuras de datos recursivas Índice 1 Listas jerárquicas...2 2 Árboles binarios... 4 3 Árboles genéricos...7 4 Referencias...10 1. Listas jerárquicas Las listas tienen la propiedad de la clausura

Más detalles

Técnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO

Técnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO Técnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO 2 Objetivo El objetivo principal de las técnicas de clasificación supervisada es obtener un modelo clasificatorio válido para permitir tratar

Más detalles

Aprendizaje Automatizado. Árboles de Clasificación

Aprendizaje Automatizado. Árboles de Clasificación Aprendizaje Automatizado Árboles de Clasificación Árboles de Clasificación Entrada: Objetos caracterizables mediante propiedades. Salida: En árboles de decisión: una decisión (sí o no). En árboles de clasificación:

Más detalles

Tema 7: Aprendizaje de árboles de decisión

Tema 7: Aprendizaje de árboles de decisión Inteligencia Artificial 2 Curso 2002 03 Tema 7: Aprendizaje de árboles de decisión José A. Alonso Jiménez Miguel A. Gutiérrez Naranjo Francisco J. Martín Mateos José L. Ruiz Reina Dpto. de Ciencias de

Más detalles

Datos y Estadísticas. Profesor: alberto alvaradejo

Datos y Estadísticas. Profesor: alberto alvaradejo Datos y Estadísticas Profesor: alberto alvaradejo Estadística La estadística se define como el arte y la ciencia de reunir datos, analizarlos, presentarlos e interpretarlos Especialmente en los negocios

Más detalles

Diseño de Experimentos

Diseño de Experimentos Diseño de Experimentos p. Diseño de Experimentos Isabel Casas Despacho: 10.0.04 mcasas@est-econ.uc3m.es Hector Cañada jcanada@est-econ.uc3m.es Introducción Los modelos que vamos a estudiar son usados para

Más detalles

Primera aproximación al aprendizaje automático.

Primera aproximación al aprendizaje automático. APRENDIZAJE Introducción al aprendizaje algorítmico José M. Sempere Departamento de Sistemas Informáticos y Computación Universidad Politécnica de Valencia Aprender: Tomar algo en la memoria [...] Adquirir

Más detalles

Estructuras de Datos y Algoritmos: Boletín de Problemas del segundo parcial

Estructuras de Datos y Algoritmos: Boletín de Problemas del segundo parcial Estructuras de Datos y Algoritmos: Boletín de Problemas del segundo parcial (Facultad de Informática) Curso 00 0 Estructuras de Datos y Algoritmos (FI-UPV) Curso 00 0 Árboles. Si la acción P fuera escribir

Más detalles

Programación de sistemas Árboles

Programación de sistemas Árboles Programación de sistemas Árboles Departamento de Ingeniería Telemática 1 Contenidos Concepto de árbol Terminología Implementación Casos especiales Árboles binarios de búsqueda Montículos (heaps) 2 Concepto

Más detalles

> plot(salmon[,- 1],col=as.factor(salmon[,1]))

> plot(salmon[,- 1],col=as.factor(salmon[,1])) ANÁLISIS DISCRIMINANTE El análisis discriminante, se utiliza para identificar las características que permiten diferenciar a dos o más grupos de sujetos; además para clasificar nuevos casos como pertenecientes

Más detalles

Grados Ing. Inf. y Mat. Inf. Noviembre 2011 Algoritmos y Estructura de Datos Página 1 de 6

Grados Ing. Inf. y Mat. Inf. Noviembre 2011 Algoritmos y Estructura de Datos Página 1 de 6 Grados Ing. Inf. y Mat. Inf. Noviembre 2011 Algoritmos y Estructura de Datos Página 1 de 6 Algoritmos y Estructura de Datos: Examen 2 (Solución) Grados Ing. Inf. y Mat. Inf. Noviembre 2011 Departamento

Más detalles

Introducción a los árboles. Lección 11

Introducción a los árboles. Lección 11 Introducción a los árboles Lección 11 Árbol: Conjunto de elementos de un mismo tipo, denominados nodos, que pueden representarse en un grafo no orientado, conexo y acíclico, en el que existe un vértice

Más detalles

Apellidos:... Nombre:...

Apellidos:... Nombre:... Apellidos:....................................... Nombre:........................................ Introducción a la Inteligencia Artificial 1 er Parcial de Teoría 12 Noviembre 2004 Ejercicio 1: Responder

Más detalles

Guía docente MÉTODOS ESTADÍSTICOS PARA LA EMPRESA

Guía docente MÉTODOS ESTADÍSTICOS PARA LA EMPRESA 1. Introducción Guía docente MÉTODOS ESTADÍSTICOS PARA LA EMPRESA Los análisis económicos y empresariales se efectúan sobre la base de la toma de decisiones, las cuales se toman a partir de la información

Más detalles

TEMA 0 REPASO DE CONCEPTOS BÁSICOS TEST PARA AUTOEVALUACIÓN DEL ALUMNO

TEMA 0 REPASO DE CONCEPTOS BÁSICOS TEST PARA AUTOEVALUACIÓN DEL ALUMNO TEMA 0 REPASO DE CONCEPTOS BÁSICOS TEST PARA AUTOEVALUACIÓN DEL ALUMNO NOTA: Sólo hay una respuesta válida. Responder a las preguntas justo en el orden en que están planteadas. A) Fundamentos de Matemáticas:

Más detalles

ANÁLISIS DE DATOS. Jesús García Herrero

ANÁLISIS DE DATOS. Jesús García Herrero ANÁLISIS DE DATOS Jesús García Herrero ANALISIS DE DATOS EJERCICIOS Una empresa de seguros de automóviles quiere utilizar los datos sobre sus clientes para obtener reglas útiles que permita clasificar

Más detalles

Automatización de la Evaluación del Impacto Social en Proyectos de Inversión Publica

Automatización de la Evaluación del Impacto Social en Proyectos de Inversión Publica Automatización de la Evaluación del Impacto Social en Proyectos de Inversión Publica Ronald René Vergara Pareja 1 Agenda Objetivo de la Investigación. Situación Actual de los Proyectos de Inversión Publica.

Más detalles

ESTADÍSTICA DESCRIPTIVA

ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA DESCRIPTIVA 1.- DISTRIBUCIONES UNIDIMENSIONALES. CONCEPTOS GENERALES. La estadística se puede dividir en dos partes: Estadística descriptiva o deductiva. Estadística inferencial o inductiva.

Más detalles

Aprendizaje Automático Segundo Cuatrimestre de Árboles de Decisión

Aprendizaje Automático Segundo Cuatrimestre de Árboles de Decisión Aprendizaje Automático Segundo Cuatrimestre de 2015 Árboles de Decisión Aproximación de Funciones Ejemplo: Un amigo juega al tenis los sábados. Juega o no, dependiendo del estado del tiempo. Cielo: {Sol,

Más detalles

Sílabo de Costos. Obligatorio

Sílabo de Costos. Obligatorio Sílabo de Costos I. Datos Generales Código Carácter A0089 Obligatorio Créditos 3 Periodo Académico 2017 Prerrequisito Ninguno Horas Teóricas: 2 Prácticas: 2 II. Sumilla de la asignatura La asignatura contiene:

Más detalles

IIC3633 Sistemas Recomendadores Functional Matrix Factorizations for Cold-Start Recommendation. Juan Navarro

IIC3633 Sistemas Recomendadores Functional Matrix Factorizations for Cold-Start Recommendation. Juan Navarro IIC3633 Sistemas Recomendadores Functional Matrix Factorizations for Cold-Start Recommendation Juan Navarro Referencia Zhou, K., Yang, S., and Zha, H. Functional matrix factorizations for cold-start recommendation.

Más detalles

OBJETIVO INTRODUCCIÓN

OBJETIVO INTRODUCCIÓN Fecha: 27 de mayo 2015 Tema: Búsqueda con información Parcial OBJETIVO Entender sobre la búsqueda con información parcial, tipos de problemas de búsqueda, como un agente puede construir secuencia de acciones

Más detalles

Introducción a la Odontología. Formación Básica. Materia Básica Estadística 1º 1º 6. Francisco Requena Guerrero

Introducción a la Odontología. Formación Básica. Materia Básica Estadística 1º 1º 6. Francisco Requena Guerrero GUIA DOCENTE DE LA ASIGNATURA ESTADÍSTICA Curso 2014-2015 (Fecha última actualización: 04/06/14) MÓDULO MATERIA CURSO SEMESTRE CRÉDITOS TIPO Introducción a la Odontología Materia Básica Estadística 1º

Más detalles

Sílabo de Costos. Obligatorio. Ninguno

Sílabo de Costos. Obligatorio. Ninguno Sílabo de Costos I. Datos Generales Código Carácter A0089 Obligatorio Créditos 3 Periodo Académico 2017 Prerrequisito Ninguno Horas Teóricas: 2 Prácticas: 2 II. Sumilla de la asignatura La asignatura contiene:

Más detalles

Inducción de Árboles de Decisión ID3, C4.5

Inducción de Árboles de Decisión ID3, C4.5 Inducción de Árboles de Decisión ID3, C4.5 Contenido 1. Representación mediante árboles de decisión. 2. Algoritmo básico: divide y vencerás. 3. Heurística para la selección de atributos. 4. Espacio de

Más detalles

HEA Herramienta de Software para la enseñanza de árboles B. Autor: Nucilli, Emanuel Alberto.

HEA Herramienta de Software para la enseñanza de árboles B. Autor: Nucilli, Emanuel Alberto. HEA Herramienta de Software para la enseñanza de árboles B Autor: Nucilli, Emanuel Alberto. Director: Thomas, Pablo. Codirector: Bertone, Rodolfo. Septiembre de 2011 FACULTAD DE INFORMÁTICA - UNLP 1 Índice

Más detalles

Tema Árboles generales. 9.2 Árboles binarios 9.3 Árboles de búsqueda

Tema Árboles generales. 9.2 Árboles binarios 9.3 Árboles de búsqueda Informática Haskell Matemáticas Curso 2004-2005 Pepe Gallardo Universidad de Málaga Tema 9. Árboles 9.1 Árboles generales 9.2 Árboles binarios 9.3 Árboles de búsqueda 9.1 Árboles generales Un árbol es

Más detalles

Lingüística computacional

Lingüística computacional Lingüística computacional Definición y alcance Escuela Nacional de Antropología e Historia (ENAH) Agosto diciembre de 2015 Lingüística Ciencias de la computación Lingüística computacional Estudio del lenguaje

Más detalles

Inteligencia Artificial: Su uso para la investigación

Inteligencia Artificial: Su uso para la investigación Inteligencia Artificial: Su uso para la investigación Dra. Helena Montserrat Gómez Adorno Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas helena.adorno@iimas.unam.mx 1 Introducción

Más detalles

Tema: Métodos de Ordenamiento. Parte 3.

Tema: Métodos de Ordenamiento. Parte 3. Programación IV. Guía 4 1 Facultad: Ingeniería Escuela: Computación Asignatura: Programación IV Tema: Métodos de Ordenamiento. Parte 3. Objetivos Específicos Identificar la estructura de algunos algoritmos

Más detalles

Técnicas de Minería de Datos

Técnicas de Minería de Datos Técnicas de Minería de Datos Act. Humberto Ramos S. 1 Qué es Minería de datos? El desarrollo de dispositivos tecnológicos para acumular datos a bajo costo. Acumulación o registro de gran cantidad de datos.

Más detalles

La web de la tecnología en educación secundaria

La web de la tecnología en educación secundaria La web de la tecnología en educación secundaria Introducción La web educativa www.tecno12-18.com tiene como objetivo suministrar contenidos educativos para la enseñanza de la tecnología en educación secundaria,

Más detalles

Minería de Datos Web. Cursada 2018

Minería de Datos Web. Cursada 2018 Minería de Datos Web Cursada 2018 Proceso de Minería de Texto Clustering de Documentos Clasificación de Documentos Es un método supervisado para dividir documentos en base a categorías predefinidas Los

Más detalles

Técnicas Multivariadas Avanzadas

Técnicas Multivariadas Avanzadas Métodos basados en árboles Universidad Nacional Agraria La Molina 2014-2 Introducción Introducción Se describen métodos basados en árboles para regresión y clasicación. Estos métodos requieren estraticar

Más detalles

Sobreajuste - Overfitting

Sobreajuste - Overfitting Sobreajuste - Overfitting Miguel Cárdenas-Montes Cuando se evalúa la calidad de un modelo o un ajuste, es importante medir el error en el conjunto de entrenamiento y en la predicción. La utilización exclusiva

Más detalles

En esta sección se presenta detalles acerca del diseño para computar la función Get- 6.1 Observaciónes en la Estructura de Teorías para

En esta sección se presenta detalles acerca del diseño para computar la función Get- 6.1 Observaciónes en la Estructura de Teorías para Capítulo 6 Implementación En esta sección se presenta detalles acerca del diseño para computar la función Get- SafeBeliefs y hacer posible su implementación. 6.1 Observaciónes en la Estructura de Teorías

Más detalles

Técnicas Avanzadas de Testing Automatizado. Generación exhaustiva acotada

Técnicas Avanzadas de Testing Automatizado. Generación exhaustiva acotada Técnicas Avanzadas de Testing Automatizado Generación exhaustiva acotada Generación Exaustiva Acotada La generación exhaustiva acotada es un enfoque a la generación automática de tests, que es especialmente

Más detalles

Object Recognition as Machine Translation: Learning a Lexicon for a Fixed Image Vocabulary

Object Recognition as Machine Translation: Learning a Lexicon for a Fixed Image Vocabulary Object Recognition as Machine Translation: Learning a Lexicon for a Fixed Image Vocabulary P. Duygulu, K. Barnard, J.F.G. de Freitas, and D.A. Forsyth Dr. Enrique Sucar 1 Victor Hugo Arroyo Dominguez 1

Más detalles