Weka: Waitako Environment for Knowledge Analysis Introducción Explorer Carlos J. Alonso González Departamento de Informática Universidad de Valladolid
Contenidos Fuentes Introducción The Explorer Introducción a Weka: explorer 2
Fuentes El contenido de esta presentación se basa en el capítulo 10 de I. Witten, E. Frank. Data Minig: Practical Machine Learning tools and Techniques, Second Edition. Morgan Kaufmman, Elsevier. San Francisco, CA, 2005. ISBN: 0 12 088407 Sitio weka: http://www.cs.waikato.ac.nz/ml/weka/ Presentación weka.ppt (descripción de todas las interfaces gráficas de weka, por E. Franck) Varios tutoriales, en el sitio weka Tutorial.pdf (parte II de la obra citada) Introducción de Alex K. Seewald Manual en español: http://metaemotion.com/diego.garcia.morate/download/weka.pdf Introducción a Weka: explorer 3
Introducción Software para el aprendizaje automático/minería de datos escrito en JAVA con licencia GNU Principalmente investigación, educación Complementa DATA MINIG, de Witten y Frank Características principales Sistema integrado de herramientas de preprocesado de datos, algoritmos de aprendizaje y métodos de evaluación de algoritmos Interfaces gráficas Entorno para la comparación de herramientas de aprendizaje Introducción a Weka: explorer 4
Ejecución Instalada máquina virtual java Instalado weka java jar weka.jar Aparece la ventana selector de interfaces Introducción a Weka: explorer 5
Selector de interfaces Introducción a Weka: explorer 6
Introducción a Weka: explorer 7
Explorer: formato de datos ARFF @relation heart-disease-simplified @attribute age numeric @attribute sex { female, male} @attribute chest_pain_type { typ_angina, asympt, non_anginal, atyp_angina} @attribute cholesterol numeric @attribute exercise_induced_angina { no, yes} @attribute class { present, not_present} @data 63,male,typ_angina,233,no,not_present 67,male,asympt,286,yes,present 67,male,asympt,229,yes,present 38,female,non_anginal,?,no,not_present... Introducción a Weka: explorer 8
Explorer: formato de datos ARFF @relation heart-disease-simplified CABECERA @attribute age numeric DECLARACIóN DE ATRIBUTOS @attribute sex { female, male} @attribute chest_pain_type { typ_angina, asympt, non_anginal, atyp_angina} @attribute cholesterol numeric @attribute exercise_induced_angina { no, yes} @attribute class { present, not_present} @data SECCIÓN DE DATOS 63,male,typ_angina,233,no,not_present 67,male,asympt,286,yes,present 67,male,asympt,229,yes,present 38,female,non_anginal,?,no,not_present... Introducción a Weka: explorer 9
Explorer: preprocesado Se pueden importar datos en varios formatos: ARFF, CSV, binarios... Herramientas de preprocesado: filters Filtros para: discretización, normalización, selección de atributos, resampling,... Introducción a Weka: explorer 10
Datos: IRIS Problema: determinar la clase de planta Iris: setosa, versicoulor, virginica Descripción de instancias: 4 atributos numéricos 1. sepal longitud en cm 2. sepal anchura en cm 3. petal longitud en cm 4. petal anchura en cm Nº de ejemplos: 150 (50 de cada clase) Dominio muy simple Introducción a Weka: explorer 11
Archivo IRIS.ARFF @relation iris @attribute sepallength numeric @attribute sepalwidth numeric @attribute petallength numeric @attribute petalwidth numeric @attribute class {Iris-setosa,Iris-versicolor,Iris-virginica} @data 5.1,3.5,1.4,0.2,Iris-setosa 4.9,3,1.4,0.2,Iris-setosa 4.7,3.2,1.3,0.2,Iris-setosa 4.6,3.1,1.5,0.2,Iris-setosa... Introducción a Weka: explorer 12
Introducción a Weka: explorer 13
Introducción a Weka: explorer 14
Introducción a Weka: explorer 15
Introducción a Weka: explorer 16
Introducción a Weka: explorer 17
Introducción a Weka: explorer 18
Introducción a Weka: explorer 19
Introducción a Weka: explorer 20
Introducción a Weka: explorer 21
Introducción a Weka: explorer 22
Introducción a Weka: explorer 23
Introducción a Weka: explorer 24
Introducción a Weka: explorer 25
Introducción a Weka: explorer 26
Introducción a Weka: explorer 27
Introducción a Weka: explorer 28
Introducción a Weka: explorer 29
Introducción a Weka: explorer 30
Introducción a Weka: explorer 31
Introducción a Weka: explorer 32
Explorer: construcción de clasificadores WEKA denomina clasificador a cualquier modelo con capacidad de predecir un valor nominal (clase discreta, clasificación) o un valor numérico (regresión) Numerosos métodos básicos Listas decisión, árboles decisión, reglas, PMC, SVM... Meta-clasificadores Baggin, boosting, stacking... Introducción a Weka: explorer 33
Introducción a Weka: explorer 34
Introducción a Weka: explorer 35
Introducción a Weka: explorer 36
Introducción a Weka: explorer 37
Introducción a Weka: explorer 38
Introducción a Weka: explorer 39
Introducción a Weka: explorer 40
Introducción a Weka: explorer 41
Introducción a Weka: explorer 42
Introducción a Weka: explorer 43
Introducción a Weka: explorer 44
Introducción a Weka: explorer 45
Introducción a Weka: explorer 46
Introducción a Weka: explorer 47
Introducción a Weka: explorer 48
Introducción a Weka: explorer 49
Introducción a Weka: explorer 50
Introducción a Weka: explorer 51
Introducción a Weka: explorer 52
Introducción a Weka: explorer 53
Introducción a Weka: explorer 54
Introducción a Weka: explorer 55
Introducción a Weka: explorer 56
Introducción a Weka: explorer 57