Weka: Waitako Environment for Knowledge Analysis

Documentos relacionados
Minería de datos: Modelos de Predicción, Modelos de Descripción, y usos en IN

Práctica 5: Clasificación con número variable de ejemplos.

1.-DATOS DE LA ASIGNATURA

Práctica 3: Almacenamiento de modelos con WEKA.

M1. FUNDAMENTOS DE MINERÍA DE DATOS

TRABAJO PRÁCTICO III: Minería de datos. PARTE 01: Arboles de decisión (J48)

Técnicas de Preprocesado

Trabajo final de Ingeniería

Selección de atributos

Procesamiento del Habla

Posibles trabajos HIA

Aprendizaje Supervisado Máquinas Vectoriales de Soporte

Alternativa de herramienta libre para la implementación de aprendizaje automático.

Introducción a selección de. Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012

Tutorial Weka Ricardo Aler 2009

Predicción meteorológica

ANÁLISIS DE DATOS DE LOS ENTORNOS VIRTUALES DE APRENDIZAJE, USANDO TÉCNICAS DE MINERÍA DE DATOS.

Weka como herramienta de data mining

MINERÍA DE DATOS: PREPROCESAMIENTO Y CLASIFICACIÓN

Técnicas de aprendizaje sobre series temporales

Tópicos Selectos en Aprendizaje Maquinal. Algoritmos para Reconocimiento de Patrones

Introducción al Procesamiento de Lenguaje Natural. Grupo de PLN - InCo

Aprendizaje Automatizado. Árboles de Clasificación

Interfaces de programación de aplicaciones para minería de datos. PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR

DIAGNÓSTICO DEL ESTILO DE APRENDIZAJE PREDOMINANTE BASADO EN MINERÍA DE DATOS Y EL MODELO DE FELDER: APLICACIONES AL ELEARNIG 3.0

Estadística Multivariada Computacional Introducción al Aprendizaje Automático (parte 1)

José Hernández Orallo Mª. José Ramírez Quintana

APLICACIÓN DE TÉCNICAS DE INDUCCIÓN DE ÁRBOLES DE DECISIÓN A PROBLEMAS DE CLASIFICACIÓN MEDIANTE EL USO DE WEKA (WAIKATO ENVIRONMENT FOR KNOWLEDGE

Práctica 1: Entorno WEKA de aprendizaje automático y data mining.

Máster Universitario en Modelización e Investigación Matemática, Estadística y Computación

PROGRAMA DE CURSO. Personal Electivo para ICC FI2002 Electromagnetismo. Competencia a la que Tributa el Curso. Propósito del Curso

OPTATIVA I: MINERIA DE DATOS

Análisis Exploratorio de Datos

Aprendizaje Automático



Jesús García Herrero METODOLOGÍA DE ANÁLISIS DE DATOS

Fundamentos de programación JAVA

FILTRADO DE CONTENIDOS WEB EN ESPAÑOL DENTRO DEL PROYECTO POESIA

Clasificación y regresión logística

MÓDULO MATERIA CURSO SEMESTRE CRÉDITOS TIPO

Aprendizaje Automático (Machine Learning)

Manual de Instalación

Aprendizaje Supervisado K - Vecinos más cercanos Knn-Method

Aprendizaje Supervisado Árboles de Decisión

Otros aspectos. Procesado de la entrada Procesado de la salida. Carlos J. Alonso González Departamento de Informática Universidad de Valladolid

Características. Interfaz Gráfica. Agenda. Agenda

SVM: Máquinas de Vectores Soporte. Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid

TÓPICOS AVANZADOS DE BASES DE DATOS

Automatización de la Evaluación del Impacto Social en Proyectos de Inversión Publica

Inducción de Árboles de Decisión ID3, C4.5

Proyecto 6. Árboles de decisión: Un árbol de decisión es un modelo de predicción utilizado en el ámbito de la inteligencia artificial.

Métodos Predictivos en Minería de Datos

MINERÍA DE DATOS EN LA ENCUESTA PERMANENTE DE HOGARES 2009, UNIVERSIDAD NACIONAL DEL LITORAL, ARGENTINA.

A3. Ciencia de datos y aprendizaje automático

Introducción. Requisitos para el inicio. Derechos de acceso. Elaboración de informes. Information Server Instrucciones de uso.

Práctica 2: Utilización de WEKA desde la línea de comandos.

IAAE - Inteligencia Artificial Aplicada a la Ingeniería

Aprendizaje Computacional. Eduardo Morales y Jesús González

Guía docente de la asignatura

Análisis inteligente de datos aplicado al proceso de nivelación en la Universidad Técnica Estatal de Quevedo

Tutorial de Minería de Datos. Dr. Ricardo Blanco Vega

Evaluación de Rankings de Atributos para Clasificación

WEKA TUTORIAL 1. Weka Tutorial en Clasificación de Documentos. Valeria Guevara. Thompson Rivers University

Estudio del problema del matrimonio estable en un entorno multiagente

Requisitos mínimos de configuración de equipos

Aprendizaje Supervisado Clasificación Bayesiana (Método de Naïve Bayes)

Estadística Descriptiva. Poblaciones y muestras.

Inteligencia Artificial Técnicas de clasificación

GUÍA DOCENTE. Ingeniería Informática en Sistemas de Información. Ingeniería del Software, Sistemas de Información y Sistemas Inteligentes

Análisis de Datos. Práctica de métodos predicción de en WEKA

Métodos basados en instancias. K-vecinos, variantes

Aprendizaje Automatizado

GUÍA DOCENTE. Curso Ingeniería Informática en Sistemas de Información Doble Grado:

1. Instalación de ADOBE Flash CS5

Práctica 1. Entorno de Trabajo e Introducción a Java. Fundamentos de Programación Departamento de Lenguajes y Sistemas Informáticos. Versión 1.0.

Diplomado C#.NET con Visual Studio

Text Mining. Laura Alonso i Alemany. Facultad de Matemática, Astronomía y Física UNC, Córdoba (Argentina)

Tutorial. VISUALIZACIÓN DE DETECCIONES TERRA-i

Fundamentos de Informática E.U.P. Universidad de Sevilla

Text Mining. Laura Alonso i Alemany. Facultad de Matemática, Astronomía y Física UNC, Córdoba (Argentina)

Sistema de Predicción de la Demanda de Papel Fotográfico para Ecuacolor. Egresada de Licenciada en Sistemas de Información


NEWTON TREES. Árboles de Estimación Estocástica de Probabilidades:

Aprendizaje Supervisado Análisis Discriminante (Lineal y Cuadrático)

Reglas de Asociación en Weka

Métodos de combinación de clasicadores sobre Máquinas de Vectores Soporte *

DEM GDEF DECLARACIÓN INFORMATIVA DE LAS ENTIDADES FEDERATIVAS POR LA RECAUDACIÓN DE IEPS POR VENTA FINAL DE GASOLINAS Y DIESEL

Carrera: Ingeniería en Sistemas Computacionales PRESENTACIÓN

5. Minería de datos. Minería de datos. Aprendizaje UPM UPM. c 2010 DIT-ETSIT-UPM Minería de datos transp. 1

Manual de instalación AutoFirma 1.4.2

Introducción a la Programación de Videojuegos y Gráficos

MALTED: MANUAL DE INSTALACIÓN EN LINUX

Estimación del estado del flujo de tráfico mediante preprocesado y minería de datos. Aplicación de Dataset de posiciones GPS de taxis de Porto

A3. Ciencia de datos y aprendizaje automático

lidar forestal métodos de masa 55 horas


APLICACIÓN DE TÉCNICAS DE CLASIFICACIÓN BASADAS EN UN SISTEMA DE APRENDIZAJE PARA LA GENERACIÓN DE UN MAPA DE USOS DE SUELO

IAAE - Inteligencia Artificial Aplicada a la Ingeniería

Previo al uso del sistema SAT, se deben verificar las máquinas de los usuarios, y realizar los siguientes pasos:

Transcripción:

Weka: Waitako Environment for Knowledge Analysis Introducción Explorer Carlos J. Alonso González Departamento de Informática Universidad de Valladolid

Contenidos Fuentes Introducción The Explorer Introducción a Weka: explorer 2

Fuentes El contenido de esta presentación se basa en el capítulo 10 de I. Witten, E. Frank. Data Minig: Practical Machine Learning tools and Techniques, Second Edition. Morgan Kaufmman, Elsevier. San Francisco, CA, 2005. ISBN: 0 12 088407 Sitio weka: http://www.cs.waikato.ac.nz/ml/weka/ Presentación weka.ppt (descripción de todas las interfaces gráficas de weka, por E. Franck) Varios tutoriales, en el sitio weka Tutorial.pdf (parte II de la obra citada) Introducción de Alex K. Seewald Manual en español: http://metaemotion.com/diego.garcia.morate/download/weka.pdf Introducción a Weka: explorer 3

Introducción Software para el aprendizaje automático/minería de datos escrito en JAVA con licencia GNU Principalmente investigación, educación Complementa DATA MINIG, de Witten y Frank Características principales Sistema integrado de herramientas de preprocesado de datos, algoritmos de aprendizaje y métodos de evaluación de algoritmos Interfaces gráficas Entorno para la comparación de herramientas de aprendizaje Introducción a Weka: explorer 4

Ejecución Instalada máquina virtual java Instalado weka java jar weka.jar Aparece la ventana selector de interfaces Introducción a Weka: explorer 5

Selector de interfaces Introducción a Weka: explorer 6

Introducción a Weka: explorer 7

Explorer: formato de datos ARFF @relation heart-disease-simplified @attribute age numeric @attribute sex { female, male} @attribute chest_pain_type { typ_angina, asympt, non_anginal, atyp_angina} @attribute cholesterol numeric @attribute exercise_induced_angina { no, yes} @attribute class { present, not_present} @data 63,male,typ_angina,233,no,not_present 67,male,asympt,286,yes,present 67,male,asympt,229,yes,present 38,female,non_anginal,?,no,not_present... Introducción a Weka: explorer 8

Explorer: formato de datos ARFF @relation heart-disease-simplified CABECERA @attribute age numeric DECLARACIóN DE ATRIBUTOS @attribute sex { female, male} @attribute chest_pain_type { typ_angina, asympt, non_anginal, atyp_angina} @attribute cholesterol numeric @attribute exercise_induced_angina { no, yes} @attribute class { present, not_present} @data SECCIÓN DE DATOS 63,male,typ_angina,233,no,not_present 67,male,asympt,286,yes,present 67,male,asympt,229,yes,present 38,female,non_anginal,?,no,not_present... Introducción a Weka: explorer 9

Explorer: preprocesado Se pueden importar datos en varios formatos: ARFF, CSV, binarios... Herramientas de preprocesado: filters Filtros para: discretización, normalización, selección de atributos, resampling,... Introducción a Weka: explorer 10

Datos: IRIS Problema: determinar la clase de planta Iris: setosa, versicoulor, virginica Descripción de instancias: 4 atributos numéricos 1. sepal longitud en cm 2. sepal anchura en cm 3. petal longitud en cm 4. petal anchura en cm Nº de ejemplos: 150 (50 de cada clase) Dominio muy simple Introducción a Weka: explorer 11

Archivo IRIS.ARFF @relation iris @attribute sepallength numeric @attribute sepalwidth numeric @attribute petallength numeric @attribute petalwidth numeric @attribute class {Iris-setosa,Iris-versicolor,Iris-virginica} @data 5.1,3.5,1.4,0.2,Iris-setosa 4.9,3,1.4,0.2,Iris-setosa 4.7,3.2,1.3,0.2,Iris-setosa 4.6,3.1,1.5,0.2,Iris-setosa... Introducción a Weka: explorer 12

Introducción a Weka: explorer 13

Introducción a Weka: explorer 14

Introducción a Weka: explorer 15

Introducción a Weka: explorer 16

Introducción a Weka: explorer 17

Introducción a Weka: explorer 18

Introducción a Weka: explorer 19

Introducción a Weka: explorer 20

Introducción a Weka: explorer 21

Introducción a Weka: explorer 22

Introducción a Weka: explorer 23

Introducción a Weka: explorer 24

Introducción a Weka: explorer 25

Introducción a Weka: explorer 26

Introducción a Weka: explorer 27

Introducción a Weka: explorer 28

Introducción a Weka: explorer 29

Introducción a Weka: explorer 30

Introducción a Weka: explorer 31

Introducción a Weka: explorer 32

Explorer: construcción de clasificadores WEKA denomina clasificador a cualquier modelo con capacidad de predecir un valor nominal (clase discreta, clasificación) o un valor numérico (regresión) Numerosos métodos básicos Listas decisión, árboles decisión, reglas, PMC, SVM... Meta-clasificadores Baggin, boosting, stacking... Introducción a Weka: explorer 33

Introducción a Weka: explorer 34

Introducción a Weka: explorer 35

Introducción a Weka: explorer 36

Introducción a Weka: explorer 37

Introducción a Weka: explorer 38

Introducción a Weka: explorer 39

Introducción a Weka: explorer 40

Introducción a Weka: explorer 41

Introducción a Weka: explorer 42

Introducción a Weka: explorer 43

Introducción a Weka: explorer 44

Introducción a Weka: explorer 45

Introducción a Weka: explorer 46

Introducción a Weka: explorer 47

Introducción a Weka: explorer 48

Introducción a Weka: explorer 49

Introducción a Weka: explorer 50

Introducción a Weka: explorer 51

Introducción a Weka: explorer 52

Introducción a Weka: explorer 53

Introducción a Weka: explorer 54

Introducción a Weka: explorer 55

Introducción a Weka: explorer 56

Introducción a Weka: explorer 57