KNime. KoNstanz Information MinEr. KNime - Introducción. KNime - Introducción. Partes de la Herramienta. Editor Window. Repositorio de Nodos



Documentos relacionados
Sistema de Gestión Portuaria Sistema de Gestión Portuaria Uso General del Sistema

Manual de NetBeans y XAMPP

Nota: Se puede tener un acceso directo definido o podemos entrar a través de la

12 Minería de Datos Reglas de asociación.

Pontificia Universidad Católica de Chile Escuela de Ingeniería Departamento de Ciencia de la Computación. IIC1102 Introducción a la Programación

WINDOWS. Iniciando Windows. El mouse

GUIA DE USO DEL ACCPRO

MANUAL SISTEMA ENCRIPTACIÓN DE HECHOS RESERVADOS

Manual de INTRANET. Introducción Objetivo de este Manual Convenciones y estándares a utilizar Convenciones de formato de texto...

Manual de usuario Versión: 1.3 Edición: 05/02/2015 1

1.- GENERAL. 2.- INGRESO AL SISTEMA.

INDICE. 1. Introducción El panel Entities view El panel grafico Barra de botones Botones de Behavior...

Acronis License Server. Guía del usuario

Ministerio de Educación. Base de datos en la Enseñanza. Open Office. Módulo 5: Report Builder

TEMA 4: EMPEZANDO A NAVEGAR ESCUELA UNIVERSITARIA DE INFORMÁTICA. Raúl Martín Martín

GESTIÓN DOCUMENTAL PARA EL SISTEMA DE CALIDAD

Fundamentos CAPÍTULO 1. Contenido

MANUAL DE USUARIO CMS- PLONE

UNIVERSIDAD TECNICA DEL NORTE

Registro y consulta de clientes según la ley para la prevención de lavado de dinero en Neodata ERP.

Manual del Sistema Extranet de Proveedores. Extranet de Proveedores. Versión 3.0. Manual de Usuario

F O R M U L A R I O S FORMULARIOS

GUÍA BÁSICA USUARIO MOODLE 2.6

Novedades en Q-flow 3.02

MEJORAR EL RENDIMIENTO DEL EXPLORADOR DE INTERNET

La pestaña Inicio contiene las operaciones más comunes sobre copiar, cortar y pegar, además de las operaciones de Fuente, Párrafo, Estilo y Edición.

INSTALACIÓN DE MÚLTIPLES SUPERVISOR VS EN RED

MANUAL PAGINA WEB ALASCORPCA MANUAL PARA EL USO DE LA PAGINA WEB ALASCORP.

Organizándose con Microsoft Outlook

REGISTRAR LOS SITIOS WEB MÁS INTERESANTES

CONSIDERACIONES GENERALES DEL FUNCIONAMIENTO DEL PROGRAMA


Creación un instalador con Visual Studio.NET. Irene Sobrón. Ingeniero de Telecomunicaciones por la Escuela Técnica Superior de Bilbao

Comisión Nacional de Bancos y Seguros

GENERACIÓN DE TRANSFERENCIAS

MANUAL DE USO FILEZILLA

TUTORIAL ACADÉMICO. Programación II- Taller de Programación I Fa.CENA. UNNE

Microsoft Access proporciona dos métodos para crear una Base de datos.

Manual de Usuario De Respaldo y Restauración de Información

Capacitación Rational Funcional Tester

UNIVERSIDAD DE MEDELLÍN NUEVO PORTAL WEB MANUAL DE USUARIO GESTOR DE CONTENIDOS

Apéndice 5 Manual de usuario de ColeXión. ColeXión 1.0. Manual de usuario

Base de datos II Facultad de Ingeniería. Escuela de computación.

MANUAL PARA LA ACTUALIZACIÓN Y CREACIÓN DE DEPENDENCIAS EN EL SISTEMA CREG ENTREGA-RECEPCIÓN

Manual del visor GeoEuskadi 2013 MANUAL DEL VISOR GEOEUSKADI

CONECTANDO EL SOFTWARE EN REDES

Sistema Inteligente de Exploración

Manual de configuración de Adobe Reader para la validación de la firma de un documento.

Tobii Communicator 4. Introducción

GVisualPDA Módulo de Almacén

Guía para Desplegar la Aplicación en Entorno de Producción

Versión 1.0. BOLETÍN (JUNIO 2009) a2móvil PC. a2 softway C. A.

2_trabajar con calc I

MANUAL DE USUARIO. SISTEMA DE INVENTARIO DE OPERACIONES ESTADÍSTICAS.

Manual Consultas Web - PC Sistel Ver 486R4+ - USUARIO JEFATURA

En términos generales, un foro es un espacio de debate donde pueden expresarse ideas o comentarios sobre uno o varios temas.

Tabla de contenido. Avenida El Dorado Nº Bogotá Colombia T T

Para ingresar a la aplicación Microsoft PowerPoint 97, los pasos que se deben seguir pueden ser los siguientes:

3. CONSIDERACIONES GENERALES

MANUAL DE INSTALACIÓN DEL COMPONENTE WEBSIGNER JAVA. Versión 4.0

GUIA COMPLEMENTARIA PARA EL USUARIO DE AUTOAUDIT. Versión N 02 Fecha: 2011-Febrero Apartado: Archivos Anexos ARCHIVOS ANEXOS

Manual de usuario del Centro de Control

Manual de software. Dynamic Cloud. 10/2014 MS-Dynamic_Cloud v1.2

(PHP y APACHE), y el programa de comunicación Skype, para controlar de manera

Instalación y uso de Check 2000 Client Server con ZENworks 2

LA INFORMÁTICA EN EL AULA

Manejo de versiones 392

Manual Impress Impress Impress Impress Impress Draw Impress Impress

2.3 El Mundo de Tarski.

10. El entorno de publicación web (Publiweb)

Tutorial: Primeros Pasos con Subversion

COMBINAR CORRESPONDENCIA EN MICROSOFT WORD

LiLa Portal Guía para profesores

ESCUELA SUPERIOR DE INFORMATICA Prácticas de Estadística UNA SESIÓN EN SPSS

GENERACIÓN DE ANTICIPOS DE CRÉDITO

MANUAL DE USO DE CORREO ELECTRÓNICO, CALENDARIO Y CONTACTOS

la red de Internet PRODIGY para poder tener acceso al sistema RAGNVALD vía Internet

GUIA DE INSTALACIÓN DEL FORMULARIO DIGITAL PARA EL FORTALECIMIENTO DE CENTROS DE INVESTIGACIÓN Y DESARROLLO TECNOLÓGICO

CONVERSOR LIBROS DE REGISTRO (IVA IGIC) Agencia Tributaria DEPARTAMENTO DE INFORMÁTICA TRIBUTARIA

MANUAL TARIFICADOR A continuación encontrara un Paso a Paso de la instalación del tarificador.

Uso de Visual C++ Pre-Practica No. 3

Internet Information Server

UNIDAD DIDÁCTICA Nº 7 USO DE LOS RECURSOS EN MOODLE

Gestión de ficheros. Manual de generación de ficheros de pagos y cobros

Presentaciones. Con el estudio de esta Unidad pretendemos alcanzar los siguientes objetivos:

Actividades con GeoGebra

MANUAL DE LA APLICACIÓN DE ENVÍO DE SMS

Trabajo final de Ingeniería

DISEÑADOR DE ESCALERAS

MANUAL DE HOJA DE CALCULO

SISTEMA ETAP en línea Estándares Tecnológicos para la Administración Pública

6.1. Conoce la papelera

Soporte y mantenimiento de base de datos y aplicativos

Manual del Usuario. Sistema de Help Desk

CREACIÓN O MIGRACIÓN DEL CORREO POP A IMAP PARA MOZILLA THUNDERBIRD

CONCEPTOS BASICOS. Febrero 2003 Página - 1/10

Análisis y diseño del sistema CAPÍTULO 3

Capítulo 9. Archivos de sintaxis

Manual De Intranet Docentes (versión 1.0)

AGREGAR COMPONENTES ADICIONALES DE WINDOWS

Transcripción:

KNime - Introducción KNime Significa KoNstanz Information MinEr. Se pronuncia [naim]. Fue desarrollado en la Universidad de Konstanz (Alemania). Esta escrito en Java y su entorno grafico esta desarrollado en Eclipse. KoNstanz Information MinEr El proceso de análisis de datos, utilizado por KNime, consiste de un pipeline de nodos, conectados a través de puentes que transportan datos o modelos. Cada nodo procesa la llegada de datos y/o modelo(s) y produce resultados como salida. Es posible explorar los datos en forma visual, a través de vistas. KNime - Introducción Partes de la Herramienta Licencia: KNime es un proyecto open source, y esta liberado bajo la licencia Aladdin Free Public License. La licencia es para usuarios no profesionales, para uso comercial son necesarios otros requisitos. Requerimientos: Sistema operativo Linux o Windows con Java 1.5 JRE instalado (o alguna versión posterior). Workflow Proyect Navigator Descripción de nodos Instalación: Descomprimir el archivo knime_win32_1.2.1 que esta en el directorio compartido \\192.168.5.4\Temp. Problemas: Comunicarlos a contact@knime.org incluyendo el stack trace de las acciones que estábamos realizando. Repositorio de nodos Editor Window Consola Editor Window Es la ventana en la cual se construyen los flujos de análisis de datos. Repositorio de Nodos Se encuentran todos los nodos que pueden agregarse a un flujo (están agrupados por categorías). Categoría IO Manipulación de datos Vistas de datos Mining Weka File Reader, Table Reader, CSV Writter, Table Writter. Column, Row, Matrix. Scatter Plot, Interactive Table, Box Plot, Histogram, Line Plot. Clustering, Decision Tree, Association Rules. Bayes, Trees, Rules. Nodos USO: Drag & Drop sobre el Editor Window. 1

Consola Descripción de nodos Muestra los mensajes de warning y error. Provee información sobre cualquier nodo seleccionado. Esta vacía si no seleccionamos ningún nodo en el flujo. Esos mensajes también se almacenan en un archivo, llamado knime.log (stack trace), ubicado en la carpeta.metadata del proyecto. Si seleccionamos una categoría (que incluye varios nodos), entonces muestra los nodos que forman parte de esa categoría. Workflow Proyects Navigator Muestra todo los proyectos existente en el workspace (espacio de trabajo, que se encuentra en el directorio donde descomprimimos el KNime). La herramienta permite crear nuevos proyectos, importar proyectos existentes o exportar nuestro proyecto, entre otras actividades. Crear un proyecto Clickeamos sobre el Workflow Proyect Navigator, elegimos la opción New KNIME workflow y después le ponemos un nombre al proyecto. Construir un flujo de datos. 2

Nodos Los nodos son básicamente unidades de procesamiento de un workflow Puerto de Entrada Transporta datos Puerto de Salida Puerto de Modelo Transporta modelos Nombre Cambiamos el nombre haciendo click sobre él Estados NO listo para ejecución Configurado y listo para ejecutar Ejecutado Flujo de datos Se construye un flujo arrastrando y soltando (drag & drop) los nodos desde el repositorio de nodos al Editor Window y conectándolos entre ellos. Los datos se transportan entre los nodos a través de los puertos de entrada y salida. Después de colocar los nodos en el Editor Window, es necesario conectar la entrada de cada nodo con la salida del nodo predecesor. NO se permiten loops. Nodo ColorManager Este nodo se utiliza para colorear los resultados, generados a partir de los datos de entrada. Los colores elegidos en el ColorManager afectan a muchas vistas y ayudan a diferenciar los datos. Ejemplo - Nodos Se van a leer los datos de un archivo ASCII, se van a obtener cluster de esos datos y mostrar los resultados en una tabla y un Scatter Plot. NODOS Si se inserta este nodo en el flujo, entonces los datos de entrada se codifican según un color específico, determinado por el ColorManager. IO Read Mining Clustering Data Views Property BUSCADOR Data Views CONECTAR LOS NODOS Es necesario conectar los nodos según el orden que debe seguir el flujo. 3

Configuración de Nodos Una vez que el flujo esta totalmente conectado, si existen nodos que tienen su estado en color rojo, entonces deben ser configurados. Si algún nodo presenta un color amarillo, después de que fueron conectados, significa que la configuración del mismo se realizó utilizando los valores por defecto. Ejemplo - Configuración Ejemplo - Configuración NODO File Reader NODO K-Means Se configura automáticamente (una vez que se configura el File Reader). Su estado se encuentra en el color amarillo (esto significa que las propiedades por defecto del nodo fueron aplicadas, y el mismo esta listo para ejecutarse). Datos de Entrada Directorio IrisDataset Número de Clusters Iteraciones Propiedades Vista Preliminar Ejemplo - Configuración Ejemplo - Configuración NODO ColorManager Es necesario configurar previamente el nodo K-Means, para determinar los valores a colorear. Columna que contiene el atributo que queremos colorear (por defecto el cluster) NODO Interactive Table y Scatter Plot Estos nodos no necesitan ser configurados, con lo cual pueden ejecutarse directamente. Columna con valores nominales (Cluster) Columna con valores con rango (Sepal Lenght) El nodo Interactive Table es uno nodo puro de vista (muestra los datos de entrada en una tabla), con lo cual no permite configuración. Colores para asignar a los datos Las propiedades del nodo Scatter Plot se setean por defecto. 4

Ejecución de flujo Cuando todos los nodos del flujo poseen un color amarillo, entonces el mismo puede ser ejecutado. Los nodos se ejecutan de izquierda a derecha, es decir, que un nodo solo puede ejecutarse si todos sus nodos predecesores en el flujo han terminado su ejecución. Formas de ejecución: Por nodo (eligiendo la opción Execute). Ejecutar el ultimo nodo del flujo (KNime ejecuta todos los nodos predecesores). Seleccionar varios nodos y disparar la ejecución (KNime determina el orden y ejecuta nodos en paralelo, si es posible). Ejecución de flujo Barra de progreso durante la ejecución de un nodo. Ejemplo - Ejecución Ejecutamos el nodo Scatter Plot, haciendo click con el botón derecho sobre él y eligiendo la opción Execute. Errores en la ejecución de un nodo. Todos los demás nodos del flujo se ejecutan automáticamente. El nodo Interactive Table, se ejecuta en paralelo con el Scatter Plot. Resultados Algunos nodos proveen vistas que muestran sus resultados computacionales. Estas vistas se observan haciendo click con el botón derecho sobre el nodo y eligiendo la opción View. Se pueden abrir varias instancias de una vista (de un nodo), lo cual permite tener diferentes vistas de los mismos datos. Algunas vistas, solo se muestran si el nodo fue ejecutado. 5

Table View Renders para las columnas Table View Muestra los datos en filas. Cada fila se marca con el color seleccionado para ese conjunto en el ColorManager. Scatter Plot View Scatter Plot View Operaciones sobre el gráfico Cada uno de los puntos corresponde a un valor de los datos de entrada, y su color indica el cluster al cual pertenece (si en el ColorManager coloreamos los clusters). Zooming Scatter Plot View Selección de columnas Cluster View Muestra los cluster construidos por el algoritmo para los datos de entrada y los centroides correspondientes. 6

HiLiting Si se seleccionan datos en una vista y se aplica un hilite sobre ellos, entonces se puede ver ese mismo efecto de hilite sobre los datos en todas las demás vistas disponibles del workflow que soporten esta función. Los datos seleccionados y que recibieron el hilite se resaltan con un color naranja en todas las vistas mostrando los mismos datos. Ejemplo - HiLiting Ejemplo - HiLiting Práctica: encontrar el mínimo y máximo valor de cada cluster. Comprobar la media. Cluster 2 X: Sepal Lenght Cluster 1 X: Sepal Lenght Deshacer el Hilited Ejemplo 2: Nodos de Salida Los resultados no se muestran, sino que se guardan en nodos de salida. Ejemplo 3: Manipulación de Datos Podemos realizar operaciones sobre los datos. Se encuentran en la categoría Data Manipulation. Nodo Sorter. Categoría Row. Configuración Nombre para el archivo donde guardamos los datos 7

Ejemplo 4: Vista de Datos Nodos Histogram y Parallel Coordinates Ejemplo 4: Vista de Datos Vista Nodo Parallel Coordinates Vista Nodo Histogram Columnas graficadas Extensiones JFreeChart Para visualización. NODOS: Bar Chart, Histogram Chart, Pie Chart, XY Chart. Extensiones - JFreeChart Nodos Pie Chart Bar Chart WEKA Para Data Mining. NODOS: Bayes, Trees, Rules. INSTALACION Descomprimir los rar que están en el directorio Extensiones_Plugings, en el directorio donde tenemos el KNime. Extensiones - WEKA WEKA J48 VISTA DE ARBOL CREAMOS EL MODELO UTILIZAMOS EL MODELO EVALUAMOS EL MODELO 8

WEKA J48 WEKA J48 WEKA TREE CODIGO DEL ALGORITMO Para acomodar el árbol a la pantalla WEKA Scorer (Evaluación) Clasificaciones correctas Clasificaciones incorrectas 9