CURSOS DE VERANO 2014

Documentos relacionados
KNime. KoNstanz Information MinEr. KNime - Introducción. KNime - Introducción. Partes de la Herramienta. Editor Window. Repositorio de Nodos

Sistemas Inteligentes de Gestión. Guión de Prácticas de Minería de Datos. Práctica 4. Clasificación y regresión

Minería de Datos. Presentación de la asignatura. Fac. Ciencias Ing. Informática Otoño de Dept. Matesco, Universidad de Cantabria

GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC)

MINERÍA DE DATOS: PREPROCESAMIENTO Y CLASIFICACIÓN

Métodos Predictivos en Minería de Datos

Big Data & Machine Learning. MSc. Ing. Máximo Gurméndez Universidad de Montevideo

Sumario Prólogo Unidad didáctica 1. Introducción a business intelligence Objetivos de la Unidad... 12

Índice. Resumen 15 Motivación 15 Desarrollos y aportes 16 Publicaciones derivadas de esta tesis doctoral 19

MÓDULO MATERIA CURSO SEMESTRE CRÉDITOS TIPO

Supervisor v4.6. Apéndice 1. Herramientas automatizadas de gestión remota

Configuración de MySQL con NetBeans

Estructuras en LabVIEW.

Sistemas Inteligentes de Gestión. Guión de Prácticas de Minería de Datos. Práctica 3. Métodos de agrupamiento [Clustering]

Prontuario. I. Titulo del curso: Minería de Datos. II. Codificación: ESTA Horas / Crédito: 3 horas semanales / 3 Créditos

Benemérita Universidad Autónoma de Puebla Vicerrectoría de Docencia Dirección General de Educación Superior Facultad de Ciencias de la Computación

Aprendizaje Automatizado

Técnicas de Minería de Datos

Módulo Trazabilidad. Funcionalidades. elastic BUSINESS V.15.0

ANÁLISIS DE DATOS DE LOS ENTORNOS VIRTUALES DE APRENDIZAJE, USANDO TÉCNICAS DE MINERÍA DE DATOS.

Visión global del KDD

Escuela Técnica Superior de Ingeniería Informática

Departamento de Soporte Occidente. Módulo Misceláneos. Cambiar usuarios:

Aprendizaje Automático

Sistemas Inteligentes de Gestión. Guión de Prácticas de Minería de Datos. Práctica 1. Herramientas de Minería de Datos. Introducción a KNIME

MÉTODOS DE GENERACIÓN DE MALLA

PEntaho Data Integration (PDI, también conocido como

Comenzando con K2BWebPanelDesigner

Para ello abra desde Windows Configuración Regional del menú de INICIO- Configuración. Aparece la siguiente pantalla

Adquisición y proceso de múltiples datos para la gestión minera

VARIABLES LOCALES Y VARIABLES GLOBALES

Sistemas de predicción Aprendizaje automático Data Mining & Machine Learning

ING. JONATHAN QUIROGA TINOCO. Desarrollado por Ing. Jonathan Quiroga T.

Manual de uso UN PRODUCTO

Wenceslao González Manteiga.

La importancia de Big Data en finanzas

Desarrollo de aplicaciones de acceso a base de datos con JBuilder 7

Módulo Almacén. Funcionalidades. elastic BUSINESS V.12.0

CX-Integrator permite crear tablas de data link Offline para transferirlas posteriormente.

FACULTAD DE INGENIERÍA

1.2 Para qué me sirve FTP FTP y Planes de Hospedaje FTP y CentovaCast (AutoDj) FTP y Dreamweaver Descarga de FileZilla 10

Técnicas de análisis estadístico basado en inteligencia artificial

Instalación de Centos

PROYECTO FINAL GUÍA 1 ERDAS

CONECTOR EDI INTERCAMBIO ELECTRÓNICO DE DATOS ASINTEC

Información estadística de alumnos de carreras de pregrado, grado y Posgrado de las universidades públicas y privadas argentinas.

PRÁCTICA 1. INTRODUCCION A STATGRAPHICS. ESTADISTICA DESCRIPTIVA

CLASIFICACION DE PATRONES. M. Cabrera, J. Vidal Dept. TSC ETSETB UPC Febrero-Mayo 2007

Departamento Administrativo Departamental de Estadística. Dirección de Regulación, Planeación, Estandarización y Normalización -DIRPEN-

Aprendizaje Computacional. Eduardo Morales y Jesús González

MANUAL DE USUARIO NOTAS PARCIALES MODULO CONFIGUARACION DE NOTAS -288

Manual del Integrador Contable Premium Soft

Aprendizaje Automatizado. Árboles de Clasificación

ÍNDICE. Introducción... Capítulo 1. Inteligencia de negocios y sistemas de información. Informes... 1

CONFIGURACIÓN DEL ENLACE DE INTOUCH DESDE UN PC CON WINDOWS XP CON PROFIBÚS MEDIANTE LA TARJETA CP5613.

Tutorial 3. Conexión a Bases de Datos con NetBeans 5.0

Planificador de Linux (Scheduler)

Métodos Exploratorios en Minería de Datos

Máster universitario en automatización de procesos industriales

Introducción. Requisitos para el inicio. Derechos de acceso. Elaboración de informes. Information Server Instrucciones de uso.

img.1 Comenzar a crear nuestro player

Trabajando con documentos

Introducción a la Minería de Datos

$0 Representa al parámetro cero o nombre del programa $1 Representa al parámetro uno $2 Representa al parámetro dos

Aprovechamiento pedagógico de Ardora

DESPLAZAMIENTO POR LA HOJA DE CÁLCULO

1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2.

Reglas de Asociación en Weka

Andres Felipe Rojas / Nancy Gelvez. UNESCO UNIR ICT & Education Latam Congress 2016

Modelos Comprimidos. Modelo de Bloque 3D Standard

Introducción Definición Procesos Técnicas y Algoritmos Principales Usos Software Metodología CRISP - DM Conclusión

GUÍA DOCENTE DE LA ASIGNATURA

Aprendizaje: Boosting y Adaboost

MODELOS PREDICTIVOS DEL CHURN ABANDONO DE CLIENTES PARA OPERADORES DE TELECOMUNICACIONES

Repetidores o Hubs. Puentes

FACULTAD DE INGENIERÍA

Guía de uso del programa AVR-Studio

Ingeniería del conocimiento. Sesión 1 Por qué estudiar aprendizaje automático?

1. GUI: INTERFAZ DE USUARIO GRAFICA

Web GIS y Big Data en los análisis de tendencias y comportamientos

Laboratorio 01: Generación del Hola Mundo Android

Random Forests. Felipe Parra

Administración de dispositivos móviles

Desarrollo de DataMarts y Cubos de Información Business Intelligence con SQL. web

Secretaría de Docencia Dirección de Estudios Profesionales

Arancha Pintado. Perfiles Big Data.

Minería de Datos. Índice. Raquel M. Crespo García. Julio Villena Román. Definición y conceptos Técnicas y modelos

ACTUALIZACIÓN MANUAL SOFTWARE RES NUEVA EPS S.A. PROCEX SOFTWARE

Conceptos básicos útiles. PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR

Tutoriales y Guías de uso con Orientaciones Pedagógicas Entorno Virtual de Aprendizaje Plataforma Blackboard WIKIS

Tutorial de Flex: Creación de una aplicación simple con Flex 2.0

ÁREA GERENCIAL. Cuadros de Mando

INFORME TAREA N 4 CLUSTERING

CAPÍTULO 1. MI PRIMERA APLICACIÓN...

Introducción a SPSS Árboles de Clasificación. Jorge Del Río L. Consultor Estadístico

Base de datos II Facultad de Ingeniería. Escuela de computación.

CURSOS DE VERANO 2014

CONTENIDO. Business Objects

Control y manejo cámara IP. Aplicación cliente. (IPCMonitor) Feb, 2013 Version Manual usuario.

CURSO: APACHE SPARK CAPÍTULO 3: SPARK CONCEPTOS BÁSICOS.

Transcripción:

CURSOS DE VERANO 2014 TÍTULO APROXIMACIÓN DEL CURSO PRÁCTICA A LA CIENCIA DE DATOS Y BIG DATA: HERRAMIENTAS KNIME, R, HADOOP Y TÍTULO PONENCIA MAHOUT NOMBRE PROFESOR Introducción a KNIME María José del Jesus

Epígrafe KNIME o tema Por qué aprender KNIME? El entorno de trabajo de KNIME Ejemplos

Epígrafe Por qué o aprender tema KNIME? KNIME es una herramienta Open Source Ofrece el ciclo completo de KDD Visualización de datos Pre-procesado de datos Extracción de modelos mediante algoritmos de Minería de Datos Comparación de modelos Análisis de resultados Integración con Weka y R Información sobre instalación y uso: https://www.knime.org

Epígrafe El entorno o tema de trabajo en KNIME

Epígrafe El entorno o tema de trabajo en KNIME Conceptos básicos Un proceso de análisis de datos se representa mediante un flujo de trabajo Construcción de un flujo de trabajo: arrastrar nodos del Almacén de nodos y pegar en el editor de flujo de trabajo Conectar nodos Estado de un nodo Rojo à hay que configurar antes de ejecutar Amarillo à el nodo está preparado para ejecutar Verde à el nodo se ha ejecutado Puertos (de entrada o salida) Solo se pueden conectar puertos del mismo tipo Datos (triángulo amarillo): transfieren tablas de datos entre nodos Bases de datos (cuadrado marrón) PMML: transfieren modelos ya aprendidos Otros puertos

Epígrafe El entorno o tema de trabajo en KNIME Acciones básicas: Crear un proyecto Utilizar nodos Construir un flujo de datos Nodo color manager Configuración de nodos Ejecución de flujo de datos Resultados HiLiting

Epígrafe El entorno o tema de trabajo en KNIME nodos Son unidades de procesamiento de un workflow Puerto de entrada (datos) Puerto de salida Puerto de modelo Nombre (Se puede cambiar) Estados no listo para la ejecución configurado y listo para ejecutar ejecutado

Epígrafe El entorno o tema de trabajo en KNIME Construir un flujo de datos Se construye un flujo arrastrando y soltando los nodos desde el almacén de nodos al editor de proyectos y conectándolos entre ellos Los datos se transportan entre nodos a través de los puertos Es necesario, una vez colocados los nodos en el editor, conectar la salida de cada nodo con el predecesor

Epígrafe El entorno o tema de trabajo en KNIME Construir un flujo de datos

Epígrafe El entorno o tema de trabajo en KNIME nodo Color Manager Permite colorear los resultados generados a partir de los datos de entrada El coloreo afecta a muchas vistas y ayuda a diferenciar los datos Si se inserta este nodo en el flujo de trabajo, los datos se codifican según los colores determinados por el Color Manager

Epígrafe El entorno o tema de trabajo en KNIME ejecución del flujo de datos Cuando los nodos del flujo tienen color amarillo, se puede ejecutar Los nodos se ejecutan de izquierda a derecha Un nodo puede ejecutarse cuando todos los nodos predecesores han terminado su ejecución Formas de ejecución: Por nodo (con la opción Execute) Ejecutando el último nodo del flujo (KNIME ejecuta los predecesores) Seleccionando varios nodos y disparando la ejecución (KNIME determina el orden y ejecuta nodos en paralelo, si es posible)

Epígrafe El entorno o tema de trabajo en KNIME HiLiting Si se seleccionan datos en una vista y se aplica Hilite sobre ellos, se podrá ver el efecto Hilite sobre los datos en el resto de vistas del flujo que soporten esta opción Los datos seleccionados se resaltarán en color naranja

Epígrafe El entorno o tema de trabajo en KNIME HiLiting

Epígrafe El entorno o tema de trabajo en KNIME HiLiting

Epígrafe El entorno o tema de trabajo en KNIME HiLiting

Epígrafe El entorno o tema de trabajo en KNIME HiLiting

Epígrafe El entorno o tema de trabajo en KNIME HiLiting Árbol simple

Epígrafe El entorno o tema de trabajo en KNIME HiLiting

Epígrafe El entorno o tema de trabajo en KNIME HiLiting

Epígrafe El entorno o tema de trabajo en KNIME HiLiting

Epígrafe El entorno o tema de trabajo en KNIME HiLiting

Epígrafe El entorno o tema de trabajo en KNIME HiLiting

Epígrafe El entorno o tema de trabajo en KNIME HiLiting

Epígrafe El entorno o tema de trabajo en KNIME HiLiting

Epígrafe El entorno o tema de trabajo en KNIME HiLiting

Epígrafe El entorno o tema de trabajo en KNIME HiLiting

Epígrafe El entorno o tema de trabajo en KNIME Hotkeys

Epígrafe Ejemplo: o Iris tema Carga de datos Visualización Análisis predictivo Análisis descriptivo https://archive.ics.uci.edu/ml/datasets/iris Nº ejemplos: 150 Nº variables: 4 Nº clases: 3 (50/50/50)

Epígrafe Ejemplo: o Iris tema 1. Cargar el fichero de ejemplos iris.dat 2. Obtener medidas estadísticas 3. Asignar a cada ejemplo un color en función de la clase a la que pertenece 4. Visualizar el conjunto de ejemplos en base a pares de variables Determinar el par de variables más relevantes 5. Realizar una partición con hold-out al 60% estratificada 6. Visualizar el conjunto de test en base a las dos variables seleccionadas en el paso 4

Epígrafe Ejemplo: o Iris tema 1. File Reader: IO à Read 2. Statistics: Statistics Calcula y muestra estadísticas 3. Color Manager: Data Views à Property Asigna colores a las clases 4. Scatter Matrix : Data Views à Utility Visualiza los ejemplos según pares de variables (scatter plots) 5. Partitioning: Data Manipulation à Row à Transform Hold-out 6. Scatter Plot: Data Views à Utility

Epígrafe Ejemplo 1: o tema Iris Carga de datos y visualización

Epígrafe Ejemplo 1: o tema Iris Visualizar

Epígrafe Ejemplo 1: o tema Iris Visualizar

Epígrafe Ejemplo 1: o tema Iris

Epígrafe Ejemplo: o Iris tema Para agilizar: hold-out 60% estratificado 1-NN (k Nearest Neigbor: Mining à Misc Classifiers) Visualizar resultados (Scorer: Mining à Scoring) Marcar y visualizar errores en test Scatter Plot Interactive Table: Data Views à Utility Funcionará mejor con otro valor de k? Funcionará mejor ponderando por distancias? Decision trees Random forest Naïve Bayes

Epígrafe Ejemplo 1: o tema Iris Análisis predictivo knn

Epígrafe Ejemplo 1: o tema Iris Análisis predictivo knn

Epígrafe Ejemplo 1: o tema Iris Análisis predictivo knn Normalización? Normalizer: Data Manipulation à Column à Transform

Epígrafe Ejemplo 1: o tema Iris Análisis predictivo knn

Epígrafe Ejemplo 1: o tema Iris Análisis predictivo Naïve Bayes

Epígrafe Ejemplo 1: o tema Iris Análisis predictivo Árboles de decisión

Epígrafe Ejemplo 1: o tema Iris Análisis predictivo Árboles de decisión

Epígrafe Ejemplo 1: o tema Iris Análisis predictivo Los ciclos de validación cruzada se verán en los casos de estudio

Epígrafe Ejemplo 1: o tema Iris Análisis predictivo Random Forest

Epígrafe Ejemplo 1: o tema Iris Análisis descriptivo A priori Weka

Epígrafe Ejemplo 1: o tema Iris Análisis descriptivo A priori Weka

Epígrafe Ejemplo 1: o tema Iris Análisis descriptivo k means

Epígrafe Ejemplo 1: o tema Iris Análisis descriptivo k means

Epígrafe Ejemplo 1: o tema Iris Análisis descriptivo k means

Epígrafe Ejemplo 1: o tema Iris Análisis descriptivo k means Clustering con k-means

Epígrafe Ejemplo 2: o tema Pima Carga de datos Visualización Análisis predictivo Análisis descriptivo https://archive.ics.uci.edu/ml/datasets/pima+indians+diabetes 8 variables predictoras (continuas) 768 ejemplos 2 clases (500/268) Valores perdidos?

Epígrafe Ejemplo 3: o tema Wine Carga de datos Visualización Análisis predictivo Análisis descriptivo https://archive.ics.uci.edu/ml/datasets/wine 12 variables predictoras (continuas) 178 ejemplos 3 clases (59/71/48)

Epígrafe Ejemplo 4: o tema Spam Carga de datos Visualización Preprocesamiento Análisis predictivo Análisis descriptivo https://archive.ics.uci.edu/ml/datasets/spambase 57 variables predictoras (55 continuas, 2 enteras) 4601 ejemplos 2 clases (2788/1813)

Epígrafe Bibliografía o tema The Elements of Statistical Learning: Data Mining, Inference, and Prediction, by Trevor Hastie, Robert Tibshirani and Jerome Friedman. 2009 Guide to Intelligent Data Analysis. How to Intelligently Make Sense of Real Data, by M. R. Berthold, C. Borgelt, F. Höppner, F. Klawonn. Springer 2010

Epígrafe Más información o tema KNIME pages (www.knime.org) KNIME Tech (tech.knime.org) KNIME Quickstart Guide https://tech.knime.org/files/knime_quickstart.pdf KNIME TV Channel on YouTube 100 best KNIME Videos http://meta-guide.com/videography/100-best-knimevideos

CURSOS DE VERANO 2014 TÍTULO APROXIMACIÓN DEL CURSO PRÁCTICA A LA CIENCIA DE DATOS Y BIG DATA: HERRAMIENTAS KNIME, R, HADOOP Y TÍTULO PONENCIA MAHOUT NOMBRE PROFESOR Introducción a KNIME María José del Jesus