INTELIGENCIA EN REDES DE COMUNICACIONES. MINERÍA DE DATOS-PREDICCIÓN METEOROLÓGICA-.

Documentos relacionados
Práctica 5: Clasificación con número variable de ejemplos.

Minería a de Datos. plataforma WEKA. Ismael Fernández Castellano Telmo Calle Facal

PREDICCIÓN METEOROLÓGICA

INGENIERÍA DE TELECOMUNICACIÓN INTELIGENCIA EN REDES DE ORDENADORES

INVESTIGACIÓN OPERATIVA Redes Neuronales Artificiales y Aplicaciones INTEGRANTES: Armijos Mauricio Jara Iza Rony

Práctica Final: Predicción Metereológica en Weka.

Inteligencia en Redes de Comunicaciones

Introducción a las Redes Neuronales

Técnicas de Minería de Datos

Predicción meteorológica

Caracterización del funcionamiento adecuado de equipos aplicando redes neuronales

Predicción de potencia en el parque eólico de Villonaco, Loja, Ecuador. Alberto Reyes y Tania Guerrero INER Ecuador

Simulación de Redes Neuronales Artificiales: Una Herramienta para la Docencia en Castellano

Práctica 2: Utilización de WEKA desde la línea de comandos.

TRABAJO FIN DE ASIGNATURA

DATA MINING CONCEPTOS Y EXPERIENCIA EN LA FISCALIZACIÓN DEL MERCADO DE VALORES DE CHILE

Reconocimiento automático de palabras en documentos históricos usando redes neuronales convolucionales

CRITERIOS DE SELECCIÓN DE MODELOS

PREDICCIÓN METEOROLÓGICA

MASTER DE INGENIERÍA BIOMÉDICA. Métodos de ayuda al diagnóstico clínico. Tema 6: Árboles de decisión.

La última versión disponible cuando se redactó este manual era la 5 Beta (versión ), y sobre ella versa este manual.

Primeros pasos con Knime. Luis P. Guerra Velasco

Métodos de Inteligencia Artificial

Definir un Equipo de Fútbol óptimo mediante Redes Neuronales Artificiales

Capítulo 5. Construcción de una Red Neuronal Artificial Asesora

LA MINERÍA DE DATOS APLICADA A LA BÚSQUEDA DE PATRONES DE SUPERVIVIENCIA EN LA NEOPLASIA MALIGNA DE TRÁQUEA, BRONQUIOS Y PULMÓN

Práctica Final INTELIGENCIA EN REDES DE COMUNICACIONES

Ismael Fernández Castellano Telmo Calle Facal Grupo 91

Aprendizaje Automatizado

OTRAS CONSIDERACIONES. Introducción a las Redes Neuronales Artificiales

Tema 4: Aprendizaje de conceptos

1.-DATOS DE LA ASIGNATURA

Estabilización Inteligente de Sistemas Eléctricos de Potencia (Parte II)

Inteligencia Artificial. Aprendizaje neuronal. Ing. Sup. en Informática, 4º. Curso académico: 2011/2012 Profesores: Ramón Hermoso y Matteo Vasirani

PREDICCIÓN DE VAPOR DE AGUA PRECIPITABLE CON DATOS DE MEDICIONES GPS UTILIZANDO UNA RED NEURONAL ARTIFICIAL

Instalación de diferentes S.O. en maquinas virtuales, Virtual Box. Vicente Sánchez Patón I.E.S Gregorio Prieto. Tema 1 SRI

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 11 -

Primera aproximación al aprendizaje automático.

Identificación de variables asociadas al éxito académico en Estudiantes de la Facultad de Informática Mazatlán

Fuzzification. M.C. Ana Cristina Palacios García

María Gabriela Vintimilla Sarmiento Darwin Alulema

Curso Superior. Experto en Data Mining

Grado en ESTADÍSTICA APLICADA 258 ECTS

informática Educación Secundaria Obligatoria

Introducción a la minería de datos. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR

Minería de Datos. Profra. Heidy Marisol Marin Castro Universidad Politécnica de Victoria

Unidad 5. Tablas. La celda que se encuentra en la fila 1 columna 2 tiene el siguiente contenido: 2º Celda

Componentes de los SBC. Componentes de los SBC. SBC basados en sistemas de producción. Notas

Series Temporales. Departamento de Informática Universidad Carlos III de Madrid Avda. de la Universidad, Leganés (Madrid)

LIM. Modelización del conjunto motor-transmisión de un automóvil a partir de datos experimentales. Trabajo final de grado

Algoritmos y Programación Orientada a Objetos I. Contenedoras de tamaño variable y uso de ciclos en otros contextos

CONCLUSIONES. La teoría de Redes Neuronales Artificiales, presenta grandes ventajas con

Mantenimiento de edificios

Redes Neuronales Artificiales

Técnicas de aprendizaje automático en el análisis de datos de DP. Dr. Carlos Fernández Lozano Juan de la Cierva-Formación

Manual configuración aplicaciones

Universidad de Costa Rica Sistema de Aplicaciones Estudiantiles SAE

5. PLANIFICACIÓN DE LAS ENSEÑANZAS

CONCEPTOS BÁSICOS (Freeman capt.1; Neural Nets capt. 4,5 y 7)

OPTIMIZACIÓN Y SIMULACIÓN PARA LA EMPRESA. Tema 5 Simulación

MODELO 347. Si elegimos el modelo 347, la pantalla que se nos muestra es:

Itinerario: Inteligencia Computacional

PRUEBA DE SOFTWARE LA PRUEBA DE UN SISTEMA

Tablas dinámicas: Teoría y ejercicios resueltos

Solución al parcial 14

Procesamiento Analógico de Señales

Experto en Data Mining

REDES NEURONALES. Una esquema simplificado de una neurona se muestra en la siguiente figura. Cuerpo celular. Dendrita. Axón.

Aplicación de carga de faltas

LOS SISTEMAS ADAPTATIVOS

EL ANALISIS DE LA EXPLOTACION AGRARIA

Jesús García Herrero METODOLOGÍA DE ANÁLISIS DE DATOS

Manual de Usuario Digibanda MANUALES. Source IT Consulting SAC Calle General Silva 489 Miraflores Lima Perú

4.13. GESTIÓN DINÁMICA DE UN PROYECTO

MINERIA DE DATOS: ANÁLISIS DE DATOS ELECTORALES

La aplicación de separación de voz separalab

LABORATORIO DE FISICA - BOBINAS DE HELMHOLTZ

Capítulo 2: Introducción.

Posibles trabajos HIA

Especialidades en GII-TI

Perfil de la carrera Licenciatura en Computación Inteligencia Artificial

MANUAL DE USUARIO SISTEMA DE CALIFICACIÓN PARA CAPACITADORES INDEPENDIENTES

Intensificación en "Lenguajes e Inteligencia Artificial"

Big Data Analytics & IBM BIG INSIGHT

MANUAL PARA INTEGRAR LOS DATOS DE ABIES A ABIESWEB

CAPÍTULO Reconocimiento de voz usando redes neuronales artificiales del CSLU

CAPÍTULO 1. INTRODUCCIÓN

Técnicas de Programación

Técnicas de inteligencia artificial. Aprendizaje: Perceptrón multi-capa

Minería de Datos. Índice. Raquel M. Crespo García. Julio Villena Román. Definición y conceptos Técnicas y modelos

TEST DE RAZONAMIENTO NUMÉRICO. Consejos generales

2. NORMAS DE SEGURIDAD Y TRABAJO EN EL AULA-TALLER

Tema 2: Diseño y Construccion de Sistemas de Ayuda a la Decision

Master Universitario de Automatización de Procesos Industriales DEPARTAMENTO DE ELECTRÓNICA T3 ENTORNO VIJEO CITECT CONFIGURACIÓN VIJEO CITECT BÁSICA

Sistemas de predicción Aprendizaje automático Data Mining & Machine Learning

MANUAL WinPoET 1/31. MANUAL WinPoET

INTELIGENCIA ARTIFICAL COMO HERRAMIENTA EN LA TOMA DE DECISIONES. Tecnología i3b

Dentro de un multiplexor hay que destacar tres tipos de señales: los datos de entrada, las entradas de control y la salida

Unidad 2. Crear una Presentación (I)

matemáticos, como por ejemplo las cinco operaciones básicas, factorial de un número.

Transcripción:

INGENIERÍA EN TELECOMUNICACIONES UNIVERSIDAD CARLOS III DE MADRID 5º Curso, Año Académico 2004/2005 INTELIGENCIA EN REDES DE COMUNICACIONES. MINERÍA DE DATOS-PREDICCIÓN METEOROLÓGICA-. Realizado por: David Paniagua Martín. Juan Carlos Soler Pascual del Pobil.

INDICE: INTRODUCCIÓN AL CONCEPTO DE MINERÍA DE DATOS. Qué es la minería de datos? Fases de un Proyecto de Minería de Datos. Filtrado de datos. Selección de variables. Algoritmos de extracción de conocimiento. Interpretación y evaluación. DESARROLLO DE LA PRÁCTICA. Comienza el filtrado de los datos. Ajuste del fichero. Selección de variables. DESCRIPCIÓN DE LOS ALGORITMOS. Redes Neuronales. ANÁLISIS DE LOS FICHEROS GENERADOS, MEDIANTE WEKA. Selección de los algoritmos. Entrenamiento de un perceptrón multicapa. Problemas.

INTRODUCCIÓN AL CONCEPTO DE MINERÍA DE DATOS. Qué es la minería de datos? Las técnicas de minería de datos se emplean para mejorar el rendimiento de procesos de negocio o industriales en los que se manejan grandes volúmenes de información estructurada y almacenada en bases de datos. Se trata de un proceso analítico diseñado para explorar grandes volúmenes de datos (generalmente datos de negocio y mercado) con el objeto de descubrir patrones y modelos de comportamiento o relaciones entre diferentes variables. Esto permite generar conocimiento que ayuda a mejorar la toma de decisiones en los procesos fundamentales de un negocio. La minería de datos permite obtener valor a partir de la información que registran y manejan las empresas, lo que ayuda a dirigir esfuerzos de mejora respaldados en datos históricos de diversa índole. Por ejemplo, se usan con éxito en aplicaciones de control de procesos productivos, como herramienta de ayuda a la planificación y a la decisión en marketing, finanzas, etc. Asimismo, la minería de datos es fundamental en la investigación científica y técnica, como herramienta de análisis y descubrimiento de conocimiento a partir de datos de observación o de resultados de experimentos. Fases de un Proyecto de Minería de Datos. Los pasos a seguir para la realización de un proyecto de minería de datos son siempre los mismos, independientemente de la técnica específica de extracción de conocimiento usada. Filtrado de datos: El formato de los datos contenidos en la fuente de datos (base de datos, Data Warehouse...) nunca es el idóneo, y la mayoría de las veces no es posible ni siquiera utilizar ningún algoritmo de minería sobre los datos "en bruto".

Mediante el preprocesado, se filtran los datos (de forma que se eliminan valores incorrectos, no válidos, desconocidos... Según las necesidades y el algoritmo a usar), se obtienen muestras de los mismos (en busca de una mayor velocidad de respuesta del proceso), o se reducen el número de valores posibles (mediante redondeo, clustering,...). Selección de variables: Aún después de haber sido preprocesados, en la mayoría de los casos se tiene una cantidad ingente de datos. La selección de características reduce el tamaño de los datos eligiendo las variables más influyentes en el problema, sin apenas sacrificar la calidad del modelo de conocimiento obtenido del proceso de minería. Los métodos para la selección de características son básicamente dos: Aquellos basados en la elección de los mejores atributos del problema. Aquellos que buscan variables independientes mediante tests de sensibilidad, algoritmos de distancia o heurísticos. Algoritmos de Extracción de Conocimiento: Mediante una técnica de minería de datos, se obtiene un modelo de conocimiento, que representa patrones de comportamiento observados en los valores de las variables del problema o relaciones de asociación entre dichas variables. También pueden usarse varias técnicas a la vez para generar distintos modelos, aunque generalmente cada técnica obliga a un preprocesado diferente de los datos. Interpretación y evaluación: Una vez obtenido el modelo, se debe proceder a su validación, comprobando que las conclusiones que arroja son válidas y suficientemente satisfactorias. En el caso de haber obtenido varios modelos mediante el uso de distintas técnicas, se deben comparar los modelos en busca de aquel que se ajuste mejor al problema. Si ninguno de los modelos alcanza los resultados esperados, debe alterarse alguno de los pasos anteriores para generar nuevos modelos.

DESARROLLO DE LA PRÁCTICA. A la hora de desarrollar la práctica hemos seguido, en cierta manera, los pasos que hemos indicado en la introducción. Es cierto que, a pesar de haberlo visto en teoría, es ahora cuando nos hemos dado cuenta de lo que es la minería de datos y de cuál es su verdadero problema: el filtrado de los datos. En un principio obtenemos los datos en bruto del link facilitado en el enunciado de la práctica. En este link conseguimos el archivo meteo.tgz. En él encontramos los distintos ficheros con abundantes medidas de varios factores relacionados con la meteorología. Comienza el filtrado de los datos: Para la realización de esta primera fase hemos utilizado la programación en lenguaje java. En primer lugar hacemos uso de la clase Preprocesar.java, que lo que hace es recorrer todos los ficheros con datos y volcarlos de forma ordenada en otro fichero(esto es: Hora, Temperatura, Nivel de Rocio, Humedad, Presión, Visibilidad, Dirección del viento, Velocidad del viento, Ráfaga, Precipitación, Hechos, Condiciones). Como es normal, al realizar esta simple ordenación, vimos que algunos de los datos eran incorrectos, es decir, formato que no se correspondía con el tipo declarado en las cabeceras, dato inexistente, etc... Estos datos debían ser filtrados. Para ello utilizamos la clase Preprocesado2.java, en la que nos encargamos de eliminar los errores más comunes; por ejemplo: cambiar N/A por el carácter? para que no de problemas la herramienta WEKA, cambiar una palabra por un número que la identifique debido a que la inmensa mayoría de los datos son de tipo real... Nos gustaría destacar que para realizar esta tarea no basta con pasar el programa, ya que éste resuelve los problemas más comunes, debido a que consideramos que por la existencia de alguna línea errónea, con un fallo particular, no merecía la pena desarrollar un código específico y nos inclinamos por quitarla manualmente. El resultado de realizar estas dos operaciones, más un pequeño trabajo de optimización manual del fichero, nos ofrece un fichero con sus respectivas cabeceras, en el que disponemos de todos los datos con formato correcto. Ajuste del fichero: En este momento es cuando pasamos a la siguiente fase: reajustar el fichero para facilitar la selección de las variables; qué quiere decir esto? Pues que como en el fichero anterior no vienen datos para todas las horas y hay espacios en blanco, en las clases Fich_Def_Pred1h.java y Fich_Def_Pred24h.java (elegir cuál según el caso) lo primero que hacemos es eliminar dichos blancos y rellenar todas las horas en las que deberíamos tener

medidas (cada treinta minutos) con el carácter? donde deberían ir los datos. El objetivo de esta operación es el de tener un fichero sin blancos y con cuarenta y ocho medidas por día. Con este fichero nos resultará más fácil programar la clase java que irá recorriendo el fichero para seleccionar las variables con las que entrenaremos a WEKA con el fin de que consiga predecir la variable deseada. Selección de variables: El criterio de selección de variables lo hemos desarrollado de forma un tanto intuitiva, pensando cuáles de las variables del fichero influirían más en la predicción de la variable deseada: Predicción de la temperatura dentro de una hora: En un principio pensamos que sería conveniente obtener la temperatura, la humedad, la presión y la velocidad del viento actuales y los mismos datos de hasta cuatro horas anteriores (es decir ocho datos), también deberíamos quedarnos con el valor de la variable a predecir: la temperatura dentro de una hora; sin embargo, cuando pasamos el fichero a WEKA, nos decía que éste era demasiado grande, por lo que decidimos quedarnos con la información de hasta dos horas anteriores (cuatro datos). Predicción de la temperatura dentro de veinticuatro horas: es un caso análogo al anterior, sólo que necesitamos, además de la temperatura, la humedad, la presión y la velocidad del viento actuales, los mismos datos de hasta cuatro días antes y el valor de la variable a predecir: la temperatura dentro de veinticuatro horas. Predicción de la condición meteorológica dentro de veinticuatro horas: es un caso parecido a lrios dos anteriores, pero eliminamos la velocidad del viento y añadimos la condición meteorológica. A la hora de seleccionar variables, pensamos que deberíamos haber incluido alguna variable más que también puede influir en la predicción, pero los problemas de memoria que nos dio la herramienta WEKA nos disuadieron de ello. Con esta operación acaba la labor más ardua de esta práctica, en la que por fin disponemos de un fichero que ofrecer a la herramienta para dedicarnos a la minería de datos propiamente dicha. DESCRIPCIÓN DE LOS ALGORITMOS. Redes Neuronales. Referidas habitualmente de forma más sencilla como redes de neuronas, las redes de neuronas artificiales (RNA) son un paradigma de aprendizaje y procesamiento automático inspirado en la forma en que funciona el sistema nervioso de los animales. Consiste en simular las propiedades observadas en los sistemas neuronales biológicos a través de modelos matemáticos recreados mediante mecanismos artificiales (como un circuito integrado, un ordenador o un conjunto de válvulas). El objetivo es conseguir

que las máquinas den respuestas similares a las que es capaz el cerebro que se caracterizan por su generalización y su robustez. A continuación mostramos un ejemplo de Red Neuronal Artificial de tipo Perceptrón simple con n neuronas de entrada, m neuronas en su capa oculta y una neurona de salida. Las Redes Neuronales pueden ser aplicadas a la construcción de generalizaciones o cubrimientos que caractericen grandes grupos de datos ya que adquieren conocimiento integrador de información durante el proceso de ajuste de los pesos de las conexiones entre neuronas que las integran, tienen la ventaja de ser tolerantes al ruido y la capacidad de extender la generalización al momento de necesitar manipular datos nuevos.

Análisis de los ficheros generados, mediante WEKA. Una vez realizada la tarea de preprocesar los datos, llega la parte más sencilla, aunque nosotros en este caso hemos tenido algunos problemas que han hecho que no pudiésemos obtener los resultados esperados. A continuación explicaremos como es la carga de los datos de entrenamiento, de test, como se seleccionan los métodos que podemos usar y como se entrena el modelo. - Carga de datos en WEKA. En la siguiente ventana, podemos observar el archivo, ya preprocesado, cargado en WEKA. A la izquierda tenemos todas las diferentes variables que utilizamos para el entrenamiento de los modelos. - Carga fichero de test. Dentro de la pestaña 'Classify', que es donde escogeremos el algoritmo que queremos emplear, aparecen diversas opciones para hacer el test del modelo. Como ya explicamos anteriormente no es conveniente usar el mismo conjunto de entrenamiento para realizar el test, pues no dará resultados del todo fiables. Las posibilidades son usar el propio conjunto de entrenamiento, conjunto de test diferente, validación cruzada y porcentaje.

Selección de los algoritmos. En WEKA podemos escoger entre una amplia variedad de algoritmos. Para el caso de predicción y estimación los mejores métodos son las redes neuronales. En nuestro caso, realizaremos un "Análisis predictivo" es decir el problema se enfoca en predecir eventos o comportamientos específicos, basado en información histórica. A continuación vemos una imagen con diferentes métodos presentes en WEKA.

Entrenamiento de un perceptrón multicapa: Para la previsión de la temperatura e 1 hora y a 24 horas en las dos diferentes localizaciones, vamos a utilizar un perceptrón multicapa. Ventana con el modelo generandose en WEKA. Una vez terminada la simulación se presenta en pantalla los resultados y el modelo realizado, con todos los pesos para cada una de las entradas a cada neurona y los umbrales de las sigmoides. Cuatro vientos, prevision a una hora: La red neuronal elegida en este caso es un perceptrón multicapa, de dos capas ocultas con 4 neuronas cada una. Modelo del clasificador: Linear Node 0

Threshold -0.7318542853332106 Node 5 2.451155199434381 Node 6 3.605923459515365 Node 7 2.9845814367379737 Node 8 1.7381290311705837 Sigmoid Node 1 Threshold -0.6147338986303225 Attrib Temperatura -12.947069009246327 Attrib Humedad -0.9266699791506914 Attrib Presion 2.008662587182459 Attrib Velocidad_del_vientoMPH -1.758623994741193 Attrib Temperatura2h 3.0506231381314457 Attrib Humedad2h -0.09020337018928898 Attrib Presion2h 1.8711234010012852 Attrib Velocidad_del_vientoMPH2h 0.5716977188945489 Attrib Temperatura1_30h -0.14218622296047803 Attrib Humedad1_30h 0.9929698133534901 Attrib Presion1_30h 1.283186245513777 Attrib Velocidad_del_vientoMPH1_30h 0.4191147141074435 Attrib Temperatura1h -0.7579011346648772 Attrib Humedad1h -0.9646314842304976 Attrib Presion1h -0.5132199780387997 Attrib Velocidad_del_vientoMPH1h -0.010800515377322583 Attrib Temperatura0_30h -5.30098024177015 Attrib Humedad0_30h -1.1373017562404966 Attrib Presion0_30h -3.1348378088064 Attrib Velocidad_del_vientoMPH0_30h -0.12839428771289915 Sigmoid Node 2 Threshold -0.3504103079064791 Attrib Temperatura 5.043435583311411 Attrib Humedad 4.450455611324779 Attrib Presion -14.783846966603663 Attrib Velocidad_del_vientoMPH 9.38557207812525 Attrib Temperatura2h -2.898294858673786 Attrib Humedad2h -1.37472645250323 Attrib Presion2h -0.4905456275500915 Attrib Velocidad_del_vientoMPH2h 1.5136674874525182 Attrib Temperatura1_30h -2.606740713238114 Attrib Humedad1_30h -0.6839292883540816 Attrib Presion1_30h 0.07443099050663786 Attrib Velocidad_del_vientoMPH1_30h 1.5407319241390514 Attrib Temperatura1h -4.131223032955618 Attrib Humedad1h -1.1094297215491522 Attrib Presion1h 0.21420427388526325 Attrib Velocidad_del_vientoMPH1h 1.6949091782398686 Attrib Temperatura0_30h -7.197827275652763 Attrib Humedad0_30h 1.581426147847638 Attrib Presion0_30h -3.2092888677144167 Attrib Velocidad_del_vientoMPH0_30h 2.260606217815922 Sigmoid Node 3 Threshold 0.6800606786749867 Attrib Temperatura -5.278557209332113 Attrib Humedad -0.395059310762834 Attrib Presion -0.5455000168406886 Attrib Velocidad_del_vientoMPH 0.09633128749187742 Attrib Temperatura2h 0.3982890517950956

Attrib Humedad2h -0.05704311131887253 Attrib Presion2h 0.17619311323838638 Attrib Velocidad_del_vientoMPH2h 0.026388255073993287 Attrib Temperatura1_30h 0.20306947467259 Attrib Humedad1_30h 0.05334130670016562 Attrib Presion1_30h 0.25035993986155997 Attrib Velocidad_del_vientoMPH1_30h 0.06881422376355001 Attrib Temperatura1h 0.12631507415960477 Attrib Humedad1h -0.011508326717766118 Attrib Presion1h 0.021082036440251847 Attrib Velocidad_del_vientoMPH1h -0.029991462428089376 Attrib Temperatura0_30h 0.4035670851305122 Attrib Humedad0_30h 0.20855775222032727 Attrib Presion0_30h -0.09295748003886092 Attrib Velocidad_del_vientoMPH0_30h -0.059573802182914797 Sigmoid Node 4 Threshold -4.350687901983403 Attrib Temperatura -5.362282187024175 Attrib Humedad 0.08954624203860817 Attrib Presion -0.05471017744946929 Attrib Velocidad_del_vientoMPH 0.13482018497080878 Attrib Temperatura2h -0.0425380313251771 Attrib Humedad2h -0.046778222439851594 Attrib Presion2h 0.25544226677873905 Attrib Velocidad_del_vientoMPH2h -0.06542710828645158 Attrib Temperatura1_30h 0.10668907578007518 Attrib Humedad1_30h -0.11483455422547999 Attrib Presion1_30h -0.015596665472447823 Attrib Velocidad_del_vientoMPH1_30h -0.12072945530105579 Attrib Temperatura1h -0.03467668904283438 Attrib Humedad1h -0.11802219035322713 Attrib Presion1h -0.12075855201431235 Attrib Velocidad_del_vientoMPH1h -0.08839637306509265 Attrib Temperatura0_30h 0.261272381110117 Attrib Humedad0_30h -0.07449574301072662 Attrib Presion0_30h 0.007660358300969868 Attrib Velocidad_del_vientoMPH0_30h -0.04817338828764935 Sigmoid Node 5 Threshold -0.5440761247875076 Node 1 0.41650643212807376 Node 2-1.955792325646534 Node 3-2.3477380448997804 Node 4-6.633237986986848 Sigmoid Node 6 Threshold -5.197066423930135 Node 1-0.13627838164191322 Node 2 1.1721579480530906 Node 3 2.732349643061715 Node 4-7.884491203627148 Sigmoid Node 7 Threshold -1.1937537062522194 Node 1 0.4220330522847942 Node 2-1.4034065144737466 Node 3-2.0210523018235858 Node 4-5.18075314270267 Sigmoid Node 8

Threshold -5.256335891052092 Node 1-5.054431004397993 Node 2-6.281457184982572 Node 3 6.783550969906818 Node 4-4.3221866464817476 Resultados: Correlation coefficient 0.9692 Mean absolute error 2.5194 Root mean squared error 3.9627 Relative absolute error 18.3551 % Root relative squared error 24.7567 % Total Number of Instances 12711 Ignored Class Unknown Instances 6763 CuatroVientos previsión a 24 horas de la temperatura: Modelo del clasificador: Linear Node 0 Threshold 0.8073585685781312 Node 5-2.037384027202763 Node 6-2.038740035407279 Node 7-2.041188135507193 Node 8-2.0404426741643613 Sigmoid Node 1 Threshold -0.6651558935974691 Attrib Temperatura 1.8555127654045558 Attrib Humedad -0.2361136702430307 Attrib Presion 0.29695979033129505 Attrib Velocidad_del_vientoMPH 0.11647677040395613 Attrib Temperatura2h 0.22557991485177872 Attrib Humedad2h -0.2011957833558654 Attrib Presion2h 0.20666543811242383 Attrib Velocidad_del_vientoMPH2h 0.056826073017695586 Attrib Temperatura1_30h 0.3866348534817607 Attrib Humedad1_30h -0.05815874744197061 Attrib Presion1_30h 0.19778026760170336 Attrib Velocidad_del_vientoMPH1_30h -0.08783072454852817 Attrib Temperatura1h 0.4128046101392379 Attrib Humedad1h -0.06366867136040044 Attrib Presion1h 0.13663097977981942 Attrib Velocidad_del_vientoMPH1h -0.054685576736889015 Attrib Temperatura0_30h 0.9078949431956693 Attrib Humedad0_30h -0.18414477172258967 Attrib Presion0_30h 0.22479055297958836 Attrib Velocidad_del_vientoMPH0_30h -0.013314652542877625 Sigmoid Node 2 Threshold -3.588144980779826

Attrib Temperatura 1.3070256679846426 Attrib Humedad 1.3934097227470312 Attrib Presion -0.5625874940982641 Attrib Velocidad_del_vientoMPH 1.17833058276069 Attrib Temperatura2h 1.8459071635989825 Attrib Humedad2h -0.6395798832150247 Attrib Presion2h 0.7730428087008788 Attrib Velocidad_del_vientoMPH2h -0.6560304591434359 Attrib Temperatura1_30h 1.5071017026680544 Attrib Humedad1_30h -0.2268188309196192 Attrib Presion1_30h 0.5803811375294144 Attrib Velocidad_del_vientoMPH1_30h -0.4959581976334875 Attrib Temperatura1h 0.9615443369417199 Attrib Humedad1h 0.35187202573600773 Attrib Presion1h 0.10388011769247511 Attrib Velocidad_del_vientoMPH1h 0.17958263383129322 Attrib Temperatura0_30h 1.3465232009663417 Attrib Humedad0_30h 0.9354774227491115 Attrib Presion0_30h -0.08538134747684345 Attrib Velocidad_del_vientoMPH0_30h 0.31415701796050965 Sigmoid Node 3 Threshold -0.47358433416696016 Attrib Temperatura 2.0751514064734033 Attrib Humedad 0.016776286489068228 Attrib Presion -0.13153960050150193 Attrib Velocidad_del_vientoMPH -0.2446158077469039 Attrib Temperatura2h -0.32190829702971413 Attrib Humedad2h 0.4357440226371362 Attrib Presion2h -0.18577573084321894 Attrib Velocidad_del_vientoMPH2h 0.23069573414913386 Attrib Temperatura1_30h -0.09092876305526085 Attrib Humedad1_30h 0.27889369385166957 Attrib Presion1_30h 0.011616029974752966 Attrib Velocidad_del_vientoMPH1_30h 0.2904272715178043 Attrib Temperatura1h 0.1318941344854407 Attrib Humedad1h 0.1378853017503764 Attrib Presion1h -0.038283000669113734 Attrib Velocidad_del_vientoMPH1h 0.06406494409950755 Attrib Temperatura0_30h 0.939145413187267 Attrib Humedad0_30h -0.015381704587068681 Attrib Presion0_30h 0.018303970414755732 Attrib Velocidad_del_vientoMPH0_30h 0.008003541760441057 Sigmoid Node 4 Threshold -2.091825561013978 Attrib Temperatura 2.0122144998320413 Attrib Humedad -0.06577779989723699 Attrib Presion 0.17128732479348305 Attrib Velocidad_del_vientoMPH -0.43551491600915127 Attrib Temperatura2h 0.041340580614107655 Attrib Humedad2h 0.2641091823178154 Attrib Presion2h 0.10658330775614389 Attrib Velocidad_del_vientoMPH2h 0.16031956633767666 Attrib Temperatura1_30h 0.11645592864117726 Attrib Humedad1_30h 0.17583998906741194 Attrib Presion1_30h 0.19067124857485157 Attrib Velocidad_del_vientoMPH1_30h 0.17285636749096112 Attrib Temperatura1h 0.3000464045329895 Attrib Humedad1h -0.05746086110075946 Attrib Presion1h 0.06091663292559196

Attrib Velocidad_del_vientoMPH1h 0.039968404820281966 Attrib Temperatura0_30h 1.0016302676171973 Attrib Humedad0_30h 0.052476718048625706 Attrib Presion0_30h 0.05368731705089637 Attrib Velocidad_del_vientoMPH0_30h 0.006000027243493216 Sigmoid Node 5 Threshold -1.5273331736342641 Node 1-0.6646136147663774 Node 2-1.8436063868821848 Node 3-0.7296832378650701 Node 4-1.120878109489772 Sigmoid Node 6 Threshold -1.526007097616617 Node 1-0.7000073972523669 Node 2-1.8209657020638397 Node 3-0.724533018327228 Node 4-1.1062118182390737 Sigmoid Node 7 Threshold -1.516457799491078 Node 1-0.7364177406564825 Node 2-1.821570323631226 Node 3-0.7343840203042871 Node 4-1.0921816145830363 Sigmoid Node 8 Threshold -1.5226803967190308 Node 1-0.6629578206852422 Node 2-1.8357268736998502 Node 3-0.7931894571053381 Node 4-1.091675583759213 Resultados: Correlation coefficient 0.9358 Mean absolute error 4.4479 Root mean squared error 5.973 Relative absolute error 31.5225 % Root relative squared error 36.2601 % Total Number of Instances 13917 Ignored Class Unknown Instances 7377 Madrid previsión a 1 hora de la temperatura: Modelo del clasificador: Linear Node 0 Threshold 1.0618238596199778 Node 5-1.5686892783513868 Node 6-1.5975187472484036 Node 7-1.5925081755596977 Node 8-1.5817677788357463 Sigmoid Node 1

Threshold -0.9886330579904867 Attrib Temperatura 2.1346056546023378 Attrib Humedad 0.22062695144546124 Attrib Presion 2.1632831147320273 Attrib Velocidad_del_vientoMPH 0.3497526135286801 Attrib Temperatura2h 0.23143964233625056 Attrib Humedad2h 0.0706670408716608 Attrib Presion2h -0.12922697461871654 Attrib Velocidad_del_vientoMPH2h 0.25015322492346803 Attrib Temperatura1_30h 0.37419939148710624 Attrib Humedad1_30h 0.037261105440250714 Attrib Presion1_30h -0.021735996867559844 Attrib Velocidad_del_vientoMPH1_30h 0.009087298556632825 Attrib Temperatura1h 0.5788129372425187 Attrib Humedad1h 0.10295860817722016 Attrib Presion1h 0.08144363284794758 Attrib Velocidad_del_vientoMPH1h -0.08796719917529731 Attrib Temperatura0_30h 1.4998256972807853 Attrib Humedad0_30h -0.20231180455467795 Attrib Presion0_30h 1.264552082931572 Attrib Velocidad_del_vientoMPH0_30h -0.17454686714342416 Sigmoid Node 2 Threshold -0.8303108848207218 Attrib Temperatura 1.6176476009955287 Attrib Humedad 0.056205088301477246 Attrib Presion -1.051938206624725 Attrib Velocidad_del_vientoMPH -0.30474683728826013 Attrib Temperatura2h -0.29416427309328386 Attrib Humedad2h -0.21230882454283048 Attrib Presion2h -0.1480408488898227 Attrib Velocidad_del_vientoMPH2h 0.10565479434707789 Attrib Temperatura1_30h 0.134432071168191 Attrib Humedad1_30h -0.004754368960413012 Attrib Presion1_30h 0.013616338902236716 Attrib Velocidad_del_vientoMPH1_30h 0.013161581540085681 Attrib Temperatura1h 0.3771221723599792 Attrib Humedad1h -0.05345141989698303 Attrib Presion1h -0.10668063828279882 Attrib Velocidad_del_vientoMPH1h -0.23270071246210797 Attrib Temperatura0_30h 1.0445757719948305 Attrib Humedad0_30h 0.02946709954498486 Attrib Presion0_30h -0.5547383541424838 Attrib Velocidad_del_vientoMPH0_30h -0.445558226781873 Sigmoid Node 3 Threshold -3.815145251223874 Attrib Temperatura 3.9554735021249057 Attrib Humedad -0.7977283332368412 Attrib Presion 2.365162696750582 Attrib Velocidad_del_vientoMPH -0.47936760527716615 Attrib Temperatura2h -1.4030200452348598 Attrib Humedad2h 0.10256340093290923 Attrib Presion2h 0.1052437642605515 Attrib Velocidad_del_vientoMPH2h 0.003495982757594373 Attrib Temperatura1_30h -0.7414124558143137 Attrib Humedad1_30h 0.04447059849532746 Attrib Presion1_30h 2.2272807304455798E-4 Attrib Velocidad_del_vientoMPH1_30h 0.012003990999078113 Attrib Temperatura1h -0.2504080865142009 Attrib Humedad1h 0.23692030959663166

Attrib Presion1h 0.010209856822545665 Attrib Velocidad_del_vientoMPH1h 0.0348202908048004 Attrib Temperatura0_30h 0.32277764087463656 Attrib Humedad0_30h 0.4269764671881349 Attrib Presion0_30h -0.5142471567694773 Attrib Velocidad_del_vientoMPH0_30h -0.047415434962319924 Sigmoid Node 4 Threshold -1.3009985299539097 Attrib Temperatura 0.8462963176994714 Attrib Humedad 0.5966670731552902 Attrib Presion -1.3564964392411347 Attrib Velocidad_del_vientoMPH 1.3856462947295614 Attrib Temperatura2h 0.37370269368173553 Attrib Humedad2h -0.008464652521449526 Attrib Presion2h 0.32610817263430447 Attrib Velocidad_del_vientoMPH2h -0.4986506265531261 Attrib Temperatura1_30h 0.6523491811428909 Attrib Humedad1_30h 0.010603752382426352 Attrib Presion1_30h -0.2050561801610554 Attrib Velocidad_del_vientoMPH1_30h 0.04219795480398837 Attrib Temperatura1h 0.6635019479190263 Attrib Humedad1h -0.07416582679030602 Attrib Presion1h 0.02912420084042308 Attrib Velocidad_del_vientoMPH1h 0.16009454186624417 Attrib Temperatura0_30h 1.4427922458152218 Attrib Humedad0_30h -0.13068150214349813 Attrib Presion0_30h 0.3874914697180759 Attrib Velocidad_del_vientoMPH0_30h 0.10878990608057294 Sigmoid Node 5 Threshold -0.6926683622141724 Node 1-0.6848549243323471 Node 2-0.6106194957281558 Node 3-1.3929039690368514 Node 4-0.9760180387116332 Sigmoid Node 6 Threshold -0.7112091253531574 Node 1-0.41319465680777195 Node 2-0.6976865563515924 Node 3-1.5167669375703485 Node 4-1.2260396065036334 Sigmoid Node 7 Threshold -0.7802771084985822 Node 1-0.48887672960676 Node 2-0.641228836210231 Node 3-1.4740714694556525 Node 4-1.084710814609543 Sigmoid Node 8 Threshold -0.7913234511469062 Node 1-0.5512603174981132 Node 2-0.6242521851197618 Node 3-1.3949723699339365 Node 4-1.060873155599475 Resultados: Correlation coefficient 0.9861

Mean absolute error 1.9769 Root mean squared error 2.7336 Relative absolute error 14.7594 % Root relative squared error 17.0025 % Total Number of Instances 10423 Ignored Class Unknown Instances 446 Madrid previsión a 24 horas de la temperatura: Modelo del clasificador: Linear Node 0 Threshold -0.7560927624975112 Node 5 1.8148815953546535 Node 6 1.8118559881102485 Node 7 1.8129262482222812 Node 8 1.8162805994112887 Sigmoid Node 1 Threshold -0.579905296583075 Attrib Temperatura -2.1085893577120136 Attrib Humedad -0.3811361256846924 Attrib Presion 1.201020795499226 Attrib Velocidad_del_vientoMPH -0.0035375412575892025 Attrib Temperatura2h -0.19771841697864806 Attrib Humedad2h -0.038402424191694054 Attrib Presion2h -0.08623037610627533 Attrib Velocidad_del_vientoMPH2h 0.010573367260305508 Attrib Temperatura1_30h -0.887169665677545 Attrib Humedad1_30h 0.03547474103116008 Attrib Presion1_30h 0.36690189717200067 Attrib Velocidad_del_vientoMPH1_30h 0.033403589861371485 Attrib Temperatura1h -1.1062027843481517 Attrib Humedad1h -0.029937410694295178 Attrib Presion1h 0.6246856367632794 Attrib Velocidad_del_vientoMPH1h 0.1055716587401212 Attrib Temperatura0_30h -1.6607008520573734 Attrib Humedad0_30h -0.18466535656270702 Attrib Presion0_30h 0.9247052079124412 Attrib Velocidad_del_vientoMPH0_30h 0.15219494720454121 Sigmoid Node 2 Threshold -0.42642043520617046 Attrib Temperatura -1.756759201774166 Attrib Humedad -0.3025363111773669 Attrib Presion -0.931123988558451 Attrib Velocidad_del_vientoMPH 0.2471392654690495 Attrib Temperatura2h -0.7998515683258312 Attrib Humedad2h 0.17222956317291627 Attrib Presion2h -0.257629107195901 Attrib Velocidad_del_vientoMPH2h 0.06378935300739881 Attrib Temperatura1_30h -0.9423729459943634 Attrib Humedad1_30h -0.03144784997969491 Attrib Presion1_30h -0.18199867174262557 Attrib Velocidad_del_vientoMPH1_30h 0.021675333324264905 Attrib Temperatura1h -0.9539560428062228 Attrib Humedad1h -0.23150442570394883

Attrib Presion1h -0.2912971604300684 Attrib Velocidad_del_vientoMPH1h 0.024953845397736513 Attrib Temperatura0_30h -1.3789615240597362 Attrib Humedad0_30h -0.2595054973947634 Attrib Presion0_30h -0.582528978749064 Attrib Velocidad_del_vientoMPH0_30h 0.02529255652350621 Sigmoid Node 3 Threshold -2.675981240484311 Attrib Temperatura -1.7674227963080371 Attrib Humedad 0.6489896931342477 Attrib Presion 0.7560459287601023 Attrib Velocidad_del_vientoMPH -0.08292505951586919 Attrib Temperatura2h 0.6057914951200217 Attrib Humedad2h -0.08213254769582772 Attrib Presion2h 0.30392476622996906 Attrib Velocidad_del_vientoMPH2h 0.040682302888936886 Attrib Temperatura1_30h 0.046236227153044124 Attrib Humedad1_30h -0.12819871106345385 Attrib Presion1_30h 0.1312565931850578 Attrib Velocidad_del_vientoMPH1_30h 0.17727212052607255 Attrib Temperatura1h -0.3632364761495221 Attrib Humedad1h 0.17095273322727988 Attrib Presion1h 0.19859661432586626 Attrib Velocidad_del_vientoMPH1h 0.12857680014831557 Attrib Temperatura0_30h -0.9755433067112832 Attrib Humedad0_30h 0.15694172185176333 Attrib Presion0_30h 0.1624994578304326 Attrib Velocidad_del_vientoMPH0_30h 0.1454607322362428 Sigmoid Node 4 Threshold -0.041711723973287256 Attrib Temperatura -1.717179132940165 Attrib Humedad -0.32272315675060304 Attrib Presion -1.145399659263305 Attrib Velocidad_del_vientoMPH 0.32000744308483375 Attrib Temperatura2h -0.8895095302325192 Attrib Humedad2h 0.32303015988273487 Attrib Presion2h -0.2958771813438675 Attrib Velocidad_del_vientoMPH2h 0.062450801711568645 Attrib Temperatura1_30h -0.9996617931899534 Attrib Humedad1_30h 0.08020438999870397 Attrib Presion1_30h -0.18227924862339984 Attrib Velocidad_del_vientoMPH1_30h 0.07612333347096199 Attrib Temperatura1h -1.0683827695742176 Attrib Humedad1h -0.16241305350664817 Attrib Presion1h -0.405955314125704 Attrib Velocidad_del_vientoMPH1h 0.015637710974986112 Attrib Temperatura0_30h -1.3703611067983952 Attrib Humedad0_30h -0.15571715158202168 Attrib Presion0_30h -0.6828323566701093 Attrib Velocidad_del_vientoMPH0_30h 0.09201364963493416 Sigmoid Node 5 Threshold -1.2641474732852696 Node 1-0.6409707340356203 Node 2-1.0981908357388148 Node 3-0.9320189560657894 Node 4-1.0948877346341808 Sigmoid Node 6

Threshold -1.2442417112835533 Node 1-0.6181041713885638 Node 2-0.9804560659828082 Node 3-1.0342634485902493 Node 4-1.0154512375770817 Sigmoid Node 7 Threshold -1.2646475216133883 Node 1-0.6095400910025727 Node 2-1.0188019917994944 Node 3-0.9775285146862107 Node 4-1.1095097291436649 Sigmoid Node 8 Threshold -1.260618796127294 Node 1-0.6576530566252439 Node 2-1.0804057378532432 Node 3-0.9177755034037145 Node 4-1.1283296624464705 Resultados: Correlation coefficient 0.9419 Mean absolute error 3.9756 Root mean squared error 5.1734 Relative absolute error 31.725 % Root relative squared error 33.7178 % Total Number of Instances 11895 Ignored Class Unknown Instances 507 Como es normal se puede ver que la probabilidad de error es mayor cuando tratamos de predecir la temperatura a 24 horas que a 1 hora. Problemas: Problemas de memoria. Los problemas de memoria, han hecho imposible la obtención de resultados para los algoritmos. Después de un rato de ejecución ocurría un error de memoria que no hemos sabido solucionar. Creemos que el formateo de los datos es correcto y los pasos seguidos también. Hemos intentado solventar el problema disminuyendo el tamaño de los archivos, pero solo ha solucionado en parte el problema y aumentando al máximo la memoria virtual de windows no conseguimos ninguna mejora. Estos problemas los tuvimos tanto en la universidad como en nustras casas. Ventana de error por falta de memoria.