MINERIA DE DATOS: ANÁLISIS DE DATOS ELECTORALES

Tamaño: px
Comenzar la demostración a partir de la página:

Download "MINERIA DE DATOS: ANÁLISIS DE DATOS ELECTORALES"

Transcripción

1 MINERIA DE DATOS: ANÁLISIS DE DATOS ELECTORALES Rubén Gómez-Chacón Camuñas Javier Jimenez Dorado RESUMEN En este artículo vamos a tratar un problema de minería de datos mediante técnicas de aprendizaje supervisado y no supervisado. Se estudia un conjunto de muestras donde están representados los datos electorales de las elecciones de octubre de 2003 a la Asamblea Legislativa de la Comunidad de Madrid. El problema se divide en dos partes bien diferenciadas: Selección de mesas representativas y Análisis de la distribución del voto. Los algoritmos de aprendizaje supervisado que hemos usado han sido los árboles de decisión (decisionstump, j48 y LMT) y perceptrón multicapa. Los algoritmos no supervisados han sido EM (Expectation Maximization) y K-Medias. Al final del artículo hacemos un breve repaso teórico de los mismos. La herramienta utilizada ha sido Weka, un programa de código abierto y que implementa gran variedad de algoritmos de aprendizaje muy útiles en tareas de minería de datos. El proceso de minería de datos será análogo al visto en clase y representado en el gráfico: Categorías y descriptores de materia I.2.6 Learning. I.5.3 Clustering Terminos generales Algoritmos, Experimentacion, Teoria, Verificación. Claves Mineria de datos, aprendizaje, clustering. 1. SELECCIÓN DE MESAS ELECTORALES REPRESENTATIVAS Disponemos de datos reales sobre los resultados electorales correspondientes a las elecciones autonómicas de la Comunidad de Madrid de octubre de Nuestro objetivo principal es seleccionar una serie de mesas electorales cuyos resultados sean representativos. Esto puede ser muy importante pues señala los puntos clave para realizar sondeos a pie de urna de una forma fiable, reduciendo pues el coste de los mismos, ya que bastará con realizarlos en dichas mesas en las próximas ediciones. Además se podrán simplificar los sondeos previos a la jornada electoral, pues podrán realizarse solamente en las áreas geográficas asociadas a dichos colegios electorales. Por otro lado se intentará extraer otro tipo de conocimiento de los datos que ayude en mayor medida al análisis de los mismos. Este tipo de conocimiento se conoce como conocimiento oculto, pues no es evidente, es desconocido a priori, pero puede sernos muy útil. Figura 1. Proceso de minería de datos 1.1 Preprocesado de los datos El conjunto inicial de datos, de que partimos, se encuentra almacenado en un fichero de texto en el que cada patrón corresponde a una mesa electoral, existiendo un total de 5866 mesas. Cada uno de estos patrones tiene 33 atributos, que especificamos en la siguiente tabla: Tabla 1. Atributos de los patrones 1

2 En este fichero de datos los municipios y distritos vienen representandos por códigos, cuya correspondencia real podemos ver en la figura de abajo. Figura 4. PP vs IU y PSOE vs. IU Se observa en esta gráfica cierta proporcionalidad entre los votos de PSOE y de IU, lo que implica por tanto proporcionalidad inversa entre PP e IU. Figura 2. Mapa de los distritos de la comunidad de Madrid En primer lugar transformaremos dicho archivo en un fichero.arff, que es el formato usado por Weka. En la primera línea debe datos_electorales, que especifica el nombre de la relación. En las lineas siguientes se pondrán uno a uno los atributos en la certificaciones real, si toma un valor numérico y en la mesa {A,B,C,D,U}, si es una variable nominal y toma valores discretos. Cuando se han puesto todas los atributos se y a continuación se pone un patrón por linea con los atributos separados por comas. Debido a la gran cantidad de partidos que concurrian en las elecciones y a que muchos de ellos no obtenian un número significativo de votos, optamos por dejar unicamente los siguientes, de manera que se simplicara el procesado: PSOE, PP, IU, y el resto de partidos fueron agrupados como RESTO. 1.2 Analisis de las relaciones entre variables Mediante la opcion Visualize de Weka podemos ver la relación entre todos los atributos dos a dos, en forma de gráfica, obteniendose resultados interesantes aunque no por ello poco esperados: 1.3 Obtención de mesas representativas usando clustering de la distancia. En primer lugar vamos a determinar las 10 mesas más representativas sin usar Weka. Para ello calculamos el resultado global de las elecciones sumando los votos obtenidos por cada partido: PSOE, PP, IU y RESTO, y los normalizamos con respecto al total de votos emitidos para obtener los porcentajes de voto. El resultado es: PSOE: : ~39.7% PP: : ~49.3% IU: : ~8.6% RESTO: : ~2.3% De aquí obtenemos la distancia euclídea de cada una de las mesas al resultado final de las elecciones mediante: dis tan cia = i 2 2 ( votos _ psoe votos _ psoe ) ( votos _ pp votos _ pp ) ( votos _ iu votos _ iu ) ) 2 i t + i t + i La distribución de las mesas en función de la distancia al resultado final puede verse en la siguiente gráfica : Figura3. PP vs. PSOE En esta figura se aprecia que el número de votos obtenidos por el PP es inversamente proporcional al obtenido por el PSOE. Figura5. Distribución de las distancias del resultado de cada mesa al resultado de las elecciones. 2

3 Llegados a este punto podemos tomar algún algoritmo de clustering para quedarnos con las mesas con resultados más parecidos al resultado final. El algoritmo elegido ha sido K- Medias. Cuanto mayor número de grupos elijamos, menor número de muestras aparecerá en cada uno. Si por ejemplo elegimos 20 clusters, el resultado dado por Weka es el siguiente: === Run information === Scheme: weka.clusterers.simplekmeans -N 20 -S 10 Relation: distancia_mesas Instances: 5864 Attributes: 1 distancia Test mode: evaluate on training data === Model and evaluation on training set === kmeans ====== Number of iterations: 135 Within cluster sum of squared errors: Cluster centroids: Cluster 0 Mean/Mode: Std Devs: Cluster 1 Mean/Mode: Std Devs: Cluster 2 Mean/Mode: Std Devs: Cluster 3 Mean/Mode: Std Devs: Cluster 4 Mean/Mode: Std Devs: Cluster 5 Mean/Mode: Std Devs: Cluster 6 Mean/Mode: Std Devs: Cluster 7 Mean/Mode: Std Devs: Cluster 8 Mean/Mode: Std Devs: Cluster 9 Mean/Mode: Std Devs: Cluster 10 Mean/Mode: Std Devs: Cluster 11 Mean/Mode: Std Devs: Cluster 12 Mean/Mode: Std Devs: Cluster 13 Mean/Mode: Std Devs: Cluster 14 Mean/Mode: Std Devs: Cluster 15 Mean/Mode: Std Devs: Cluster 16 Mean/Mode: Std Devs: Cluster 17 Mean/Mode: Std Devs: Cluster 18 Mean/Mode: Std Devs: Cluster 19 Clustered Instances Mean/Mode: Std Devs: ( 1%) ( 7%) ( 6%) ( 7%) ( 3%) ( 6%) ( 5%) ( 6%) ( 4%) ( 4%) ( 7%) ( 5%) ( 6%) ( 3%) ( 4%) ( 2%) ( 5%) ( 6%) ( 6%) ( 5%) En el cluster 13 se situan aquellas mesas con resultado más cercano en distancia euclídea al resultado final. Este cluster agrupa un 3% de las mesas electorales, esto es 190, que bien podría servir para realizar los sondeos. Si queremos seleccionar un número menor de mesas deberemos introducir un mayor número de clusters. Por ejemplo, usando 100 clusters conseguimos seleccionar 22 mesas con una distancia de en media y de 0.02 de desviación estandar. Weka, nos permite además representar los centroides de cada cluster y ver las mesas asignadas a cada uno de ellos: Figura 6. Centroides de los 100 clusters usados en k- Medias Si seleccionamos el cluster azul, que se encuentra más abajo en el eje de ordenadas,vemos que las mesas asignadas al mismo son las que buscabamos: 216, 399, 501, 660, 763, 764, 2396, 2625, 2963, 2970, 3092, , 3855, 3938, 3964, 4015, 4646, 4904, 4975, 5626,

4 Que correponden con: nº mesas municipio distrito 1 Alcobendas 1 1 Alcorcón 3 1 Alpedrete 1 1 Camarma de Esteruelas 2 Collado Villalba 1 1 Madrid Tetúan (6) 1 Madrid Fuencarral-El Pardo (8) 4 Madrid Latina (10) 1 Madrid Carabanchel (11) 1 Madrid Moratalaz (14) Obtención de mesas representativas haciendo clustering directo de las muestras Otra manera de obtener 10 mesas representativas es mediante agrupamiento directo, sin calcular previamente las distancias. Hemos usado los algoritmos EM y k-medias implementados en Weka y como entradas los porcentajes de voto por mesa para PSOE, PP, IU y RESTO. Si queremos obtener un número pequeño de mesas representativas deberemos incrementar el número de clusters, para que haya menos mesas por cluster, lo que con una entrada de dimensión 4 puede alargar el tiempo de procesado bastante. En estos casos hemos pasado a utilizar únicamente PSOE y PP como entradas, pues IU y RESTO son mucho menos significativas. Finalmente, una vez se ha realizado el agrupamiento, no queda más que seleccionar el cluster con centroide más parecido al resultado final de las elecciones y tomar como mesas representativas las que han sido asignadas a dicho cluster. En primer lugar, a modo ilustrativo (salen demasiadas mesas por cluster) mostramos el resultado del algoritmo EM con 6 clusters para los atributos PSOE y PP (sólo es posible representar gráficos bidimensionales): 3 Madrid Ciudad Lineal (15) 1 Madrid San Blas (20) 1 Móstoles 2 1 Móstoles 3 1 Torrejón de Ardoz 4 1 Villavicioa de Odón 1 Tabla 2: 22 Mesas representativas Figura 7. Agrupamiento de 6 conjuntos usando el algoritmo EM (se muestra PSOE frente a PP). Las muestras que más se parecen al resultado de las elecciones se encuentran en el cluster 1 (azul oscuro). Véase como las muestras más atípicas son agrupadas en clusters aparte. Usando kmeans para el mismo número de clusters se reduce el tiempo de ejecución a cambio de dar como resultado regiones con límites más difusos. 4

5 A pesar de usar 100 clusters el número de mesas agrupadas en el cluster más parecido al resultado final sigue siendo grande. En el primer caso ( figura x) hay 113 mesas (cluster 31 en rojo) y en el segundo caso, cluster 66, hay 186. Usando el algoritmo kmedias y 200 clusters (lleva menos tiempo de ejecución que el EM). Figura 8. Agrupamiento de 6 conjuntos usando el algoritmo K-Medias (se muestra PSOE frente a PP). Aumentando el número de clusters para obtener menos muestras en cada uno: Figura 11. Agrupamiento de 200 conjuntos usando el algoritmo kmeans (entradas = PSOE y PP) El cluster seleccionado es el 13, con 42 muestras. Hemos comprobado que algunas coinciden con las obtenidas en el apartado 1.3. Figura 9. Agrupamiento de 100 conjuntos usando el algoritmo EM (se muestra PSOE frente a PP). Usando como atributos PSOE y PP: Figura 10. Agrupamiento de 100 conjuntos usando el algoritmo EM. 5

6 2. ANÁLISIS DE LA DISTRIBUCIÓN DEL VOTO Adicionalmente a la obtención de las mesas representativas hemos querido analizar la relación entre los ganadores en cada mesa electoral con el porcentaje de voto valido (votos validos/censo), asi como la opción ganadora en función del distrito. Para ello hemos introducido dos nuevas variables: gana (que toma los valores PSOE, PP y IU) y porcentaje_voto (que es el resultado de dividir los votos válidos entre el censo). 2.1 Distribución del voto en la comunidad de Madrid Mostramos algunas gráficas donde podemos ver las relaciones entre diversas variables con el atributo gana. Podemos comprobar que el PSOE necesita un porcentaje algo mayor en una mesa (en media) para proclamarse ganador en la misma. Además parece que el que gane una u otra opción política puede estar relacionado con el porcentaje de gente que vota en dicha mesa. Esta información puede ser usada por el partido al cual perjudique la abstención para fomentar el voto en aquellas zonas donde sea mayor. Dada la relación entre el porcentaje de voto y el partido que sale ganador en la mesa, hemos intentado construir un sistema automático que nos diga la opción ganadora en cada mesa. Hemos usado, en primer lugar, un árbol de decisión, concretamente el DecisionStump, puesto que sólo tenemos una entrada: el porcentaje de voto. Los árboles de decisión son muy intuitivos y fáciles de comprender, además de poder mapearse directamente a código de programación a través de sentencias ifelse. A continuación mostramos la salida de Weka, al ejecutar este algoritmo: Decision Stump Classifications porcentaje_voto <= : PSOE porcentaje_voto > : PP porcentaje_voto is missing : PP Class distributions porcentaje_voto <= PP PSOE IU porcentaje_voto > PP PSOE IU porcentaje_voto is missing PP PSOE IU Figura 12. Histogramas de datos par a las distribuciones del porcentaje de voto, ganador por mesa, y porcentajes de voto por mesa para PSOE, PP, IU y RESTO. El color azul corresponde con las mesas donde gana el PP, el rojo con las que gana el PSOE y el azul claro con las que gana IU. Obteniendose los siguientes resultados: === Summary === Correctly Classified Instances % Incorrectly Classified Instances % Kappa statistic Mean absolute error Root mean squared error Relative absolute error % Root relative squared error % Total Number of Instances 5864 === Detailed Accuracy By Class === TP Rate FP Rate Precision Recall F-Measure ROC Area Class PP PSOE IU === Confusion Matrix === a b c <-- classified as a = PP b = PSOE c = IU Figura 13. Distribución de las mesas ganadoras en función del porcentaje de voto en cada una. 6

7 Vemos que tomando como entrada solamente el porcentaje de voto somos capaces de alcanzar más de un 71% de acierto. En segundo lugar hemos usado un perceptrón multicapa, con entrada porcentaje_voto y salida gana. Usando una sola capa oculta y los valores que vienen por defecto (tasa de aprendizaje=0.3, momento=0.2, etc.) hemos obtenido algo más de un 72% de acierto. Tanto en el método de DecisionStump como en el del perceptrón multicapa hemos usado cross-validation con 3 grupos como mecanismo de validación. 2.2 Distribución del voto en el municipio de Madrid Nos gustaría obtener un nivel mayor de fiabilidad para nuestro sistema, para ello vamos a centrarnos en un sólo municipio, que será Madrid (correpondiente al código 79), y usaremos un nuevo atributo de entrada a los clasificadores, el distrito. 01 Centro 02 Arganzuela 03 Retiro 04 Salamanca 05 Chamartín 06 Tetuán 07 Chamberí 08 Fuencarral-El Pardo 09 Moncloa-Aravaca 10 Latina 11 Carabanchel 12 Usera 13 Puente de Vallecas 14 Moratalaz 15 Ciudad Lineal 16 Hortaleza 17 Villaverde 18 Villa de Vallecas 19 Vicálvaro 20 San Blas 21 Barajas distrito <= 11: PP (198.0/92.0) distrito > 11: PSOE (170.0/27.0) distrito > 14: PP (142.0/35.0) distrito > 16 distrito <= 19 porcentaje_voto <= : PSOE (95.0/5.0) porcentaje_voto > distrito <= 18 distrito <= 17: PSOE (5.0/1.0) distrito > 17: PP (4.0) distrito > 18: PSOE (2.0) distrito > 19 distrito <= 20: PSOE (68.0/22.0) distrito > 20: PP (12.0/2.0) porcentaje_voto > distrito <= 16 distrito <= 13 distrito <= 11: PP (245.0/38.0) distrito > 11 distrito <= 12 porcentaje_voto <= : PP (4.0) porcentaje_voto > : PSOE (20.0/7.0) distrito > 12: PSOE (59.0/14.0) distrito > 13: PP (289.0/38.0) distrito > 16 distrito <= 19: PSOE (82.0/26.0) distrito > 19: PP (78.0/20.0) Number of Leaves : 20 Size of the tree : 39 En segundo lugar hemos probado con un clasificador de tipo perceptrón multicapa. Hemos usado algunos clasificadores de Weka. En primer lugar, árboles de decisión, J48 y LMT. En el primero alcanzamos un % de acierto y en el segundo un %. En ambos con 3 grupos para la validación cruzada y con las opciones por defecto. Adjuntamos a continuación el árbol del primer algoritmo (j48): J48 pruned tree distrito <= 9 porcentaje_voto <= porcentaje_voto <= : PSOE (44.0/15.0) porcentaje_voto > : PP (310.0/60.0) porcentaje_voto > : PP (1000.0/21.0) distrito > 9 porcentaje_voto <= porcentaje_voto <= : PSOE (363.0/48.0) porcentaje_voto > distrito <= 16 distrito <= 14 Figura 14. Estructura del perceptrón multicapa, con una capa oculta (en rojo). Todos los parámetros se han dejado a los valores por defecto, al igual que en el caso anterior. El porcentaje de acierto con este método ascendió a un %. 7

8 3. CONCLUSIONES El análisis realizado para los datos electorales dados puede ser realmente útil, primero para realizar los sondeos en elecciones posteriores sólo alli donde el resultado de los mismos puede tener cierta fiabilidad, resultando en un ahorro de costes. Por otro lado, la relación entre el porcentaje de voto (y en menor medida del distrito) con la opción ganadora en cada mesa puede ser útil para realizar valoraciones a lo largo de la jornada electoral y sobre todo justo al término de la misma, cuando el porcentaje de voto puede ser calculado directamente. Aún así no puede considerarse que los resultados obtenidos sean muy fiables, puesto que solo se han utilizado los resultados de unas elecciones (octubre de 2003), que además fueron anticipadas, debido a los sucesos que siguieron a las elecciones de mayo del mismo año. Un estudio más exhaustivo, usando datos relacionados con diferentes convocatorias electorales podría dar resultados de mayor fiabilidad y muy interesantes. 4. ANEXOS TEÓRICOS En este apartado vamos a revisar algunos conceptos teóricos relacionados con los procedimientos de minería de datos utilizados a lo largo del presente trabajo. 4.1 Anexo 1: Algoritmos de clasificación a. Árboles de decisión Los árboles de decisión son algoritmos de aprendizaje por inducción supervisada que pretenden modelar los datos de ejemplo mediante un árbol. Los nodos intermedios son los atributos de entrada de los ejemplos presentados, las ramas representan valores de dichos atributos y los nodos finales osn los valores de la clase. Para elegir qué atributos y en que orden aparecen en el árbol, se utiliza una función de evaluación llamada ganancia de información (reducción de entropía del conjunto al clasificar usando un determinado atributo). Tienen como ventaja que son fáciles de programar pues se traducen en regla if-else. Los hay que trabajan con atributos nominales únicamente, como el ID3, y que trabajan también con atributos numéricos, como el C4.5 (j48 en Weka). Ejemplo: b. Perceptrón multicapa Es un tipo de red neuronal. Las redes neuronales son una simplificación matemática bastada en el proceso estímulo/respuesta de las neuronas. Son capaces de aprender o modelar la relación existente entre sus entradas y salidas mediante la modificación de los valores de los pesos de las conexiones que unen las entradas con las neuronas y las neuronas entre sí. El modelo más simple de red neuronal es el perceptrón simple, que no tiene capas de neuronas ocultas y que mostramos en la figura. Figura 16. Estructura de perceptrón simple La relación entre entradas y salida viene dada por: siendo F la función de activación. El problema de este tipo de estructura es que sólo sirve para resolver problemas de complejidad lineal (relación lineal entre entradas y salidas), de ahí la necesidad de introducir capas de neuronas ocultas y dar lugar al perceptrón multicapa, como el que hemos usado. El problema de entrenar las neuronas de las capas ocultas para actualizar los pesos de sus conexiones se resuelve con el algoritmo de BackPropagation (retropropagación). c. Entrenamiento y validación Para que evaluar el aprendizaje se divide el conjunto de datos en dos grupos: entrenamiento y test. El primero para entrenar el modelo y el segundo para validarlo, comprobando en este último caso que el error es lo suficientemente pequeño. Suele usarse un 80% de muestras para entrenamiento y un 20% para test, y se pretende que ambos conjuntos sean capaces de representar al conjunto total de datos, de no ser así aparece el llamado error de muestreo. Para evitarlo puede usarse validación cruzada (crossvalidation): se divide el conjunto inicial de datos en N partes, se entrena/evalúa N veces, cada vez con un conjunto de test diferente y se da como error final la media de las N medidas de error. Figura 15. Ejemplo de árbol de decisión 8

9 4.2 Anexo 2: Algoritmos de agrupamiento a. k-medias Algoritmo de clasificación no supervisado, inventado por J. MacQueen en 1967, mediante el cual el espacio de patrones de entrada se divide en K clases o regiones, cada una representada por un punto llamado centroide. Dichos centros se determinan con el objetivo de minimizar las distancias euclídeas entre los patrones de entrada y el centro más cercano Los pasos para la aplicación del algoritmo son los siguientes: 1. Se inicializan aleatoriamente los centros de las K clases 2. Se asignan Ni patrones de entrada a cada clase i del siguiente modo: El patrón X(n) pertenece a la clase i si Por tanto, cada clase tendrá asociado un determinado número de patrones de entrada, aquellos más cercanos al centro de la clase. 3. Se calcula la nueva posición de los centros de las clases como la media de todos los patrones que pertenecen a su clase, es decir: 4. Se repiten los pasos 2 y 3 hasta que las nuevas posiciones de los centros no se modifiquen respecto a su posición anterior, es decir hasta que: El algoritmo EM (Expectation Maximization) empieza adivinando los parámetros de las distribuciones y los usa para calcular las probabilidades de que cada objeto pertenezca a un cluster y usa esas probabilidades para re-estimar los parámetros de las probabilidades, hasta converger (se puede empezar adivinando las probabilidades de que un objeto pertenezca a una clase). El cálculo de las probabilidades de las clases o los valores esperados de las clases es la parte de expectation. El paso de calcular los valores de los parámetros de las distribuciones, es maximization, maximar la verosimilitud de las distribuciones dados los datos. Para estimar los parámetros, tenemos que considerar que tenemos únicamente las probabilidades de pertenecer a cada cluster y no los clusters en si. Estas probabilidades actúan como pesos. PROCESO: Maximizar L(x, λ) = log(f(x, λ)) maximizando iterativamente L ( x, ˆ) λ = log f ( x, ˆ) λ Se define: Q ( λ, ˆ) λ tal que L( x, ˆ) λ = Q( λ, ˆ) λ H ( λ, ˆ λ) Pasos: 1.Elegir un modelo inicial λ 2.E-step: Calcular Q( λ, ˆ) λ 3.M-step ˆ λ arg maxq( λ, ˆ) λ ˆ λ 4.Hacer λ= ˆ λ y repetir desde el paso 2 hasta la convergencia. Como condición de parada del algoritmo suele tomarse cuando la log-verosimilitud no varía de manera significativa. Aunque EM garantiza convergencia, esta puede ser a un máximo local, por lo que se recomienda repetir el proceso varias veces. El algoritmo de K-medias es un método fácil de implementar y usar. Suele ser un algoritmo bastante eficiente en problemas de clasificación, pues converge en pocas iteraciones hacía un mínimo de la función, aunque podría tratarse de un mínimo local. Su principal inconveniente: su dependencia de los valores iniciales asignados a cada centro (mínimos locales). b. EM Es un método no supervisado de aprendizaje. Se trata de un estimador ML que maximiza la log-verosimilitud de los datos incompletos iterativamente maximizando la esperanza de la logverosimilitud de los datos completos, donde los datos completos están formados por los observables (incompletos) y los no observables. El problema es que no sabemos de qué distribución viene cada dato y no conocemos los parámetros de las distribuciones. 5. HERRAMIENTAS Para la realización de este trabajo se ha usado fundamentalmente el programa de código abierto Weka y se han programado código Java para dar formato a los ficheros de entrada a Weka, así como para calcular el resultado de las elecciones y las distancias de este resultado a las diferentes mesas. Los programas creados son: Preprocesamiento.java, Resultado.java, PorMesa.java, PorMesaGana.java y Distancias.java. Estos archivos, así como copia de diferentes salidas y gráficos de Weka se adjuntan con esta memoria. 6. REFERENCIAS [1] Apuntes de la asignatura: Inteligencia de Redes de Comunicación [2] Apuntes de la asignaturas: Tratamiento digital de señales y Redes de Neuronas. [3] Página de Weka: [4] Instituto de estadística de la comunidad de Madrid. 9

10 10

Redes de Neuronas de Base Radial

Redes de Neuronas de Base Radial Redes de Neuronas de Base Radial 1 Introducción Redes multicapa con conexiones hacia delante Única capa oculta Las neuronas ocultas poseen carácter local Cada neurona oculta se activa en una región distinta

Más detalles

Práctica 5: Clasificación con número variable de ejemplos.

Práctica 5: Clasificación con número variable de ejemplos. 5º INGENIERÍA DE TELECOMUNICACIÓN INTELIGENCIA ARTIFICIAL Y RECONOCIMIENTO DE PATRONES Práctica 5: Clasificación con número variable de ejemplos. Objetivos: Utilización de conjuntos de entrenamiento y

Más detalles

Práctica 2: Utilización de WEKA desde la línea de comandos.

Práctica 2: Utilización de WEKA desde la línea de comandos. PROGRAMA DE DOCTORADO TECNOLOGÍAS INDUSTRIALES APLICACIONES DE LA INTELIGENCIA ARTIFICIAL EN ROBÓTICA Práctica 2: Utilización de WEKA desde la línea de comandos. Objetivos: Utilización de WEKA desde la

Más detalles

Introducción. - Este estudio tiene por objeto analizar la distribución de los alumnos inscritos en los colegios e institutos de la Ciudad de Madrid.

Introducción. - Este estudio tiene por objeto analizar la distribución de los alumnos inscritos en los colegios e institutos de la Ciudad de Madrid. Introducción - Este estudio tiene por objeto analizar la distribución de los alumnos inscritos en los colegios e institutos de la Ciudad de Madrid. - Se ha realizado con los datos oficiales de la Consejería

Más detalles

DOCUMENTACIÓN Y ESTADÍSTICA EN RED. Boletín del Atlas de movilidad residencia-trabajo en la Comunidad de Madrid 2017

DOCUMENTACIÓN Y ESTADÍSTICA EN RED. Boletín del Atlas de movilidad residencia-trabajo en la Comunidad de Madrid 2017 DOCUMENTACIÓN Y ESTADÍSTICA EN RED Boletín del Atlas de movilidad residencia-trabajo en la de Madrid 207 CONSEJERÍA DE ECONOMÍA, EMPLEO Y HACIENDA Elaboración del trabajo: ARGEA CONSULTORES, S.L. Coordinación:

Más detalles

Fuentes, notas y conceptos del Capítulo 16

Fuentes, notas y conceptos del Capítulo 16 1. Resultados electorales 1.1. Resultados generales elecciones al Ayuntamiento de Madrid y Asamblea de Madrid de 22 de mayo de 2011 1.2. Resultados por Distrito en las Elecciones al Ayuntamiento de Madrid

Más detalles

ANÁLISIS DE DATOS. Jesús García Herrero

ANÁLISIS DE DATOS. Jesús García Herrero ANÁLISIS DE DATOS Jesús García Herrero ANALISIS DE DATOS EJERCICIOS Una empresa de seguros de automóviles quiere utilizar los datos sobre sus clientes para obtener reglas útiles que permita clasificar

Más detalles

PROYECTO PRESUPUESTO GENERAL AYUNTAMIENTO DE MADRID INVERSIONES FINANCIERAMENTE SOSTENIBLES

PROYECTO PRESUPUESTO GENERAL AYUNTAMIENTO DE MADRID INVERSIONES FINANCIERAMENTE SOSTENIBLES PROYECTO PRESUPUESTO GENERAL AYUNTAMIENTO DE MADRID Las Entidades Locales que tengan superávit o remanente de tesorería positivo y que no hayan sobrepasado los límites de deuda que tengan autorizados,

Más detalles

Jesús García Herrero TÉCNICAS DE REGRESIÓN NO LINEAL

Jesús García Herrero TÉCNICAS DE REGRESIÓN NO LINEAL Jesús García Herrero TÉCNICAS DE REGRESIÓN NO LINEAL En esta clase se presenta un método de inducción de modelos numéricos de regresión a partir de datos. En el tema de técnicas clásicas se presentó la

Más detalles

Reconocimiento de Patrones

Reconocimiento de Patrones Reconocimiento de Patrones Técnicas de validación (Clasificación Supervisada) Jesús Ariel Carrasco Ochoa Instituto Nacional de Astrofísica, Óptica y Electrónica Clasificación Supervisada Para qué evaluar

Más detalles

Técnicas de Minería de Datos

Técnicas de Minería de Datos Técnicas de Minería de Datos Act. Humberto Ramos S. 1 Qué es Minería de datos? El desarrollo de dispositivos tecnológicos para acumular datos a bajo costo. Acumulación o registro de gran cantidad de datos.

Más detalles

PREDICCIÓN METEOROLÓGICA

PREDICCIÓN METEOROLÓGICA PREDICCIÓN METEOROLÓGICA INTELIGENCIA EN REDES DE COMUNICACIONES INTRODUCCIÓN En esta práctica se pretende obtener un sistema real de predicción meteorológica utilizando técnicas de aprendizaje automático

Más detalles

Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Introducción al aprendizaje supervisado Profesor: Dr. Wilfrido Gómez Flores 1 Conceptos básicos Reconocimiento de patrones (RP): clasificar objetos en un número de categorías o clases.

Más detalles

Examen de Septiembre de TACCIII y TAI (Modelo 2)

Examen de Septiembre de TACCIII y TAI (Modelo 2) Examen de Septiembre de TACCIII y TAI (Modelo 2) 12 de septiembre de 2008 1. La desordenación de la base de datos puede influir en el resultado obtenido mediante a) clasificación por distancia a las medias

Más detalles

Fuentes, notas y conceptos del Capítulo 16

Fuentes, notas y conceptos del Capítulo 16 1. Resultados electorales 1.1. Resultados generales elecciones al Ayuntamiento de Madrid y Asamblea de Madrid de 27 de mayo de 2007 1.2. Resultados por Distrito en las Elecciones al Ayuntamiento de Madrid

Más detalles

Aplicación de Técnicas de Minería de Datos para la Indagación y Estudio de Resultados Electorales

Aplicación de Técnicas de Minería de Datos para la Indagación y Estudio de Resultados Electorales FIALLOS TIC S y Sociedad Aplicación de Técnicas de Minería de Datos para la Indagación y Estudio de Resultados Electorales Roberto CAMANA FIALLOS Facultad de Ingeniería en Sistemas Bolívar 20-35 y Guayaquil,

Más detalles

MASTER DE INGENIERÍA BIOMÉDICA. Métodos de ayuda al diagnóstico clínico. Tema 6: Árboles de decisión.

MASTER DE INGENIERÍA BIOMÉDICA. Métodos de ayuda al diagnóstico clínico. Tema 6: Árboles de decisión. MASTER DE INGENIERÍA BIOMÉDICA. Métodos de ayuda al diagnóstico clínico. Tema 6: Árboles de decisión. 1 Objetivos del tema Conocer en qué consiste un árbol de decisión. Aprender los problemas que pueden

Más detalles

ESTUDIO DE CORRELACIONES DE RESULTADOS FUTBOLÍSTICOS DE REAL MADRID C.de F.

ESTUDIO DE CORRELACIONES DE RESULTADOS FUTBOLÍSTICOS DE REAL MADRID C.de F. ESTUDIO DE CORRELACIONES DE RESULTADOS FUTBOLÍSTICOS DE REAL MADRID C.de F. FRANCISCO SANTOS IGLESIAS Universidad Carlos III de Madrid 100025248@alumnos.uc3m.es DANIEL ÁNGEL RODRÍGUEZ PLAZA Universidad

Más detalles

Inteligencia Artificial. Aprendizaje neuronal. Ing. Sup. en Informática, 4º. Curso académico: 2011/2012 Profesores: Ramón Hermoso y Matteo Vasirani

Inteligencia Artificial. Aprendizaje neuronal. Ing. Sup. en Informática, 4º. Curso académico: 2011/2012 Profesores: Ramón Hermoso y Matteo Vasirani Inteligencia Artificial Aprendizaje neuronal Ing. Sup. en Informática, 4º Curso académico: 20/202 Profesores: Ramón Hermoso y Matteo Vasirani Aprendizaje Resumen: 3. Aprendizaje automático 3. Introducción

Más detalles

Aprendizaje: Boosting y Adaboost

Aprendizaje: Boosting y Adaboost Técnicas de Inteligencia Artificial Aprendizaje: Boosting y Adaboost Boosting 1 Indice Combinando clasificadores débiles Clasificadores débiles La necesidad de combinar clasificadores Bagging El algoritmo

Más detalles

La Firma Electrónica en el

La Firma Electrónica en el Ayuntamiento La Firma Electrónica en el Ayuntamiento de Dirección General de Calidad y Atención al Ciudadano Subdirección General de Calidad Servicio de Protección de Datos y Administración Electrónica

Más detalles

GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC)

GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC) GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC) Curso Académico: 2015-2016 Programa: Centro: Universidad: Máster Universitario en Ingeniería Informática Escuela Politécnica Superior

Más detalles

Aprendizaje Automatizado

Aprendizaje Automatizado Aprendizaje Automatizado Aprendizaje Automatizado Programas que mejoran su comportamiento con la experiencia. Dos formas de adquirir experiencia: A partir de ejemplos suministrados por un usuario (un conjunto

Más detalles

Object Recognition as Machine Translation: Learning a Lexicon for a Fixed Image Vocabulary

Object Recognition as Machine Translation: Learning a Lexicon for a Fixed Image Vocabulary Object Recognition as Machine Translation: Learning a Lexicon for a Fixed Image Vocabulary P. Duygulu, K. Barnard, J.F.G. de Freitas, and D.A. Forsyth Dr. Enrique Sucar 1 Victor Hugo Arroyo Dominguez 1

Más detalles

TÉCNICAS DE AGRUPAMIENTO

TÉCNICAS DE AGRUPAMIENTO TÉCNICAS DE AGRUPAMIENTO José D. Martín Guerrero, Emilio Soria, Antonio J. Serrano PROCESADO Y ANÁLISIS DE DATOS AMBIENTALES Curso 2009-2010 Page 1 of 11 1. Algoritmo de las C-Medias. Algoritmos de agrupamiento

Más detalles

I Estudio sobre rentabilidad en locales. Noviembre 2017

I Estudio sobre rentabilidad en locales. Noviembre 2017 I Estudio sobre rentabilidad en locales Noviembre 2017 Existe un porcentaje muy significativo de locales cerrados en las dos principales ciudades españolas Desarrollo del estudio La Guía de Rentabilidad

Más detalles

Contabilidad Municipal de la Ciudad de Madrid

Contabilidad Municipal de la Ciudad de Madrid Contabilidad Municipal de la Ciudad de Madrid Base 2000. Serie 1998-2003 Producto Interior Bruto a precios de mercado 2003 Precios corrientes Ramas Millones 23, incluida la energía 6.819 4.513 64.787 24.241

Más detalles

Posibles trabajos HIA

Posibles trabajos HIA Posibles trabajos HIA Posibles trabajos Comparar otras herramientas de Minería de Datos con Weka Estudiar la influencia del ruido en bagging y boosting Estudiar la influencia del parámetro de poda en J48

Más detalles

RECONOCIMIENTO DE PAUTAS

RECONOCIMIENTO DE PAUTAS RECONOCIMIENTO DE PAUTAS ANÁLISIS DISCRIMINANTE (Discriminant analysis) Reconocimiento de pautas supervisado si se cuenta con objetos cuya pertenencia a un grupo es conocida métodos: análisis de discriminantes

Más detalles

Técnicas de aprendizaje sobre series temporales

Técnicas de aprendizaje sobre series temporales Técnicas de aprendizaje sobre series temporales Contenido 1. Motivación. 2. Ejemplo del Problema. 3. Aproximaciones al problema de clasificación de series temporales. 4. Aprendizaje de reglas. 5. Boosting

Más detalles

Práctica 1: Entorno WEKA de aprendizaje automático y data mining.

Práctica 1: Entorno WEKA de aprendizaje automático y data mining. PROGRAMA DE DOCTORADO TECNOLOGÍAS INDUSTRIALES APLICACIONES DE LA INTELIGENCIA ARTIFICIAL EN ROBÓTICA Práctica 1: Entorno WEKA de aprendizaje automático y data mining. Objetivos: Utilización de funciones

Más detalles

MINI GUIA DE PROYECTOS - PRESUPUESTOS PARTICIPATIVOS - CUESTIONARIO DE VIABILIDAD - SUBE EL PROYECTO A DECIDE MADRID

MINI GUIA DE PROYECTOS - PRESUPUESTOS PARTICIPATIVOS - CUESTIONARIO DE VIABILIDAD - SUBE EL PROYECTO A DECIDE MADRID MINI GUIA DE PROYECTOS - PRESUPUESTOS PARTICIPATIVOS - CUESTIONARIO DE VIABILIDAD - SUBE EL PROYECTO A DECIDE MADRID decide.madrid.es/sitesientesgato PRESUPUESTOS PARTICIPATIVOS CUESTIONARIO DE VIABILIDAD

Más detalles

5. Cooperación al desarrollo 5.1. Proyectos de Cooperación al Desarrollo subvencionados por áreas geográficas

5. Cooperación al desarrollo 5.1. Proyectos de Cooperación al Desarrollo subvencionados por áreas geográficas 1. Atención en los Servicios Generales 1.1. Personas atendidas en la Unidad de Primera Atención en los Centros de Servicios Sociales 1.2. Prestaciones sociales de carácter económico por Distrito según

Más detalles

Previsión de Demanda de Vivienda Nueva hasta 2028

Previsión de Demanda de Vivienda Nueva hasta 2028 Previsión de Demanda de Vivienda Nueva hasta 2028 Nueve mayores Áreas Metropolitanas de España XXII SIMPOSIO ANUAL DEL CIF Prof. José Luis Suárez 20 de mayo de 2015 suarez@iese.edu 1 Oferta y demanda de

Más detalles

1. Evolución de la población 1.1. Evolución de la Población. Operaciones censales 1.2. Evolución de la Población por Distrito

1. Evolución de la población 1.1. Evolución de la Población. Operaciones censales 1.2. Evolución de la Población por Distrito 1. Evolución de la población 1.1. Evolución de la Población. Operaciones censales 1.2. Evolución de la Población por Distrito 2. Movimiento Natural de la Población 2.1. Nacimientos, Defunciones y Matrimonios.

Más detalles

Inteligencia en Redes de Comunicaciones

Inteligencia en Redes de Comunicaciones Inteligencia en Redes de Comunicaciones Autores: -Daniel Pérez Vaquero. -Javier García Lloreda. Fecha: -17 de Diciembre de 2013. 1. Introducción Al Clustering. El clustering no es más que el agrupamiento

Más detalles

Guía para invertir en Madrid en el sector inmobiliario

Guía para invertir en Madrid en el sector inmobiliario Guía para invertir en Madrid en el sector inmobiliario Ahora las grandes oportunidades de inversión en el sector inmobiliario, ya no son solo para grandes players Guía para invertir en Madrid en el sector

Más detalles

Análisis de Datos. Validación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Validación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Validación de clasificadores Profesor: Dr. Wilfrido Gómez Flores 1 Introducción La mayoría de los clasificadores que se han visto requieren de uno o más parámetros definidos libremente,

Más detalles

Métodos de Inteligencia Artificial

Métodos de Inteligencia Artificial Métodos de Inteligencia Artificial L. Enrique Sucar (INAOE) esucar@inaoep.mx ccc.inaoep.mx/esucar Tecnologías de Información UPAEP Agentes que Aprenden: Clasificador Bayesiano Clasificación Clasificador

Más detalles

ARBOLES DE DECISION. Miguel Cárdenas-Montes. 1 Introducción. Objetivos: Entender como funcionan los algoritmos basados en árboles de decisión.

ARBOLES DE DECISION. Miguel Cárdenas-Montes. 1 Introducción. Objetivos: Entender como funcionan los algoritmos basados en árboles de decisión. ARBOLES DE DECISION Miguel Cárdenas-Montes Los árboles de decisión son estructuras lógicas con amplia utilización en la toma de decisión, la predicción y la minería de datos. Objetivos: Entender como funcionan

Más detalles

Redes Neuronales Artificiales

Redes Neuronales Artificiales Algoritmo de retropropagación Back propagation Es utilizado para entrenar redes neuronales multicapa. Exige que la función de activación de las neuronas sea derivable y creciente. Las funciones comúnmente

Más detalles

ANALISIS DE CLUSTER CON SPSS: INMACULADA BARRERA

ANALISIS DE CLUSTER CON SPSS: INMACULADA BARRERA ANALISIS DE CLUSTER CON SPSS: INMACULADA BARRERA ANALISIS DE CLUSTER EN SPSS Opción: Analizar Clasificar ANALISIS DE CLUSTER EN SPSS Tres posibles OPCIONES 1.- Cluster en dos etapas 2.- K-means 3.- Jerárquicos

Más detalles

GLOSARIO ESTADÍSTICO. Fuente: Murray R. Spiegel, Estadística, McGraw Hill.

GLOSARIO ESTADÍSTICO. Fuente: Murray R. Spiegel, Estadística, McGraw Hill. GLOSARIO ESTADÍSTICO Fuente: Murray R. Spiegel, Estadística, McGraw Hill. CONCEPTOS Y DEFINICIONES ESPECIALES Es el estudio científico de los métodos para recoger, organizar, resumir y analizar los datos

Más detalles

LAS AREAS INDUSTRIALES DEL PLAN GENERAL DE MADRID 3.- LOCALIZACIÓN Y TIPOLOGÍA DE LAS AREAS DE ACTIVIDAD ECONOMICA DE MADRID... 9

LAS AREAS INDUSTRIALES DEL PLAN GENERAL DE MADRID 3.- LOCALIZACIÓN Y TIPOLOGÍA DE LAS AREAS DE ACTIVIDAD ECONOMICA DE MADRID... 9 Fuencarral - El Pardo Hortaleza Barajas Tetuán Chamartín Chamberí Moncloa - Aravaca Salamanca San Blas Ciudad Lineal Centro Retiro Moratalaz Arganzuela Vicálvaro Latina Carabanchel Puente Vallecas Usera

Más detalles

BOLETÍN EPIDEMIOLÓGICO de la Comunidad de Madrid

BOLETÍN EPIDEMIOLÓGICO de la Comunidad de Madrid BOLETÍN EPIDEMIOLÓGICO de la Comunidad de Madrid 4. INFORMES: - Mortalidad por enfermedades cardiovasculares en la Comunidad de Madrid, años 1980 2000. - - Vigilancia de las Encefalopatías Espongiformes

Más detalles

La modernización digital en el Ayuntamiento de Madrid. José Miguel González Aguilera Consejero técnico 25 de abril de 2017

La modernización digital en el Ayuntamiento de Madrid. José Miguel González Aguilera Consejero técnico 25 de abril de 2017 La modernización digital en el Ayuntamiento de Madrid José Miguel González Aguilera Consejero técnico 25 de abril de 2017 2 165.00 0 Operaciones mensuales en la carpeta del ciudadano 57.00 inspecciones

Más detalles

Automatización de la Evaluación del Impacto Social en Proyectos de Inversión Publica

Automatización de la Evaluación del Impacto Social en Proyectos de Inversión Publica Automatización de la Evaluación del Impacto Social en Proyectos de Inversión Publica Ronald René Vergara Pareja 1 Agenda Objetivo de la Investigación. Situación Actual de los Proyectos de Inversión Publica.

Más detalles

PROYECTO PRESUPUESTO GENERAL AYUNTAMIENTO DE MADRID. Madrid, la ciudad que quieres

PROYECTO PRESUPUESTO GENERAL AYUNTAMIENTO DE MADRID. Madrid, la ciudad que quieres PROYECTO PRESUPUESTO GENERAL AYUNTAMIENTO DE MADRID Madrid, la ciudad que quieres PROYECTO PRESUPUESTO GENERAL 2016 CIUDAD DE MADRID La ciudad que quieres, será la ciudad que quieras. Un presupuesto que

Más detalles

REDES NEURONALES ADAPTABLES

REDES NEURONALES ADAPTABLES REDES NEURONALES ADAPTABLES Unidad 3: Redes neuronales artificiales y modelos de entrenamiento SubTemas 3.2 Perceptron simple Arquitectura Regla delta Multi Layer Perceptrón 3.3 Redes Neuronales Adaptables

Más detalles

S CONSULTA 11 DE MAYO IU- MADRID Ciempozuelos SAN MARTIN DE LA VEGA Travesía Antonio de oro, 5 local colegio CIEMPOZUELOS ARANJUEZ CIEMPOZUELOS Las Rozas C/Mar negro, 1 Colegio LAS ROZAS VILLANUEVA DEL

Más detalles

Intervalos de confianza con STATGRAPHICS

Intervalos de confianza con STATGRAPHICS Intervalos de confianza con STATGRAPHICS Ficheros empleados: TiempoaccesoWeb.sf3 ; TiempoBucle.sf3; 1. Ejemplo 1: Tiempo de acceso a una página Web Se desean construir intervalos de confianza para la media

Más detalles

Clustering. Departamento de Ingeniería Informática y de Sistemas Universidad de La Laguna

Clustering. Departamento de Ingeniería Informática y de Sistemas Universidad de La Laguna Clustering Christopher Expósito Izquierdo Airam Expósito Márquez Israel López Plata Belén Melián Batista J. Marcos Moreno Vega {cexposit, aexposim, ilopezpl, mbmelian, jmmoreno}@ull.edu.es Departamento

Más detalles

Estudio del Mercado Secundario de la Vivienda para Venta en Madrid capital

Estudio del Mercado Secundario de la Vivienda para Venta en Madrid capital Estudio del Mercado Secundario de la Vivienda para Venta en Madrid capital Elaborado por el Departamento de Estudios Inmobiliarios de Euroval Febrero 2006 www.euroval.com ÍNDICE 0. Finalidad y Metodología

Más detalles

INVERSIONES EN EQUIPAMIENTOS DEPORTIVOS MUNICIPALES 2016 AYUNTAMIENTO DE MADRID

INVERSIONES EN EQUIPAMIENTOS DEPORTIVOS MUNICIPALES 2016 AYUNTAMIENTO DE MADRID INVERSIONES EN EQUIPAMIENTOS DEPORTIVOS MUNICIPALES 2016 AYUNTAMIENTO DE MADRID Centro gestor Distrito Descripción Proyecto Importe CULTURA Y DEPORTES LATINA CENTRO DEPORTIVO GALLUR. RENOVACIÓN PAVIMENTO

Más detalles

2.- Tablas de frecuencias

2.- Tablas de frecuencias º BACHILLERATO MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES II TEMA 3.- ESTADÍSTICA DESCRIPTIVA PROFESOR: RAFAEL NÚÑEZ -----------------------------------------------------------------------------------------------------------------------------------------------------------------

Más detalles

REPASO DE ESTADÍSTICA DESCRIPTIVA

REPASO DE ESTADÍSTICA DESCRIPTIVA ÍNDICE: 1.- Tipos de variables 2.- Tablas de frecuencias 3.- Gráficos estadísticos 4.- Medidas de centralización 5.- Medidas de dispersión REPASO DE ESTADÍSTICA DESCRIPTIVA 1.- Tipos de variables La estadística

Más detalles

El Algoritmo E-M. José Antonio Camarena Ibarrola

El Algoritmo E-M. José Antonio Camarena Ibarrola El Algoritmo E-M José Antonio Camarena Ibarrola Introducción Método para encontrar una estimación de máima verosimilitud para un parámetro ѳ de una distribución Ejemplo simple 24 Si tiene las temperaturas

Más detalles

Apuntes de Inteligencia Artificial

Apuntes de Inteligencia Artificial PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR FACULTAD DE INGENIERÍA Apuntes de Inteligencia Artificial Laboratorio: Perceptrón Simple JORGE AGUILAR JARAMILLO LABORATORIO : NEURONA Y PERCEPTRON SIMPPLE Objetivos.

Más detalles

Inteligencia en Redes de Comunicaciones - 06 Aprendizaje

Inteligencia en Redes de Comunicaciones - 06 Aprendizaje El objetivo de este tema es realizar una introducción a los conceptos, fundamentos y técnicas básicas de aprendizaje computacional. En primer lugar se formalizará el concepto de aprendizaje y se describirán

Más detalles

Estudio del problema del matrimonio estable en un entorno multiagente

Estudio del problema del matrimonio estable en un entorno multiagente Estudio del problema del matrimonio estable en un entorno multiagente Estudiante: Alberto Hueso Alonso Grado Ingeniería Informática Especialidad Computación Inteligencia Artificial Consultor: David Isern

Más detalles

Análisis de Clúster con SPSS. Método de las K-Medias

Análisis de Clúster con SPSS. Método de las K-Medias Análisis de Clúster con SPSS. Método de las K-Medias El análisis de cluster es un tipo de clasificación de datos que se lleva a cabo mediante la agrupación de los elementos analizados. El objetivo fundamental

Más detalles

Tema: Aprendizaje Supervisado.

Tema: Aprendizaje Supervisado. Sistemas Expertos e Inteligencia Artificial. Guía No. 9 1 Tema: Aprendizaje Supervisado. Facultad: Ingeniería Escuela: Computación Asignatura: Sistemas Expertos e Inteligencia Artificial Objetivos Específicos

Más detalles

ANEXO II PARTICIPANTES EN LOS GRUPOS DE TRABAJO Y COMITÉ ORGANIZADOR DE LAS JORNADAS

ANEXO II PARTICIPANTES EN LOS GRUPOS DE TRABAJO Y COMITÉ ORGANIZADOR DE LAS JORNADAS ANEXO II PARTICIPANTES EN LOS GRUPOS DE TRABAJO Y COMITÉ ORGANIZADOR DE LAS JORNADAS 257 2.1. PARTICIPANTES EN LOS GRUPOS DE TRABAJO PREVIOS A LAS JORNADAS (JUNTAS MUNICIPALES DE DISTRITO) Encarna Albalat

Más detalles

Consumo de alimentos y factores de riesgo asociados en la Ciudad de Madrid

Consumo de alimentos y factores de riesgo asociados en la Ciudad de Madrid Consumo de alimentos y factores de riesgo asociados en la Ciudad de Madrid (Fuente: Encuesta de salud de la Ciudad de Madrid 2006.) El presente trabajo tiene como objetivo describir la situación en los

Más detalles

S XI ASAMBLEA DE IU FEDERAL 29 DE MAYO IU- MADRID Ciempozuelos SAN MARTIN DE LA VEGA Travesía Antonio de oro, 5 local colegio CIEMPOZUELOS ARANJUEZ CIEMPOZUELOS Las Rozas C/Mar negro, 1 Colegio LAS ROZAS

Más detalles

Pilar Serrano Garijo DGMAS. Ayuntamiento de Madrid

Pilar Serrano Garijo DGMAS. Ayuntamiento de Madrid Pilar Serrano Garijo DGMAS. Ayuntamiento de Madrid Programa de Apoyo a los Mayores Vulnerables con Especial Referencia al Aislamiento y el Maltrato Objetivo General: Evitar las situaciones de vulnerabilidad

Más detalles

Aprendizaje Automatizado. Árboles de Clasificación

Aprendizaje Automatizado. Árboles de Clasificación Aprendizaje Automatizado Árboles de Clasificación Árboles de Clasificación Estudiaremos un algoritmo para la creación del árbol. Selección de atributos comenzando en el nodo raíz. Proceso recursivo. Árboles

Más detalles

Simulación de Redes Neuronales Artificiales: Una Herramienta para la Docencia en Castellano

Simulación de Redes Neuronales Artificiales: Una Herramienta para la Docencia en Castellano Simulación de Redes Neuronales Artificiales: Una Herramienta para la Docencia en Castellano Anita Alegre López 1, Sonia Mariño 1, David La Red 1 1 Dpto. Informática. Universidad Nacional del Nordeste.

Más detalles

Métricas para la validación de Clustering

Métricas para la validación de Clustering Métricas para la validación de Clustering MINERIA DE DATOS Elizabeth León Guzmán, Profesor Asociado Universidad Nacional de Colombia Ingeniería de Sistemas y Computación Contenido Introducción Tipos de

Más detalles

ESTUDIO SOBRE CONSUMO DE DROGAS EN JOVENES Y ADOLESCENTES

ESTUDIO SOBRE CONSUMO DE DROGAS EN JOVENES Y ADOLESCENTES ESTUDIO SOBRE CONSUMO DE DROGAS EN JOVENES Y ADOLESCENTES FASES DEL ESTUDIO Y METODOLOGIA DE TRABAJO Fase 1: Factores de riesgo y protección del consumo de drogas entre los jóvenes Fase 2: Percepciones

Más detalles

Aprendizaje inductivo

Aprendizaje inductivo Inteligencia Artificial Aprendizaje inductivo Ing. Sup. en Informática, 4º Curso académico: 2011/2012 Profesores: Ramón Hermoso y Matteo Vasirani Aprendizaje Resumen: 3. Aprendizaje automático 3.1 Introducción

Más detalles

ESTADISTICA Y PROBABILIDAD ESTADÍSTICA

ESTADISTICA Y PROBABILIDAD ESTADÍSTICA ESTADÍSTICA La estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comprobaciones y sacar conclusiones. Un estudio estadístico consta

Más detalles

INFORME TAREA N 4 CLUSTERING

INFORME TAREA N 4 CLUSTERING Universidad de Chile Facultad de Ciencias Físicas y Matemáticas Departamento de Ingeniería Eléctrica EL4106 Inteligencia Computacional INFORME TAREA N 4 CLUSTERING Nombre Alumno : Profesor : Profesor Auxiliar

Más detalles

Día del deporte municipal

Día del deporte municipal Día del deporte municipal Jornada de puertas abiertas y entrada libre a los Centros Deportivos Municipales Actividades extraordinarias con motivo del Día del Deporte y la Semana Europea del Deporte * Confirmar

Más detalles

Estadística y sus aplicaciones en Ciencias Sociales 5. Estimación. Facultad de Ciencias Sociales, UdelaR

Estadística y sus aplicaciones en Ciencias Sociales 5. Estimación. Facultad de Ciencias Sociales, UdelaR Estadística y sus aplicaciones en Ciencias Sociales 5. Estimación Facultad de Ciencias Sociales, UdelaR Índice 1. Repaso: estimadores y estimaciones. Propiedades de los estimadores. 2. Estimación puntual.

Más detalles

Determinantes sociales de las enfermedades crónicas y estrategias de abordaje desde la promoción de la salud: La experiencia de Madrid Salud

Determinantes sociales de las enfermedades crónicas y estrategias de abordaje desde la promoción de la salud: La experiencia de Madrid Salud Determinantes sociales de las enfermedades crónicas y estrategias de abordaje desde la promoción de la salud: La experiencia de Madrid Salud Javier Segura del Pozo Situación de salud en Madrid Están fuertemente

Más detalles

I Estudio comparativo sobre alquiler turístico vs residencial

I Estudio comparativo sobre alquiler turístico vs residencial I Estudio comparativo sobre alquiler turístico vs residencial JUNIO 2017 Factores como la ocupación, la rotación y el precio, son determinantes para conocer si la rentabilidad es más alta en una vivienda

Más detalles

CONCLUSIONES. La teoría de Redes Neuronales Artificiales, presenta grandes ventajas con

CONCLUSIONES. La teoría de Redes Neuronales Artificiales, presenta grandes ventajas con 319 CONCLUSIONES La teoría de Redes Neuronales Artificiales, presenta grandes ventajas con respecto a otros modelos típicos de solución de problemas de Ingeniería, una de ellas es su inspiración en modelos

Más detalles

Prof. Angel Zambrano ENERO 2009 Universidad de Los Andes Escuela de Estadística

Prof. Angel Zambrano ENERO 2009 Universidad de Los Andes Escuela de Estadística Prof. Angel Zambrano ENERO 009 Universidad de Los Andes Escuela de Estadística Muestreo: Es una metodología que apoyándose en la teoría estadística y de acuerdo a las características del estudio, indica

Más detalles

PRIMER SEMESTRE. Informe Semestral de la evolución del precio de las viviendas ubicadas en el Distrito 01 de Madrid, Centro MADRID. Centro Distrito 01

PRIMER SEMESTRE. Informe Semestral de la evolución del precio de las viviendas ubicadas en el Distrito 01 de Madrid, Centro MADRID. Centro Distrito 01 PRIMER SEMESTRE 2016 Informe Semestral de la evolución del precio de las viviendas ubicadas en el Distrito 01 de Madrid, Centro MADRID Centro Distrito 01 Índice 1. Información básica de la provincia y

Más detalles

Experimentos Introducción

Experimentos Introducción Capítulo 5 Experimentos 5.1. Introducción En este capítulo se describirán los desarrollos y resultados de los experimentos realizados con el sistema de reconocimiento de voz presentado en este proyecto.

Más detalles

Predicción meteorológica

Predicción meteorológica Predicción meteorológica Trabajo hecho por: Roberto García Sanchez Pablo Casas Muñoz Qué es WEKA? Acrónimo de Waikate Environment for Knowledge Analisis Es un entorno para experimentación de análisis de

Más detalles

Análisis de Datos. Combinación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Combinación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Combinación de clasificadores Profesor: Dr. Wilfrido Gómez Flores 1 Introducción Diversos algoritmos de clasificación están limitados a resolver problemas binarios, es decir, con dos

Más detalles

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 11 -

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 11 - Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos - Sesión 11 - Juan Alfonso Lara Torralbo 1 Índice de contenidos Actividad. Resolución manual de clasificación bayesiana

Más detalles

NEWTON TREES. Árboles de Estimación Estocástica de Probabilidades:

NEWTON TREES. Árboles de Estimación Estocástica de Probabilidades: Tesis de Máster en Ingeniería del Software, Métodos Formales y Sistemas de Información Árboles de Estimación Estocástica de Probabilidades: NEWTON TREES Autor: Fernando Martínez Plumed 1 Directores: Cèsar

Más detalles

Redes neuronales con funciones de base radial

Redes neuronales con funciones de base radial Redes neuronales con funciones de base radial Diego Milone y Leonardo Rufiner Inteligencia Computacional Departamento de Informática FICH-UNL Organización: RBF-NN Motivación y orígenes RBF Arquitectura

Más detalles

La contratación electrónica en el Ayuntamiento de Madrid

La contratación electrónica en el Ayuntamiento de Madrid Área de Gobierno de Hacienda y Administración Pública La contratación electrónica en el Antonio López-Fuensalida 6 de junio de 2007 Marco general de actuación Proceso de transformación y modernización

Más detalles

Raquel del Río Machín Área de Gobierno de Desarrollo Urbano Sostenible Ayuntamiento de Madrid. 27 de septiembre de 2017

Raquel del Río Machín Área de Gobierno de Desarrollo Urbano Sostenible Ayuntamiento de Madrid. 27 de septiembre de 2017 Raquel del Río Machín Área de Gobierno de Desarrollo Urbano Sostenible Ayuntamiento de Madrid 27 de septiembre de 2017 NUEVO MODELO ANÁLISIS MARCO ANTERIOR Fracaso del modelo extensivo Fin del crecimiento

Más detalles

Primero se inicializan dos puntos (tantos como clusters queremos) al azar. Estos puntos se denominan centroides del cluster.

Primero se inicializan dos puntos (tantos como clusters queremos) al azar. Estos puntos se denominan centroides del cluster. K-Means Introducción El algoritmo k-means es el algoritmo de clustering más popular y ampliamente utilizado. Algoritmo Supongamos que queremos agrupar los siguientes datos en dos clusters Primero se inicializan

Más detalles

NÚMERO DE PUESTOS Y RETRIBUCIONES DE LOS ÓRGANOS DIRECTIVOS DEL AYUNTAMIENTO DE MADRID Y DE SUS ORGANISMOS AUTÓNOMOS.

NÚMERO DE PUESTOS Y RETRIBUCIONES DE LOS ÓRGANOS DIRECTIVOS DEL AYUNTAMIENTO DE MADRID Y DE SUS ORGANISMOS AUTÓNOMOS. NÚMERO DE PUESTOS Y RETRIBUCIONES DE LOS ÓRGANOS DIRECTIVOS DEL AYUNTAMIENTO DE MADRID Y DE SUS ORGANISMOS AUTÓNOMOS. Actualizado a 4 de mayo de 2016 La Ley 22/2006, de 4 de julio, de Capitalidad y Régimen

Más detalles

DEPORTE INFANTIL 2012. XXXI Juegos Deportivos Municipales de Karate ZONA - 1 (AREAS 1/2 CONJUNTAS AREAS 3/4 CONJUNTAS) (MADRID, VILLA) KATAS Y KUMITE

DEPORTE INFANTIL 2012. XXXI Juegos Deportivos Municipales de Karate ZONA - 1 (AREAS 1/2 CONJUNTAS AREAS 3/4 CONJUNTAS) (MADRID, VILLA) KATAS Y KUMITE 1 www.fmkarate.com C/ Alberche Nº 21 Tel. 91 5018144 Fax: 91 5522878 Madrid - 28007 DEPORTE INFANTIL 2012 DIRECCION GENERAL DE DEPORTES COMUNIDAD DE MADRID KARATE 2012 La Dirección General de Deportes

Más detalles

1.-DATOS DE LA ASIGNATURA

1.-DATOS DE LA ASIGNATURA 1.-DATOS DE LA ASIGNATURA Nombre de la asignatura: Minería de Datos Carrera: Ingeniería en Sistemas Computacionales Clave de la asignatura: ADM-0701 Horas teoría-horas práctica-créditos: 3-2-8 2.-HISTORIA

Más detalles

TECNOLOGÍAS INTELIGENTES PARA EXPLOTACIÓN DE INFORMACIÓN

TECNOLOGÍAS INTELIGENTES PARA EXPLOTACIÓN DE INFORMACIÓN TECNOLOGÍAS INTELIGENTES PARA EXPLOTACIÓN DE INFORMACIÓN FUNDAMENTOS CURSO DE DOCTORADO Dr. Ramón García-Martínez * * * CONTEXTO La inteligencia de negocio propone un abordaje interdisciplinario que tomando:

Más detalles

Contabilidad Municipal de la Ciudad de Madrid

Contabilidad Municipal de la Ciudad de Madrid Contabilidad Municipal de la Ciudad de Madrid Base 2002. Serie 2005-2010(1ªe) Producto Interior Bruto a precios de mercado 2010(1ªe) Precios corrientes Ramas Millones de 105 8.422 7.234 Hosteleria, Transp.y

Más detalles

Inteligencia en Redes de Comunicaciones. Aprendizaje. Raquel M. Crespo García Julio Villena Román. {rcrespo,

Inteligencia en Redes de Comunicaciones. Aprendizaje. Raquel M. Crespo García Julio Villena Román. {rcrespo, Inteligencia en Redes de Comunicaciones Aprendizaje Raquel M. Crespo García Julio Villena Román {rcrespo, jvillena}@it.uc3m.es Objetivo El objetivo es dotar a los sistemas de inteligencia artificial con

Más detalles

Mapa de la Psicología Clínica en el Servicio Madrileño de Salud de la Consejería de Sanidad de la Comunidad de Madrid

Mapa de la Psicología Clínica en el Servicio Madrileño de Salud de la Consejería de Sanidad de la Comunidad de Madrid Mapa de la Psicología Clínica en el Servicio Madrileño de Salud de la Consejería de Sanidad de la Comunidad de Madrid MAPA DE LA PSICOLOGÍA CLÍNICA EN EL SERVICIO MADRILEÑO DE SALUD (SERMAS) 325 profesionales

Más detalles

III. Equilibrio territorial

III. Equilibrio territorial III. Equilibrio territorial Población escolar por distritos La Ciudad de Madrid concentra el 46% de la población escolar de Infantil, Primaria y Secundaria de la región Recién estrenado el curso escolar,

Más detalles

FICHEROS Y BASES DE DATOS (E44) 3º INGENIERÍA EN INFORMÁTICA. Tema 4. Técnicas de Dispersión. Definición y Manejo.

FICHEROS Y BASES DE DATOS (E44) 3º INGENIERÍA EN INFORMÁTICA. Tema 4. Técnicas de Dispersión. Definición y Manejo. FICHEROS Y BASES DE DATOS (E44) 3º INGENIERÍA EN INFORMÁTICA Tema 4. Técnicas de Dispersión. Definición y Manejo. 1.- Introducción. 2.- Funciones de Dispersión. 3.- Saturación Progresiva. 4.- Empaquetado

Más detalles

ANÁLISIS DE CONGLOMERADOS (CLUSTER ANALYSIS)

ANÁLISIS DE CONGLOMERADOS (CLUSTER ANALYSIS) ANÁLISIS DE CONGLOMERADOS (CLUSTER ANALYSIS) AGRUPAMIENTOS Cuál agrupamiento es mejor? MÉTODOS DE AGRUPACIÓN Métodos jerárquicos: Los objetos se agrupan (dividen) i por partes hasta clasificar todos los

Más detalles

Introducción. Autoencoders. RBMs. Redes de Convolución. Deep Learning. Eduardo Morales INAOE (INAOE) 1 / 60

Introducción. Autoencoders. RBMs. Redes de Convolución. Deep Learning. Eduardo Morales INAOE (INAOE) 1 / 60 Deep Learning Eduardo Morales INAOE (INAOE) 1 / 60 Contenido 1 2 3 4 (INAOE) 2 / 60 Deep Learning El poder tener una computadora que modele el mundo lo suficientemente bien como para exhibir inteligencia

Más detalles