ANÁLISIS DE CONGLOMERADOS (CLUSTER ANALYSIS)

Tamaño: px
Comenzar la demostración a partir de la página:

Download "ANÁLISIS DE CONGLOMERADOS (CLUSTER ANALYSIS)"

Transcripción

1 ANÁLISIS DE CONGLOMERADOS (CLUSTER ANALYSIS)

2 AGRUPAMIENTOS

3 Cuál agrupamiento es mejor?

4 MÉTODOS DE AGRUPACIÓN Métodos jerárquicos: Los objetos se agrupan (dividen) i por partes hasta clasificar todos los objetos. No requiere fijar un número de clústeres o grupos (menos supervisado). Métodos de capa única: Se tiene un número de grupos predefinidos y cada objeto se ubica en un grupo hasta alcanzar estabilidad en los valores de los centroides. Requiere, generalmente, fijar a priori un número de clústeres.

5 MÉTODOS JERÁRQUICOS V i niveles Varios i l d de agrupamiento i t D d Dendograma

6 Métodos aglomerativos Esquema general algoritmo: 1. Cada objeto corresponde a un grupo. 2. En cada iteración se juntan los dos grupos más cercanos bajo algún criterio de cercanía entre grupos. 3. Los dos grupos recién unidos forman un único grupo. 4. Iterar hasta formar un único grupo. El método jerárquico aglomerativo más utilizado es el de Ward, por el nombre de su autor.

7 Método de Ward Este procedimiento trata de identificar grupos de casos, tratando de minimizar la varianza dentro de los grupos. Se minimiza la distancia euclideana cuadrada a las medias del conglomerado o grupo.

8 Dendogramas Un dendograma es un árbol en el que el largo delas ramas está asociado inversamente a la fortaleza de la relación.

9 Métodos divisivos Esquema general algoritmo: 1. Todos los objetos corresponde a un grupo. 2. Cada grupo se separa bajo algún maximización de varianza entre grupos. criterio i de 3. Dividir cada uno de los grupos hasta que: Todos los grupos sean tan homogéneos que no vale la pena seguir dividiendo. Los grupos son tan pequeños que no vale la pena seguir dividiendo.

10 Métodos de una sola capa o particionales Algoritmos iterativos: en cada iteración ubican a los objetos en el grupo más cercano a él, de acuerdo con los valores de los centroides.

11 [idx,ctrs] = kmeans(x,2,... 'Distance','city ); La función kmeans trata a cada observación como un objeto localizado en el espacio. Se pueden escoger cinco medidas de distancia. Cada clúster es definido por sus miembros y por su centroide. El centroide es aquel que minimiza la suma de las desviaciones desde cualquier punto del grupo a ese punto central. La función kmeans minimiza una función diferente dependiendo de la medida de distancia que se utilice. Se pueden controlar los detalles de la minimización como incluir los valores iniciales de los centroides o el máximo número de iteraciones.

12 MEDIDAS DE DISTANCIA EN MATLAB ENTRE OBJETOS (PDIST(X))

13 Ejemplos usando Rattle y Matlab Tiempo_fac Gasto Horas ocio 36 min $ horas Tamaños de clústeres: [1] " Suma de cuadrados en clúster: [1] Medida de distancia: Euclidiana Clúster Tiempo Gasto Horas ocio Medida de distancia: City block Clúster Tiempo Gasto Horas ocio

14 Ejemplo usando Rattle

15 Ejemplos creando dos grupos Tiempo_fac Gasto Horas ocio 36 min $ horas Medida de distancia: Euclidiana Clúster Tiempo_fac Gasto Horas.ocio Tamaños de clústers: [1] "8 18 Suma de cuadrados en clúster: [1]

16 Ejemplo usando Weka

17 Agrupamiento probabilista bili Función gmdistribution en Matlab: funciones normales

18 Comparación de agrupamientos con los lirios, usando una interfaz de Matlab Clustering sustractivo Fuzzy C-means findcluster('iris.dat')

19 Interpretar y elaborar un perfil de cada grupo Debe buscarse una semántica que diferencie a los objetos de cada grupo. Enfoques complementarios: Análisis y comparación de los centroides de cada grupo. Análisis gráfico para determinar la variables que marcan diferencias significativas.

20 EVALUACIÓN VISUAL DE AGRUPAMIENTOS Datos originales K-medias Probabilístico EM

Sistemas Inteligentes. Tema B2T4: Aprendizaje no supervisado: algoritmo k-medias.

Sistemas Inteligentes. Tema B2T4: Aprendizaje no supervisado: algoritmo k-medias. Sistemas Inteligentes Escuela Técnica Superior de Informática Universitat Politècnica de València Tema B2T4: Aprendizaje no supervisado: algoritmo k-medias. Índice 1 Introducción 1 2 Agrupamientos particionales

Más detalles

Máster en Ordenación y Gestión del Desarrollo Territorial y Local. Módulo I MÉTODO Y TÉCNICAS ESTADÍSTICAS PARA EL DESARROLLO TERRITORIAL Y LOCAL

Máster en Ordenación y Gestión del Desarrollo Territorial y Local. Módulo I MÉTODO Y TÉCNICAS ESTADÍSTICAS PARA EL DESARROLLO TERRITORIAL Y LOCAL ANÁLISIS CLUSTERS C U R S O TÉCNICAS MULTIVARIANTES Prof. Dr. Ángel Luís LUCENDO MONEDERO 1 http://www.geografia.us.es/ Tema 2. INTRODUCCIÓN N AL ANÁLISIS CLUSTER 2.1 Consideraciones generales. Clasificación

Más detalles

Tema 3: Análisis multivariante para la agrupación. Objetivo: Encontrar los grupos naturales en los que se divide la población.

Tema 3: Análisis multivariante para la agrupación. Objetivo: Encontrar los grupos naturales en los que se divide la población. Tema 3: Análisis multivariante para la agrupación Objetivo: Encontrar los grupos naturales en los que se divide la población. Ejemplo canónico en Biologia: Taxonomía Rosa doméstica Reino: Plantae (Plantas)

Más detalles

Clasificación Jerárquica Ascendente Presentación #1. [ U n a i n t r o d u c c i ó n ]

Clasificación Jerárquica Ascendente Presentación #1. [ U n a i n t r o d u c c i ó n ] Clasificación Jerárquica Ascendente Presentación #1 [ U n a i n t r o d u c c i ó n ] Clasificación Jerárquica Clasificación Automática La clasificación automática tiene por objetivo reconocer grupos de

Más detalles

Análisis de Conglomerados

Análisis de Conglomerados Análisis de Conglomerados Resumen El procedimiento Análisis de Conglomerados esta diseñado para agrupar observaciones o variables en conglomerados basados en similaridades entre ellos. Los renglones de

Más detalles

Clustering. Departamento de Ingeniería Informática y de Sistemas Universidad de La Laguna

Clustering. Departamento de Ingeniería Informática y de Sistemas Universidad de La Laguna Clustering Christopher Expósito Izquierdo Airam Expósito Márquez Israel López Plata Belén Melián Batista J. Marcos Moreno Vega {cexposit, aexposim, ilopezpl, mbmelian, jmmoreno}@ull.edu.es Departamento

Más detalles

Clasificación Jerárquica Ascendente Presentación #1. [ U n a i n t r o d u c c i ó n ]

Clasificación Jerárquica Ascendente Presentación #1. [ U n a i n t r o d u c c i ó n ] Clasificación Jerárquica Ascendente Presentación #1 [ U n a i n t r o d u c c i ó n ] Clasificación Jerárquica Clasificación Automática La clasificación automática tiene por objetivo reconocer grupos de

Más detalles

Curso de Postgrado en Herramientas Estadísticas Avanzadas: AGROPECUARIOS. Prof. Dr. José Perea Dpto. Producción Animal

Curso de Postgrado en Herramientas Estadísticas Avanzadas: AGROPECUARIOS. Prof. Dr. José Perea Dpto. Producción Animal Curso de Postgrado en Herramientas Estadísticas Avanzadas: ANÁLISIS MULTIVARIANTE PARA INVESTIGACIÓN EN SISTEMAS AGROPECUARIOS ANÁLISIS CLUSTER Prof. Dr. José Perea Dpto. Producción Animal ANÁLISIS DE

Más detalles

INTRODUCCION AL ANALISIS DE CLUSTER

INTRODUCCION AL ANALISIS DE CLUSTER -1- INTRODUCCION AL ANALISIS DE CLUSTER José Luis Vicente Villardón Departamento de Estadística Universidad de Salamanca -- DEFINICION E INTRODUCCION El Análisis de Clusters (o Análisis de conglomerados)

Más detalles

Tema 11. Clustering. X 1... X i... X n O 1 x x 1 i... x 1 n... O j x j 1... x j i... x j n... O N x N 1... x N i... x N n

Tema 11. Clustering. X 1... X i... X n O 1 x x 1 i... x 1 n... O j x j 1... x j i... x j n... O N x N 1... x N i... x N n Tema 11. Clustering Abdelmalik Moujahid, Iñaki Inza, Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del País Vasco Euskal Herriko Unibertsitatea 1 Introducción

Más detalles

Primero se inicializan dos puntos (tantos como clusters queremos) al azar. Estos puntos se denominan centroides del cluster.

Primero se inicializan dos puntos (tantos como clusters queremos) al azar. Estos puntos se denominan centroides del cluster. K-Means Introducción El algoritmo k-means es el algoritmo de clustering más popular y ampliamente utilizado. Algoritmo Supongamos que queremos agrupar los siguientes datos en dos clusters Primero se inicializan

Más detalles

Redes de Neuronas de Base Radial

Redes de Neuronas de Base Radial Redes de Neuronas de Base Radial 1 Introducción Redes multicapa con conexiones hacia delante Única capa oculta Las neuronas ocultas poseen carácter local Cada neurona oculta se activa en una región distinta

Más detalles

RESUMEN ANÁLISIS CLUSTER

RESUMEN ANÁLISIS CLUSTER RESUMEN ANÁLISIS CLUSTER 1. Introducción 2. Los datos 2.1. Transformación de los datos 3. Medidas de distancias 4. Métodos: aspectos generales 5. El método jerárquico aglomerativo 5.1 Algoritmos más usados

Más detalles

CLASIFICACIÓN PROBLEMA SOLUCIÓN

CLASIFICACIÓN PROBLEMA SOLUCIÓN Capítulo 7 Análisis Cluster CLASIFICACIÓN Asignar objetos en su lugar correspondiente dentro de un conjunto de categorías establecidas o no. PROBLEMA Dado un conjunto de m objetos (animales, plantas, minerales...),

Más detalles

ANALISIS DE CLUSTER CON SPSS: INMACULADA BARRERA

ANALISIS DE CLUSTER CON SPSS: INMACULADA BARRERA ANALISIS DE CLUSTER CON SPSS: INMACULADA BARRERA ANALISIS DE CLUSTER EN SPSS Opción: Analizar Clasificar ANALISIS DE CLUSTER EN SPSS Tres posibles OPCIONES 1.- Cluster en dos etapas 2.- K-means 3.- Jerárquicos

Más detalles

Análisis de Conglomerados

Análisis de Conglomerados Diplomatura en Estadística 1 Diplomatura en Estadística 2 Análisis de Conglomerados (Cluster analysis) Aurea Grané Departamento de Estadística Universidad Carlos III de Madrid Antecedente histórico Las

Más detalles

Introducción a Aprendizaje no Supervisado

Introducción a Aprendizaje no Supervisado Introducción a Aprendizaje no Supervisado Felipe Suárez, Álvaro Riascos 25 de abril de 2017 2 / 33 Contenido 1. Motivación 2. k-medias Algoritmos Implementación 3. Definición 4. Motivación 5. Aproximación

Más detalles

Aprendizaje no supervisado

Aprendizaje no supervisado Aprendizaje no supervisado Algoritmo de K medias Julio Waissman Vilanova Licenciatura en Ciencias de la Computación Universidad de Sonora Curso Inteligencia Artificial Plan del curso Aprendizaje no supervisado

Más detalles

Introducción a las técnicas estadísticas de

Introducción a las técnicas estadísticas de Introducción a las técnicas estadísticas de clasificación y regresión. Aprendizaje no supervisado - Clustering Laura Aspirot, Sebastián Castro Universidad de la República (UdelaR) Jueves 21 y viernes 22

Más detalles

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 9 -

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 9 - Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos - Sesión 9 - Juan Alfonso Lara Torralbo 1 Índice de contenidos Actividad. Qué es un modelo de Data Mining Qué es

Más detalles

Nota técnica Estratificación multivariada

Nota técnica Estratificación multivariada Instituto Nacional de Estadística y Geografía Nota técnica Estratificación multivariada Censo de Población y Vivienda 2010 NOTA TÉCNICA ESTRATIFICACIÓN MULTIVARIADA Con la finalidad de que el usuario pueda

Más detalles

FUNDACIÓN UNIVERSITARIA LOS LIBERTADORES DEPARTAMENTO DE CIENCIAS BÁSICAS ESPECIALIZACIÓN EN ESTADÍSTICA APLICADA

FUNDACIÓN UNIVERSITARIA LOS LIBERTADORES DEPARTAMENTO DE CIENCIAS BÁSICAS ESPECIALIZACIÓN EN ESTADÍSTICA APLICADA UNA SEGMENTACIÓN DE CLIENTES QUE ADQUIRIERON CRÉDITOS DE LIBRE INVERSIÓN EN UNA ENTIDAD FINANCIERA COLOMBIANA I SEMESTRE 2015 OSCAR TUMBIA JAIRO MARTINEZ OMAR BELTRAN FUNDACIÓN UNIVERSITARIA LOS LIBERTADORES

Más detalles

TÉCNICAS DE AGRUPAMIENTO

TÉCNICAS DE AGRUPAMIENTO TÉCNICAS DE AGRUPAMIENTO José D. Martín Guerrero, Emilio Soria, Antonio J. Serrano PROCESADO Y ANÁLISIS DE DATOS AMBIENTALES Curso 2009-2010 Page 1 of 11 1. Algoritmo de las C-Medias. Algoritmos de agrupamiento

Más detalles

Análisis Estadístico de Datos Climáticos

Análisis Estadístico de Datos Climáticos Análisis Estadístico de Datos Climáticos Análisis de agrupamiento (o clusters) (Wilks, Cap. 14) Facultad de Ciencias Facultad de Ingeniería 2013 Objetivo Idear una clasificación o esquema de agrupación

Más detalles

Clasificación Clasific NO SUPERV SUPER ISAD IS A AD AGRUPAMIENTO

Clasificación Clasific NO SUPERV SUPER ISAD IS A AD AGRUPAMIENTO Clasificación NO SUPERVISADA AGRUPAMIENTO Clasificación No Supervisada Se trata de construir clasificadores sin información a priori, o sea, a partir de conjuntos de patrones no etiquetados Objetivo: Descubrir

Más detalles

INFORME TAREA N 4 CLUSTERING

INFORME TAREA N 4 CLUSTERING Universidad de Chile Facultad de Ciencias Físicas y Matemáticas Departamento de Ingeniería Eléctrica EL4106 Inteligencia Computacional INFORME TAREA N 4 CLUSTERING Nombre Alumno : Profesor : Profesor Auxiliar

Más detalles

Ejemplos de análisis cluster

Ejemplos de análisis cluster Ejemplos de análisis cluster Objetivos: 1. Una aproximación a la terminología del análisis cluster o de conglomerados 2. Uso de las funciones oportunas de R para realizar el análisis 3. Interpretación

Más detalles

Análisis Cluster. Metodología de las CC del Comp-Universitat de València. Abril Pedro Valero

Análisis Cluster. Metodología de las CC del Comp-Universitat de València. Abril Pedro Valero Análisis Cluster Pedro Valero Mora-valerop@uv.es Metodología de las CC del Comp-Universitat de València Abril 2011 Pedro Valero Mora-valerop@uv.es Metodología de las CC del Comp-Universitat de València

Más detalles

UNIVERSIDAD TÉCNICA FEDERICO SANTA MARÍA DEPARTAMENTO DE INFORMÁTICA SANTIAGO - CHILE

UNIVERSIDAD TÉCNICA FEDERICO SANTA MARÍA DEPARTAMENTO DE INFORMÁTICA SANTIAGO - CHILE UNIVERSIDAD TÉCNICA FEDERICO SANTA MARÍA DEPARTAMENTO DE INFORMÁTICA SANTIAGO - CHILE EVALUACIÓN DE ALGORITMOS DE AGRUPAMIENTO UTILIZANDO APACHE SPARK FRANCISCO JAVIER SALINAS DEZEREGA MEMORIA DE TITULACIÓN

Más detalles

Análisis de datos cualitavos con análisis de correspondencias

Análisis de datos cualitavos con análisis de correspondencias Análisis de datos cualitavos con análisis de correspondencias Sesión 3 Campo Elías Pardo Universidad Nacional Sesión 3 - contenido 1. Algunos métodos de clasificación en espacios métricos (variables condnuas,

Más detalles

Aplicación de técnicas de aprendizaje no supervisado para la clusterización temática de la red TOR

Aplicación de técnicas de aprendizaje no supervisado para la clusterización temática de la red TOR Aplicación de técnicas de aprendizaje no supervisado para la clusterización temática de la red TOR 14 de marzo de 2016 UTILIZA MATEMÁTICAS David Martín Bragado Universidad de Alcalá Índice 1. Introducción

Más detalles

Técnicas para exploración de bases de datos

Técnicas para exploración de bases de datos Técnicas para exploración de bases de datos Daniel Aceituno Gómez Estudiante Ing. Telecomunicación Universidad Carlos III de Madrid Avenida de la Universidad, 30 28911, Leganés (Madrid-España) 100061824@alumnos.uc3m.es

Más detalles

Interfaz gráfica de usuario para la visualización de diseños de territorios

Interfaz gráfica de usuario para la visualización de diseños de territorios PISIS XII Verano científico 2011 Interfaz gráfica de usuario para la visualización de diseños de territorios Alumna: Brenda Aide Peña Cantú Asesores: Dr. Hugo Jair Escalante, Dr. Roger Z. Ríos Contenido

Más detalles

PROBABILIDAD. Unidad I Ordenamiento de la Información

PROBABILIDAD. Unidad I Ordenamiento de la Información 1 PROBABILIDAD Unidad I Ordenamiento de la Información 2 Captura de datos muestrales Conceptos básicos de la estadística 3 Población (o universo): Totalidad de elementos o cosas bajo consideración Muestra:

Más detalles

Análisis de imágenes digitales

Análisis de imágenes digitales Análisis de imágenes digitales SEGMENTACIÓN DE LA IMAGEN Segmentación basada en texturas INTRODUCCIÓN La textura provee información sobre la distribución espacio-local del color o niveles de intensidades

Más detalles

Jesús García Herrero TÉCNICAS DE AGRUPAMIENTO

Jesús García Herrero TÉCNICAS DE AGRUPAMIENTO Jesús García Herrero TÉCNICAS DE AGRUPAMIENTO En esta clase se presentan las técnicas de agrupamiento, también conocidas como clustering, que buscan grupos de instancias con características similares mediante

Más detalles

CONTENIDO MODELOS PARA LA LOCALIZACION DE PLANTA

CONTENIDO MODELOS PARA LA LOCALIZACION DE PLANTA MODELOS PARA LA LOCALIZACION DE PLANTA PROFESOR: DR. JORGE ACUÑA A. 1 CONTENIDO Modelos de localización Modelos de optimización Modelo del centro de gravedad Modelo de distancias (Ardalan) Trayectorias

Más detalles

Análisis de la relación precio marginal y demanda de electricidad mediante conglomerados

Análisis de la relación precio marginal y demanda de electricidad mediante conglomerados Análisis de la relación precio marginal y demanda de electricidad mediante conglomerados Andrés Ramos, Gonzalo Cortés, Jesús María Latorre, Santiago Cerisola Universidad Pontificia Comillas Índice Introducción

Más detalles

Análisis de clasificación

Análisis de clasificación Seminario de Doctorado Análisis de clasificación Pedro López-Roldán Departamento de Sociología Centro de Estudios Sociológicos sobre la Vida Cotidiana y el Trabajo (QUIT) Instituto de Estudios del Trabajo

Más detalles

Aprendizaje automático: métodos y aplicaciones

Aprendizaje automático: métodos y aplicaciones Aprendizaje automático: métodos y aplicaciones Fernando Díaz Gómez Depto. de Informática E. U. de Informática UVa contenidos Introducción al aprendizaje automático Aprendizaje inductivo Aprendizaje supervisado

Más detalles

Métodos de teoría de Grafos en aprendizaje no supervisado y cl

Métodos de teoría de Grafos en aprendizaje no supervisado y cl Métodos de teoría de Grafos en aprendizaje no supervisado y clustering 15 de enero de 2011 1 Teoría de Grafos 2 Métodos de la Teoría de Grafos 3 Clasificación de Documentos Web 4 Clustering Incremental

Más detalles

Reconocimiento de Patrones

Reconocimiento de Patrones Reconocimiento de Patrones Jesús Ariel Carrasco Ochoa Instituto Nacional de Astrofísica Óptica y Electrónica ariel@inaoep.mx Contenido Introducción Enfoques Problemas Selección de Variables Clasificación

Más detalles

Capítulo 21. Análisis de conglomerados (I): El procedimiento Conglomerados de K medias. Introducción

Capítulo 21. Análisis de conglomerados (I): El procedimiento Conglomerados de K medias. Introducción Capítulo 21 Análisis de conglomerados (I): El procedimiento Conglomerados de K medias Introducción El análisis de conglomerados (en inglés, cluster analisys) es una técnica multivariante que permite agrupar

Más detalles

ANÁLISIS DE CONGLOMERADOS

ANÁLISIS DE CONGLOMERADOS ANÁLISIS DE CONGLOMERADOS Análisis de conglomerados Autor: Manuel Terrádez Gurrea (mterradez@uoc.edu). ESQUEMA DE CONTENIDOS Análisis de conglomerados (cluster) Interpretación de dendogramas INTRODUCCIÓN

Más detalles

Definición de grupos: clasificación. Capítulos 10 y 11 de McCune y Grace 2002

Definición de grupos: clasificación. Capítulos 10 y 11 de McCune y Grace 2002 Definición de grupos: clasificación Capítulos 10 y 11 de McCune y Grace 2002 Clasificar Proceso natural humano para interpretar el mundo Pero estamos acostumbrados a sólo observar pocas dimensiones Más

Más detalles

Técnicas de clusterización

Técnicas de clusterización PFC Ingeniería Industrial 09/2014 Tutor: Jesús Muñuzuri Sanz Alumno: Juan de Dios Lara Albín Técnicas de Clusterización PFC ÍNDICE Pag. 1 Clasificar.... 2 2 El análisis clúster.. 5 3 Clúster por individuos

Más detalles

Análisis de Clúster con SPSS. Método de las K-Medias

Análisis de Clúster con SPSS. Método de las K-Medias Análisis de Clúster con SPSS. Método de las K-Medias El análisis de cluster es un tipo de clasificación de datos que se lleva a cabo mediante la agrupación de los elementos analizados. El objetivo fundamental

Más detalles

Minería de Datos Web. 1 er Cuatrimestre 2015. Página Web. Prof. Dra. Daniela Godoy. http://www.exa.unicen.edu.ar/catedras/ageinweb/

Minería de Datos Web. 1 er Cuatrimestre 2015. Página Web. Prof. Dra. Daniela Godoy. http://www.exa.unicen.edu.ar/catedras/ageinweb/ Minería de Datos Web 1 er Cuatrimestre 2015 Página Web http://www.exa.unicen.edu.ar/catedras/ageinweb/ Prof. Dra. Daniela Godoy ISISTAN Research Institute UNICEN University Tandil, Bs. As., Argentina http://www.exa.unicen.edu.ar/~dgodoy

Más detalles

Dr. Richard Mercado Rivera 18 de agosto de 2012 Matemática Elemental

Dr. Richard Mercado Rivera 18 de agosto de 2012 Matemática Elemental Universidad de Puerto Rico Recinto de Aguadilla Programa CeCiMat Elemental Definición de conceptos fundamentales de la Estadística y la Probabilidad y su aportación al mundo moderno Dr. Richard Mercado

Más detalles

UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ CALDAS FACULTAD DE INGENIERÍA

UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ CALDAS FACULTAD DE INGENIERÍA UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ CALDAS FACULTAD DE INGENIERÍA MAESTRIA EN CIENCIAS DE LA INFORMACION Y LAS COMUNICACIONES ENFASIS EN SISTEMA DE INFORMACION GEOFRAFICA ESTUDIO COMPARATIVO DE ALGORITMOS

Más detalles

GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC)

GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC) GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC) Curso Académico: 2015-2016 Programa: Centro: Universidad: Máster Universitario en Ingeniería Informática Escuela Politécnica Superior

Más detalles

Particionamiento Numérico CIMPA-UCR. usando Metaheurísticas de Optimización

Particionamiento Numérico CIMPA-UCR. usando Metaheurísticas de Optimización Particionamiento Numérico usando Metaheurísticas de Optimización 1 Métodos de vecindarios 1.1 Sobrecalentamiento simulado 1.2 Búsqueda tabú Optimizacion Combinatoria F: S R S: espacio de estados (soluciones

Más detalles

CLASIFICACIÓN NO SUPERVISADA CLASIFICACIÓN NO SUPERVISADA N. QUEIPO, S. PINTOS COPYRIGHT 2005 FUNDAMENTOS DE DATA MINING Y SUS APLICACIONES

CLASIFICACIÓN NO SUPERVISADA CLASIFICACIÓN NO SUPERVISADA N. QUEIPO, S. PINTOS COPYRIGHT 2005 FUNDAMENTOS DE DATA MINING Y SUS APLICACIONES DEFINICIÓN: AGRUPAR UN CONJUNTO DE n OBJETOS, DEFINIDOS POR p VARIABLES, EN c CLASES, DONDE EN CADA CLASE LOS ELEMENTOS POSEAN CARACTERÍSTICAS AFINES Y SEAN MÁS SIMILARES ENTRE SÍ QUE RESPECTO AELEMENTOS

Más detalles

ANÁLISIS DE LA SEPARABILIDAD LINEAL DE UNA BASE DE DATOS Data base linear separability analysis

ANÁLISIS DE LA SEPARABILIDAD LINEAL DE UNA BASE DE DATOS Data base linear separability analysis Scientia et Technica Año XIII, No 37, Diciembre de 2007. Universidad Tecnológica de Pereira. ISSN 022-70 527 ANÁLISIS DE LA SEPARABILIDAD LINEAL DE UNA BASE DE DATOS Data base linear separability analysis

Más detalles

MINERIA DE TEXTOS EN R: VIA UN MODELO DE ESPACIO VECTORIAL Y ANÁLISIS CLUSTER. Resumen

MINERIA DE TEXTOS EN R: VIA UN MODELO DE ESPACIO VECTORIAL Y ANÁLISIS CLUSTER. Resumen MINERIA DE TEXTOS EN R: VIA UN MODELO DE ESPACIO VECTORIAL Y ANÁLISIS CLUSTER Resumen El objetivo del presente estudio fue encontrar la similitud entre textos para asociar reclamos y determinar si estos

Más detalles

Método k-medias. [ U n a i n t r o d u c c i ó n ]

Método k-medias. [ U n a i n t r o d u c c i ó n ] Método k-medias [ U n a i n t r o d u c c i ó n ] Método K-Means (Nubes Dinámicas) 0 3 4 5 6 7 8 9 0 0 3 4 5 6 7 8 9 0 0 3 4 5 6 7 8 9 0 0 3 4 5 6 7 8 9 0 0 3 4 5 6 7 8 9 0 0 3 4 5 6 7 8 9 0 0 3 4 5 6

Más detalles

Práctica 3. Para comenzar esta práctica abrimos el programa SPSS.

Práctica 3. Para comenzar esta práctica abrimos el programa SPSS. Análisis de Datos Licenciatura en Biología Curso oo9/o0 Práctica 3 El fichero de datos necesario para realizar esta práctica, turtlefmxls, se encuentra en la página web http//wwwuames/danielfaraco La ruta

Más detalles

INTELIGENCIA ARTIFICAL COMO HERRAMIENTA EN LA TOMA DE DECISIONES. Tecnología i3b

INTELIGENCIA ARTIFICAL COMO HERRAMIENTA EN LA TOMA DE DECISIONES. Tecnología i3b INTELIGENCIA ARTIFICAL COMO HERRAMIENTA EN LA TOMA DE DECISIONES Tecnología i3b G R U P O I B E R M Á T I C A Introducción Objetivos Puntos de información y de estudio Tipos de análisis Análisis proactivo

Más detalles

3. Clasificación no supervisada

3. Clasificación no supervisada 3. El presente capítulo y el siguiente tratan de clasificación, es por ello que antes de abordar el tema específico de este capítulo, previamente se hará una introducción al tema de clasificación. 3.1

Más detalles

Object Recognition as Machine Translation: Learning a Lexicon for a Fixed Image Vocabulary

Object Recognition as Machine Translation: Learning a Lexicon for a Fixed Image Vocabulary Object Recognition as Machine Translation: Learning a Lexicon for a Fixed Image Vocabulary P. Duygulu, K. Barnard, J.F.G. de Freitas, and D.A. Forsyth Dr. Enrique Sucar 1 Victor Hugo Arroyo Dominguez 1

Más detalles

Inteligencia en Redes de Comunicaciones

Inteligencia en Redes de Comunicaciones Inteligencia en Redes de Comunicaciones Autores: -Daniel Pérez Vaquero. -Javier García Lloreda. Fecha: -17 de Diciembre de 2013. 1. Introducción Al Clustering. El clustering no es más que el agrupamiento

Más detalles

+ f 2. + f 3. p i. =h i 100. F i. = f i. H i. = h i. P i. = p i

+ f 2. + f 3. p i. =h i 100. F i. = f i. H i. = h i. P i. = p i OCIOES de ESTADÍSTICA En las tablas estadísticas se pueden tabular, entre otros, los siguientes aspectos: La frecuencia absoluta ( f i ), es decir, el número de veces que aparece un determinado valor en

Más detalles

Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA. Ricardo Aler Mur

Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA. Ricardo Aler Mur Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA Ricardo Aler Mur TIPOS DE TAREAS, MODELOS Y ALGORITMOS ? Datos Entrenamiento Algoritmo Modelo Galaxia espiral TAREAS / MODELOS

Más detalles

Curso de Estadística Básica

Curso de Estadística Básica Curso de SESION 3 MEDIDAS DE TENDENCIA CENTRAL Y MEDIDAS DE DISPERSIÓN MCC. Manuel Uribe Saldaña MCC. José Gonzalo Lugo Pérez Objetivo Conocer y calcular las medidas de tendencia central y medidas de dispersión

Más detalles

ESTRUCTURAS REPETITIVAS EN PHP

ESTRUCTURAS REPETITIVAS EN PHP ESTRUCTURAS REPETITIVAS EN PHP Los bucles nos permiten iterar conjuntos de instrucciones, es decir repetir la ejecución de un conjunto de instrucciones mientras se cumpla una condición. Sentencia while

Más detalles

EL ANÁLISIS DE LOS DATOS EN EL SISTEMA DE INFORMACIÓN GEOGRÁFICA DE CUBA

EL ANÁLISIS DE LOS DATOS EN EL SISTEMA DE INFORMACIÓN GEOGRÁFICA DE CUBA EL ANÁLISIS DE LOS DATOS EN EL SISTEMA DE INFORMACIÓN GEOGRÁFICA DE CUBA Lic. Orlando Nouva Álvarez * INTRUDUCCIÓN El Instituto de Geografía de la Academia de Ciencias de Cuba ha desarrollado un Sistema

Más detalles

Frey Miguel León Lozano

Frey Miguel León Lozano El SARLAFT y el uso de matrices de riesgo. La segmentación de riesgo basado en modelos matemáticos estadísticos para la gestión del riesgo del Lavado de Activos y Financiamiento al Terrorismo. Su implementación

Más detalles

Enfoque Conceptual Borroso en Recuperación de Información

Enfoque Conceptual Borroso en Recuperación de Información I Workshop Virtual de Ingeniería Linguística UNAB-NAACL Enfoque Conceptual Borroso en Recuperación de Información Prof. Dr. Andrés Soto Villaverde Universidad Autónoma del Carmen Cd. Carmen, Campeche,

Más detalles

Introducción a la minería de datos. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR

Introducción a la minería de datos. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Introducción a la minería de datos CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Minería de datos Detección, interpretación y predicción de patrones cuantitativos y cualitativos

Más detalles

MASTER EN CIENCIAS ACTUARIALES Y FINANCIERAS PLAN Módulo: ANÁLISIS DEL RIESGO ACTUARIAL Y FINANCIERO

MASTER EN CIENCIAS ACTUARIALES Y FINANCIERAS PLAN Módulo: ANÁLISIS DEL RIESGO ACTUARIAL Y FINANCIERO MASTER EN CIENCIAS ACTUARIALES Y FINANCIERAS PLAN 2009 Nombre de asignatura: ESTADÍSTICA ACTUARIAL III: ANÁLISIS MULTIVARIANTE DE DATOS Código: 603377 Materia: ESTADÍSTICA ACTUARIAL Módulo: ANÁLISIS DEL

Más detalles

ESTRATEGIAS DE COMPORTAMIENTO Y VALORACIÓN DE LA FORMACIÓN DE LOS ESTUDIANTES: UN ANÁLISIS APLICADO 1

ESTRATEGIAS DE COMPORTAMIENTO Y VALORACIÓN DE LA FORMACIÓN DE LOS ESTUDIANTES: UN ANÁLISIS APLICADO 1 Estrategias de comportamiento y valoración de la formación de los estudiantes: un análisis aplicado ESTRATEGIAS DE COMPORTAMIENTO Y VALORACIÓN DE LA FORMACIÓN DE LOS ESTUDIANTES: UN ANÁLISIS APLICADO 1

Más detalles

Inteligencia en Redes de Comunicaciones - 06 Aprendizaje

Inteligencia en Redes de Comunicaciones - 06 Aprendizaje El objetivo de este tema es realizar una introducción a los conceptos, fundamentos y técnicas básicas de aprendizaje computacional. En primer lugar se formalizará el concepto de aprendizaje y se describirán

Más detalles

Técnicas de Preprocesado

Técnicas de Preprocesado Técnicas de Preprocesado Series Temporales Máster en Computación Universitat Politècnica de Catalunya Dra. Alicia Troncoso Lora 1 Contenido Por qué preprocesar p los datos? Técnicas de filtro Depuración

Más detalles

Cómo hacer Valoración de Cargos

Cómo hacer Valoración de Cargos Cómo hacer Valoración de Cargos Nuestro objeto de estudio serán, también en este caso, los CARGOS que conforman la estructura Organizacional, así como la relación Hombre - Cargo Objeto de estudio 2 Es

Más detalles

Repaso del algoritmo SIMPLEX

Repaso del algoritmo SIMPLEX Universidad de Chile Facultad de Ciencias Físicas y Matemáticas Departamento de Ingeniería Industrial IN70K: Clase Auxiliar Repaso del algoritmo SIMPLEX Marcel Goic F. 1 1 Esta es una versión bastante

Más detalles

1. Identifica y abre el programa STATA. La pantalla de inicio se muestra a continuación:

1. Identifica y abre el programa STATA. La pantalla de inicio se muestra a continuación: Proyecto Ciudadano Científico II Módulo Preparatorio de Estadísticas ANOVA (Análisis de Varianza) en STATA El módulo a continuación provee al usuario un grupo de instrucciones para llevar a cabo un análisis

Más detalles

RELACIÒN ENTRE LOS PROMEDIOS

RELACIÒN ENTRE LOS PROMEDIOS Capítulo : RELACIÒN ENTRE LOS PROMEDIOS INTRODUCCIÓN La Estadística es una ciencia matemática que se utiliza para describir, analizar e interpretar ciertas características de un conjunto de individuos

Más detalles

I. Introducción.9. Estado del arte de los algoritmos de agrupamiento 16

I. Introducción.9. Estado del arte de los algoritmos de agrupamiento 16 1 I. Introducción.9 1.1 Marco tecnológico y motivación del proyecto 9 1.2 Objetivos 11 1.3 Resumen de la propuesta...13 1.4 Estructura del documento..14 II. Estado del arte de los algoritmos de agrupamiento

Más detalles

CREACIÓN DE UNA TIPOLOGÍA DE GENES MEDIANTE TÉCNICAS DE DATA MINING PARA Drosophila

CREACIÓN DE UNA TIPOLOGÍA DE GENES MEDIANTE TÉCNICAS DE DATA MINING PARA Drosophila CREACIÓN DE UNA TIPOLOGÍA DE GENES MEDIANTE TÉCNICAS DE DATA MINING PARA Drosophila Ramón Álvarez 1 Flavio Pazos 2 Adrián Valentín 2 Curso de data Mining-2012,Instituto Pasteur 1 IESTA(Instituto de Estadística)

Más detalles

NOMBRE CÓDIGO - CATEGORIZACIÓN

NOMBRE CÓDIGO - CATEGORIZACIÓN 1 NOMBRE CÓDIGO - CATEGORIZACIÓN Kiara Lucas Herrera 1 1 Carrera de Ingeniería en Sistemas Computacionales Universidad de Guayaquil diferentes cluster de productos de la página de Amazon, llegando al resultado

Más detalles

En ciencias e ingeniería (experimentales) es imprescindible realizar mediciones, que consisten en obtener

En ciencias e ingeniería (experimentales) es imprescindible realizar mediciones, que consisten en obtener ERRORES DE MEDICION Y SU PROPAGACION En ciencias e ingeniería (experimentales) es imprescindible realizar mediciones, que consisten en obtener la magnitud fisica de algun atributo de objetos ( proceso,

Más detalles

TEMA II DISTRIBUCION DE FRECUENCIA

TEMA II DISTRIBUCION DE FRECUENCIA TEMA II DISTRIBUCION DE FRECUENCIA 1. Cuestiones preliminares sobre Distribución de Frecuencia.. Distribución de frecuencia cuando la variable es discreta. 3. Distribución de frecuencia agrupada cuando

Más detalles

UNIVERSIDAD TECNOLÓGICA DE LA MIXTECA PARA OBTENER EL TÍTULO DE INGENIERO EN COMPUTACIÓN PRESENTA: FELIX EMILIO LUIS PÉREZ

UNIVERSIDAD TECNOLÓGICA DE LA MIXTECA PARA OBTENER EL TÍTULO DE INGENIERO EN COMPUTACIÓN PRESENTA: FELIX EMILIO LUIS PÉREZ UNIVERSIDAD TECNOLÓGICA DE LA MIXTECA TÉCNICAS DE AGRUPAMIENTO PARA LA REGIONALIZACIÓN DE CAUDALES EN LA MIXTECA OAXAQUEÑA T E S I S PARA OBTENER EL TÍTULO DE INGENIERO EN COMPUTACIÓN PRESENTA: FELIX EMILIO

Más detalles

Trabajo Fin de Grado ALGORITMOS PARA LA ESTIMACIÓN DE MODELOS DE MEZCLAS GAUSSIANAS (ALGORITHMS FOR GAUSSIAN MIXTURE MODEL (GMM) ESTIMATION)

Trabajo Fin de Grado ALGORITMOS PARA LA ESTIMACIÓN DE MODELOS DE MEZCLAS GAUSSIANAS (ALGORITHMS FOR GAUSSIAN MIXTURE MODEL (GMM) ESTIMATION) ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES Y DE TELECOMUNICACIÓN UNIVERSIDAD DE CANTABRIA Trabajo Fin de Grado ALGORITMOS PARA LA ESTIMACIÓN DE MODELOS DE MEZCLAS GAUSSIANAS (ALGORITHMS FOR GAUSSIAN

Más detalles

Unidad 3. Separacion de costos fijos y costos variables. Objetivos especificos de aprendizaje

Unidad 3. Separacion de costos fijos y costos variables. Objetivos especificos de aprendizaje Unidad 3 Separacion de costos fijos y costos variables Objetivos especificos de aprendizaje Alterminar de estudiar este capitulo, el estudiante sera capaz de: Explicar el concepto de costos fijos. Explicar

Más detalles

RECOPILACIÓN DE LA INFORMACIÓN

RECOPILACIÓN DE LA INFORMACIÓN RECOPILACIÓN DE LA INFORMACIÓN CONCEPTOS DE ESTADÍSTICA Y SU CLASIFICACIÓN ESTADÍSTICA. Es la ciencia que estudia los medios para derivar información válida a partir de un conjunto de datos. Es decir,

Más detalles

Análisis Cluster en SPSS

Análisis Cluster en SPSS Análisis Cluster en SPSS M. D olores M artínez M iranda Profesora del D pto. E stadística e I.O. U niversidad de G ranada Referencias bibliográficas 1. Hair, J.F., Anderson, R.E., Tatham, R.L. y Black,

Más detalles

Tema 5: SEGMENTACIÓN (II) I N G E N I E R Í A I N F O R M Á T I C A

Tema 5: SEGMENTACIÓN (II) I N G E N I E R Í A I N F O R M Á T I C A Tema 5: SEGMENTACIÓN (II) 1 I N G E N I E R Í A I N F O R M Á T I C A Tema 5: Segmentación Los algoritmos de segmentación se basan en propiedades básicas de los valores del nivel de gris: 2 - Discontinuidad:

Más detalles

Estudio del análisis de componentes principales en bases de datos de calidad del aire

Estudio del análisis de componentes principales en bases de datos de calidad del aire Estudio del análisis de componentes principales en bases de datos de calidad del aire Abraham Sánchez López 1, Viridiana Cruz-Gutiérrez 1, Mario Alberto Posada-Zamora 1, M. Teresa Torrijos M. 1, M. Auxilio

Más detalles

Ideas básicas del diseño experimental

Ideas básicas del diseño experimental Ideas básicas del diseño experimental Capítulo 4 de Analysis of Messy Data. Milliken y Johnson (1992) Diseño de experimentos p. 1/23 Ideas básicas del diseño experimental Antes de llevar a cabo un experimento,

Más detalles

Darío Álvarez Néstor Lemo www.autonomo.edu.uy

Darío Álvarez Néstor Lemo www.autonomo.edu.uy Data Mining para Optimización de Distribución de Combustibles Darío Álvarez Néstor Lemo Agenda Qué es DODC? Definición de Data Mining El ciclo virtuoso de Data Mining Metodología de Data Mining Tareas

Más detalles

Apuntes de Estadística

Apuntes de Estadística Apuntes de Estadística La Estadística es la ciencia que se encarga de recoger, organizar, describir e interpretar datos referidos a distintos fenómenos para, posteriormente, analizarlos e interpretarlos.

Más detalles

BKS: Business Knowledge Series.

BKS: Business Knowledge Series. BKS: Business Knowledge Series. BigData analytics: Next Best Offer Content. 1 Presentado por: Gabriel Contreras. Detectando y descubriendo hábitos de consumo de contenidos y aplicaciones. Capítulo 1. Breve

Más detalles

Universidad Tec Milenio: Profesional HG04002 Análisis de Decisiones I

Universidad Tec Milenio: Profesional HG04002 Análisis de Decisiones I Tema # 10 El método de las M s como solución de problemas de programación lineal 1 Objetivo de aprendizaje del tema Al finalizar el tema serás capaz de: Resolver modelos de programación lineal mediante

Más detalles

Protección de Datos Categóricos que siguen Patrones Secuenciales

Protección de Datos Categóricos que siguen Patrones Secuenciales Universitat Rovira i Virgili Escola Tècnica Superior d Enginyeria Tesina para la obtención del título de Màster Interuniversitari (URV-UPC-UB) en Intel ligència Artificial Directora: Aïda VALLS MATEU Protección

Más detalles

Aplicación de técnicas de aprendizaje automático para la identificación de patrones de interacción en una experiencia virtual de aprendizaje.

Aplicación de técnicas de aprendizaje automático para la identificación de patrones de interacción en una experiencia virtual de aprendizaje. Aplicación de técnicas de aprendizaje automático para la identificación de patrones de interacción en una experiencia virtual de aprendizaje. Priscila Valdiviezo Díaz Unidad de Virtualización, UTPL pmvaldiviezo@utpl.edu.ec

Más detalles

Examen de Septiembre de TACCIII y TAI (Modelo 2)

Examen de Septiembre de TACCIII y TAI (Modelo 2) Examen de Septiembre de TACCIII y TAI (Modelo 2) 12 de septiembre de 2008 1. La desordenación de la base de datos puede influir en el resultado obtenido mediante a) clasificación por distancia a las medias

Más detalles

Medidas de tendencia central

Medidas de tendencia central Medidas de tendencia central Medidas de tendencia central Medidas de Posición: son aquellos valores numéricos que nos permiten o bien dar alguna medida de tendencia central, dividiendo el recorrido de

Más detalles

Programación Estructurada

Programación Estructurada Programación Estructurada Técnica de programación que consiste en construir programas de fácil comprensión. Es mucho más sencillo entender la codificación del programa, que se habrá hecho en diferentes

Más detalles

Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Introducción al aprendizaje supervisado Profesor: Dr. Wilfrido Gómez Flores 1 Conceptos básicos Reconocimiento de patrones (RP): clasificar objetos en un número de categorías o clases.

Más detalles