RECONOCIMIENTO DE PAUTAS. ANÁLISIS DE CONGLOMERADOS (Cluster Analysis)

Tamaño: px
Comenzar la demostración a partir de la página:

Download "RECONOCIMIENTO DE PAUTAS. ANÁLISIS DE CONGLOMERADOS (Cluster Analysis)"

Transcripción

1 RECONOCIMIENTO DE PAUTAS ANÁLISIS DE CONGLOMERADOS (Cluster Analysis)

2 Análisis de conglomerados los análisis exploratorios de datos (como PCA) determinan relaciones generales entre datos en ocasiones no es eficiente

3 Análisis de conglomerados análisis de agrupamientos (cluster analysis): es un técnica de reconocimiento de pautas no supervisada que busca similitudes empleada originalmente en biología para determinar relaciones entre organismos (género, familia, ) herramienta esencial en tareas de clasificación y puede aplicarse en forma consecutiva al ACP resultado: se forman conglomerados (clusters) jerárquicos no jerárquicos

4 Análisis de conglomerados Cuando no conocemos cuántos grupos hay: * métodos jerárquicos produce una secuencia de particiones, juntando o separando clusters. En cada paso se juntan o separan dos clusters siguiendo algún criterio especificado. Cuando conocemos cuántos grupos hay: * métodos no jerárquicos : produce una partición de los objetos en un número especificado de grupos siguiendo un criterio de optimización.

5 Análisis de conglomerados

6 Decisiones que hay que tomar para formar un cluster 1. Elegir el método cluster que se va a emplear. 2. Decidir si trabajar con los datos según se miden o estandarizados. 3. Determinar similitud entre objetos: seleccionar la forma de medir la distancia/disimilitud entre objetos, dependiendo de si los datos son cuantitativos o cualitativos. 4. Clusters no jeráquicos: Elegir un criterio de optimalidad. Clusters jerárquicos: Elegir un criterio para vincular grupos, distancia entre grupos. 5. Decidir el número de clusters.

7 Análisis de agrupamiento etapa: mediciones de distancias a menor distancia, mayor similitud entre los objetos centroide u objeto individual que sirve de semilla para un conglomerado

8 Análisis de agrupamiento mediciones de distancias Minkowski (métrica L p ): Raíz p-ésima de la suma de las diferencias absolutas elevada a la potencia p-ésima entre los valores d ij =[ K p]1/ p x ik x jk k=1 d ij : distancia entre los objetos (muestras) i y j K= número de variables

9 mediciones de distancias Análisis de agrupamiento Euclídea: más usada p= 2 raíz cuadrada de la suma de cuadrados de las diferencias entre los valores. d 12 = [( x 11 x 21 ) 2 +(x 12 x 22 ) 2 ] 1/2

10 Análisis de agrupamiento Manhattan (city-block, distancia de ciudad): p=1 es mayor que la distancia euclídea d 12 = x 11 x 21 + x 12 x 22

11 Análisis de agrupamiento mediciones de distancias Pearson: basada en la desviación estándar (s j ) de la variable j K ( x ik x jk) 2 d ij = k=1 s j 2

12 Análisis de agrupamiento mediciones de distancias Mahalanobis: permite trabajar sin escalar los datos evita distorsiones por correlaciones D 2 ij = (x i x j ) T C 1 (x i x j ) C: matriz de covarianza (simétrica con respecto a la diagonal) x i, x j : columna de vectores de objetos i y j, respectivamente

13 Análisis de agrupamiento Desventaja distancia Minkowski: depende de las unidades hay que escalar los datos Desventaja distancia Mahalanobis: cuando el número de variables (mediciones) excede al número de objetos (muestras) no se puede aplicar porque C puede no tener inversa

14 métodos jerárquicos etapa: vincular grupos métodos de vinculación: Análisis de agrupamiento de vinculación simple (vecino más próximo, nearest neighbour) mínima distancia entre dos objetos de cada grupo (útil para para identificar atípicos) d ki = d Ai + d Bi 2 d Ai d Bi 2 = min(d Ai, d Bi )

15 Análisis de agrupamiento vecino más lejano (complete linkage) máxima distancia entre dos objetos de cada grupo. d ki = d Ai + d Bi 2 + d Ai d Bi 2 = max(d Ai,d Bi )

16 Análisis de agrupamiento vínculo promedio no ponderado (unweighted average linkage) d ki = n A n d Ai + n B n d Bi n = n A + n B

17 Análisis de agrupamiento vínculo promedio (median linkage) media de las distancias entre todos los objetos de los dos grupos d ki = d Ai 2 + d Bi 2 d AB 4

18 Análisis de agrupamiento Centroide (centroid linkage) distancia/disimilitud entre los centros de los grupos d ki = n A n d Ai + n B n d Bi n A n B n 2 d AB

19 Análisis de agrupamiento de Ward: utiliza la suma de las distancias al cuadrado a los centros de los grupos distancia de Lance y Williams... d ki = n A+n i n+n i d Ai + n B+n i n+n i d Bi n i n+n i d AB generalmente conviene usar distintos métodos y comparar los resultados

20 método del vecino más próximo

21 métodos jerárquicos Análisis de agrupamiento Representación gráfica: Dendograma: representa las etapas de la formación de conglomerados los grupos u observaciones que son mas similares son combinados a bajas alturas, mientras que los mas dismiles lo hacen a alturas grandes.

22 métodos jerárquicos Ejemplo: Análisis de agrupamiento Datos: intensidades de emisión de fluorescencia de 12 compuestos (A-L) a 4 longitudes de onda (300, 350, 400, 450 nm)

23 Ejemplo

24 Gráfico de puntuación para PCA 2 grupos

25 Euclidean Distance, Single Linkage Amalgamation Steps Step Nº Similarity Distance Clusters New Nº obs. clusters level level joined cluster new cluster ,1970 1, ,1970 1, ,7464 1, ,7464 1, ,7464 1, ,7464 1, ,7464 1, ,9944 2, ,9944 2, ,6888 2, ,5122 3,

26 Dendograma dos grupos como los obtenidos con PCA

27 métodos no jerárquicos Análisis de agrupamiento método de k-medias: separa las observaciones en k clusters, de manera que cada dato pertenezca a un grupo y sólo a uno. (o se pueden elegir k puntos semilla) cada objeto se asigna al conglomerado cuyo centroide esté más próximo OPTIMALIDAD: maximizar la homogeneidad dentro de los grupos

28 método de k-medias: Análisis de agrupamiento Una forma de cuantificar el criterio de optimalidad es: - Minimizar la media ponderada (por el tamaño del grupo) de las varianzas dentro de cada grupo para todas las variables dicho con otras palabras - Minimizar la suma de los cuadrados de las diferencias entre cada dato y la media de su grupo

29 Análisis de agrupamiento Pasos del Algoritmo de k-medias Partiendo de un conjunto inicial de k centroides, m1(1),,mk(1), que se pueden elegir al azar para evitar sesgos o por cualquier otro procedimiento, el algoritmo va alternando los dos siguientes pasos: paso de asignación: cada observación se asigna al cluster con el centroide más próximo (siguiendo el criterio de optimalidad), con la distancia euclidea. paso de centralización:para los clusters modificados se calculan los nuevos centroides. El algoritmo se considera que ha alcanzado la convergencia cuando en una iteración no se produce ningún cambio

30 método de k-medias: Análisis de agrupamiento

31 método de k-medias: Análisis de agrupamiento desventajas: el agrupamiento final refleja la elección de conglomerados (o puntos semilla) dificultades para elegir k (se debe elegir de antemano) es importante chequear distintas opciones para determinar el número de posibles clusters que hay en el conjunto de datos

32 Análisis de agrupamiento métodos no jerárquicos representaciones gráficas: gráficos de estrellas y rayos caras de Chernoff

33 métodos no jerárquicos Análisis de agrupamiento gráficos de estrellas y rayos gráficos radiales. cada estrella representa una observación, formando un polígono a partir de cada variable. el tamaño de cada línea corresponde al valor re-escalado de la variable.

34 métodos no jerárquicos caras de Chernoff Análisis de agrupamiento enfoque creado por Herman Chernoff basado en la capacidad humana para distinguir rostros. a cada variable se le asocia un rasgo o caracteristica de la cara (boca, ojos, nariz, etc..)

Tema 3: Análisis multivariante para la agrupación. Objetivo: Encontrar los grupos naturales en los que se divide la población.

Tema 3: Análisis multivariante para la agrupación. Objetivo: Encontrar los grupos naturales en los que se divide la población. Tema 3: Análisis multivariante para la agrupación Objetivo: Encontrar los grupos naturales en los que se divide la población. Ejemplo canónico en Biologia: Taxonomía Rosa doméstica Reino: Plantae (Plantas)

Más detalles

ANÁLISIS DE CONGLOMERADOS (CLUSTER ANALYSIS)

ANÁLISIS DE CONGLOMERADOS (CLUSTER ANALYSIS) ANÁLISIS DE CONGLOMERADOS (CLUSTER ANALYSIS) AGRUPAMIENTOS Cuál agrupamiento es mejor? MÉTODOS DE AGRUPACIÓN Métodos jerárquicos: Los objetos se agrupan (dividen) i por partes hasta clasificar todos los

Más detalles

Máster en Ordenación y Gestión del Desarrollo Territorial y Local. Módulo I MÉTODO Y TÉCNICAS ESTADÍSTICAS PARA EL DESARROLLO TERRITORIAL Y LOCAL

Máster en Ordenación y Gestión del Desarrollo Territorial y Local. Módulo I MÉTODO Y TÉCNICAS ESTADÍSTICAS PARA EL DESARROLLO TERRITORIAL Y LOCAL ANÁLISIS CLUSTERS C U R S O TÉCNICAS MULTIVARIANTES Prof. Dr. Ángel Luís LUCENDO MONEDERO 1 http://www.geografia.us.es/ Tema 2. INTRODUCCIÓN N AL ANÁLISIS CLUSTER 2.1 Consideraciones generales. Clasificación

Más detalles

CLASIFICACIÓN PROBLEMA SOLUCIÓN

CLASIFICACIÓN PROBLEMA SOLUCIÓN Capítulo 7 Análisis Cluster CLASIFICACIÓN Asignar objetos en su lugar correspondiente dentro de un conjunto de categorías establecidas o no. PROBLEMA Dado un conjunto de m objetos (animales, plantas, minerales...),

Más detalles

ANÁLISIS DE CONGLOMERADOS

ANÁLISIS DE CONGLOMERADOS ANÁLISIS DE CONGLOMERADOS Análisis de conglomerados Autor: Manuel Terrádez Gurrea (mterradez@uoc.edu). ESQUEMA DE CONTENIDOS Análisis de conglomerados (cluster) Interpretación de dendogramas INTRODUCCIÓN

Más detalles

Capítulo 4. Medidas de Proximidad. Proximidades Similaridades: s(a, B) Similitudes: s(a, B) 4.1. VARIABLES CUANTITATIVAS

Capítulo 4. Medidas de Proximidad. Proximidades Similaridades: s(a, B) Similitudes: s(a, B) 4.1. VARIABLES CUANTITATIVAS Capítulo 4 Medidas de Proximidad X 1,..., X p variables A = (a 1,..., a p ) valores de X 1,..., X p para el individuo A B = (b 1,..., b p ) valores de X 1,..., X p para el individuo B { Disimilaridades:

Más detalles

Análisis de Conglomerados

Análisis de Conglomerados Análisis de Conglomerados Resumen El procedimiento Análisis de Conglomerados esta diseñado para agrupar observaciones o variables en conglomerados basados en similaridades entre ellos. Los renglones de

Más detalles

Análisis Cluster. Metodología de las CC del Comp-Universitat de València. Abril Pedro Valero

Análisis Cluster. Metodología de las CC del Comp-Universitat de València. Abril Pedro Valero Análisis Cluster Pedro Valero Mora-valerop@uv.es Metodología de las CC del Comp-Universitat de València Abril 2011 Pedro Valero Mora-valerop@uv.es Metodología de las CC del Comp-Universitat de València

Más detalles

Análisis de Conglomerados

Análisis de Conglomerados Diplomatura en Estadística 1 Diplomatura en Estadística 2 Análisis de Conglomerados (Cluster analysis) Aurea Grané Departamento de Estadística Universidad Carlos III de Madrid Antecedente histórico Las

Más detalles

Clasificación Clasific NO SUPERV SUPER ISAD IS A AD AGRUPAMIENTO

Clasificación Clasific NO SUPERV SUPER ISAD IS A AD AGRUPAMIENTO Clasificación NO SUPERVISADA AGRUPAMIENTO Clasificación No Supervisada Se trata de construir clasificadores sin información a priori, o sea, a partir de conjuntos de patrones no etiquetados Objetivo: Descubrir

Más detalles

Técnicas Cuantitativas para el Management y los Negocios

Técnicas Cuantitativas para el Management y los Negocios Técnicas Cuantitativas para el Management y los Negocios Contador Público Módulo I: ESTADÍSTICA DESCRIPTIVA Contenidos Módulo I Unidad 1. Introducción y conceptos básicos Conceptos básicos de Estadística.

Más detalles

Comunidades. Buscando grupos naturales de nodos

Comunidades. Buscando grupos naturales de nodos Comunidades Buscando grupos naturales de nodos cliques, -componentes (Newman 7.8.1, 7.8.2) similaridad (N7.12) Geometria: means topologia: equivalencia estructural vs equivalencia regular Clustering jerarquico

Más detalles

Análisis de agrupamiento (Cluster nmds)

Análisis de agrupamiento (Cluster nmds) Análisis de agrupamiento (Cluster nmds) Agregación (Cluster) Conjunto de técnicas que intentan organizar la información de las unidades de muestreo (UM) en clases o grupos discretos Crea agrupaciones sobre

Más detalles

Curso de Postgrado en Herramientas Estadísticas Avanzadas: AGROPECUARIOS. Prof. Dr. José Perea Dpto. Producción Animal

Curso de Postgrado en Herramientas Estadísticas Avanzadas: AGROPECUARIOS. Prof. Dr. José Perea Dpto. Producción Animal Curso de Postgrado en Herramientas Estadísticas Avanzadas: ANÁLISIS MULTIVARIANTE PARA INVESTIGACIÓN EN SISTEMAS AGROPECUARIOS ANÁLISIS CLUSTER Prof. Dr. José Perea Dpto. Producción Animal ANÁLISIS DE

Más detalles

Sistemas Inteligentes. Tema B2T4: Aprendizaje no supervisado: algoritmo k-medias.

Sistemas Inteligentes. Tema B2T4: Aprendizaje no supervisado: algoritmo k-medias. Sistemas Inteligentes Escuela Técnica Superior de Informática Universitat Politècnica de València Tema B2T4: Aprendizaje no supervisado: algoritmo k-medias. Índice 1 Introducción 1 2 Agrupamientos particionales

Más detalles

ANALISIS DE CLUSTER CON SPSS: INMACULADA BARRERA

ANALISIS DE CLUSTER CON SPSS: INMACULADA BARRERA ANALISIS DE CLUSTER CON SPSS: INMACULADA BARRERA ANALISIS DE CLUSTER EN SPSS Opción: Analizar Clasificar ANALISIS DE CLUSTER EN SPSS Tres posibles OPCIONES 1.- Cluster en dos etapas 2.- K-means 3.- Jerárquicos

Más detalles

Práctica 3. Para comenzar esta práctica abrimos el programa SPSS.

Práctica 3. Para comenzar esta práctica abrimos el programa SPSS. Análisis de Datos Licenciatura en Biología Curso oo9/o0 Práctica 3 El fichero de datos necesario para realizar esta práctica, turtlefmxls, se encuentra en la página web http//wwwuames/danielfaraco La ruta

Más detalles

INFORMÁTICA APLICADA AL ANÁLISIS ECONÓMICO - FONDO SOCIAL EUROPEO ANÁLISIS CLUSTER IDEA CONCEPTUAL BÁSICA: DEFINICIÓN:

INFORMÁTICA APLICADA AL ANÁLISIS ECONÓMICO - FONDO SOCIAL EUROPEO ANÁLISIS CLUSTER IDEA CONCEPTUAL BÁSICA: DEFINICIÓN: IDEA CONCEPTUAL BÁSICA: La heterogeneidad de una población constituye la materia prima del análisis cuantitativo...... sin embargo, en ocasiones, el individuo u objeto particular, aislado, resulta un "recipiente"

Más detalles

RESUMEN ANÁLISIS CLUSTER

RESUMEN ANÁLISIS CLUSTER RESUMEN ANÁLISIS CLUSTER 1. Introducción 2. Los datos 2.1. Transformación de los datos 3. Medidas de distancias 4. Métodos: aspectos generales 5. El método jerárquico aglomerativo 5.1 Algoritmos más usados

Más detalles

INTRODUCCION AL ANALISIS DE CLUSTER

INTRODUCCION AL ANALISIS DE CLUSTER -1- INTRODUCCION AL ANALISIS DE CLUSTER José Luis Vicente Villardón Departamento de Estadística Universidad de Salamanca -- DEFINICION E INTRODUCCION El Análisis de Clusters (o Análisis de conglomerados)

Más detalles

Representaciones Gráficas en el Análisis Multivariado

Representaciones Gráficas en el Análisis Multivariado Cómo observar en un espacio de tantas dimensiones? Una etapa importante en el análisis y modelación de datos multivariados es su representación gráfica. John Tukey (1977) en su trabajo sobre análisis exploratorio

Más detalles

TÉCNICAS DE AGRUPAMIENTO

TÉCNICAS DE AGRUPAMIENTO TÉCNICAS DE AGRUPAMIENTO José D. Martín Guerrero, Emilio Soria, Antonio J. Serrano PROCESADO Y ANÁLISIS DE DATOS AMBIENTALES Curso 2009-2010 Page 1 of 11 1. Algoritmo de las C-Medias. Algoritmos de agrupamiento

Más detalles

Introducción a las técnicas estadísticas de

Introducción a las técnicas estadísticas de Introducción a las técnicas estadísticas de clasificación y regresión. Aprendizaje no supervisado - Clustering Laura Aspirot, Sebastián Castro Universidad de la República (UdelaR) Jueves 21 y viernes 22

Más detalles

Introducción a las técnicas de Análisis Multivariante

Introducción a las técnicas de Análisis Multivariante Introducción a las técnicas de Análisis Multivariante Dagoberto Salgado Horta Universidad del Tolima Dagoberto Salgado Horta 1 Análisis multivariante Objetivo: estudio de varias variables simultáneamente:

Más detalles

Tema: Validación de Cuestionarios con SPSS

Tema: Validación de Cuestionarios con SPSS Tema: Validación de Cuestionarios con SPSS 1.- Análisis de fiabilidad 1.1.- Introducción El análisis de fiabilidad permite estudiar las propiedades de las escalas de medición y de los elementos que las

Más detalles

Conceptos de Estadística

Conceptos de Estadística Definición de Estadística La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Conceptos de Estadística

Más detalles

Contenido. 2 Operatoria con matrices. 3 Determinantes. 4 Matrices elementales. 1 Definición y tipos de matrices

Contenido. 2 Operatoria con matrices. 3 Determinantes. 4 Matrices elementales. 1 Definición y tipos de matrices elementales Diciembre 2010 Contenido Definición y tipos de matrices elementales 1 Definición y tipos de matrices 2 3 4 elementales 5 elementales Definición 1.1 (Matriz) Una matriz de m filas y n columnas

Más detalles

Tema 2 Datos multivariantes

Tema 2 Datos multivariantes Aurea Grané Máster en Estadística Universidade Pedagógica 1 Aurea Grané Máster en Estadística Universidade Pedagógica 2 Tema 2 Datos multivariantes 1 Matrices de datos 2 Datos multivariantes 2 Medias,

Más detalles

Introducción Ordenación Clasificación Ord. + Clas. Geobotánica. Tema 12 Ordenación y clasificación

Introducción Ordenación Clasificación Ord. + Clas. Geobotánica. Tema 12 Ordenación y clasificación Introducción Clasificación Ord. + Clas. Geobotánica Tema 12 y clasificación Copyright: 2011 Francisco Alcaraz Ariza. Esta obra está bajo una licencia de Reconocimiento-No Comercial de Creative Commons

Más detalles

FLORIDA Secundaria. 1º BACH MATEMÁTICAS CCSS -1- BLOQUE ESTADÍSTICA: ESTADÍSTICA VARIABLE UNIDIMENSIONAL. Estadística variable unidimensional

FLORIDA Secundaria. 1º BACH MATEMÁTICAS CCSS -1- BLOQUE ESTADÍSTICA: ESTADÍSTICA VARIABLE UNIDIMENSIONAL. Estadística variable unidimensional FLORIDA Secundaria. 1º BACH MATEMÁTICAS CCSS -1- Estadística variable unidimensional 1. Conceptos de Estadística 2. Distribución de frecuencias 2.1. Tablas de valores con variables continuas 3. Parámetros

Más detalles

Capítulo 8. Análisis Discriminante

Capítulo 8. Análisis Discriminante Capítulo 8 Análisis Discriminante Técnica de clasificación donde el objetivo es obtener una función capaz de clasificar a un nuevo individuo a partir del conocimiento de los valores de ciertas variables

Más detalles

Análisis Cluster en SPSS

Análisis Cluster en SPSS Análisis Cluster en SPSS M. D olores M artínez M iranda Profesora del D pto. E stadística e I.O. U niversidad de G ranada Referencias bibliográficas 1. Hair, J.F., Anderson, R.E., Tatham, R.L. y Black,

Más detalles

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2 PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2 Preg. 1. Para comparar la variabilidad relativa de la tensión arterial diastólica y el nivel de colesterol en sangre de una serie de individuos, utilizamos

Más detalles

Nota técnica Estratificación multivariada

Nota técnica Estratificación multivariada Instituto Nacional de Estadística y Geografía Nota técnica Estratificación multivariada Censo de Población y Vivienda 2010 NOTA TÉCNICA ESTRATIFICACIÓN MULTIVARIADA Con la finalidad de que el usuario pueda

Más detalles

Gráfico de Control T-Cuadrada Multivariada

Gráfico de Control T-Cuadrada Multivariada Gráfico de Control T-Cuadrada Multivariada STATGRAPHICS Rev. 25/04/2007 Resumen El procedimiento Gráfico de Control T-Cuadrada Multivariada crea diagramas de control para dos o más variables numéricas.

Más detalles

ANÁLISIS DE CONGLOMERADOS. Prof. Esperanza Ayuga Téllez

ANÁLISIS DE CONGLOMERADOS. Prof. Esperanza Ayuga Téllez ANÁLISIS DE CONGLOMERADOS Prof. Esperanza Ayuga Téllez Tiene por objeto agrupar elementos en grupos homogéneos en función de las similitudes entre ellos. Detecta grupos internamente homogéneos (y (y heterogéneos

Más detalles

Semana 14 [1/28] Matrices. 22 de julio de Matrices

Semana 14 [1/28] Matrices. 22 de julio de Matrices Semana 14 [1/28] 22 de julio de 2007 Definiciones básicas Semana 14 [2/28] Definiciones básicas Matriz Una matriz A, de m filas y n columnas con coeficientes en el cuerpo à (en este apunte à será Ê ó C)

Más detalles

Tema 8: Distribuciones Unidimensionales y Distribuciones Bidimensionales. Consideraciones iniciales:

Tema 8: Distribuciones Unidimensionales y Distribuciones Bidimensionales. Consideraciones iniciales: Tema 8: Distribuciones Unidimensionales y Distribuciones Bidimensionales. Consideraciones iniciales: - Población: Es el conjunto de todos los elementos que cumplen una determinada característica. Ej.:

Más detalles

OPTIMIZACIÓN VECTORIAL

OPTIMIZACIÓN VECTORIAL OPTIMIZACIÓN VECTORIAL Métodos de Búsqueda Directa Utilizan sólo valores de la función Métodos del Gradiente Métodos de Segundo Orden Requieren valores aproimados de la primera derivada de f) Además de

Más detalles

ESTADÍSTICA. Rincón del Maestro:

ESTADÍSTICA. Rincón del Maestro: ESTADÍSTICA Definición de Estadística La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Conceptos

Más detalles

Laura de la Fuente Crespo. Análisis Cluster

Laura de la Fuente Crespo. Análisis Cluster Laura de la Fuente Crespo Análisis Cluster Análisis Cluster ÍNDICE Teoría Análisis Cluster... 1 Análisis Cluster No Jerárquico con SPSS... 25 Análisis Cluster Jerárquico con SPSS... 36 Análisis Cluster

Más detalles

Primero se inicializan dos puntos (tantos como clusters queremos) al azar. Estos puntos se denominan centroides del cluster.

Primero se inicializan dos puntos (tantos como clusters queremos) al azar. Estos puntos se denominan centroides del cluster. K-Means Introducción El algoritmo k-means es el algoritmo de clustering más popular y ampliamente utilizado. Algoritmo Supongamos que queremos agrupar los siguientes datos en dos clusters Primero se inicializan

Más detalles

Redes de Neuronas de Base Radial

Redes de Neuronas de Base Radial Redes de Neuronas de Base Radial 1 Introducción Redes multicapa con conexiones hacia delante Única capa oculta Las neuronas ocultas poseen carácter local Cada neurona oculta se activa en una región distinta

Más detalles

Matemáticas 2.º Bachillerato. Matemáticas 2.º Bachillerato. Matemáticas 2.º Bachillerato. Ejemplo:

Matemáticas 2.º Bachillerato. Matemáticas 2.º Bachillerato. Matemáticas 2.º Bachillerato. Ejemplo: Mapa conceptual Determinante de segundo orden Dada una matriz cuadrada de segundo orden: a a 11 12 A = a a 21 22 se llama determinante de A al número real: det (A)= A = a11 a 12 = a a a a a21 a22 11 22

Más detalles

Tema 3: Estadística Descriptiva

Tema 3: Estadística Descriptiva Tema 3: Estadística Descriptiva Estadística. 4 o Curso. Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 3: Estadística Descriptiva Curso 2008-2009 1 / 27 Índice

Más detalles

VQ. Algorítmica de reconocimiento de voz VQ.1. Reconocimiento de patrones

VQ. Algorítmica de reconocimiento de voz VQ.1. Reconocimiento de patrones VQ. Algorítmica de reconocimiento de voz VQ.1. Reconocimiento de patrones Por reconocimiento de patrones se entiende la realización de una comparación entre una muestra representativa de la señal de voz,

Más detalles

ESTADÍSTICA DESCRIPTIVA EN POCAS PALABRAS (por jmd matetam.com)

ESTADÍSTICA DESCRIPTIVA EN POCAS PALABRAS (por jmd matetam.com) ESTADÍSTICA DESCRIPTIVA EN POCAS PALABRAS (por jmd matetam.com) ESTADÍSTICA DESCRIPTIVA EN POCAS PALABRAS... 1 DEFINICIONES BÁSICAS... 1 Estadística... 1 Estadística descriptiva... 1 Estadística inferencial...

Más detalles

Clasificación Jerárquica Ascendente Presentación #1. [ U n a i n t r o d u c c i ó n ]

Clasificación Jerárquica Ascendente Presentación #1. [ U n a i n t r o d u c c i ó n ] Clasificación Jerárquica Ascendente Presentación #1 [ U n a i n t r o d u c c i ó n ] Clasificación Jerárquica Clasificación Automática La clasificación automática tiene por objetivo reconocer grupos de

Más detalles

Julio Deride Silva. 18 de agosto de 2010

Julio Deride Silva. 18 de agosto de 2010 Estadística Descriptiva Julio Deride Silva Área de Matemática Facultad de Ciencias Químicas y Farmcéuticas Universidad de Chile 18 de agosto de 2010 Tabla de Contenidos Estadística Descriptiva Julio Deride

Más detalles

Estadística ESTADÍSTICA

Estadística ESTADÍSTICA ESTADÍSTICA La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Un estudio estadístico consta

Más detalles

1 Cómo introducir datos de archivos de Excel (.xls) en SPSS/PC?

1 Cómo introducir datos de archivos de Excel (.xls) en SPSS/PC? Análisis de Datos Licenciatura en Biología Curso 2o10/2o11 Práctica 1 El fichero de datos necesario para realizar esta práctica, alligator.xls, se encuentra en la página web http://www.uam.es/daniel.faraco/ad11.

Más detalles

Asimetría Coeficiente de Asimetría de Fisher

Asimetría Coeficiente de Asimetría de Fisher Asimetría Si los valores de la serie de datos presenta la misma forma a izquierda y derecha de un valor central (media aritmética) se dice que es simétrica de lo contrario será asimétrica. Para medir el

Más detalles

Tareas de la minería de datos: agrupamiento. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR

Tareas de la minería de datos: agrupamiento. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Tareas de la minería de datos: agrupamiento CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Agrupamiento Agrupamiento (clasificación no supervisada, aprendizaje no supervisado).

Más detalles

Redes Neuronales Artificiales

Redes Neuronales Artificiales Red de Hopfield Almacenar un conjunto de p patrones de forma tal que cuando se presente un nuevo patrón, la red responda produciendo alguno de los patrones previamente almacenados que más se parezca al

Más detalles

3 ANALISIS DESCRIPTIVO DE LOS DATOS

3 ANALISIS DESCRIPTIVO DE LOS DATOS 3 ANALISIS DESCRIPTIVO DE LOS DATOS 3.1 La tabulación de los datos 3.1.1 Tabla de distribución de frecuencias. 3.1.2 El histograma. 3.2 Medidas de tendencia central 3.2.1 La media. 3.2.2 La mediana. 3.2.3

Más detalles

Figura 1: Esquema de las tablas simplex de inicio y general.

Figura 1: Esquema de las tablas simplex de inicio y general. RELACIONES PRIMAL-DUAL Los cambios que se hacen en el modelo original de programación lineal afectan a los elementos de la tabla óptima actual el que se tenga en el momento, que a su vez puede afectar

Más detalles

UNIDAD 8. ESTADÍSTICA

UNIDAD 8. ESTADÍSTICA UNIDAD 8. ESTADÍSTICA La Estadística es la rama de las Matemáticas que se ocupa de la recopilación y ordenación de datos para su posterior análisis. 1. Población y muestra. Población. Es el conjunto de

Más detalles

RECONOCIMIENTO DE PAUTAS

RECONOCIMIENTO DE PAUTAS RECONOCIMIENTO DE PAUTAS ANÁLISIS DISCRIMINANTE (Discriminant analysis) Reconocimiento de pautas supervisado si se cuenta con objetos cuya pertenencia a un grupo es conocida métodos: análisis de discriminantes

Más detalles

Tema 1: Análisis de datos univariantes

Tema 1: Análisis de datos univariantes Tema 1: Análisis de datos univariantes 1 En este tema: Conceptos fundamentales: muestra y población, variables estadísticas. Variables cualitativas o cuantitativas discretas: Distribución de frecuencias

Más detalles

Estadística II Tema 1: Distribución normal multivariante

Estadística II Tema 1: Distribución normal multivariante Estadística II Tema 1: Distribución normal multivariante José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Algunas propiedades de los vectores aleatorios Sea X = (X 1,..., X

Más detalles

La práctica del análisis de correspondencias

La práctica del análisis de correspondencias La práctica del análisis de correspondencias MICHAEL GREENACRE Catedrático de Estadística en la Universidad Pompeu Fabra Separata del apéndice D Glosario de términos Primera edición: julio 2008 ISBN: 978-84-96515-71-0

Más detalles

3. Clasificación no supervisada

3. Clasificación no supervisada 3. El presente capítulo y el siguiente tratan de clasificación, es por ello que antes de abordar el tema específico de este capítulo, previamente se hará una introducción al tema de clasificación. 3.1

Más detalles

Definición de la época de incendios en un contexto multivariado 1

Definición de la época de incendios en un contexto multivariado 1 Definición de la época de incendios en un contexto multivariado 1 Marcos Pedro Ramos Rodríguez 2 ; Yudisnelvis González Menzonet 3 Resumen En este trabajo se presenta un método para definir la época de

Más detalles

Exploración de datos

Exploración de datos Mathieu Departamento de Matemática Aplicada y Estadística Universidad Politécnica de Cartagena Cartagena, Enero 2010 Guión 1 Introducción 2 Unos cuantos términos 3 Tabulación y representaciones gráficas

Más detalles

Tema 11. Clustering. X 1... X i... X n O 1 x x 1 i... x 1 n... O j x j 1... x j i... x j n... O N x N 1... x N i... x N n

Tema 11. Clustering. X 1... X i... X n O 1 x x 1 i... x 1 n... O j x j 1... x j i... x j n... O N x N 1... x N i... x N n Tema 11. Clustering Abdelmalik Moujahid, Iñaki Inza, Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del País Vasco Euskal Herriko Unibertsitatea 1 Introducción

Más detalles

Reconocimiento de Patrones

Reconocimiento de Patrones Reconocimiento de Patrones Técnicas de validación (Clasificación Supervisada) Jesús Ariel Carrasco Ochoa Instituto Nacional de Astrofísica, Óptica y Electrónica Clasificación Supervisada Para qué evaluar

Más detalles

Repaso de álgebra de matrices y probabilidad. Javier Santibáñez (IIMAS, UNAM) Regresión Semestre / 58

Repaso de álgebra de matrices y probabilidad. Javier Santibáñez (IIMAS, UNAM) Regresión Semestre / 58 Repaso de álgebra de matrices y probabilidad Javier Santibáñez (IIMAS, UNAM) Regresión Semestre 2017-2 1 / 58 Preliminares Definición (matriz) Una matriz de dimensión m n es un arreglo rectangular de números

Más detalles

Interfaz hombre máquina basado en el análisis de los gestos faciales mediante visión artificial

Interfaz hombre máquina basado en el análisis de los gestos faciales mediante visión artificial UNIVERSIDAD DE ALCALÁ Escuela Politécnica Superior INGENIERÍA DE TELECOMUNICACIÓN Interfaz hombre máquina basado en el análisis de los gestos faciales mediante visión artificial Proyecto Fin de Carrera

Más detalles

Clasificación Jerárquica Ascendente Presentación #1. [ U n a i n t r o d u c c i ó n ]

Clasificación Jerárquica Ascendente Presentación #1. [ U n a i n t r o d u c c i ó n ] Clasificación Jerárquica Ascendente Presentación #1 [ U n a i n t r o d u c c i ó n ] Clasificación Jerárquica Clasificación Automática La clasificación automática tiene por objetivo reconocer grupos de

Más detalles

Clustering. Departamento de Ingeniería Informática y de Sistemas Universidad de La Laguna

Clustering. Departamento de Ingeniería Informática y de Sistemas Universidad de La Laguna Clustering Christopher Expósito Izquierdo Airam Expósito Márquez Israel López Plata Belén Melián Batista J. Marcos Moreno Vega {cexposit, aexposim, ilopezpl, mbmelian, jmmoreno}@ull.edu.es Departamento

Más detalles

ESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA

ESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA Definición de Estadística: La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer

Más detalles

Componentes principales (II)

Componentes principales (II) Componentes principales (II) Eliseo Martínez Herrera 1. Propiedades de los componentes Los componentes principales tienen las siguientes propiedades: 1 La suma de las varianzas de los componentes es igual

Más detalles

Medidas de dispersión

Medidas de dispersión Medidas de dispersión Las medidas de dispersión nos informan sobre cuánto se alejan del centro los valores de la distribución. Las medidas de dispersión son: Rango o recorrido El rango es la diferencia

Más detalles

Medidas de posición relativa

Medidas de posición relativa Medidas de posición relativa Copyright 2010, 2007, 2004 Pearson Education, Inc. All Rights Reserved. 3.1-1 Medidas de posición relativa Son medidas que pueden utilizarse para comparar valores de diferentes

Más detalles

Ejemplos de análisis cluster

Ejemplos de análisis cluster Ejemplos de análisis cluster Objetivos: 1. Una aproximación a la terminología del análisis cluster o de conglomerados 2. Uso de las funciones oportunas de R para realizar el análisis 3. Interpretación

Más detalles

Análisis de la relación precio marginal y demanda de electricidad mediante conglomerados

Análisis de la relación precio marginal y demanda de electricidad mediante conglomerados Análisis de la relación precio marginal y demanda de electricidad mediante conglomerados Andrés Ramos, Gonzalo Cortés, Jesús María Latorre, Santiago Cerisola Universidad Pontificia Comillas Índice Introducción

Más detalles

ANÁLISIS DE COMPONENTES PRINCIPALES

ANÁLISIS DE COMPONENTES PRINCIPALES CAPÍTULO 4 ANÁLISIS DE COMPONENTES PRINCIPALES 4.1 Introducción Al investigar un fenómeno desconocido se pretende abordarlo con muestras de diferentes variables, en las cuales muchas veces existe una fuerte

Más detalles

Reducción de la Dimensionalidad en Análisis de Datos. Análisis de Componentes Principales.

Reducción de la Dimensionalidad en Análisis de Datos. Análisis de Componentes Principales. Reducción de la Dimensionalidad en Análisis de. Análisis de Componentes Principales. A. Jiménez, A. Murillo, E. Piza, M. Villalobos, J. Trejos. April 27, 2010 Contenido 1 Objetivo. 2 Solución. 3. Calidad

Más detalles

ÍNDICE INTRODUCCIÓN... 21

ÍNDICE INTRODUCCIÓN... 21 INTRODUCCIÓN... 21 CAPÍTULO 1. ORGANIZACIÓN DE LOS DATOS Y REPRESENTACIONES GRÁFICAS... 23 1. ORGANIZACIÓN DE LOS DATOS... 23 1.1. La distribución de frecuencias... 24 1.2. Agrupación en intervalos...

Más detalles

Fundamentos de Estadística y Simulación Básica

Fundamentos de Estadística y Simulación Básica Fundamentos de Estadística y Simulación Básica TEMA 2 Estadística Descriptiva Clasificación de Variables Escalas de Medición Gráficos Tabla de frecuencias Medidas de Tendencia Central Medidas de Dispersión

Más detalles

Estadística. Conceptos de Estadística Descriptiva

Estadística. Conceptos de Estadística Descriptiva Estadística Conceptos de Estadística Descriptiva Estadística Descriptiva Recordemos que : Es la rama de la Estadística que trata básicamente sobre la recolección, organización, presentación, descripción,

Más detalles

TEMA 14 ESTADÍSTICA. Cuantitativa: si puede medirse y expresarse con números (es una variable), por ejemplo la talla de calzado.

TEMA 14 ESTADÍSTICA. Cuantitativa: si puede medirse y expresarse con números (es una variable), por ejemplo la talla de calzado. Objetivos / Criterios de evaluación TEMA 14 ESTADÍSTICA O.15.1 Conocer el significado y saber calcular los parámetros de centralización y dispersión O.15.2 Interpretar y utilizar los parámetros de dispersión.

Más detalles

Curso de nivelacioón Estadiística y Matemaática Matrices Derivadas. Universidad de Costa Rica Programa Técnico en Riesgo

Curso de nivelacioón Estadiística y Matemaática Matrices Derivadas. Universidad de Costa Rica Programa Técnico en Riesgo Curso de nivelacioón Estadiística y Matemaática Matrices Derivadas Universidad de Costa Rica Programa Técnico en Riesgo 6 de Mayo 2017 1 / 51 1 Matrices y vectores Suma y resta Producto Inversa 2 Repaso

Más detalles

PRINCIPIOS DE PSICOMETRIA. Universidad Intercontinental Facultad de Psicología Área de la Salud

PRINCIPIOS DE PSICOMETRIA. Universidad Intercontinental Facultad de Psicología Área de la Salud PRINCIPIOS DE PSICOMETRIA Universidad Intercontinental Facultad de Psicología Área de la Salud PRINCIPIOS DE PSICOMETRIA MEDICION La medición de habilidades cognitivas Prueba: muestra de una conducta particular.

Más detalles

DESCRIPCIÓN DE DATOS. Medidas Numéricas

DESCRIPCIÓN DE DATOS. Medidas Numéricas DESCRIPCIÓN DE DATOS Medidas Numéricas MEDIDAS DE TENDENCIA CENTRAL O POSICIÓN MEDIA ARITMÉTICA O PROMEDIO Media poblacional Cualquier característica medible de una población recibe el nombre de parámetro

Más detalles

Tema 5: Muestreo sistemático

Tema 5: Muestreo sistemático Tema 5: Muestreo sistemático Contenido 1- Definición, Ventajas Desventajas, Variantes del muestreo sistemático, selección de una muestra sistemática. - Muestreo sistemático como Estratificado o Conglomerado

Más detalles

UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS FACULTAD DE INGENIERÍA PROYECTO CURRICULAR DE INGENIERÍA DE SISTEMAS

UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS FACULTAD DE INGENIERÍA PROYECTO CURRICULAR DE INGENIERÍA DE SISTEMAS I. IDENTIFICACIÓN DE LA ASIGNATURA ESTADÍSTICA I CÓDIGO DE LA ASIGNATURA 33102106 ÁREA CIENCIAS BASICAS DE INGENIERIA SEMESTRE SEGUNDO PLAN DE ESTUDIOS 1996 AJUSTE 2002 HORAS TOTALES POR SEMESTRE 64 HORAS

Más detalles

Análisis de imágenes digitales

Análisis de imágenes digitales Análisis de imágenes digitales SEGMENTACIÓN DE LA IMAGEN Segmentación basada en texturas INTRODUCCIÓN La textura provee información sobre la distribución espacio-local del color o niveles de intensidades

Más detalles

DISTRIBUCIONES DE PROBABILIDAD

DISTRIBUCIONES DE PROBABILIDAD DISTRIBUCIONES DE PROBABILIDAD VARIABLE ALEATORIA Una variable x valuada numéricamente varía o cambia, dependiendo del resultado particular del experimento que se mida. Por ejemplo, suponga que se tira

Más detalles

A = , B = 2 2. a 11 a 1n a 21 a 2n A = a m1 a mn

A = , B = 2 2. a 11 a 1n a 21 a 2n A = a m1 a mn Máster en Materiales y Sistemas Sensores para Tecnologías Medioambientales Erasmus Mundus NOTAS DE CÁLCULO NUMÉRICO Damián Ginestar Peiró ESCUELA TÉCNICA SUPERIOR DE INGENIERÍA DEL DISEÑO UNIVERSIDAD POLITÉCNICA

Más detalles

MASTER EN CIENCIAS ACTUARIALES Y FINANCIERAS PLAN Módulo: ANÁLISIS DEL RIESGO ACTUARIAL Y FINANCIERO

MASTER EN CIENCIAS ACTUARIALES Y FINANCIERAS PLAN Módulo: ANÁLISIS DEL RIESGO ACTUARIAL Y FINANCIERO MASTER EN CIENCIAS ACTUARIALES Y FINANCIERAS PLAN 2009 Nombre de asignatura: ESTADÍSTICA ACTUARIAL III: ANÁLISIS MULTIVARIANTE DE DATOS Código: 603377 Materia: ESTADÍSTICA ACTUARIAL Módulo: ANÁLISIS DEL

Más detalles

Parte 3. Vectores y valores propios

Parte 3. Vectores y valores propios Parte 3. Vectores y valores propios Gustavo Montero Escuela Universitaria Politécnica Universidad de Las Palmas de Gran Canaria Curso 2004-2005 1 Introducción a los valores y vectores propios 2 3 4 5 Valores

Más detalles

Matrices: repaso. Denotaremos con M m n el conjunto de matrices de tamaño m n, o sea, de m filas y n columnas. Una matriz A M m n es de la forma A =

Matrices: repaso. Denotaremos con M m n el conjunto de matrices de tamaño m n, o sea, de m filas y n columnas. Una matriz A M m n es de la forma A = Matrices: repaso Denotaremos con M m n el conjunto de matrices de tamaño m n, o sea, de m filas y n columnas Una matriz A M m n es de la forma a 11 a 1n A = a m1 a mn Denotaremos A ij = a ij el coeficiente

Más detalles

Análisis de Correspondencias

Análisis de Correspondencias Análisis de Correspondencias Introducción El análisis de correspondencias es una técnica descriptiva para representar tablas de contingencia. Los datos de partida para el análisis de correspondencias es

Más detalles

Estadística. Análisis de datos.

Estadística. Análisis de datos. Estadística Definición de Estadística La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Un

Más detalles

Estadística Inga Patricia Juárez, 2017 MEDIDAS DE TENDENCIA CENTRAL

Estadística Inga Patricia Juárez, 2017 MEDIDAS DE TENDENCIA CENTRAL MEDIDAS DE TENDENCIA CENTRAL Las medidas de tendencia central nos proporcionan la descripción significativa de un conjunto de observaciones. Como su nombre lo indica, son datos de una variable que tienden

Más detalles

CONTENIDOS EXÁMEN DE ADMISIÓN MATEMÁTICA SEGUNDO BÁSICO 2017

CONTENIDOS EXÁMEN DE ADMISIÓN MATEMÁTICA SEGUNDO BÁSICO 2017 SEGUNDO BÁSICO 2017 DEPARTAMENTO ÁMBITO NUMÉRICO 0-50 - Escritura al dictado - Antecesor y sucesor - Orden (menor a mayor y viceversa) - Patrones de conteo ascendente (2 en 2, 5 en 5, 10 en 10) - Comparación

Más detalles

Medidas de dispersión. Rango o recorrido. Desviación media. Medidas de dispersión

Medidas de dispersión. Rango o recorrido. Desviación media. Medidas de dispersión Inicio Aritmética Álgebra Geometría Cálculo Estadística Trigonometría A B C D E F G H I J K L M N O P Q R S T U V W X Y Z Medidas de dispersión Las medidas de dispersión nos informan sobre cuánto se alejan

Más detalles

ESTADISTICA Y PROBABILIDAD ESTADÍSTICA

ESTADISTICA Y PROBABILIDAD ESTADÍSTICA ESTADÍSTICA La estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comprobaciones y sacar conclusiones. Un estudio estadístico consta

Más detalles

INVERSA DE UNA MATRIZ

INVERSA DE UNA MATRIZ INVERSA DE UNA MATRIZ Profesores Omar Darío Saldarriaga Ortíz Ivan Darío Gómez Hernán Giraldo 2009 Definición Sean x = x 1 x n y y = y 1 y n vectores de n componentes, definimos el producto interno o producto

Más detalles