Tema 3: Análisis multivariante para la agrupación. Objetivo: Encontrar los grupos naturales en los que se divide la población.

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Tema 3: Análisis multivariante para la agrupación. Objetivo: Encontrar los grupos naturales en los que se divide la población."

Transcripción

1 Tema 3: Análisis multivariante para la agrupación Objetivo: Encontrar los grupos naturales en los que se divide la población.

2 Ejemplo canónico en Biologia: Taxonomía Rosa doméstica Reino: Plantae (Plantas) Grupo: Tracteophyta (planta vascular) Subgrupo: Pteropsida (planta de helechos y semillas) Clase: Dicotyledoneae Orden: Rosales Familia: Rosaceae (Cerezas, ciruelo, espino, rosas y relativos Género: Rosa Especia: Galliea (Rosa domestica) La clasificicación procede de lo mas nátural a lo mas particular Demografía, Medio ambiente (vulnerabilidad de los acuíferos)

3 La técnica de subdividir una población en distintos grupos se llama Cluster Analysis (Análisis de conglomerados) Malas noticias! El análisis de conglomerados es altamente empírico. Hay distintos métodos que pueden dar lugar a muy diferentes grupos. Además, como los grupos Son desconocidos a priori es difícil juzgar los resultados

4 Problema de clasificación Dada una matriz de datos X correspondiente a n individuos, el problema consiste en asignar los n individuos a k grupos siguiendo dos reglas Regla I: Cada elemento se asigna a un único grupo Regla II: Cada grupo es homogeneo internamente Cómo medimos la homogeneidad de un grupo? (similitudes) Regla III: Distintos grupos son heterogeneos (distancias)

5 Similitudes y distancias Nota: Para este problema se utiliza la noción de distancia Euclidea. La distancia de Mahalanobis nos añadiría mas información pero como no sabemos los grupos no conocemos las correspondientes matrices de varianzas covarianzas. Matriz de distancias

6 Nota II: Dependiendo del problema nos interesa trabajar con las variables estandarizadas o no (A veces interesa dar mas peso a las variables con magnitudes mas grandes). En un Problema real puede ser conveniente hacer ambas Nota III: No siempre lo mas conveniente es usar la distancia Euclidea (Distancia de Manhattan, Minkowski..) Nota IV: Si las variables toman valores en los que las unidades son ficticias (Variables cualitativas) nos interesa cambiar el concepto de distancia por El de

7 Similitudes Variables binarias (o dicotómicas) X 1 0 hombre 1 mujer X 2 0 fumador 1 No fumador X 3 0 sobrepeso 1 Sin sobrepeso

8 Similitudes Supongamos dos observaciones de p-variables binarias x [1,0,0,1,0,1] [1,0,1,0,0,1] i x j Definiciones a=número de veces que ambas observaciones tienen 1 b= Número de veces que la observación i tiene 1 y la j 0 c=número de veces que la observación j tiene 0 y la i 1 d=numero de veces que ambas tienen 0

9

10 Proporción de apariciones Proporción de coincidencias

11

12

13 Matriz de similitudes

14

15 Métodos de agrupación Métodos jerárquicos: Los grupos van creciendo de mas a menos homogéneos Métodos no jerárquicos: Se forman grupos homogéneos, pero no se establecen relaciones dentro de los grupos Jerarquicos Los que estudiaremos De Aglomeración; Parten de elementos individuales y (usando similitudes o distancias ) las van agregando a grupos De división ; Parten del total como un único grupo y lo van dividiendo sucesivamente hasta llegar a los elementos individuales

16 Descripción del metodo jerárquico de aglomeración Punto de Partida: La matriz de similitudes o matriz de distancias.

17 La matriz de similitudes N=5 1- Comenzamos con n clusters con un solo elemento 2- Buscamos en la matriz de similitudes (distancias) el par con mayor similitud (menor distancia) e.g U V A (Agrostis tenuis) y F(Festuca Rubra) 3- Unimos los cluster es U y V formando uno nuevo UV. Y actualizamos la Matriz ahora con N-1 clusteres. 4- Repetimos los pasos 2 y 3 hasta quedarnos con un único cluster

18 ????

19 Se comparan Los mas cerca nos Se comparan Los Mas lejanos Se comparan Los centroides Distintos métodos dan lugar a distintos clusteres!

20 Park Grass con Encadenamiento simple o vecino mas próximo = AF y D son los mas cercanos!

21 Calculamos la nueva matriz de similitudes Solo nos quedan 3 clusteres, AFD, B y C AFD y B son los mas cercanos!

22 Calculamos la nueva matriz de similitudes

23 Representanciones del algoritmo jerárquico I: Historial de Conglomeración Parte Importante

24 II: Dendograma

25 Ejemplos tipos de maiz en venezuela

26 Variables demográficas

27 Otros métodos Vecino mas lejano Paso I: empezamos con la misma matriz que nos da el mismo cluster AF

28 Paso II: Ahora el cálculo de la distancia entre clusters es diferente! Paso III: y asi seguimos --

29 Resultado

30 Método de centroides (distancias) La respuesta es diferente!

31 Problema: Como decidir cuantos grupos significativos hay? Respuesta: Anova, A. Discriminante SENTIDO COMÚN (INFORMACIÓN EXTERNA), SCDG Respuesta: Se corta el dendograma en un lugar sensato de manera que los Clusteres seleccionados tengan alguna significación.

32

33 Ejemplos tipos de maiz en venezuela

34 Métodos no jerarquicos (K-medias) Paso I: Decidimos cuantos grupos queremos (K) (despues veremos un criterio) Paso II: Asignamos aleatoriamente n/k elementos a cada grupo. Tenemos K grupos 1 K i Paso III: Hallamos el centro de cada grupo. Obtenemos K centros x i

35 Paso IV: Para cada elemento x_i hallamos su distancia (Euclidea) a cada x k y le reasignamos al grupo que la minimiza. Obtenemos K nuevos grupos posiblemente distintos K 2 i Paso V=Paso III: Repetimos el proceso obteniendo nuevo grupo 3 K i Paso V=Paso III: Repetimos el proceso hasta llegar a una etapa j tal que K j K j 1 i i

36 Criterio de homogeneidad : Suma del cuadrado de la distancia entre los Grupos (SCDG) Mide la homogeneidad entre los grupos (los grupos finales minimizan SCDG). Metodo jerarquico de Ward. Criterio para decidir cuantos grupos Es un viejo conocido disfrazado

37 Cuántos grupos? F>10 F<10 K+1 grupos seran mas homogeneos No interesa hacer grupos mas pequeños

38 Tortugas I

39 Tortugas II

40 Cocodrilos Qué clusters tienen interpretación?

INTRODUCCION AL ANALISIS DE CLUSTER

INTRODUCCION AL ANALISIS DE CLUSTER -1- INTRODUCCION AL ANALISIS DE CLUSTER José Luis Vicente Villardón Departamento de Estadística Universidad de Salamanca -- DEFINICION E INTRODUCCION El Análisis de Clusters (o Análisis de conglomerados)

Más detalles

Tema 2: Análisis Discriminante

Tema 2: Análisis Discriminante Tema 2: Análisis Discriminante P 1 P 2 Problema de clasificación: Ténemos observaciones que corresponden a 2 grupos P_1, P_2. Si nos dan uno nuevo x_0 a que grupo pertenece? Guión 1. Motivación 2. Clasificación

Más detalles

Máster en Ordenación y Gestión del Desarrollo Territorial y Local. Módulo I MÉTODO Y TÉCNICAS ESTADÍSTICAS PARA EL DESARROLLO TERRITORIAL Y LOCAL

Máster en Ordenación y Gestión del Desarrollo Territorial y Local. Módulo I MÉTODO Y TÉCNICAS ESTADÍSTICAS PARA EL DESARROLLO TERRITORIAL Y LOCAL ANÁLISIS CLUSTERS C U R S O TÉCNICAS MULTIVARIANTES Prof. Dr. Ángel Luís LUCENDO MONEDERO 1 http://www.geografia.us.es/ Tema 2. INTRODUCCIÓN N AL ANÁLISIS CLUSTER 2.1 Consideraciones generales. Clasificación

Más detalles

ANÁLISIS DE CONGLOMERADOS (CLUSTER ANALYSIS)

ANÁLISIS DE CONGLOMERADOS (CLUSTER ANALYSIS) ANÁLISIS DE CONGLOMERADOS (CLUSTER ANALYSIS) AGRUPAMIENTOS Cuál agrupamiento es mejor? MÉTODOS DE AGRUPACIÓN Métodos jerárquicos: Los objetos se agrupan (dividen) i por partes hasta clasificar todos los

Más detalles

Curso de Postgrado en Herramientas Estadísticas Avanzadas: AGROPECUARIOS. Prof. Dr. José Perea Dpto. Producción Animal

Curso de Postgrado en Herramientas Estadísticas Avanzadas: AGROPECUARIOS. Prof. Dr. José Perea Dpto. Producción Animal Curso de Postgrado en Herramientas Estadísticas Avanzadas: ANÁLISIS MULTIVARIANTE PARA INVESTIGACIÓN EN SISTEMAS AGROPECUARIOS ANÁLISIS CLUSTER Prof. Dr. José Perea Dpto. Producción Animal ANÁLISIS DE

Más detalles

Capítulo 4. Medidas de Proximidad. Proximidades Similaridades: s(a, B) Similitudes: s(a, B) 4.1. VARIABLES CUANTITATIVAS

Capítulo 4. Medidas de Proximidad. Proximidades Similaridades: s(a, B) Similitudes: s(a, B) 4.1. VARIABLES CUANTITATIVAS Capítulo 4 Medidas de Proximidad X 1,..., X p variables A = (a 1,..., a p ) valores de X 1,..., X p para el individuo A B = (b 1,..., b p ) valores de X 1,..., X p para el individuo B { Disimilaridades:

Más detalles

ANALISIS DE CLUSTER CON SPSS: INMACULADA BARRERA

ANALISIS DE CLUSTER CON SPSS: INMACULADA BARRERA ANALISIS DE CLUSTER CON SPSS: INMACULADA BARRERA ANALISIS DE CLUSTER EN SPSS Opción: Analizar Clasificar ANALISIS DE CLUSTER EN SPSS Tres posibles OPCIONES 1.- Cluster en dos etapas 2.- K-means 3.- Jerárquicos

Más detalles

CLASIFICACIÓN PROBLEMA SOLUCIÓN

CLASIFICACIÓN PROBLEMA SOLUCIÓN Capítulo 7 Análisis Cluster CLASIFICACIÓN Asignar objetos en su lugar correspondiente dentro de un conjunto de categorías establecidas o no. PROBLEMA Dado un conjunto de m objetos (animales, plantas, minerales...),

Más detalles

Práctica 3. Para comenzar esta práctica abrimos el programa SPSS.

Práctica 3. Para comenzar esta práctica abrimos el programa SPSS. Análisis de Datos Licenciatura en Biología Curso oo9/o0 Práctica 3 El fichero de datos necesario para realizar esta práctica, turtlefmxls, se encuentra en la página web http//wwwuames/danielfaraco La ruta

Más detalles

Análisis Cluster. Metodología de las CC del Comp-Universitat de València. Abril Pedro Valero

Análisis Cluster. Metodología de las CC del Comp-Universitat de València. Abril Pedro Valero Análisis Cluster Pedro Valero Mora-valerop@uv.es Metodología de las CC del Comp-Universitat de València Abril 2011 Pedro Valero Mora-valerop@uv.es Metodología de las CC del Comp-Universitat de València

Más detalles

Clasificación Clasific NO SUPERV SUPER ISAD IS A AD AGRUPAMIENTO

Clasificación Clasific NO SUPERV SUPER ISAD IS A AD AGRUPAMIENTO Clasificación NO SUPERVISADA AGRUPAMIENTO Clasificación No Supervisada Se trata de construir clasificadores sin información a priori, o sea, a partir de conjuntos de patrones no etiquetados Objetivo: Descubrir

Más detalles

Análisis de Conglomerados

Análisis de Conglomerados Análisis de Conglomerados Resumen El procedimiento Análisis de Conglomerados esta diseñado para agrupar observaciones o variables en conglomerados basados en similaridades entre ellos. Los renglones de

Más detalles

ANÁLISIS DISCRIMINANTE

ANÁLISIS DISCRIMINANTE DEFINICIÓN: Cómo técnica de análisis de dependencia: Pone en marcha un modelo de causalidad en el que la variable endógena es una variable NO MÉTRICA y las independientes métricas. Cómo técnica de análisis

Más detalles

MASTER EN CIENCIAS ACTUARIALES Y FINANCIERAS PLAN Módulo: ANÁLISIS DEL RIESGO ACTUARIAL Y FINANCIERO

MASTER EN CIENCIAS ACTUARIALES Y FINANCIERAS PLAN Módulo: ANÁLISIS DEL RIESGO ACTUARIAL Y FINANCIERO MASTER EN CIENCIAS ACTUARIALES Y FINANCIERAS PLAN 2009 Nombre de asignatura: ESTADÍSTICA ACTUARIAL III: ANÁLISIS MULTIVARIANTE DE DATOS Código: 603377 Materia: ESTADÍSTICA ACTUARIAL Módulo: ANÁLISIS DEL

Más detalles

Análisis de Conglomerados

Análisis de Conglomerados Análisis de Datos Avanzados Análisis de Conglomerados Joaquín Aldás Manzano Universitat de València * joaquin.aldas@uv.es Descripción Definición Cuando tenemos un conjunto de variables que caracterizan

Más detalles

Análisis Cluster en SPSS

Análisis Cluster en SPSS Análisis Cluster en SPSS M. D olores M artínez M iranda Profesora del D pto. E stadística e I.O. U niversidad de G ranada Referencias bibliográficas 1. Hair, J.F., Anderson, R.E., Tatham, R.L. y Black,

Más detalles

Análisis de Conglomerados

Análisis de Conglomerados Diplomatura en Estadística 1 Diplomatura en Estadística 2 Análisis de Conglomerados (Cluster analysis) Aurea Grané Departamento de Estadística Universidad Carlos III de Madrid Antecedente histórico Las

Más detalles

RESUMEN ANÁLISIS CLUSTER

RESUMEN ANÁLISIS CLUSTER RESUMEN ANÁLISIS CLUSTER 1. Introducción 2. Los datos 2.1. Transformación de los datos 3. Medidas de distancias 4. Métodos: aspectos generales 5. El método jerárquico aglomerativo 5.1 Algoritmos más usados

Más detalles

Técnicas de clusterización

Técnicas de clusterización PFC Ingeniería Industrial 09/2014 Tutor: Jesús Muñuzuri Sanz Alumno: Juan de Dios Lara Albín Técnicas de Clusterización PFC ÍNDICE Pag. 1 Clasificar.... 2 2 El análisis clúster.. 5 3 Clúster por individuos

Más detalles

Análisis Multivariante de Datos en Psicología. Ana María López Curso

Análisis Multivariante de Datos en Psicología. Ana María López Curso Análisis Multivariante de Datos en Psicología Ana María López Curso 2006-2007 2007 Análisis Multivariante de Datos en Psicología Créditos teóricos: 2.5 Créditos prácticos: 2 PROGRAMA DE CONTENIDOS TEÓRICOS

Más detalles

Clasificación. Aurea Grané. Análisis Discriminante

Clasificación. Aurea Grané. Análisis Discriminante Diplomatura en Estadística 1 Diplomatura en Estadística 2 Análisis discriminante Análisis Discriminante y Clasificación Aurea Grané Departamento de Estadística Universidad Carlos III de Madrid Supongamos

Más detalles

5. Análisis de cúmulos

5. Análisis de cúmulos 5. Análisis de cúmulos OBJETIVO: Dividir a los individuos de una base de datos en grupos, llamados cúmulos (clusters), de tal manera que los individuos de un mismo cúmulo tengan características semejantes

Más detalles

Capítulo 8. Análisis Discriminante

Capítulo 8. Análisis Discriminante Capítulo 8 Análisis Discriminante Técnica de clasificación donde el objetivo es obtener una función capaz de clasificar a un nuevo individuo a partir del conocimiento de los valores de ciertas variables

Más detalles

Introducción alas técnicas de muestreo

Introducción alas técnicas de muestreo Introducción alas técnicas de muestreo 1. Introducción. 2. Análisis de poblaciones por muestreo. 3. Sesgos del muestreo. 4. Muestreo aleatorio simple. 5. Muestreo sistemático. 6. Muestreo estratificado.

Más detalles

Clasificación Jerárquica Ascendente Presentación #1. [ U n a i n t r o d u c c i ó n ]

Clasificación Jerárquica Ascendente Presentación #1. [ U n a i n t r o d u c c i ó n ] Clasificación Jerárquica Ascendente Presentación #1 [ U n a i n t r o d u c c i ó n ] Clasificación Jerárquica Clasificación Automática La clasificación automática tiene por objetivo reconocer grupos de

Más detalles

El análisis de correspondencias. Ana María López Jiménez Dept. Psicología Experimental (USE)

El análisis de correspondencias. Ana María López Jiménez Dept. Psicología Experimental (USE) El análisis de correspondencias Ana María López Jiménez Dept. Psicología Experimental (USE) 4. El análisis de correspondencias 4.. Introducción 4.2. Tabla de correspondencias 4.3. Dependencia e independencia

Más detalles

Clustering. Departamento de Ingeniería Informática y de Sistemas Universidad de La Laguna

Clustering. Departamento de Ingeniería Informática y de Sistemas Universidad de La Laguna Clustering Christopher Expósito Izquierdo Airam Expósito Márquez Israel López Plata Belén Melián Batista J. Marcos Moreno Vega {cexposit, aexposim, ilopezpl, mbmelian, jmmoreno}@ull.edu.es Departamento

Más detalles

Sistemas Inteligentes. Tema B2T4: Aprendizaje no supervisado: algoritmo k-medias.

Sistemas Inteligentes. Tema B2T4: Aprendizaje no supervisado: algoritmo k-medias. Sistemas Inteligentes Escuela Técnica Superior de Informática Universitat Politècnica de València Tema B2T4: Aprendizaje no supervisado: algoritmo k-medias. Índice 1 Introducción 1 2 Agrupamientos particionales

Más detalles

Estimación de homografías

Estimación de homografías Estimación de homografías Visión en Robótica 1er cuatrimestre de 2013 1 Introducción del problema Una homografía es una transformación proyectiva que determina una correspondencia entre puntos El problema

Más detalles

PRÁCTICA I. Ejercicios Teóricos

PRÁCTICA I. Ejercicios Teóricos PRÁCTICA I TEORÍA DE LA DECISIÓN BAYESIANA Ejercicios Teóricos Ejercicio. En el caso de dos categorías, en la regla de decisión de Bayes el error condicional está dado por la ecuación (7). Incluso si las

Más detalles

Grafos. AMD Grado en Ingeniería Informática. AMD Grado en Ingeniería Informática (UM) Grafos 1 / 30

Grafos. AMD Grado en Ingeniería Informática. AMD Grado en Ingeniería Informática (UM) Grafos 1 / 30 Grafos AMD Grado en Ingeniería Informática AMD Grado en Ingeniería Informática (UM) Grafos / 0 Objetivos Al finalizar este tema tendréis que: Conocer la terminología básica de la teoría de grafos. Pasar

Más detalles

Medidas de tendencia central

Medidas de tendencia central Medidas de tendencia central Medidas de tendencia central Medidas de Posición: son aquellos valores numéricos que nos permiten o bien dar alguna medida de tendencia central, dividiendo el recorrido de

Más detalles

Capítulo 21. Análisis de conglomerados (I): El procedimiento Conglomerados de K medias. Introducción

Capítulo 21. Análisis de conglomerados (I): El procedimiento Conglomerados de K medias. Introducción Capítulo 21 Análisis de conglomerados (I): El procedimiento Conglomerados de K medias Introducción El análisis de conglomerados (en inglés, cluster analisys) es una técnica multivariante que permite agrupar

Más detalles

Estadística y sus aplicaciones en Ciencias Sociales 5. Estimación. Facultad de Ciencias Sociales, UdelaR

Estadística y sus aplicaciones en Ciencias Sociales 5. Estimación. Facultad de Ciencias Sociales, UdelaR Estadística y sus aplicaciones en Ciencias Sociales 5. Estimación Facultad de Ciencias Sociales, UdelaR Índice 1. Repaso: estimadores y estimaciones. Propiedades de los estimadores. 2. Estimación puntual.

Más detalles

CONTRASTES DE HIPÓTESES

CONTRASTES DE HIPÓTESES CONTRASTES DE IPÓTESES 1. Contraste de hipótesis 2. Contrastes de tipo paramétrico 2.1 Contraste T para una muestra 2.2 Contraste T para dos muestras independientes 2.3 Análisis de la varianza 3. Contrastes

Más detalles

Profesor: Hugo S. Salinas. Primer Semestre Tabla 1: Inteligencia y Rendimiento. X Y Figura 1: Inteligencia y Rendimiento.

Profesor: Hugo S. Salinas. Primer Semestre Tabla 1: Inteligencia y Rendimiento. X Y Figura 1: Inteligencia y Rendimiento. UNIVERSIDAD DE ATACAMA FACULTAD DE CIENCIAS JURÍDICAS / CARRERA DE TRABAJO SOCIAL TECNOLOGÍA INFORMÁTICA I (SPSS) ESTADÍSTICA DESCRIPTIVA CON MÁS DE UNA VARIABLE Profesor: Hugo S. Salinas. Primer Semestre

Más detalles

Clasificación Jerárquica Ascendente Presentación #1. [ U n a i n t r o d u c c i ó n ]

Clasificación Jerárquica Ascendente Presentación #1. [ U n a i n t r o d u c c i ó n ] Clasificación Jerárquica Ascendente Presentación #1 [ U n a i n t r o d u c c i ó n ] Clasificación Jerárquica Clasificación Automática La clasificación automática tiene por objetivo reconocer grupos de

Más detalles

1. Introducción. 2. Los métodos proporcionales

1. Introducción. 2. Los métodos proporcionales 1. Introducción Una asignación consiste en repartir una cierta cantidad de objetos entre un determinado número de conjuntos. Las asignaciones que nos interesan son aquellas en que los objetos no se pueden

Más detalles

ÍNDICE INTRODUCCIÓN... 21

ÍNDICE INTRODUCCIÓN... 21 INTRODUCCIÓN... 21 CAPÍTULO 1. ORGANIZACIÓN DE LOS DATOS Y REPRESENTACIONES GRÁFICAS... 23 1. ORGANIZACIÓN DE LOS DATOS... 23 1.1. La distribución de frecuencias... 24 1.2. Agrupación en intervalos...

Más detalles

Introducción a la Teoría de Números

Introducción a la Teoría de Números Introducción a la Teoría de Números Elaborado por: Jeff Maynard Guillén Eliminatoria II Julio, 2011 Introducción a la Teoría de Números A manera de repaso vamos a recordar algunos conjuntos N = {1, 2,

Más detalles

ANÁLISIS DE CONGLOMERADOS

ANÁLISIS DE CONGLOMERADOS ANÁLISIS DE CONGLOMERADOS Análisis de conglomerados Autor: Manuel Terrádez Gurrea (mterradez@uoc.edu). ESQUEMA DE CONTENIDOS Análisis de conglomerados (cluster) Interpretación de dendogramas INTRODUCCIÓN

Más detalles

CAPÍTULO IV MEDIDAS DE TENDENCIA CENTRAL Y DE POSICION

CAPÍTULO IV MEDIDAS DE TENDENCIA CENTRAL Y DE POSICION Notas de clase: Rénember Niño C. CAPÍTULO IV MEDIDAS DE TENDENCIA CENTRAL Y DE POSICION 4.1 MEDIDAS DE TENDENCIA CENTRAL Hemos analizado como a partir de tablas y gráficos puede presentarse la información

Más detalles

Tema 2 Datos multivariantes

Tema 2 Datos multivariantes Aurea Grané Máster en Estadística Universidade Pedagógica 1 Aurea Grané Máster en Estadística Universidade Pedagógica 2 Tema 2 Datos multivariantes 1 Matrices de datos 2 Datos multivariantes 2 Medias,

Más detalles

TEMA 8: ESTADÍSTICA DESCRIPTIVA.

TEMA 8: ESTADÍSTICA DESCRIPTIVA. I.E.S. Salvador Serrano de Alcaudete Departamento de Matemáticas º ESO 0 / TEMA 8: ESTADÍSTICA DESCRIPTIVA. 8. Introducción. La palabra ESTADÍSTICA procede del vocablo Estado, pues era función principal

Más detalles

ECUACIÓN GENERAL DE LA CIRCUNFERENCIA

ECUACIÓN GENERAL DE LA CIRCUNFERENCIA ECUACIÓN GENERAL DE LA CIRCUNFERENCIA CONVERSIÓN DE FORMA ORDINARIA A FORMA GENERAL. La ecuación ordinaria de la circunferencia con centro en el origen y radio r, tiene la forma: Para representar esta

Más detalles

ASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN

ASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN CURSO DE BIOESTADÍSTICA BÁSICA Y SPSS ASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN Amaia Bilbao González Unidad de Investigación Hospital Universitario Basurto (OSI Bilbao-Basurto)

Más detalles

Tema 4: Otros Métodos de Análisis de Datos Cuantitativos y Cualitativos

Tema 4: Otros Métodos de Análisis de Datos Cuantitativos y Cualitativos Tema 4: Otros Métodos de Análisis de Datos Cuantitativos y Cualitativos Metodología de la Investigación en Fisioterapia Miguel González Velasco Departamento de Matemáticas. Universidad de Extremadura M.

Más detalles

CONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS

CONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS CONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS 1 POR QUÉ SE LLAMAN CONTRASTES NO PARAMÉTRICOS? A diferencia de lo que ocurría en la inferencia paramétrica, ahora, el desconocimiento de la población que vamos

Más detalles

Análisis de los Municipios Turísticos de Andalucía

Análisis de los Municipios Turísticos de Andalucía Análisis de los Municipios Turísticos de Andalucía UNIVERSIDAD DE MÁLAGA DPTO. ECONOMÍA APLICADA-POLÍTICA ECONÓMICA Febrero, 2004 EQUIPO DE TRABAJO: Pedro Raya Mellado. Profesor Titular de Economía Aplicada.

Más detalles

Índice La División Entera El Máximo Común Divisor Algoritmo de Euclides Ecuaciones Diofánticas Factorización. Aritmética I.

Índice La División Entera El Máximo Común Divisor Algoritmo de Euclides Ecuaciones Diofánticas Factorización. Aritmética I. Leandro Marín Septiembre 2010 Índice La División Entera El Máximo Común Divisor Algoritmo de Euclides Ecuaciones Diofánticas Factorización Los Números Enteros Llamaremos números enteros al conjunto infinito

Más detalles

N 11. Documentos FCE - CID. Documento Escuela de Administración y Contaduría Pública. Nelcy Rocío Escobar Moreno

N 11. Documentos FCE - CID. Documento Escuela de Administración y Contaduría Pública. Nelcy Rocío Escobar Moreno Documentos FCE - CID Documento Escuela de Administración y Contaduría Pública N 11 ISSN 2011-6306 Mayo 2012 Análisis de conglomerados para la segmentación de mercados Cluster Analysis for Market Segmentation

Más detalles

C/ Fernando Poo 5 Madrid (Metro Delicias o Embajadores).

C/ Fernando Poo 5 Madrid (Metro Delicias o Embajadores). UNIVERSIDAD REY JUAN CARLOS, MADRID PRUEBA DE ACCESO PARA MAYORES DE 25 AÑOS MATEMÁTICAS II AÑO 2014 OPCIÓN A Ejercicio 1 a) (1 punto) Determinar el valor del parámetro para que los puntos A(1,2,0), B(5,-4,0)

Más detalles

Producto Escalar. AMD Grado en Ingeniería Informática. AMD Grado en Ingeniería Informática (UM) Producto Escalar 1 / 31

Producto Escalar. AMD Grado en Ingeniería Informática. AMD Grado en Ingeniería Informática (UM) Producto Escalar 1 / 31 Producto Escalar AMD Grado en Ingeniería Informática AMD Grado en Ingeniería Informática (UM) Producto Escalar 1 / 31 Objetivos Al finalizar este tema tendrás que: Saber usar el producto escalar. Calcular

Más detalles

Definición de grupos: clasificación. Capítulos 10 y 11 de McCune y Grace 2002

Definición de grupos: clasificación. Capítulos 10 y 11 de McCune y Grace 2002 Definición de grupos: clasificación Capítulos 10 y 11 de McCune y Grace 2002 Clasificar Proceso natural humano para interpretar el mundo Pero estamos acostumbrados a sólo observar pocas dimensiones Más

Más detalles

La práctica del análisis de correspondencias

La práctica del análisis de correspondencias La práctica del análisis de correspondencias MICHAEL GREENACRE Catedrático de Estadística en la Universidad Pompeu Fabra Separata del capítulo 5 Representación gráfica de distancias ji-cuadrado Primera

Más detalles

Repaso de integración

Repaso de integración TABLA DE INTEGRALES INMEDIATAS Repaso de integración. Tabla de integrales inmediatas n d = n+ + C, si n n + f() n f () d = f()n+ n + + C, si n d = ln + C f() f () d = ln f() + C e d = e + C e f() f ()

Más detalles

TEMA 2 Diseño de experimentos: modelos con varios factores

TEMA 2 Diseño de experimentos: modelos con varios factores TEMA 2 Diseño de experimentos: modelos con varios factores José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Análisis de Datos - Grado en Biología Esquema del tema Modelo bifactorial

Más detalles

Espacios vectoriales.

Espacios vectoriales. Unidad docente de Matemáticas Matemáticas (CC. Químicas) Espacios vectoriales. Si detectas cualquier error o errata por favor, comunicaselo al profesor de la asignatura. El subíndice can significa canónica/o..

Más detalles

EJERCICIOS. 7.3 Valor de un polinomio para x = a. Por lo tanto: para determinar expresiones

EJERCICIOS. 7.3 Valor de un polinomio para x = a. Por lo tanto: para determinar expresiones or lo tanto: para determinar epresiones a que sean divisores de un polinomio con coeficientes enteros, se deben asignar valores al número a que dividan al término independiente. Apliquemos este resultado

Más detalles

Asimetría Coeficiente de Asimetría de Fisher

Asimetría Coeficiente de Asimetría de Fisher Asimetría Si los valores de la serie de datos presenta la misma forma a izquierda y derecha de un valor central (media aritmética) se dice que es simétrica de lo contrario será asimétrica. Para medir el

Más detalles

DETERMINANTES. 2. Resuelve el siguiente determinante aplicando la regla de Sarrus:

DETERMINANTES. 2. Resuelve el siguiente determinante aplicando la regla de Sarrus: DETERMINNTES. Calcula el determinante de la siguiente matriz: 3 4 3 0..(3.0 2.0).0 0 0 3 4 0 0 3 Hemos sumado a la segunda fila la primera cambiada de signo. continuación hemos sumado a la tercera fila

Más detalles

Manejo del entorno windows y nociones básicas de estadística.

Manejo del entorno windows y nociones básicas de estadística. ANÁLISIS ESTADÍSTICO CON EL SPSS Profesor: J. Manuel Tejero González. METODOLOGÍA. Prensencial, en el aula de informática, utilizando un ordenador por alumno (Programa SPSS Versión 11.0, paquete básico,

Más detalles

Tema 3: Espacios eucĺıdeos

Tema 3: Espacios eucĺıdeos Marisa Serrano, Zulima Fernández Universidad de Oviedo 25 de noviembre de 2009 email: mlserrano@uniovi.es Índice 1 2 3.1 V, R espacio vectorial, la aplicación : V V R ( v, u) v u a) v 1, v 2, u V α, β

Más detalles

6.8. Descomposición mediante valores singulares. v 2 =

6.8. Descomposición mediante valores singulares. v 2 = 68 Descomposición mediante valores singulares Los valores singulares de una matriz m n Supongamos que A es una matriz real cualquiera Los autovalores de A T A tienen la siguiente propiedad A T Ax = λx

Más detalles

La práctica del análisis de correspondencias

La práctica del análisis de correspondencias La práctica del análisis de correspondencias MICHAEL GREENACRE Catedrático de Estadística en la Universidad Pompeu Fabra Separata del apéndice D Glosario de términos Primera edición: julio 2008 ISBN: 978-84-96515-71-0

Más detalles

1 Cómo introducir datos de archivos de Excel (.xls) en SPSS/PC?

1 Cómo introducir datos de archivos de Excel (.xls) en SPSS/PC? Análisis de Datos Licenciatura en Biología Curso 2o10/2o11 Práctica 1 El fichero de datos necesario para realizar esta práctica, alligator.xls, se encuentra en la página web http://www.uam.es/daniel.faraco/ad11.

Más detalles

PROGRAMA DE LA ASIGNATURA. Curso académico

PROGRAMA DE LA ASIGNATURA. Curso académico PROGRAMA DE LA ASIGNATURA Curso académico 2010-2011 IDENTIFICACIÓN Y CARACTERÍSTICAS DE LA ASIGNATURA Código Créditos ECTS 6 Denominación ESTADÍSTICA APLICADA Titulación/es Máster Universitario en Marketing

Más detalles

Análisis Estadístico de Datos Climáticos

Análisis Estadístico de Datos Climáticos Análisis Estadístico de Datos Climáticos Análisis de agrupamiento (o clusters) (Wilks, Cap. 14) Facultad de Ciencias Facultad de Ingeniería 2013 Objetivo Idear una clasificación o esquema de agrupación

Más detalles

6. Aportación y propuesta para al estudio de noticias en prensa con técnicas estadísticas multivariantes: Análisis cluster

6. Aportación y propuesta para al estudio de noticias en prensa con técnicas estadísticas multivariantes: Análisis cluster 6. Aportación y propuesta para al estudio de noticias en prensa con técnicas estadísticas multivariantes: Análisis cluster En este estudio sobre discapacidad queremos realizar una propuesta de aplicación

Más detalles

Métodos estadísticos de clasificación

Métodos estadísticos de clasificación Métodos estadísticos de clasificación Preparado por Luis M. Molinero (Alce Ingeniería) CorreoE: bioestadistica alceingenieria.net Artículo en formato PDF Diciembre 2002 www.seh lelha.org/stat1.htm El problema

Más detalles

Anova unifactorial Grados de Biología y Biología sanitaria

Anova unifactorial Grados de Biología y Biología sanitaria Anova unifactorial Grados de Biología y Biología sanitaria M. Marvá e-mail: marcos.marva@uah.es Unidad docente de Matemáticas, Universidad de Alcalá 29 de noviembre de 2015 El problema Analizaremos la

Más detalles

ESTRATEGIAS DE COMPORTAMIENTO Y VALORACIÓN DE LA FORMACIÓN DE LOS ESTUDIANTES: UN ANÁLISIS APLICADO 1

ESTRATEGIAS DE COMPORTAMIENTO Y VALORACIÓN DE LA FORMACIÓN DE LOS ESTUDIANTES: UN ANÁLISIS APLICADO 1 Estrategias de comportamiento y valoración de la formación de los estudiantes: un análisis aplicado ESTRATEGIAS DE COMPORTAMIENTO Y VALORACIÓN DE LA FORMACIÓN DE LOS ESTUDIANTES: UN ANÁLISIS APLICADO 1

Más detalles

Tema 11. Clustering. X 1... X i... X n O 1 x x 1 i... x 1 n... O j x j 1... x j i... x j n... O N x N 1... x N i... x N n

Tema 11. Clustering. X 1... X i... X n O 1 x x 1 i... x 1 n... O j x j 1... x j i... x j n... O N x N 1... x N i... x N n Tema 11. Clustering Abdelmalik Moujahid, Iñaki Inza, Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del País Vasco Euskal Herriko Unibertsitatea 1 Introducción

Más detalles

Tema 5: SEGMENTACIÓN (II) I N G E N I E R Í A I N F O R M Á T I C A

Tema 5: SEGMENTACIÓN (II) I N G E N I E R Í A I N F O R M Á T I C A Tema 5: SEGMENTACIÓN (II) 1 I N G E N I E R Í A I N F O R M Á T I C A Tema 5: Segmentación Los algoritmos de segmentación se basan en propiedades básicas de los valores del nivel de gris: 2 - Discontinuidad:

Más detalles

Espacios vectoriales. Ortogonalizacioón de Gram Schmidt

Espacios vectoriales. Ortogonalizacioón de Gram Schmidt Espacios_Vectoriales.nb Espacios vectoriales. Ortogonalizacioón de Gram Schmidt Práctica de Álgebra Lineal, E.U.A.T., Curso 00 00 En esta práctica se explica cómo resolver con Mathematica algunos problemas

Más detalles

Análisis Multivariante son Stata

Análisis Multivariante son Stata Análisis Multivariante con Stata Diploma Avanzado en Metodología de Investigación en Ciencias de la Salud EVES. Valencia, Oct 2013 fgarcia@cipf.es Indice 1 Introducción 2 3 4 Análisis Multivariante Análisis

Más detalles

Guía Docente EMPRESARIALES

Guía Docente EMPRESARIALES Guía Docente ASIGNATURA ESTUDIOS DE MERCADO EN MARKETING II CURSO 4º SEMESTRE 1º GRADO EN MARKETING Y GESTIÓN COMERCIAL MODALIDAD: PRESENCIAL CURSO 2015-16 FACULTAD DE CIENCIAS ECONÓMICAS Y EMPRESARIALES

Más detalles

1. Realice la prueba de homogeneidad de variancias e interprete los resultados.

1. Realice la prueba de homogeneidad de variancias e interprete los resultados. 1ª PRÁCTICA DE ORDENADOR (FEEDBACK) Un investigador pretende evaluar la eficacia de dos programas para mejorar las habilidades lectoras en escolares de sexto curso. Para ello asigna aleatoriamente seis

Más detalles

Experimentos factoriales con factores aleatorios

Experimentos factoriales con factores aleatorios Experimentos factoriales con factores aleatorios Hasta el momento hemos presumido que los factores en nuestros experimentos eran de naturaleza fija; esto es los niveles en que los factores fueron evaluados

Más detalles

Estimación. Introducción. Sea X la variable aleatoria poblacional con distribución de probabilidad f θ donde. es el parámetro poblacional desconocido

Estimación. Introducción. Sea X la variable aleatoria poblacional con distribución de probabilidad f θ donde. es el parámetro poblacional desconocido Tema : Introducción a la Teoría de la Estimación Introducción Sea X la variable aleatoria poblacional con distribución de probabilidad f θ (x), donde θ Θ es el parámetro poblacional desconocido Objetivo:

Más detalles

MÉTODOS AVANZADOS EN APRENDIZAJE ARTIFICIAL: TEORÍA Y APLICACIONES A PROBLEMAS DE PREDICCIÓN

MÉTODOS AVANZADOS EN APRENDIZAJE ARTIFICIAL: TEORÍA Y APLICACIONES A PROBLEMAS DE PREDICCIÓN MÉTODOS AVANZADOS EN APRENDIZAJE ARTIFICIAL: TEORÍA Y APLICACIONES A PROBLEMAS DE PREDICCIÓN Manuel Sánchez-Montañés Luis Lago Ana González Escuela Politécnica Superior Universidad Autónoma de Madrid Teoría

Más detalles

Objetivo: Universo de estudio:

Objetivo: Universo de estudio: Resumen de la metodología y resultados de la clasificación de hospitales públicos españoles mediante el uso del análisis cluster realizado por el Departamento de Métodos Cuantitativos en Economía y Gestión

Más detalles

Ejemplos de análisis cluster

Ejemplos de análisis cluster Ejemplos de análisis cluster Objetivos: 1. Una aproximación a la terminología del análisis cluster o de conglomerados 2. Uso de las funciones oportunas de R para realizar el análisis 3. Interpretación

Más detalles

Esquema (1) Análisis de la Varianza y de la Covarianza. ANOVA y ANCOVA. ANOVA y ANCOVA 1. Análisis de la Varianza de 1 Factor

Esquema (1) Análisis de la Varianza y de la Covarianza. ANOVA y ANCOVA. ANOVA y ANCOVA 1. Análisis de la Varianza de 1 Factor Esquema (1) Análisis de la arianza y de la Covarianza ANOA y ANCOA 1. (Muestras independientes). () 3. Análisis de la arianza de Factores 4. Análisis de la Covarianza 5. Análisis con más de Factores J.F.

Más detalles

Reconocimiento de Patrones

Reconocimiento de Patrones Reconocimiento de Patrones Jesús Ariel Carrasco Ochoa Instituto Nacional de Astrofísica Óptica y Electrónica ariel@inaoep.mx Contenido Introducción Enfoques Problemas Selección de Variables Clasificación

Más detalles

FACTORIZACIÓN DE POLINOMIOS en Q (racionales)

FACTORIZACIÓN DE POLINOMIOS en Q (racionales) FACTORIZACIÓN DE OLINOMIOS en Q racionales FAQ Qué es factorizar un polinomio? Es expresarlo como un producto por eso lo de "factorizar" de otros polinomios de grado igual o menor a él ara qué factorizar

Más detalles

Tema: Validación de Cuestionarios con SPSS

Tema: Validación de Cuestionarios con SPSS Tema: Validación de Cuestionarios con SPSS 1.- Análisis de fiabilidad 1.1.- Introducción El análisis de fiabilidad permite estudiar las propiedades de las escalas de medición y de los elementos que las

Más detalles

FUNDACIÓN UNIVERSITARIA LOS LIBERTADORES DEPARTAMENTO DE CIENCIAS BÁSICAS ESPECIALIZACIÓN EN ESTADÍSTICA APLICADA

FUNDACIÓN UNIVERSITARIA LOS LIBERTADORES DEPARTAMENTO DE CIENCIAS BÁSICAS ESPECIALIZACIÓN EN ESTADÍSTICA APLICADA UNA SEGMENTACIÓN DE CLIENTES QUE ADQUIRIERON CRÉDITOS DE LIBRE INVERSIÓN EN UNA ENTIDAD FINANCIERA COLOMBIANA I SEMESTRE 2015 OSCAR TUMBIA JAIRO MARTINEZ OMAR BELTRAN FUNDACIÓN UNIVERSITARIA LOS LIBERTADORES

Más detalles

Técnicas de análisis multivariante para agrupación

Técnicas de análisis multivariante para agrupación TEMA 2: TÉCNICAS DE ANÁLISIS MULTIVARIANTE PARA AGRUPACIÓN Métodos cluster Técnicas de segmentación Clasificación no supervisada Ana Justel 1 Técnicas de análisis multivariante para agrupación Motivación

Más detalles

Las demás fracciones se expresaban como suma de unitarias, por ejemplo

Las demás fracciones se expresaban como suma de unitarias, por ejemplo Concepto de Fracción Definición: Las fracciones son porciones de la unidad.es decir, la unidad se divide en partes y se toman algunas de ellas. Anécdota histórica Los egipcios, como los babilonios, también

Más detalles

Ejemplos Resueltos Tema 4

Ejemplos Resueltos Tema 4 Ejemplos Resueltos Tema 4 01 1. Intervalo de Confianza para la Media µ (con σ conocida Dada una muestra de tamaño n, para un nivel de confianza 1-α y la desviación típica de la población σ, el Intervalo

Más detalles

Wenceslao González Manteiga.

Wenceslao González Manteiga. ANÁLISIS MULTIVARIANTE Wenceslao.gonzalez@usc.es ÍNDICE 0. MOTIVACIÓN HISTÓRICA 1. ANÁLISIS EXPLORATORIO DE DATOS 2. REVISIÓN DE LAS DISTRIBUCIONES NOTABLES MULTIDIMENSIONALES RELACIONADAS CON LA NORMAL

Más detalles

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2 PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2 Preg. 1. Para comparar la variabilidad relativa de la tensión arterial diastólica y el nivel de colesterol en sangre de una serie de individuos, utilizamos

Más detalles

Llamamos ángulo a la región comprendida entre dos semirrectas que tienen el mismo origen.

Llamamos ángulo a la región comprendida entre dos semirrectas que tienen el mismo origen. LOS ÁNGULOS Llamamos ángulo a la región comprendida entre dos semirrectas que tienen el mismo origen. Ángulo p r Semirrecta o Semirrecta Vértice Para nombrar un ángulo, generalmente, se utilizan las letras

Más detalles

Primero se inicializan dos puntos (tantos como clusters queremos) al azar. Estos puntos se denominan centroides del cluster.

Primero se inicializan dos puntos (tantos como clusters queremos) al azar. Estos puntos se denominan centroides del cluster. K-Means Introducción El algoritmo k-means es el algoritmo de clustering más popular y ampliamente utilizado. Algoritmo Supongamos que queremos agrupar los siguientes datos en dos clusters Primero se inicializan

Más detalles

Estadística. Generalmente se considera que las variables son obtenidas independientemente de la misma población. De esta forma: con

Estadística. Generalmente se considera que las variables son obtenidas independientemente de la misma población. De esta forma: con Hasta ahora hemos supuesto que conocemos o podemos calcular la función/densidad de probabilidad (distribución) de las variables aleatorias. En general, esto no es así. Más bien se tiene una muestra experimental

Más detalles

Introducción Climatología y variabilidad climática (espacial y temporal). Datos climáticos. Revisión sobre el concepto de probabilidad.

Introducción Climatología y variabilidad climática (espacial y temporal). Datos climáticos. Revisión sobre el concepto de probabilidad. Nombre de la Asignatura: Análisis Estadístico de Datos Climáticos Créditos: 10 Docentes responsables: Ciencias) Álvaro Díaz (F. Ingeniería) y Mario Bidegain (F. Objetivo de la asignatura: Desarrollar en

Más detalles

Ruth Vilà, María-José Rubio, Vanesa Berlanga, Mercedes Torrado. Cómo aplicar un cluster jerárquico en SPSS.

Ruth Vilà, María-José Rubio, Vanesa Berlanga, Mercedes Torrado. Cómo aplicar un cluster jerárquico en SPSS. Universitat de Barcelona. Institut de Ciències de l Educació Cómo aplicar un cluster jerárquico en SPSS Ruth Vilà-Baños, María-José Rubio-Hurtado, Vanesa Berlanga-Silvente, Mercedes Torrado-

Más detalles

La práctica del análisis de correspondencias

La práctica del análisis de correspondencias La práctica del análisis de correspondencias MICHAEL GREENACRE Catedrático de Estadística en la Universidad Pompeu Fabra Separata del capítulo 8 Simetría entre el análisis de filas y el de columnas Primera

Más detalles

El Cluster Analysis* su aplicación en el estudio de la validez de un instrumento psicodiagnóstico

El Cluster Analysis* su aplicación en el estudio de la validez de un instrumento psicodiagnóstico REVISTA CUBANA DE PSICOLOGÍA Vol. IV, No. 3, 1987 El Cluster Analysis* su aplicación en el estudio de la validez de un instrumento psicodiagnóstico Martha Vázquez Villazón y María Eugenia de Bernard Cerezo

Más detalles