Tema 8. Análisis de Correspondencias

Documentos relacionados
Análisis de CorrespondenciaCapítulo 3

El análisis de correspondencias. Ana María López Jiménez Dept. Psicología Experimental (USE)

Análisis de Correspondencias Simple

ANÁLISIS DE CORRESPONDENCIAS

El Análisis de Correspondencias tiene dos objetivos básicos:

Capítulo 8. Análisis Discriminante

EL ANÁLISIS DE CORRESPONDENCIAS

PROCESO DE PREPARACIÓN DE DATOS

Ayudas a la Interpretación en ACS.(acs)

Análisis de datos cualitavos con análisis de correspondencias

FACTORIAL DE CORRESPONDENCIAS SIMPLES Y MÚLTIPLES CRIVISQ

La práctica del análisis de correspondencias

Análisis de correspondencias

Etapa 6: interpretación de la matriz factorial rotada y representación de los resultados

TABLAS DE CONTINGENCIA

Practica 1. Análisis de Tablas de Contingencia

La práctica del análisis de correspondencias

La práctica del análisis de correspondencias

Análisis de Correspondencias

Distribuciones Bidimensionales.

Tema 10: Introducción a los problemas de Asociación y Correlación

La práctica del análisis de correspondencias

LECCIÓN PÚBLICA. Tema 6 Descripción Multivariante de Datos. Profa. María Fátima Dos Santos

El ejemplo: Una encuesta de opinión

Datos de tipo cuantitativo

Análisis inferencial de la soldabilidad de los electrodos

Estadística descriptiva bidimensional

LABORATORIO 1 DE ANÁLISIS DE CORRESPONDENCIAS

UNIDAD DIDÁCTICA III ESTADÍSTICA BIDIMENSIONAL Y REGRESIÓN LINEAL SIMPLE

Fincas hipotecadas en las comunidades autónomas españolas

Reducción de la Dimensionalidad en Análisis de Datos. Análisis de Componentes Principales.

DISTRIBUCIONES BIDIMENSIONALES

EJEMPLO PRÁCTICO DE CORRELACIÓN Y CHI-CUADRADO (X 2 )

Biplot Versus Coodernadas Paralelas

ESTADISTICA. Tradicionalmente la aplicación del término estadística se ha utilizado en tres ámbitos:

Lección 3. Análisis conjunto de dos variables

TEMA 5 Estadística descriptiva. Análisis de datos

Trabajar con Gráficos

alumnos: 20 = n - 100% - x i son los valores que aparecen en los datos. f i

Tema 8. Análisis de dos variables Ejercicios resueltos 1

LABORATORIO DE FÍSICA TEORÍA DE GRÁFICAS

Taller: Aplicación e importancia del software SPSS en la investigación. Instructor: Mtro. Roberto Leonardo Sánchez Medina

3.1.3 Análisis Multivariado

INDICE. 81 Operadores lógicos Funciones exponenciales y logarítmicas Funciones trigonométricas

Análisis en Componentes Principales

MASTER EN CIENCIAS ACTUARIALES Y FINANCIERAS PLAN Módulo: ANÁLISIS DEL RIESGO ACTUARIAL Y FINANCIERO

2º ESO UNIDAD 14 ESTADÍSTICA Y PROBABILIDAD

2.1. Introducción Análisis exploratorio Análisis exploratorio para variables con muchas modalidades

Análisis de Correlación Canónica y Análisis discriminante

Medidas de Tendencia Central. Dra. Noemí L. Ruiz Limardo Derechos de Autor Reservados Revisado 2010

Anexo I CUESTIONARIO UTILIZADO PARA LA RECOGIDA DE INFORMACIÓN

ANEXO 3. CAPACIDADES Y ERRORES

Tema 12: Introducción a la Estadística.

ESTADISTICA Y PROBABILIDAD ESTADÍSTICA

Tema 9: Relación entre variables categóricas

La práctica del análisis de correspondencias

U ED Tudela Introducción al Análisis de Datos - Tema 4

D I S T R I B U C I O N E S B I D I M E N S I O N A L E S

TEMA-1 CONCEPTOS BÁSICOS Y ORGANIZACIÓN DE DATOS INTRODUCCIÓN:

MÓDULO III. MEDIDAS DE TENDENCIA CENTRAL, DISPERSIÓN Y ASIMETRÍA

Análisis de Varianza Factorial y MANOVA

DOCUMENTO 8: ESTADÍSTICA BIDIMENSIONAL

2. ESTADÍSTICAS BIDIMENSIONALES

Prof. Jose Jacobo Zubcoff, PhD. Area de Estadística Departamento de Ciencias del Mar y Biología Aplicada Universidad de Alicante

Análisis descriptivo con SPSS. Favio Murillo García

Guía docente 2007/2008

La práctica del análisis de correspondencias

CORRELACIÓN Y REGRESIÓN. Raúl David Katz

Estadística Descriptiva 2da parte

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2

ESTADÍSTICA CON EXCEL

Exploración de datos

Unidad 11. Trabajar con Gráficos (I)

Informática en la ESO 4ºESO. Elaboración de diagramas Hoja de Cálculo Openoffice Calc

CINETICA QUIMICA. ó M s s

2 Contraste de independencia

Tema 2: Análisis de datos bivariantes

Tema 2. Descripción Conjunta de Varias Variables

El deletreo manual en la enseñanza de vocabulario en un grupo de jóvenes sordos 51

Tema 3: Análisis de datos bivariantes

Tema 5. Estadística descriptiva bivariable con variables categóricas y numéricas

TEMA 8: ESTADÍSTICA DESCRIPTIVA.

Or O g r a g n a i n zac a ión ó y re r p e r p e r s e en e t n a t c a ión ó de d e los o da d t a o t s o TEMA 3.2

TEMA 12: UN MUNDO EN MOVIMIENTO

5. TIPOLOGÍAS DE VIAJEROS

Distribuciones bidimensionales. Correlación.

Tema 13. Investigación de mercados, segmentación y experimentación comercial

T. 7 Organización y representación gráfica de datos multivariados

Funciones reales de variable real.

4. PROPIEDAD DE ÁREAS PLANAS Y LINEAS Centroides de áreas compuestas

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 4)

1 CÁLCULO DE PROBABILIDADES

Estadística Inga Patricia Juárez, 2017 MEDIDAS DE TENDENCIA CENTRAL

MÓDULO III. MEDIDAS DE TENDENCIA CENTRAL, DISPERSIÓN Y ASIMETRÍA

La práctica del análisis de correspondencias

VARIABLES ESTADÍSTICAS BIDIMENSIONALES

3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS

Examen de la asignatura Estadística aplicada a las ciencias sociales Profesor Josu Mezo. Respuestas correctas del examen de 3 de septiembre de 2003

CONSTRUCCIÖN E IDENTIFICACIÖN DE DIRECCIONES DE INDICES DE MILLER EN LAS CELDAS UNITARIAS

Introducción Ordenación Clasificación Ord. + Clas. Geobotánica. Tema 12 Ordenación y clasificación

Transcripción:

Tema 8 Análisis de Correspondencias

Análisis de Correspondencias 1963 Universidad de Renner (Francia), Benzecri Se trata de una técnica de interdependencia en la que no se distingue entre variables dependientes e independientes Es una técnica que permite estudiar las relaciones de inercia y asociación, entre variables categóricas en tablas de contingencia Análisis de Correspondencias Simple (dos variables) Análisis de Correspondencias Múltiple (más de dos variables)

Análisis de Correspondencias CORRESPONDENCIAS SIMPLES Dada una tabla de observaciones correspondiente a dos variables cualitativas, el análisis de correspondencias simples es una técnica para representar las categorías de las dos variables en un espacio de pequeña dimensión que permita interpretar, por un lado, las similitudes entre las categorías de una variable respecto a las categorías de la otra, y por otro, las relaciones entre las categorías de cada una de las variables por separado

Análisis de Correspondencias Así al analizar el cruce entre dos variables se pretende 1 Reducir la información de la que disponemos a factores que permitan explicarla de modo más resumido y sencillo 2 Crear un espacio factorial en el que ubicar las variables y sujetos para poder establecer grados de semejanza y diferencia entre ellos Todo ello nos permite 1 Analizar la semejanzas y diferencias entre las categorías de una misma variable 2 Analizar la relación de semejanzas y diferencias entre las categorías de las distintas variables incluidas en el análisis

Análisis de Correspondencias Representación y reducción de las dimensiones Así a partir de la representación de las filas o columnas, se extraerá un nuevo espacio c-dimensional siendo c = [min (p,q) 1], del que a su vez se obtendrá un espacio K-dimensional tal que por un lado, K sea pequeño, y por otro, se pierda poca información respecto a la similitud entre las distintas categorías

1 2 3 4 5 Total N 71 80 81 86 102 420 E 42 43 47 47 43 222 n 55 56 58 54 49 272 V 66 68 65 65 58 322 e 18 5 1 0 0 24 252 252 252 252 252 1260

Nauseas Fármaco 1 Fármaco 2 Fármaco 3 Erupciones cutáneas Fármaco 5 Fármaco 4 Epigastralgia Vómitos No efectos secundarios

Análisis de Correspondencias Concepto de masa: La masa de cada punto (categoría marginal) será igual a la frecuencia relativa de observaciones en la categoría correspondiente Cada masa es una ponderación asignada con la finalidad de que, a la hora de extraer un eje tratando de que la deformación de la nube de puntos sea mínima, las categorías que presentan una mayor frecuencia se ven menos afectadas e inciden en mayor medida en la determinación de los ejes factoriales resultantes

Análisis de Correspondencias Concepto de Inercia: Es el estadístico que mide la dispersión de la nube de puntos. La inercia es el promedio de las distancias de los distintos puntos a su centro de gravedad, estando cada distancia ponderada por la masa del punto correspondiente La inercia total es igual al cociente entre el estadístico Chi-cuadrado de la tabla, y el total de las observaciones Es decir, si las variables son muy dependientes, tanto las filas como las columnas serán distintas entre sí, mientras que si son independientes serán parecidas

Análisis de Correspondencias Concepto de Inercia: En resumen si son independientes habrá poca inercia y si son dependientes (están relacionadas) habrá mucha inercia, es decir, mucha dispersión

Análisis de Correspondencias FASES DEL ANÁLISIS DE CORRESPONDENCIAS 1 Extracción del espacio factorial criterios: Conseguir un 70% de inercia explicada o más Sólo retener aquellas dimensiones proporción de inercia explicada superior a 1/c En síntesis si K es pequeño la solución será más fácil de interpretar pero será menos fiable que si K es grande, caso en el que ocurrirá lo contrario

Análisis de Correspondencias FASES DEL ANÁLISIS DE CORRESPONDENCIAS 2 Extracción de puntuaciones factoriales: Marginal Profile o Perfiles Marginales son las masas de las categorías o frecuencias relativas de las mismas Contribution of dimensions to the inertia of each point o CONTRIBUCIÓN RELATIVA Ayuda a conocer la calidad de representación de cada dimensión o factor Contribution of Row/Column to the inertia of each dimensíon o CONTRIBUCIÓN ABSOLUTA Cuanto influye cada categoría en el factor sirve para bautizarlos

Análisis de Correspondencias FASES DEL ANÁLISIS DE CORRESPONDENCIAS 3 Representación gráfica: Cuanto mayor sea la distancia al origen mayor será la tendencia de la categoría correspondiente a concentrar su frecuencia en determinadas celdas

1 2 3 4 5 Total N 71 80 81 86 102 420 E 42 43 47 47 43 222 n 55 56 58 54 49 272 V 66 68 65 65 58 322 e 18 5 1 0 0 24 252 252 252 252 252 1260

Coordenadas Contribución relativa Coordenadas

Contribución absoluta

Significance. 82388

Análisis de Correspondencias Interpretación de resultados Relación entre las categorías de cada variable Fármaco {1} {2,3,4} {5} Efectos secundarios {erupciones cutáneas} {Epigastralgia, nauseas, vómitos} {No hay efectos secundarios} Relación entre las categorías de ambas variables {1} {erupciones cutáneas} {2,3,4} {Epigastralgia, nauseas, vómitos} {5} {No hay efectos secundarios}

Análisis de Correspondencias Interpretación de resultados En conclusión, excepto el primer analgésico, al que se le pueden atribuir la existencia de erupciones cutáneas, los restantes son bastante homogéneos entre sí, aunque matizando pequeñas diferencias entre ellos, ya que cabe esperar que con el quinto, la ausencia de efectos secundarios sea más frecuente que con el resto

Análisis de Correspondencias Por favor, indica qué características principales asocias a cada una de las marcas de productos que te mostramos: Marcas Levi s Lois Bennetton Zara Opel Volkswgen Seat Audi Coca-Cola Kas Pepsi Cola La Casera Características Moderna Amigable Solidaria Juvenil Internacional Elegante Confiable Creativa Económica Divertida Clásica Diferente

1,2 Análisis de Correspondencias Bennetton Solidaria 0 Audi Elegante Volkswagen Levi s Internacional Moderna Confiable Opel Clásica Creativa Diferente Zara Coca- Cola Seat Divertida Lois Amigable Pepsi Cola Kas Juvenil 1,4-1,6 Economíca La Casera 0 1,0

Análisis de Correspondencias CORRESPONDENCIAS MULTIPLES Extensión del Análisis de Correspondencias Simple a más de dos variables, el objetivo es el mismo : definir los factores y asociar categorías Características 1 En lugar de partir de la tabla de contingencia partimos de la TABLA DE BURT (matriz simétrica que resume la información original) 2 Las categorías con una frecuencia significativamente baja se han de depurar pues pueden aparecer sobre representadas generando confusión

Análisis de Correspondencias CORRESPONDENCIAS MULTIPLES Características 3 La parte de inercia atribuida a cada variable es tanto mayor cuanto mayor es su número de categorías. Por ello es recomendable que las variables incluidas en el análisis tengan un número similar de categorías 4 La inercia explicada por los factores comunes es menor que en el caso de correspondencias simple. No se pretende tanto explicar un determinado % de inercia como trabajar con un número de dimensiones reducido

Análisis de Correspondencias CORRESPONDENCIAS MULTIPLES Interpretación de resultados 1 Si dos categorías tienen estructura similar aparecerán cercanas en el plano, pero que aparezcan lejanas no quiere decir necesariamente que tengan estructuras diferentes, dependerá de la calidad de representación 2 La situación cercana de una modalidad a otra sólo se puede interpretar si estamos lejos del origen. Las categorías que aparecen cercanas al origen representan una estructura media, son categorías asociadas a distintas categorías de la periferia

Análisis de Correspondencias CORRESPONDENCIAS MULTIPLES Interpretación de resultados 3 Cuando una categoría tiene un perfil próximo al perfil medio tenderá a ubicarse cercana al origen 4 Cada variable además de cada categoría explica una parte concreta de cada factor, ésta se obtiene sumando la de todas sus categorías 5 Debemos tener en cuenta las contribuciones absolutas de las modalidades o categorías para conocer cuáles son las que más influyen en el factor y así poder definirlo mejor, bautizarlo

Análisis de Correspondencias CORRESPONDENCIAS MULTIPLES Interpretación de resultados 6 Las contribuciones relativas ayudan a conocer la calidad de representación de cada categoría y no cometer errores visuales

Edad: E1 menor de 25 años E2 entre 26 y 35 años E3 entre 36 y 50 años E4 más de 50 años Nivel de Renta: R1 menos de 10.000 e R2 entre 10.000 y 20.000 e R3 entre 20.000 y 40.000 e R4 más de 40.000 e Nivel de estudios: Ep Estudios primarios Em Estudios medios Es Estudios superiores Tamaño ciudad de Residencia: Z1 Menos de 50.000 hb Z2 entre 50.000 y 200.000 hb Z3 entre 200.000 y 1.000.000 hb Z4 más de 1.000.000 hb

Frecuencia en la utilización de Productos congelados: C1 nunca C2 raras veces C3 con frecuencia C4 con mucha frecuencia C5 casi a diario Actitud hacia los Hornos microondas: Nivel profesional: M1 Los desconozco M2 No me interesa M3 Me gustaría M4 Lo tengo P1 Ama de casa P2 Trabajo no cualificado P3 Trabajo cualificado P4 Trabajo muy cualificado

Trabajo no cualficado Utiliza congelados con frecuencia Le gustaría tener microondas Menos de 50.000 Hb. Estudios primarios Nunca utiliza congelados Desconoce los microondas Más de 40.000 Hb. Utiliza congelados casi a diario Estudios superiores Tiene microondas Trabajo muy cualificado

Archivos para el ejemplo con SPSS smoking.sav coffee.sav flying.sav