TIPOS DE TÉCNICAS MULTIVARIANTES

Documentos relacionados
UNIVERSIDADA NACIONAL DEL SANTA FACULTAD DE CIENCIAS DEPARTAMENTO DE MATEMÁTICAS

TÉCNICAS MULTIVARIANTES

Objetivo. variables factores F Principios básicos. Parsimonia Interpretabilidad

IN 540 Métodos Estadísticos para Economía y Gestión. Cap. VII. Análisis Factorial

Análisis de Componentes Principales (ACP)

4 Prácticas con SPSS. 4.1 Análisis Multivariante mediante SPSS

2. Análisis factorial

ANÁLISIS DE COMPONENTES PRINCIPALES y ANÁLISIS DE FACTORES COMUNES

Correlación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r)

Profesor: Hugo S. Salinas. Primer Semestre Tabla 1: Inteligencia y Rendimiento. X Y Figura 1: Inteligencia y Rendimiento.

I. TÉCNICAS DE ANÁLISIS MULTIVARIANTE

El análisis de correspondencias. Ana María López Jiménez Dept. Psicología Experimental (USE)

Tema 3: Análisis de datos bivariantes

Tema 2 Datos multivariantes

7. ANÁLISIS DE VARIABLES CUANTITATIVAS: REGRESIÓN LINEAL SIMPLE

3.1.3 Análisis Multivariado

Reducción de la Dimensionalidad en Análisis de Datos. Análisis de Componentes Principales.

ANALISIS FACTORIAL. Jorge Galbiati R.

Análisis de Correspondencias Simple

3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS

COMPONENTES PRINCIPALES

COLEGIO DE ESTADITICOS DEL PERÚ REGIÓN LAMBAYEQUE MSC. ACOSTA PISCOYA, JORGE

Puntuaciones de las observaciones en las componentes Gráfico de dispersión de las componentes Y1 e Y2:

Eigenvalores y eigenvectores

UNIVERSIDAD AUTONOMA DEL ESTADO DE MEXICO ESCUELA PREPARATORIA TEXCOCO

ANÁLISIS DE DATOS. L.A. y M.C.E. Emma Linda Diez Knoth

Componentes principales (II)

Universidad Técnica de Babahoyo CORRELACIÓN DE VARIABLES Y REGRESIÓN LINEAL

Análisis factorial: preferencia del análisis de factor común frente al análisis de componentes principales

CARACTERÍSTICAS GRALES.

ANÁLISIS DE COMPONENTES PRINCIPALES y ANÁLISIS DE FACTORES COMUNES

Estadística ESTADÍSTICA

El análisis de datos como una herramienta para la planificación del minado

TEMA 1 Introducción 1.1. Concepto y características de la investigación comercial 1.2. La investigación comercial y el proceso de marketing de la

Guía docente 2007/2008

ESTADÍSTICA. Rincón del Maestro:

La práctica del análisis de correspondencias

Distribuciones Bidimensionales.

ANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada.

Estadística; 3º CC. AA. Examen final, 23 de enero de 2009

Tema 8: Distribuciones Unidimensionales y Distribuciones Bidimensionales. Consideraciones iniciales:

A. ANÁLISIS DE LOS RESULTADOS DE LA CONSULTA DE LAS COMPETENCIAS GENÉRICAS

ESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA

Análisis Factorial: Análisis de componentes principales

El ejemplo: Una encuesta de opinión

Capítulo 8. Análisis Discriminante

Regresión lineal. Marcelo Rodríguez Ingeniero Estadístico - Magíster en Estadística

Muy en desacuerdo Muy de acuerdo

EXAMEN DE ESTADÍSTICA II Junio de 2002 SOLUCIÓN (tiempo:100 minutos)

ÍNDICE INTRODUCCIÓN... 21

Capítulo 20 Análisis Factorial El procedimiento Análisis factorial

ANÁLISIS DE REGRESIÓN

ANÁLISIS DISCRIMINANTE

Descomposición Factorial de la In ación en Perú

TEMA 4 FASE ESTADÍSTICO-ANALÍTICA: RECURSOS PARA EL ANÁLISIS DE DATOS

1. Estadística. 2. Seleccionar el número de clases k, para agrupar los datos. Como sugerencia para elegir el k

Lucila Finkel Temario

Estadística Descriptiva II: Relación entre variables

El análisis factorial

Figura 4.1. Fases en el método hipotético-deductivo

Medidas de variabilidad (dispersión)

MASTER EN CIENCIAS ACTUARIALES Y FINANCIERAS PLAN Módulo: ANÁLISIS DEL RIESGO ACTUARIAL Y FINANCIERO

Estudio del consumo y los precios al consumo de Frutas y Hortalizas

Se usa para encontrar un numero relativamente pequeño de variables nuevas que contengan la mayor cantidad de info posible del conjunto de datos

MATEMÁTICAS 1º BI-NM Serie Estadística Unidimensional y Bidimensional

U.D.1: Análisis estadístico de una variable Consideraciones iniciales: Propuesta: 1.1 Distribución de frecuencias. Variables Cualitativas: Ejemplo

INDICE. Prólogo a la Segunda Edición

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2

Regresión múltiple. Demostraciones. Elisa Mª Molanes López

Conceptos de Estadística

Repaso de conceptos de álgebra lineal

ASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN

Lección 3. Análisis conjunto de dos variables

Caso 17. Análisis multivariante: reducción de datos por componentes principales.

FACTORES LATENTES DEL DESARROLLO EN LOS MUNICIPIOS DE LA REGIÓN DE MURCIA

TALLER DE ANÁLISIS MULTIVARIABLE TÉCNICA DE COMPONENTES PRINCIPALES SEPTIEMBRE DE 2012

Método de cuadrados mínimos

CAPITULO IV ANÁLISIS DE RESULTADOS. una interpretación de los resultados. Este capítulo está conformado por la Medida de

Estadística Inferencial. Sesión No. 9 Regresión y correlación lineal

Regresión: implica la obtención de una ecuación mediante la que podamos estimar el valor medio de una variable.

UNIVERSIDAD ABIERTA PARA ADULTOS (UAPA) Maestría en Dirección Financiera. Asignatura: Método Cuantitativo Empresarial

TEMA 14 ESTADÍSTICA. Cuantitativa: si puede medirse y expresarse con números (es una variable), por ejemplo la talla de calzado.

1, 2, 2, 3, 1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 2, 1, 1, 4, 1

Estadística. Análisis de datos.

Tema: Medidas de Asociación con SPSS

QUE ES EL ANÁLISIS MULTIVARIANTE

Consultor en investigación social y de mercados y analista web.

Tema 10: Introducción a los problemas de Asociación y Correlación

TEMA 2: DISTRIBUCIONES BIDIMENSIONALES

Un estudio estadístico consta de las siguientes fases: Recogida de datos. Organización y representación de datos. Análisis de datos.

Syllabus. Curso:SEXTO. Materia:ESTUDIOS MATEMÁTICOS

Estadística para el análisis de los Mercados S3_A1.1_LECV1. Estadística Descriptiva Bivariada

ESTADÍSTICA. A su vez, las variables pueden ser :

FLORIDA Secundaria. 1º BACH MATEMÁTICAS CCSS -1- BLOQUE ESTADÍSTICA: ESTADÍSTICA VARIABLE UNIDIMENSIONAL. Estadística variable unidimensional

Tema 1: Estadística descriptiva. Probabilidad y Estadística (Ing. Informática). Tema 1: Estadística descriptiva 1

3 ANALISIS DESCRIPTIVO DE LOS DATOS

Tema 1. 1 Álgebra lineal. Aurea Grané Departamento de Estadística Universidad Carlos III de Madrid. 1.1 Vectores de R n. 1. Vectores. 2.

APLICACIÓN DEL ANÁLISIS FACTORIAL A LA INVESTIGACIÓN DE MERCADOS. CASO DE ESTUDIO

SPSS Aplicación práctica: Base de datos del HATCO

Transcripción:

TIPOS DE TÉCNICAS MULTIVARIANTES Factoriales: 1. Análisis de Componentes Principales. Para tablas de medidas o de escalas métricas. 2. Análisis de Correspondencias Simple y Múltiple. Para tablas de contingencia o de frecuencias Clasificación: 1. Análisis Clúster 2. Análisis Discriminante 1

Métodos de Análisis Multivariado Métodos Predictivos: 1)Regresión multivariado 2) MANOVA Y MANCOVA 3) Análisis Discriminante Métodos Reductivos: 1) Componenentes principales 2)Análisis Factorial, Correlación Canónica 3) Análisis de Cluster, de Correspondencia 2

VARIABLES...notación... Individuos V1 V2... Vj... Vp 1 X 11 X 12... X 1j... X 1p 2 X 21 X 22... X 2j... X 2p 3 X 31 X 32... X 3j... X 3p.. n X n1 X n2... X nj... X np 3

Reducción de Dimensión Análisis de Interdependencia ANÁLISIS DE COMPONENTES PRINCIPALES (Análisis exploratorio) 4

Reducción de Dimensión mirar a los datos para ver que pretenden decir (John Tukey,1977) Podemos ver en 3D pero no más allá!!!! Para entender que está pasando en dimensiones mayores Técnicas de reducción de dimensión Una proyección de los datos a un espacio en el que podemos visualizarlos 5

2. Análisis de Componentes Principales Objetivo: Transformar un conjunto de variables en un nuevo conjunto, componentes principales, incorrelacionadas entre sí. Se consigue una representación simplificada, más sencilla y fácil de ver. Metodología: Los datos se presentan en una tabla rectangular con n líneas (individuos) y p columnas (variables) (matriz R, nxp). Puede ser disimétrica y con variables heterogéneas. Hay dos espacios: R p : n individuos con los valores que toman para cada una de las p variables. R n : p variables para cada individuo. Finalidad: Buscar un subespacio R q, q<p que contenga la mayor cantidad posible de información de la nube primitiva, y que mejor se ajuste a la nube de puntos y la deforme lo menos posible. El criterio de ajuste es el de mínimos cuadrados. Se obtendrán nuevas variables, combinaciones lineales de las variables originales llamadas factores o componentes. 6

Gráficamente: u i es el vector unitario o propio y z i es la proyección de x i en F i. Como medida de la cantidad de información incorporada en una componente se utiliza su varianza. Cuanto mayor sea, mayor es la información incorporada a dicha componente. La primera componente será la de mayor varianza. Para obtener los factores o componentes que diferencian al máximo a los individuos entre sí, medidos a través de caracteres métricos, la extracción se realiza sobre variables tipificadas, con matriz X, para evitar problemas de escala. La suma de las varianzas es igual a p, ya que la de cada una de ellas es igual a 1 y habrá tantas componentes como número de variables originales. Mientras más correlacionadas estén las variables originales entre sí, más alta será la variabilidad que se pueda explicar con menos componentes. Si existiera incorrelación, el ACP carecería de sentido, ya que las variables originales y las componentes o nuevas variables coincidirían. 7

9

10

11

12

13

14

15

16

17

MATRIZ DE DATOS Cálculo de medias y desviaciones típicas X: MATRIZ DE DATOS TIPIFICADOS R =X X MATRIZ DE CORRELACIONES Diagonalización de R, cálculo de valores propios, varianza explicada y correlaciones COMPONENTES PRINCIPALES 18

Algebra del Análisis 1) Matriz de n observaciones con p variables cuantitativas por observación, X 2) Matriz de covarianzas o correlación (pxp), S o R 3) Descomposición Espectral (obtiene autovalores y autovectores de S) 4) Construye las CP = Combinaciones lineales de las variables originales usando como coeficiente de la combinación los elementos de un autovector. Si se usa el primer autovector, se tiene la CP1, si se usa el segundo autovector, se tiene la CP2, y así hasta la CP número p. 5) Quedarse con las primeras k CPs si la proporción de varianza explicada acumulada por esas k CPs es alta.

Algebra del Análisis La CP1 se obtiene encontrando la recta que minimiza la suma de los cuadrados de las distancias de los puntos a sus proyecciones ortogonales sobre esa recta. Su dirección está dada por el autovector asociado al mayor autovector de S. La proyección de una observación sobre esa recta es una CL de las observaciones que tiene como coeficientes a los elementos del primer autovector normalizado La recta maximiza la suma de los valores de la componente al cuadrado (maximiza las varianzas de las proyecciones ortogonales de los datos sobre la recta) La CP1 se define como la CL normalizada de las variables originales que tiene máxima varianza. La segunda CP se construye con el segundo autovector, es decir es ortogonal a la primera por lo que ambas conforman el plano que mejor (mínima distancia al cuadrado) aproxima a la nube de puntos multidimensional

Algebra del Análisis Se demuestra que el hiperplano (subespacio) de dimensión r que minimiza la suma de las distancias al cuadrado entre cada dato y su proyección ortogonal sobre dicho hiperplano se determina maximizando la varianza total (varianza en las r dimensiones) y queda definido por los r autovectores normalizados asociados a los r autovalores de S. Estas direcciones se denominan direcciones principales de los datos y las nuevas variables por ellas definidas son las r primeras CP muestrales.

Consecuencias del Algoritmo La CP1 permite visualizar más variabilidad en los datos que cualquier otra CP. La CP2 no esta correlacionada con la CP1 (aporta nueva información) y explica mayor variabilidad que cualquier otra CP que no sea la CP1. Un gráfico de dispersión construido a partir de la CP1 y la CP2 proyecta la nube de datos en el sentido de máxima variación. Ideal para estudiar variación. Un número k de CPs, con k mucho menor a p, puede explicar la variabilidad de la información con poca pérdida de información.

Consecuencias del Algoritmo Cuando un CP tiene todos sus coeficientes (relevantes) positivos, es decir es un promedio ponderado de todas las variables que lo integran, se dice que es un factor global de tamaño. Esto ocurre, por ej., con la CP1 cuando todos los pares de variables originales tienen una alta correlación positiva. Cuando un CP tiene coordenadas positivas y negativas, está contraponiendo un grupo de variables con otro grupo. Se dice que es un factor de forma. Frecuentemente, éstos pueden expresarse como promedios ponderados de dos grupos de variables con distinto signo

Selección del Número de ACP Gráfico de autovalores. Se busca un quiebre a partir del cual todos los autovalores posteriores son iguales entre sí. Fijar la proporción de la varianza explicada Cota inferior para los autovalores (por ej., la varianza media - autovalor promedio para S o 1 para R.

MÉTODOSPARA ESTIMAR EL NÚMERO DE CP Cuando los puntos en la gráfica tienden a nivelarse, estos autovalores suelen estar suficientemente cercanos a cero como para que puedan ignorarse Autovalor Proporción Acumulada CP1 66.53 54.30 54.30 CP2 18.18 14.84 69.14 CP3 10.59 8.64 77.78 CP4 6.77 5.52 83.30 CP5 3.98 3.25 86.55 CP6 3.63 2.96 89.52 CP7 2.91 2.38 91.90 CP8 2.84 2.31 94.21 CP9 1.95 1.59 95.80 CP10 1.61 1.32 97.12 CP11 1.14 0.09 98.05 CP12 0.87 0.07 98.76 CP13 0.71 0.06 99.32 Eigenvalue 70 60 50 40 30 20 10 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 # CP CP14 0.51 0.04 99.75 CP15 0.30 0.01 100.00 25

ACP sobre R Cuando las variables originales tienen unidades de medida distinta, la maximización de las varianzas de las proyecciones ortogonales depende de esta escala de medida y las variables con valores más grandes tienen más peso en el análisis de componentes que las restantes. Conviene estandarizar = trabajar con autovalores y autovectores de R

Resumen Las componentes principales son combinaciones lineales de las variables originales. Los coeficientes de las combinaciones lineales son los elementos de los vectores característicos asociados a la matriz de covarianzas de las variables originales. Por tanto, la obtención de componentes principales es un caso típico de cálculo de raíces y vectores característicos de una matriz simétrica. La primera componente se asocia a la mayor raíz característica a que va asociada. Si se tipifican las variables originales, su proporción de variabilidad total captada por una componente es igual a su raíz característica dividida por el número de variables originales. La correlación entre una componente y una variable original se determina con la raíz característica de la componente y el correspondiente elemento del vector característico asociado, si las variables originales están tipificadas 27

CASO: Posicionamiento de turistas en Tenerife Objetivo: Posicionamiento del producto turístico de Tenerife según nacionalidades. Metodología: Cuestionario: Fichero base turistas curso.sav. Caso de ACP: Se han elegido noches, nº visitas, nº personas, gasto y edad Se crea una nueva variable: Gasto/persona/noche. Se obtienen las medianas por nacionalidad para las variables. 28

Datos. Medianas Nacionalidad Nº Noches Nº visitas anteriores Gasto noche/persona Edad Alemana 14,00,00 76,6290 42,00 Austriaca 7,00,00 35,7452 33,00 Belga 7,00 1,00 46,2028 35,00 Británica 14,00 2,00 37,5633 39,00 Española 7,00,00 85,8589 31,00 Europa exc 7,00,00 41,7811 24,50 Finlandesa 32,00 50,00 46,9541 73,00 Francesa 7,00,00 75,1265 38,00 Holandesa 14,00,00 18,9410 26,00 Italiana 7,00,00 72,9800 28,00 R. América 29,00 1,00 19,1990 22,50 R. Europa 7,00,00 89,0786 34,00 R. mundo 6,00,00 117,9486 30,00 Sueca 7,00,00 123,5552 30,00 Suiza 7,00,00 80,3639 37,00 Fuente: Encuesta a turistas. Base turistas.sav Tabla de datos: Matriz con 15 filas, correspondientes a las nacionalidades, y 4 columnas, correspondientes a las 4 variables. Dentro, medianas 29

SPSS versión 22 para windows Analizar Reducción de datos Análisis Factorial 30

Elección del numero de ejes Criterio de la media aritmética: Se seleccionan las componentes cuya varianza (valor propio) o inercia asociada a cada componente, exceda de la media de las raíces características. Por tanto, se debepverificar que λi i 1 λh λ p Si las variables originales están tipificadas, λ j p, por lo que la media j 1 de la inercia es igual a 1. Se retendrán los factores cuya inercia sea mayor que 1. p 31

Resultados ACP 1 Estadísticos descriptivos más importantes de las variables utilizadas Estadísticos descriptivos Nº Noches Nº visitas anteriores Edad del turista Gasto por persona y día Desviación Media tí pica N del análisis 11, 47 8, 27 15 3, 60 12, 85 15 34, 87 11, 92 15 64, 53 32, 54 15 El perfil promedio de los turistas de la muestra tiene un estancia promedio de 11 o 12 días, han visitado con anterioridad la isla entre 3 y 4 ocasiones, el gasto persona/día de sus vacaciones ha sido de 64,53, la edad es aproximadamente 35 años. La variable con mayor grado de dispersión relativa es el nº de visitas anteriores (357%). 32

Resultados ACP 2 Matri z de correl aciones Correlac ión Sig. (Unilateral) Nº Noches Nº visitas anteriores Edad del turista Gasto por persona y día Nº Noches Nº visitas anteriores Edad del turista Gasto por persona y día Nº visitas Edad del Gasto por Nº Noches ant eriores turista persona y día 1, 000,702,509 -, 508,702 1, 000,887 -, 170,509,887 1, 000 -, 016 -,508 -,170 -,016 1,000,002,026,027,002,000,272,026,000,478,027,272,478 Matriz de coeficientes de correlación para todos los pares de variables originales. Niveles de significación unilaterales de cada uno de los coeficientes. Para un nivel del 5% de significación, resultaron significativos 4 de los 6 (67%), porcentaje de índices de correlación adecuado para el análisis. 33

Resultados ACP 3 La adecuación de los datos al análisis factorial de componentes principales se contrasta mediante KMO y prueba de Bartlett KMO y prueba de Bartlett Medida de adecuación muestral de Kaiser-Mey er-olkin.,572 Prueba de esf ericidad de Bartlett Chi-cuadrado aproximado gl Sig. 32, 762 6,000 34

Resultados ACP 4 KMO: Estadístico de prueba de la hipótesis de que las correlaciones parciales entre las variables son pequeñas. Indica la proporción de varianza de las variables originales que es común, y que podría ser explicada por factores subyacentes. Valores cercanos a 1: un análisis factorial puede ser útil para los datos. Valores menores de 0,5: los resultados probablemente no sean muy útiles. KMO i j i j 2 ij r 2 ij r i j a 2 ij rij : coeficiente de correlación lineal de Pearson entre las variables i,j aij: coeficiente de correlación parcial entre las variables i,j KMO = 0,6: Los datos muestran ser adecuados para el análisis ACP. Prueba de esferidad de Bartlett: Indica si la matriz de correlaciones es una matriz identidad, por lo que que las variables no están relacionadas Hay evidencia suficiente para rechazar que la matriz de correlaciones es una matriz identidad. Existe un cierto nivel de relación entre las variables. 35

Resultados ACP 5 Matri ces anti-imagen Cov arianza anti-imagen Correlac ión anti-imagen a. Medida de adecuación muestral Nº Noches Nº visitas anteriores Edad del turista Gasto por persona y día Nº Noches Nº visitas anteriores Edad del turista Gasto por persona y día Nº visitas Edad del Gasto por Nº Noches ant eriores turista persona y día,333 -, 117,057,236 -,117,128 -,130 -,013,057 -, 130,184 -, 047,236 -, 013 -, 047,661,617 a -,567,229,503 -,567,556 a -,850 -,043,229 -,850,569 a -,136,503 -,043 -,136,513 a Covarianzas y correlaciones parciales negativas. Índice de las correlaciones no debidas a los factores. Valores pequeños: las variables están relativamente libres de correlaciones no explicadas. La mayoría de los valores fuera de la diagonal principal deberían ser muy pequeños (próximos a cero). En nuestro caso, parece existir una parte importante de las correlaciones entre las variables que los factores extraídos no consiguen explicar. Elementos de la diagonal principal de la matriz de correlación anti-imagen: medida de adecuación muestral para cada variable. Valores inferiores a 0,5: Las variables no se ajustan a la estructura de las otras. Deberíamos eliminarlas del análisis. En nuestro caso todas las variables presentan una medida de adecuación muestral superior a 0,5. 36

Resultados ACP 6 Comunali dades Inic ial Extracción Nº Noches 1, 000,835 Nº visitas anteriores 1, 000,954 Edad del turista 1, 000,918 Gasto por persona y día 1, 000,926 Mét odo de extracción: Análisis de C omponent es principales Indican la cantidad de varianza de cada variable que es explicada. En el método de extracción Componentes Principales, las comunalidades iniciales son siempre 1. Las comunalidades de la extracción son estimaciones de la varianza de cada variable que es explicada por los factores incluidos en la solución factorial. Para todas las variables la cantidad de varianza explicada por los factores de la solución factorial es alta. Todas las variables se ajustan bien a la solución factorial. 37

Resultados ACP 7 Componente 1 2 3 4 Autov alores iniciales Varianza total expli cada % de la % de la % de la Total v arianza % acumulado Tot al v arianza % acumulado Tot al v arianza % acumulado 2, 511 62, 772 62, 772 2, 511 62, 772 62, 772 2, 248 56, 190 56, 190 1, 122 28, 047 90, 819 1, 122 28, 047 90, 819 1, 385 34, 628 90, 819,291 7, 265 98, 084,077 1, 916 100,000 Mét odo de extracción: Análisis de Componentes princ ipales. Sumas de las saturaciones al cuadrado de la extracción Las tres primeras columnas se refieren a la solución inicial, y hay tantos valores como componentes o factores posibles. Total: Cantidad de varianza explicada por cada componente en las variables observadas. % de varianza : Porcentaje de varianza explicada por las componentes. Suma de las s aturaciones al cuadrado de la rotación % de varianza acumulado : Porcentaje acumulado de varianza explicada por la componente correspondiente y las anteriores. En nuestro caso los dos primeros factores consiguen explicar prácticamente el 91% de la varianza de las variables originales, lo que indica un buen modelo factorial. También se muestran las cantidades de varianza explicada por cada factor extraído una vez realizada la rotación de los mismos. En ese caso, el factor 1 explica más del 56% de la varianza, mientras que el segundo factor explica el 34.63%. 38

Resultados ACP 8 Nº visitas anteriores Nº Noches Edad del turista Matriz de componentes a Gasto por persona y día Componente 1 2,943,254,860 -,309,848,447 -,404,873 Mét odo de extracción: Análisis de c omponentes principales. a. 2 componentes extraídos Cargas factoriales para cada variable sobre las componentes no rotadas. Cada valor representa la correlación entre la variable y la componente. Pueden ayudar a formular una interpretación de los factores. La mayoría de las variables originales presentan una correlación alta con el primero de los factores, lo que dificulta la interpretación de los mismos. Matriz de casos Nacionalidad F1 F2 Alemana 0,142 0,380 Austriaca -0,201-0,666 Belga -0,167-0,331 Británica 0,309-0,619 Española -0,505 0,466 Europa excomunista -0,471-0,805 Finlandesa 3,374 0,988 Francesa -0,254 0,443 Holandesa -0,026-1,534 Italiana -0,526 0,058 Resto América 0,524-2,126 Resto Europa -0,436 0,643 Resto mundo -0,734 1,234 Sueca -0,720 1,335 Suiza -0,308 0,535 40

Correlaciones reproducidas y residuos Resultados ACP 9 Patrón predictivo de las relaciones. Si la solución es correcta, las correlaciones reproducidas están próximas a los valores observados, Los residuos indican la diferencia entre valores reproducidos y observados. La mayoría de estos valores deberán ser pequeños. Correlac ión reproducida Residual a Nº Noches Nº visitas anteriores Edad del turista Correlaci ones reproducidas Gasto por persona y día Nº Noches Nº visitas anteriores Edad del turista Gasto por persona y día Nº visitas Edad del Gasto por Nº Noches ant eriores turista persona y día,835 b,733,591 -,617,733,954 b,913 -,159,591,913,918 b,047 -,617 -,159,047,926 b -,030 -,082,109 -,030 -,026 -,011 -,082 -,026 -,063,109 -,011 -,063 Mét odo de extracción: Análisis de Componentes princ ipales. a. Los residuos se calculan entre las correlaciones observ adas y reproduc idas. Hay 3 (50, 0%) residuales no redundantes con v alores absolutos may ores que 0,05. b. Comunalidades reproducidas a. Hay 3 (50,0%) residuales no redundantes con valores absolutos mayores que 0,05. Los valores residuales son pequeños. La bondad del modelo factorial estimado es bastante alta 41

Resultados ACP 10 Matriz de coeficientes para el cálculo de las puntuaci ones en las componentes Nº Noches Nº visitas anteriores Edad del turista Gasto por persona y día Componente 1 2,189 -,397,437,040,477,211,194,771 Mét odo de extracción: Análisis de c omponentes principales. Mét odo de rotación: Normalización Varimax con Kaiser. Valores utilizados para el cálculo de las puntuaciones para cada caso. Para cada nacionalidad, la puntuación factorial se calcula multiplicado los valores de la variable por los coeficientes de la puntuación factorial. 42

Gráfico ACP: Diagrama de dispersión 43

Rotación de los ejes: Procedimientos Objetivo: Obtener nuevos factores más fáciles de interpretar. Cada variable original tendrá una correlación lo más próxima a 1 con uno de los factores y lo más próximas a 0 con el resto. Cada factor tendrá correlación alta con un grupo de variables y baja con el resto. 1. Rotación ortogonal: Queda preservada la incorrelación entre los factores. VARIMAX. Los ejes de los factores rotados se obtienen maximizando la suma de varianzas de las cargas factoriales al cuadrado dentro de cada factor. Problema: Las variables con mayores comunalidades tienen mayor influencia en la solución final. Para evitarlo: normalización de Kaiser: Cada carga factorial al cuadrado se divide por la comunalidad de la variable correspondiente (VARIMAX normalizado). Ventaja: queda inalterada tanto la varianza total explicada por los factores como la comunalidad de cada una de las variables EQUAMAX y el QUARTIMAX 2. Rotación oblicua: Factores no incorrelacionados. Se compensarse si se consigue una asociación más nítida de cada variable con el factor correspondiente. OBLIMIN: Se utilizan algoritmos para controlar el grado de no ortogonalidad. Tampoco se ve modificada la comunalidad en la rotación oblicua 44

Resultados Rotación VARIMAX 1 Las cargas factoriales quedan más repartidas Para la componente 1 las variables con mayores cargas factoriales son: nº de visitas anteriores (+), edad del turista (+) y nº de noches (+), aunque ésta última, también presenta una alta carga factorial con la componente 2. Con la componente 2 además de el nº de noches (-), se da una alta correlación con : gasto por persona y día (+). Explicación: Matriz de componentes rotados a Nº visitas anteriores Edad del turista Gasto por persona y día Nº Noches Componente 1 2,960 -,182,958,033,017,962,640 -,652 Mét odo de extracción: Análisis de c omponentes principales. Mét odo de rotación: Normalización Varimax con Kaiser. a. La rotación ha conv ergido en 3 iteraciones. Componente 1: Los turistas de más edad son los que más veces han repetido visita a Tenerife, y los que más alargan su estancia durante sus vacaciones. Componente 2: Los que más gastan por persona y día son los que menor tiempo de estancia tienen. 45

Resultados Rotación VARIMAX 2 MATRIZ DE CASOS ROTADOS Nacionalidad F1 F2 Alemana 0,293 0,280 Austriaca -0,471-0,512 Belga -0,294-0,226 Británica 0,008-0,692 Española -0,252 0,640 Europa excomunista -0,775-0,520 Finlandesa 3,467-0,580 Francesa -0,036 0,510 Holandesa -0,691-1,370 Italiana -0,449 0,281 Resto América -0,454-2,142 Resto Europa -0,112 0,769 Resto mundo -0,123 1,430 Sueca -0,067 1,515 Suiza -0,044 0,616 Factor 1: Cuadrante positivo: Nacionalidades: Finlandesa, Alemana y Británica. Nº visitas anteriores, edad, nº noches Cuadrante negativo: Nacionalidades: Resto Factor 2: Cuadrante positivo: Nacionalidades: Alemana, Española, Francesa, Italiana, Resto de Europa, Resto del Mundo, Sueca y Suirza. Gasto noche persona Cuadrante negativo: Nacionalidades: Resto. Nº noches 46

Gráfico ACP rotado: Diagrama de dispersión 47

Caso a resolver: Imagen de fabricantes de modas para penetración en un mercado extranjero La marca de ropas St. John no es muy conocida en Europa. Procede de EEUU. Allí es adquirida por mujeres de nivel socioeconómico alto. St. John fabrica primordialmente trajes de chaqueta, empleando fibras naturales que mezcla con una pequeña parte de un polímero sintético que impide que la ropa se arrugue. Muchas mujeres compran ropa de este fabricante, especialmente si realizan un trabajo en el que la imagen sea importante, pues los trajes presentan un aspecto impecable después de muchas horas de llevarlos puestos. Se puede llegar al final de la jornada casi sin que sea necesario tener que plancharlos. En 1991 se realizó un estudio sobre el posicionamiento de marcas de fabricantes de ropa (Dishener y Grande, 1991) para detectar cómo era percibida esta marca y encontrar el segmento en el que podría ser incluida y decidir sobre la oportunidad de penetrar en el mercado español. Fase cualitativa: Como la marca no era conocida en España, no tenía mucho sentido obtener información en el mercado. Se optó por consultar con expertos del mundo de la moda para que posicionaran las marcas. Tras una serie de entrevistas con directores de escuelas de diseño de moda se consideraron las variables más importantes para juzgar una serie de marcas. En un principio se pensó que, debido al perfil socioeconómico de las compradoras de St. John en EEUU, el segmento dentro del cual podría penetrar la marca podría ser el de Loewe o Chanel. 48

Objetivo del estudio: Averiguar en qué medida se situaba cada una de las marcas respecto a una marca media. Se intenta obtener las valoraciones de cada marca; no sólo estudiar qué aspectos destacan en su imagen, sino si se encuentran por debajo o por encima de la media. Metodología: Se consideró que la técnica más adecuada para este caso era el Análisis de Componentes Principales, que trabaja con datos métricos. Se diseñó un cuestionario en el que debían valorarse de 0 a 100 las características citadas para cada una de las marcas. La valoración que debía darse era en términos positivos: cuanto más cara fuera la marca, mayor su calidad, prestigio, exclusividad, etc., mayor tenía que ser la puntuación asignada. La aparente dificultad de las valoraciones - obliga a pensar y fatiga - quedó mitigada por el reducido número de atributos a valorar y la gran cualificación de los encuestados, todos ellos expertos en moda. Muestra: El cuestionario se distribuyó a 256 directores de centros de diseño de moda, 30 distribuidores y 10 importadores. La información se recogió a lo largo de mayo y junio de 1991. Los valores medios de cada marca en cada atributo son los siguientes: 49

CASAS P1 P2 P3 P4 P5 P6 P7 ÚNGARO 79 87 87 87 82 72 62 ARMANI 69 89 96 92 91 72 75 GENNY 63 77 73 91 72 73 90 VERINO 64 72 68 56 55 69 62 ESCADA 70 91 82 76 82 75 72 FERRAUD 60 78 70 71 72 59 53 VERSACE 78 83 92 91 66 87 79 ST. JOHN 72 87 54 75 85 59 81 DIOR 69 83 85 81 74 53 77 KENZO 68 78 82 79 65 81 65 A. DOMINGUEZ 65 76 75 77 72 68 44 BURBERRYS 69 77 74 63 72 30 48 MOSCHINO 71 81 89 87 44 92 91 YVES ST.LAURENT 62 82 79 80 81 63 72 P.CARDIN 66 71 75 69 72 37 53 RODIER 65 62 60 58 48 30 28 LOEWE 74 91 97 92 91 48 90 CHANEL 73 92 99 97 97 64 94 ESCORPION 71 63 52 48 52 32 27 BENETTON 70 53 77 64 30 62 51 P1 PRECIO P2 CALIDAD P3 PRESTIGIO P4 EXCLUSIVIDAD P5 ELEGANCIA P6 VANGUARDIA P7 COMPLEMENTOS 50