Análisis de componentes principales

Documentos relacionados

Álgebra lineal y matricial

Definición de vectores

Covarianza y coeficiente de correlación

1 v 1 v 2. = u 1v 1 + u 2 v u n v n. v n. y v = u u = u u u2 n.

Geometría Tridimensional

Vectores: Producto escalar y vectorial

Vectores en el espacio

DIBUJO TÉCNICO. UNIDAD DIDÁCTICA 9: Geometría 2D (V)

Definición Dados dos números naturales m y n, una matriz de orden o dimensión m n es una tabla numérica rectangular con m filas y n columnas.

_ Antología de Física I. Unidad II Vectores. Elaboró: Ing. Víctor H. Alcalá-Octaviano

3.1 DEFINICIÓN. Figura Nº 1. Vector

VECTORES COORDENADOS (R n )

Nivelación de Matemática MTHA UNLP 1. Vectores

Anexo 1: Demostraciones

COORDENADAS CURVILINEAS

Tema 2. Espacios Vectoriales Introducción

ECUACION DE DEMANDA. El siguiente ejemplo ilustra como se puede estimar la ecuación de demanda cuando se supone que es lineal.

1 Espacios y subespacios vectoriales.

VECTORES. Por ejemplo: la velocidad de un automóvil, o la fuerza ejercida por una persona sobre un objeto.

VECTORES EN EL PLANO

ASOCIACIÓN LINEAL ENTRE VARIABLES CUANTITATIVAS: la correlación de Pearson

TEOREMA DE DETERMINACIÓN DE APLICACIONES LINEALES

6. VECTORES Y COORDENADAS

4 APLICACIONES LINEALES. DIAGONALIZACIÓN

De acuerdo con sus características podemos considerar tres tipos de vectores:

Subespacios vectoriales en R n

Este documento ha sido generado para facilitar la impresión de los contenidos. Los enlaces a otras páginas no serán funcionales.

1. Vectores 1.1. Definición de un vector en R2, R3 (Interpretación geométrica), y su generalización en Rn.

BASES Y DIMENSIÓN. Propiedades de las bases. Ejemplos de bases.

8.1. Introducción Dependencia/independencia estadística Representación gráfica: diagrama de dispersión Regresión...

Selectividad Junio 2008 JUNIO 2008 PRUEBA A

Muchas veces hemos visto un juego de billar y no nos percatamos de los movimientos de las bolas (ver gráfico 8). Gráfico 8

Curso de Procesamiento Digital de Imágenes

REGRESION simple. Correlación Lineal:

VECTORES. Módulo, dirección y sentido de un vector fijo En un vector fijo se llama módulo del mismo a la longitud del segmento que lo define.

Estructuras algebraicas

1. Producto escalar, métrica y norma asociada

Diagonalización de matrices

Seminario Universitario Material para estudiantes. Física. Unidad 2. Vectores en el plano. Lic. Fabiana Prodanoff

PROGRAMACIÓN LINEAL Introducción Inecuaciones lineales con 2 variables

E 1 E 2 E 2 E 3 E 4 E 5 2E 4

PROBLEMA [1.5 puntos] Obtener la ecuación de la recta tangente en el punto ( 2, 1) a la curva dada implícitamente por y 3 +3y 2 = x 4 3x 2.

VECTORES. Abel Moreno Lorente. February 3, 2015

Caracterización geométrica

Tema 3. Medidas de tendencia central Introducción. Contenido

Espacios vectoriales. Bases. Coordenadas

Tema 1. VECTORES (EN EL PLANO Y EN EL ESPACIO)

Aplicaciones Lineales

Tema 3. Espacios vectoriales

APUNTES DE MATEMÁTICAS TEMA 4: VECTORES 1º BACHILLERATO

MATEMÁTICAS para estudiantes de primer curso de facultades y escuelas técnicas

CURSO CERO. Departamento de Matemáticas. Profesor: Raúl Martín Martín Sesiones 18 y 19 de Septiembre

Capitán de fragata ingeniero AGUSTÍN E. GONZÁLEZ MORALES. ÁLGEBRA PARA INGENIEROS (Solucionario)

Geometría analítica. Impreso por Juan Carlos Vila Vilariño Centro I.E.S. PASTORIZA

RECTAS Y PLANOS EN EL ESPACIO

Matrices equivalentes. El método de Gauss

Aplicaciones Lineales

Departamento de Economía Aplicada I ESCUELA UNIVERSITARIA DE ESTUDIOS EMPRESARIALES DIPLOMATURA EN CIENCIAS EMPRESARIALES ESTADÍSTICA

Sistemas de vectores deslizantes

Apoyo para la preparación de los estudios de Ingeniería y Arquitectura Física (Preparación a la Universidad) Unidad 4: Vectores

Análisis de medidas conjuntas (conjoint analysis)

1.4.- D E S I G U A L D A D E S

GUIAS DE ACTIVIDADES Y TRABAJO PRACTICO Nº 21

Medidas de tendencia central o de posición: situación de los valores alrededor

BREVE MANUAL DE SOLVER

GEOMETRÍA ANALÍTICA 2º Curso de Bachillerato 22 de mayo de 2008

FUNCIONES CUADRÁTICAS Y RACIONALES

1. El teorema de la función implícita para dos y tres variables.

y λu = Idea. Podemos sumar vectores y multiplicar por un escalar. El resultado vuelve a ser un vector Definición de espacio vectorial.

Selectividad Septiembre 2013 OPCIÓN B

PROBLEMAS MÉTRICOS. Página 183 REFLEXIONA Y RESUELVE. Diagonal de un ortoedro. Distancia entre dos puntos. Distancia de un punto a una recta

Ecuaciones de primer grado con dos incógnitas

La forma algebraica de la ecuación producto cruz es más complicada que la del producto escalar. Para dos vectores 3D y,

Álgebra Lineal Ma1010

INFLUENCIA DE SELECTIVIDAD EN LAS MATEMÁTICAS DE ECONOMÍA

CURSO BÁSICO DE FÍSICA MECÁNICA PROYECTO UNICOMFACAUCA TU PROYECTO DE VIDA

GEOMETRÍA ANALÍTICA GIRO DE LOS EJES

ANÁLISIS DE DATOS NO NUMERICOS

a < b y se lee "a es menor que b" (desigualdad estricta) a > b y se lee "a es mayor que b" (desigualdad estricta)

Vectores no colineales.

ANALISIS MULTIVARIANTE

Universidad de la Frontera. Geometría Anaĺıtica: Departamento de Matemática y Estadística. Cĺınica de Matemática. J. Labrin - G.

Segundo de Bachillerato Geometría en el espacio

Universidad de Costa Rica Escuela de Matemática CONARE-PROYECTO RAMA. Funciones

TEMA 1: DISEÑO Y DIBUJO DE OBJETOS.

ÁLGEBRA DE MATRICES. Al consejero A no le gusta ninguno de sus colegas como presidente.

En la siguiente gráfica se muestra una función lineal y lo que representa m y b.

Cambio de representaciones para variedades lineales.

TEMA II ÁLGEBRA VECTORIAL; FUNDAMENTOS Definicion, notacion y clasificacion de los vectores.

Capítulo 10. Análisis descriptivo: Los procedimientos Frecuencias y Descriptivos

6 ANÁLISIS DE INDEPENDENCIA O ASOCIACIÓN ENTRE DOS ATRIBUTOS

ESTADÍSTICA SEMANA 4

Tema 5: Dualidad y sensibilidad de los modelos lineales.

Finanzas de Empresas Turísticas

ANALISIS DE COMPONENTES PRINCIPALES

SISTEMAS INTELIGENTES

Funciones, x, y, gráficos

Los métodos Biplot. LOS METODOS BIPLOT (Teoría) José Luis Vicente Villardón Departamento de Estadística Universidad de Salamanca

EXAMEN DE MATEMÁTICAS 2º BACHILLERATO CCNN BLOQUE : GEOMETRÍA

Un ejemplo de ACP paso a paso

Transcripción:

Capítulo 2 Análisis de componentes principales 2.1. INTRODUCCIÓN El Análisis de componentes principales trata de describir las características principales de un conjunto de datos multivariantes, en los que se han medido p variables cuantitativas a n objetos. Esto se realiza construyendo un conjunto de variables incorreladas (componentes principales) que son combinación lineal de las variables originales. Las componentes principales están ordenadas en órden decreciente de importancia, de manera que la primera componente proporciona (o recoge) la mayor variabilidad posible de los datos. Seleccionando las componentes más importantes se resume la información que proporcionan los datos con poca pérdida de información. Los datos se podrán representar en un espacio de menor dimensión con ejes ortogonales. 1

Ejemplo 2.1 Ventas de dos productos en 25 establecimientos nacionales. X 1 X 2 X 1 X 2 X 1 X 2 191 155 179 158 192 154 195 149 183 147 174 143 181 148 174 150 176 139 183 153 190 159 197 167 176 144 188 151 190 163 208 157 163 137 189 150 195 155 197 159 186 153 188 152 181 145 192 150 175 140 Vector de medias y la matriz de covarianzas: ( ) ( 185,7 95,29 52,87 X =, S 151,1 X = 52,87 54,36 Variables centradas: Y 1 = X 1 x 1 e Y 2 = X 2 x 2. Centramos los datos y representamos los puntos centrados P i = (y i1, y i2 ), i = 1, 2,..., 25. ) 2

3 40 Y 2 Z 2 30 20 P i Z 2 10 0-30 -20-10 0 10 20 30 Y 1-10 -20-30 -40 Figura 2.1: Nube de puntos (y i1, y i2 ), i = 1,..., 25. Se desea construir dos nuevos ejes que representen mejor los datos. P i = (y i1, y i2 ) punto genérico de la nube p i = (y i1, y i2 ) vector que va desde el origen hasta el punto P i a 1 = (a 11, a 21 ) vector director (unitario) de un nuevo eje Z 1 a 2 = (a 12, a 22 ) vector director (unitario) de un nuevo eje Z 2 Coordenadas de P i en los nuevos ejes Z 1 y Z 2 : z i1 =..., z i2 =...,

Estos son los valores del establecimiento i respecto a dos nuevas variables Z 1 y Z 2. Por tanto, buscar dos nuevos ejes donde representar los datos es equivalente a buscar dos nuevas variables Z 1 y Z 2 que son combinación lineal de las variables originales. El primer eje va a ser el que minimiza la distancia euclídea de cada punto a su proyección ortogonal (o coordenada) en dicho eje. El vector director del primer eje, a 1 = (a 11, a 21 ), se obtiene resolviendo el problema mín a1 25 i=1 z2 i2 s.a. a 1a 1 = 1. Pero por el teorema de Pitágoras, y despejando zi2 2, tenemos que d(o, P i ) 2 = z 2 i1 + z 2 i2, z 2 i2 = d(o, P i ) 2 z 2 i1. Además, d(o, P i ) 2 es una cantidad que no depende de a 1 = (a 11, a 21 ); es decir, para cualquier valor que tome a 1, la distancia es la misma. Por tanto, encontrar el vector a 1 que minimiza 25 i=1 z2 i2 es equivalente a encontrar el vector a 1 que maximiza 25 i=1 z2 i1. Por otro lado, al estar Y 1 e Y 2 centradas (ȳ 1 = ȳ 2 = 0), entonces Z 1 también está centrada, ya que z 1 =..., 4

y por tanto la varianza de las proyecciones en el eje Z 1 es s 2 Z 1 = 1 n zi1 2. n Así, el eje principal que minimiza la distancia euclídea de los puntos a sus proyecciones ortogonales, es el que maximiza la varianza de las proyecciones. Es decir, el primer eje principal es el que produce la mayor separación de los puntos respecto de su origen. i=1 El problema a resolver para encontrar dicho eje es 5 máx a11,a 21 s 2 Z 1 s.a. a 2 11 + a 2 21 = 1. La segunda componente es una recta ortogonal a Z 1. Interpretación de los ejes: Z 1 separa a los establecimientos que venden muchas unidades de ambos productos, de los establecimientos que venden pocas unidades. Por tanto, se puede interpretar que Z 1 es la variable que mide la proporcionalidad en la venta de ambos productos. Z 2 da los establecimientos que venden muchas unidades de uno de los productos y pocas del otro. Sin embargo, dado que hay pocos establecimientos con estas características, podemos considerar que este eje no representa demasiado a los datos que tenemos. Si lo eliminásemos, nos quedaríamos con un espacio de dimensión uno.

6 2.2. DEFINICIÓN DE LAS COMPONENTES PRIN- CIPALES Tabla de datos de p variables X 1,..., X p medidas a n individuos: Indiv. X 1 X 2 X p 1 x 11 x 12 x 1p 2 x 21 x 22...... x 2p. n x n1 x n2 x np Variables centradas: Datos centrados: Y j = X j x j, j = 1,..., p y ij = x ij x j, j = 1,..., p, i = 1,..., n, Matriz de datos centrados: y 11 y 12 y 1p y Y = 21 y 22 y 2p....... y n1 y n2 y np Vector de variables aleatorias centradas: Y = (Y 1, Y 2,..., Y p ) matriz de covarianzas de Y : S Y = 1 n Y Y Primera componente principal (Z 1 ): Combinación lineal de Y 1,..., Y p con varianza máxima. Sea a 1 = (a 11, a 21,..., a p1 ) el vector de coeficientes de la combinación lineal. La primera componente principal es Z 1 = a 1Y = a 11 Y 1 + a 21 Y 2 + + a p1 Y p.

7 Su varianza es s 2 Z 1 =.... El vector a 1 se obtiene resolviendo el problema máx a1 s 2 Z 1 =... s.a. a 1a 1 = 1. Llamamos λ 1 al valor máximo solución de este problema. Segunda componente principal (Z 2 ): Combinación lineal de Y 1,..., Y p, incorrelada con Z 1, con varianza máxima. Sea a 2 = (a 12, a 22,..., a p2 ) el vector de coeficientes de la combinación lineal. La segunda componente principal es Su varianza es Z 2 = a 2Y = a 12 Y 1 + a 22 Y 2 + + a p2 Y p. La covarianza entre Z 1 y Z 2 es s 2 Z 2 =.... s Z1,Z 2 =.... El vector a 2 se obtiene resolviendo el problema máx a2 s 2 Z 2 =... s.a. a 2a 2 = 1, a 1S Y a 2 = 0. Si λ 2 es este máximo, se verifica λ 1 λ 2. Componente principal j-ésima (Z j ): Combinación lineal de Y 1,..., Y p, incorrelada con Z 1, Z 2,..., Z j 1, con varianza máxima.

8 Sea a j = (a 1j, a 2j,..., a pj ) el vector de coeficientes de la combinación lineal. La j-ésima componente principal es Su varianza es Z j = a jy = a 1j Y 1 + a 2j Y 2 + + a pj Y p. La covarianza entre Z i y Z j es s 2 Z j =.... s Zi,Z j =.... Por tanto, a j se obtiene resolviendo el problema máx aj s 2 Z j = a j S Y a j s.a. a j a j = 1, a i S Y a j = 0, i = 1,..., j 1. Si λ j es este máximo, se verifica λ 1 λ 2 λ j 1 λ j. Esto ocurre para j = 1,..., p. Solución - Descomposición espectral de S Y : Denotamos por Z = (Z 1,..., Z p ) al vector de componentes principales, y A = [a 1 a 2... a p ]. Expresamos la el vector de componentes principales en función del vector de variables originales: Z = A Y. La matriz de varianzas-covarianzas de Z es S Z = A S Y A = diag{s 2 Z 1,..., S 2 Z p }.

Por otro lado, al ser S Y simétrica, el Teorema de Descomposición Espectral nos dice que existe una matriz ortogonal P y otra matriz diagonal Λ, tales que S Y = P ΛP Λ = P S Y P = diag{λ 1,..., λ p }, donde las columnas de P son los vectores propios de S Y normalizados, y los elementos de Λ son los valores propios de S Y. El siguiente resultado nos dice que las dos igualdades anteriores coinciden, es decir, P = A y Λ = S Z, con lo cual, se verifica: a j es el vector propio normalizado de S Y asociado a λ j. s 2 Z j = λ j, donde λ j es el j-ésimo mayor valor propio de S Y. 9 Teorema 2.1 Sea S Y la matriz de covarianzas asociada al vector Y = (Y 1,..., Y p ). Sean λ 1 λ 2 λ p los valores propios de S Y, con vectores propios asociados a 1, a 2,..., a p. Se verifica: (i) La componente principal i-ésima es Z i = a iy = a 1i Y 1 + a 2i Y 2 + + a pi Y p, i = 1,..., p. (ii) La varianza de la componente principal i-ésima es s 2 Z i = a is Y a i = λ i, i = 1,..., p. (iii) La covarianza entre dos componentes Z i y Z j es s Zi Z j = a is Y a j = 0, i j.

Ejemplo 2.2 En el Ejemplo 2.1, los valores y vectores propios de S Y = S X son λ 1 = 131,52, a 1 = (a 11, a 21 ) = (0,825, 0,565), λ 2 = 18,146, a 2 = (a 12, a 22 ) = ( 0,565, 0,825). Así, las dos componentes principales serían Z 1 =... Z 2 =... El primer eje principal es la recta que pasa por el origen y con vector director a 1 = (0,825, 0,565), cuya ecuación es Y 2 =... Y 1. 10 Corolario 2.1 Sea el vector de variables Y = (Y 1,..., Y p ), con matriz de covarianzas S Y. Sean λ 1 λ 2 λ p > 0 los valores propios de S Y, y a 1, a 2,..., a p los vectores propios asociados. Sean las componentes principales Z 1 = a 1Y, Z 2 = a 2Y,. Z p = a py Las componentes principales conservan la varianza total, es decir p p p tr(s Y ) = s 2 Y i = λ i = s 2 Z i. i=1 i=1 i=1

Ejemplo 2.3 Para el Ejemplo 2.1, sabemos que S Y = S X, con lo cual, podemos calcular la traza de S Y tr(s X ) =.... Por otro lado, sumando los valores propios obtenemos λ 1 + λ 2 =.... Nota 2.1 En la Figura 2.1 se puede observar cómo las observaciones se pueden envolver en una elipsoide. Esto ocurre cuando el vector (Y 1, Y 2 ) tiene una distribución normal bivariante. Entonces, el primer eje principal tiene la dirección del eje principal de la elipsoide, y el segundo eje tiene la dirección del eje secundario de la elipsoide. Además, λ 1 es la longitud del semieje principal de la elipse, y λ 2 es la del semieje secundario. 2.3. SELECCIÓN E INTERPRETACIÓN DE LAS COMPONENTES 2.3.1. ELECCIÓN DEL NÚMERO DE COMPONENTES En la literatura se proponen tres criterios: Retener un número de componentes tales que en conjunto recojan un porcentaje de variabilidad de al menos un 75 %. Proporción de la variabilidad total de la i-ésima componente: λ i tr(s Y ) = λ i p k=1 λ i = 1,..., p. k, Proporción de variabilidad de las primeras p 1 < p componentes: p1 k=1 λ i tr(s Y ) = p1 k=1 λ k p k=1 λ k. 11

Seleccionar las componentes con valores propios (varianzas) mayores que el valor propio (varianza) promedio: λ = 1 p λ k. p k=1 Usar el test scree o gráfico de sedimentación, en el que se representa el número de órden del valor propio i frente a su magnitud λ i. Se descartan las componentes que ya no aportan significativamente a la varianza. 12 3 2.5 2 autovalor 1.5 1 0.5 0 1 2 3 4 5 6 Figura 2.2: Gráfico de sedimentación Ejemplo 2.4 En el Ejemplo 2.1, el porcentaje de variabilidad explicado por la primera componente principal Z 1 es... Según el primer criterio, nos quedaríamos con una componente principal. La media de los valores propios es...

Por tanto, ambos criterios indican lo mismo. El criterio del testscree no es necesario cuando solo se dispone de dos componentes principales. 13 2.3.2. COMUNALIDADES Comunalidad de una variable original: Cantidad de su varianza que recogen las componentes principales seleccionadas: Por el Teorema de Descomposición espectral, S Y = AΛA = λ 1 a 1 a 1 + + λ p a p a p La varianza de cada variable original Y i se descompone en una suma de aportaciones de cada componente principal Z j, s 2 Y i = λ 1 a 2 i1 + + λ 1 a 2 ip, i = 1,..., p. La comunalidad de una variable original Y i es la cantidad de variabilidad que permanece en el sumatorio anterior al seleccionar solo las p 1 < p primeras componentes principales, h 2 Y i = λ 1 a 2 i1 + + λ p1 a 2 ip 1, i = 1,..., p. Las comunalidades nos indican lo bien representadas que están las variables originales por el conjunto de componentes seleccionadas. Ejemplo 2.5 Si en el Ejemplo 2.1 nos quedamos con una componente principal Z 1 = a 11 Y 1 + a 21 Y 2 =...,

14, entonces las comunalidades de la vari- con varianza λ 1 =... ables originales son h 2 Y 1 =..., h 2 Y 2 =.... La proporción de la varianza de las variables originales recogida (explicada) por la primera componente principal es h 2 Y 1 S 2 Y 1 = =..., h 2 Y 2 S 2 Y 2 = =..., En SPSS, estas proporciones se denominan comunalidades reescaladas. Una variable se considerará bien representada por las componentes principales seleccionadas si su comunalidad reescalada es al menos 0.6. 2.3.3. COMPONENTES PRINCIPALES REESCALADAS La matriz de covarianzas S Y se puede descomponer en el producto de una matriz por su traspuesta, de la forma S Y = AΛA = AΛ 1/2 Λ 1/2 A = AΛ 1/2 (AΛ 1/2 ) = A (A ), donde A = AΛ 1/2. Es decir, A = [a 1 a 2 a p], con a j = λ 1/2 j a j, j = 1,..., p. Es decir, las columnas a j de la matriz A son los coeficientes de las componentes principales, reescalados de manera que se le da un

peso mayor a las componentes que aportan mayor variabilidad. De esta manera, las componentes principales reescaladas son Z i = (a i ) Y, i = 1,..., n. La matriz A se denomina matriz factorial, o matriz de saturaciones. Ejemplo 2.6 Para el Ejemplo 2.1, las componentes principales reescaladas son a 1 = λ 1/2 1 a 1 =..., a 2 = λ 1/2 2 a 2 =.... La matriz de saturaciones es A = [a 1 a 2] = (... ). 15 2.3.4. CORRELACIONES ENTRE VARIABLES Y COMPO- NENTES PRINCIPALES Corolario 2.2 Sea la componente principal j-ésima Z j = a 1j Y 1 + + a pj Y p. Las correlaciones de Y 1, Y 2,..., Y p con Z j son λj a 1j λj a 2j r Y1,Z j =, r Y2,Z s j =,, r Yp,Z Y1 s j = Y2 λj a pj s Yp. Ejemplo 2.7 Para el Ejemplo 2.1, las correlaciones entre las variables Y 1 e Y 2 con las componentes principales Z 1 =...Y 1 +...Y 2, Z 2 =...Y 1 +...Y 2.

son r Y1,Z 1 = =..., r Y2,Z 1 = =.... r Y1,Z 2 = =..., r Y2,Z 2 = =.... 16 2.4. ANÁLISIS DE LA MATRIZ DE CORRELA- CIONES Si las variables originales X j, j = 1,..., p, tienen rangos muy distintos, o están medidas en unidades no comparables, es necesario tipificarlas (estandarizarlas) de la forma Y j = X j x j, s 2 s 2 j = 1 n 1 j p (x ij x j ) 2, j = 1,..., p. j=1 Así, la matriz de covarianzas S Y del vector (Y 1,..., Y p ) coincidirá con la matriz de correlaciones R Y. Entonces se verifica: tr(s Y ) = tr(r Y ) =... = p i=1 λ i = p i=1 s2 Z i. La media de valores propios es λ = p i=1 λ i/p =.... La correlación entre la variable Y i y la componente principal Z j es r Yi,Z j = =.... Las comunalidades son h 2 Y i = p 1 j=1 λ j a 2 ij =.... La matriz factorial es A = [a 1... a p], donde a j = λ j a j = (r Yi,Z j,..., r Yp,Z j ), j = 1,..., p.

17 2.5. REPRESENTACIÓN GRÁFICA Normalmente se realizan dos tipos de gráficos: Gráfico de componentes: Representa las correlaciones de las variables en el espacio de las componentes principales. De este gráfico se puede obtener una interpretación de cada componente en función de las variables originales. Representación de los individuos en el espacio de las componentes: Es un gráfico de dispersión en el que se representan las coordenadas de los n individuos en cada par de componentes seleccionadas. Permite caracterizar o describir a los individuos. Este gráfico se interpreta con ayuda de las correlaciones de las variables originales con las componentes principales (Gráfico anterior). 2.6. RESUMEN Las componentes principales Z 1,..., Z p son nuevas variables incorreladas, que se obtienen como combinación lineal de las variables originales Y 1,..., Y p : Z 1 = a 11 Y 1 + a 21 Y 2 +... + a p1 Y p, Z 2 = a 12 Y 1 + a 22 Y 2 +... + a p2 Y p,. Z p = a 1p Y 1 + a 2p Y 2 +... + a pp Y p.

18 En principio, hay tantas componentes principales como variables originales. Geométricamente, los ejes principales son los ejes ortogonales que producen la mayor separación de las proyecciones. Cómo se calculan las componentes?, es decir, cómo se calculan las constantes a ij? Se calculan a partir de la matriz de covarianzas de Y = (Y 1,..., Y p ), llamada S Y. Se calculan sus valores propios y se ordenan de mayor a menor, λ 1 λ 2 λ p. Se calculan los vectores propios (normalizados) asociados a los valores propios, a 1,..., a p. Pues éstos son los vectores cuyas coordenadas me dan las constantes a ij, es decir, a 1 = (a 11,..., a p1 ), a 2 = (a 12,..., a p2 ),. a p = (a 1p,..., a pp ). Con cuántas componentes me quedo? Hay tres criterios: - Porcentaje de varianza: sabemos que los valores propios son las varianzas de las componentes principales, y que la suma de varianzas de las componentes es igual a la suma de las varianzas de las variables originales; por tanto, λ j p i=1 λ i 100 es el porcentaje de varianza que recoge la componente Z j.

Ordenadas de mayor a menor porcentaje de varianza, nos quedamos con el número de componentes que en total recojan al menos un 75 % de la varianza. - Nos quedamos con las componentes cuyo valor propio supere la media de los valores propios. - Criterio del test scree o gráfico de sedimentación: Nos fijamos en los codos más pronunciados. Una vez se han seleccionado un número p 1 < p de componentes principales, se observan las comunalidades de las variables originales. Las comunalidad de una variable Y i es la cantidad de su varianza S Yi que permanece al seleccionar las p 1 componentes principales. Una variable se considera mínimamente representada por las componentes si éstas recogen al menos un 60 % de su varianza. Si no es así, esta variable no es interpretable en función de las componentes. 19 Qué miden las componentes? Para interpretar el sentido de las componentes principales, el siguiente paso es observar las correlaciones entre las variables originales y dichas componentes seleccionadas. Para una componente Z j = a 1j Y 1 + + a pj Y p,

20 las correlaciones de Y 1, Y 2,..., Y p con Z j son λj a 1j λj a 2j r Y1,Z j =, r Y2,Z s j =,, r Yp,Z Y1 s j = Y2 λj a pj s Yp. Para una mejor interpretación, interesa que las variables tengan una correlación alta solamente con una de las componentes. Si esto no se verifica, se pueden efectuar rotaciones, e inspeccionar si éstas mejoran los resultados. Estas correlaciones se pueden representar en gráficos. Por último, representado a los individuos en el espacio de las componentes principales y teniendo en cuenta las correlaciones anteriores, se pueden describir las características de los individuos y extraer conclusiones prácticas.