ANALISIS DE COMPONENTES PRINCIPALES

Tamaño: px
Comenzar la demostración a partir de la página:

Download "ANALISIS DE COMPONENTES PRINCIPALES"

Transcripción

1 1 X 2 F 1 F 2 e 2 v 2 v 1 e 1 X 1 ANALISIS DE COMPONENTES PRINCIPALES José Luis Vicente Villardón Departamento de Estadística

2 2 1.- EJEMPLO INICIAL DEFINICIONES BASICAS OBTENCION DE LA COMPONENTES PRINCIPALES OBTENCIÓN DE LAS CP MEDIANTE LA MAXIMIZACIÓN DE LA VARIABILIDAD OBTENCIÓN A PARTIR DEL SUBESPACIO DE MEJOR AJUSTE Ajuste por un subespacio vectorial en R p Cálculo del máximo COORDENADAS PRINCIPALES MEDIDAS DE LA BONDAD DEL AJUSTE PROPIEDADES NÚMERO DE EJES A RETENER ESCALAS DE MEDIDA INTERPRETACIÓN DE RESULTADOS CORRELACIONES DE LAS COMPONENTES Y LAS VARIABLES EJEMPLO DATOS REPRESENTACIÓN DE LOS INDIVIDUOS SOBRE EL PRIMER PLANO PRINCIPAL SALIDA TIPICA DE ORDENADOR...32

3 3 1.- EJEMPLO INICIAL Supongamos que deseamos conocer cuales son los factores relacionados con el riesgo de enfermedad coronaria. Del conoocimiento previo sabemos que el riesgo la presión arterial, la edad, la obesidad, el tiempo que se ha sido hipertenso, el pulso, y el stress. Para la investigación seleccionamos al azar 20 pacientes hipertensos en los que medimos las siguientes variables: X 1 : Presión arterial media (mm Hg) X 2 : Edad (años) X 3 : Peso (Kg). X 4 : Superficie corporal (m 2 ) X 5 : Duración de la Hipertensión (años) X 7 : Medida del stress. X 6 : Pulso (pussaciones/minuto) Tratamos de estudiar la situación del grupo de pecientes en relación a los factores de riesgo y las posibles interrelacions entre las distintas variables. Iniicialmente queremos describir el conjunto de pacientes utilizando simultáneamente todas las variables Los datos obtenidos se muestran en la tabla siguiente: X 1 X 2 X 3 X 4 X 5 X 6 X ,4 1,75 5, ,2 2,10 3, ,3 1,98 8, ,7 2,01 5, ,4 1,89 7, ,5 2,25 9, ,8 2,25 2, ,9 1,90 6, ,2 1,83 7, ,7 2,07 5, ,4 2,07 5, ,1 1,98 5, ,6 2,05 10, ,1 1,92 5, ,3 2,19 10, ,5 1,98 7, ,0 1,87 3, ,5 1,90 4, ,5 1,88 9, ,7 2,09 7, La dimensión inicial es 7, pero Será posible describir el conjunto de datos utilizando un número menor de dimnsiones, aprovechando las interrelaciones

4 4 entre las variables? Es posible definir un índice general que cuantifique la situación de riesgo? Si consideramos solamente dos variables, los resultados se pueden presentar mediante un diagrama de dispersión como el que aparece en la figura siguiente. Sobre el diagrama se han incluidos los números de orden de cada uno de los pacientes. edad By presion 57,5 55, , edad 50, , , , presion Sobre la figura es posible interpretar la posible relación entre las variables, pero también las similitudes entre los individuos. Dos individuos próximos en el gráfico tendrán características similares, mientras que dos individuos alejados tendrán características diferentes. Se pueden buscar también grupos de puntos cercanos con características similares.

5 5 Si consideramos las tres primras variables, aun es posible representarlas en tres dimensiones sobre el papel como se muestra en la figura siguiente. Las representaciones tridimensionales sobre el papel son difíciles de interpretar ya que no se tiene una referencia visual clara. La interpretación puede realizarse mediante un programa de ordenador que permita el movimiento de la figura para ver las posiciones relativas de los puntos. Components X presion Y edad Z peso y z x Representación tridimensional de las variables presión, edad y peso. Si movemos la figura resultante, observaremos que los puntos están prácticamente sobre un plano. Esto se pone de manifiesto en la figura siguiente en la que se ha conseguido un punto de vista desde el que los puntos parecen estar sobre una línea recta. Este hecho pone de manifiesto que no son necesarias tres dimensiones para describir el conjunto de datos, sino solamente dos.

6 6 y 20 z x Rotación de la representación tridimensional que muestra que los puntos se encuentran aproximadamente en un plano. Tenemos entonces que buscar un sistema de referencia para el plano (subespacio) más cercano a la nube de puntos de forma que, al proyectarlos todos sobre dicho plano, la pérdida de información sea mínima. La pérdida de información puede entenderse en términos de variabilidad del conjunto de puntos o en términos de la similitud entre las interdistancias entre los puntos, calculadas en el espacio original y las calculadas en la proyección del subespacio. El subespacio quedará definido mediante un sistema de referencia para el mismo, es decir, mediante dos vectores perpendiculares dentro del subespacio. El primero lo situaremos en la dirección en la que más varían los datos, el

7 7 segundo, perpendicular al primero recogiendo la mayor parte de la variabilidad restante y así sucesivamente. Los vectores del sistema de referencia definen nuevas variables, que son combinaciones lineales de las variables de partida y se denominan componentes principales. De esta forma, podemos reducir la dimensión seleccionando solamente las primeras componentes. La reducción de la dimensión se deriva del hecho de que las variables están relacionadas entre si y, por tanto, tienen información común, de alguna manera, la información común a todas ellas se extrae en las componentes principales. La representación de las dos primeras componentes, para los datos anteriores y con sólo tres variables aparece en la figura siguiente. Las dos primeras componentes absorben el 99% de la variabilidad de los datos. 2,5 20 2,0 5 1,5 Prin Comp 2 1,0 0,5 0, ,5-1, ,5 6-2,0-1,5-1,0-0,5 0,0 0,5 1,0 1,5 2,0 2,5 Prin Comp 1 7 Espacio de las componentes con las tres primeras variables Sobre el diagrama de dispersión es posible interpretar las distancias entre los puntos en términos de similitud, buscar conjuntos de individuos similares, etc, con la garantía de que la pérdida de información es mínima y de que hemos recogido las fuentes de variabilidad más importantes en el conjunto de datos.

8 8 Cuando el número de variables es mayor, ya no es posible la representación directa de las variables en más de tres dimensiones, pero aun sigue siendo posible la reducción de la dimensión, teniendo en cuenta las iterrelaciones entre las variables. La figura siguiente muestra las dos primeras componentes principales para el conjunto de las 7 variables. Las componentes se denotan con x e y. Se han superpuesto sobre el gráfico vectores que representan a las variables originales y que interpretaremos más tarde. También se han suprimido las escalas ya que, en este contexto son menos importantes. y 19 5 stress 9 duracio z edad pulso x presion peso superfi Espacio de las componentes con todas las variables. En este caso, las dos primeras componentes recogen aproximadamente el 77% de la variabilidad, más aun recogen las fuentes de variabilidad más importantes de los datos.

9 9 Si prescindimos, por el momento, de los vectores que representan a las variables, podemos interpretar las distancias entre puntos y buscar grupos, tal y como hacíamos en el diagrama de dispersión inicial. Como las componentes son variables compuestas calculadas a partir de las originales, solamente queda por determinar cual es la información que han recogido las componentes, es decir, que variables explican la similitud de los individuos en el subespacio de representación final. La interpretación se hace a partir de las correlaciones entre las variables observadas y las componentes. Dichas correlaciones se muestran en la tabla siguiente. (las componentes se denominan factores en la tabla). Unrotated Factors presion edad peso supcorp Durac. pulso stress Factor 1 Factor 2,965 -,230,723,304,884 -,403,804 -,473,434,525,844,284,355,764 Correlaciones entre las componentes principales y las variables observadas Observamos como la primera componente está altamente correlacionada con todas las variables salvo Duración y Stress, es decir, la primera componente muestra, fundamentalmente aspectos relacionados con el aumento de la presión arterial y de las variables determinantes del riesgo de enfermedad coronaria, por tanto la primera componente sería un índice del riesgo de enfermedad de forma que, los individuos que se sitúen a la derecha en la proyección sobre el eje del gráfico serán los que tienen riesgo más alto de enfermedad y los que se sitúan a la izquierda, riesgo más bajo. La segunda componente está más correlacionada con el stress y algo menos con la duración, por lo que mostrará las diferencias en el índice de stress. Sobre el gráfico habíamos superpuesto también vectores que representaban a cada una de las variables originales. Los vectores representan la dirección de mejor ajuste para cada una de las variables, en el sentido de que, si proyectamos los puntos que representan a los individuos sobre uno de los vectores, las puntuaciones obtenidas estarían más correlacionadas con la variable original

10 10 que las proyecciones en cualquier otra dirección. El coseno del ángulo que forma cada vector con el eje, mide aproximadamente la correlación con el mismo y los cosenos de los ángulos entre dos vectores aproximan la correlación entre las variables a las que representan, es decir, a menor ángulo menor correlación. La representación con las variables añadidas se denomina representación biplot. A las correlaciones al cuadrado entre la variable y el eje se le denomina tambien contribución relativa del factor al elemento, y mide la parte de la variabilidad de la variable que explica cada uno de los ejes. Las variables con contribuciones altas en uno de los ejes y bajas en los demás son las que han de interpretarse para cada eje ya que son características exclusivas del mismo. Como las componentes son incorreladas, tienen información independiente por lo que la suma de las correlaciones al cuadrado es 1. La parte explicada por un plano, se calcula simplemente sumando la parte explicada (contribución) por los ejes que lo componen, a esta cantidad se la denomina también calidad de la representación. La calidad de representación puede interpretarse tambien como la correlación al cuadrado entre los valores de la variable original y las proyecciones de los puntos sobre la dirección que representa a la variable. De la misma manera que hemos hecho para las variables es posible definir calidades de representación para los individuos. Veamos una interpretación diferente de la misma más adecuada para el estudio de los individuos. La figura siguiente muestra la proyección de uno de los puntos de la nube en un espacio bidimensional. Supongamos que se trata de la proyección de uno de los vectores que representa a una variable.

11 11 Vector real en el espacio tridimensional Vector proyección en el espacio bidimensional Si observamos el espacio tridimensional que aparece en la figura, la variable representada y el eje horizontal forman un ángulo de casi 90 por lo que pueden considerarse independientes; sin embargo en la proyección sobre el espacio bidimensional, el ángulo es muy pequeño, hecho que se podría traducir en una fuerte relación. Esto es debido a que la calidad de la representación del vector sobre el plano es baja. La figura siguiente muestra la situación esquematizada. El coseno al cuadrado del ángulo se puede tomar como medida de la relación entre la variable y el eje. i ángulo C proy(i, 1) eje 1 cos 2 (θ) = C, proy(i, 1) / C, i A esta medida la denominaremos CALIDAD DE LA REPRESENTACION del punto i sobre el eje factorial. (CLR il ). Esta cantidad puede calcularse tambien a partir del producto escalar entre el

12 12 vector i y un vector cualquiera en la dirección del eje. La calidad de la representación es una medida relativa, ya que la suma de las calidades de la representación de cada elemento sobre todos los ejes factoriales es 1. El gráfico siguiente muestra una representación sobre tres ejes factoriales, donde se especifican los cosenos de los ángulos con los tres ejes que, como es sabido, su suma de cuadrados es la unidad. eje 3 θ 3 θ 2 θ 1 θ eje 1 eje cos θ + cos θ + cos θ = cos θ = cos θ + cos θ 1 2 La calidad de la representación con respecto a un plano se mide de la misma manera, es decir, como el coseno al cuadrado del ángulo que forman el vector y el plano. Este coseno al cuadrado es la suma de los cosenos al cuadrado de los ángulos con los ejes que forman el plano. cos 2 (θ lk ) = cos 2 (θ l ) + cos 2 (θ k ) Por tanto, la calidad de la representación del elemento es una medida aditiva que puede calcularse para la proyección en cualquier plano factorial, sin más que sumar las calidades de representación con respecto a los ejes factoriales que lo forman.

13 DEFINICIONES BASICAS DATOS Disponemos de una matriz X nxp que contiene las medidas de p variables tomadas sobre n individuos. Para simplificar el resto de la exposición supondremos, sin pérdida de generalidad, que las columnas de X tienen media cero, es decir que se le ha restado la media. Todas las variables tienen el mismo papel, es decir, el conjunto no se divide en variables dependientes e independientes como en el caso de la regresión. DEFINICION El Análisis de Componentes principales consiste en encontrar transformaciones ortogonales de las variables originales para conseguir un nuevo conjunto de variables incorreladas, denominadas Componentes Principales, que se obtienen en orden decreciente de importancia. Las componentes son combinaciones lineales de las variables originales y se espera que, solo unas pocas (las primeras) recojan la mayor parte de la variabilidad de los datos, obteniéndose una reducción de la dimensión en los mismos. Luego el propósito fundamental de la técnica consiste en la reducción de la dimensión de los datos con el fin de simplificar el problema en estudio. Se trata de una técnica orientada a las variables, suponemos que las p columnas de X generan un espacio p dimensional, de forma que los n individuos pueden representarse en dicho espacio en lo que llamaremos una hipernube. La transformación es, de hecho, una rotación en el espacio p-dimensional. El espacio generado por las primeras q componentes es entonces, un subespacio vectorial q-dimensional del espacio p-dimensonal original.

14 14 Cuando el valor de q es pequeño, por ejemplo 2, es posible una representación gráfica directa de los individuos que nos ayudará ainterpretar las similitudes entre los mismos. El ACP puede entenderse también como la búsqueda del subespacio de mejor ajuste. Una de las diferencias fundamentales con el Análisis Factorial es que el ACP explica variabilidad en lugar de correlaciones, aunque para obtener una reducción efectiva de la dimensión es necesario que las variables estén correlacionadas. En otras palabras, si las variables están altamente correlacionadas, tienen información común y la dimensión real de los datos es menor que p. En muchas ocasiones es difícil encontrar el significado de las componentes, como variables compuestas, por lo que el uso principal de la técnica es la reducción de la dimensión como paso previo a la aplicación de otros análisis posteriores, por ejemplo, un diagrama de dispersión de las primeras componentes con el objeto de encontrar clusters en los datos o con el objeto de contrastar similitudes o diferencias entre los individuos. El ACP es una técnica que no necesita que se especifique un modelos concreto para explicar el error, en particular, no se hace ninguna suposición sobre la distribución de probabilidad de las variables originales, aunque si se supone que es normal multivariante es posible obtener algunos resultados inferenciales adicionales. En algunos textos se hacen diferencias entre las CP poblacionales y muestrales, aquí entenderemos la técnica como un método descriptivo, libre de distribución, y trabajaremos directamente con los datos muestrales.

15 OBTENCION DE LA COMPONENTES PRINCIPALES La obtención de las CP puede realizarse por varios métodos alternativos: 1.- Buscando aquella combinación lineal de las variables que maximiza la variabilidad. (Hottelling). 2.- Buscando el subespacio de mejor ajuste por el método de los mínimos cuadrados. (Minimizando la suma de cuadrados de las distancias de cada punto al subespacio). (Pearson). 3.- Minimizando la discrepancia entre las distancias euclídeas entre los puntos calculadas en el espacio original y en el subespacio de baja dimensión. (Coordenadas principales, Gower). 4.- Mediante regresiones alternadas (métodos Biplot) OBTENCIÓN DE LAS CP MEDIANTE LA MAXIMIZACIÓN DE LA VARIABILIDAD. Denotaremos con X 1,, X p las variables originales y con Y 1,, Y p las componentes. En principio, podemos obtener tantas componentes como variables originales. X denotará el vector de variables originales e Y el de componentes. X es la matriz de datos originales, que supondremos centrada por columnas, y S es la matriz de covarianzas entre las variables. S = 1 n 1 X X

16 16 Buscamos combinaciones lineales de las variables observadas que sean incorreladas y con varianzas progresivamente decrecientes Y j = v 1j X 1 +K+ v pj X p Y j = Xv j y j = Xv j Y = XV Donde Y es la matriz que contiene las puntuaciones de cada uno de los individuos sobre las componentes y V es la matriz que contiene los coeficientes de las combinaciones lineales en columnas. Y 1 será aquella componente que explique la mayor parte de la variabilidad, Y 2 será ortogonal a Y 1 y explicará la mayor parte de la variabilidad restante y así sucesivamente. En las ecuaciones tenemos un factor de escala arbitraria por lo que imponemos la restricción P v kj k =1 2 = 1 v jvj = 1 V V = I Buscamos Y 1 que haga máxima la varianza Var(Y1) = Var(Xv1) = v 1Sv1 Utilizando el método de los multiplicadores de Lagrange para tener en cuenta la restricción, podemos escribir L(v1 ) = v 1Sv1 λ( v 1v1 1) Derivando e igualando a cero L(v1 ) v 1 = 2Sv1 2λv1

17 17 es decir Sv1 = λv1 lo que quiere decir que v 1 debe ser un vector propio de S de valor propio λ, pero S tiene p valores propios λ 1, λ p que supondremos distintos y ordenados en orden decreciente λ 1 λ p 0. Teniendo en cuenta que Var(Xv1 ) = v 1Sv1 = v 1 λ v1 = λ λ debe ser λ 1 el primer valor propio y v 1 el vector propio asociado. La segunda componente principal Y 2 = Xv 2, se obtiene con un procedimiento análogo pero añadiendo la restricción adicional de que Y 1 e Y 2 son incorreladas. cov(y1, Y2 ) = v 2Sv1 = 0 o una condición equivalente más simple v 2v1 = 0 ya que Sv1 = λv1 Utilizando de nuevo el método de los multiplicadores de Lagrange, podemos escribir L(v2 ) = v 2Sv 2 λ( v 2v2 1) δ v 2v1 Derivando e igualando a cero se obtiene L(v2 ) v 2 = 2Sv2 2λv2 δv1=0 premultiplicando por v 1,

18 18 2 v 1Sv2 2λ v 1v2 δ v 1v1 = 0 2 v 1Sv2 δ=0 como v 1Sv2 = 0, entonces δ = 0 en el punto estacionario, de forma que, Sv2 = λv 2 con lo que λ es el segundo valor propio λ 2 y v 2 es el segundo vector propio. Siguiendo con el mismo argumento, podemos obtener las sucesivas componentes principales a partir de los correspondientes valores y vectores propios. Entonces, si S = V ΛV Λ = diag(λ 1,K, λ p ) V V = I es la descomposición espectral de la matriz de covarianzas S, los coeficientes de las combinaciones lineales que definen las componentes principales son las columnas de V, es decir los vectores propios de la matriz de covarianzas. Seleccionando q componentes, las puntuaciones de los individuos en las componentes están dadas por Yq = XVq donde V q está formada por las q primeras columnas de V, y suponiendo X centrada. Ahora p Var(Yj ) = λ j = traza(λ) j=1 p j=1 y

19 19 traza( Λ) = traza( V SV) = traza(s V V) = traza(s) = Var(X j ) p j=1 Este resultado nos permite calcular la proporción de varianza absorbida por cada componente como λj p λ i i=1 o acumulada para un subespacio de dimensión q q λ j j=1 p λ i i=1 - Nota: las componentes principales pueden calcularse también a partir de X'X con X centrada ya que S = 1 n 1 X X se obtienen los mismos vectores propios aunque los correspondientes valores propios aparecieran multiplicados por n-1, lo cual no influye en la variabilidad absorbida.

20 20 Obtención a partir del subespacio de mejor ajuste Una aproximación diferente que produce los mismos resultados es la que trata de minimizar la suma de cuadrados de las distancias de cada punto a la componente, entendiendo que buscamos el subespacio, en dimensión reducida, que mejor se ajusta a la nube de puntos. El procedimiento de ajuste se basa en el método de los mínimos cuadrados. Sea X una matriz rectangular de datos con n filas y p columnas y con término general x ij. Abordaremos el siguiente problema: es posible reconstruir los np valores x ij, y por tanto las interdistancias entre individuos, a partir de un número mas pequeño de valores numéricos? Trataremos ahora la solución relacionada con los métodos factoriales. Supongamos que existe un vector columna y de n componentes y un vector 1 columna v 1 de p componentes de modo que X = y 1 v t 1. Se habrán reconstruido los np valores de X con n + p valores únicamente (en este caso la matriz es de rango 1). En general no es posible obtener una descomposición tan simple. Buscaremos una aproximación de rango q para X, es decir X = y v t y v t y v t q q + E E es una matriz residual con términos muy pequeños para que la reconstrucción sea satisfactoria. Reconstruimos X entonces, con q(n+p) valores de los vectores u v t i i. Resolveremos el problema mediante representaciones geométricas vinculadas a los métodos factoriales. X dará lugar a dos representaciones; las n filas pueden considerarse como n puntos en un espacio de p dimensiones R p ; y las p columnas pueden representar las coordenadas de p puntos en un espacio de n dimensiones R n

21 21 Ajuste por un subespacio vectorial en R p. Si la nube de n puntos que representan a las filas de la matriz X está contenida en un subespacio de dimensión q < p será posible reconstruir las posiciones de los n puntos a partir de las coordenadas de q nuevos ejes y de las componentes de estos nuevos ejes. Por lo tanto vamos a intentar ajustar la nube de n puntos por un subespacio vectorial de R p dotado de la distancia euclídea ordinaria. Buscaremos la recta F l que pasa por el origen y se ajusta lo mejor posible a nube. Sea v un vector unitario de esa recta, es decir, v t v = 1 Como cada fila de X representa un punto de R p,las n filas de vector Xv son las n longitudes de las proyecciones de los puntos de la nube sobre F 1. Para cada punto, el cuadrado de la distancia a origen se descompone en el cuadrado de su proyección sobre F1 y el cuadrado de su distancia a F1. Como las distancias al origen están fijadas, minimizar la suma de cuadrados de las distancias a F 1 es equivalente a maximizar la suma de cuadrados de las proyecciones. P d d 1 F 1 p d 2 = p 2 + d 2 1

22 22 X 2 F 1 F 2 e 2 v 2 v 1 e 1 X 1 Buscamos v que haga máxima la cantidad (Xv) t Xv = v t X t X v con la restricción v t v = 1. El subespacio resultante se designará por v 1. El subespacio vectorial de dos dimensiones que mejor se ajusta a la nube de puntos contendrá a v 1. Se hallará buscando el vector unitario v 2 ortogonal respecto a v 1 que haga máxima la forma cuadrática v 2 t X t X v2 con las restricciones v 2 t v1 = 0; v 2 t v2 = 1. Así sucesivamente buscamos el subespacio engendrado por q vectores v 1, v 2,..., v q (ortogonales dos a dos) que mejor se ajustan a la nube de puntos.

23 23 Cálculo del máximo. Sea λ un multiplicador de Lagrange. Derivamos la cantidad v t X t X v - λ (v t v - 1) con respecto a las componentes de v y obtenemos 2 X t X v - 2 λ v = 0 es decir, X t X v = λ v Entonces, v l es un vector propio de la matiz X t X de valor propio λ. Concretamente el mayor valor propio. Puede verse que, v 1, v 2,..., v q son vectores propios de X t X asociados a valores propios λ 1, λ 2,..., λ q respectivamente y que λ 1 λ 2... λ q. La matriz X t X es semidefinida positiva por lo que todos los valores propios son mayores que cero Es posible otra interpretación en términos de la variablidad. Como es bien sabido, si los datos están centrados, la matriz X t X es, salvo un factor de escala dependiente del tamaño muestral, coincide con la matriz de varianzascovarianzas entre las variables. S = (1/n) X t X Dado un vector v en R p, la varianza de las proyecciones sobre Xv dicho vector, es v t S v. Si buscamos el vector v unitario en aquella dirección con máxima varianza se trata de hacer máxima la cantidad v t S v con la restricción v t v = 1. El subespacio resultante se designará por v. 1 Sea µ un multiplicador de Lagrange.

24 24 Derivamos la cantidad v t S v - µ (v t v - 1) con respecto a las componentes de u y obtenemos es decir, 2 S v - 2 µ v = 0 S v = µ v Entonces, v l es un vector propio de la matiz X t X de valor propio µ = λ / n. Luego la dirección buscada es la que maximiza la varianza y es, por tanto, la dirección en la que pueden examinarse las diferencias entre los individuo con pérdida de información mínima. Los vectores directores de los q nuevos ejes se obtienen a partir de la descomposición en valores y vectores propios de S (o X t X) en la forma S = V D V t y se corresponden con las q primeras columnas de la matriz de vectores propios V. Las coordenadas de los individuos en el espacio generado por las q primeras componentes principales, es decir, las proyecciones de los puntos en el espacio original sobre el subespacio de las componentes principales, son Y = X V (q) donde el subíndice (q) significa "las q primeras columnas". Las componentes principales son nuevas variables, combinación lineal de las variables originales, con varianza progresivamente decreciente.

25 COORDENADAS PRINCIPALES El tercer procedimiento de obtención se basa en hacer minima la discrepancia entre las distancias observadas en el espacio original y las distancias estimadas en el espacio de la aproximación. δ ij P j P i P' i δij ˆ P' j L Min ij p (δ ij ˆ δ ij ) 2 δij = (xik x jk ) 2 k=1 q δ ˆ ij = (y ik y jk ) 2 k=1 (Coordenadas principales)

26 4.- MEDIDAS DE LA BONDAD DEL AJUSTE 26 Como se trata de una aproximación en dimensión reducida es necesario decidir si la aproximación es satisfactoria. - Las coordenadas de las proyecciones sobre el subespacio de las componentes en el sistema de referencia original son X* = Y V t (q) = X V (q) Vt (q) La discrepancia con los valores originales en X con los valores esperados en el subespacio se puede medir como la suma de cuadrados de (X - X*), es decir, como traza[(x - X*) t (X - X*)] o en forma relativa traza[(x - X*) t (X - X*)] / traza[x t X] luego, una medida de la bondad del ajuste puede ser (1 - (traza[(x - X*) t (X - X*)] / traza[x t X])) x 100 que puede interpretarse como el porcentaje de la variabilidad de los datos explicado por las componentes principales. Teniendo en cuenta las propiedades de la traza, la bondad del ajuste puede escribirse también como q λi i=1 q λ i i=1 x100

27 PROPIEDADES - La matriz de vectores propios V define un cambio de base del espacio R p en el que se ha representado la matriz de datos originales. - Las q primeras columnas de V definen la proyección de los puntos en R p sobre el subespacio q-dimensional de mejor ajuste. - Los elementos de V son los cosenos de los ángulos que forman las variables originales y las componentes principales. - Las coordenadas de los individuos en el nuevo sistema de referencia son de la forma Y = X V. - Las coordenadas las primeras componentes principales permiten interpretar las similaridades entre individuos con pérdida de información mínima. - El ACP utiliza la información redundante, a través de las correlaciones entre las variables, para reducir la dimensión. - La matriz de covarianzas entre las componentes es D (Λ). - Las componentes principales son variables incorreladas y, por tanto con información independiente. - La varianza de las componentes principales es λ i. - Si se trabaja con datos brutos, la primera componente principal suele mostrar la traslación de la nube de puntos con respecto al origen. - Si las variables están centradas, las componentes se calculan a partir de la matriz de covarianzas y las componentes estarán dominadas por las variables con escala de medida mayores. - Si se trabaja con datos estandarizados, las componentes principales se obtienen de la diagonalización de la matriz de correlaciones. Se utilizarán datos estandarizados cuando las escalas de medida de las variables sean muy diferentes. 6.- NÚMERO DE EJES A RETENER - Prueba de Anderson: Si los datos son normales, es posible realizar un test para contrastar si las últimas (p-q) raíces son iguales a cero.

28 28 p χ 2 p λi I=q+1 = (n 1) ln(λ i) + (n 1)(p q)ln I=q+1 p q sigue una ji-cuadrado con (1/2) (p-q) (p-q+1) - 1 grados de libertad. -Scree Plot: Gráfico de los valores propios. Se seleccionan ejes hasta que se vea un decrecimiento brusco en la magnitud de los valores propios. - Seleccionar las componentes necesarias para explicar un determinado porcentaje de la varianza. 7.- ESCALAS DE MEDIDA Si las escalas de medida de las variables son muy diferentes, la variabilidad estaría dominada por las variables con magnitudes mayores de forma que las primeras componentes pueden mostrar simplemente las diferencias en la escala. En este caso conviene tomar la matriz x estandarizada por columnas y centrando y dividiendo por la desviación típica. En este caso las componentes estarían colocadas sobre la matriz de correlaciones. 8.- INTERPRETACIÓN DE RESULTADOS - Diagramas de dispersión que representan los valores de los individuos en las primeras componentes principales. - Interpretación de distancias en términos de similitud. - Búsqueda de clusters (grupos) y patrones. - Interpretación de las componentes utilizando las correlaciones con las variables originales. Las posiciones de los individuos se interpretan después en relación a la interpretación dada a las componentes.

29 CORRELACIONES DE LAS COMPONENTES Y LAS VARIABLES A los vectores escalados de la forma: v j * = λ j 1/2 v j C = VΛ 1/2 se les denomina factores de carga (C) Cuando las componentes principales se calculan usando la matriz de correlaciones, la matriz C contiene las correlaciones entre las variables originales y las componentes. Para las componentes calculadas a partir de la matriz de covarianzas, los factores de carga dependen de la escala de medida de las variables por lo que son difíciles de interpretar. Los factores de carga suelen representarse en un gráfico que permite la interpretación visual de las relaciones. En cualquiera de los casos podemos calcular también la correlación al cuadrado entre las componentes y las variables y las componentes. A dichas correlaciones al cuadrado se las denomina contribuciones relativas del factor al elemento y miden la proporción de la variabilidad de las variables explicadas por cada componente. Esta cantidad puede utilizarse para interpretar las componentes.

30 EJEMPLO DATOS La tabla de datos siguiente muestra los porcentajes de personas empleadas en 9 sectores distintos para 26 países europeos (antes de los últimos cambios políticos). En este caso, el Análisis Multivariante puede ser útil para aislar grupos de países con distribuciones de empleo similares y en general para intentar comprender mejor las relaciones existentes entre los países y las variables. SECTORES: AGR: Agricultura, MIN: Minería, MAN: Manufacturas, ENER: Energía, CON: Construcción, SER: Industrias de servicios, FIN: finanzas, SSP: Servicios sociales y personales, TC: Transportes y comunicaciones. PAISES AGR MIN MAN ENER CON SER FIN SSP TC BÉLGICA DINAMARCA FRANCIA RFA IRLANDA ITALIA LUXEMBURGO HOLANDA U.K AUSTRIA FINLANDIA GRECIA NORUEGA PORTUGAL ESPAÑA SUECIA SUIZA TURQUÍA BULGARIA CHECOSLOVAQUIA RDA HUNGRÍA POLONIA RUMANIA URSS YUGOSLAVIA

31 REPRESENTACIÓN DE LOS INDIVIDUOS SOBRE EL PRIMER PLANO PRINCIPAL 2 HUN CHE RDA POL 1 RUM BUL URS LUX AUS -1 0 TUR YUG GRE POR ESP IRL ITA FRA RFA UK SUI FIN NOR BEL SUE HOL DIN MINERIA 0.5 ENERG MANUF 0.0 AGRIC TRANSP CONSTR SERVSOC -0.5 FINANZAS SERVICIO Representación gráfica de los factores de carga.

32 SALIDA TIPICA DE ORDENADOR COMPONENT LOADINGS 1 2 AGRIC MINERIA MANUF ENERG CONSTR SERVICIO FINANZAS SERVSOC TRANSP VARIANCE EXPLAINED BY COMPONENTS PERCENT OF TOTAL VARIANCE EXPLAINED FACTOR SCREE PLOT LATENT ROOTS (EIGENVALUES) EIGENVALUES A A A 1 + A + A A A A A

Análisis de componentes principales

Análisis de componentes principales Capítulo 2 Análisis de componentes principales 2.1. INTRODUCCIÓN El Análisis de componentes principales trata de describir las características principales de un conjunto de datos multivariantes, en los

Más detalles

Covarianza y coeficiente de correlación

Covarianza y coeficiente de correlación Covarianza y coeficiente de correlación Cuando analizábamos las variables unidimensionales considerábamos, entre otras medidas importantes, la media y la varianza. Ahora hemos visto que estas medidas también

Más detalles

3.1 DEFINICIÓN. Figura Nº 1. Vector

3.1 DEFINICIÓN. Figura Nº 1. Vector 3.1 DEFINICIÓN Un vector (A) una magnitud física caracterizable mediante un módulo y una dirección (u orientación) en el espacio. Todo vector debe tener un origen marcado (M) con un punto y un final marcado

Más detalles

Definición de vectores

Definición de vectores Definición de vectores Un vector es todo segmento de recta dirigido en el espacio. Cada vector posee unas características que son: Origen: O también denominado Punto de aplicación. Es el punto exacto sobre

Más detalles

8.1. Introducción... 1. 8.2. Dependencia/independencia estadística... 2. 8.3. Representación gráfica: diagrama de dispersión... 3. 8.4. Regresión...

8.1. Introducción... 1. 8.2. Dependencia/independencia estadística... 2. 8.3. Representación gráfica: diagrama de dispersión... 3. 8.4. Regresión... Tema 8 Análisis de dos variables: dependencia estadística y regresión Contenido 8.1. Introducción............................. 1 8.2. Dependencia/independencia estadística.............. 2 8.3. Representación

Más detalles

Un ejemplo de ACP paso a paso

Un ejemplo de ACP paso a paso Un ejemplo de ACP paso a paso Francesc Carmona Departament d Estadística 13 de enero de 2014 1. Introducción Para ilustrar el procedimiento de cálculo, partamos de un ejemplo en el que disponemos de la

Más detalles

PROGRAMACIÓN LINEAL. 8.1. Introducción. 8.2. Inecuaciones lineales con 2 variables

PROGRAMACIÓN LINEAL. 8.1. Introducción. 8.2. Inecuaciones lineales con 2 variables Capítulo 8 PROGRAMACIÓN LINEAL 8.1. Introducción La programación lineal es una técnica matemática relativamente reciente (siglo XX), que consiste en una serie de métodos y procedimientos que permiten resolver

Más detalles

Tema 2. Espacios Vectoriales. 2.1. Introducción

Tema 2. Espacios Vectoriales. 2.1. Introducción Tema 2 Espacios Vectoriales 2.1. Introducción Estamos habituados en diferentes cursos a trabajar con el concepto de vector. Concretamente sabemos que un vector es un segmento orientado caracterizado por

Más detalles

ANÁLISIS DE DATOS NO NUMERICOS

ANÁLISIS DE DATOS NO NUMERICOS ANÁLISIS DE DATOS NO NUMERICOS ESCALAS DE MEDIDA CATEGORICAS Jorge Galbiati Riesco Los datos categóricos son datos que provienen de resultados de experimentos en que sus resultados se miden en escalas

Más detalles

_ Antología de Física I. Unidad II Vectores. Elaboró: Ing. Víctor H. Alcalá-Octaviano

_ Antología de Física I. Unidad II Vectores. Elaboró: Ing. Víctor H. Alcalá-Octaviano 24 Unidad II Vectores 2.1 Magnitudes escalares y vectoriales Unidad II. VECTORES Para muchas magnitudes físicas basta con indicar su valor para que estén perfectamente definidas y estas son las denominadas

Más detalles

Tema 1. VECTORES (EN EL PLANO Y EN EL ESPACIO)

Tema 1. VECTORES (EN EL PLANO Y EN EL ESPACIO) Vectores Tema. VECTORES (EN EL PLANO Y EN EL ESPACIO Definición de espacio vectorial Un conjunto E es un espacio vectorial si en él se definen dos operaciones, una interna (suma y otra externa (producto

Más detalles

CORRELACIÓN Y PREDICIÓN

CORRELACIÓN Y PREDICIÓN CORRELACIÓN Y PREDICIÓN 1. Introducción 2. Curvas de regresión 3. Concepto de correlación 4. Regresión lineal 5. Regresión múltiple INTRODUCCIÓN: Muy a menudo se encuentra en la práctica que existe una

Más detalles

Estructuras algebraicas

Estructuras algebraicas Tema 2 Estructuras algebraicas básicas 2.1. Operación interna Definición 29. Dados tres conjuntos A, B y C, se llama ley de composición en los conjuntos A y B y resultado en el conjunto C, y se denota

Más detalles

4 APLICACIONES LINEALES. DIAGONALIZACIÓN

4 APLICACIONES LINEALES. DIAGONALIZACIÓN 4 APLICACIONES LINEALES DIAGONALIZACIÓN DE MATRICES En ocasiones, y con objeto de simplificar ciertos cálculos, es conveniente poder transformar una matriz en otra matriz lo más sencilla posible Esto nos

Más detalles

Los métodos Biplot. LOS METODOS BIPLOT (Teoría) José Luis Vicente Villardón Departamento de Estadística Universidad de Salamanca

Los métodos Biplot. LOS METODOS BIPLOT (Teoría) José Luis Vicente Villardón Departamento de Estadística Universidad de Salamanca LOS METODOS BIPLOT (Teoría) José Luis Vicente Villardón Departamento de Estadística Universidad de Salamanca 1 T1. INTRODUCCION...3 T. DEFINICION Y OBTENCION DE MARCADORES...14 T.1 DEFINICION...14 T. BIPLOT

Más detalles

ANALISIS MULTIVARIANTE

ANALISIS MULTIVARIANTE ANALISIS MULTIVARIANTE Es un conjunto de técnicas que se utilizan cuando se trabaja sobre colecciones de datos en las cuáles hay muchas variables implicadas. Los principales problemas, en este contexto,

Más detalles

Anexo 1: Demostraciones

Anexo 1: Demostraciones 75 Matemáticas I : Álgebra Lineal Anexo 1: Demostraciones Espacios vectoriales Demostración de: Propiedades 89 de la página 41 Propiedades 89- Algunas propiedades que se deducen de las anteriores son:

Más detalles

Aula Banca Privada. La importancia de la diversificación

Aula Banca Privada. La importancia de la diversificación Aula Banca Privada La importancia de la diversificación La importancia de la diversificación La diversificación de carteras es el principio básico de la operativa en mercados financieros, según el cual

Más detalles

BASES Y DIMENSIÓN. Propiedades de las bases. Ejemplos de bases.

BASES Y DIMENSIÓN. Propiedades de las bases. Ejemplos de bases. BASES Y DIMENSIÓN Definición: Base. Se llama base de un espacio (o subespacio) vectorial a un sistema generador de dicho espacio o subespacio, que sea a la vez linealmente independiente. β Propiedades

Más detalles

E 1 E 2 E 2 E 3 E 4 E 5 2E 4

E 1 E 2 E 2 E 3 E 4 E 5 2E 4 Problemas resueltos de Espacios Vectoriales: 1- Para cada uno de los conjuntos de vectores que se dan a continuación estudia si son linealmente independientes, sistema generador o base: a) (2, 1, 1, 1),

Más detalles

Aplicaciones Lineales

Aplicaciones Lineales Aplicaciones Lineales Ejercicio Dada la matriz A = 0 2 0 a) Escribir explícitamente la aplicación lineal f : 2 cuya matriz asociada con respecto a las bases canónicas es A. En primer lugar definimos las

Más detalles

Estadística con Excel Informática 4º ESO ESTADÍSTICA CON EXCEL

Estadística con Excel Informática 4º ESO ESTADÍSTICA CON EXCEL 1. Introducción ESTADÍSTICA CO EXCEL La estadística es la rama de las matemáticas que se dedica al análisis e interpretación de series de datos, generando unos resultados que se utilizan básicamente en

Más detalles

VECTORES EN EL ESPACIO. 1. Determina el valor de t para que los vectores de coordenadas sean linealmente dependientes.

VECTORES EN EL ESPACIO. 1. Determina el valor de t para que los vectores de coordenadas sean linealmente dependientes. VECTORES EN EL ESPACIO. Determina el valor de t para que los vectores de coordenadas (,, t), 0, t, t) y(, 2, t) sean linealmente dependientes. Si son linealmente dependientes, uno de ellos, se podrá expresar

Más detalles

Geometría Tridimensional

Geometría Tridimensional Capítulo 4 Geometría Tridimensional En dos dimensiones trabajamos en el plano mientras que en tres dimensiones trabajaremos en el espacio, también provisto de un sistema de coordenadas. En el espacio,

Más detalles

Matrices equivalentes. El método de Gauss

Matrices equivalentes. El método de Gauss Matrices equivalentes. El método de Gauss Dada una matriz A cualquiera decimos que B es equivalente a A si podemos transformar A en B mediante una combinación de las siguientes operaciones: Multiplicar

Más detalles

REGRESION simple. Correlación Lineal:

REGRESION simple. Correlación Lineal: REGRESION simple Correlación Lineal: Dadas dos variable numéricas continuas X e Y, decimos que están correlacionadas si entre ambas variables hay cierta relación, de modo que puede predecirse (aproximadamente)

Más detalles

Vectores en el espacio

Vectores en el espacio Vectores en el espacio Un sistema de coordenadas tridimensional se construye trazando un eje Z, perpendicular en el origen de coordenadas a los ejes X e Y. Cada punto viene determinado por tres coordenadas

Más detalles

Profr. Efraín Soto Apolinar. La función lineal. y = a 0 + a 1 x. y = m x + b

Profr. Efraín Soto Apolinar. La función lineal. y = a 0 + a 1 x. y = m x + b La función lineal Una función polinomial de grado uno tiene la forma: y = a 0 + a 1 x El semestre pasado estudiamos la ecuación de la recta. y = m x + b En la notación de funciones polinomiales, el coeficiente

Más detalles

ASOCIACIÓN LINEAL ENTRE VARIABLES CUANTITATIVAS: la correlación de Pearson

ASOCIACIÓN LINEAL ENTRE VARIABLES CUANTITATIVAS: la correlación de Pearson ASOCIACIÓN LINEAL ENTRE VARIABLES CUANTITATIVAS: la correlación de Pearson 3datos 2011 Análisis BIVARIADO de variables cuantitativas OBJETIVO DETERMINAR 1º) si existe alguna relación entre las variables;

Más detalles

UNIDAD 4: PLANO CARTESIANO, RELACIONES Y FUNCIONES. OBJETIVO DE APRENDIZAJE: Representar gráficamente relaciones y funciones en el plano cartesiano.

UNIDAD 4: PLANO CARTESIANO, RELACIONES Y FUNCIONES. OBJETIVO DE APRENDIZAJE: Representar gráficamente relaciones y funciones en el plano cartesiano. UNIDAD 4: PLANO CARTESIANO, RELACIONES Y FUNCIONES OBJETIVO DE APRENDIZAJE: Representar gráficamente relaciones y funciones en el plano cartesiano. EL PLANO CARTESIANO. El plano cartesiano está formado

Más detalles

1. Producto escalar, métrica y norma asociada

1. Producto escalar, métrica y norma asociada 1. asociada Consideramos el espacio vectorial R n sobre el cuerpo R; escribimos los vectores o puntos de R n, indistintamente, como x = (x 1,..., x n ) = n x i e i i=1 donde e i son los vectores de la

Más detalles

1. Dominio, simetría, puntos de corte y periodicidad

1. Dominio, simetría, puntos de corte y periodicidad Estudio y representación de funciones 1. Dominio, simetría, puntos de corte y periodicidad 1.1. Dominio Al conjunto de valores de x para los cuales está definida la función se le denomina dominio. Se suele

Más detalles

Tema 3. Medidas de tendencia central. 3.1. Introducción. Contenido

Tema 3. Medidas de tendencia central. 3.1. Introducción. Contenido Tema 3 Medidas de tendencia central Contenido 31 Introducción 1 32 Media aritmética 2 33 Media ponderada 3 34 Media geométrica 4 35 Mediana 5 351 Cálculo de la mediana para datos agrupados 5 36 Moda 6

Más detalles

TIPOS DE RESTRICCIONES

TIPOS DE RESTRICCIONES RESTRICCIONES: Las restricciones son reglas que determinan la posición relativa de las distintas geometrías existentes en el archivo de trabajo. Para poder aplicarlas con rigor es preciso entender el grado

Más detalles

Apoyo para la preparación de los estudios de Ingeniería y Arquitectura Física (Preparación a la Universidad) Unidad 4: Vectores

Apoyo para la preparación de los estudios de Ingeniería y Arquitectura Física (Preparación a la Universidad) Unidad 4: Vectores Apoyo para la preparación de los estudios de Ingeniería y Arquitectura Física (Preparación a la Universidad) Unidad 4: Vectores Universidad Politécnica de Madrid 5 de marzo de 2010 2 4.1. Planificación

Más detalles

Tema 3. Espacios vectoriales

Tema 3. Espacios vectoriales Tema 3. Espacios vectoriales Estructura del tema. Definición y propiedades. Ejemplos. Dependencia e independencia lineal. Conceptos de base y dimensión. Coordenadas Subespacios vectoriales. 0.1. Definición

Más detalles

Vectores: Producto escalar y vectorial

Vectores: Producto escalar y vectorial Nivelación de Matemática MTHA UNLP 1 Vectores: Producto escalar y vectorial Versores fundamentales Dado un sistema de coordenadas ortogonales, se considera sobre cada uno de los ejes y coincidiendo con

Más detalles

1 v 1 v 2. = u 1v 1 + u 2 v 2 +... u n v n. v n. y v = u u = u 2 1 + u2 2 + + u2 n.

1 v 1 v 2. = u 1v 1 + u 2 v 2 +... u n v n. v n. y v = u u = u 2 1 + u2 2 + + u2 n. Ortogonalidad Producto interior Longitud y ortogonalidad Definición Sean u y v vectores de R n Se define el producto escalar o producto interior) de u y v como u v = u T v = u, u,, u n ) Ejemplo Calcular

Más detalles

1 Espacios y subespacios vectoriales.

1 Espacios y subespacios vectoriales. UNIVERSIDAD POLITÉCNICA DE CARTAGENA Departamento de Matemática Aplicada y Estadística Espacios vectoriales y sistemas de ecuaciones 1 Espacios y subespacios vectoriales Definición 1 Sea V un conjunto

Más detalles

De acuerdo con sus características podemos considerar tres tipos de vectores:

De acuerdo con sus características podemos considerar tres tipos de vectores: CÁLCULO VECTORIAL 1. ESCALARES Y VECTORES 1.1.-MAGNITUDES ESCALARES Y VECTORIALES Existen magnitudes físicas cuyas cantidades pueden ser expresadas mediante un número y una unidad. Otras, en cambio, requieren

Más detalles

Dibujamos estos puntos en el espacio, y no cerramos la figura

Dibujamos estos puntos en el espacio, y no cerramos la figura PRÁCTICA SÉPTIMA: PROYECCIÓN ORTOGONAL. INVERSA DE MOORE-PENROSE 1. Proyección de un vector sobre un subespacio En este apartado vamos a recordar como se proyecta un vector v R m sobre un subespacio vectorial

Más detalles

2 VARIABLES ESTADÍSTICAS BIDIMENSIONALES

2 VARIABLES ESTADÍSTICAS BIDIMENSIONALES 2 VARIABLES ESTADÍSTICAS BIDIMENSIONALES 1 Se ha medido el volumen, X, y la presión, Y, de una masa gaseosa y se ha obtenido: X (litros) 1 65 1 03 0 74 0 61 0 53 0 45 Y (Kg/cm 2 ) 0 5 1 0 1 5 2 0 2 5 3

Más detalles

Aproximación local. Plano tangente. Derivadas parciales.

Aproximación local. Plano tangente. Derivadas parciales. Univ. de Alcalá de Henares Ingeniería de Telecomunicación Cálculo. Segundo parcial. Curso 004-005 Aproximación local. Plano tangente. Derivadas parciales. 1. Plano tangente 1.1. El problema de la aproximación

Más detalles

COORDENADAS CURVILINEAS

COORDENADAS CURVILINEAS CAPITULO V CALCULO II COORDENADAS CURVILINEAS Un sistema de coordenadas es un conjunto de valores que permiten definir unívocamente la posición de cualquier punto de un espacio geométrico respecto de un

Más detalles

Control Estadístico de Procesos

Control Estadístico de Procesos Control Estadístico de Procesos Gráficos de Control Los gráficos de control o cartas de control son una importante herramienta utilizada en control de calidad de procesos. Básicamente, una Carta de Control

Más detalles

Se podría entender como una matriz de filas y columnas. Cada combinación de fila y columna se denomina celda. Por ejemplo la celda A1, B33, Z68.

Se podría entender como una matriz de filas y columnas. Cada combinación de fila y columna se denomina celda. Por ejemplo la celda A1, B33, Z68. Departamento de Economía Aplicada: UDI de Estadística. Universidad Autónoma de Madrid Notas sobre el manejo de Excel para el análisis descriptivo y exploratorio de datos. (Descriptiva) 1 1 Introducción

Más detalles

x 10000 y 8000 x + y 15000 a) La región factible asociada a las restricciones anteriores es la siguiente: Pedro Castro Ortega lasmatematicas.

x 10000 y 8000 x + y 15000 a) La región factible asociada a las restricciones anteriores es la siguiente: Pedro Castro Ortega lasmatematicas. Pruebas de Acceso a Enseñanzas Universitarias Oficiales de Grado (PAEG) Matemáticas aplicadas a las Ciencias Sociales II - Septiembre 2012 - Propuesta A 1. Queremos realizar una inversión en dos tipos

Más detalles

ESTIMACIÓN. puntual y por intervalo

ESTIMACIÓN. puntual y por intervalo ESTIMACIÓN puntual y por intervalo ( ) Podemos conocer el comportamiento del ser humano? Podemos usar la información contenida en la muestra para tratar de adivinar algún aspecto de la población bajo estudio

Más detalles

Te damos los elementos básicos de los vectores para que puedas entender las operaciones básicas.

Te damos los elementos básicos de los vectores para que puedas entender las operaciones básicas. 4 año secundario Vectores, refrescando conceptos adquiridos Te damos los elementos básicos de los vectores para que puedas entender las operaciones básicas. El término vector puede referirse al: concepto

Más detalles

Análisis de medidas conjuntas (conjoint analysis)

Análisis de medidas conjuntas (conjoint analysis) Análisis de medidas conuntas (conoint analysis). Introducción Como ya hemos dicho anteriormente, esta técnica de análisis nos sirve para analizar la importancia que dan los consumidores a cada uno de los

Más detalles

FUNCIONES CUADRÁTICAS Y RACIONALES

FUNCIONES CUADRÁTICAS Y RACIONALES www.matesronda.net José A. Jiménez Nieto FUNCIONES CUADRÁTICAS Y RACIONALES 1. FUNCIONES CUADRÁTICAS. Representemos, en función de la longitud de la base (), el área (y) de todos los rectángulos de perímetro

Más detalles

a < b y se lee "a es menor que b" (desigualdad estricta) a > b y se lee "a es mayor que b" (desigualdad estricta)

a < b y se lee a es menor que b (desigualdad estricta) a > b y se lee a es mayor que b (desigualdad estricta) Desigualdades Dadas dos rectas que se cortan, llamadas ejes (rectangulares si son perpendiculares, y oblicuos en caso contrario), un punto puede situarse conociendo las distancias del mismo a los ejes,

Más detalles

FISICA I Escuela Politécnica de Ingeniería de Minas y Energía AJUSTE POR MÍNIMOS CUADRADOS

FISICA I Escuela Politécnica de Ingeniería de Minas y Energía AJUSTE POR MÍNIMOS CUADRADOS AJUSTE POR MÍNIMOS CUADRADOS Existen numerosas leyes físicas en las que se sabe de antemano que dos magnitudes x e y se relacionan a través de una ecuación lineal y = ax + b donde las constantes b (ordenada

Más detalles

PARÁBOLA. 1) para la parte positiva: 2) para la parte negativa: 3) para la parte positiva: 4) para la parte negativa:

PARÁBOLA. 1) para la parte positiva: 2) para la parte negativa: 3) para la parte positiva: 4) para la parte negativa: Página 90 5 LA PARÁBOLA 5.1 DEFINICIONES La parábola es el lugar geométrico 4 de todos los puntos cuyas distancias a una recta fija, llamada, y a un punto fijo, llamado foco, son iguales entre sí. Hay

Más detalles

Espacios vectoriales. Bases. Coordenadas

Espacios vectoriales. Bases. Coordenadas Capítulo 5 Espacios vectoriales. Bases. Coordenadas OPERACIONES ENR n Recordemos que el producto cartesiano de dos conjuntos A y B consiste en los pares ordenados (a,b) tales que a A y b B. Cuando consideramos

Más detalles

INTRODUCCIÓN A VECTORES Y MAGNITUDES

INTRODUCCIÓN A VECTORES Y MAGNITUDES C U R S O: FÍSIC Mención MTERIL: FM-01 INTRODUCCIÓN VECTORES Y MGNITUDES La Física tiene por objetivo describir los fenómenos que ocurren en la naturaleza, a través de relaciones entre magnitudes físicas.

Más detalles

Diagonalización de matrices

Diagonalización de matrices diagonalizacion.nb Diagonalización de matrices Práctica de Álgebra Lineal, E.U.A.T., Grupos ºA y ºB, 2005 Algo de teoría Qué es diagonalizar una matriz? Para estudiar una matriz suele ser conveniente expresarla

Más detalles

Seminario Universitario Material para estudiantes. Física. Unidad 2. Vectores en el plano. Lic. Fabiana Prodanoff

Seminario Universitario Material para estudiantes. Física. Unidad 2. Vectores en el plano. Lic. Fabiana Prodanoff Seminario Universitario Material para estudiantes Física Unidad 2. Vectores en el plano Lic. Fabiana Prodanoff CONTENIDOS Vectores en el plano. Operaciones con vectores. Suma y producto por un número escalar.

Más detalles

Lecturas previas Cuando llegue a su primera sesión de laboratorio debe haber estudiado el contenido de la lectura que aparece a continuación.

Lecturas previas Cuando llegue a su primera sesión de laboratorio debe haber estudiado el contenido de la lectura que aparece a continuación. Laboratorio 1 Medición e incertidumbre La descripción de los fenómenos naturales comienza con la observación; el siguiente paso consiste en asignar a cada cantidad observada un número, es decir en medir

Más detalles

A continuación voy a colocar las fuerzas que intervienen en nuestro problema.

A continuación voy a colocar las fuerzas que intervienen en nuestro problema. ísica EL PLANO INCLINADO Supongamos que tenemos un plano inclinado. Sobre él colocamos un cubo, de manera que se deslice sobre la superficie hasta llegar al plano horizontal. Vamos a suponer que tenemos

Más detalles

LÍMITES Y CONTINUIDAD DE FUNCIONES

LÍMITES Y CONTINUIDAD DE FUNCIONES Capítulo 9 LÍMITES Y CONTINUIDAD DE FUNCIONES 9.. Introducción El concepto de ite en Matemáticas tiene el sentido de lugar hacia el que se dirige una función en un determinado punto o en el infinito. Veamos

Más detalles

UNIDAD 4: MEDIDAS DE TENDENCIA CENTRAL

UNIDAD 4: MEDIDAS DE TENDENCIA CENTRAL UNIDAD 4: MEDIDAS DE TENDENCIA CENTRAL Objetivo terminal: Calcular e interpretar medidas de tendencia central para un conjunto de datos estadísticos. Objetivos específicos: 1. Mencionar las características

Más detalles

Definición 1.1.1. Dados dos números naturales m y n, una matriz de orden o dimensión m n es una tabla numérica rectangular con m filas y n columnas.

Definición 1.1.1. Dados dos números naturales m y n, una matriz de orden o dimensión m n es una tabla numérica rectangular con m filas y n columnas. Tema 1 Matrices Estructura del tema. Conceptos básicos y ejemplos Operaciones básicas con matrices Método de Gauss Rango de una matriz Concepto de matriz regular y propiedades Determinante asociado a una

Más detalles

TEMA 7: Análisis de la Capacidad del Proceso

TEMA 7: Análisis de la Capacidad del Proceso TEMA 7: Análisis de la Capacidad del Proceso 1 Introducción Índices de capacidad 3 Herramientas estadísticas para el análisis de la capacidad 4 Límites de tolerancia naturales 1 Introducción La capacidad

Más detalles

BREVE MANUAL DE SOLVER

BREVE MANUAL DE SOLVER BREVE MANUAL DE SOLVER PROFESOR: DAVID LAHOZ ARNEDO PROGRAMACIÓN LINEAL Definición: Un problema se define de programación lineal si se busca calcular el máximo o el mínimo de una función lineal, la relación

Más detalles

Tema 10. Estimación Puntual.

Tema 10. Estimación Puntual. Tema 10. Estimación Puntual. Presentación y Objetivos. 1. Comprender el concepto de estimador y su distribución. 2. Conocer y saber aplicar el método de los momentos y el de máxima verosimilitud para obtener

Más detalles

VECTORES EN EL PLANO

VECTORES EN EL PLANO VECTORES EN EL PLANO VECTOR: vectores libres Segmento orientado, con un origen y extremo. Módulo: es la longitud del segmento orientado, es un número positivo y su símbolo es a Dirección: es la recta que

Más detalles

QUÉ ES LA RENTABILIDAD Y CÓMO MEDIRLA. La rentabilidad mide la eficiencia con la cual una empresa utiliza sus recursos financieros.

QUÉ ES LA RENTABILIDAD Y CÓMO MEDIRLA. La rentabilidad mide la eficiencia con la cual una empresa utiliza sus recursos financieros. QUÉ ES LA RENTABILIDAD Y CÓMO MEDIRLA La rentabilidad mide la eficiencia con la cual una empresa utiliza sus recursos financieros. Qué significa esto? Decir que una empresa es eficiente es decir que no

Más detalles

REPASO CONCEPTOS BÁSICOS DE ESTADÍSTICA. DISTRIBUCIÓN NORMAL.

REPASO CONCEPTOS BÁSICOS DE ESTADÍSTICA. DISTRIBUCIÓN NORMAL. REPASO COCEPTOS BÁSICOS DE ESTADÍSTICA. DISTRIBUCIÓ ORMAL. Éste es un breve repaso de conceptos básicos de estadística que se han visto en cursos anteriores y que son imprescindibles antes de acometer

Más detalles

Subespacios vectoriales en R n

Subespacios vectoriales en R n Subespacios vectoriales en R n Víctor Domínguez Octubre 2011 1. Introducción Con estas notas resumimos los conceptos fundamentales del tema 3 que, en pocas palabras, se puede resumir en técnicas de manejo

Más detalles

VECTORES. Abel Moreno Lorente. February 3, 2015

VECTORES. Abel Moreno Lorente. February 3, 2015 VECTORES Abel Moreno Lorente February 3, 015 1 Aspectos grácos. 1.1 Deniciones. Un vector entre dos puntos A y B es el segmento de recta orientado que tiene su origen en A y su extremo en B. A este vector

Más detalles

Segundo de Bachillerato Geometría en el espacio

Segundo de Bachillerato Geometría en el espacio Segundo de Bachillerato Geometría en el espacio Jesús García de Jalón de la Fuente IES Ramiro de Maeztu Madrid 204-205. Coordenadas de un vector En el conjunto de los vectores libres del espacio el concepto

Más detalles

ESTATICA: TIPOS DE MAGNITUDES: CARACTERÍSTICAS DE UN VECTOR. Rama de la física que estudia el equilibrio de los cuerpos.

ESTATICA: TIPOS DE MAGNITUDES: CARACTERÍSTICAS DE UN VECTOR. Rama de la física que estudia el equilibrio de los cuerpos. ESTATICA: Rama de la física que estudia el equilibrio de los cuerpos. TIPOS DE MAGNITUDES: MAGNITUD ESCALAR: Es una cantidad física que se especifica por un número y una unidad. Ejemplos: La temperatura

Más detalles

Indicaciones específicas para los análisis estadísticos.

Indicaciones específicas para los análisis estadísticos. Tutorial básico de PSPP: Vídeo 1: Describe la interfaz del programa, explicando en qué consiste la vista de datos y la vista de variables. Vídeo 2: Muestra cómo crear una base de datos, comenzando por

Más detalles

1. Vectores 1.1. Definición de un vector en R2, R3 (Interpretación geométrica), y su generalización en Rn.

1. Vectores 1.1. Definición de un vector en R2, R3 (Interpretación geométrica), y su generalización en Rn. 1. VECTORES INDICE 1.1. Definición de un vector en R 2, R 3 (Interpretación geométrica), y su generalización en R n...2 1.2. Operaciones con vectores y sus propiedades...6 1.3. Producto escalar y vectorial

Más detalles

GEOMETRÍA ANALÍTICA 2º Curso de Bachillerato 22 de mayo de 2008

GEOMETRÍA ANALÍTICA 2º Curso de Bachillerato 22 de mayo de 2008 1. Sean los puntos A (1, 0,-1) y B (,-1, 3). Calcular la distancia del origen de coordenadas a la recta que pasa por A y B. Calculemos la recta que pasa por A y B. El vector AB es (1,-1,4) y por tanto

Más detalles

Clasificación de métricas.

Clasificación de métricas. Clasificación de métricas. 1. El problema de clasificación. Como bien sabemos, el par formado por una métrica T 2 (esto es, un tensor 2-covariante simétrico) sobre un espacio vectorial E, (E, T 2 ), constituye

Más detalles

Aplicaciones de Estadística Descriptiva

Aplicaciones de Estadística Descriptiva Aplicaciones de Estadística Descriptiva Contenidos de la presentación Funciones estadísticas en Excel. Gráficos. El módulo de análisis de datos y las tablas dinámicas de Excel. Información Intentaremos

Más detalles

SISTEMAS DE COORDENADAS SISTEMA COORDENADO UNIDIMENSIONAL

SISTEMAS DE COORDENADAS SISTEMA COORDENADO UNIDIMENSIONAL SISTEMAS DE COORDENADAS En la vida diaria, nos encontramos con el problema de ordenar algunos objetos; de tal manera que es necesario agruparlos, identificarlos, seleccionarlos, estereotiparlos, etc.,

Más detalles

CAPÍTULO II. 2 El espacio vectorial R n

CAPÍTULO II. 2 El espacio vectorial R n CAPÍTULO II 2 El espacio vectorial R n A una n upla (x 1, x 2,..., x n ) de números reales se le denomina vector de n coordenadas o, simplemente, vector. Por ejemplo, el par ( 3, 2) es un vector de R 2,

Más detalles

Medidas de tendencia central o de posición: situación de los valores alrededor

Medidas de tendencia central o de posición: situación de los valores alrededor Tema 10: Medidas de posición y dispersión Una vez agrupados los datos en distribuciones de frecuencias, se calculan unos valores que sintetizan la información. Estudiaremos dos grandes secciones: Medidas

Más detalles

Fundamentos de Investigación de Operaciones Investigación de Operaciones 1

Fundamentos de Investigación de Operaciones Investigación de Operaciones 1 Fundamentos de Investigación de Operaciones Investigación de Operaciones 1 1 de agosto de 2003 1. Introducción Cualquier modelo de una situación es una simplificación de la situación real. Por lo tanto,

Más detalles

Espacios vectoriales y aplicaciones lineales.

Espacios vectoriales y aplicaciones lineales. Práctica 2 Espacios vectoriales y aplicaciones lineales. Contenido: Localizar bases de espacios vectoriales. Suma directa. Bases y dimensiones. Cambio de base. Aplicaciones lineales. Matriz asociada en

Más detalles

Transformación de gráfica de funciones

Transformación de gráfica de funciones Transformación de gráfica de funciones La graficación de las funciones es como un retrato de la función. Nos auda a tener una idea de cómo transforma la función los valores que le vamos dando. A partir

Más detalles

Funciones, x, y, gráficos

Funciones, x, y, gráficos Funciones, x, y, gráficos Vamos a ver los siguientes temas: funciones, definición, dominio, codominio, imágenes, gráficos, y algo más. Recordemos el concepto de función: Una función es una relación entre

Más detalles

Tema 3: Producto escalar

Tema 3: Producto escalar Tema 3: Producto escalar 1 Definición de producto escalar Un producto escalar en un R-espacio vectorial V es una operación en la que se operan vectores y el resultado es un número real, y que verifica

Más detalles

15 ESTADÍSTICA BIDIMENSIONAL

15 ESTADÍSTICA BIDIMENSIONAL ESTADÍSTICA BIDIMENSINAL EJERCICIS PRPUESTS. Copia y completa la siguiente tabla. A B C Total A B C Total a 4 b c 0 7 Total 7 6 a 4 b c 4 3 0 7 Total 7 6 3 6 a) Qué porcentaje de datos presentan la característica

Más detalles

Muchas veces hemos visto un juego de billar y no nos percatamos de los movimientos de las bolas (ver gráfico 8). Gráfico 8

Muchas veces hemos visto un juego de billar y no nos percatamos de los movimientos de las bolas (ver gráfico 8). Gráfico 8 Esta semana estudiaremos la definición de vectores y su aplicabilidad a muchas situaciones, particularmente a las relacionadas con el movimiento. Por otro lado, se podrán establecer las características

Más detalles

Curso de Procesamiento Digital de Imágenes

Curso de Procesamiento Digital de Imágenes Curso de Procesamiento Digital de Imágenes Impartido por: Elena Martínez Departamento de Ciencias de la Computación IIMAS, UNAM, cubículo 408 http://turing.iimas.unam.mx/~elena/teaching/pdi-lic.html elena.martinez@iimas.unam.mx

Más detalles

ANÁLISIS DE CORRELACIÓN EMPLEANDO EXCEL Y GRAPH

ANÁLISIS DE CORRELACIÓN EMPLEANDO EXCEL Y GRAPH ANÁLISIS DE CORRELACIÓN EMPLEANDO EXCEL Y GRAPH Cuando se estudian en forma conjunta dos características (variables estadísticas) de una población o muestra, se dice que estamos analizando una variable

Más detalles

Uso del Programa Gantt Project

Uso del Programa Gantt Project Uso del Programa Gantt Project Presentación En esta práctica guiada aprenderás varias cosas relacionadas con el uso de Gantt Project, que es una aplicación de ayuda a la gestión de proyectos: Especificar

Más detalles

El programa Minitab: breve introducción a su funcionamiento. Para mostrar la facilidad con la que se pueden realizar los gráficos y cálculos

El programa Minitab: breve introducción a su funcionamiento. Para mostrar la facilidad con la que se pueden realizar los gráficos y cálculos El programa Minitab: breve introducción a su funcionamiento Para mostrar la facilidad con la que se pueden realizar los gráficos y cálculos estadísticos en la actualidad, el libro se acompaña, en todo

Más detalles

Semana de dieta (X) 1 2 3 4 5 Peso en Kg (Y) 88.5 87 84 82.5 79

Semana de dieta (X) 1 2 3 4 5 Peso en Kg (Y) 88.5 87 84 82.5 79 . Una persona se somete a una dieta de adelgazamiento durante cinco semanas. A continuación se detalla su peso al término de cada una de esas semanas: Semana de dieta X) 2 3 4 Peso en Kg Y) 88. 87 84 82.

Más detalles

Estadística. Conceptos de Estadística. Un individuo o unidad estadística es cada uno de los elementos que componen la población.

Estadística. Conceptos de Estadística. Un individuo o unidad estadística es cada uno de los elementos que componen la población. Estadística La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Un estudio estadístico consta

Más detalles

MEDIDAS DE DISPERSIÓN EMPLEANDO EXCEL

MEDIDAS DE DISPERSIÓN EMPLEANDO EXCEL MEDIDAS DE DISPERSIÓN EMPLEANDO EXCEL Las medias de tendencia central o posición nos indican donde se sitúa un dato dentro de una distribución de datos. Las medidas de dispersión, variabilidad o variación

Más detalles

Selectividad Septiembre 2009 SEPTIEMBRE 2009. Opción A

Selectividad Septiembre 2009 SEPTIEMBRE 2009. Opción A SEPTIEMBRE 2009 Opción A 1.- Como cada año, el inicio del curso académico, una tienda de material escolar prepara una oferta de 600 cuadernos, 500 carpetas y 400 bolígrafos para los alumnos de un IES,

Más detalles

Introducción. Estadística 1. 1. Introducción

Introducción. Estadística 1. 1. Introducción 1 1. Introducción Introducción En este tema trataremos de los conceptos básicos de la estadística, también aprenderemos a realizar las representaciones gráficas y a analizarlas. La estadística estudia

Más detalles

La práctica del análisis de correspondencias

La práctica del análisis de correspondencias La práctica del análisis de correspondencias MICHAEL GREENACRE Catedrático de Estadística en la Universidad Pompeu Fabra Separata del capítulo Biplots en análisis de correspondencias Primera edición: julio

Más detalles

CÁLCULO PARA LA INGENIERÍA 1

CÁLCULO PARA LA INGENIERÍA 1 CÁLCULO PARA LA INGENIERÍA 1 PROBLEMAS RESUELTOS Tema 3 Derivación de funciones de varias variables 3.1 Derivadas y diferenciales de funciones de varias variables! 1. Derivadas parciales de primer orden.!

Más detalles