CEDEX - Curso de formación estadística. Técnicas de análisis multivariante
|
|
- Purificación Nieto Benítez
- hace 6 años
- Vistas:
Transcripción
1 CEDEX - Curso de formación estadística Técnicas de análisis multivariante Departamento de Estadística Universidad Carlos III de Madrid Madrid - 8 de octubre de 007
2 Estructura del curso.. Introducción. Técnicas descriptivas numéricas. Técnicas descriptivas gráficas. Análisis de componentes principales.. I. Análisis factorial. Escalado multidimensional. Análisis de correspondencias.
3 Estructura del curso. II. Problemas de clasificación. Análisis discriminante lineal. Análisis discriminante cuadrático. Análisis discriminante logístico. 5. V. Análisis cluster jerárquico. Análisis cluster por partición. Análisis de correlaciones canónicas. 6. Técnicas de análisis multivariante - V. Sesión práctica con SPSS.
4 Introducción Variables Observaciones. Matriz de datos. Ejemplos.
5 5 Variable (vectorial o multivariante): es un conjunto de características o rasgos de los elementos de una población. Notación: x. Observación o dato: valor de una variable multivariante en un elemento de la muestra. Notación: x i corresponde al elemento i. Matriz de datos: representación de los valores de una muestra de tamaño n de una variable vectorial x. x x x p x X = x x x p.... = x. = [ ] x () x () x (p), x n x n x np x n donde: x ij es el valor de la variable escalar j en el individuo i. x i es un vector fila p que representa los valores de las p variables univariantes en el individuo i. x (j) es un vector columna n que representa los valores de la variable escalar j en las n observaciones.
6 6 Ejemplo 0. Rectángulos. Ejemplo 5.9 del libro Análisis de Datos Multivariantes de Daniel Peña. Se tienen 6 observaciones bivariantes, cada observación corresponde con un rectángulo y las variables univariantes son la longitud de la base y la altura del rectángulo. La matriz de datos es: X =,0,0,5 0,5 0,7 0,5 0,5,5 0,5 0,7 0,7 0,7. Rectángulo medio Rectángulo medio ± desviación estándar
7 7 Ejemplo. Medidas de cráneos de cocodrilos. Código cl cw sw sl dcl ow oiw ol lcr wcr wn Descripción Longitud del cráneo Ancho del cráneo Ancho del hocico Longitud del hocico Longitud dorsal del cráneo Ancho máximo orbital Ancho mínimo inter orbital Longitud máxima orbital Longitud del paladar post orbital Ancho posterior del paladar craneal Ancho máximo entre orificios nasales
8 8 Ejemplo. Medidas o características de automóviles. Código consumo motor cv peso acel año origen cilindr Descripción Consumo (l/00km) Cilindrada en cc Potencia (CV) Peso total (kg) Aceleración 0 a 00 km/h (segundos) Año del modelo País de origen Número de cilindros
9 9 Ejemplo. Gases contaminantes En la Tabla siguiente se presentan las 0 primeras observaciones de cinco variables de niveles de gases contaminantes (CO: X, NO: X, NO : X 5, O : X 6, y HC: X 7 ) y dos variables relacionadas (Intensidad del viento: X, y Radiación solar: X ). X X X X X 5 X 6 X
10 0 Ejemplo. Gráficos de control de un proceso industrial. X n 60 : 60 Mediciones del proceso en n máquinas.
11 Ejemplo 5. Esclerosis múltiple. En un estudio sobre esclerosis múltiple se registran las respuestas del ojo izquierdo (I) y del ojo derecho (D) a dos estímulos visuales diferentes. Se consideran dos grupos, 9 individuos que padecen esclerosis múltiple y un grupo control de 69 individuos que no la padecen. Se registran las siguientes variables: X : Edad, X = RL+RD, X = RL RD, X = RL+RD, X 5 = RL RD. X X X X X 5 Paciente/Control
12 Técnicas descriptivas numéricas Estadísticos univariantes y bivariantes. Vector de medias y matriz de covarianzas. Proyecciones y combinaciones lineales. Estandarización univariante. Estandarización multivariante.
13 Estadísticos univariantes y bivariantes Media muestral de la variable x j : x j = n n x ij. i= Varianza muestral de la variable x j : s j = s jj = n n (x ij x j ). i= Covarianza muestral entre las variables x j y x k : s jk = n n (x ij x j )(x ik x k ). i=
14 Los estadísticos anteriores dependen de las unidades de medidas y por esto suelen utilizarse, como complemento en el resumen numérico, los siguientes estadísticos: Coeficiente de variación de la variable x j : CV j = s j, x j que podrá calcularse siempre que x j sea distinta de cero. Correlación muestral entre las variables x j y x k : r jk = s jk sjj s kk = s jk s j s k.
15 Estadísticos multivariantes - I 5 Vector de medias muestral de la variable vectorial x: x = n n x i = i= x es un vector de dimensión p. También podemos obtener el vector de medias de la siguiente expresión: x x. x p. x = n X, donde es un vector de unos de dimensión n.
16 Estadísticos multivariantes - II 6 Matriz de varianzas y covarianzas de la variable vectorial x: S = s s s p s s s p s p s p... s pp S es una matriz cuadrada simétrica (s jk = s kj ) de dimensión p p. También podemos obtener la matriz de varianzas y covarianzas de las siguientes expresiones:. S = n n (x i x)(x i x) = n (X x ) (X x ) = n X X, i= donde la matriz X = X x = X n X recibe el nombre de matriz de datos centrados.
17 Estadísticos multivariantes - Ejemplo - I 7 Ejemplo 0. De las siguientes salidas de SPSS podemos obtener el vector de medias y las matrices de covarianzas y de correlaciones del conjunto de datos de rectángulos: Estadísticos descriptivos BASE ALTURA N válido (según lista) N Media Desv. típ. Varianza 6,98,60,86 6,98,60,86 6 Vector de medias: x = [ 0,98 0,98 ].
18 Estadísticos multivariantes - Ejemplo - II 8 Ejemplo 0. Correlaciones BASE ALTURA Correlación de Pearson Covarianza N Correlación de Pearson Covarianza N BASE ALTURA,6,86,78 6 6,6,78, Matriz de covarianzas: S = Matriz de correlaciones: R = [ 0,86 0,78 0,78 0,86 [,000 0,6 0,6,000 ]. ].
19 Estadísticos multivariantes - Ejemplo - III 9 Estadísticos descriptivos Consumo (l/00km) Cilindrada en cc Potencia (CV) Peso total (kg) Aceleración 0 a 00 km/h (segundos) Año del modelo País de origen Número de cilindros N válido (según lista) N Mínimo Máximo Media Desv. típ ,, ,7 7, ,8 8, ,5 8, ,50, ,9,79 05,57, ,7,70 9 La media y la varianza no tienen sentido en la variable Pais de origen. El vector de medias es: x = [, 79, 7 0, 8 989, 5 5, 50 75, 9 5, 7 ].
20 Estadísticos multivariantes - Ejemplo - IV 0 Correlaciones Consumo (l/00km) Cilindrada en cc Potencia (CV) Peso total (kg) Aceleración 0 a 00 km/h (segundos) Año del modelo Correlación de Pearson Sig. (bilateral) N Correlación de Pearson Sig. (bilateral) N Correlación de Pearson Sig. (bilateral) N Correlación de Pearson Sig. (bilateral) N Correlación de Pearson Sig. (bilateral) N Correlación de Pearson Sig. (bilateral) N Número de cilindros Correlación de Pearson Sig. (bilateral) N **. La correlación es significativa al nivel 0,0 (bilateral). Aceleración 0 Consumo Cilindrada en Peso total a 00 km/h Año del Número de (l/00km) cc Potencia (CV) (kg) (segundos) modelo cilindros,87**,86**,87** -,90** -,55**,8**.,000,000,000,000,000, ,87**,897**,9** -,55** -,70**,95**,000.,000,000,000,000, ,86**,897**,859** -,70** -,7**,8**,000,000.,000,000,000, ,87**,9**,859** -,5** -,96**,895**,000,000,000.,000,000, ,90** -,55** -,70** -,5**,** -,58**,000,000,000,000.,000, ,55** -,70** -,7** -,96**,** -,57**,000,000,000,000,000., ,8**,95**,8**,895** -,58** -,57**,000,000,000,000,000,
21 Estadísticos multivariantes - Ejemplo - V Correlaciones VIENTO RADIACIO CO NO NO O HC Correlación de Pearson Sig. (bilateral) N Correlación de Pearson Sig. (bilateral) N Correlación de Pearson Sig. (bilateral) N Correlación de Pearson Sig. (bilateral) N Correlación de Pearson Sig. (bilateral) N Correlación de Pearson Sig. (bilateral) N Correlación de Pearson Sig. (bilateral) N *. La correlación es significante al nivel 0,05 (bilateral). **. La correlación es significativa al nivel 0,0 (bilateral). VIENTO RADIACIO CO NO NO O HC -,0 -,9 -,70 -,0 -,5,56.,5,9,08,89,05, -,0,8 -,07,6,9*,05,5.,7,6,65,09,7 -,9,8,50**,557**,**,66,9,7.,00,000,007,9 -,70 -,07,50**,97 -,,5,08,6,00.,056,98,5 -,0,6,557**,97,67,8**,89,65,000,056.,9,00 -,5,9*,** -,,67,5,05,09,007,98,9.,9,56,05,66,5,8**,5,,7,9,5,00,9.
22 Proyecciones y combinaciones lineales Una forma simple de resumir una variable vectorial, x, es construir una variable univariante, y, que sea el resultado de una combinación lineal de las componentes de x: y = a x, donde a es un vector de constantes de dimensión p. Si obtenemos las combinaciones lineales de todos los datos tendremos un vector y de dimensión n. y puede obtenerse de la siguiente expresión: y = Xa, donde X es la matriz de datos de dimensión n p.
23 Ejemplo de rectángulos Ejemplo 0. En el ejemplo de los rectángulos, una variable de interés es el perímetro del rectángulo, (base + altura), que podemos obtener mediante: y = Xa =,0,0,5 0,5 0,7 0,5 0,5,5 0,5 0,7 0,7 0,7 [,0,0 ].5 = 8,00,00,0,00,0,
24 Estandarización univariante Estandarización univariante: y = D / (x x), donde D / expresión: es una matriz diagonal de dimensión p p con la siguiente D / = s s s p. Propiedades: La media de y es cero, i.e., ȳ = 0. La matriz de covarianzas de y es la matriz de correlaciones de x, i.e., S y = R x.
25 Estandarización multivariante 5 Estandarización multivariante: Si S x es la matriz de covarianzas de x podemos definir su raíz cuadrada, S / x, por la siguiente condición: S x = S / x (S / x ). Esto nos permitirá definir la estandarización multivariante mediante la expresión: y = S / x (x x). Propiedades: La media de y es cero, i.e., ȳ = 0. La matriz de covarianzas de y es la matriz identidad de dimensión p p, i.e., S y = I.
26 Técnicas descriptivas gráficas 6 Objetivos. Ejemplos de representación gráfica de los datos: Matriz de diagramas de dispersión. Diagramas de estrellas. Diagramas de caras de Chernoff. Diagramas de Andrews.
27 Representación gráfica de datos 7 El objetivo que perseguimos con la representación gráfica de datos es identificar: Relaciones ( débil/fuerte ó lineal/no lineal?). Grupos ( los grupos o conglomerados observados corresponden a grupos o categorías conocidas?) Atípicos. Estudiaremos los siguientes gráficos: Matriz de diagramas de dispersión. Diagramas de estrellas. Diagramas de caras. Diagramas de Andrews.
28 Matriz de diagramas de dispersión - I 8 Si tenemos p variables podemos construir p(p )/ diagramas de dispersión diferentes tomando las variables por pares. Una manera de presentar estos gráficos es en forma de matriz. Gráfico CL CW SW SL Ejemplo. La Figura muestra la matriz de diagramas de dispersión en la que observamos, por ejemplo: (i) relaciones lineales entre la mayor parte de las variables, (ii) posible relación no lineal entre las variables oiw y ow, y entre oiw y wn, (iii) posibles atípicos en la variable ow. Gráfico DCL OW OIW OL LCR WCR WN
29 Matriz de diagramas de dispersión - II 9 Ejemplo. (Zoom x) Gráfico cp8 cp8 cp8 cp8 cn9 cn9 cn9 cn9 SL am am am am cp8 cp8 cp8 cp8 cn9 cn9 cn9 cn9 am DCL am am am cp8 cp8 cp8 cp8 am am am am cn9 cn9 cn9 cn9 OW cn9 cp8 cn9 cp8 cn9 cp8 cn9 cp8 OIW am am am am cp8 cp8 cp8 cp8 cn9 cn9 cn9 cn9 am am am am OL
30 Matriz de diagramas de dispersión - III 0 Ejemplo. (Zoom x8) 70 cp8 60 am 50 cn9 0 0 am 0 OW OIW
31 0,9 0,8 0,7 0,6 0,5 0, 0, 0, 0, 0 Diagramas de estrellas - I cl wn cw Cada dato se representará mediante una estrella que tendrá tantos rayos o ejes como variables se deseen representar. wcr sw La longitud del rayo j-ésimo en la estrella que representa al datos i dependerá del valor de la variable j en ese dato, x ij. lcr sl ol dcl oiw ow
32 Diagramas de estrellas - II Ejemplo. observaciones. cn cn7 cp ot ot8 ot am am0 cn cn8 cp5 ot ot9 ot5 am5 am cn cn9 cp6 ot ot0 ot6 am6 cn cp cp7 ot5 ot am am7 cn5 cp cp8 ot6 ot am am8 cn6 cp ot ot7 ot am am9
33 Diagramas de estrellas - III Ejemplo. Medias por especies. Crocodylus niloticus Osteolaemus tetraspis Crocodylus porosus Alligator mississippiensis
34 Diagramas de caras Caras de Chernoff: Cada dato se representará mediante una cara. A cada variable se asocia un rasgo o característica de una cara, por ejemplo: () área de la cara, () forma de la cara, () longitud de la nariz, () localización de la boca, (5) curva de la sonrisa (6) grosor de la boca, (7) localización, separación, inclinación, forma y grosor de los ojos, etcétera. Crocodylus niloticus Osteolaemus tetraspis Crocodylus porosus Alligator mississippiensis
35 Diagramas de Andrews - I 5 Los diagramas de Andrews representan al vector de observaciones x i = [x i x i x ip ] mediante el gráfico de la siguiente función: f i (t) = x i + x i sin(t) + x i cos(t)+ +x i sin(t) + x i5 cos(t) + con π t π. Es claro que la función anterior cambia si cambiamos el orden de las variables, por lo que se recomienda explorar distintos ordenes para decidir cuál representa mejor los datos
36 Diagramas de Andrews - II 6 Ejemplo
37 Análisis de componentes principales 7 Interpretación geométrica. Obtención y propiedades de las componentes principales. Criterios para elegir el número de componentes. Interpretación de las componentes.
38 Análisis de componentes principales 8 Al estudiar una matriz de datos X, es posible que encontremos correlaciones altas (en valor absoluto) entre varias variables. El caso más extremo es que una de las variables sea combinación lineal de las restantes. Entonces, el investigador puede preguntarse si no sería más adecuado estudiar un subconjunto de las variables originales o combinaciones lineales de éstas. También el número de variables, p, puede ser grande, lo que dificulta su análisis conjunto y en tal caso el trabajo del investigador se facilitaría si existiese un conjunto de dimensión menor (r < p) de combinaciones lineales que describiera la matriz de datos X con una pequeña pérdida de información. Reducción de la dimensión
39 9 El análisis de componentes principales tiene como objetivo la reducción de la dimensión de p variables preservando en lo posible la estructura de varianzas presente en la matriz X. Se intentará explicar la mayor variabilidad posible con un número r < p de combinaciones lineales de las variables originales. Así: La primera componente principal será la combinación lineal z = Xa que tenga varianza máxima. La segunda componente principal será la combinación lineal z = Xa que tenga varianza máxima y que sea incorrelada con z. Las siguientes componentes se definen de manera similar, es decir, se intenta obtener la máxima varianza con combinaciones lineales que sean incorreladas con las componentes previamente calculadas. Cuántas componentes se necesitan para explicar el 00 % de la variabilidad?
40 Interpretación geométrica 0
41 Obtención de las componentes principales Supuesto inicial: El vector de medias cumple que x = 0. Obtención de la primera componente principal: z = Xa. Varianza de z : σ z = a Sa, donde S = n X X es la matriz de covarianzas de x. Qué problema debemos resolver para obtener z? Maximizar {a Sa } s.a. a =.
42 Solución: Mediante los multiplicadores de Lagrange: L = a Sa λ(a a ). Derivamos respecto de a e igualamos la derivada a 0: La solución cumple que: Sa = λa. L a = Sa λa = 0. El vector, a, que define la primera componente principal es un vector propio de la matriz de covarianzas, S. Pero, σ z = a Sa = λa a = λ, Entonces: El vector, a, que define la primera componente principal es el vector propio asociado al mayor valor propio de la matriz de covarianzas, S.
43 Obtención de la segunda componente principal: z = Xa. Problema a resolver: Maximizar {a Sa } Que equivale a: s.a. { a =. a a = 0. L = a Sa λ (a a ) λ a a. Derivamos respecto de a e igualamos la derivada a 0: L a = Sa λ a λ a = 0.
44 Obtención de la segunda componente principal: Premultiplicando la expresión anterior por a obtenemos: a Sa λ a a λ a a = λ = 0, es decir λ = 0. Por lo tanto: Sa = λ a. El vector, a, que define la segunda componente principal es el vector propio asociado al segundo mayor valor propio de la matriz de covarianzas, S.
45 Componentes principales - Ejemplo 5 Ejemplo 0. En el tema anterior calculamos la matriz de covarianzas de este ejemplo: [ ] 0,86 0,78 S =. 0,78 0,86 y sus valores y vectores propios: λ = 0,56, a = [ 0,707 0,707 ], y λ = 0,080, a = [ 0,707 0,707 ]. De manera que las componentes principales son: z = 0,707 x + 0,707 x, z = 0,707 x 0,707 x.
46 Componentes principales - Ejemplo con SPSS - I 6 Ejemplo 0. Resultados utilizando SPSS: Matriz de componentes Bruta Reescalada BASE ALTURA Componente Componente,5 -,,855 -,59,5,,855,59 b = λ a = 0,56 [ 0,707 0,707 ] = [ 0,507 0,507 ] Comp. bruta: b = λ a = [ 0,080 0,707 0,707 ] = [ 0, 0, ].
47 Componentes principales - Ejemplo con SPSS - II 7 Ejemplo 0. Matriz de componentes Bruta Reescalada BASE ALTURA Componente Componente,5 -,,855 -,59,5,,855,59 c = [ ] b /σ b /σ = [ 0,507/0,6 0,507/0,6 ] = [ 0,855 0,855 ] Comp. re-escalada: c = [ ] b /σ b /σ = [ 0,/0,6 0,/0,6 ] = [ 0,59 0,59 ].
48 ,0,76 -,5 -,7,095,05 Cilindrada en cc 7,500-5,,7,00,00,000 Potencia (CV),5,0-6,596,75,6 -,07 Peso total (kg) 6,9 98,75, -,008 -,06 -,00 Aceleración 0 a 00 -,507,676,5 -,8,659 -,095 km/h (segundos) Componentes principales - Ejemplo - III Año del modelo -,7,9,785,7,8,5 Número de cilindros,60,09,05 -,00 -,06,068 Matriz de componentes Método de extracción: Análisis de componentes principales. a 8 Consumo (l/00km) Cilindrada en cc Potencia (CV) Peso total (kg) Aceleración 0 a 00 km/h (segundos) Año del modelo Número de cilindros Bruta Componente 5 6,0,76 -,5 -,7,095,05 7,500-5,,7,00,00,000,5,0-6,596,75,6 -,07 6,9 98,75, -,008 -,06 -,00 Método de extracción: Análisis de componentes principales. -,507,676,5 -,8,659 -,095 -,7,9,785,7,8,5,60,09,05 -,00 -,06,068 Matriz de componentes a Reescalada Componente 5 6 Consumo (l/00km),87,89 -, -,9,0,0 Cilindrada en cc,000 -,009,000,000,000,000 Potencia (CV),899,060 -,,005,00 -,00 Peso total (kg),97,9,00,000,000,000 Aceleración 0 a 00 km/h (segundos) -,56,5,5 -,066,60 -,0 Año del modelo -,66,,,89,0, Número de cilindros,95,07,0 -,006 -,0,00 Método de extracción: Análisis de componentes principales. a. 6 componentes extraídos Matriz de componentes a Consumo (l/00km) Reescalada Componente 5 6,87,89 -, -,9,0,0
49 Propiedades de las componentes principales - I 9. Conservan la variabilidad inicial: la suma de las varianzas de las p componentes principales es igual a la de las p variables originales: p j= σ x j = p j= λ j = p j= σ z j.. La proporción de variabilidad explicada por una componente es igual al valor propio asociado dividido por la suma de los valores propios de S: var(σ z h ) = λ h p j= λ j.. Las covarianzas entre la componente principal z h y la variable x es: Cov(z h, x) = λ h a h, donde λ h es el h-ésimo valor propio de S y a h su vector propio asociado.
50 Propiedades de las componentes principales - II 50. La correlación entre la componente principal z h y la variable univariante x k es: Corr(z h, x k ) = λ ha kh λh s k = a kh λh s k. 5. La estandarización de las componentes principales, Z, permite obtener la estandarización multivariante de la matriz de datos, X: Z u = ZD / = XAD /, y recordamos que Y m = XAD / A. Por lo tanto, Z u y Y m son iguales salvo rotaciones.
51 Análisis normado de componentes principales Cómo es la primera componente de S = Respuesta: a = [ 0 0 ] ? 5 Problema: Una variable con mayor varianza que el resto de las variables tendrá asociada la primera componente principal. Ejemplo Solución: Obtener las componentes principales de la matriz de correlaciones. R = ,5 0 0,5 Cuyos valores y vectores propios son: λ =,5, a = [ 0 / / ], λ =,0, a = [ 0 0 ], λ = 0,5, a = [ 0 / / ].
52 Propiedades de las componentes principales - III 5 6. La proporción de variabilidad explicada por una componente normada zh R es: var(σ λ R h z h R ) = p = λr h j= λr j p, donde λ R h es el h-ésimo valor propio de la matriz R. 7. Las covarianzas entre la componente principal normada zh R vectorial y u (estandarización univariante de x) es: y la variable Cov(z R h, y u ) = λ R h a R h, donde λ R h es el h-ésimo valor propio de R y ar h su vector propio asociado. 8. La correlación entre la componente principal zh R y la variable univariante y k (estandarización univariante de x k ) es: Corr(zh R, y k ) = a R kh λ R h.
53 Componentes principales normadas - Ejemplo- I 5 Observación: En general, los valores y vectores propios de S y de R no coinciden. Esto hace que los resultados del análisis de componentes principales y de componentes principales normadas sean, en general, diferentes. Ejemplo 0. Obtenemos [ los valores ] y vectores propios de la matriz de correlaciones, R = :,000 0,6 0,6,000 λ R =,60, a R = [ 0,707 0,707 ] [, y λ R = 0,590, a R = 0,707 0,707 ]. Entonces, las componentes principales son: { z R = 0,707 y + 0,707 y, z R = 0,707 y 0,707 y. En este caso los vectores propios de S y R coinciden.
54 Componentes principales normadas - Ejemplo - II 5 Ejemplo 0. Resultados utilizando SPSS: Matriz de componentes Componente BASE ALTURA,855,59,855 -,59 a = λ b =,60 [ 0,855 0,855 ] [ 0,707 0,707 ] Componentes: [ a = λ b = 0,59 0,59 0,59 ] [ 0,7069 0,7069 ]
55 Componentes principales normadas - Ejemplo - III 55 Matriz de componentes a Consumo (l/00km) Cilindrada en cc Potencia (CV) Peso total (kg) Aceleración 0 a 00 km/h (segundos) Componente 5 6,96 -,088,95,86 -,98,06,96,6,075 -,5,05 -,07,95,0 -,50,8,87,,98,,05,09,0 -,7 -,68,0,77,08,07,05 Año del modelo -,99,85 -,7,06 -,07,0 Número de cilindros,9,8,0 -,6 -,05,07 Método de extracción: Análisis de componentes principales. a. 6 componentes extraídos
56 Criterios de reducción de la dimensión 56 Gráfico de sedimentación o de codo : Obtener el gráfico de los valores propios, λ i, frente a i. Buscar un codo en el gráfico, i.e., un punto a partir del cual los valores propios son aproximadamente iguales. Criterio de la varianza explicada: Seleccionar el número de componentes necesario para explicar una proporción predeterminada de la varianza, por ejemplo, el 80 % o el 90 %. Criterio del valor propio: Seleccionar los componentes principales asociados a valores propios superiores a un valor prefijado, por ejemplo, la varianza media: p j= λ j/p p j= λr j /p = en componentes principales, en componentes principales normadas.
57 Reducción de la dimensión - Ejemplo - I 57 Ejemplo. Análisis de componentes principales normadas. El criterio de la variabilidad explicada (> 90 %) sugiere utilizar una componente. El criterio del valor propio (> ) sugiere utilizar una componente. Componente Total Autovalores iniciales % de la varianza % acumulado 0,6 9,87 9,87,8,80 97,5,,08 98,90 6,90E-0,590 98,980,0E-0,75 99,55,90E-0,55 99,7,965E-0,79 99,889 7,55E-0 6,8E-0 99,958,06E-0,005E-0 99,988,05E-0 9,556E-0 99,997,090E-0,809E-0 00,000
58 Reducción de la dimensión - Ejemplo - II 58 Ejemplo Autovalor Número de componente El criterio del gráfico de sedimentación sugiere utilizar una componente.
59 Reducción de la dimensión - Ejemplo - III 59 Ejemplo. Análisis de componentes principales. Varianza total explicada Componente Autovalores iniciales % de la % de la Total varianza % acumulado Total varianza % acumulado 005,5 99,66 99,66 005,5 99,66 99,66 995,69,9 99,990 78,68,009 99,999,078,000 00,000,798 9,6E-05 00,000,69 5,6E-05 00,000,68 8,878E-06 00,000 Método de extracción: Análisis de Componentes principales. Sumas de las saturaciones al cuadrado de la extracción
60 Reducción de la dimensión - Ejemplo - IV 60 Ejemplo. Análisis de componentes principales normadas. Varianza total explicada Componente Autovalores iniciales % de la % de la Total varianza % acumulado Total varianza % acumulado 5, 7,0 7,0 5, 7,0 7,0,85,68 85,9,706 0,085 95,76,5,58 97,,088,6 98,698,057,8 99,5,0,89 00,000 Método de extracción: Análisis de Componentes principales. Sumas de las saturaciones al cuadrado de la extracción
61 Reducción de la dimensión - Ejemplo - V 6 Ejemplo. Análisis de componentes principales normadas. Gráfico de sedimentación 6 5 Autovalor Número de componente
62 Interpretación de las componentes - Ejemplo - I 6 Ejemplo 0. Las componentes principales: { z = 0,707 x + 0,707 x, z = 0,707 x 0,707 x. La primera componente, que explica el 7.0 % de la variabilidad total, asigna igual peso a las variables base y altura, x y x. Si re escribimos esta componente como: z = 0,707 (x + x ) podemos interpretarla como una ponderación del perímetro del rectángulo. Si ordenamos los datos según esa componente. obtenemos: Es decir, los rectángulos quedan ordenados según su tamaño.
63 Interpretación de las componentes - Ejemplo- II 6 Ejemplo 0. Las componentes principales: { z = 0,707 x + 0,707 x, z = 0,707 x 0,707 x. La segunda componente, que explica el 6.97 % de la variabilidad total, asigna igual peso a la base y la altura pero con signo diferente. Así, por ejemplo, un valor de z positivo corresponderá a un rectángulo con más base que altura. Si ordenamos los datos según esa componente, obtenemos: Es decir, los rectángulos quedan ordenados según su forma.
64 Interpretación de las componentes - Casos Particulares - I Componentes principales de una matriz diagonal: Σ = Entonces, los pares valor vector propio son: 0 σ y a = 0., σ y a =. 0 0,, σ p y a p = σ σ σ p Las componentes principales en matrices diagonales son las variables originales. En una matriz de covarianzas no necesariamente diagonal, si existe una variable, x k, incorrelada con el resto de las variables, entonces habrá una componente principal que dará peso a la variable x k y 0 al resto. 6.
65 65 Interpretación de las componentes - Casos Particulares - II Componentes principales de una matriz equicorrelada: R = ρ ρ ρ ρ ρ ρ Entonces, los pares de valor vector propio son: λ = + (p )ρ a = λ = ρ a = λ = ρ a =.. λ p = ρ a p = [ [ [ p, p, p,,,, p,...,, ], p ], 0, 0,..., 0, 0,..., 0 [ ],,,,..., (p ). (p )p (p )p (p )p (p )p (p )p ],
66 66 Interpretación de las componentes - Casos Particulares - III Componentes principales de una matriz equicorrelada: Si ρ > 0, entonces el mayor valor propio es λ = + (p )ρ y su vector propio asociado a define una componente principal que asigna igual peso a todas las variables: z = p p j= x j. Si ρ > 0, entonces la primera componente principal explica una proporción +(p )ρ p = ρ + ρ p. Por ejemplo, si ρ = 0,9 y p = 0, entonces la primera componente explica el 90.0 % de la variabilidad total. Si ρ es cercano a, entonces las restantes p componentes, explican una pequeña proporción de la variabilidad total.
67 Interpretación de las componentes - Ejemplo - I 67 Ejemplo. La matriz de correlaciones de este ejemplo es aproximadamente equicorrelada: CL CW SW SL DCL OW OIW OL LCR WCR WN CL CW SW SL DCL OW OIW OL LCR WCR WN,000,99,976,997,999,8,96,99,96,98,900,99,000,987,986,989,80,965,9,968,99,9,976,987,000,969,97,859,95,950,956,985,9,997,986,969,000,998,796,958,97,958,978,890,999,989,97,998,000,8,96,90,96,98,900,8,80,859,796,8,000,766,906,858,86,89,96,965,95,958,96,766,000,895,9,958,8,99,9,950,97,90,906,895,000,9,95,95,96,968,956,958,96,858,9,9,000,97,886,98,99,985,978,98,86,958,95,97,000,908,900,9,9,890,900,89,8,95,886,908,000
68 Interpretación de las componentes - Ejemplo - II 68 Ejemplo. Matriz de componentes La primera componente principal estará definida por un vector aproximadamente [ igual a a =,,..., ]. Recordemos que en SPSS aparece λ a, por tanto los coeficientes serán aproximadamente iguales a 0,969. 0,6 CL CW SW SL DCL OW OIW OL LCR WCR WN Componente,989,99,99,98,988,88,957,96,975,99,90
69 Interpretación de las componentes - Ejemplo - III 69 Ejemplo. Diagrama de caja de la primera componente. 0 ot6 ot5 - am - N = Alligator_mississipp Crocodylus_porosus Crocodylus_niloticus Osteolaemus_tetraspi
70 70 Interpretación de las componentes - Ejemplo - IV Ejemplo. Matriz de diagramas de dispersión de las tres primeras CP. CP CP CP
71 Interpretación de las componentes - Ejemplo - V 7 Ejemplo. Análisis de componentes principales normadas. Matriz de componentes a Consumo (l/00km) Cilindrada en cc Potencia (CV) Peso total (kg) Aceleración 0 a 00 km/h (segundos) Componente,96 -,088,95,96,6,075,95,0 -,50,98,,05 -,68,0,77 Año del modelo -,99,85 -,7 Número de cilindros,9,8,0 Método de extracción: Análisis de componentes principales. a. componentes extraídos
72 Interpretación de las componentes - Ejemplo - VI 7 Ejemplo. Análisis de componentes principales normadas. CP CP País de origen CP Japón Europa EE.UU.
73 Interpretación de las componentes - Ejemplo - VII 7 Ejemplo 5. Esclerosis múltiple. Autovalores iniciales Matriz de componentes Componente Total % de la varianza % acumulado,97 58, 58,,7,5 8,876,70,056 96,9 9,095E-0,89 98,75 EDAD RSUMA RDIF RSUMA Componente,99,7,878,6,86 -,,85,6 5 6,5E-0,9 00,000 RDIF,766 -,55 La primera componente da mayor peso a las variables relacionadas con las respuestas a estímulos visuales, y menor peso a la edad. La segunda componente da mayor peso a la edad, y por otra parte contrapone las variables de tipo respuesta conjunta y respuesta diferencial.
74 Interpretación de las componentes - Ejemplo - VIIII 7 Ejemplo 5. Esclerosis múltiple. 6 5 REGR factor score for analysis REGR factor score for analysis
75 Ejemplo con gráficos de control - I 75 Ejemplo. Seis tipos de escenarios. Varianza total explicada Componente : 60 Autovalores iniciales % de la % de la Total varianza % acumulado Total varianza % acumulado,79 5,65 5,65,79 5,65 5,65 5,90 9,88 6,8 5,90 9,88 6,8,8 6,97 69,,8 6,97 69,,989, 7,66,989, 7,66,86,077 75,7,86,077 75,7,5,090 77,80,5,090 77,80,0,685 79,88,0,685 79,88,957,595 8,08,76,6 8,09,75,9 8,50 : : :,05,076 99,79 Método de extracción: Análisis de Componentes principales. Sumas de las saturaciones al cuadrado de la extracción
76 Ejemplo con gráficos de control - II 76 Ejemplo. (AF) Componentes principales normadas. CP CP Tend.Decreciente Tend. Creciente Normal CP Esc.Positivo Esc. Negativo Ciclico
77 Ejemplo con gráficos de control - III 77 Ejemplo. (AF) Componentes principales normadas rotadas. CP (r) CP (r) Tend. Decreciente Tend. Creciente Normal CP (r) Esc. Positivo Esc. Negativo Ciclico
78 Ejemplo con gráficos de control - IV 78 Ejemplo. Interpretación de las CP - factores.,5,0,5 0,0 -,5 Coef. CP (r) Coef. CP (r) -,0 Coef. CP (r) Variable
79 Lecturas recomendadas 79 Análisis descriptivo: Capítulo de Baillo y Grané (007); Capítulo de Cuadras (00); Capítulo de Johnson y Wichern (00); Capítulos y de Peña (00); Análisis de componentes principales: Capítulo de Baillo y Grané (007); Capítulo 5 de Cuadras (00); Capítulo 8 de Johnson y Wichern (00); Capítulo de McGarigal et al (000); Capítulo 5 de Peña (00); Capítulo 7 de Selvin (995). Baillo, A. y Grané, A. (007) 00 problemas resueltos de estadística multivariante (Implementados en Matlab), Delta Publicaciones. Cuadras, C. (00) Análisis multivariante, Universidad de Barcelona. Johnson, R.A. y Wichern, W.A. (00) Applied multivariate statistical analysis, Prentice Hall. McGarigal, K., Cushman, S. y Stafford, S. (000) Multivariate analysis for wildlife and ecology research, Springer. Peña, D. (00) Análisis de datos multivariantes, McGraw Hill. Selvin, S. (995) Practical biostatistical methods, Duxbury Press.
80
Wenceslao González Manteiga.
ANÁLISIS MULTIVARIANTE Wenceslao.gonzalez@usc.es ÍNDICE 0. MOTIVACIÓN HISTÓRICA 1. ANÁLISIS EXPLORATORIO DE DATOS 2. REVISIÓN DE LAS DISTRIBUCIONES NOTABLES MULTIDIMENSIONALES RELACIONADAS CON LA NORMAL
Más detallesTema 2 Datos multivariantes
Aurea Grané Máster en Estadística Universidade Pedagógica 1 Aurea Grané Máster en Estadística Universidade Pedagógica 2 Tema 2 Datos multivariantes 1 Matrices de datos 2 Datos multivariantes 2 Medias,
Más detallesCapítulo 8. Análisis Discriminante
Capítulo 8 Análisis Discriminante Técnica de clasificación donde el objetivo es obtener una función capaz de clasificar a un nuevo individuo a partir del conocimiento de los valores de ciertas variables
Más detallesTema 3: Análisis de datos bivariantes
Tema 3: Análisis de datos bivariantes 1 Contenidos 3.1 Tablas de doble entrada. Datos bivariantes. Estructura de la tabla de doble entrada. Distribuciones de frecuencias marginales. Distribución conjunta
Más detallesRepaso de conceptos de álgebra lineal
MÉTODOS AVANZADOS EN APRENDIZAJE ARTIFICIAL: TEORÍA Y APLICACIONES A PROBLEMAS DE PREDICCIÓN Manuel Sánchez-Montañés Luis Lago Ana González Escuela Politécnica Superior Universidad Autónoma de Madrid Repaso
Más detallesTeoría de la decisión
1.- Un problema estadístico típico es reflejar la relación entre dos variables, a partir de una serie de Observaciones: Por ejemplo: * peso adulto altura / peso adulto k*altura * relación de la circunferencia
Más detalles15. Regresión lineal. Te recomiendo visitar su página de apuntes y vídeos:
15. Regresión lineal Este tema, prácticamente íntegro, está calacado de los excelentes apuntes y transparencias de Bioestadística del profesor F.J. Barón López de la Universidad de Málaga. Te recomiendo
Más detallesAPÉNDICE A. Algebra matricial
APÉNDICE A Algebra matricial El estudio de la econometría requiere cierta familiaridad con el álgebra matricial. La teoría de matrices simplifica la descripción, desarrollo y aplicación de los métodos
Más detallesEsta expresión polinómica puede expresarse como una expresión matricial de la forma; a 11 a 12 a 1n x 1 x 2 q(x 1, x 2,, x n ) = (x 1, x 2,, x n )
Tema 3 Formas cuadráticas. 3.1. Definición y expresión matricial Definición 3.1.1. Una forma cuadrática sobre R es una aplicación q : R n R que a cada vector x = (x 1, x 2,, x n ) R n le hace corresponder
Más detallesEjemplos y ejercicios de. Estadística Descriptiva. yanálisis de Datos. 2 Descripción estadística de una variable. Ejemplos y ejercicios.
ESTADÍSTICA DESCRIPTIVA Y ANÁLISIS DE DATOS Ejemplos y ejercicios de Estadística Descriptiva yanálisis de Datos Diplomatura en Estadística Curso 007/08 Descripción estadística de una variable. Ejemplos
Más detallesTema 2 Estadística Descriptiva
Estadística Descriptiva 1 Tipo de Variables 2 Tipo de variables La base de datos anterior contiene la información de 36 alumnos de un curso de Estadística de la Universidad de Talca. En esta base de datos
Más detalles3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS
1. INTRODUCCIÓN Este tema se centra en el estudio conjunto de dos variables. Dos variables cualitativas - Tabla de datos - Tabla de contingencia - Diagrama de barras - Tabla de diferencias entre frecuencias
Más detallesUNIVERSIDAD AUTÓNOMA DEL ESTADO DE MÉXICO
UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MÉXICO CENTRO UNIVERSITARIO UAEM ZUMPANGO LICENCIATURA EN TURISMO UNIDAD DE APRENDIZAJE: ESTADISTICA TEMA 1.5 : ESTADISTICA DESCRIPTIVA M. EN C. LUIS ENRIQUE KU MOO FECHA:
Más detallesINTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 7)
TEMA Nº 7 DISTRIBUCIONES CONTINUAS DE PROBABILIDAD OBJETIVOS DE APRENDIZAJE: Conocer las características de la distribución normal como distribución de probabilidad de una variable y la aproximación de
Más detallesTécnicas de Investigación Social
Licenciatura en Sociología Curso 2006/07 Técnicas de Investigación Social Medir la realidad social (4) La regresión (relación entre variables) El término REGRESIÓN fue introducido por GALTON en su libro
Más detallesEstadística Inferencial. Estadística Descriptiva
INTRODUCCIÓN Estadística: Ciencia que trata sobre la teoría y aplicación de métodos para coleccionar, representar, resumir y analizar datos, así como realizar inferencias a partir de ellos. Recogida y
Más detalles1. Cómo introducir datos en SPSS/PC? - Recordatorio
1 Taller de Estadística Curso 2oo5/2oo6 Descripción de datos bivariantes El objetivo de esta práctica es familiarizarse con las técnicas de descripción de datos bidimensionales y con algunas de las opciones
Más detallesFLORIDA Secundaria. 1º BACH MATEMÁTICAS CCSS -1- BLOQUE ESTADÍSTICA: ESTADÍSTICA VARIABLE UNIDIMENSIONAL. Estadística variable unidimensional
FLORIDA Secundaria. 1º BACH MATEMÁTICAS CCSS -1- Estadística variable unidimensional 1. Conceptos de Estadística 2. Distribución de frecuencias 2.1. Tablas de valores con variables continuas 3. Parámetros
Más detallesESTADÍSTICA CON EXCEL
ESTADÍSTICA CON EXCEL 1. INTRODUCCIÓN La estadística es la rama de las matemáticas que se dedica al análisis e interpretación de series de datos, generando unos resultados que se utilizan básicamente en
Más detallesBioestadística. Tema 3: Estadística descriptiva bivariante y regresión lineal. Relaciones entre variables y regresión
Bioestadística Tema 3: Estadística descriptiva bivariante y regresión lineal. Tema 3: Estadística bivariante 1 Relaciones entre variables y regresión El término regresión fue introducido por Galton en
Más detallesMatrices. Álgebra de matrices.
Matrices. Álgebra de matrices. 1. Definiciones generales Definición 1.1 Si m y n son dos números naturales, se llama matriz de números reales de orden m n a una aplicación A : {1, 2, 3,..., m} {1, 2, 3,...,
Más detallesPREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2
PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2 Preg. 1. Para comparar la variabilidad relativa de la tensión arterial diastólica y el nivel de colesterol en sangre de una serie de individuos, utilizamos
Más detallesFundamentos de Estadística y Simulación Básica
Fundamentos de Estadística y Simulación Básica TEMA 2 Estadística Descriptiva Clasificación de Variables Escalas de Medición Gráficos Tabla de frecuencias Medidas de Tendencia Central Medidas de Dispersión
Más detallesANÁLISIS DE DATOS. L.A. y M.C.E. Emma Linda Diez Knoth
ANÁLISIS DE DATOS 1 Tipos de Análisis en función de la Naturaleza de los Datos Datos cuantitativos Datos cualitativos Análisis cuantitativos Análisis cuantitativos de datos cuantitativos (Estadística)
Más detallesVARIABLES ESTADÍSTICAS BIDIMENSIONALES
VARIABLES ESTADÍSTICAS BIDIMENSIONALES 1.- En una variable estadística bidimensional, el diagrama de dispersión representa: a) la nube de puntos. b) las varianzas de las dos variables. c) los coeficientes
Más detalles1, 2, 2, 3, 1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 2, 1, 1, 4, 1
8 Estadística 81 Distribuciones unidimensionales Tablas de frecuencias En este tema nos ocuparemos del tratamiento de datos estadísticos uestro objeto de estudio será pues el valor de una cierta variable
Más detallesANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada.
ANEXO 1. CONCEPTOS BÁSICOS Este anexo contiene información que complementa el entendimiento de la tesis presentada. Aquí se exponen técnicas de cálculo que son utilizados en los procedimientos de los modelos
Más detallesRepaso Estadística Descriptiva
Grado en Fisioterapia, 2010/11 Cátedra de Bioestadística Universidad de Extremadura 13 de octubre de 2010 Índice Descriptiva de una variable 1 Descriptiva de una variable 2 Índice Descriptiva de una variable
Más detallesExpresión decimal. Aproximación y estimación. Notación científica. Polinomios. Divisibilidad de polinomios. Regla de Ruffini.
Otras páginas Matemáticas 5º Matemáticas I. Bloque I: ARITMÉTICA Y ÁLGEBRA Los números reales Los números reales, concepto y características. Estructura algebraica, orden, representación en la recta real
Más detallesAnálisis de componentes principales. a.k.a.: PCA Principal components analysis
Análisis de componentes principales a.k.a.: PCA Principal components analysis 1 Outline Motivación Derivación Ejemplos 2 Motivación general Tenemos un dataset X con n datos y p dimensiones, centrado (medias
Más detallesMódulo de Estadística
Módulo de Estadística Tema 2: Estadística descriptiva Tema 2: Estadísticos 1 Medidas La finalidad de las medidas de posición o tendencia central (centralización) es encontrar unos valores que sinteticen
Más detalles1. (F, +) es un grupo abeliano, denominado el grupo aditivo del campo.
Capítulo 5 Campos finitos 5.1. Introducción Presentaremos algunos conceptos básicos de la teoría de los campos finitos. Para mayor información, consultar el texto de McEliece [61] o el de Lidl y Niederreiter
Más detalles1. Matrices. Operaciones con matrices
REPASO MUY BÁSICO DE MATRICES. Matrices. Operaciones con matrices.. Introducción Las matrices aparecieron por primera vez hacia el año 850, introducidas por el inglés J. J. Sylvester. Su desarrollo se
Más detallesCurso de Estadística Aplicada a las Ciencias Sociales
Curso de Estadística Aplicada a las Ciencias Sociales Tema 6. Descripción numérica (2) Capítulo 5 del manual Tema 6 Descripción numérica (2) Introducción 1. La mediana 2. Los cuartiles 3. El rango y el
Más detallesLa práctica del análisis de correspondencias
La práctica del análisis de correspondencias MICHAEL GREENACRE Catedrático de Estadística en la Universidad Pompeu Fabra Separata del capítulo 11 Contribuciones a la inercia Primera edición: julio 2008
Más detallesFase 2. Estudio de mercado: ESTADÍSTICA
1. CONCEPTO DE ESTADÍSTICA. ESTADÍSTICA DESCRIPTIVA 2. 3. TABLA DE FRECUENCIAS 4. REPRESENTACIONES GRÁFICAS 5. TIPOS DE MEDIDAS: A. MEDIDAS DE POSICIÓN B. MEDIDAS DE DISPERSIÓN C. MEDIDAS DE FORMA 1 1.
Más detallesObjetivo. variables factores F Principios básicos. Parsimonia Interpretabilidad
ANÁLISIS FACTORIAL 1. Introducción 2. Examen de la matriz de correlación 3. Extracción de los factores 4. Rotación de los factores 5. Puntuaciones factoriales 6. Caso práctico Introducció Objetivo. Resumir
Más detallesEl Análisis de Correspondencias tiene dos objetivos básicos:
Tema 8 Análisis de correspondencias El Análisis de Correspondencias es una técnica de reducción de dimensión y elaboración de mapas percentuales. Los mapas percentuales se basan en la asociación entre
Más detallesMatrices 2º curso de Bachillerato Ciencias y tecnología
MATRICES Índice:. Introducción-------------------------------------------------------------------------------------- 2. Definición de matriz-----------------------------------------------------------------------------
Más detallesAnálisis de Componentes Principales
Diplomatura en Estadística 1 Diplomatura en Estadística 2 Análisis de Componentes Principales Se han observado p variables X 1,X 2,...,X p sobre una muestra de n individuos. La matriz de datos muestrales
Más detallesESTADÍSTICA. Tema 4 Regresión lineal simple
ESTADÍSTICA Grado en CC. de la Alimentación Tema 4 Regresión lineal simple Estadística (Alimentación). Profesora: Amparo Baíllo Tema 4: Regresión lineal simple 1 Estructura de este tema Planteamiento del
Más detalles3. CORRELACIÓN Y REGRE-
3. CORRELACIÓN Y REGRE- SIÓN Objetivo Medir y ajustar una relación lineal entre dos variables cuantitativas. Bibliografia recomendada Peña y Romo (1997), Capítulos 8 y 9. Índice 1. Covarianza y sus propiedades
Más detallesTema 2: Estadística Descriptiva Multivariante
Tema 2: Estadística Descriptiva Multivariante Datos multivariantes: estructura y notación Se llama población a un conjunto de elementos bien definidos. Por ejemplo, la población de las empresas de un país,
Más detalles2. Formas cuadráticas. Expresiones diagonales. Clasificación respecto a su signo.
2. Formas cuadráticas. Expresiones diagonales. Clasificación respecto a su signo. 2.1 Formas cuadráticas. Expresión matricial y analítica. Expresiones diagonales. Definición 2.1 (Expresión matricial) Una
Más detallesEstadística Descriptiva II: Relación entre variables
Estadística Descriptiva II: Relación entre variables Iniciación a la Investigación Ciencias de la Salud MUI Ciencias de la Salud, UEx 25 de octubre de 2010 De qué trata? Descripción conjunto concreto de
Más detallesY accedemos al cuadro de diálogo Descriptivos
SPSS: DESCRIPTIVOS PROCEDIMIENTO DE ANÁLISIS INICIAL DE DATOS: DESCRIPTIVOS A diferencia con el procedimiento Frecuencias, que contiene opciones para describir tanto variables categóricas como cuantitativas
Más detallesMEDIDAS DE RESUMEN: MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN. Lic. Esperanza García Cribilleros
MEDIDAS DE RESUMEN: MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN Lic. Esperanza García Cribilleros ANÁLISIS EXPLORATORIO DE DATOS Diagrama de tallo y hojas Diagrama de caja DESCRIPCIÓN N DE LOS DATOS Tablas
Más detallesALN. Repaso matrices. In. Co. Facultad de Ingeniería Universidad de la República
ALN Repaso matrices In. Co. Facultad de Ingeniería Universidad de la República Definiciones básicas - Vectores Definiciones básicas - Vectores Construcciones Producto interno: ( x, y n i x y i i ' α Producto
Más detallesMEDIDAS DE TENDENCIA CENTRAL
UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS (Universidad del Perú, DECANA DE AMERICA) MEDIDAS DE TENDENCIA CENTRAL 20/05/2008 Ing. SEMS 2.1 INTRODUCCIÓN En el capítulo anterior estudiamos de qué manera los
Más detallesUNIDAD DE APRENDIZAJE VI
UNIDAD DE APRENDIZAJE VI Saberes procedimentales 1. Interpreta y utiliza correctamente el lenguaje simbólico para el manejo de expresiones algebraicas. 2. Relaciona la ecuación algebraica de segundo grado
Más detallesCORRELACIÓN Y REGRESIÓN. Raúl David Katz
CORRELACIÓN Y REGRESIÓN Raúl David Katz 1 Correlación y regresión Introducción Hasta ahora hemos visto el modo de representar la distribución de frecuencias de los datos correspondientes a una variable
Más detallesConjuntos de Vectores y Matrices Ortogonales
Conjuntos de Vectores y Matrices Ortogonales Departamento de Matemáticas, CCIR/ITESM 28 de junio de 2011 Índice 21.1.Introducción............................................... 1 21.2.Producto interno............................................
Más detallesMedidas de posición relativa
Medidas de posición relativa Copyright 2010, 2007, 2004 Pearson Education, Inc. All Rights Reserved. 3.1-1 Medidas de posición relativa Son medidas que pueden utilizarse para comparar valores de diferentes
Más detallesProbabilidad y Estadística, EIC 311
Probabilidad y Estadística, EIC 311 Medida de resumen 1er Semestre 2016 1 / 105 , mediana y moda para datos no Una medida muy útil es la media aritmética de la muestra = Promedio. 2 / 105 , mediana y moda
Más detallesRESUMEN DE LOS ALGORITMOS.
RESUMEN DE LOS ALGORITMOS. 1.- REDUCCIONES DE ÓRDENES. Caso (1): () = (,, ) DEPENDE DE SOLO VARIABLE INDEPENDIENTE. = () = (). Caso (): (, ) = (,, ) DEPENDE DE DERIVADA DE y Y VARIABLE INDEPENDIENTE. CAMBIO
Más detallesNota técnica Estratificación multivariada
Instituto Nacional de Estadística y Geografía Nota técnica Estratificación multivariada Censo de Población y Vivienda 2010 NOTA TÉCNICA ESTRATIFICACIÓN MULTIVARIADA Con la finalidad de que el usuario pueda
Más detallesTema: ESTADÍSTICA DESCRIPTIVA BÁSICA CON SPSS 8.0
Ignacio Martín Tamayo 11 Tema: ESTADÍSTICA DESCRIPTIVA BÁSICA CON SPSS 8.0 ÍNDICE ------------------------------------------------------------- 1. Introducción 2. Frecuencias 3. Descriptivos 4. Explorar
Más detallesPRUEBA DE HIPÓTESIS BENJAMIN MAMANI CONDORI
PRUEBA DE HIPÓTESIS BENJAMIN MAMANI CONDORI 2014 Para qué es útil la estadística inferencial? Se utiliza para probar hipótesis y generalizar los resultados obtenidos en la muestra a la población o universo.
Más detallesJesús Eduardo Pulido Guatire, marzo Diagrama de Dispersión y Correlación Lineal Simple
Jesús Eduardo Pulido Guatire, marzo 0 Diagrama de Dispersión y Correlación Lineal Simple Hasta el momento el trabajo lo hemos centrado en resumir las características de una variable mediante la organización
Más detallesAnálisis de correspondencias
Análisis de correspondencias utilizando el SPSS Vamos a realizar el Análisis de correspondencias sobre el mismo ejemplo (ejemplo 6.1 de los apuntes), sobre el que ya se obtuvo el análisis mediante el R,
Más detallesSemana 14 [1/28] Matrices. 22 de julio de Matrices
Semana 14 [1/28] 22 de julio de 2007 Definiciones básicas Semana 14 [2/28] Definiciones básicas Matriz Una matriz A, de m filas y n columnas con coeficientes en el cuerpo à (en este apunte à será Ê ó C)
Más detallesUNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS FACULTAD DE INGENIERÍA PROYECTO CURRICULAR DE INGENIERÍA DE SISTEMAS
I. IDENTIFICACIÓN DE LA ASIGNATURA ESTADÍSTICA I CÓDIGO DE LA ASIGNATURA 33102106 ÁREA CIENCIAS BASICAS DE INGENIERIA SEMESTRE SEGUNDO PLAN DE ESTUDIOS 1996 AJUSTE 2002 HORAS TOTALES POR SEMESTRE 64 HORAS
Más detallesEste programa estadístico está organizado en dos bloques: el editor de datos y el visor de resultados.
Bases de Estadística Licenciatura en Ciencias Ambientales Curso 2oo3/2oo4 Introducción al SPSS/PC Este programa estadístico está organizado en dos bloques: el editor de datos y el visor de resultados.
Más detallesClase No. 13: Factorización QR MAT 251. Joaquín Peña (CIMAT) Métodos Numéricos (MAT 251) / 16
Clase No 13: Factorización QR MAT 251 Joaquín Peña (CIMAT) Métodos Numéricos (MAT 251) 03102011 1 / 16 Factorización QR Sea A R m n con m n La factorización QR de A es A = QR = [Q 1 Q 2 ] R1 = Q 0 1 R
Más detallesADMINISTRACION DE OPERACIONES
Sesión4: Métodos cuantitativos ADMINISTRACION DE OPERACIONES Objetivo específico 1: El alumno conocerá y aplicara adecuadamente los métodos de pronóstico de la demanda para planear la actividad futura
Más detallesAlgunos Tipos de matrices. Matrices. Algunos Tipos de matrices. Algunos Tipos de matrices
Matrices Una matriz de orden m n es un conjunto ordenado de m n números reales dispuestos en m filas y n columnas de la forma: A = a 11 a 12 a 1j a 1n a 21 a 22 a 2j a 2n a i1 a i2 a ij a in a m1 a m2
Más detallesTema Contenido Contenidos Mínimos
1 Estadística unidimensional - Variable estadística. - Tipos de variables estadísticas: cualitativas, cuantitativas discretas y cuantitativas continuas. - Variable cualitativa. Distribución de frecuencias.
Más detallesDescomposición en forma canónica de Jordan (Segunda versión)
Descomposición en forma canónica de Jordan (Segunda versión) Francisco J. Bravo S. 1 de septiembre de 211 En esta guía se presentan los resultados necesarios para poder construir la forma de Jordan sin
Más detallesDistribuciones bidimensionales. Correlación.
Temas de Estadística Práctica Antonio Roldán Martínez Proyecto http://www.hojamat.es/ Tema 4: Distribuciones bidimensionales. Correlación. Resumen teórico Resumen teórico de los principales conceptos estadísticos
Más detallesESTADÍSTICA DESCRIPTIVA
ESTADÍSTICA DESCRIPTIVA Medidas de tendencia central y de dispersión Giorgina Piani Zuleika Ferre 1. Tendencia Central Son un conjunto de medidas estadísticas que determinan un único valor que define el
Más detallesUna forma fácil de recordar esta suma (regla de Sarrus): Primero vamos a estudiar algunas propiedades de los determinantes.
Una forma fácil de recordar esta suma (regla de Sarrus): Ejemplos: Tarea: realizar al menos tres ejercicios de cálculo de determinantes de matrices de 2x2 y otros tres de 3x3. PARA DETERMINANTES DE MATRICES
Más detallesEl ejemplo: Una encuesta de opinión
El ejemplo: Una encuesta de opinión Objetivos Lo más importante a la hora de planificar una encuesta es fijar los objetivos que queremos lograr. Se tiene un cuestionario ya diseñado y se desean analizar
Más detallesTema 2: Estadística Descriptiva Bivariante.
Estadística 24 Tema 2: Estadística Descriptiva Bivariante. Se va a estudiar la situación en la que los datos representan observaciones, correspondientes a dos variables o caracteres, efectuadas en los
Más detallesLa práctica del análisis de correspondencias
La práctica del análisis de correspondencias MICHAEL GREENACRE Catedrático de Estadística en la Universidad Pompeu Fabra Separata del apéndice D Glosario de términos Primera edición: julio 2008 ISBN: 978-84-96515-71-0
Más detallesOPTIMIZACIÓN Y SIMULACIÓN PARA LA EMPRESA. Tema 4 Optimización no Lineal
OPTIMIZACIÓN Y SIMULACIÓN PARA LA EMPRESA Tema 4 Optimización no Lineal ORGANIZACIÓN DEL TEMA Sesiones: El caso sin restricciones: formulación, ejemplos Condiciones de optimalidad, métodos Caso con restricciones:
Más detallesCONTENIDOS MÍNIMOS SEPTIEMBRE. DEPARTAMENTO DE MATEMÁTICAS
CONTENIDOS MÍNIMOS SEPTIEMBRE. DEPARTAMENTO DE MATEMÁTICAS CONTENIDOS MÍNIMOS MATEMÁTICAS 1º ESO U.D. 1 Números Naturales El conjunto de los números naturales. Sistema de numeración decimal. Aproximaciones
Más detallesCapítulo 2. Presentación, organización y descripción de datos. Continuar
Capítulo 2 Presentación, organización y descripción de datos Continuar Introducción Una vez que se han coleccionado los datos, se les debe dar una mirada general para obtener una percepción de sus características
Más detallesEstadísticas Elemental Tema 3: Describir la relación entre dos variables: Correlación y regresión 3.1-1
Estadísticas Elemental Tema 3: Describir la relación entre dos variables: Correlación y regresión 3.1-1 Relación entre dos variables Al estudiar conjuntos de variables con más de una variable, una pregunta
Más detallesTema 1. 1 Álgebra lineal. Aurea Grané Departamento de Estadística Universidad Carlos III de Madrid. 1.1 Vectores de R n. 1. Vectores. 2.
Aurea Grané. Máster en Estadística. Universidade Pedagógica. 1 Aurea Grané. Máster en Estadística. Universidade Pedagógica. 2 Tema 1 Álgebra lineal 1. Vectores 2. Matrices 1 Álgebra lineal Aurea Grané
Más detallesÁLGEBRA LINEAL II Algunas soluciones a la práctica 2.3
ÁLGEBRA LINEAL II Algunas soluciones a la práctica 2. Transformaciones ortogonales (Curso 2010 2011) 1. Se considera el espacio vectorial euclídeo IR referido a una base ortonormal. Obtener la expresión
Más detallesUNIVERSIDADA NACIONAL DEL SANTA FACULTAD DE CIENCIAS DEPARTAMENTO DE MATEMÁTICAS
UNIVERSIDADA NACIONAL DEL SANTA FACULTAD DE CIENCIAS DEPARTAMENTO DE MATEMÁTICAS PINCIPALES FACTORES QUE INFLUYEN EN EL HOGAR, SEGÚN ENCUESTA ENAHO 2009. RESPONSABLE: LIC. LUIS ALFREDO PAJUELO GONZÁLES
Más detalles18 Experimentos aleatorios. Sucesos y espacio muestral. Frecuencia y probabilidad de un suceso.
PRIMER CURSO DE E.S.O Criterios de calificación: 80% exámenes, 10% actividades, 10% actitud y trabajo 1 Números naturales. 2 Potencias de exponente natural. Raíces cuadradas exactas. 3 Divisibilidad. Concepto
Más detallesAPLICACIONES DE LA DERIVADA. Cuando una función es derivable en un punto, podemos conocer si es creciente o decreciente
APLICACIONES DE LA DERIVADA.- BACHILLERATO.- TEORÍA Y EJERCICIOS. Pág. 1 Crecimiento y decrecimiento. APLICACIONES DE LA DERIVADA Cuando una función es derivable en un punto, podemos conocer si es creciente
Más detallesMétodo de cuadrados mínimos
REGRESIÓN LINEAL Gran parte del pronóstico estadístico del tiempo está basado en el procedimiento conocido como regresión lineal. Regresión lineal simple (RLS) Describe la relación lineal entre dos variables,
Más detallesEstadística Descriptiva
M. en C. Juan Carlos Gutiérrez Matus Instituto Politécnico Nacional 2004 IPN UPIICSA c 2004 Juan C. Gutiérrez Matus Desde la segunda mitad del siglo anterior, el milagro industrial sucedido en Japón, hizo
Más detallesIES Fco Ayala de Granada Sobrantes de 2011 (Modelo 4) Soluciones Germán-Jesús Rubio Luna
IES Fco Ayala de Granada Sobrantes de 011 (Modelo 4) Soluciones Germán-Jesús Rubio Luna Opción A Ejercicio 1 opción A, modelo 4 del 011 [ 5 puntos] Queremos hacer junto a la carretera un cercado rectangular
Más detallesAPLICACIONES DE LA DERIVADA
APLICACIONES DE LA DERIVADA Crecimiento y decrecimiento. Cuando una función es derivable en un punto, podemos conocer si es creciente o decreciente en dicho punto: Una función f() es creciente en un punto
Más detallesEstadística aplicada a la comunicación
Estadística aplicada a la comunicación Tema 5: Análisis de datos cuantitativos I: estadística descriptiva b. Análisis bivariante OpenCourseWare UPV/EHU Unai Martín Roncero Departamento de Sociología 2
Más detallesComo resultado de aprender adecuadamente los contenidos del curso el estudiante estará en capacidad de:
MATERIA: Cálculo de Varias Variables CÓDIGO: 08275 REQUISITOS: Cálculo de una Variable, Álgebra Lineal PROGRAMAS: Biología, Ingenierías, Química, Química Farmacéutica. PERÍODO ACADÉMICO: 2016-2 INTENSIDAD
Más detalles4. Medidas de dispersión
FUOC XP00/71004/00017 27 Medidas de dispersión 4. Medidas de dispersión Los cuartiles y la desviación estándar En el capítulo 3 hemos aprendido varias maneras de medir el centro de una distribución. Pero,
Más detallesESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA
ESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA Definición de Estadística: La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer
Más detalles6. PROGRAMACIÓN DEL CURSO 4º A DE E. S. O.
6. PROGRAMACIÓN DEL CURSO 4º A DE E. S. O. 6.1 OBJETIVOS GENERALES DEL CURSO Reconocer las diferentes clases de números, y operar correctamente con ellos. Aplicaciones aritméticas. Conocer y manejar la
Más detallesESTADISTICA Y PROBABILIDAD ESTADÍSTICA
ESTADÍSTICA La estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comprobaciones y sacar conclusiones. Un estudio estadístico consta
Más detalles1. Los números racionales. 2. Operaciones con racionales. 3. Clasificación de los decimales. 4. Irracionales. (representación, orden).
EJES ARTICULADORES Y PRODUCTIVOS DEL AREA SISTEMA DE CONOCIMIENTOS GRADO: 8 9 1. Los números racionales. 2. Operaciones con racionales. 3. Clasificación de los decimales. 1. Los números reales. 2. Notación
Más detallesMedidas de Tendencia Central
Medidas de Tendencia Central En cualquier análisis o interpretación, se pueden usar muchas medidas descriptivas que representan las propiedades de tendencia central, variación y forma para resumir las
Más detallesALGEBRA. Escuela Politécnica Superior de Málaga
ALGEBRA. Escuela Politécnica Superior de Málaga Tema 1. Espacios Vectoriales. Sistemas de ecuaciones. Espacio vectorial. Espacios vectoriales R n. Dependencia e independencia lineal. Base. Matrices y determinantes.
Más detallesDOCENTE: JESÚS E. BARRIOS P.
DOCENTE: JESÚS E. BARRIOS P. DEFINICIONES Es larga la historia del uso de las matrices para resolver ecuaciones lineales. Un texto matemático chino que proviene del año 300 A. C. a 200 A. C., Nueve capítulos
Más detallesUniversidad de Sonora Departamento de Matemáticas Área Económico Administrativa
Universidad de Sonora Departamento de Matemáticas Área Económico Administrativa Materia: Estadística I Maestro: Dr. Francisco Javier Tapia Moreno Semestre: 015- Hermosillo, Sonora, a 14 de septiembre de
Más detallesFormulación del problema de la ruta más corta en programación lineal
Formulación del problema de la ruta más corta en programación lineal En esta sección se describen dos formulaciones de programación lineal para el problema de la ruta más corta. Las formulaciones son generales,
Más detallesSe usa para encontrar un numero relativamente pequeño de variables nuevas que contengan la mayor cantidad de info posible del conjunto de datos
Analisis Estadístico de Datos Climáticos Análisis de componentes principales Analisis de componentes principales Se usa para encontrar un numero relativamente pequeño de variables nuevas que contengan
Más detalles