David R. González Barreto Universidad de Puerto Rico

Tamaño: px
Comenzar la demostración a partir de la página:

Download "David R. González Barreto Universidad de Puerto Rico"

Transcripción

1 David R. González Barreto Universidad de Puerto Rico

2 La habilidad de capturar datos hace tiempo le viene ganando la carrera a la habilidad de obtener información significativa de estos datos. Es necesario hacer uso de herramientas analíticas adecuadas que extraigan información sustantiva de grandes bases de datos. Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [2]

3 Existen muchas situaciones (típico de PAT) en donde es necesario la medición y/o monitoreo simultáneo de múltiples variables de proceso o de calidad. El monitoreo independiente de estas características puede llevarnos a decisiones erróneas con respecto al estado del proceso o producto. Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [3]

4 Si m pruebas independientes univariadas son realizadas, cada una con probabilidad α de cometer el Error Tipo I, la probabilidad global de cometer este error para todas las pruebas está dado por: α glogal = 1 (1 α ) m Ejemplo: 10 pruebas con α = 0.05 α global = 1 (1-0.05) 10 α global = = Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [4]

5 Univariados x 2 x 1 Control para dos variables x 1 x 2 Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [5]

6 VARIABLES K Complejidad de los datos Número de variables OBSERVACIONES, OBJETOS, MUESTRAS, CASOS, ÍTEMS N Univariado K = 1 Bivariado K = 2 Low Variate K < 5 Multivariate K > 5 Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [6]

7 Visión general de los datos (data overview) Clasificación y/o discriminación entre grupos de observaciones Regresión y modelaje entre dos bloques de datos (X y Y) Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [7]

8 Visión general de los datos X Clasificación y/o discriminación entre grupos de observaciones I II III Regresión y modelaje entre dos bloques de datos (X y Y) X Y PCA PCA PLS Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [8]

9 Datos del Proceso X Datos de Calidad, Productividad Y Temperatura, Presión, Velocidad, Nivel de fluido, Ph, concentración, rendimiento,, Peso, Dureza, Grosor, Potencia, Presión, Velocidad, Content Uniformity, Disolución, Existen Técnicas para: Explicar la variación en X ó Y (PCA) - mientras maximiza la Varianza (X) ó (Y) Explicar la variación en X ey y la relación entre X e Y (PLS) - mientras maximiza la Covarianza (X,Y) Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [9]

10 Las bases de MVDA pueden ser delineadas en términos de la geometría de espacios multidimensionales. Los datos multivariados y sus modelos pueden representarse como puntos, líneas, planos e hiperplanos en éstos espacios multidimensionales. Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [10]

11 Suponga que K = 3, esto es existen 3 variables. Cada observación puede ser representada en un conjunto de ejes, un espacio tridimensional Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [11]

12 El principio de representar cada observación como un punto en el espacio multidimensional hace posible convertir una tabla de datos en una representación gráfica. Todas las observaciones de X se desplegan en el espacio de dimensión K, como una nube de puntos. En esta gráfica se presentan 20 observaciones. Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [12]

13 El análisis de datos corresponde a formular una descripción cuantitativa de la forma de la nube de puntos. Este modelo puede verse como una ventana en el espacio tridimensional. Esta ventana se orienta de forma tal que provee una visión general de los datos y permite su interpretación. El principio detrás de esta converisón se conoce como proyección. La proyección logra disminuir el espacio tridimensional original en un espacio bidimensional (la ventana). Examinando la posición de cada observación en la ventana obetenemos una visión general de los datos. Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [13]

14 El principio de proyecciones puede ser matemáticamente extendedido a cualquier número de variables en el espacio K. Ejemplo: el archivo FOODS, suministrado por Umetrics, es un ejemplo donde tenemos 16 observaciones (N) para cada una de 20 variables (K, K > N, imposible usar regresión). El objetivo del estudio es el de investigar patrones de consumo alimenticio en paises europeos. Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [14]

15 Base de Datos FOODS.xls Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [15]

16 K (20) > N (16) Cada una de las 16 observaciones (países) se convierte en un punto de la nube de puntos en el espacio de veinte dimensiones. Este espacio puede reducirse a muchas menos dimensiones extrayendo la información sustancial de los datos, proyectando cada observación en la ventana. Note como los países nórdicos se agrupan en la parte superior. Esta es la escencia de la metodología de PCA. Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [16]

17 Ejemplo Foods: Score Plot Ejemplo Foods: Loadings Plot Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [17]

18 Ejemplo Foods: Distance to Model: DMODX No se observan outliers, todos los países se ajustan bien al modelo Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [18]

19 PCA

20 PCA es un método para crear combinaciones lineales de las características originales que son ortogonales; a estas combinaciones se le llama los componentes principales (PC). Los PCs, a través de las combinaciones lineales independientes intentan contienen la mayoría de la variabilidad de las características originales. Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [20]

21 PCA se utiliza para encontrar las estructuras de correlación entre las múltiples variables. La idea es encontrar un puñado de variables no correlacionadas, que son combinaciones lineales de las variables originales, que contengan la mayoría de la variabilidad de éstas. Por esta razón, se le conoce como una técnica de reducción de dimensiones. Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [21]

22 Matriz de Datos: Las filas corresponden a las unidades experimentales y las columnas a las características p: número de características consideradas n: número de unidades experimentales X rj : valor de la característica j en la unidad experimental r donde r = 1,2,,n and j = 1,2,,p. Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [22]

23 Si p variables son consideradas, existen p PCs: PC 1 = α 11 X 1 + α 12 X α 1p X p PC 2 = α 21 X 1 + α 22 X α 2p X p : : PC p = α p1 X 1 + α p2 X α pp X p Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [23]

24 El primer PC contiene la mayor proporción de la variabilidad. El segundo PC contiene la segunda mayor proporción de la variabilidad, así sucesivamente. Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [24]

25 Dos Componentes Principales X X1 Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [25]

26 Matriz de Covarianza: σσ 11 σσ 12 σσ 1pp σσ 21 σσ 22 σσ 2pp = σσ pp1 σσ pp2 σσ pppp σ ii = Var(X i ) para i = 1,2,,p σ ij = Cov(X i,x j ) para i j = 1,2,,p Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [26]

27 Coeficiente de Correlación: ρ ij = coeficiente de correlación entre X i and X j para i j = 1,2,,p. -1 ρ ij 1 para cada i j Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [27]

28 Matriz de Correlación: PP = 1 ρρ 12 ρρ 1pp ρρ 21 1 ρρ 2pp ρρ pp1 ρρ pp2 1 ρ ij = coeficiente de correlación entre X i and X j for i j = 1,2,,p. Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [28]

29 Simca realiza este pretratamiento por default Centralización y Varianza Unitaria Tomado de: IBS Caribe,Inc. presentation on Chemometrics Interpretación de Centralización Tomado de: IBS Caribe, Presentation on Chemometrics and Multivariate Model Development. Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [29]

30 Estandarización de los datos: necesaria para tener las variables en unidades comparables (codificación). A esta estandarización se le conoce como Standard Normal Variate Transformation o SNV correction en pre-tratamiento espectral. Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [30]

31 Datos Estandarizados: son el promedio y desviación estándar de cada variable para todas las observaciones. Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [31]

32 Matrix de Datos Estandarizados: ZZ = ZZ 11 ZZ 12 ZZ 1pp ZZ 21 ZZ 22 ZZ 2pp ZZ NN1 ZZ NN2 ZZ NNNN Las filas corresponden a las unidades experimentales y las columnas a las características Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [32]

33 Las variables deben ser estandarizadas si son medidas en escalas muy diferentes o si sus varianzas difieren siginificativamente. Usar la matriz de correlación para calcular los componentes principales PC s es equivalente a estandarizar los datos. La matriz de covarianza se utiliza cuando no es necesario estandarizar los datos. Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [33]

34 Los componentes principales de un conjunto de variables del proceso x 1, x 2,.., x p, son unas combinaciones lineales particulares de estas variables. z 1 = c 11 x 1 + c 12 x c 1p x p z 2 = c 21 x 1 + c 22 x c 2p x p : : : z p = c p1 x 1 + c p2 x c pp x p Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [34]

35 C ij s son constantes que se obtienen de los vectores propios (eigenvectors). Las variables de los componentes principales z1, z2,., zp son los ejes de un nuevo sistema de coordenadas que se obtienen de rotar el sistema original de ejes (basado en las x s). Los nuevos ejes representan las direcciones de máxima variabilidad. Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [35]

36 Encontrar los c ij s es relativamente fácil. Si las variables x 1, x 2,, x p se representan con un vector x con matriz de covarianza Σ y los valores propios (eigenvalues) de Σ son λ 1 > λ 2 >. λ p > 0. Entonces las constantes c ij s son los elementos del eigenvector i asociados con el eigenvalue i. La varianza del componente principal i es el eigenvalue i, λ i. La proporción de la variabilidad explicada por el componente principal i está dado por: Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [36]

37 Encontrar los c ij s es relativamente fácil. Si las variables x 1, x 2,, x p se representan con un vector x con matriz de covarianza Σ y los valores propios (eigenvalues) de Σ son λ 1 > λ 2 >. λ p > 0. Entonces las constantes c ij s son los elementos del eigenvector i asociados con el eigenvalue i. La varianza del componente principal i es el eigenvalue i, λ i. La proporción de la variabilidad explicada por el componente principal i está dado por: λi λ + λ λ 1 2 p Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [37]

38 Los vectores propios (eigenvectors) proveen los coeficientes para los PC s: PC 1 = α 11 Z 1 + α 12 Z α 1p Z p Los valores propios (eigenvalues) corresponden a las varianzas de los PC s. λ 1, λ 2,, λ p La suma de las varianzas de las variables originales es igual a la suma de las varianzas de los PC s. p i= 1 λ = i p i= 1 σ 2 i Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [38]

39 Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [39]

40 Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [40]

41 Cuantos PC s? Scree Plot estado estable Porcentaje de la Varianza Criterio: Eigenvalues > 1 Matriz de Correlación Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [41]

42 Figure 7: Scree Plot (Matriz de Covarianza) Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [42]

43 Cuantos PC s? Porcentaje de la varianza Puede decidir mantener los PCs que expliquen el 85% de la varianza, por ejemplo. Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [43]

44 Cuántos PC s? Criterio Eigenvalue > 1: los eigenvalues son las varianzas de los PCs; por lo tanto, cuando usamos variables estandarizadas (matriz de correlación), se pueden considerar todos los PCs cuyo eigenvalue sea mayor de 1. Scree Plot (Matriz de Correlacion) Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [44]

45 Tradeoff entre el número de componentes y el overfitting R 2 goodness of fit Q 2 goodness of prediction Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [45]

46 Seleccione las variables para el análisis. Decida si utilizara datos estandarizados, o, Seleccione la matriz a utilizarse: matriz de covarianza o matriz de correlación P. Determine el numero de PCs significativos. Interprete los PCs (cuando sea posible). Use los PCs estudios futuros. Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [46]

47 Scores plots : Muestra las observationes proyectadas en el hiper-plano creado por los PCs. Muestra un resumen de la relacion entre las observaciones. Score Plot Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [47]

48 Loadings plots: Muestra la relación entre distintas variables. Los loadings son los pesos que combinan las variables originales para obtener los scores. Geométricamente, representan la dirección de los PCs. La dirección del plano de proyección provee información sobre la importancia de las variables. Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [48]

49 Loading Plot Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [49]

50 Escuela % de Retención GPA_ESP GPA-ING GPA-MAT T_Promedio Proportion A B D E F H A I J K L Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [50]

51 Eigenanalysis of the Correlation Matrix Eigenvalue Proportion Cumulative Variable PC1 PC2 PC3 PC4 PC5 PC6 % de Retención GPA_ESP GPA-ING GPA-MAT Tiempo_Promedio Proportion Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [51]

52 Ejemplo Escuelas: Model Overview Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [52]

53 Ejemplo Escuelas: Scores Plot Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [53]

54 Ejemplo Escuelas: Loadings Plot Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [54]

55 PLS

56 PLS es un método para construir modelos de predicción cuando existen múltiples variables y una alta (relación) entre las mismas. PLS es una extensión de regresión a PCA, que es utilizado para conectar la información de dos bloques de variables, X e Y. Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [56]

57 PLS intenta encontrar unos pocos factores fundamentales o latentes que explican la mayor parte de la variabilidad en las respuestas. La idea es extraer estos factores latentes mientras se modela adecuadamente las respuestas. Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [57]

58 FACTORES/PREDICTORES K RESPUESTAS M OBSERVACIONES, OBJETOS, MUESTRAS, CASOS, ÍTEMS N X PLS OBSERVACIONES, OBJETOS, MUESTRAS, CASOS, ÍTEMS N Y Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [58]

59 K = 3, M = 1, dos nubes de puntos Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [59]

60 K = 3, M = 3, dos nubes de puntos Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [60]

61 Primer Componente, ambos espacios Score Vectors Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [61]

62 Segundo Componente, ambos espacios Línea de segundo componente de X Ortogonal a la primera, esto no es necesariamente cierto para el espacio Y Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [62]

63 Score vectors, otros componentes El segundo par de score vectors (t2, u2), Correlacionan, pero regularmente menos que el primer componente Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [63]

64 Modelaje Indirecto Tomado de: An Introduction to Partial Least Squares Regression by Randall D. Tobias Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [64]

65 Ejemplo: el archivo LOWARP, suministrado por Umetrics, es un ejemplo donde tenemos 17 observaciones (mezclas) de una cubierta de plástico para un celular. Cuatro componentes son utilizados en la mezcla. El objetivo del estudio es el de conseguir cubiertas con poca deformación (warpage) y alto esfuerzo (strength). Catorce respuestas relacionadas a las deformaciones y el esfuerzo son medidas en la cubierta. Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [65]

66 Base de Datos LOWARP Factores - X Respuestas -Y Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [66]

67 LOWARP Weight Plot Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [67]

68 LOWARP Observed vs Predicted Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [68]

69 Tres Componentes Dos Componentes Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [69]

70 t1/t2 - Score plot Biplot 3.0 lowarp.m1 (PLS) t[comp. 1]/t[Comp. 2] lowarp.m1 (PLS) pc(corr)[comp. 1]/pc(corr)[Comp. 2] t[2] mica st3 st st1 glasst4 st2 st t[1] R2X[1] = R2X[2] = Ellipse: Hotelling T2 (0.95) Var_ w rp5 w rp6 wwrp2 rp1 amtpw rp3 w rp7 12 w rp8 w rp4 SIMCA-P :32:13 (UTC-5) crtp pc(corr)[1], t(corr)[1] Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [70]

71 Interpretación de los weights Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [71]

72 Coeficientes de variables correlacionadas wrp1 y wrp2 Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [72]

73 Coeficientes de variables no correlacionadas wrp4 y st lowarp.m1 (PLS) CoeffCS[Last comp.](wrp4) Colored according to Var ID (Primary) CoeffCS[2](wrp4) glas crtp mica amtp Var ID (Primary) SIMCA-P :29:21 (UTC-5) Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [73]

74 VIP Variance Influence on projection Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [74]

75 Diagnóstico de observaciones outliers p non-linearities Una observación puede ser un outlier en X en Y y/o en la relación entre X e Y. Cuatro score Plots pueden ayudar: t1/u1, t2/u2, t1/t2 y u1/u2 La no-linearidad entre X e Y Puede ser observada en los scores tj/uj Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [75]

76 t1/u1 - Score plot t2/u2 - Score plot Indica una correlación alta entre Los factores y las respuestas; no parecen existir outliers. En general se observa una correlación alta entre los factores y las respuestas; puntos 6,11, 12 son como diferentes Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [76]

77 t/t score útil para encontrar desviaciones en X u/u plot útil para encontrar desviaciones en Y t/u plot útil para encontrar desviaciones de la correlación existente entre X e Y. Además es útil para desviaciones a la linearidad entre X e Y. DmodX/DmodY, muestra la distancia de cada observación al modelo en el espacio X/Y y pueden ayudar a detectar outliers moderados Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [77]

78 DMOD- distancia al modelo detect outliers moderados DMODX DMODY Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [78]

79 R2VX- variación explicada de los predictores X Primer Componente DMODY Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [79]

80 Hotelling, PCA

81 x 1 x 1 x2 Variables Independendientes x 2 Variables Dendendientes Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [81]

82 Hotelling T 2 T 2 = = n x x ' S 1 = x x Fase I uso de los gráficos de control para establecer control (obtener límites adecuados) LCS Fase II monitoreo de observaciones futuras LCS p( m 1)( n 1) F mn m p + 1 = α + p( m + 1)( n 1) F mn m p + 1 m = # de muestras, n = tamaño de muestra p = # de variables, p, mn m p 1 LCI = 0 LCI = α, p, mn m p+ 1 = 0 Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [82]

83 A B Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [83]

84 A B Xbar A X Bar B Var A Var B Cov (A,B) Corr(A,B) Average Promedios Varianzas Cov / Corr Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [84]

85 110 Scatterplot of B vs A B A Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [85]

86 Tsquared Chart of A, B T Square Tsquared UCL= Sample Median=1.36 LCL=0.00 MEAN1 MEAN COV Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [86]

87 Uno de los retos en estos gráficos cuando ocurre una señal de fuera de control es distinguir o diagnosticar cual o cuales de las variables son las que han cambiado su comportamiento. Entre los métodos sugeridos para el disgnóstico se encuentran: Gráficos Univariados usando límites Bonferroni Usar Componentes Principales Descomposición de T 2 d i = T 2 T 2 (i) donde T 2 (i) la estadística T 2 sin la variable I, valores de d i altos indican variables sospechosas Otro reto con estas variables es la estinmación de la matriz de covarianza y el vector de promedios Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [87]

88 Los gráficos de Control Multivariados son efectivos en la medida en que p, el número de variables del proceso a monitorearse no sea muy grande. A medida que p aumenta el ARL de detectar un cambio particular también aumenta, porque el cambio se diluye en el espacio dimesional de las p variables del proceso. Métodos para descubrir el subconjunto de variables que operan sobre el proceso se le conocen como Latent Structure Methods. Uno de estos métodos es el de componentes principales PCA siglas en inglés). Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [88]

89 X1 X2 X3 X Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [89]

90 Type: PCA-X Observations (N)=20, Variables (K)=4 (X=4, Y=0) Matrix Plot of X1, X2, X3, X4 Correlations: X1, X2, X3, X4 22 X X1 X2 X3 X X X X X X Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [90]

91 Principal Component Analysis: X1, X2, X3, X4 Eigenanalysis of the Correlation Matrix Eigenvalue Proportion Cumulative Variable PC1 PC2 PC3 PC4 X X X X Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [91]

92 Z1 Z2 Z3 Z Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [92]

93 Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [93]

94 Variables Originales Z Scores X1 X2 X3 X4 Z1 Z Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [94]

95 Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [95]

96 Hotelling T2 monitoreo multivariado Pesos señal de fuera de control obs. 23 Intro PCA E -PCA PLS E - PLS Q Chart MVDA - DRGB Septiembre 2011 [96]

David R. González Barreto Universidad de Puerto Rico

David R. González Barreto Universidad de Puerto Rico Diccionario de Términos Multivariados David R. González Barreto Universidad de Puerto Rico Pagina 2 MVDA (Multivariate Data Analysis) Principal Component Analysis (PCA) Hotelling T 2 técnicas gráficas

Más detalles

MODELADO CALIBRACIÓN MULTIVARIADA

MODELADO CALIBRACIÓN MULTIVARIADA MODELADO CALIBRACIÓN MULTIVARIADA Calibración multivariada aproximaciones multivariadas para crear una curva de calibración: regresión clásica u ordinaria (classical/ordinary least squares, CLS) regresión

Más detalles

ANÁLISIS DE COMPONENTES PRINCIPALES

ANÁLISIS DE COMPONENTES PRINCIPALES ANÁLISIS DE COMPONENTES PRINCIPALES INTRODUCCIÓN El objetivo principal de la mayoría de las técnicas numéricas de análisis multivariado, es reducir la dimensión de nuestros datos. Por supuesto, si esta

Más detalles

Edgar Acuna/ ESMA 6665 Lecc La SVD y Componentes Principales

Edgar Acuna/ ESMA 6665 Lecc La SVD y Componentes Principales Edgar Acuna/ ESMA 6665 Lecc 7 75 6.2 La SVD y Componentes Principales El objetivo de componentes principales es hacer una reducción de la información disponible. Es decir, la información contenida en p

Más detalles

ANÁLISIS DE COMPONENTES PRINCIPALES

ANÁLISIS DE COMPONENTES PRINCIPALES ANÁLISIS DE COMPONENTES PRINCIPALES INTRODUCCIÓN El objetivo principal de la mayoría de las técnicas numéricas de análisis multivariado, es reducir la dimensión de nuestros datos. Por supuesto, si esta

Más detalles

Caso 17. Análisis multivariante: reducción de datos por componentes principales.

Caso 17. Análisis multivariante: reducción de datos por componentes principales. Caso 17: reducción por componentes principales 115 Caso 17. Análisis multivariante: reducción de datos por componentes principales. (JESÚS LÓPEZ FIDALGO, UCLM) CASO PRÁCTICO Se dispone de 15 variables

Más detalles

Eigenvalores y eigenvectores

Eigenvalores y eigenvectores Eigenvalores y eigenvectores Los dos problemas principales del álgebra lineal son: resolver sistemas lineales de la forma Ax = b y resolver el problema de eigenvalores. En general, una matriz actúa sobre

Más detalles

Quimiometría CALIBRACIÓN MULTIVARIADA

Quimiometría CALIBRACIÓN MULTIVARIADA CALIBRACIÓN MULTIVARIADA Calibración multivariada un método multivariado implica que: existe una dependencia múltiple de la variable x (independiente) y múltiples variables y (dependiente) el número de

Más detalles

COMPONENTES PRINCIPALES

COMPONENTES PRINCIPALES COMPONENTES PRINCIPALES Jorge Galbiati R. El método de Componentes Principales tiene por objeto reducir la dimensionalidad de un problema de múltiples variables, aplicando una sucesión de transformaciones

Más detalles

Capítulo 2. Medidas Estadísticas Básicas Medidas estadísticas poblacionales

Capítulo 2. Medidas Estadísticas Básicas Medidas estadísticas poblacionales Capítulo 2 Medidas Estadísticas Básicas 2.1. Medidas estadísticas poblacionales Sea X una variable aleatoria con función de probabilidad p(x) si es discreta, o función de densidad f(x) si es continua.

Más detalles

Análisis de Componentes Principales (ACP)

Análisis de Componentes Principales (ACP) Sistemas de Visión en Manufactura Maestría en MIC, UDB Análisis de Componentes Principales (ACP) Presenta: Sergio Miguel García Pérez Enero de 2015 Introducción Cuando se recoge información de una muestra

Más detalles

ANÁLISIS DE REGRESIÓN

ANÁLISIS DE REGRESIÓN ANÁLISIS DE REGRESIÓN INTRODUCCIÓN Francis Galtón DEFINICIÓN Análisis de Regresión Es una técnica estadística que se usa para investigar y modelar la relación entre variables. Respuesta Independiente Y

Más detalles

1. Conceptos de Regresión y Correlación. 2. Variables aleatorias bidimensionales. 3. Ajuste de una recta a una nube de puntos

1. Conceptos de Regresión y Correlación. 2. Variables aleatorias bidimensionales. 3. Ajuste de una recta a una nube de puntos TEMA 10 (curso anterior): REGRESIÓN Y CORRELACIÓN 1 Conceptos de Regresión y Correlación 2 Variables aleatorias bidimensionales 3 Ajuste de una recta a una nube de puntos 4 El modelo de la correlación

Más detalles

Métodos Estadísticos Multivariados

Métodos Estadísticos Multivariados Métodos Estadísticos Multivariados Victor Muñiz ITESM Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre 2011 1 / 19 Partial Least Squares Regression Victor Muñiz (ITESM) Métodos

Más detalles

Estadística II Tema 1: Distribución normal multivariante

Estadística II Tema 1: Distribución normal multivariante Estadística II Tema 1: Distribución normal multivariante José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Algunas propiedades de los vectores aleatorios Sea X = (X 1,..., X

Más detalles

Análisis de componentes principales

Análisis de componentes principales Capítulo 2 Análisis de componentes principales 2.1. Teoría Sea X una muestra de datos (de la variable/población x N ( µ, Σ)) donde el elemento x ij corresponde al individuo i y a la variable continua j

Más detalles

Revista digital Matemática, Educación e Internet (www.cidse.itcr.ac.cr/revistamate/). Vol. 11, N o 2. Enero Agosto 2011.

Revista digital Matemática, Educación e Internet (www.cidse.itcr.ac.cr/revistamate/). Vol. 11, N o 2. Enero Agosto 2011. Artículo Revista digital Matemática, Educación e Internet (www.cidse.itcr.ac.cr/revistamate/). Vol. 11, N o 2. Enero Agosto 2011. Implementación del Análisis en Componentes Principales con el software

Más detalles

RECONOCIMIENTO DE PAUTAS

RECONOCIMIENTO DE PAUTAS RECONOCIMIENTO DE PAUTAS ANÁLISIS DISCRIMINANTE (Discriminant analysis) Reconocimiento de pautas supervisado si se cuenta con objetos cuya pertenencia a un grupo es conocida métodos: análisis de discriminantes

Más detalles

Introducción a las técnicas de Análisis Multivariante

Introducción a las técnicas de Análisis Multivariante Introducción a las técnicas de Análisis Multivariante Dagoberto Salgado Horta Universidad del Tolima Dagoberto Salgado Horta 1 Análisis multivariante Objetivo: estudio de varias variables simultáneamente:

Más detalles

Análisis multivariante II

Análisis multivariante II Análisis multivariante II Tema 1: Introducción Pedro Galeano Departamento de Estadística Universidad Carlos III de Madrid pedro.galeano@uc3m.es Curso 2016/2017 Grado en Estadística y Empresa Pedro Galeano

Más detalles

Regresión Lineal Múltiple

Regresión Lineal Múltiple Universidad Nacional Agraria La Molina 2011-2 Efectos de Diagnósticos de Dos predictores X 1 y X 2 son exactamente colineales si existe una relación lineal tal que C 1 X 1 + C 2 X 2 = C 0 para algunas

Más detalles

Estadística II Tema 4. Regresión lineal simple. Curso 2009/10

Estadística II Tema 4. Regresión lineal simple. Curso 2009/10 Estadística II Tema 4. Regresión lineal simple Curso 009/10 Tema 4. Regresión lineal simple Contenidos El objeto del análisis de regresión La especificación de un modelo de regresión lineal simple Estimadores

Más detalles

Análisis en Componentes Principales

Análisis en Componentes Principales This is page i Printer: Opaque this Análisis en Componentes Principales Dr. Oldemar Rodríguez Rojas 29 de mayo de 2008 ii This is page iii Printer: Opaque this Contents. Análisis en Componentes Principales

Más detalles

Universidad Técnica de Babahoyo CORRELACIÓN DE VARIABLES Y REGRESIÓN LINEAL

Universidad Técnica de Babahoyo CORRELACIÓN DE VARIABLES Y REGRESIÓN LINEAL Universidad Técnica de Babahoyo CORRELACIÓN DE VARIABLES Y REGRESIÓN LINEAL OBJETIVO Analizar las Diferentes formas de Describir la Relación entre dos variables numéricas Trazar un diagrama de dispersión

Más detalles

Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.

Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows. TEMA 12 REGRESIÓN LINEAL Mediante la regresión lineal se busca hallar la línea recta que mejor explica la relación entre unas variables independientes o variables de exposición y una variable dependiente

Más detalles

Ordenación contrastante o directo. Pueden los patrones de la comunidad de aves ser explicados por variables ambientales medidas?

Ordenación contrastante o directo. Pueden los patrones de la comunidad de aves ser explicados por variables ambientales medidas? Ordenación contrastante o directo Pueden los patrones de la comunidad de aves ser explicados por variables ambientales medidas? Ordenación contrastante o directa De análisis de gradiente indirecto a directo

Más detalles

MODELADO CALIBRACIÓN MULTIVARIADA

MODELADO CALIBRACIÓN MULTIVARIADA MODELADO CALIBRACIÓN MULTIVARIADA Calibración multivariada un método multivariado implica que: existe una dependencia múltiple de la variable x (independiente) y múltiples variables y (dependiente) el

Más detalles

Análisis Estadístico de Datos Climáticos. Análisis de correlación canónica. Facultad de Ciencias Facultad de Ingeniería 2013

Análisis Estadístico de Datos Climáticos. Análisis de correlación canónica. Facultad de Ciencias Facultad de Ingeniería 2013 Análisis Estadístico de Datos Climáticos Análisis de correlación canónica Facultad de Ciencias Facultad de Ingeniería 2013 Motivación Si se tienen dos conjuntos de datos (A y B) que, por ejemplo, varían

Más detalles

Análisis de Varianza Factorial y MANOVA

Análisis de Varianza Factorial y MANOVA 0 Introducción origen y características (1869 Galton Genio Hereditario) Parsimonia Informativa 1 Tipos de Análisis Factorial 2 El modelo de Análisis Factorial: Teoremas 3 Pasos del Análisis Factorial:

Más detalles

Bioestadística. Curso Práctica: La recta de regresión

Bioestadística. Curso Práctica: La recta de regresión Bioestadística. Curso 2012-2013 Carmen M a Cadarso, M a del Carmen Carollo, Xosé Luis Otero, Beatriz Pateiro Índice 1. Introducción 2 2. El diagrama de dispersión 2 3. Covarianza 4 4. Coeciente de correlación

Más detalles

Análisis de Gradiente Ambiental: Ordenación sin contrastar

Análisis de Gradiente Ambiental: Ordenación sin contrastar Análisis de Gradiente Ambiental: Ordenación sin contrastar Ordenación sin contrastar Características importantes de las técnicas ordenación no contrastantes Una familia de técnicas con objetivos similares.

Más detalles

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 4)

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 4) OBJETIVOS DE APRENDIZAJE: TEMA Nº ANÁLISIS CONJUNTO DE DOS VARIABLES Distinguir entre variables cualitativas y cuantitativas, y saber elegir los métodos en cada caso. Conocer métodos gráficos y cuantitativos

Más detalles

Componentes principales (II)

Componentes principales (II) Componentes principales (II) Eliseo Martínez Herrera 1. Propiedades de los componentes Los componentes principales tienen las siguientes propiedades: 1 La suma de las varianzas de los componentes es igual

Más detalles

Linear Regression and the Least-squares problem

Linear Regression and the Least-squares problem Linear Regression and the Least-squares problem Aniel Nieves-González Aniel Nieves-González () Linear Regression and the LSP 1 / 25 Variables cuantitativas y relaciones entre estas (Repaso) Recuerde que

Más detalles

Puntuaciones de las observaciones en las componentes Gráfico de dispersión de las componentes Y1 e Y2:

Puntuaciones de las observaciones en las componentes Gráfico de dispersión de las componentes Y1 e Y2: Ejemplo 1 Objetivos: 1. Ayudar a comprender los conceptos relacionados con un análisis de componentes principales. Interpretación de resultados. 2. Aprender a ejecutar con R el ACP. Familiarizarse con

Más detalles

Tema 2 Datos multivariantes

Tema 2 Datos multivariantes Aurea Grané Máster en Estadística Universidade Pedagógica 1 Aurea Grané Máster en Estadística Universidade Pedagógica 2 Tema 2 Datos multivariantes 1 Matrices de datos 2 Datos multivariantes 2 Medias,

Más detalles

Análisis de Correspondencias Simple

Análisis de Correspondencias Simple 1 Capítulo 4 Análisis de Correspondencias Simple 41 INTRODUCCIÓN El Análisis de Correspondencias Simple permite describir las relaciones entre dos variables categóricas dispuestas en una tabla de contingencia

Más detalles

ANÁLISIS DE COMPONENTES PRINCIPALES

ANÁLISIS DE COMPONENTES PRINCIPALES ANÁLISIS DE COMPONENTES PRINCIPALES COMPONENTES PRINCIPALES 1. Introducción 2. Componentes principales de dos variables 3. Obtención de los componentes principales 4. Caso práctico Análisis de interdependencias

Más detalles

Análisis de Capacidad Multivariada

Análisis de Capacidad Multivariada Análisis de Capacidad Multivariada Resumen El procedimiento Análisis de Capacidad Multivariada determina la probabilidad de que los puntos caracterizados por dos o más variables se encuentren establecidos

Más detalles

Mínimos Cuadrados Parciales

Mínimos Cuadrados Parciales Mínimos Cuadrados Parciales Resumen El procedimiento Mínimos Cuadrados Parciales (PLS Partial Least Squares) está diseñado para construir un modelo estadístico que relaciona múltiples variables independientes

Más detalles

Modelo Lineal PRACTICA 5

Modelo Lineal PRACTICA 5 Modelo Lineal PRACTICA 5 1. La Tabla 3 (gener2.txt) contiene un conjunto de 30 datos generados correspondientes a dos variables: X e Y. a) Ajuste un modelo lineal utilizando la variable Y como respuesta

Más detalles

ANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada.

ANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada. ANEXO 1. CONCEPTOS BÁSICOS Este anexo contiene información que complementa el entendimiento de la tesis presentada. Aquí se exponen técnicas de cálculo que son utilizados en los procedimientos de los modelos

Más detalles

Gráfico de Control T-Cuadrada Multivariada

Gráfico de Control T-Cuadrada Multivariada Gráfico de Control T-Cuadrada Multivariada STATGRAPHICS Rev. 25/04/2007 Resumen El procedimiento Gráfico de Control T-Cuadrada Multivariada crea diagramas de control para dos o más variables numéricas.

Más detalles

RESPUESTAS BREVES A LA PRÁCTICA 7

RESPUESTAS BREVES A LA PRÁCTICA 7 RESPUESTAS BREVES A LA PRÁCTICA 7 EJERCICIO 1 Las salidas que proporciona el programa son: Unweighted Least Squares Linear Regression of X Puntaje en Inteligencia Predictor Variables Coefficient Std Error

Más detalles

Práctica 3: Regresión simple con R

Práctica 3: Regresión simple con R Estadística II Curso 2010/2011 Licenciatura en Matemáticas Práctica 3: Regresión simple con R 1. El fichero de datos Vamos a trabajar con el fichero salinity que se encuentra en el paquete boot. Para cargar

Más detalles

Linear Regression and the Least-squares problem

Linear Regression and the Least-squares problem Linear Regression and the Least-squares problem Aniel Nieves-González Abril 2013 Aniel Nieves-González () Linear Regression and the LSP Abril 2013 1 / 25 Variables cuantitativas y relaciones entre estas

Más detalles

UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS NATURALES Y MUSEO CÁTEDRA DE ESTADÍSTICA CLASE ESPECIAL. Tema:

UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS NATURALES Y MUSEO CÁTEDRA DE ESTADÍSTICA CLASE ESPECIAL. Tema: UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS NATURALES Y MUSEO CÁTEDRA DE ESTADÍSTICA CLASE ESPECIAL Tema: Correlación múltiple y parcial. Ecuaciones y planos de regresión La Plata, septiembre

Más detalles

SOLUCIONES AL EXAMEN DE SEPTIEMBRE DE ESTADÍSTICA EXAMEN DE MATEMÁTICAS II

SOLUCIONES AL EXAMEN DE SEPTIEMBRE DE ESTADÍSTICA EXAMEN DE MATEMÁTICAS II SOLUCIONES AL EXAMEN DE SEPTIEMBRE DE 4. ESTADÍSTICA EXAMEN DE MATEMÁTICAS II Estadística (primer parcial). Septiembre de 4.- El coeficiente de determinación R nos determina a) el % de la varianza de Y

Más detalles

Objetivo. variables factores F Principios básicos. Parsimonia Interpretabilidad

Objetivo. variables factores F Principios básicos. Parsimonia Interpretabilidad ANÁLISIS FACTORIAL 1. Introducción 2. Examen de la matriz de correlación 3. Extracción de los factores 4. Rotación de los factores 5. Puntuaciones factoriales 6. Caso práctico Introducció Objetivo. Resumir

Más detalles

INTRODUCCIÓN AL ANÁLISIS MULTIVARIADO RECONOCIMIENTO DE PAUTAS

INTRODUCCIÓN AL ANÁLISIS MULTIVARIADO RECONOCIMIENTO DE PAUTAS INTRODUCCIÓN AL ANÁLISIS MULTIVARIADO RECONOCIMIENTO DE PAUTAS Datos multivariantes Métodos modernos de análisis automático (métodos espectroscópicos o cromatográficos) permiten reunir grandes cantidades

Más detalles

Descomposición Factorial de la In ación en Perú

Descomposición Factorial de la In ación en Perú Descomposición Factorial de la n ación en Perú Alberto Humala (BCRP) Gabriel Rodríguez (BCRP) XXV Encuentro de Economistas Banco Central de Reserva del Perú 26-28/11/2008 Humala-Rodríguez () n ación 26-28/11/2008

Más detalles

TEMA 3.- VECTORES ALEATORIOS.- CURSO

TEMA 3.- VECTORES ALEATORIOS.- CURSO TEMA 3.- VECTORES ALEATORIOS.- CURSO 017-018 3.1. VARIABLES ALEATORIAS BIDIMENSIONALES. FUNCIÓN DE DISTRIBUCIÓN CONJUNTA. 3.. VARIABLES BIDIMENSIONALES DISCRETAS. 3.3. VARIABLES BIDIMENSIONALES CONTINUAS.

Más detalles

Ing. MSc. Luis Fernando Restrepo Gómez

Ing. MSc. Luis Fernando Restrepo Gómez Ing. MSc. Luis Fernando Restrepo Gómez Introducción a la Valuación Masiva METODOLOGÍA VALUATORIA Sigue los pasos de la metodología científica, y se apoya en el análisis estadístico de datos comparables.

Más detalles

LECCIÓN PÚBLICA. Tema 6 Descripción Multivariante de Datos. Profa. María Fátima Dos Santos

LECCIÓN PÚBLICA. Tema 6 Descripción Multivariante de Datos. Profa. María Fátima Dos Santos LECCIÓN PÚBLICA Tema 6 Descripción Multivariante de Datos Profa. María Fátima Dos Santos 1 TEMARIO Análisis Multivariados. Clasificación ACP. Organización de los Datos ACP. Componentes, variabilidad explicada

Más detalles

Estadística. Tema 3. Esperanzas Esperanza. Propiedades Varianza y covarianza. Correlación

Estadística. Tema 3. Esperanzas Esperanza. Propiedades Varianza y covarianza. Correlación Estadística Tema 3 Esperanzas 31 Esperanza Propiedades 32 Varianza y covarianza Correlación 33 Esperanza y varianza condicional Predicción Objetivos 1 Medidas características distribución de VA 2 Media

Más detalles

ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE

ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE Jorge Fallas jfallas56@gmail.com 2010 1 Temario Introducción: correlación y regresión Supuestos del análisis Variación total de Y y variación explicada por

Más detalles

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos Agro 6998 Conferencia Introducción a los modelos estadísticos mixtos Los modelos estadísticos permiten modelar la respuesta de un estudio experimental u observacional en función de factores (tratamientos,

Más detalles

Tema 10: Introducción a los problemas de Asociación y Correlación

Tema 10: Introducción a los problemas de Asociación y Correlación Tema 10: Introducción a los problemas de Asociación y Correlación Estadística 4 o Curso Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 10: Asociación y Correlación

Más detalles

Regresión múltiple. Efecto de varias variables ambientales sobre una especie de ganso migratorio. Luz

Regresión múltiple. Efecto de varias variables ambientales sobre una especie de ganso migratorio. Luz Nombre: AGRO 6600 LAB 12 Regresión múltiple Los datos adjuntos se tomaron para estudiar el efecto de varias variables ambientales sobre el tiempo en el que una especie de ganso migratorio deja su nido

Más detalles

Regresión: implica la obtención de una ecuación mediante la que podamos estimar el valor medio de una variable.

Regresión: implica la obtención de una ecuación mediante la que podamos estimar el valor medio de una variable. 1 DEFINICIONES PREVIAS Regresión: implica la obtención de una ecuación mediante la que podamos estimar el valor medio de una variable. Correlación: es la cuantificación del grado de relación existente

Más detalles

Estadística Descriptiva 2da parte

Estadística Descriptiva 2da parte Universidad Nacional de Mar del Plata Facultad de Ingeniería Estadística Descriptiva 2da parte 2 Cuatrimestre 2018 COMISIÓN :1. Prof. Dr. Juan Ignacio Pastore. Qué es la estadística? El contenido de la

Más detalles

INDICADORES MULTIVARIADOS DE CAPACIDAD DE PROCESOS. SU EFICIENCIA BAJO DISTRIBUCIONES NORMALES.

INDICADORES MULTIVARIADOS DE CAPACIDAD DE PROCESOS. SU EFICIENCIA BAJO DISTRIBUCIONES NORMALES. Dianda, Daniela Hernández, Lucia Quaglino, Marta Pagura, José Alberto Instituto de Investigaciones Teóricas y Aplicadas de la Escuela de Estadística INDICADORES MULTIVARIADOS DE CAPACIDAD DE PROCESOS.

Más detalles

Regresión Lineal. El modelo de regresión caracteriza la relación entre una variable respuesta que depende de k variables independientes o regresoras.

Regresión Lineal. El modelo de regresión caracteriza la relación entre una variable respuesta que depende de k variables independientes o regresoras. Regresión Lineal Los factores envueltos en la experimentación pueden ser de tipo cuantitativos o cualitativos Un factor cuantitativo es aquel que sus niveles pueden ser asociados con puntos dentro de una

Más detalles

Componentes principales y dimensionalidad

Componentes principales y dimensionalidad Universisad de San Andrés y CONICET Dos problemas Bienestar 19 dimensiones del bienestar en Argentina Ingreso, educacion, tipo de trabajo, paga en cuotas, etc. Realmente el bienestar tiene 19 dimensiones?

Más detalles

GEOESTADÍSTICA APLICADA

GEOESTADÍSTICA APLICADA UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO GEOESTADÍSTICA APLICADA Tema: Análisis Exploratorio de Datos Instructores: Dr. Martín A. Díaz Viera (mdiazv@imp.mx) Dr. Ricardo Casar González (rcasar@imp.mx) 2009

Más detalles

Reducción de la Dimensionalidad en Análisis de Datos. Análisis de Componentes Principales.

Reducción de la Dimensionalidad en Análisis de Datos. Análisis de Componentes Principales. Reducción de la Dimensionalidad en Análisis de. Análisis de Componentes Principales. A. Jiménez, A. Murillo, E. Piza, M. Villalobos, J. Trejos. April 27, 2010 Contenido 1 Objetivo. 2 Solución. 3. Calidad

Más detalles

Análisis de componentes principales. a.k.a.: PCA Principal components analysis

Análisis de componentes principales. a.k.a.: PCA Principal components analysis Análisis de componentes principales a.k.a.: PCA Principal components analysis 1 Outline Motivación Derivación Ejemplos 2 Motivación general Tenemos un dataset X con n datos y p dimensiones, centrado (medias

Más detalles

B.1 ANÁLISIS FACTORIAL COMÚN. cuyo propósito es reducir los datos en cantidad. Es también una técnica en la cual todas las

B.1 ANÁLISIS FACTORIAL COMÚN. cuyo propósito es reducir los datos en cantidad. Es también una técnica en la cual todas las B. NOTAS TEÓRICAS B.1 ANÁLISIS FACTORIAL COMÚN El análisis factorial es un nombre dado a una clase de métodos estadísticos multivariados cuyo propósito es reducir los datos en cantidad. Es también una

Más detalles

Regresión Lineal Simple y Múltiple Regresión Logística

Regresión Lineal Simple y Múltiple Regresión Logística Regresión Lineal Simple y Múltiple Regresión Logística Miguel González Velasco Departamento de Matemáticas. Universidad de Extremadura MUI en Ciencias de la Salud MUI en Ciencias de la Salud (UEx) Regresión

Más detalles

Tema1. Modelo Lineal General.

Tema1. Modelo Lineal General. Tema1. Modelo Lineal General. 1. Si X = (X 1, X 2, X 3, X 4 ) t tiene distribución normal con vector de medias µ = (2, 1, 1, 3) t y matriz de covarianzas 1 0 1 1 V = 0 2 1 1 1 1 3 0 1 1 0 2 Halla: a) La

Más detalles

Distribución bidimensional. Marginales. Correlación lineal. Rectas de regresión.

Distribución bidimensional. Marginales. Correlación lineal. Rectas de regresión. REGRESIÓN LINEAL. Distribución bidimensional. Marginales. Correlación lineal. Rectas de regresión. Dada una población, hasta ahora hemos estudiado cómo a partir de una muestra extraída de ella podemos

Más detalles

ANÁLISIS DE COMPONENTES PRINCIPALES

ANÁLISIS DE COMPONENTES PRINCIPALES CAPÍTULO 4 ANÁLISIS DE COMPONENTES PRINCIPALES 4.1 Introducción Al investigar un fenómeno desconocido se pretende abordarlo con muestras de diferentes variables, en las cuales muchas veces existe una fuerte

Más detalles

Se usa para encontrar un numero relativamente pequeño de variables nuevas que contengan la mayor cantidad de info posible del conjunto de datos

Se usa para encontrar un numero relativamente pequeño de variables nuevas que contengan la mayor cantidad de info posible del conjunto de datos Analisis Estadístico de Datos Climáticos Análisis de componentes principales Analisis de componentes principales Se usa para encontrar un numero relativamente pequeño de variables nuevas que contengan

Más detalles

CORRELACIÓN Y REGRESIÓN. Raúl David Katz

CORRELACIÓN Y REGRESIÓN. Raúl David Katz CORRELACIÓN Y REGRESIÓN Raúl David Katz 1 Correlación y regresión Introducción Hasta ahora hemos visto el modo de representar la distribución de frecuencias de los datos correspondientes a una variable

Más detalles

Modelo de Regresión Lineal

Modelo de Regresión Lineal Modelo de Regresión Lineal Álvaro José Flórez 1 Escuela de Ingeniería Industrial y Estadística Facultad de Ingenierías Febrero - Junio 2012 Introducción Un ingeniero, empleado por un embotellador de gaseosas,

Más detalles

ANALISIS FACTORIAL. Jorge Galbiati R.

ANALISIS FACTORIAL. Jorge Galbiati R. ANALISIS FACTORIAL Jorge Galbiati R El análisis factorial es un modelo matamático que pretende explicar la correlación entre un conjunto grande de variables observadas y un pequeño conjunto de factores

Más detalles

Escuela de Economía Universidad de Carabobo Profesor: Exaú Navarro Pérez.

Escuela de Economía Universidad de Carabobo Profesor: Exaú Navarro Pérez. Escuela de Economía Universidad de Carabobo Profesor: Exaú Navarro Pérez. Econometría Regresión Múltiple: Municipio Ocupados Población Analfabeta Mayor de 10 años Total de Viviendas Bejuma 18.874 1.835

Más detalles

Módulo Minería de Datos

Módulo Minería de Datos Módulo Minería de Datos Diplomado Por Elizabeth León Guzmán, Ph.D. Profesora Ingeniería de Sistemas Grupo de Investigación MIDAS Preprocesamiento de Datos Preparación de datos El propósito fundamental

Más detalles

EVALUACIÓN DEL MÉTODO DE MURPHY PARA LA INTERPRETACIÓN DE SEÑALES EN LA CARTA T 2 MULTIVARIADA

EVALUACIÓN DEL MÉTODO DE MURPHY PARA LA INTERPRETACIÓN DE SEÑALES EN LA CARTA T 2 MULTIVARIADA EVALUACIÓN DEL MÉTODO DE MURPHY PARA LA INTERPRETACIÓN DE SEÑALES EN LA CARTA T 2 MULTIVARIADA Hector Fabian Lopez Casas 1 hectorfl86@hotmail.com 1 Estudiante de Matematicas Con Enfasis en Estadistica,

Más detalles

ESQUEMA GENERAL Concepto y formato del Diseño de grupo control no equivalente (DGCNE) Clasificación

ESQUEMA GENERAL Concepto y formato del Diseño de grupo control no equivalente (DGCNE) Clasificación TEMA V ESQUEMA GENERAL Concepto y formato del Diseño de grupo control no equivalente (DGCNE) Clasificación Análisis de la covarianza (ANCOVA) Modelos alternativos de análisis DISEÑO DE GRUPO CONTROL NO

Más detalles

Análisis de Componentes Principales (PCA) Jesús González y Eduardo Morales

Análisis de Componentes Principales (PCA) Jesús González y Eduardo Morales Análisis de Componentes Principales (PCA) Jesús González y Eduardo Morales Introducción a PCA 2 PCA à herramienta estándar en análisis de datos Simple No paramétrico Extrae información relevante a partir

Más detalles

TEMA 2: DISTRIBUCIONES BIDIMENSIONALES

TEMA 2: DISTRIBUCIONES BIDIMENSIONALES TEMA : DISTRIBUCIONES BIDIMENSIONALES 1.- DISTRIBUCIONES BIDIMENSIONALES Cuando estudiamos un solo carácter estadístico, los datos que obtenemos forman una variable estadística unidimensional. También

Más detalles

3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS

3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS 1. INTRODUCCIÓN Este tema se centra en el estudio conjunto de dos variables. Dos variables cualitativas - Tabla de datos - Tabla de contingencia - Diagrama de barras - Tabla de diferencias entre frecuencias

Más detalles

REGRESIÓN Y ESTIMACIÓN TEMA 1: REGRESIÓN LINEAL SIMPLE

REGRESIÓN Y ESTIMACIÓN TEMA 1: REGRESIÓN LINEAL SIMPLE UNIDAD 3 REGRESIÓN Y ESTIMACIÓN TEMA 1: REGRESIÓN LINEAL SIMPLE Relación entre variables de interés 1 Relación entre variables de interés Muchas decisiones gerenciales se basan en la relación entre 2 o

Más detalles

UNIVERSIDAD AUTONOMA DEL ESTADO DE MEXICO ESCUELA PREPARATORIA TEXCOCO

UNIVERSIDAD AUTONOMA DEL ESTADO DE MEXICO ESCUELA PREPARATORIA TEXCOCO UNIVERSIDAD AUTONOMA DEL ESTADO DE MEXICO ESCUELA PREPARATORIA TEXCOCO MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIÓN PARA DATOS NO AGRUPADOS MATERIAL DIDACTICO SOLO VISION ASIGNATURA QUE CORRESPONDE: ESTADISTICA

Más detalles

Regresión Simple. Leticia Gracia Medrano. 2 de agosto del 2012

Regresión Simple. Leticia Gracia Medrano. 2 de agosto del 2012 Regresión Simple Leticia Gracia Medrano. lety@sigma.iimas.unam.mx 2 de agosto del 2012 La ecuación de la recta Ecuación General de la recta Ax + By + C = 0 Cuando se conoce la ordenada al origen y su pendiente

Más detalles

MÉTODOS DE PRONÓSTICO TEMA 1: ANÁLISIS DE SERIES DE TIEMPO Y ELABORACIÓN DE PRONÓSTICOS

MÉTODOS DE PRONÓSTICO TEMA 1: ANÁLISIS DE SERIES DE TIEMPO Y ELABORACIÓN DE PRONÓSTICOS UNIDAD 4 MÉTODOS DE PRONÓSTICO TEMA 1: ANÁLISIS DE SERIES DE TIEMPO Y ELABORACIÓN DE PRONÓSTICOS Predicción de lo que sucederá en el futuro. 1 Predicción de lo que sucederá en el futuro. Los métodos de

Más detalles

Ejemplo: Peso y altura de los estudiantes Función de Distribución -Coeficiente de correlación(de Pearson) Estadística Descriptiva.

Ejemplo: Peso y altura de los estudiantes Función de Distribución -Coeficiente de correlación(de Pearson) Estadística Descriptiva. -(de Pearson) Mayo 2014 Esquema de la Presentación 1 Ejemplo: Peso y altura de los estudiantes 2 3 Datos de estudiantes Tenemos los datos que corresponden a 51 estudiantes de UDA2 de la Facultad de Odontología

Más detalles

Introducción a las técnicas de. Análisis multivariante

Introducción a las técnicas de. Análisis multivariante Introducción a las técnicas de Análisis Multivariante Fco. Javier Burguillo Universidad de Salamanca Objetivo: estudio de varias variables simultáneamente: X X X3 X4 X5 Objeto 34 6 0. 0.7 Objeto 4 36 3

Más detalles

DISTRIBUCIONES MULTIDIMENSIONALES DE PROBABILIDAD

DISTRIBUCIONES MULTIDIMENSIONALES DE PROBABILIDAD DISTRIBUCIONES MULTIDIMENSIONALES DE PROBABILIDAD FUNCIÓN DE DISTRIBUCIÓN ( CONJUNTA ) DE UN VECTOR ALEATORIO FUNCIÓN DE CUANTÍA ( CONJUNTA) DE VECTORES ALETORIOS DISCRETOS FUNCIÓN DE DENSIDAD (CONJUNTA)

Más detalles

Qué es? Primer paso Representación en un sistema de coordenadas. numéricos Cada punto muestra el valor de cada pareja de datos (X e Y)

Qué es? Primer paso Representación en un sistema de coordenadas. numéricos Cada punto muestra el valor de cada pareja de datos (X e Y) Gráfico de dispersión Qué es? Primer paso Representación en un sistema de coordenadas cartesianas de los datos numéricos Cada punto muestra el valor de cada pareja de datos (X e Y) Gráfico de dispersión

Más detalles

Estadística aplicada al medio ambiente

Estadística aplicada al medio ambiente Estadística aplicada al medio ambiente III. Regresión lineal 3 o de CC. AA. Departamento de Matemáticas Universidad Autónoma de Madrid 2011/12 Planteamiento Modelo Estimación de parámetros Intervalos de

Más detalles

Análisis de Correlación Canónica y Análisis discriminante

Análisis de Correlación Canónica y Análisis discriminante Análisis de Correlación Canónica y Análisis discriminante Análisis de Regresión Múltiple TÉCNICAS DE DEPENDENCIA Variable/s Dependiente/s Variable/s Independiente/s Técnica 1 Nivel de medición Continuo

Más detalles

VARIABLES ESTADÍSTICAS BIDIMENSIONALES

VARIABLES ESTADÍSTICAS BIDIMENSIONALES VARIABLES ESTADÍSTICAS BIDIMENSIONALES 1.- En una variable estadística bidimensional, el diagrama de dispersión representa: a) la nube de puntos. b) las varianzas de las dos variables. c) los coeficientes

Más detalles

Tema 2: Análisis de datos bivariantes

Tema 2: Análisis de datos bivariantes Tema 2: Análisis de datos bivariantes Los contenidos a desarrollar en este tema son los siguientes: 1. Tablas de doble entrada. 2. Diagramas de dispersión. 3. Covarianza y Correlación. 4. Regresión lineal.

Más detalles

Tema 6: Distribuciones Multivariantes

Tema 6: Distribuciones Multivariantes Tema : Distribuciones Multivariantes. Distribución conjunta de un vector aleatorio. Distribución conjunta de un vector aleatorio. Distribuciones marginales condicionadas.3 Independencia entre variables

Más detalles

3 ANALISIS DESCRIPTIVO DE LOS DATOS

3 ANALISIS DESCRIPTIVO DE LOS DATOS 3 ANALISIS DESCRIPTIVO DE LOS DATOS 3.1 La tabulación de los datos 3.1.1 Tabla de distribución de frecuencias. 3.1.2 El histograma. 3.2 Medidas de tendencia central 3.2.1 La media. 3.2.2 La mediana. 3.2.3

Más detalles

Ventanas de SPSS 1 y resultados de los análisis estadísticos descriptivos

Ventanas de SPSS 1 y resultados de los análisis estadísticos descriptivos Ventanas de SPSS 1 y resultados de los análisis estadísticos descriptivos Al poner en funcionamiento el programado SPSS, aparecen dos ventanas una sobre la otra. La ventana que aparece en el fondo es la

Más detalles

El Principio de los Mínimos. Cuadrados

El Principio de los Mínimos. Cuadrados El Principio de los Mínimos La regresión trata de generar la ecuación de mejor ajuste --- pero qué es lo mejor? Criterio: minimizar la suma de las desviaciones cuadradas de los puntos de datos de la regresión

Más detalles