Aálisis Descriptivo Presetació de Datos e Dos Variables Aálisis de Correlació Lieal Regresió Lieal SPSS & Ecel Prof. Gaspar Torres Rivera Math. 98
Supuestos: La muestra de datos bivariados (, ) represeta ua muestra aleatoria Los pares ordeados proviee de ua Distribució Biomial Bivariable, para cualquier valor fijo de, los valores correspodietes de tega ua distribució e forma de campaa, que para cualquier valor fijo de los valores de tega ua distribució e forma de campaa). Coeficiete de correlació lieal producto mometo de Pearso (Karl Pearso 1857-1936) (r ) mide la itesidad de la relació lieal etre los valores de ua muestra. El valor de r siempre está etre -1 +1. El valor de r o cambia si todos los valores de cualquier de las variables se covierte a ua escala diferete. No es u problema de causa-efecto. Eiste modelos de correlació o lieal: Cuadráticas Epoecial Logarítmicas Trigoométricas, etre otras Tipo de correlació Negativa Positiva Cero
Magitud de la correlació (+/-) Alta 0.85-0.99 Moderada 0.50-0.84 Baja 0.00-0.49 r ( ) ( )( ) [ ( ) ( ) ] ( ) ( ) [ ]
Propiedades del coeficiete de correlació lieal r El valor de r está etre -1 +1. Iclue a los valores -1 +1. La relació de las variables es directa lieal. Las variables tiee que estar e térmios de itervalo/razó. El valor de r o cambia si todos los valores de cualquiera de las variables se covierte a ua escala diferete. r r El valor de r o cambia si escogemos o. Cocepto de ormalidad Errores comues respecto a la correlació Debemos teer cuidado de evitar cocluir que la correlació implica causalidad. Otra fuete de error potecial so los datos basados e tasas o promedios. U tercer error tiee que ver co la propiedad liear (Otras correlacioes)
Características del coeficiete de correlació lieal r E las variables correlacioadas, éstas o so idetificadas como idepediete o depediete porque el ivestigador mide ua relació etre dos variables. La causalidad o implica correlació. E. Núm. acimieto de bebés el úmero de cigüeñas. El coeficiete de correlació lieal es medido e relacioes lieales. La correlació tiee dos compoetes: fortaleza direcció. Ua correlació de cero (0) o es u idicador de o relació. r r Ejemplos de casos de correlació: Si la dosis de Hepari aumeta, etoces el Partial Throboplai Time (PTT) aumeta. Si el ivel de oígeo atmosférico dismiue, etoces el ivel de hemoglobia de la sagre aumeta. Si el ivel de cocetració de aspiria aumeta, etoces la agregació de platolet dismiue. Al aumetar la dosis de Dopamie Hdrochloride, tiede aumetar el ivel de presió saguíea del paciete.
Ejemplo #1 Los datos que sigue perteece al residuo de Cl (partes por milló) que ha e ua piscia e diversos mometos después de que se ha tratado co sustacias químicas. El tiempo de tratamieto se mide e térmios de horas. Observació X (horas) Y Residuo Cl (ppm) 1 1.8 X Y X Y 4 1.5 3 6 1.4 4 8 1.1 5 10 0.9 Σ Σ Σ Σ Σ
Coteste las siguietes: Calcular ) ( ) ( Calcular el coeficiete de correlació lieal de Pearso ( ) r Eiste correlació lieal etre las variables idepediete depediete? Eplique el modelo de predicció. Calcular los promedios las desviacioes estádar s s,,,
Magitud de la correlació (+/-) Alta 0.85-0.99 Moderada 0.50-0.84 Baja 0.00-0.49 r ( ) ( )( ) [ ( ) ( ) ] ( ) ( ) r 0.9918 0.99 [ ]
Correlatios tiempo de tratamieto residuo de Cloro tiempo de tratamieto Pearso Correlatio 1.000 -.99** Sig. (-tailed)..001 N 5 5 residuo de Cloro Pearso Correlatio -.99** 1.000 Sig. (-tailed).001. N 5 5 **. Correlatio is sigificat at the 0.01 level (-tailed). Diagrama de Dispersió Es ua gráfica de datos (,) pareados co u eje de (horizotal) u eje de vertical. Nota: r r +1.00
Ejemplo Supoer que los siguietes datos represeta a pacietes co emphsema co las variables: úm. de años que el paciete está fumado e ihalado el el porcetaje de dismiució e la capacidad pulmoar (%). Paciete Tiempo fumado (años) Dismiució Capacidad Pulmoar (%) 1 5 55 36 60 3 50 4 15 30 5 48 75 6 39 70 7 4 70 8 31 55 9 8 30 10 33 35
Coteste las siguietes: Calcular ) ( ) ( Calcular el coeficiete de correlació lieal de Pearso ( ) r Eiste correlació lieal etre las variables idepediete depediete? Eplique el modelo de predicció. Calcular los promedios las desviacioes estádar s s,,,
r ( ) ) ( )( ) [ ( ) ( ) ] ( ) ( ) [ ] 10( 18055) ( 319)( 530) ( 11053) ( 319) 10 30600 [ 10 ][ ( ) ( 530) ] 11480 11480 [ 110530 101761 ][ 306000 80900 ] [ 8769 ][ 5100 ] 11480 0101900 11480 14835.83 0.774 Por lo tato eiste correlació lieal moderada positiva etre el tiempo que lleva Fumado la dismiució de la capacidad pulmoar de los pacietes co emphsema
Ejemplo E el artículo A Multistate Aalsis of Active Life Epectac, dos de las variables estudiadas fuero la edad actual de u paciete su epectativa de vida (tiempo restate por vivir). Paciete Edad (años) Epectativa de vida (años) 1 83 6. 65 16.4 3 67 15. 4 69 13.6 5 71 1. 6 73 11. 7 75 10. 8 77 9.1 9 79 8.4 10 81 7.
r ( ) ) ( )( ) [ ( ) ( ) ] ( ) ( ) [ ] 10( 7933.7) ( 740)( 109.7) [ 10( 55090) ( 740) ] 10 ( 1306.94 ) ( 109.7 ) [ ] 1841 [ 3300][ 1035.31] 1841 341653 1841 1848.38 0.996 Por lo tato eiste correlació lieal alta egativa etre la edad la epectativa de de vida de los pacietes.
Coteste las siguietes: Calcular ) ( ) ( Calcular el coeficiete de correlació lieal de Pearso ( ) r Eiste correlació lieal etre las variables idepediete depediete? Eplique el modelo de predicció. Calcular los promedios las desviacioes estádar s s,,,
Ejemplo: Caso Calidad Calidad de Vida Educació A 10 10 B 13 1 C 18 15 D 0 18 E 15 10 F 11 9 G 1 11 H 6 8 I 9 13 J 8 5 Calidad Educativa (1Bajo a 0Alto) Calidad de Vida (Escala que iclue salud, tasa de desempleo, etre otras)
Coteste las siguietes: Calcular ) ( ) ( Calcular el coeficiete de correlació lieal de Pearso ( ) r Eiste correlació lieal etre las variables idepediete depediete? Eplique el modelo de predicció. Calcular los promedios las desviacioes estádar s s,,,
Ejemplo: U psicólogo eperimetal asevera que mietras más grade (croológicamete) sea u iño, las respuestas de éste e u eperimeto cotrolado so meos irrelevates. Para ivestigar su afirmació se reuiero los siguietes datos: Caso Edad (años) Núm. de respuestas irrelevates A 1 B 4 13 C 5 9 D 6 7 E 6 1 F 7 8 G 9 6 H 9 9 I 10 7 J 1 5
Coteste las siguietes: Calcular ) ( ) ( Calcular el coeficiete de correlació lieal de Pearso ( ) r Eiste correlació lieal etre las variables idepediete depediete? Eplique el modelo de predicció. Calcular los promedios las desviacioes estádar s s,,,
Regresió Lieal El aálisis de regresió lieal busca la ecuació de la recta que describe mejor la relació etre las dos variables. Ua aplicació de esta ecuació es hacer prediccioes. Predecir el éito que tedrá u estudiate e la uiversidad a base de los resultados que obtuvo e los estudios secudarios. La relació etre estas dos variables es ua epresió algebraica que describe la relació matemática etre las dos variables. Ejemplos de Modelos o Ecuacioes de Predicció: Lieal Cuadrática Epoecial Logarítmica Otras Si u modelo de líea recta parece idóeo, etoces la recta de mejor ajuste se ecuetra aplicado el Método de Míimo de Cuadrados.
La ecuació de la recta de mejor ajuste es determiada por su pediete (B) su ordeada (A). A A + B B dode ( ) B ( ) ( )( ) ( ) ( ) B es la pediete de la recta de regresió lieal A es el itercepto de o corte del eje de por la recta. Al hacer prediccioes a base de la recta de mejor ajuste, es ecesario observar las siguietes propiedades: La ecuació debe usarse para hacer prediccioes sólo acerca de la població de la cual se etrajo la muestra. La ecuació debe usarse sólo detro del domiio muestral de la variable de etrada. Si la muestra fue medida e el año 1994, o espere que los resultados sea válidos para 199 o 040.,
OLS: Método de los Míimos Cuadrados E los modelos siguietes los errores describe los efectos de todos los factores o cosiderados. Tiee ua media de 0 variaza costate. Normalidad, idepedecia liealidad (supuestos matemáticos sigificacia de la regresió. Residuales so las discrepacias etre el modelo los datos empíricos que pretede ajustar al mismo. R ( 100) Detecció E de "outliers" es el porcetaje de variaza de la variable depediete que es eplicado (coteto eperimetal) o compartido por las variables. No es causaefecto. Població Muestra Recta de mejor α + β + ε ( µ 0, ) ' i i dode Ei ~ N σ Dis tacia de Mahalaobis (SPSS) : D A + B + e ajuste i ( ) i s A + B
OLS: Método de los Míimos Cuadrados R ( 100) es R ( ) / ( ) la razó de var iació eplicada a var iació total
Ejemplos Costruir la ecuació de regresió lieal para cada ejemplo dado e clase. Costruir el Diagrama de Dispersió para cada ejemplo dado e clase. Trazar la recta de mejor ajuste sobre el Diagrama de Dispersió para cada ejemplo dado e clase. Utiliza el programa de computadoras Ecel.
Itercepto de (Corte e el eje de ) B( ) A ppm Pediete de la recta de mejor ajuste B ( ) ( )( ) ( ) ( ) 0.11 Ecuació de Regresió Lieal A + B + ( 0.11) 0.11
Valores Esperados o Teóricos () 0.11 0.11 ( ) 1.78 ppm 0.11 0.11 ( 10 ) 0.90 ppm Pares ordeados (, 1.78 ) ( 10, 0.90 )
Model 1 Model Summar Adjusted Std. Error of R R Square R Square the Estimate.99 a.984.978 5.164E-0 a. Predictors: (Costat), tiempo de tratamieto Coefficiets a Model 1 a. (Costat) tiempo de tratamieto Depedet Variable: residuo de Cloro Stadardi zed Ustadardized Coefficie Coefficiets ts B Std. Error Beta t Sig..000.054 36.97.000 -.110.008 -.99-13.47.001 Model 1 Regressio Residual Total ANOVA b Sum of Squares df Mea Square F Sig..484 1.484 181.500.001 a 8.000E-03 3.667E-03.49 4 a. Predictors: (Costat), tiempo de tratamieto b. Depedet Variable: residuo de Cloro
Relació etre el tiempo de tratamieto de la piscia el residuo de Cl después de diversos mometos Residuo de Cl.0 1.8 1.6 1.4 1. 1.0 0.8 0.6 0.4 0. 0.0-0.11 + R 0.9837 0 4 6 8 10 1 Tiempo (horas) Residuo de Cl Lieal (Residuo de Cl)
Qué sigifica B? E. U aálisis de regresió lieal relacioa el peso e libras la estatura e pulgadas muestra la ecuació: 130.0 + 5 Esto idica que si la estatura de u paciete es aumetada por 1 pulgada, el peso promedio esperado es aumetado por 5 libras o sea la razó 1:5. Qué sigifica A? 119.0 + 0.0719 Icome ; Tuitio (average )ad Icome (Md)