UNIVERSIDD DE CIENCIS EMPRESRILES Y SOCILES Facultad de Psicología y Ciencias Sociales Carrera Sociología Curso ESTDÍSTIC STIC I Clase 6: nálisis de Correlación n Lineal Simple Prof. Titular: Lic. Rubén n José Rodríguez Prof. djunta: Lic. Micaela Bazzano Segundo Cuatrimestre 2012 utor: Lic. Rubén José Rodríguez 1
OBJETIVOS DE PRENDIZJE Correlación de Correlación Lineal Simple Comprender las medida de la relación entre variables métricas y variables ordinales Diferenciar correlación de causalidad. Reconocer independencia y dependencia estadística entre variables. Interpretar un diagrama de dispersión. Comprender los conceptos de desvío, varianza y covarianza. Calcular el Coeficiente de Correlación r de Pearson. Interpretar el r en términos de sus coeficientes derivados. plicar análisis bivariados con datos 1rios y 2rios. utor: Lic. Rubén José Rodríguez 2
VRINZ Y COVRINZ Varianza: Medida de dispersión paramétrica, igual a la media de los cuadrados de las devíos (X-M) de los datos de una distribución respecto de la media. 2 2 Se simboliza con X y s x para la población y la muestra Covarianza: Medida estadística paramétrica que expresa el grado de variación conjunta de dos variables. Es la medida de la suma de los productos entre las desviaciones respecto de su media, de los valores de X e Y. La Cov se basa en las unidades de medida originales de las dos variables. Por eso no varía entre 1 a +1, ni se puede comparar. Se standariza dividiendo su 2 2 fórmula por las X y Y, lo que da lugar al Coeficiente de Correlación Producto-Momento r de Pearson. utor: Lic. Rubén José Rodríguez 3
KRL PERSON CREDOR DE L ESTDÍSTIC PLICD utor: Lic. Rubén José Rodríguez 4
COVRINZ Y FÓRMUL GENERL DEL COEFICIENTE DE CORRELCIÓN r DE PERSON (a) 1 n (x, y) = ( - ) (Y- ) j x j y n j1 Cov X r xy, n j1 ( X X) ( Y Y) j n X J y utor: Lic. Rubén José Rodríguez 5
COEFICIENTE DE CORRELCIÓN r DE PERSON (b) n r xy j1 X X* Y Y n* * X Y utor: Lic. Rubén José Rodríguez 6
r xy, COEFICIENTE DE CORRELCIÓN r DE PERSON (c) n n j1 ( X X) ( Y Y) j n n ( X X) 2 ( Y Y) 2 i i j1 j1 n n j 1 r * z * z xy x y n utor: Lic. Rubén José Rodríguez 7
CORRELCIÓN ENTRE VRIBLES Correlación indica relación recíproca. En Estadística, designa no una relación recíproca, sino la correspondencia en las pautas de variación de dos o más variables. La covariación puede no deberse a una relación de influencia entre las variables, no implica causalidad. El grado de correlación entre las variables es medido mediante el cálculo de los coeficientes de correlación. utor: Lic. Rubén José Rodríguez 8
COEFICIENTE r de PERSON Coeficiente de Correlación lineal y paramétrico, que sirve para determinar el grado y signo de la covariación entre dos variables de nivel intervalar. Puede variar de 1 a +1, indicando la fuerza o intensidad de la relación y el sentido o dirección: ( 1 r +1) x,y Requiere que las variables se distribuyan normalmente. Los puntos en el diagrama de dispersión deben ajustarse al modelo de la ecuación de la línea recta. Y = a + b. X La herogeneidad o dispersión a lo largo de la recta, debe ser aproximadamente la misma (homocedasticidad). utor: Lic. Rubén José Rodríguez 9
INDEPENDENCI ESTDÍSTIC Son independientes dos o más variables cuando la variación de los valores de una variable no está relacionada con la variación de los valores de las otras. El r es igual a 0. Dos sucesos son independientes, cuando la probabilidad de ocurrencia de uno no depende, o es la misma tenga o no tenga lugar el otro suceso. utor: Lic. Rubén José Rodríguez 10
VRIBLES INDEPENDIENTES Y DEPENDIENTES Variables independientes que en la investigación se estudian como no dependientes en su variación de otras variables, sino que, al contrario, mediante ellas se pretende explicar la variación de las variables dependientes. Variables dependientes que en su variación, dependen de otras variables, que determinan el alcance y sentido de las modificaciones que en ellas se observan. Son las que se quieren estudiar y explicar en la investigación. utor: Lic. Rubén José Rodríguez 11
Comparación de diagramas de dispersión (Razón alumnos-cargo*nbi) Ciclo Inicial Ciclo EGB Ciclo Medio Ciclo Especial Ciclo Form. Prof Ciclo CEC Ciclo CENS Ciclo Educ. rt. Ciclo Superior Ciclo dultos Ciclo Ed. Física utor: Lic. Rubén José Rodríguez 12
Coeficiente r: 0,87 Coeficiente r 2 : 0,75 utor: Lic. Rubén José Rodríguez 13
Coeficiente r: 0,97 Coeficiente r 2 : 0,93 utor: Lic. Rubén José Rodríguez 14
Coeficiente r: 0,94 Coeficiente r 2 : 0,89 utor: Lic. Rubén José Rodríguez 15
Coeficiente r: - 0,66 Coeficiente r 2 : 0,43 utor: Lic. Rubén José Rodríguez 16
Coeficiente r: 0,15 Coeficiente r 2 : 0,02 utor: Lic. Rubén José Rodríguez 17
Coeficiente r: 0,70 Coeficiente r 2 : 0,48 utor: Lic. Rubén José Rodríguez 18
Coeficiente r: 0,42 Coeficiente r 2 : 0,17 utor: Lic. Rubén José Rodríguez 19
Coeficiente r: 0,42 Coeficiente r 2 : 0,18 utor: Lic. Rubén José Rodríguez 20
Coeficiente r: 0,78 Coeficiente r 2 : 0,60 utor: Lic. Rubén José Rodríguez 21
Coeficiente r: 0,72 Coeficiente r 2 : 0,52 utor: Lic. Rubén José Rodríguez 22
Coeficiente r: 0,19 Coeficiente r 2 : 0,04 utor: Lic. Rubén José Rodríguez 23
Comparación de Diagramas de Dispersión (Puntajes de Tests Mentales y de Rendimiento Nivel intelectual * Madurez lectora Lector de 36 alumnos de EGB) Nivel intelectual * Comprensión Nivel intelectual * Memoria General Nivel intelectual * Cálculo Madurez lectora * Velocidad lectora Velocidad lectora * Comprensión Nivel de vocabulario * Comprensión utor: Lic. Rubén José Rodríguez 24
4 8 Coeficiente r: 0,70 Coeficiente r 2 : 0,49 Madurez Lectora Nivel Intelectual 18 43 17 30 7 18 12 23 15 19 6 22 7 26 10 20 9 19 4 18 2 12 7 17 20 29 9 22 10 20 13 25 11 15 2 11 16 33 8 28 3 24 9 20 4 13 2 14 19 27 14 22 15 28 9 19 8 18 11 20 10 20 13 24 10 21 4 18 10 10 3 14 utor: Lic. Rubén José Rodríguez 25
Ejercicio SPSS-Regresión Simple Fichero LTUR nalizar > Correlaciones > Bivariadas Coeficiente de Correlación r de Pearson Edad del CHICO ltura del CHICO Matriz de Correlaciones Correlación de Pearson Sig. (bilateral) N Correlación de Pearson Sig. (bilateral) N **. La correlación es significativa al nivel 0,01 (bilateral). Edad del ltura del CHICO CHICO 1,962**.,000 339 339,962** 1,000. 339 339 Fuente: Etxcheberría, Juan (1999). Regresión Múltiple, Cuadernos de Estadística nº 4, Madrid: Editorial La Muralla-Hespérides. utor: Lic. Rubén José Rodríguez 26
Ejercicio SPSS-Regresión Simple Fichero LTUR nalizar > Regresión > Lineal Modelo 1 Variables introducidas/eliminadas b Variables Variables introducidas eliminadas Método Edad del CHICO a. Introducir a. Todas las variables solicitadas introducidas b. Variable dependiente: ltura del CHICO Modelo 1 Resumen del modelo R cuadrado Error típ. de la R R cuadrado corregida estimación,962 a,926,925 6,927 a. Variables predictoras: (Constante), Edad del CHICO utor: Lic. Rubén José Rodríguez 27
Ejercicio SPSS-Regresión Simple Fichero LTUR nalizar > Regresión > Lineal Identificación de casos atípicos (outliers) Número de caso 290 324 330 Diagnósticos por caso a ltura del Valor Residuo tip. CHICO pronosticado Residuo bruto -3,009 154 174,85-20,85-4,209 151 180,16-29,16-3,776 154 180,16-26,16 a. Variable dependiente: ltura del CHICO utor: Lic. Rubén José Rodríguez 28
Ejercicio SPSS-Regresión Simple Fichero LTUR nalizar > Regresión > Lineal Modelo 1 Regresión Residual Total NOV b Suma de Media cuadrados gl cuadrática F Sig. 201226,814 1 201226,814 4193,343,000 a 16171,687 337 47,987 217398,501 338 a. Variables predictoras: (Constante), Edad del CHICO b. Variable dependiente: ltura del CHICO Modelo 1 (Constante) Edad del CHICO Coeficientes a Coeficientes no estandarizados a. Variable dependiente: ltura del CHICO Coeficientes estandarizad os B Error típ. Beta t Sig. 89,900,903 99,586,000 5,309,082,962 64,756,000 utor: Lic. Rubén José Rodríguez 29
Ecuación de regresión: ESTTUR = f (EDD) Modelo 1 (Constante) Edad del CHICO Coeficientes a Coeficientes no estandarizados a. Variable dependiente: ltura del CHICO Coeficientes estandarizad os B Error típ. Beta t Sig. 89,900,903 99,586,000 5,309,082,962 64,756,000 Y a b * X i 1 1 Y b b * X i 0 1 1 Y 1 = 89,00+5,309*X 1 = 89,00+5,309*EDD= ESTTUR=89,00+5,309*12 años= 152,7 08 cm. Y c = Y = 152,708 cm. utor: Lic. Rubén José Rodríguez 30
Ecuación de estimación de ESTTUR verdadera Modelo 1 Resumen del modelo R cuadrado Error típ. de la R R cuadrado corregida estimación,962 a,926,925 6,927 a. Variables predictoras: (Constante), Edad del CHICO Y Y 1, 96 z* S c o Y X Y c = 143 cm. ± 1,96 * 6,927 = 143 ± 13,577= Límite Inferior: ESTTUR (estimada) = 143-13,577 = 129, 423 cm. Límite Superior: ESTTUR (estimada) = 143+13,577 = 156,577 cm. 152,708 cm. ESTTUR estimada por la Ecuación de Regresión en función de EDD 143 cm. Media ritmética de los n = 339 chicos de 2 a 17 años. 158,60 cm. Media ritmética de los n = 20 chicos de 12 años. utor: Lic. Rubén José Rodríguez 31
Gráfico Convencional Diagrama de Dispersión Simple LTUR del chico según 200 la EDD del chico 180 160 140 120 100 80 0 2 4 6 8 10 12 14 16 Edad del CHICO utor: Lic. Rubén José Rodríguez 18 32 Etxeberría, Rafaél (1999). Regresión Múltiple. Cuadernos de Estadística n 4. Madrid: Editorial Hespérides-La Muralla, pp. 6-51 ltura del CHICO
utor: Lic. Rubén José Rodríguez 33 Gráfico Interactivo Recta de Regresión Lineal Simple Regresión lineal 4 8 12 16 Edad del CHICO 100 125 150 175 ltura del CHICO 290 324 330 1ltura del CHICO = 89,90 + 5,31 * edad R-cuadrado = 0,93 LTUR del chico en funcion de la EDD del chico Etxeberría, Rafaél (1999). Regresión Múltiple. Cuadernos de Estadística n 4. Madrid: Editorial Hespérides-La Muralla, pp. 6-51 0 1 1 * i Y b b X ESTTUR=89,00+5,309*12 años= 152,708 cm.
utor: Lic. Rubén José Rodríguez 34 Gráfico Interactivo Recta de Regresión Lineal Simple. Suma de Cuadrado Total 2 ( ) o SCT Y Y Etxeberría, Rafaél (1999). Regresión Múltiple. Cuadernos de Estadística n 4. Madrid: Editorial Hespérides-La Muralla, pp. 6-51 LTUR del chico en funcion de la EDD del chico Media 4 8 12 16 Edad del CHICO 100 125 150 175 ltura del CHICO 290 324 330 Media = 143
utor: Lic. Rubén José Rodríguez 35 Gráfico Interactivo Recta de Regresión Lineal Simple. Intervalo de Confianza de la Ecuación del estimación de Yc Etxeberría, Rafaél (1999). Regresión Múltiple. Cuadernos de Estadística n 4. Madrid: Editorial Hespérides-La Muralla, pp. 6-51 Regresión lineal con Intervalo de predicción individual al 95,00% 4 8 12 16 Edad del CHICO 100 125 150 175 ltura del CHICO 290 324 330 1ltura del CHICO = 89,90 + 5,31 * edad R-cuadrado = 0,93 LTUR del chico en funcion de la EDD del chico Y = 152,708 cm. ± 1,96 * 6,927 = 152,708 ± 13,577= 139,131 166,357 1, 96 * x c y Y Y z S