RESUMEN DISTRIBUCIONES BIDIMENSIONALES J. Vega RELACIONES LABORALES ESTADÍSTICA 15 de noviembre de 2008
RESUMEN 1 DISTRIBUCIONES BIDIMENSIONALES DISTRIBUCIÓN CONJUNTA DISTRIBUCIONES MARGINALES DISTRIBUCIONES CONDICIONADAS 2 GRÁFICAS DIAGRAMA DE BARRAS TRIDIMENSIONAL DIAGRAMA DE DISPERSIÓN o NUBE DE PUNTOS 3 DEPENDENCIA FUNCIONAL INDEPENDENCIA DEPENDENCIA ESTADÍSTICA COVARIANZA
RESUMEN 4 REGRESIÓN REGRESIÓN LINEAL 5 CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL. r
DISTRIBUCIONES BIDIMENSIONALES INTRODUCCIÓN Siguiente Paso Buscar relaciones entre la variables.(no se asegurará causalidad) Realizar un estudio conjunto de dos variables. Aunque se pueden estudiar conjuntamente: Cualitativa-Cualitativa (Sexo-Situación Laboral) Cualitativa-Cuantitativa (Estado Civil-Edad) Cuantitativa-Cuantitativa (Edad-Número Semanal de Horas de Trabajo) Nos centraremos en el estudio conjunto de dos variables Cuantitativas
DISTRIBUCIONES BIDIMENSIONALES INTRODUCCIÓN Siguiente Paso Buscar relaciones entre la variables.(no se asegurará causalidad) Realizar un estudio conjunto de dos variables. Aunque se pueden estudiar conjuntamente: Cualitativa-Cualitativa (Sexo-Situación Laboral) Cualitativa-Cuantitativa (Estado Civil-Edad) Cuantitativa-Cuantitativa (Edad-Número Semanal de Horas de Trabajo) Nos centraremos en el estudio conjunto de dos variables Cuantitativas
DISTRIBUCIONES BIDIMENSIONALES DISTRIBUCIÓN CONJUNTA DISTRIBUCIONES MARGINALES DISTRIBUCIONES CONDICIONADAS 1 DISTRIBUCIONES BIDIMENSIONALES DISTRIBUCIÓN CONJUNTA DISTRIBUCIONES MARGINALES DISTRIBUCIONES CONDICIONADAS 2 GRÁFICAS DIAGRAMA DE BARRAS TRIDIMENSIONAL DIAGRAMA DE DISPERSIÓN o NUBE DE PUNTOS 3 DEPENDENCIA FUNCIONAL INDEPENDENCIA DEPENDENCIA ESTADÍSTICA COVARIANZA
DISTRIBUCIONES BIDIMENSIONALES DISTRIBUCIÓN CONJUNTA DISTRIBUCIONES MARGINALES DISTRIBUCIONES CONDICIONADAS Variables X e Y Población: Empleados de una empresa. (n=10) X =Años de antigüedad en el trabajo. Y =Número de Accidentes Laborales en el último año. Datos (X, Y) Se denomina: Variable Bidimensional. (2,2),(2,3),(2,3),(3,2),(3,2),(4,1),(4,2),(5,1),(5,1),(5,1)
DISTRIBUCIONES BIDIMENSIONALES DISTRIBUCIÓN CONJUNTA DISTRIBUCIONES MARGINALES DISTRIBUCIONES CONDICIONADAS Variables X e Y Población: Empleados de una empresa. (n=10) X =Años de antigüedad en el trabajo. Y =Número de Accidentes Laborales en el último año. Datos (X, Y) Se denomina: Variable Bidimensional. (2,2),(2,3),(2,3),(3,2),(3,2),(4,1),(4,2),(5,1),(5,1),(5,1)
DISTRIBUCIONES BIDIMENSIONALES Distribución Conjunta DISTRIBUCIÓN CONJUNTA DISTRIBUCIONES MARGINALES DISTRIBUCIONES CONDICIONADAS Las tablas de frecuencias de la distribución conjunta se presenta en una tabla de doble entrada. Tabla de Frecuencias Absolutas Y X 1 2 3 2 0 1 2 3 3 0 2 0 2 4 1 1 0 2 5 3 0 0 3 4 4 2 10
DISTRIBUCIONES BIDIMENSIONALES DISTRIBUCIÓN CONJUNTA DISTRIBUCIONES MARGINALES DISTRIBUCIONES CONDICIONADAS k= es el número de modalidades de X p= número de modalidades de Y n ij = número de veces que aparece el par (x i, y j ) se tiene: Ordenadas las variables: x 1 < x 2 < < x k, y 1 < y 2 < < y p Tabla de Frecuencias Absolutas X Y y 1 y 2 y j y p x 1 n 11 n 12 n 1j n 1p n 1 x 2 n 21 n 22 n 2j n 2p n 2............ x i n i1 n i2 n ij n ip n i............ x k n k1 n k2 n kj n kp n k n 1 n 2 n j n p n = n
DISTRIBUCIONES BIDIMENSIONALES DISTRIBUCIÓN CONJUNTA DISTRIBUCIONES MARGINALES DISTRIBUCIONES CONDICIONADAS Tabla de Frecuencias Relativas Se obtiene sustituyendo las n ij por f ij = n ij n Ejemplo Y X 1 2 3 2 0 0.1 0.2 0.3 3 0 0.2 0 0.2 4 0.1 0.1 0 0.2 5 0.3 0 0 0.3 0.4 0.4 0.2 1
DISTRIBUCIONES BIDIMENSIONALES Distribuciones Marginales DISTRIBUCIÓN CONJUNTA DISTRIBUCIONES MARGINALES DISTRIBUCIONES CONDICIONADAS Las variables unidimensionales X e Y se denominan marginales. X =Años de antigüedad en el trabajo. Y =Número de Accidentes Laborales en el último año. Sus frecuencias absolutas aparecen en los márgenes derecho e inferior de la tabla de doble entrada. Marginal X x i n i 2 3 3 2 4 2 5 3 10 Marginal Y y i n i 1 4 2 4 3 2 10
DISTRIBUCIONES BIDIMENSIONALES DISTRIBUCIÓN CONJUNTA DISTRIBUCIONES MARGINALES DISTRIBUCIONES CONDICIONADAS Ejercicio Calcular el número medio de años de antigüedad en el trabajo y su desviación típica. (Media y desviación típica de la marginal X) Marginal X x i n i x i n i xi 2n i 2 3 6 12 3 2 6 18 4 2 8 32 5 3 15 75 10 35 137 X = 35 10 = 3,5 S 137 X = 10 3,52 = 1,2042 SX 2 = 1,45
DISTRIBUCIONES BIDIMENSIONALES DISTRIBUCIÓN CONJUNTA DISTRIBUCIONES MARGINALES DISTRIBUCIONES CONDICIONADAS Ejercicio Calcular el número medio de accidentes en el último año y su desviación típica. (Media y Desviación Típica de la marginal Y.) Marginal Y y i n i y i n i yi 2n i 1 4 4 4 2 4 8 16 3 2 6 18 10 18 38 Y = 18 10 = 1,8 S 38 Y = 10 1,82 = 0,7483 SY 2 = 0,56
Marginal X DISTRIBUCIONES BIDIMENSIONALES x i n i x 1 n 1 x 2 n 2. x k. n k n DISTRIBUCIÓN CONJUNTA DISTRIBUCIONES MARGINALES DISTRIBUCIONES CONDICIONADAS Marginal Y y j n j y 1 n 1 y 2 n 2. y p. n p n X = k i=1 x in i n Y = p i=1 y jn j n S X = k i=1 x i 2n i X 2 n S Y = p j=1 y i 2n j Y 2 n
DISTRIBUCIONES BIDIMENSIONALES Distribuciones Condicionadas DISTRIBUCIÓN CONJUNTA DISTRIBUCIONES MARGINALES DISTRIBUCIONES CONDICIONADAS Problema Obtener el número medio de accidentes de los empleados que tiene dos años de antigüedad en la empresa. Calcular también su desviación típica. Distribución y i n i y i n i yi 2n i 1 0 0 0 2 1 2 4 3 2 6 18 3 8 22
DISTRIBUCIONES BIDIMENSIONALES DISTRIBUCIÓN CONJUNTA DISTRIBUCIONES MARGINALES DISTRIBUCIONES CONDICIONADAS Estas distribuciones se denominan Distribuciones Condicionadas, en este caso, distribución de Y condicionada a X=2 y se representa como: Y X=2 Media y D. Típica Condicionada Y X =2 = 8 3 = 2,6667 S Y X =2 = 22 3 2,66672 = 0,4714 En este sentido tendremos las siguientes distribuciones condicionadas: Y X =2, Y X =3, Y X =4, Y X =5
DISTRIBUCIONES BIDIMENSIONALES DISTRIBUCIÓN CONJUNTA DISTRIBUCIONES MARGINALES DISTRIBUCIONES CONDICIONADAS Problema Obtener la antigüedad media de los empleados que presentaron dos accidentes el último año. Calcule también la desviación típica. Distribución x i n i x i n i xi 2n i 2 1 2 4 3 2 6 18 4 1 4 16 5 0 0 0 4 12 38
DISTRIBUCIONES BIDIMENSIONALES DISTRIBUCIÓN CONJUNTA DISTRIBUCIONES MARGINALES DISTRIBUCIONES CONDICIONADAS Esta distribución condicionada se denomina, X condicionada a Y=2 y se representa como: X Y=2 Media y D. Típica Condicionada X Y =2 = 12 4 = 3 38 S X Y =2 = 4 32 = 0,7071 En este sentido tendremos las siguientes distribuciones condicionadas: X Y =1, X Y =2, X Y =3
DISTRIBUCIONES BIDIMENSIONALES DIAGRAMA DE BARRAS DIAGRAMA DE DISPERSIÓN 1 DISTRIBUCIONES BIDIMENSIONALES DISTRIBUCIÓN CONJUNTA DISTRIBUCIONES MARGINALES DISTRIBUCIONES CONDICIONADAS 2 GRÁFICAS DIAGRAMA DE BARRAS TRIDIMENSIONAL DIAGRAMA DE DISPERSIÓN o NUBE DE PUNTOS 3 DEPENDENCIA FUNCIONAL INDEPENDENCIA DEPENDENCIA ESTADÍSTICA COVARIANZA
DISTRIBUCIONES BIDIMENSIONALES DIAGRAMA DE BARRAS DIAGRAMA DE DISPERSIÓN Ejemplo Y 1 2 3 X 2 0 1 2 3 3 0 2 0 2 4 1 1 0 2 5 3 0 0 3 4 4 2 10
DISTRIBUCIONES BIDIMENSIONALES DIAGRAMA DE BARRAS DIAGRAMA DE DISPERSIÓN Diagrama de barras tridimensional
DISTRIBUCIONES BIDIMENSIONALES DIAGRAMA DE BARRAS DIAGRAMA DE DISPERSIÓN Diagrama de barras tridimensional n ij 3-2 - 1 - X 5 4 3 2 1 1 2 3 Y
DISTRIBUCIONES BIDIMENSIONALES DIAGRAMA DE BARRAS DIAGRAMA DE DISPERSIÓN Diagrama de barras tridimensional n ij 3-2 - 1 - X 5 4 3 2 1 1 2 3 Y
DISTRIBUCIONES BIDIMENSIONALES DIAGRAMA DE BARRAS DIAGRAMA DE DISPERSIÓN Diagrama de barras tridimensional n ij 3-2 - 1 - X 5 4 3 2 1 1 2 3 Y
DISTRIBUCIONES BIDIMENSIONALES DIAGRAMA DE BARRAS DIAGRAMA DE DISPERSIÓN Diagrama de barras tridimensional n ij 3-2 - 1 - X 5 4 3 2 1 1 2 3 Y
DISTRIBUCIONES BIDIMENSIONALES DIAGRAMA DE BARRAS DIAGRAMA DE DISPERSIÓN Diagrama de barras tridimensional n ij 3-2 - 1 - X 5 4 3 2 1 1 2 3 Y
DISTRIBUCIONES BIDIMENSIONALES DIAGRAMA DE BARRAS DIAGRAMA DE DISPERSIÓN Diagrama de barras tridimensional n ij 3-2 - 1 - X 5 4 3 2 1 1 2 3 Y
DISTRIBUCIONES BIDIMENSIONALES DIAGRAMA DE BARRAS DIAGRAMA DE DISPERSIÓN Diagrama de barras tridimensional n ij 3-2 - 1 - X 5 4 3 2 1 1 2 3 Y
DISTRIBUCIONES BIDIMENSIONALES DIAGRAMA DE BARRAS DIAGRAMA DE DISPERSIÓN Diagrama de barras tridimensional n ij 3-2 - 1 - X 5 4 3 2 1 1 2 3 Y
DISTRIBUCIONES BIDIMENSIONALES DIAGRAMA DE BARRAS DIAGRAMA DE DISPERSIÓN Diagrama de Dispersión o Nube de Puntos El punto (X, Y ) se denomina centro de gravedad de la nube de puntos. 9 8 7 6 5 4 3 2 1 0 1 0 1 2 3 4 5 6 7 8 9 1
DISTRIBUCIONES BIDIMENSIONALES DIAGRAMA DE BARRAS DIAGRAMA DE DISPERSIÓN Diagrama de Dispersión o Nube de Puntos El punto (X, Y ) se denomina centro de gravedad de la nube de puntos. 9 8 7 6 5 4 3 2 1 0 1 0 1 2 3 4 5 6 7 8 9 1
DISTRIBUCIONES BIDIMENSIONALES DIAGRAMA DE BARRAS DIAGRAMA DE DISPERSIÓN Diagrama de Dispersión o Nube de Puntos El punto (X, Y ) se denomina centro de gravedad de la nube de puntos. 9 8 7 6 5 4 3 2 1 0 1 0 1 2 3 4 5 6 7 8 9 1
DISTRIBUCIONES BIDIMENSIONALES DIAGRAMA DE BARRAS DIAGRAMA DE DISPERSIÓN Diagrama de Dispersión o Nube de Puntos El punto (X, Y ) se denomina centro de gravedad de la nube de puntos. 9 8 7 6 5 4 3 2 1 0 1 0 1 2 3 4 5 6 7 8 9 1
DISTRIBUCIONES BIDIMENSIONALES Variables Continuas DIAGRAMA DE BARRAS DIAGRAMA DE DISPERSIÓN Y 0-5 5-10 10-15 X 0-10 5 10 0 15 10-20 0 20 0 20 20-30 0 10 5 15 5 40 5 50
DISTRIBUCIONES BIDIMENSIONALES DIAGRAMA DE BARRAS DIAGRAMA DE DISPERSIÓN Estereograma
DISTRIBUCIONES BIDIMENSIONALES DIAGRAMA DE BARRAS DIAGRAMA DE DISPERSIÓN Diagrama de Dispersión 15 10 5 0 10 20 30
DISTRIBUCIONES BIDIMENSIONALES DEPENDENCIA FUNCIONAL INDEPENDENCIA DEPENDENCIA ESTADÍSTICA COVARIANZA S XY 1 DISTRIBUCIONES BIDIMENSIONALES DISTRIBUCIÓN CONJUNTA DISTRIBUCIONES MARGINALES DISTRIBUCIONES CONDICIONADAS 2 GRÁFICAS DIAGRAMA DE BARRAS TRIDIMENSIONAL DIAGRAMA DE DISPERSIÓN o NUBE DE PUNTOS 3 DEPENDENCIA FUNCIONAL INDEPENDENCIA DEPENDENCIA ESTADÍSTICA COVARIANZA
Introducción DISTRIBUCIONES BIDIMENSIONALES DEPENDENCIA FUNCIONAL INDEPENDENCIA DEPENDENCIA ESTADÍSTICA COVARIANZA S XY Cuando hablamos del estudio conjunto de dos variables nos podemos preguntar: Existe algún tipo de relación entre las variables? Se puede explicar el comportamiento de una de ellas conociendo la otra. Los valores de una de las variables influyen en la distribución de la otra. La variación de una de ellas explica la variación de la otra. Analizando el problema nos encontramos la dependencia estadística y dos casos extremos: Dependencia funcional = Dependencia Estadística= Independencia
DISTRIBUCIONES BIDIMENSIONALES Dependencia Funcional DEPENDENCIA FUNCIONAL INDEPENDENCIA DEPENDENCIA ESTADÍSTICA COVARIANZA S XY Los valores de una variable van a determinar exactamente los valores de la otra. Se dice que Y depende funcionalmente de X si a cada valor de X le corresponde un único valor de Y Ejemplo Y X 10 11 12 3 4 0 0 4 0 0 2 5 0 3 0 Cada fila tiene un único valor significativo.
DISTRIBUCIONES BIDIMENSIONALES DEPENDENCIA FUNCIONAL INDEPENDENCIA DEPENDENCIA ESTADÍSTICA COVARIANZA S XY Se dice que X depende funcionalmente de Y si a cada valor de Y le corresponde un único valor de X Ejemplo Y 6 9 11 X 3 4 0 5 5 0 3 0 Cada columna tiene un único valor significativo. La dependencia funcional no es recíproca, en este último caso Y no depende funcionalmente de X.
Independencia DISTRIBUCIONES BIDIMENSIONALES DEPENDENCIA FUNCIONAL INDEPENDENCIA DEPENDENCIA ESTADÍSTICA COVARIANZA S XY Supongamos que en una facultad hay dos tipos de apuntes de una misma asignatura: Alumnos Aprobados Suspensos Apuntes A 400 300 100 Apuntes B 100 La independencia está asociada a mantener las relaciones.
Independencia DISTRIBUCIONES BIDIMENSIONALES DEPENDENCIA FUNCIONAL INDEPENDENCIA DEPENDENCIA ESTADÍSTICA COVARIANZA S XY Supongamos que en una facultad hay dos tipos de apuntes de una misma asignatura: Alumnos Aprobados Suspensos Apuntes A 400 300 100 Apuntes B 100 La independencia está asociada a mantener las relaciones.
DISTRIBUCIONES BIDIMENSIONALES DEPENDENCIA FUNCIONAL INDEPENDENCIA DEPENDENCIA ESTADÍSTICA COVARIANZA S XY Independencia Se dice que X e Y son independientes si las distribuciones de frecuencias relativas de Y condicionada a los valores de X coinciden (o viceversa). Los valores de una de las variables no dan ninguna información sobre los posibles valores de la otra. No existe ninguna relación entre las variables. La independencia es recíproca. Son Independientes las variables? Y X 1 2 3 5 1 2 1 10 2 4 2
DISTRIBUCIONES BIDIMENSIONALES DEPENDENCIA FUNCIONAL INDEPENDENCIA DEPENDENCIA ESTADÍSTICA COVARIANZA S XY Comparemos las distribuciones de frecuencias relativas de las variables: Y X =5 y Y X =10 xi ni fi 1 1 0.25 2 2 0.50 3 1 0.25 4 1 yi ni fi 1 2 0.25 2 4 0.50 3 2 0.25 8 1 Las terceras columnas coinciden, son por lo tanto Independientes.
DISTRIBUCIONES BIDIMENSIONALES DEPENDENCIA FUNCIONAL INDEPENDENCIA DEPENDENCIA ESTADÍSTICA COVARIANZA S XY Otra caracterización es comprobar que las filas (columnas) de frecuencias en la tabla de doble entrada son proporcionales. Y 1 2 3 X 5 1 2 1 10 2 4 2
DISTRIBUCIONES BIDIMENSIONALES Dependencia Estadística DEPENDENCIA FUNCIONAL INDEPENDENCIA DEPENDENCIA ESTADÍSTICA COVARIANZA S XY Una vez estudiado los casos extremos, lo que normalmente ocurre, es que los valores de una de las variables dan cierta información sobre la distribución o los valores de la otra. Este tipo de dependencia se denomina Dependencia Estadística Abordaremos el estudio de dicha dependencia desde diferentes puntos de vista. Empezaremos dando una medida para determinar si se trata de una dependencia positiva o directa, o por el contrario, se trata de una dependencia negativa o inversa.
DISTRIBUCIONES BIDIMENSIONALES Dependencia Directa e Inversa DEPENDENCIA FUNCIONAL INDEPENDENCIA DEPENDENCIA ESTADÍSTICA COVARIANZA S XY Directa Dos variables presentan una relación o dependencia positiva o directa si a valores crecientes de X le corresponden valores crecientes de Y. Ejemplos Se espera una dependencia positiva: Inversión de las empresas y ganancias Antigüedad y sueldo...
DISTRIBUCIONES BIDIMENSIONALES DEPENDENCIA FUNCIONAL INDEPENDENCIA DEPENDENCIA ESTADÍSTICA COVARIANZA S XY Inversa Dos variables presentan una relación o dependencia negativa o inversa si a valores crecientes de X le corresponden valores decrecientes de Y Ejemplos Se espera una dependencia negativa: Inversión en prevención de riesgos laborales y número de accidentes. Horas de trabajo y número de suspensos....
Covarianza DISTRIBUCIONES BIDIMENSIONALES DEPENDENCIA FUNCIONAL INDEPENDENCIA DEPENDENCIA ESTADÍSTICA COVARIANZA S XY 9 8 (x i x)(y i y) < 0 7 6 5 (x i x)(y i y) > 0 (x, y) 4 3 (x i x)(y i y) > 0 2 (x i x)(y i y) < 0 1 0 1 0 1 2 3 4 5 6 7 8 9 1
DISTRIBUCIONES BIDIMENSIONALES DEPENDENCIA FUNCIONAL INDEPENDENCIA DEPENDENCIA ESTADÍSTICA COVARIANZA S XY Una medida de la dependencia directa e inversa será: n (x i x)(y i y) i=1 n Covarianza. S XY En la tabla de doble entrada se define: S XY = k p (x i x)(y i y)n ij i=1 j=1 n
DISTRIBUCIONES BIDIMENSIONALES Fórmula Práctica de la Covarianza DEPENDENCIA FUNCIONAL INDEPENDENCIA DEPENDENCIA ESTADÍSTICA COVARIANZA S XY Covarianza. S XY S XY = k p x i y j n ij i=1 j=1 n X Y Interpretación de S XY S XY > 0 = Dependencia Directa S XY = 0 = Incorrelación S XY < 0 = Dependencia Inversa
Ejemplos DISTRIBUCIONES BIDIMENSIONALES DEPENDENCIA FUNCIONAL INDEPENDENCIA DEPENDENCIA ESTADÍSTICA COVARIANZA S XY Dando los pares de datos (2,2),(2,3),(2,3),(3,2),(3,2),(4,1),(4,2),(5,1),(5,1),(5,1) S XY = 2 2 + 2 3 + 2 3 + + 5 1 10 3,5 1,8 = 0,8
DISTRIBUCIONES BIDIMENSIONALES DEPENDENCIA FUNCIONAL INDEPENDENCIA DEPENDENCIA ESTADÍSTICA COVARIANZA S XY Dando la tabla de doble entrada Y X 1 2 3 2 0 1 2 3 3 0 2 0 2 4 1 1 0 2 5 3 0 0 3 4 4 2 10 S XY = 2 2 1 + 2 3 2 + 3 2 2 + 4 1 1 + 4 2 1 + 5 1 3 10 3,5 1,8 = 0,8
REGRESIÓN CORRELACIÓN REGRESIÓN LINEAL 4 REGRESIÓN REGRESIÓN LINEAL 5 CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL. r
REGRESIÓN CORRELACIÓN REGRESIÓN LINEAL Concepto de Regresión Objetivo Buscar la función que exprese lo mejor posible la relación existente entre las variables, con vistas a poder predecir los valores de una de ellas a partir de los valores de la otra. Ver Ejemplos Excel
REGRESIÓN CORRELACIÓN REGRESIÓN LINEAL Regresión Lineal
REGRESIÓN CORRELACIÓN REGRESIÓN LINEAL Regresión Parabólica
REGRESIÓN CORRELACIÓN REGRESIÓN LINEAL Regresión Exponencial
REGRESIÓN CORRELACIÓN REGRESIÓN LINEAL Regresión Lineal Objetivo Buscar la recta que mejor de adapte a la nube de puntos. Criterio El criterio que se utilizará para cuantificar el grado de ajuste es el de mínimos cuadrados.
REGRESIÓN CORRELACIÓN REGRESIÓN LINEAL Regresión Lineal Objetivo Buscar la recta que mejor de adapte a la nube de puntos. Criterio El criterio que se utilizará para cuantificar el grado de ajuste es el de mínimos cuadrados.
REGRESIÓN CORRELACIÓN REGRESIÓN LINEAL Recta de Regresión. Criterio de Mínimos Cuadrados 9 8 y = a + bx 7 6 (x 3, y 3 ) d 3 d 4 (x 4, y 4 ) 5 4 (x 1, y 1 ) 3 2 1 d 1 d 2 (x 2, y 2 ) 0 1 0 1 2 3 4 5 6 7 8 9 1
REGRESIÓN CORRELACIÓN REGRESIÓN LINEAL Objetivo Encontrar la recta y = a + bx que resuelva el problema: mín a,b d 2 1 + d 2 2 + + d 2 n = Solución Existen dos rectas de regresión: n i=1 d 2 i = n (y i (a + bx i )) 2 i=1
REGRESIÓN CORRELACIÓN REGRESIÓN LINEAL Recta de Regresión de Y X Recta que predice el valor de Y conocido el valor de X. b = S XY S y = a + bx X 2 a = Y bx Alternativa y Y = S XY S 2 X (x X )
REGRESIÓN CORRELACIÓN REGRESIÓN LINEAL Recta de Regresión de X Y Recta que predice el valor de X conocido el valor de Y. b = S XY x = a + b S y Y 2 a = X b Y Alternativa x X = S XY S 2 Y (y Y ) Ambas rectas pasan por el centro de gravedad: (X, Y )
REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL 4 REGRESIÓN REGRESIÓN LINEAL 5 CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL. r
REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL Objetivo Medir el grado de ajuste existente entre la nube de puntos y la función ajustada. Es una medida de asociación entre las variables.
REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL Coeficiente de Correlación Lineal Medir el grado de ajuste existente entre la nube de puntos y la recta ajustada. Se representa con la letra r y su valor es: r = S XY S X S Y
Coeficiente de correlación Lineal. r 1 r 1 r = 1 r 1 r = 0 r 1 r = 1 (x, y) CLPI FCLI DCLI INCORRE. DCLD FCLD CLPD CLPI. Correlación Lineal Perfecta e Inversa. El Modelo Lineal es exacto. FCLI. Fuerte Correlación Lineal Inversa. Modelo Lineal adecuado. Predicciones Fiables DCLI. Débil Correlación Lineal Inversa. Modelo Lineal Inadecuado. Incorrelación. Ausencia Total de Correlación Lineal. DCLD. Débil Correlación Lineal Directa. Modelo Lineal Inadecuado. FCLD. Fuerte correlación Lineal Directa. Modelo Lineal adecuado. Predicciones Fiables CLPD. Correlación Lineal Perfecta y Directa. El Modelo Lineal es exacto. Ver Interpr. Excel
Coeficiente de correlación Lineal. r 1 r 1 r = 1 r 1 r = 0 r 1 r = 1 (x, y) CLPI FCLI DCLI INCORRE. DCLD FCLD CLPD CLPI. Correlación Lineal Perfecta e Inversa. El Modelo Lineal es exacto. FCLI. Fuerte Correlación Lineal Inversa. Modelo Lineal adecuado. Predicciones Fiables DCLI. Débil Correlación Lineal Inversa. Modelo Lineal Inadecuado. Incorrelación. Ausencia Total de Correlación Lineal. DCLD. Débil Correlación Lineal Directa. Modelo Lineal Inadecuado. FCLD. Fuerte correlación Lineal Directa. Modelo Lineal adecuado. Predicciones Fiables CLPD. Correlación Lineal Perfecta y Directa. El Modelo Lineal es exacto. Ver Interpr. Excel
Coeficiente de correlación Lineal. r 1 r 1 r = 1 r 1 r = 0 r 1 r = 1 (x, y) CLPI FCLI DCLI INCORRE. DCLD FCLD CLPD CLPI. Correlación Lineal Perfecta e Inversa. El Modelo Lineal es exacto. FCLI. Fuerte Correlación Lineal Inversa. Modelo Lineal adecuado. Predicciones Fiables DCLI. Débil Correlación Lineal Inversa. Modelo Lineal Inadecuado. Incorrelación. Ausencia Total de Correlación Lineal. DCLD. Débil Correlación Lineal Directa. Modelo Lineal Inadecuado. FCLD. Fuerte correlación Lineal Directa. Modelo Lineal adecuado. Predicciones Fiables CLPD. Correlación Lineal Perfecta y Directa. El Modelo Lineal es exacto. Ver Interpr. Excel
Coeficiente de correlación Lineal. r 1 r 1 r = 1 r 1 r = 0 r 1 r = 1 (x, y) CLPI FCLI DCLI INCORRE. DCLD FCLD CLPD CLPI. Correlación Lineal Perfecta e Inversa. El Modelo Lineal es exacto. FCLI. Fuerte Correlación Lineal Inversa. Modelo Lineal adecuado. Predicciones Fiables DCLI. Débil Correlación Lineal Inversa. Modelo Lineal Inadecuado. Incorrelación. Ausencia Total de Correlación Lineal. DCLD. Débil Correlación Lineal Directa. Modelo Lineal Inadecuado. FCLD. Fuerte correlación Lineal Directa. Modelo Lineal adecuado. Predicciones Fiables CLPD. Correlación Lineal Perfecta y Directa. El Modelo Lineal es exacto. Ver Interpr. Excel
Coeficiente de correlación Lineal. r 1 r 1 r = 1 r 1 r = 0 r 1 r = 1 (x, y) CLPI FCLI DCLI INCORRE. DCLD FCLD CLPD CLPI. Correlación Lineal Perfecta e Inversa. El Modelo Lineal es exacto. FCLI. Fuerte Correlación Lineal Inversa. Modelo Lineal adecuado. Predicciones Fiables DCLI. Débil Correlación Lineal Inversa. Modelo Lineal Inadecuado. Incorrelación. Ausencia Total de Correlación Lineal. DCLD. Débil Correlación Lineal Directa. Modelo Lineal Inadecuado. FCLD. Fuerte correlación Lineal Directa. Modelo Lineal adecuado. Predicciones Fiables CLPD. Correlación Lineal Perfecta y Directa. El Modelo Lineal es exacto. Ver Interpr. Excel
Coeficiente de correlación Lineal. r 1 r 1 r = 1 r 1 r = 0 r 1 r = 1 (x, y) CLPI FCLI DCLI INCORRE. DCLD FCLD CLPD CLPI. Correlación Lineal Perfecta e Inversa. El Modelo Lineal es exacto. FCLI. Fuerte Correlación Lineal Inversa. Modelo Lineal adecuado. Predicciones Fiables DCLI. Débil Correlación Lineal Inversa. Modelo Lineal Inadecuado. Incorrelación. Ausencia Total de Correlación Lineal. DCLD. Débil Correlación Lineal Directa. Modelo Lineal Inadecuado. FCLD. Fuerte correlación Lineal Directa. Modelo Lineal adecuado. Predicciones Fiables CLPD. Correlación Lineal Perfecta y Directa. El Modelo Lineal es exacto. Ver Interpr. Excel
Coeficiente de correlación Lineal. r 1 r 1 r = 1 r 1 r = 0 r 1 r = 1 (x, y) CLPI FCLI DCLI INCORRE. DCLD FCLD CLPD CLPI. Correlación Lineal Perfecta e Inversa. El Modelo Lineal es exacto. FCLI. Fuerte Correlación Lineal Inversa. Modelo Lineal adecuado. Predicciones Fiables DCLI. Débil Correlación Lineal Inversa. Modelo Lineal Inadecuado. Incorrelación. Ausencia Total de Correlación Lineal. DCLD. Débil Correlación Lineal Directa. Modelo Lineal Inadecuado. FCLD. Fuerte correlación Lineal Directa. Modelo Lineal adecuado. Predicciones Fiables CLPD. Correlación Lineal Perfecta y Directa. El Modelo Lineal es exacto. Ver Interpr. Excel
Coeficiente de correlación Lineal. r 1 r 1 r = 1 r 1 r = 0 r 1 r = 1 (x, y) CLPI FCLI DCLI INCORRE. DCLD FCLD CLPD CLPI. Correlación Lineal Perfecta e Inversa. El Modelo Lineal es exacto. FCLI. Fuerte Correlación Lineal Inversa. Modelo Lineal adecuado. Predicciones Fiables DCLI. Débil Correlación Lineal Inversa. Modelo Lineal Inadecuado. Incorrelación. Ausencia Total de Correlación Lineal. DCLD. Débil Correlación Lineal Directa. Modelo Lineal Inadecuado. FCLD. Fuerte correlación Lineal Directa. Modelo Lineal adecuado. Predicciones Fiables CLPD. Correlación Lineal Perfecta y Directa. El Modelo Lineal es exacto. Ver Interpr. Excel
REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL Propiedades Sig(b) = sig(b ) = sig(r) = sig(s XY ) Las dos rectas de regresión son; o las dos crecientes o las dos decrecientes, salvo en el caso de incorrelación, que son perpendiculares y paralelas a los ejes. Las dos rectas de regresión se cortan en el centro de gravedad de la nube de puntos (X, Y ), por lo tanto son la solución del sistema: { y = a + bx x = a + b y r = ± b b Será el valor positivo si b y b son positivos y será negativo si b y b son negativos.
REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL Propiedades Sig(b) = sig(b ) = sig(r) = sig(s XY ) Las dos rectas de regresión son; o las dos crecientes o las dos decrecientes, salvo en el caso de incorrelación, que son perpendiculares y paralelas a los ejes. Las dos rectas de regresión se cortan en el centro de gravedad de la nube de puntos (X, Y ), por lo tanto son la solución del sistema: { y = a + bx x = a + b y r = ± b b Será el valor positivo si b y b son positivos y será negativo si b y b son negativos.
REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL Propiedades Sig(b) = sig(b ) = sig(r) = sig(s XY ) Las dos rectas de regresión son; o las dos crecientes o las dos decrecientes, salvo en el caso de incorrelación, que son perpendiculares y paralelas a los ejes. Las dos rectas de regresión se cortan en el centro de gravedad de la nube de puntos (X, Y ), por lo tanto son la solución del sistema: { y = a + bx x = a + b y r = ± b b Será el valor positivo si b y b son positivos y será negativo si b y b son negativos.
REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL Propiedades Sig(b) = sig(b ) = sig(r) = sig(s XY ) Las dos rectas de regresión son; o las dos crecientes o las dos decrecientes, salvo en el caso de incorrelación, que son perpendiculares y paralelas a los ejes. Las dos rectas de regresión se cortan en el centro de gravedad de la nube de puntos (X, Y ), por lo tanto son la solución del sistema: { y = a + bx x = a + b y r = ± b b Será el valor positivo si b y b son positivos y será negativo si b y b son negativos.
REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL Datos (2,2),(2,3),(2,3),(3,2),(3,2),(4,1),(4,2),(5,1),(5,1),(5,1) Tabla de doble entrada Y X 1 2 3 2 0 1 2 3 3 0 2 0 2 4 1 1 0 2 5 3 0 0 3 4 4 2 10
REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL Datos (2,2),(2,3),(2,3),(3,2),(3,2),(4,1),(4,2),(5,1),(5,1),(5,1) Tabla de doble entrada Y X 1 2 3 2 0 1 2 3 3 0 2 0 2 4 1 1 0 2 5 3 0 0 3 4 4 2 10
REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL X = 35 137 = 3,5 Sx = 10 10 3,52 = 1,2042 Sx 2 = 1,45 Sxy = 55 Y = 18 38 = 1,8 Sy = 10 10 1,82 = 0,7483 Sy 2 = 0,56 3,5 1,8 = 0,8 10 Recta de regresión de Y X y = a + bx b = S xy S 2 x = 0,5517 a = Y ( 0,5517)X = 3,73 y = 3,73 0,5517x
REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL X = 35 137 = 3,5 Sx = 10 10 3,52 = 1,2042 Sx 2 = 1,45 Sxy = 55 Y = 18 38 = 1,8 Sy = 10 10 1,82 = 0,7483 Sy 2 = 0,56 3,5 1,8 = 0,8 10 Recta de regresión de X Y x = a + b y b = S xy S 2 y = 1,4286 a = X ( 1,4286)Y = 6,07 x = 6,07 1,4286y
REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL Recta de regresión de Y X y = 3,73 0,5517x Recta de regresión de X Y x = 6,07 1,4286y Predicciones x = 6 y = 4
REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL Recta de regresión de Y X y = 3,73 0,5517x Recta de regresión de X Y x = 6,07 1,4286y Predicciones x = 6 ŷ = 3,73 0,5517 6 = 0,42 y = 4
REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL Recta de regresión de Y X y = 3,73 0,5517x Recta de regresión de X Y x = 6,07 1,4286y Predicciones x = 6 ŷ = 3,73 0,5517 6 = 0,42 y = 4 x = 6,07 1,4286 4 = 0,36
REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL Coeficiente de Correlación Lineal r r = S xy S x S y = 0,8878 FCLI
REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL Representar las rectas sobre la nube de puntos x 3.5 0 6.76 y 1.8 3.73 0 y = 3,73 0,5517x x 3.5 6.07 0 y 1.8 0 4.27 x = 6,07 1,4286y
REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL 9 8 7 6 5 4 3 2 1 0 1 0 1 2 3 4 5 6 7 8 9 1
REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL 9 8 7 6 5 4 3 2 1 y = 0,5517x + 3,73 0 1 0 1 2 3 4 5 6 7 8 9 1
REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL 9 8 7 6 x = 6,07 1,4286y 5 4 3 2 1 y = 0,5517x + 3,73 0 1 0 1 2 3 4 5 6 7 8 9 1
REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL 9 8 7 6 x = 6,07 1,4286y 5 4 3 2 1 y = 0,5517x + 3,73 0 1 0 1 2 3 4 5 6 7 8 9 1
REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL Tabla de doble entrada Y X 0-5 5-10 10-15 0-10 5 10 0 15 10-20 0 20 0 20 20-30 0 10 5 15 5 40 5 50
REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL Tabla de doble entrada (Marcas de clase) Y 2.5 7.5 X 0-5 5-10 12.5 10-15 5/ 0-10 5 10 0 15 15/10-20 0 20 0 20 25/20-30 0 10 5 15 5 40 5 50
REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL X = 750 50 Y = 375 50 14250 = 15 Sx = 50 15 2 = 7,7460 Sx 2 = 60 3062,5 = 7,5 Sy = 50 7,5 2 = 2,2361 Sy 2 = 5 S xy = 6125 50 15 7,5 = 10 Recta de regresión de Y X y = a + bx b = S xy S 2 x = 0,1667 a = Y (0,1667)X = 5 y = 5 + 0,1667x
REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL X = 750 50 Y = 375 50 14250 = 15 Sx = 50 15 2 = 7,7460 Sx 2 = 60 3062,5 = 7,5 Sy = 50 7,5 2 = 2,2361 Sy 2 = 5 S xy = 6125 50 15 7,5 = 10 Recta de regresión de X Y x = a + b y b = S xy S 2 y = 2 a = X 2Y = 0 x = 2y
REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL 15 10 x = 2y y = 0,1667x + 5 5 0 10 20 30
REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL Coeficiente de Correlación Lineal r r = S xy S x S y = 0,5774 DCLD