REGRESIÓN Y CORRELACIÓN LINEAL AUTOR: Sstemas. Camlo H. Cohecha Torres. Lcecado e Matemátcas. Igeero de TEMA: Regresó y correlacó leal. LOGROS: Determar y aplcar el modelo de regresó leal e la predccó de valores. Aplcar la regresó leal para el proóstco e seres de tempo. Usar Ecel e el modelo de regresó y correlacó leal. CONDUCTA DE ENTRADA: 1. Dada la fucó f() = 8 a. Idetfcar la pedete. b. Idetfcar el tercepto co el eje y. c. Realzar la gráfca.. Realzar u gráfco de ua fucó leal para cada ua de las sguetes codcoes: a. Pedete postva. b. Pedete egatva. c. Pedete gual a cero. CRITERIOS DE EVALUACIÓN: E la parte fal de la guía ecuetras ua sere de ejerccos, los cuales se evalúa por parte del docete juto co la temátca, a la semaa sguete de la realzacó de esta e ua estructura smlar a la presetada. TIEMPO DE EJECUCIÓN: La guía se realza e ua sesó de clase. E la sguete clase etregará al docete los ejerccos propuestos y e la clase de la semaa sguete el docete la evalúa.
TEMATICA: REGRESIÓN Y CORRELACIÓN LINEAL S se dspoe de dos seres de datos emparejadas, co frecueca se desea coocer s ambas varables está relacoadas o s so depedetes. Por ejemplo, e qué medda, u aumeto de los gastos e publcdad hace aumetar las vetas de u determado producto? ó será que este algua relacó etre la talla y el peso de ua persoa? A cotuacó, represetaremos la relacó etre dos varables medate ua gráfca llamada dagrama de dspersó, luego, estableceremos u modelo matemátco para estmar el valor de ua varable basádoos e el valor de otra, e lo que llamaremos aálss de regresó y falmete estudaremos el grado de relacó estete etre las varables e lo que llamaremos aálss de correlacó. La relacó estete etre dos varables puede ser leal, cuadrátca, epoecal, logarítmca, etc. E este documeto vamos a cetraros e la posble relacó leal etre dos varables. DIAGRAMA DE DISPERSIÓN E u plao cartesao se represeta tatos putos como pares de observacoes se tega, correspodedo cada puto a u par de observacoes; a esta represetacó gráfca se le deoma dsttamete dagrama de RECTA DE REGRESIÓN Se llama así a la recta que atravesa la ube de putos y que mejor se ajusta a ellos. El modelo matemátco que descrbe ua relacó leal cuado se estma el valor de Y e fucó de esta dada así, Y = b + c ó Y = 1 + 0, o Y = B + A. (Esta últma otacó es la empleada e las calculadoras CASIO) Dode: Y es la varable que se va a estmar e fucó de otra varable () que se supoe coocda. Se le deoma també como varable depedete, eplcada o predctado. es la varable cuyo valor supuestamete se cooce, se le deoma varable depedete, predctor o eplcatva.
b = 1 es la pedete o sea la que determa el águlo de clacó de la recta. Deomada coefcete agular, cuatfcado la catdad que aumeta o decrece Y por cada udad que aumete o dsmuya la varable depedete. El coefcete agular puede represetarse así: b > 0 b < 0 b = 0 EJEMPLOS: S b es postvo dca que la recta es ascedete. S b es egatvo la recta será descedete y s b es gual a cero será ua paralela al eje horzotal. c = 0, correspode al coefcete de poscó. Es el valor dode la recta tercepta al eje Y. Puede ser mayor, meor o gual a 0. Se debe ecotrar la líea que represete al cojuto de putos, para lograr esto se debe determar los coefcetes de regresó muestrales (Coefcete agular y de poscó) que so estmadores de los parámetros o coefcetes de regresó poblacoal. Los valores de b y c correspode a aquellos que hace que los Y sea lo más cercaos posbles a los valores observados y, para determarlos lo más dcado es aplcar el método de los mímos cuadrados. CRITERIO DE LOS MÍNIMOS CUADRADOS: E el método de los mímos cuadrados se emplea los datos de la muestra para determar los valores de b y c que mmza la suma de los cuadrados de las desvacoes etre los valores observados de la varable depedete y, y los valores estmados de la varable depedete, Y. Este crtero se puede epresar así: Mí ( y Y ) Sedo y = valor observado de la varable depedete para la -ésma observacó. Y = valor estmado de la varable depedete para la -ésma observacó.
Aplcado el cálculo dferecal se puede demostrar que los valores de b y c que mmza la ateror epresó se puede determar co las sguetes ecuacoes: b y y c y b El valor de b, se puede obteer medate otras fórmulas, la cosulta de las cuales se deja como ejercco. PREDICCIÓN: Uo de los fes al obteer la ecuacó de regresó es el poder emplearla para predecr el valor de y para determado valor de. Se debe teer precaucó al aplcar la ecuacó de regresó para hacer predccoes fuera del tervalo de valores de la varable depedete, porque fuera de él o se puede asegurar que sea válda la msma relacó. E el aálss de correlacó, se determa el grado de relacó que puede haber etre dos varables. Este grado de correlacó lo obteemos medate el cálculo del Coefcete de correlacó. COEFICIENTE DE CORRELACIÓN: Deomado coefcete de correlacó leal de Pearso y smbolzado por r o R, es ua medda de terdepedeca de dos varables aleatoras, y su valor oscla etre 1 y +1. Su cálculo se puede realzar medate la aplcacó de la sguete fórmula: m r s s y y Dode:
m s s y y cov araza y y y y El valor de r se aproma a +1 cuado la correlacó tede a ser leal drecta (mayores valores de, sgfca mayores valores de y) y se aproma a 1 cuado la relacó tede a ser leal versa. S o hay correlacó de gú tpo etre dos varables aleatoras, etoces tampoco habrá correlacó leal, por lo que r = 0. S embargo el que ocurra que r= 0, sólo os dce que o hay correlacó leal, pero puede que la haya de otro tpo. El sguete dagrama resume el aálss del coefcete de correlacó etre dos varables: Correlacó egatva perfecta Correlacó egatva moderada Ngua correlacó Correlacó postva moderada Correlacó postva perfecta 1 0. 0 0. 1 Correlacó egatva fuerte Correlacó egatva débl Correlacó postva débl Correlacó postva fuerte COEFICIENTE DE DETERMINACIÓN: Deomamos coefcete de determacó R como el coefcete que os dca el porcetaje del ajuste que se ha cosegudo co el modelo leal, es decr el porcetaje de la varacó de Y que se eplca a través del modelo leal que se ha estmado, es decr a través del comportameto de X. A mayor porcetaje mejor es uestro modelo para predecr el comportameto de la varable Y.
També se puede eteder este coefcete de determacó como el porcetaje de varaza eplcada por la recta de regresó y su valor sempre estará etre 0 y 1 y es gual al cuadrado del coefcete de correlacó (r). R = r Es ua medda de la promdad o de ajuste de la recta de regresó a la ube de putos. També se le deoma bodad del ajuste. 1 - R os dca qué porcetaje de las varacoes o se eplca a través del modelo de regresó, es como s fuera la varaza eplcada que es la varaza de los resduos. EJEMPLO: Los sguetes datos fuero recoplados por u gerete de vetas y correspode a los años de epereca y las vetas auales de de sus empleados: Años de epereca 6 1 1 1 4 Vetas auales ($ 3 68 83 11 1 mlloes) 8 3 8 Tomamos los años de epereca como varable depedete. A cotuacó se preseta los cálculos ecesaros para determar la ecuacó de regresó co cuadrados mímos. Aplcado la fórmula: b y vededor y y Y 1 6 38 8 36 1444 1 68 816 144 464 3 1 83 14 6889 4 1 113 373 441 1769 4 18 307 76 16384 Totales 78 430 7734 14 4110 y Se obtee
b (78)(430) 7734 (78) 14 b =. El cálculo de la ordeada al orge (c) es el sguete: y y 78 430 1.6 86 c y b = 86 (1.6) = 8. Por lo ateror, la fucó estmada de regresó, deducda co el método de los mímos cuadrados, es Y = X + 8 La pedete de la fucó de regresó (b = ) es postva, lo cual mplca que al aumetar los años de epereca, las vetas també aumeta. De hecho, e este ejemplo, posemos llegar a la coclusó que las vetas aumete e $ mlloes por cada año de epereca. S quséramos predecr el valor de las vetas auales para u empleado que tee 0 años de epereca, el resultado sería: Y = (0) + 8 = 108 E cosecueca, predecríamos vetas auales de 108 mlloes de pesos para este empleado. A cotuacó, se aalzará s el modelo desarrollado s es el adecuado para estmar y predecr.
Para hallar el coefcete de correlacó, se determará prmero la covaraza: m y cov araza y y m y cov araza 7734 (1.6)(86) 0. Se halla las desvacoes típcas: s 14 (1.6) y 4110 s (86) y y Luego el coefcete de correlacó es 41.04 106 r m s y s y 0. 41.04 106 1 E este caso se tee que las dos varables (años de epereca) y y (Vetas auales) ua relacó leal postva perfecta. Esto es, todos los putos de datos está e ua recta co pedete postva (). El coefcete de determacó e este caso també es gual a 1. Epresádolo de maera porcetual se tee el 100%, lo cual sgfca que el 100% de la varacó e las vetas se puede eplcar co la relacó leal etre la epereca y las vetas.
USO DE LA CALCULADORA EN LA REGRESIÓN LINEAL S se dspoe de ua calculadora caso f-300p ó f-3600p se puede ejecutar los sguetes pasos, los cuales se va eplcado tomado como modelo el ejemplo resuelto: 1. Oprmr las teclas mode y e la patalla debe aparecer LR (Regresó Leal).. Co las teclas INV AC se borra la formacó que puede haber de trabajos aterores. Para costatar el borrado, oprmr las teclas KOUT 3 y debe aparecer 0 e la patalla. S aparece otro úmero se repte el procedmeto. 3. Se troduce la formacó co la tecla [(... para la varable X, y co RUN para la varable Y. Teedo e cueta que prmero es X 1, luego [(..., a cotuacó Y 1 RUN. Luego X [(..., Y RUN, y así sucesvamete. No debe haber equvocacó al troducr los datos. 4. Itroducda la formacó se comprueba, e parte, s la operacó fue realzada correctamete oprmedo KOUT 3, debe aparecer el úmero de parejas troducdas, e este caso.. Co la tecla KOUT y las teclas (1,, 3, 4,, 6) se obtee lo que aparece e egrlla debajo de cada ua de las teclas, así: KOUT 1 = = 14. KOUT = = 78. KOUT 3 = =. KOUT 4 = y = 4110. KOUT = y = 430. KOUT 6 = y = 7734. 6. Co la tecla INV y las teclas del 1 al 9 se obtee lo que aparece señalado e rojo o aarajado debajo de cada tecla. INV 1 = meda de X = 1.6 INV = = S = 6.41 (6.4064691). Correspode a la desvacó típca, elevado al cuadrado se obtee la varaza S = 41.04 INV 3 = -1 = -1 S = 7.16 (7.1640183) INV 4 = meda de Y = 86 INV = y = S y = 3.03 (3.0313476). La varaza S y = 106 INV 6 = -1 y = -1 S y = 3.81 (3.8100916).
El coefcete de poscó c se obtee co INV 7 sedo gual a 8 y el coefcete agular b co INV 8 gual a, co lo cual se tee la fucó estmada de regresó Y = + 8. El coefcete de correlacó se obtee co INV 9 sedo gual a 1. APLICACIÓN DE EXCEL EN LA REGRESIÓN LINEAL Ecel dspoe de fucoes que permte trabajar co coefcetes correlacó, regresó y otros coceptos sobre varables multdmesoales. Para ver las fucoes de la categoría Estadístca, se hace clc sobre el coo sertar fucó, f, de la barra de fórmulas (o se elge la opcó Isetar fucó del meu Isertar), e la opcó categoría de la fucó se elge Estadístcas, presetádose todas las fucoes de dcha categoría e el cuadro Nombre de la fucó. Para el ejemplo que vemos trabajado:
A 1 y 6 38 3 1 68 4 1 83 1 113 6 4 18 B S e el cuadro Nombre de la fucó hacemos clc sobre ua fucó, por ejemplo la fucó COEF.DE.CORREL, se obtee el sguete cuadro. Ua vez completados los argumetos (Varables X e Y) se obtee el resultado e la parte feror. Al pulsar Aceptar, la fórmula y su resultado se serta e la celda actva de la hoja de cálculo. A cotuacó, se preseta ua relacó de las fucoes de Ecel para correlacó y regresó, acompañada de los resultados para el ejemplo que vemos trabajado para las varables X e Y de la hoja de cálculo cuyos valores ocupa los ragos A:A6 y B:B6. Para alguas fucoes se preseta la caja correspodete.
FUNCIÓN VALOR QUE DEVUELVE RESULTADO EN EL EJEMPLO COVAR(X;Y) Devuelve la covaraza de e y defda 0. por COEF.DECORREL(X; Y) Devuelve el coefcete de correlacó de e y. 1
COEFICIENTE.R(Y; X) PENDIENTE(Y;X) INTERSECCION.EJE( Y;X) PRONOSTICO(; Y;X) Da el coefcete de determacó de y e. Da la pedete de la líea de regresó de y sobre. (Coefcete agular) Da la ordeada e el orge de la líea de regresó de y sobre. (Coefcete de poscó) Halla la predccó segú la líea de regresó de y sobre para el valor k de la varable depedete. 1 8 S =0 etoces y = 108
EJERCICIOS: 1. A cotuacó se preseta cco observacoes de dos varables, X y Y. 4 7 9 11 y 4 30 31 36 40 a. Trace u dagrama de dspersó de datos. b. Que dca el dagrama trazado e el cso a acerca de la relacó etre las dos varables? c. Trate de apromar la relacó etre y y.trazado ua recta que pase por los datos. d. Forme la ecuacó estmada de regresó calculado los valores de b y c. e. Aplque la ecuacó estmada de regresó para predecr el valor de y cuado = 6.. Se ha realzado ua observacó a cco famlas respecto a el úmero de tegrates () y sus gastos mesuales (y) e agua e mles de pesos: 7 8 10 y 30 4 7 97 a. Hallar la recta de regresó. b. Cuato se espera que gaste ua famla s esta costtuda por 6 persoas? c. Hallar el coefcete de correlacó y coclur. d. Hallar el coefcete de determacó y coclur. 3. Se dspoe de 7 parejas de datos para los cuales se sabe: = 7 = 40,6 y = 98,7 y = 00073,09 = 3119,7 y = 713831,3 a. Hallar la recta de regresó. b. Hallar el coefcete de correlacó y coclur. c. Hallar el coefcete de determacó y coclur. 4. E el semestre medatamete ateror el profesor de Estadístca regstro los putajes obtedos por sus estudates e ua prueba cal (de coocmetos elemetales) y la ota deftva e la matera e dcho semestre. Los resultados fuero los sguetes
Estudate 1 3 4 6 7 8 9 1 0 Putaje Prueba cal 3 9 4 3 1 4 7 3 3 4 1 Deftva 3 3 7 9 4 9 3 1 3 3 3 3 6 a. Elabore el dagrama de dspersó. b. Obtega la ecuacó de la recta de regresó. c. S u estudate obtuvo e la prueba cal 4, cuál sería la ota deftva que se espera obtega al fal del semestre? d. S u estudate obtuvo e deftva 4.0, qué edad putaje habría obtedo e la prueba cal?. Nota: Use Ecel o ua calculadora para resolver el sguete problema: Ua compañía que fabrca partes para maquara quere desarrollar u modelo para estmar el úmero de horas - trabajador requerdas para corrdas de produccó de lotes de dversos tamaños. Se seleccoa ua muestra aleatora de 18 corrdas de produccó ( para cada tamaño de lote de 10, 0, 30, 40, 0, 60, 70, 80 y 90) y se obtee los sguetes resultados: TAMAÑO DEL LOTE HORAS TRABAJADOR TAMAÑO DEL LOTE HORAS TRABAJADOR 10 30 0 11 10 40 60 18 0 0 60 13 0 70 148 30 73 70 160 30 67 80 170 40 87 80 16 40 9 90 180 0 108 90 190 a. Grafque el dagrama de dspersó. b. Supoga ua relacó leal y utlce al método de mímos cuadrados para ecotrar los coefcetes de regresó A y B. c. Iterprete el sgfcado de la ordeada A y la pedete B e este problema. d. Proostque el úmero promedo de horas trabajador requerdas para ua corrda de produccó co u tamaño de lote de 4. e. Por qué o es adecuado predecr el úmero promedo de horas trabajador para ua corrda de produccó de u lote de tamaño 100? Eplque. f. Supoga que las horas trabajador para el lote de tamaño 60 so 117 y 119. Resuelva los csos a. y d. co estos valores y compare los resultados.
BIBLIOGRAFIA: ANDERSON, Davd. SWEENEY, Des. WILLIAMS, Thomas. Estadístca para admstracó y ecoomía. Méco: Thomso, séptma edcó. 1999. BERENSON Mark. LEVINE Davd. KREHBIEL Tmothy. Estadístca para admstracó. Méco: Pretce Hall, Seguda edcó. 000. CHAO LINCOLN. Estadístca para cecas admstratvas. Bogotá: Mc Graw Hll, tercera edcó. 1993. MARTINEZ Becardo Cro. Estadístca y Muestreo. Bogotá: Ecoe edcoes, décma edcó. 000. SPIEGEK, Murray R. Teoría y problemas de Estadístca. Bogotá: Mc Graw Hll. MASSON y LIND. Estadístca para admstracó y ecoomía. Alfaomega. PORTUS, Lcoya. Curso práctco de estadístca. Ed. Mc Graw Hll. FREUND, Joh. Estadístca Elemetal. Ed Pretce Hall. WALPONE y MYERS. Probabldad y estadístca. Ed. Mc Graw Hll.