Capítulo V Análisis de regresión y correlación lineal Introducción
|
|
- Samuel Tebar Lagos
- hace 7 años
- Vistas:
Transcripción
1 Capítulo V Análisis de regresión y correlación lineal Introducción En el capítulo anterior se vio que es muy frecuente encontrar variables que están relacionadas o asociadas entre sí; por ejemplo, las calificaciones de los estudiantes están relacionadas con el tiempo que dedican al estudio, el gasto familiar está relacionado con el ingreso familiar, etc. Existen muchas variables, en especial cuantitativas, que se relacionan en algún grado con otras; entonces, es posible que una de las variables pueda expresarse matemáticamente en función de la otra. Frecuentemente se nos formulan las siguientes preguntas: El peso de las personas está relacionado con la estatura? El tiempo de servicio de trabajo activo tiene relación con la edad? El ingreso o salario está relacionado con el nivel educativo? El ahorro familiar tiene relación con los ingresos? La demanda de un producto dependerá de los precios?, etc. Estadísticamente nos interesa analizar la relación entre dos o más variables, siempre que se tenga un indicio de que entre ellas existe por lo menos cierto grado de dependencia o asociación. Lo importante es medir y expresar funcionalmente esta relación mediante una función o modelo matemático. En el presente capítulo estudiaremos el análisis de regresión entre dos variables X e Y, y el grado de relación entre ellas mediante el análisis de correlación. [33] 33 33
2 Análisis de regresión lineal simple Si se trata de predecir o explicar el comportamiento de una variable Y, a la que se denomina dependiente o variable respuesta, en función de otra variable X denominada independiente o regresora, Y =f( X ), estamos frente a un problema de análisis de regresión lineal simple; pero si deseamos investigar el grado de asociación entre las variables X e Y estamos frente a un problema de análisis de correlación. Diagrama de dispersión Cómo encontrar la relación entre X e Y? Una de las formas gráficas más sencillas es realizando el diagrama de dispersión, denominado también diagrama de nube de puntos. Este tipo de gráfico se utiliza para visualizar la relación entre las variables y, a partir de dicha relación, observar en qué medida se mantiene el incremento o disminución de una variable a partir del aumento de otra variable. Para su construcción, se trazan en el plano cartesiano los ejes de la abscisa ( X ) y de la ordenada (Y ). En el eje X se colocan los valores de una de las variables y, en el eje Y, los valores de la otra variable. En la intersección correspondiente a cada valor de X y a cada valor de Y se coloca un punto, y así tendremos la nube de puntos. Mostraremos a continuación algunas formas que adquiere el diagrama de dispersión. Figura. Diagramas de dispersión Y Y X Y = a+ bx Y = a bx a) Relación lineal positiva b) Relación lineal negativa X 34 34
3 Y Y X Y = a Y = a+ bx + cx c) No hay relación lineal d) Relación no lineal entre X e Y X Como se puede ver en el gráfico (a), los valores de Y se incrementan linealmente conforme X crece, es decir, el conjunto de datos se puede representar por una línea recta ascendente. Por ejemplo, al aumentar la partida presupuestal asignada por el gobierno a un colegio, aumenta la posibilidad de atender una mayor demanda escolar. Es diferente en el gráfico (b), porque cuando los valores de X crecen, los valores de Y decrecen, es decir, el conjunto de datos se puede representar por una línea recta descendente. Así, por ejemplo, cuando aumenta el número de horas semanales que los estudiantes dedican a las distracciones, su rendimiento académico disminuye. En el gráfico (c) no hay ninguna relación entre X e Y ; mientras que el gráfico (d) muestra una relación de tipo curvilínea entre X e Y. Así, por ejemplo, cuando los estudiantes dedican diariamente un mayor número de horas a ver programas de televisión, disminuye su rendimiento académico en el colegio. Como se observa en los diagramas de dispersión, el término lineal empleado se refiere al tipo de relación entre X e Y. Una vez visualizada la relación, los diagramas de dispersión no son suficientes para determinar el grado de la relación entre las variables, por lo que debemos utilizar procedimientos estadísticos para determinar el modelo mas apropiado que exprese el compor- x, y. tamiento del conjunto de datos ( ) i i 35 35
4 Ajuste de una función de regresión: Método de mínimos cuadrados Ajustar una función de regresión significa encontrar, la función que exprese con mayor precisión la relación entre las variables X e Y. Gráficamente será aquella función que mejor se adecue a la nube de puntos. En este sentido, es recomendable como primer paso construir el diagrama de dispersión o diagrama de nube de puntos para, luego de analizar su forma, decidir por el tipo de función matemática (modelo) o la ecuación de regresión que exprese la relación entre las variables X e Y. Luego, se estiman los parámetros del modelo, para lo cual existen varios métodos, siendo el más usado el método de mínimos cuadrados. Intentamos describir la dependencia de una variable Y sobre una variable independiente X. Emplearemos la ecuación de regresión a fin de apoyar la hipótesis que postula la posible causalidad de los cambios de Y mediante los cambios en X ; para propósitos de predicción de Y en función de X ; y para propósitos de explicación de parte de la variación de Y por X utilizando la última variable como control estadístico. Los estudios de los efectos de la temperatura en el rendimiento académico, el contenido de nitrógeno en el suelo sobre la tasa de crecimiento de una planta, la edad de un estudiante sobre su presión sanguínea, la dosis de un insecticida sobre la mortalidad de una población de insectos, el número de horas de estudio sobre el rendimiento académico, son ejemplos típicos de regresión para los propósitos señalados. Supondremos que el diagrama de dispersión sugiere que la relación entre las dos variables se puede expresar mediante una recta L: Y = a+ bx. El método de mínimos cuadrados garantiza que la recta que representa el comportamiento del conjunto de datos es la recta L, donde la suma de los cuadrados de las diferencias de las ordenadas y i de los puntos observados ( xi, y i), y de las ordenadas yˆ ˆ ˆ i = a+ bx de los puntos ( x, aˆ ˆ i + bx ) que están en la i recta L, sea mínimo. Esto es, se trata de obtener los valores de a y b de tal manera que el valor de la suma de cuadrados de los residuos, SSE, sea mínimo. Es decir: n i i sea mínimo, (5.) i= ( ) ˆ SSE = y y 36 36
5 donde: y i : son los valores observados de la variable dependiente Y, y ˆi : son los valores estimados de Y, b : es la pendiente de la recta, llamada también coeficiente de regresión, para predecir la variable Y, a : es la constante o intercepto Entonces la ecuación de regresión estimada se expresa como: Yˆ = aˆ + bx ˆ Y recta de regresión para predecir Y. Según el método de mínimos cuadrados, se demuestra que â y ˆb valores de a y b que hacen mínima la SSE, satisfacen el denominado sistema de ecuaciones normales: n y = an + b x i i= i= n i X n n n xiyi = a xi + b xi i= i= i=. (5.) Resolviendo el sistema se deducen los siguientes valores para las constantes a y b, denominados valores estimados de los coeficientes de regresión: n n n n yi xi xi xiyi i= i= i= i= n n n xi xi i= i= aˆ = = Y bx (5.3) 37 37
6 n n n n x y x y bˆ =, i i i i i= i= i= n n n xi xi i= i= (5.4) La recta de regresión nos permite, basándonos en los datos de la muestra, estimar un valor de la variable Y que denotaremos con y ˆi correspondiente a un valor dado x i de la variable X. Para ello es suficiente reemplazar el valor de x i en la recta de regresión y encontraremos el correspondiente valor estimado y ˆi. Ejemplo Con los datos de la tabla, correspondiente al rendimiento académico en el nivel superior (Y ) y al rendimiento académico en el nivel secundario ( X ) de 8 estudiantes: a) Construiremos el diagrama de dispersión. b) Aplicaremos el método de mínimos cuadrados para encontrar los coeficientes de regresión lineal. c) Averiguaremos: Cuál será el rendimiento en educación superior de un estudiante con nota promedio de en la educación secundaria? Tabla : Rendimiento académico en secundaria y en educación superior de un grupo de alumnos Estudiantes X Y Solución a) Usando los comando del SPSS presentados en el capítulo VII, se obtiene el diagrama de dispersión presentado en la figura. También presentamos los cálculos para encontrar los valores â y 38 38
7 ˆb de la ecuación de regresión estimada por el método de mínimos cuadrados. Figura 7 Diagrama de dispersión de rendimiento en secundaria y rendimiento en educación superior Rendimiento en secundaria Rendimiento en educación superior 8 El diagrama de dispersión nos sugiere que los datos se pueden representar mediante una recta Y = a+ bx. b) Cálculos necesarios para estimar los coeficientes de regresión y usando el método de mínimos cuadrados x i y i x x y i i i Total yi xi xi xiyi i= i= i= i= ( 06) n xi xi i= i= aˆ = = = 5,
8 n n n n x y x y ˆ b= = = 0,6 i i i i i= i= i= n n ( 06) n xi xi i= i= Entonces, la recta de regresión de Y sobre X queda expresada como: Yˆ = 5,5+ 0, 6X Si un estudiante obtiene un rendimiento de en secundaria, entonces su rendimiento esperado en educación superior se obtiene reemplazando X por el valor en la recta definida, es decir: Y ˆ = 5,5+ 0,6 = 5,5+ 7,3 =,83. Puede decirse que se estima que un alumno que tiene un rendimiento de puntos en educación secundaria, en educación superior tendrá un rendimiento de,83 puntos. Análisis de correlación lineal Nos proponemos investigar si dos variables son independientes o covarían, esto es, si varían conjuntamente. No expresamos una variable como función de la otra, así como tampoco hacemos distinción alguna entre variables dependientes e independientes. Puede muy bien suceder que, de una pareja de variables cuya correlación se estudia, una sea causa de la otra, aunque nosotros no lo sepamos ni lo sospechemos. Una hipótesis importante, aunque no esencial, es que las dos variables sean efectos de una causa común y lo que se desea conocer es el grado en el que ambas variables varían conjuntamente. Así, podríamos estar interesados en la correlación entre las longitudes de las extremidades superiores y extremidades inferiores en una población de estudiantes, o entre el peso y la estatura de un grupo de estudiantes, o entre los días necesarios para la madurez y el número de semillas en una siembra. La correlación lineal mide el grado de la asociación lineal entre dos variables denotadas con X e Y. Analizando el diagrama de dispersión o nube de puntos podemos visualizar el tipo de correlación lineal entre las variables involucradas
9 Figura 3. Tipos de correlación lineal Y Y X X a) Correlación positiva b) Correlación negativa Y : : : c) Correlación nula X Correlación positiva o directa En la figura 3(a), las variables X e Y están correlacionadas positivamente o su variación está en razón directa; es decir, el aumento de la medida de la variable X implica el aumento de la medida de la variable Y. Ejemplo En la tabla se presentan las puntuaciones en Literatura ( X ) y las puntuaciones en Lenguaje (Y ) de un grupo de alumnos de un centro educativo. Se observará su relación a través de un diagrama de dispersión. 4 4
10 Tabla : Puntuaciones en Literatura y en Lenguaje de un grupo de alumnos Nº Estudiante X Y Solución El diagrama de dispersión, usando los comandos del SPSS presentados en el capítulo VII es el siguiente: Figura 4 Puntuaciones en Literatura y Lenguaje de un grupo de alumnos 60 Puntuaciones en Lenguaje Puntuaciones en Literatura Como se puede observar, cuando aumenta el valor de la variable X (puntuaciones en Literatura) también aumenta el valor de la variable Y (puntuaciones en Lenguaje); luego, visualizando que el tipo de correlación entre las puntuaciones en literatura y lenguaje es positiva. Correlación negativa o inversa Se dice que las variables X e Y están correlacionadas negativamente o su variación está en razón inversa, cuando el aumento de 4 4
11 la medida de la variable X implica la disminución de la medida de la variable Y, o la disminución de la medida de la variable X implica el aumento de la variable Y, como se puede observar en la figura 3(b). Ejemplo 3 La tabla 3 nos muestra las puntuaciones en Literatura ( X ) y las puntuaciones en Matemática (Y ) de un grupo de alumnos de un determinado centro educativo. Mostraremos el diagrama de dispersión. Tabla 3 Puntuaciones en Literatura y en Matemática de un grupo de alumnos Nº Estudiante xi yi Solución El diagrama de dispersión, usando los comandos del SPSS presentados en el capítulo VII es el siguiente: Figura 5 Puntuaciones en Literatura y Matemática de un grupo de alumnos 40 Puntuaciones en Matemática Puntuaciones en Literatura 43 43
12 Como se puede apreciar, frente al aumento de las puntuaciones en literatura ( X ) disminuyen las puntuaciones en Matemática (Y ), visualizando la correlación entre X e Y es negativa o inversa. Correlación nula En la figura 3(c) las variables no están correlacionadas entre sí; es este caso, diremos que la correlación entre X e Y es nula; esto lo podemos observar en el siguiente ejemplo. Ejemplo 4 En la tabla 4, la variable X corresponde a las puntuaciones en deporte y la variable Y corresponde a las puntuaciones en Matemática de un grupo de alumnos. Mostraremos el diagrama de dispersión para identificar el tipo de correlación. Tabla 4: Puntuaciones en deporte y en Matemática de un grupo de alumnos Nº Estudiante X Y Solución El diagrama de dispersión, usando los comandos del SPSS presentados en el capítulo VII es el siguiente: 44 44
13 Figura 6 Puntuaciones en deporte y en Matemática de un grupo de alumnos 50 Puntuaciones en Matemática Puntuaciones en deporte 0 Como se puede apreciar, la correlación entre las puntuaciones en deporte ( X ) y las puntuaciones en matemática (Y ) es nula. Coeficiente de correlación de Pearson ( r ) Existen numerosos coeficientes de correlación en Estadística. El más común de ellos es el denominado coeficiente de correlación producto-momento, cuya formulación se debe a Karl Pearson. El coeficiente de correlación de Pearson se utiliza en el análisis de información cuantitativa, cuando se desea medir el grado de asociación lineal entre dos variables cuantitativas. Sus valores varían entre y. El valor + indica que entre X e Y existe una correlación lineal directa y perfecta; el valor, una correlación lineal inversa y perfecta. El valor 0 indica ausencia de correlación lineal. Para obtener este coeficiente hay una gran variedad de expresiones matemáticas que son equivalentes, destacando las siguientes: a) Para puntuaciones directas o datos originales: r i i ( i)( i) n x y x y = i ( i) i ( i) n x x n y y (5.5) 45 45
14 b) para puntuaciones Z (puntuaciones tipificadas): r ZZ x y =, (5.6) donde: Z x S x X i i x = Zy =. Sx Sy y Y Propiedades El valor de r se encuentra entre y +, de donde se deduce que: a) Si r > 0, existe correlación directa o correlación positiva, b) Si r < 0, existe correlación inversa o correlación negativa. En la interpretación clásica del coeficiente de correlación se deduce, por ejemplo, que si: a) 0 r < 0,0, la correlación es muy baja, b) 0, 0 r < 0, 40, existe una correlación baja, c) 0, 40 r < 0,70, existe una moderada correlación positiva, d) 0,70 r <,00, existe de moderada a buena correlación positiva, e) r =, 00, existe una perfecta correlación positiva, f), 0 r < 0, 70, existe de moderada a buena correlación inversa, g) r =, 00, existe una perfecta correlación inversa. Ejemplo 5 Se desea saber el grado de relación entre los años de escolaridad de la madre ( X ) y las calificaciones de sus hijos en una prueba de Matemática (Y ). Los datos se presentan en la siguiente tabla. Tabla 5: Años de escolaridad de la madre y calificaciones de sus hijos en una prueba de Matemática Estudiantes X Y
15 Solución En la siguiente tabla se presentan los cálculos auxiliares: Estudiantes x i y i xy i i x i n= y i Reemplazando los valores obtenidos en la ecuación (5.5) para puntuaciones directas obtenemos: ( ) ( )( ) ( ) ( ) []( ) ( ) r = = = 0, x56 El valor del coeficiente de correlación es 0,9, significa una alta correlación positiva; es decir, el nivel de escolaridad de la madre está fuertemente relacionado al rendimiento académico de sus hijos en Matemática. Ejemplo 6 En la segunda y tercera columna de la Tabla 6 se tiene la información sobre coeficientes de inteligencia y puntajes en Matemáticas para una muestra aleatoria de estudiantes que estudiaron el primer año de secundaria en el colegio Cabrera Tapia en el año 000. Encontraremos el coeficiente de correlación de Pearson. El primer día de clases, a todos ellos se les aplicó una prueba para obtener sus coeficientes de inteligencia ( X ) en la escala Stanford-Binet y al término del año se les aplicó una prueba de 35 ítems para evaluar su rendimiento en Matemática. Solución X : puntajes obtenidos en la prueba Stanford-Binet Y : rendimiento en Matemáticas 47 47
16 Tabla 6: Rendimiento de los estudiantes en Matemática y puntajes obtenidos en la prueba Stanford-Binet x i y i x i xy y i i i Totales Con la fórmula (5.5) obtenemos el coeficiente de correlación de Pearson: (993) 369(9) r = = 0,953 ( (56859) ( 369) ) (307) ( 9) ( ) Se observa muy buena correlación directa y positiva entre coeficiente de inteligencia y el rendimiento académico en el curso de matemática. Ejemplo 7 En la tabla 7 se tiene información de una muestra aleatoria de 5 alumnos del centro educativo Teresa Gonzales de Fanning. Se desea obtener el coeficiente de correlación entre los puntajes obtenidos en Aritmética y Lenguaje para medir su grado de relación
17 Tabla 7: Rendimientos de una muestra de estudiantes del colegio Teresa Gonzales de Fanning, 998. Estudiante Aritmética Lenguaje Solución Se ilustran los cálculos auxiliares del coeficiente de correlación de Pearson con los valores observados de las variables notas en Aritmética ( X ) y notas en Lenguaje (Y ). Estudiante x i yi xy x i i i y i x = 93 y = 04 x = 553 x y = 69 y = 856 i i i i i i Luego, el coeficiente de correlación entre las notas de Aritmética y Lenguaje es: 49 49
18 5( 69) 93( 04) ( ) ( ) ( ) ( ) r = = 0, Se observa una correlación alta y positiva entre los puntajes obtenidos en los cursos de Aritmética y Lenguaje. Ejemplo 8 Para los datos del ejemplo 5, usando comandos del SPSS, se mostrará el diagrama de dispersión y ajustará el modelo de regresión lineal simple. Solución a) Usando comandos presentados en el capítulo VII se obtiene el siguiente diagrama de dispersión. Figura 7 Años de escolaridad de la madre y calificaciones de los hijos en una prueba de Matemática 3 C alificacio nes en M atem á tica Años de escolaridad de la madre Se observa que existe una relación lineal directa y positiva entre los años de escolaridad de la madre y las calificaciones en una prueba de Matemática que rinden los hijos. b) El siguiente cuadro, también obtenido a partir del SPSS, nos proporciona resultados para encontrar la ecuación de la recta de regresión ajustada por el método de mínimos cuadrados ordinarios
19 Coefficients a Mode (Constant Años de escolaridad de la madre Standardized Unstandardized Coefficients Coefficients B Std. Beta t Sig. 5,054,38 3,834,03,784,8,90 3,597,037 a. Dependent Variable: Calificaciones en una Prueba de Matemática ˆb â La recta de regresión lineal simple ajustada por el método de mínimos cuadrados es: ˆ Y = 5, ,784 X, donde nos indica que un incremento de un año en los años de escolaridad de la madre, incrementará en promedio 0,784 puntos la calificación de sus hijos en la prueba de matemática. Ejemplo 9 Usando la información que corresponde a las variables calificación promedio y notas en el curso de álgebra de la base DATOS3- educación, se ajusta la recta de regresión usando el método de mínimos cuadrados. A continuación se presentan el gráfico y las salidas proporcionadas por el SPSS. Solución a) Usando comandos del SPSS se encuentra el siguiente diagrama de dispersión: Figura 8 Notas de Álgebra y calificación promedio de profesores de educación secundaria Notas de Álgebra 5 5
20 Observamos que las notas de Álgebra y las calificaciones promedio de profesores que participaron en el programa de capacitación, tienen una relación directa o positiva. b) El coeficiente de correlación de Pearson: Model Summary Model R R Square Adjusted R Square Std. Error of the Estim ate,95 a,855,85,5 a. Predictors: (Constant), NOTAS DE ÁLGEBRA r= 0,95 coeficiente de correlación lineal. Se encuentra una correlación alta y positiva entre las notas de álgebra y las calificaciones promedio que alcanzaron los profesores que participaron en el programa de capacitación. c) Los coeficientes de la recta de regresión: Coefficients a Unstandardized C oefficients Standardi zed C oefficien ts Model B Std. Error Beta t Sig. (Constant) 3,853,477,000 NOTAS DE ALGEBRA,708,043,95 6,99,000 a. Dependent Variable: NOTAS PROMEDIO â ˆb con los que se obtiene la ecuación de la recta de regresión ajustada por el método de mínimos cuadrados: ˆ Y = 3, ,708 X, donde vemos que un incremento en la notas de Álgebra de un punto, incrementará la calificación promedio de los profesores de educación secundaria, en promedio en 0,708 puntos. 5 5
21 Análisis de regresión lineal múltiple La ecuación de regresión lineal simple estudiada en la sección anterior, se puede generalizar a una ecuación de regresión lineal múltiple, cuando se tenga dos o más variables independientes o regresoras X, X,..., X k, y una variable independiente o respuesta Y. Explicaremos el análisis de regresión lineal múltiple con los datos del ejemplo 0, en el que se muestran los coeficientes de inteligencia (IQ), los promedios de las calificaciones y el tiempo que dedican al estudio estudiantes. Se desea predecir el promedio de las calificaciones de estos estudiantes en función de sus coeficientes de inteligencia y de los tiempos que dedican al estudio. Se tienen dos variables regresoras: coeficiente de inteligencia, X y tiempo dedicado al estudio, X, para explicar el comportamiento de la variable dependiente o respuesta Y : calificación promedio de los estudiantes. Para el problema descrito se postula la forma general de la ecuación de regresión lineal múltiple: Yˆ = aˆ+ bx ˆ + cx ˆ (5.7) donde: ˆ Y : valores estimados de la variable dependiente o respuesta, â, ˆb, ĉ : coeficiente de regresión de la ecuacuón de regresión lineal múltiple, X, X : variables independientes o regresoras, Esta ecuación es muy similar a la utilizada en la regresión lineal simple, excepto que agregamos otra variable independiente. Para hallar los valores de â, ˆb, ĉ, se toma una muestra de los valores ( y i, x i x i ) i =,..., n, y para cada punto se tiene el sistema de ecuaciones, yi = a+ bxi + cxi, donde y i es el i-ésimo valor de la variable Y, x i, x i, los i-ésimos valores de las variables independientes X, X,. Luego, se usa el método 53 53
22 de mínimos cuadrados para encontrar los valores â de a, ˆb de b y ĉ de c, que hacen mínima la suma de cuadrados de los n errores, es decir, que minimizan ( ) SSE = y yˆ i i. i= Cabe resaltar que el método de mínimos cuadrados conduce a un sistema de ecuaciones denominadas ecuaciones normales, a partir de las cuales, utilizando conceptos de algebra matricial se encuentran los estimadores â, ˆb, ĉ de los parámetros a, b, c tema que está fuera de los objetivos del presente libro y que no será abordado aquí. Todos los problemas de regresión múltiple serán resueltos con el soporte del SPSS, puesto que en la mayoría de las investigaciones el número de observaciones y el número de variables es grande, lo que dificulta el trabajo manual. Ejemplo 0 Para una muestra de estudiantes se dispone de sus coeficientes de inteligencia, tiempo semanal dedicado al estudio y los promedios de sus calificaciones. Vamos a ajustar la ecuación de regresión lineal múltiple, la que explique en función de y, usando el método de mínimos cuadrados. Promedio de calificaciones, Coeficiente intelectual y Tiempo dedicado al estudio Estudiante IQ Tiempo de estudio Promedio de calificaciones ( X ) ( X ) ( Y) 0 8,0 0, , 4 9 3, 5 4, , ,6 8 30, , 0 34,6 36 3, ,
23 = + +, para es- Solución Postulamos la ecuación de regresión Y a bx cx tudiar la relación entre Y y las variables X, X, donde: X : Coeficiente intelectual (IQ) X : Tiempo de estudio Y : Promedio de calificaciones Usamos las opciones del SPSS: Activar el SPSS y copiar los datos en un archivo de nombre: COEFICIENTE. En VARIABLE VIEW, definir las siguientes variables: IQ, TIEM- PO y CALIFICA con sus respectivas especificaciones y, en DATA VIEW, colocar los datos de la tabla. Ejecutar ANALYZE/ REGRESSION/LINEAR/ ingresar en DEPENDENT la variable CALIFICA y en INDEPENDENT las variables IQ TIEMPO/OK. El output del SPSS es el siguiente: Coefficients Unstandardized,,,, ˆb Las estimaciones de los parámetros son: a ˆ = 5, 49, ˆb = 0,049 ĉ = 0,8 ĉ Luego, la ecuación de regresión lineal múltiple ajustada por el método de mínimos cuadrados es: â 55 55
24 Yˆ = 5,49 + 0,049X + 0,8X donde, manteniendo constante la variable tiempo de estudio, un incremento en el coeficiente intelectual (IQ) de un punto, por ejemplo, es acompañado por un incremento en el promedio de calificaciones de 0,049 puntos. En forma similar, manteniendo constante la variable coeficiente intelectual, un incremento de hora en el tiempo de estudio, es acompañado por un incremento en el promedio de calificaciones de 0,8 puntos. Coeficiente de determinación El coeficiente de determinación R, multiplicado por 00, indica el porcentaje de la variación de la variable dependiente y que es explicado por las variaciones de las variables independientes del modelo. También se dice que mide la bondad del ajuste o de la recta de regresión ajustada por el método de mínimos cuadrados. Se puede demostrar que la variabilidad de Y, expresada por la suma de cuadrados total, SST = ( y y), se puede dividir en dos componentes: la suma de cuadrados debido a la regresión, SSR = ( y ) ˆi y, y la suma de cuadrados debido a los residuos, SSE = ( y yˆ ). Es decir:, donde: i i SST : suma de cuadrados del total SSR : suma de cuadrados debido a la regresión SSE : suma de cuadrados debido a los residuos Por ello, resulta natural definir el coeficiente de determinación como: SSR R = SST Retomando nuestro ejemplo en el que la variable dependiente es el promedio de calificaciones de un alumno y la variables inde- i 56 56
25 pendientes, el coeficiente de inteligencia y el tiempo dedicado al estudio; calcularemos la SST, SSR, SSE y el coeficiente de determinación R, usando el SPSS. El output del SPSS es el siguiente: ANOVA Model Sum of Squares df,,,,,,, SSR R = SST = R 6,389 = = 0,9 7,0 El coeficiente de determinación 0,9 significa que el 9% de las variaciones observadas en la calificación promedio de los alumnos son explicadas por las variaciones del puntajes de coeficiente de inteligencia y del tiempo dedicado al estudio. El valor 0,09 = 0,9, llamado coeficiente de alienación, indica que el 9% de las variaciones observadas en la calificación promedio de los alumnos no son explicables por las variaciones en los puntajes del coeficiente de inteligencia y del tiempo dedicado al estudio, sino por otras variables o factores no considerados en el modelo. Coeficiente de correlación parcial A veces, una alta correlación entre dos variables cuantitativas se interpreta equivocadamente como una relación de causa y efecto entre ellas; pero esa alta correlación puede deberse a la influencia de otras variables subyacentes, denominadas variables espurias. Así, por ejemplo, si se observa una relación positiva entre la asistencia a la iglesia los domingos y la honestidad de las personas mayores, esto no implica necesariamente que las personas son honestas porque van a misa los domingos, pues una razón subyacente para que las dos variables estén correlacionadas puede en
26 contrarse en variables subyacentes como el entrenamiento temprano en asistir a la iglesia y en enseñar a los niños a tener actitudes honestas. El coeficiente de correlación parcial mide la relación lineal entre dos variables, eliminando la influencia que puedan ejercer otras variables. Así, para las variables X, X y X 3, el coeficiente de correlación parcial entre las dos primeras variables mide la relación lineal entre las variables X, X eliminando la influencia que puede ejercer la tercera variable X 3. La fórmula de cálculo es la siguiente: r = 3 r r r r 3 3 ( 3)( 3) r (5.8) donde r.3 es el coeficiente de correlación parcial entre X, y X, controlando X 3. El coeficiente de correlación parcial entre X, y X, controlando X 3 y X se define como: 4 r 34 = r r r r ( 4 3)( 4 3) r La fórmula de obtención del coeficiente de correlación parcial entre las variables X i y X,..., X, X,..., X, X,... X es la siguiente: r X j, controlando las variables r + +, i i+ j j+ k, ij,,..., i, i,..., j, j,..., k ij,,..., i, i+,..., j, j+,..., k donde: = s s ij,,..., i, i+,..., j, j+,..., k s ii,,..., i, i+,..., j, j+,..., k jj,,..., i, i+,..., j, j+,..., k s ii,,..., i, i+,..., j, j+,..., k :varianza de la variable X i, controlando las variables X,..., Xi, Xi+,..., X j, X j+,... Xk ; 58 58
27 s jj,,..., i, i+,..., j, j+,..., k : varianza de la variable X j, controlando las variables X,..., X, X,..., X, X,... X i i+ j j+ k. Ejemplo Con la base de DATOS3-educación se ilustra el cálculo del coeficiente de correlación parcial entre la nota promedio y la nota de Álgebra, controlando la nota de Aritmética. X : notas promedio X : notas de Álgebra X : notas de Aritmética 3 Solución a) Considerar la base DATOS3- educación y calcular los coeficientes de correlación simple entre los pares de variables X, X X, usando los comandos del capítulo VII, la salida es: 3 NOTAS PROMEDIO Pearson Correlation NOTAS DE ÁLGEBRA Pearson Correlation NOTAS DE ARITMÉTICA Pearson Correlation NOTAS NOTAS DE NOTAS DE PROMEDIO ÁLGEBRA ARITMÉTICA,95,903,95,893,903,893 donde: r = 0, 95; r = 0,903; r = 0, y se obtiene el valor del coeficiente de correlación parcial entre la nota promedio ( X ) y la nota de álgebra ( X ), manteniendo constante la nota en aritmética ( X 3 ), usando la ecuación (5.8): ( ) 0,95 0,903 0,893 0,86 r 3 = = = 0, 67 0, ( 0, 903 )( 0,893 ) El coeficiente de correlación entre la nota promedio y la nota en álgebra es 0,95, en tanto que la correlación entre ellas eliminando la influencia de la nota de aritmética es 0,67; lo que signi
28 fica que la correlación lineal entre la nota de Álgebra y la nota promedio estaba influenciada por la nota en Aritmética. b) Usando el SPSS, se abre la base de DATOS3-EDUCACION y con los comandos del capítulo VII se tiene el siguiente cuadro: Control NOTAS NOTAS DE Variables PROMEDIO ÁLGEBRA NOTAS DE NOTAS Correlation,000,6 ARITMÉTICA PROMEDIO NOTAS DE Correlation,6,000 ÁLGEBRA Como puede observarse, el valor del coeficiente de correlación parcial coincide con el valor ya encontrado. Ejemplo Se sabe que la disposición de las mujeres a trabajar fuera de casa no ha sido la misma en todas las épocas, y también que varía de un lugar a otro y de unos grupos sociales a otros. En estas condiciones, puede preguntarse qué variables influyen para que las mujeres estén más o menos dispuestas a trabajar fuera de casa. Estas preguntas se plantean hoy día los sociólogos y consideran que si la variable dependiente fuera el porcentaje de mujeres trabajadoras, estaría explicada por algunas variables como: el salario que perciben las mujeres, el salario percibido por el marido, el número de hijos, edad de las mujeres, tasa general de desempleo, entre otras. En la base DATOS7-mujeres, se tienen los valores observados de las variables: Z 3 : logaritmo ( X / X ) X : salario promedio de las mujeres X : salario promedio de los hombres X 3 : número promedio de hijos por familia X : edad promedio de las mujeres, para una muestra de 4 señoras casadas. a) Encontrar el coeficiente de correlación lineal entre los salarios de las mujeres y los salarios de los hombres
29 b) Se propone encontrar el coeficiente de correlación parcial entre los salarios de los hombres y las mujeres, controlando la variable edad de las mujeres. Solución a) Abrir la base de DATOS7-mujeres y seleccionar los comandos del SPSS del capítulo VII (procedimientos estadísticos) que permiten obtener el coeficiente de correlación simple. El output del SPSS nos proporciona el coeficiente de correlación simple entre los salarios de los hombres y las mujeres. Correlations Salario de Salario de mujeres hombres Salario de mujeres Pearson Correlation,807 Salario de hombres Pearson Correlation,807 b) Abrir la base DATOS7- mujeres y seleccionar los comandos del capítulo VII que permiten obtener el coeficiente de correlación parcial, de X y X controlando X. 4 El output del SPSS nos proporciona el coeficiente de correlación parcial entre los salarios de los hombres y las mujeres, controlando la edad de las mujeres. Correlations Control Salario de Salario de Variables las mujeres los hombres Edad de las Salario de las Correlation,000,806 mujeres mujeres Salario de Correlation,806,000 los hombres Así, r = 0,807 es el valor del coeficiente de correlación lineal entre los salarios de las mujeres y los salarios de los hombres, valor que indica una buena relación directa entre las variables. Por otro lado, r 4 = 0,806, es el valor del coeficiente de correlación entre los salarios de los hombres y los salarios de las mujeres controlando la edad de las mujeres. Se observa que la correlación entre los salarios de las mujeres y de los hombres no está influenciada por la 6 6
30 edad de la mujer, puesto que se sigue manteniendo alta cuando la variable edad de las mujeres es controlada. Ejercicios. En los siguientes casos identifique en caso de ser posible la(s) variable(s) dependiente(s) e independiente(s). a) El presupuesto familiar destinado a la educación de los hijos y los ingresos familiares. b) El volumen de ventas de una empresa y la inversión en propaganda. c) El número de hijos por familia y el nivel educativo de los padres. d) El analfabetismo, lugar de residencia y la expansión del servicio educativo. e) La edad y el tiempo efectivo de servicio de los docentes afiliados al sindicato de profesores.. A 0 candidatos del programa de doctorado en Psicología se les aplica una prueba de personalidad ( X ) y un examen general de conocimientos ( Y ). Las puntuaciones fueron las siguientes: Candidato A B C D E F G H I J X,96,46 3,36 3,40,43,,85 3, 3,0,75 Y Realice el análisis de regresión y correlación lineal. 3. Un profesor de Estadística realiza un estudio para investigar la relación que existe entre la ansiedad y el rendimiento de sus estudiantes en los exámenes. Elige a 0 estudiantes para el experimento y, antes de asistir al examen final, los 0 estudiantes respondieron un cuestionario de ansiedad. A continuación se tienen las calificaciones de la prueba final y los puntajes obtenidos en el cuestionario de ansiedad. Ansiedad Examen Final 6 6
31 a) Elabore el diagrama de dispersión. Utilice la ansiedad como la variable regresora o independiente. b) Describa la relación que muestra el diagrama de dispersión. c) Suponga que la relación es lineal y calcule el valor del coeficiente de correlación e interprete. d) Determine la recta de regresión por mínimos cuadrados para predecir la calificación del examen final dado el nivel de ansiedad. e) Si un estudiante tiene un nivel de ansiedad de 38, qué valor podría predecirse para su calificación en el examen final? 4. Se realiza un estudio con 0 estudiantes de postgrado en Educación. X es el número de problemas resueltos correctamente por un estudiante en clase, X son las puntuaciones obtenidas al aplicarles una prueba psicológica que mide la autoestima, e Y es el número de problemas que cada estudiante espera resolver correctamente en el examen final. Con los datos que se presentan a continuación realice el análisis de regresión lineal múltiple usando el SPSS. Estudiante Número Puntuación en Número de problemas autoestima problemas que espera resueltos resolver en el examen final en clase Se aplicó a un grupo de 8 adolescentes sordomudos la prueba de inteligencia de Wechsler para adultos (Wais) y cuatro subtest. Las puntuaciones de ambas aplicaciones son las siguientes: 63 63
32 Adolescentes Wais Razonamiento Razonamiento Relaciones Velocidad y mecánico abstracto espaciales exactitud a) Realice un análisis de regresión lineal simple de Y con cada uno de los cuatro subtest. b) Realice un análisis de regresión lineal múltiple. 6. Se conocen las edades ( X ) y la presión sanguínea (Y ) de mujeres. Si x = y = x = y = x y = i 68, i 684, i 3446, i 388, i i a) Encuentre la recta de regresión de Y sobre X. b) Si una mujer tiene 49 años, cuál sería su presión sanguínea? c) Si una mujer tiene 7 años, cuál es la presión sanguínea esperada? 7. La siguiente tabla muestra las calificaciones obtenidas por 0 estudiantes en dos pruebas de Estadística: X : Primera prueba Y : Segunda prueba
33 a) Construya el diagrama de dispersión. b) Obtenga la recta de regresión de Y sobre X. c) Si un estudiante obtuvo 4,7 en la primera prueba, cuánto se espera que obtenga en la segunda prueba? 8. Dos profesores, con el propósito de examinar cuál es la influencia que los métodos de enseñanza basados en el trabajo libre y creativo del alumno ejercen sobre su rendimiento escolar, llevaron a cabo una investigación con niños y niñas, en los que evaluaron los siguientes aspectos: Creatividad : CREAT Coeficiente intelectual :C.I. Capacidad de orden : ORDEN Rendimiento escolar :RENDIM. CASO ORDEN C.I. RENDIM. CREAT. CASO ORDEN C.I. RENDIM. CREAT ,85 8, ,84 4, ,87 4, ,88 7, ,90 8, ,86 6, ,80, ,9 8, ,70 9, ,74 6, ,70 4, ,6 5, ,00 0, ,9 7, ,73 5, ,6, ,99 3, ,7, ,75 8, ,4 5,00 6,5 3,50 3,50 4 3,5 77 0,, ,73, ,65 3, ,90 6, ,78 5, ,8 8, ,48 0,00 5 5,5 84 0,8 5, ,9 4,50 6 4,5 63 0,6 5, ,97 6, ,77 7, ,6, ,99 7, ,84 4, ,78 6, ,63 0, ,98 7, ,89 6, ,74 6, ,05 6, ,94 7, ,84 3, ,76 4, ,74 5, ,8 5, ,58 0, , 8, ,8, ,85 7, ,8, ,9 6, ,75 3, ,73 6, ,88 6, ,64 5, ,8 4, ,45 3, ,65 0,
34 a) Use comandos del SPSS para crear el archivo de datos. b) Existe relación entre inteligencia y creatividad? c) Sobre la base de los datos obtenidos en esta experiencia, podemos afirmar que, a mayor creatividad, corresponde una menor capacidad de orden? d) Sobre la base de los datos obtenidos en esta experiencia, podemos afirmar que existe relación lineal entre rendimiento escolar y creatividad? e) Cuál es la recta que mejor permite predecir la variable rendimiento escolar en función de la variable creatividad? Interprete. f) Manteniendo constante la capacidad intelectual de los alumnos, la creatividad está relacionada con el rendimiento escolar? g) Sobre la base de los datos obtenidos en esta experiencia, podemos afirmar que existe relación lineal entre el rendimiento escolar y la inteligencia? h) Cuál es la ecuación de la recta que permite predecir el rendimiento escolar en función de la variable inteligencia? Interprete
La línea recta: Serie1
La línea recta: En una línea recta tenemos una relación entre dos variables, la independiente (x) y la dependiente (y). La forma en que se relacionan dependerá de la función que describa dicha relación.
Más detallesANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE
ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE Jorge Fallas jfallas56@gmail.com 2010 1 Temario Introducción: correlación y regresión Supuestos del análisis Variación total de Y y variación explicada por
Más detallesANALISIS DE REGRESIÓN Y CORRELACIÓN LINEAL
ANALISIS DE REGRESIÓN Y CORRELACIÓN LINEAL Msc. Lácides Baleta Octubre 16 Página 1 de 11 REGRESIÓN Y CORRELACIÓN LINEAL Son dos herramientas para investigar la dependencia de una variable dependiente Y
Más detallesUniversidad Técnica de Babahoyo CORRELACIÓN DE VARIABLES Y REGRESIÓN LINEAL
Universidad Técnica de Babahoyo CORRELACIÓN DE VARIABLES Y REGRESIÓN LINEAL OBJETIVO Analizar las Diferentes formas de Describir la Relación entre dos variables numéricas Trazar un diagrama de dispersión
Más detallesANÁLISIS DE REGRESIÓN
ANÁLISIS DE REGRESIÓN INTRODUCCIÓN Francis Galtón DEFINICIÓN Análisis de Regresión Es una técnica estadística que se usa para investigar y modelar la relación entre variables. Respuesta Independiente Y
Más detallesTEMA 2: DISTRIBUCIONES BIDIMENSIONALES
TEMA : DISTRIBUCIONES BIDIMENSIONALES 1.- DISTRIBUCIONES BIDIMENSIONALES Cuando estudiamos un solo carácter estadístico, los datos que obtenemos forman una variable estadística unidimensional. También
Más detalles3. RELACION ENTRE DOS CONJUNTOS DE DATOS.
3. RELACION ENTRE DOS CONJUNTOS DE DATOS. 3. 1 Introducción En la búsqueda de mejoras o en la solución de problemas es necesario, frecuentemente, investigar la relación entre variables. Para lo cual existen
Más detallesProfesor: Hugo S. Salinas. Primer Semestre Tabla 1: Inteligencia y Rendimiento. X Y Figura 1: Inteligencia y Rendimiento.
UNIVERSIDAD DE ATACAMA FACULTAD DE CIENCIAS JURÍDICAS / CARRERA DE TRABAJO SOCIAL TECNOLOGÍA INFORMÁTICA I (SPSS) ESTADÍSTICA DESCRIPTIVA CON MÁS DE UNA VARIABLE Profesor: Hugo S. Salinas. Primer Semestre
Más detallesLección 3. Análisis conjunto de dos variables
Lección 3. Análisis conjunto de dos variables Estadística Descriptiva Parcialmente financiado a través del PIE13-04 (UMA) GARCÍA TEMA 3. ANÁLII CONJUNTO DE DO VARIABLE 3.1 COVARIANZA COEFICIENTE DE CORRELACIÓN
Más detallesCorrelación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r)
Correlación El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r) El coeficiente de correlación lineal de Pearson (r) permite medir el grado de asociación entre
Más detallesPrueba de Hipótesis. Para dos muestras
Prueba de Hipótesis Para dos muestras Muestras grandes (n mayor a 30) Utilizar tabla Z Ho: μ1 = μ2 H1: μ1 μ2 Localizar en valor de Zt en la tabla Z Error estándar de la diferencia de medias Prueba de
Más detallesMétodo de cuadrados mínimos
REGRESIÓN LINEAL Gran parte del pronóstico estadístico del tiempo está basado en el procedimiento conocido como regresión lineal. Regresión lineal simple (RLS) Describe la relación lineal entre dos variables,
Más detallesCORRELACION Y REGRESIÓN LINEAL
LECCION Nº 5 CORRELACION Y REGRESIÓN LINEAL OBJETIVOS ESPECIFICOS Diferenciar los conceptos de correlación lineal, y regresión lineal. Determinar el índice o coeficiente de correlación en una distribución
Más detalles7. ANÁLISIS DE VARIABLES CUANTITATIVAS: REGRESIÓN LINEAL SIMPLE
ESCUELA UNIVERSITARIA DE ENFERMERIA DE TERUEL 1 er CURSO DE GRADO DE ENFERMERIA Estadística en Ciencias de la Salud 7. ANÁLISIS DE VARIABLES CUANTITATIVAS: REGRESIÓN LINEAL SIMPLE PROFESOR Dr. Santiago
Más detallesTema 4. Regresión lineal simple
Tema 4. Regresión lineal simple Contenidos El objeto del análisis de regresión La especificación de un modelo de regresión lineal simple Estimadores de mínimos cuadrados: construcción y propiedades Inferencias
Más detallesCapitulo. Describir la relación entre dos variables Pearson Prentice Hall. All rights reserved
Capitulo 34 Describir la relación entre dos variables Relación entre dos variables Al estudiar conjuntos de variables con más de una variable, una pregunta fundamental debe ser si podemos utilizar el valor
Más detalles1 JESTADIS\REGRES.DOC
CONTENIDOS 1. Introducción 2. Diagrama de dispersión 3. El coeficiente de correlación de Pearson 4. Regresión 1. Introducción Una de las metas frecuentes en la investigación consiste en determinar si existe
Más detallesRegresión lineal SIMPLE MÚLTIPLE N A Z IRA C A L L E J A
Regresión lineal REGRESIÓN LINEAL SIMPLE REGRESIÓN LINEAL MÚLTIPLE N A Z IRA C A L L E J A Qué es la regresión? El análisis de regresión: Se utiliza para examinar el efecto de diferentes variables (VIs
Más detallesEstadística II Tema 4. Regresión lineal simple. Curso 2009/10
Estadística II Tema 4. Regresión lineal simple Curso 009/10 Tema 4. Regresión lineal simple Contenidos El objeto del análisis de regresión La especificación de un modelo de regresión lineal simple Estimadores
Más detallesUniversidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia
Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia Estudio de Caso: Estudio Morfología Coeficiente de Correlación Considere el archivo Estudio Morfología.sav.
Más detallesTeoría de la decisión
1.- Un problema estadístico típico es reflejar la relación entre dos variables, a partir de una serie de Observaciones: Por ejemplo: * peso adulto altura / peso adulto k*altura * relación de la circunferencia
Más detallesDefinición de Correlación
Definición de Correlación En ocasiones nos puede interesar estudiar si existe o no algún tipo de relación entre dos variables aleatorias: Estudiar cómo influye la estatura del padre sobre la estatura del
Más detallesPROBLEMAS SOBRE V. ESTAD. BIDIMENSIONALES. PROFESOR: ANTONIO PIZARRO.
1º) (Andalucía, Junio, 98) Se considera la siguiente tabla estadística, donde a es una incógnita: X 2 4 a 3 5 Y 1 2 1 1 3 a) Calcular el valor de a sabiendo que la media de X es 3. b) Mediante la correspondiente
Más detallesRegresión lineal. Marcelo Rodríguez Ingeniero Estadístico - Magíster en Estadística
Regresión lineal Marcelo Rodríguez Ingeniero Estadístico - Magíster en Estadística Universidad Católica del Maule Facultad de Ciencias Básicas Pedagogía en Matemática Estadística I 01 de enero de 2012
Más detallesEstadísticas Elemental Tema 3: Describir la relación entre dos variables: Correlación y regresión 3.1-1
Estadísticas Elemental Tema 3: Describir la relación entre dos variables: Correlación y regresión 3.1-1 Relación entre dos variables Al estudiar conjuntos de variables con más de una variable, una pregunta
Más detallesTema 3: Análisis de datos bivariantes
Tema 3: Análisis de datos bivariantes 1 Contenidos 3.1 Tablas de doble entrada. Datos bivariantes. Estructura de la tabla de doble entrada. Distribuciones de frecuencias marginales. Distribución conjunta
Más detallesEstadística de dos variables
Versión: Estadística de dos variables 19 de septiembre de 013 1 Introducción En el Tema 1 se consideran las variables estadísticas unidimensionales, es decir, cada individuo de la muestra se describe de
Más detallesDistribuciones Bidimensionales.
Distribuciones Bidimensionales. 1.- Variables Estadísticas Bidimensionales. Las variables estadísticas bidimensionales se representan por el par (X, Y) donde, X es una variable unidimensional, e Y es otra
Más detallesANÁLISIS DE DATOS EXPERIMENTALES POR MÍNIMOS CUADRADOS
ANÁLISIS DE DATOS EXPERIMENTALES POR MÍNIMOS CUADRADOS CONTENIDO 1 Ajuste de Curvas 2 Análisis de Regresión 2.1 Métodos de Mínimos Cuadrados 2.2 Regresión Lineal AJUSTE DE CURVAS Uno de los objetivos en
Más detalles2.3.1 Métodos cuantitativos para los pronósticos. MÉTODOS CUANTITATIVOS
2.3.1 Métodos cuantitativos para los pronósticos. MÉTODOS CUANTITATIVOS Los modelos cuantitativos de pronósticos son modelos matemáticos que se basan en datos históricos. Estos modelos suponen que los
Más detallesUNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS NATURALES Y MUSEO CÁTEDRA DE ESTADÍSTICA CLASE ESPECIAL. Tema:
UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS NATURALES Y MUSEO CÁTEDRA DE ESTADÍSTICA CLASE ESPECIAL Tema: Correlación múltiple y parcial. Ecuaciones y planos de regresión La Plata, septiembre
Más detallesEJERCICIOS RESUELTOS TEMA 4. Tarea realizada 68 (84,8) --- (---) 96 (112,8) --- (---)
Nivel de ansiedad Ansiedad INTRODUCCIÓN AL ANÁLII DE DATO EJERCICIO REUELTO TEMA 4. 4.1. Con los datos de la Tabla 1, el valor de es igual a: A) 7,17; B) 11,80 C) 16,8. Tabla 1. En un estudio se investigó
Más detallesREGRESIÓN LINEAL SIMPLE
REGRESIÓN LINEAL SIMPLE 1. El problema de la regresión lineal simple. Método de mínimos cuadrados 3. Coeficiente de regresión 4. Coeficiente de correlación lineal 5. El contraste de regresión 6. Inferencias
Más detallesRegresión y Correlación
Relación de problemas 4 Regresión y Correlación 1. El departamento comercial de una empresa se plantea si resultan rentables los gastos en publicidad de un producto. Los datos de los que dispone son: Beneficios
Más detallesCORRELACIÓN Y REGRESIÓN. Raúl David Katz
CORRELACIÓN Y REGRESIÓN Raúl David Katz 1 Correlación y regresión Introducción Hasta ahora hemos visto el modo de representar la distribución de frecuencias de los datos correspondientes a una variable
Más detallesASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN
CURSO DE BIOESTADÍSTICA BÁSICA Y SPSS ASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN Amaia Bilbao González Unidad de Investigación Hospital Universitario Basurto (OSI Bilbao-Basurto)
Más detalles4.1 Análisis bivariado de asociaciones
4.1 Análisis bivariado de asociaciones Los gerentes posiblemente estén interesados en el grado de asociación entre dos variables Las técnicas estadísticas adecuadas para realizar este tipo de análisis
Más detallesJulio Deride Silva. 4 de junio de 2010
Curvas ROC y Regresión Lineal Julio Deride Silva Área de Matemática Facultad de Ciencias Químicas y Farmcéuticas Universidad de Chile 4 de junio de 2010 Tabla de Contenidos Curvas ROC y Regresión Lineal
Más detallesTema 1.- Correlación Lineal
Tema 1.- Correlación Lineal 3.1.1. Definición El término correlación literalmente significa relación mutua; de este modo, el análisis de correlación mide e indica el grado en el que los valores de una
Más detallesCORRELACIÓN LINEAL SIMPLE
CORRELACIÓN LINEAL SIMPLE ANÁLISIS DE CORRELACIÓN Cuando se trabaja con dos variables, pueden surgir diferentes preguntas como: Existe relación entre lo que una empresa gasta en publicidad y el importe
Más detalles3 Regresión y correlación lineales
3 Regresión y correlación lineales 3.1 Introducción En esta unidad se analizará la relación entre dos o más variables y desarrollamos una ecuación que nos permite estimar una variable con base en otra.
Más detallesTEMA 4 CUESTIONARIO DE AUTOEVALUACIÓN
4.5.- En cuál de los siguientes casos se podría utilizar la varianza residual en lugar del coeficiente de determinación para medir la calidad del ajuste? Con el mismo conjunto de datos y dos ajustes distintos.
Más detallesSOLUCIÓN A LOS EJERCICIOS DEL SPSS Bivariante
SOLUCIÓ A LOS EJERCICIOS DEL SPSS Bivariante. a). La media y la varianza de las variables estatura y peso en la escala de medida norteamericana. Peso Peso: Transformar -> Calcular: Libras.4536 Peso libras
Más detallesTema 2: Análisis de datos bidimensionales
Tema : Análisis de datos bidimensionales Variables estadísticas bidimensionales Distribuciones de frecuencias asociadas Regresión y correlación En una población puede resultar interesante considerar simultáneamente
Más detallesTema 9: Estadística en dos variables (bidimensional)
Tema 9: Estadística en dos variables (bidimensional) 1. Distribución de frecuencias bidimensional En el tema anterior se han estudiado las distribuciones unidimensionales obtenidas al observar sólo un
Más detallesTema 2: Análisis de datos bivariantes
1 Tema 2: Análisis de datos bivariantes En este tema: Tabla de contingencia, tabla de doble entrada, distribución conjunta. Frecuencias relativas, marginales, condicionadas. Diagrama de dispersión. Tipos
Más detallesEstadística para el análisis de los Mercados S3_A1.1_LECV1. Estadística Descriptiva Bivariada
Estadística Descriptiva Bivariada En el aspecto conceptual, este estudio puede ser generalizado fácilmente para el caso de la información conjunta de L variables aunque las notaciones pueden resultar complicadas
Más detallesUniversidad de Salamanca - Escuela de Educación y Turismo
Universidad de Salamanca - Escuela de Educación y Turismo ! " # $ % $ & ' ( ) * ( +(, + ' -. '. ' - % $ / %.! '. " # $ % & & $ % # # $( #. 0 # (/ $. # % 0 1 # % ( # 0 # 0 1 # 0. (, (! " # # #. $ ($ ' 0
Más detallesCUESTIONES Y PROBLEMAS DE DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES PROPUESTOS EN EXÁMENES
TUTORÍA DE INTRODUCCIÓN A LA ESTADÍSTICA (º A.D.E.) CUESTIONES Y PROBLEMAS DE DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES PROPUESTOS EN EXÁMENES 1º) Qué ocurre cuando r = 1: a) Los valores teóricos no
Más detallesTEMA 4 Modelo de regresión múltiple
TEMA 4 Modelo de regresión múltiple José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Análisis de Datos - Grado en Biología Estructura de este tema Modelo de regresión múltiple.
Más detallesUnidad IV Introducción a la Regresión y Correlación
Unidad IV Introducción a la Regresión y Correlación Última revisión: 25-0ctubre-2009 Elaboró: Ing. Víctor H. Alcalá-Octaviano Página 48 IV.1 Conceptos fundamentales Antología de Probabilidad y Estadística
Más detallesCoeficiente de Correlación
Coeficiente de Correlación Al efectuar un análisis de regresión simple (de dos variables) necesitamos hacer las siguientes suposiciones. Que las dos variables son mensurables Que la relación entre las
Más detallesPronósticos, Series de Tiempo y Regresión. Capítulo 4: Regresión Lineal Múltiple
Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple Temas Modelo de regresión lineal múltiple Estimaciones de Mínimos Cuadrados Ordinarios (MCO); estimación puntual y predicción
Más detallesAjuste por mínimos cuadrados
Mathieu Departamento de Matemática Aplicada y Estadística Universidad Politécnica de Cartagena Cartagena, Enero 2010 Guión 1 Planteamiento 2 Criterio de mínimos cuadrados 3 Casos concretos: regresión lineal
Más detallesESTADÍSTICA APLICADA. Tema 4: Regresión lineal simple
ESTDÍSTIC PLICD Grado en Nutrición Humana y Dietética Planteamiento del problema Tema 4: Regresión lineal simple Recta de regresión de mínimos cuadrados El modelo de regresión lineal simple IC y contrastes
Más detallesVARIABLES ESTADÍSTICAS BIDIMENSIONALES
VARIABLES ESTADÍSTICAS BIDIMENSIONALES 1.- En una variable estadística bidimensional, el diagrama de dispersión representa: a) la nube de puntos. b) las varianzas de las dos variables. c) los coeficientes
Más detallesAnálisis de datos en los estudios epidemiológicos III Correlación y regresión
Análisis de datos en los estudios epidemiológicos III Correlación y regresión Salinero. Departamento de Investigación Fuden Introducción En el capitulo anterior estudiamos lo que se denomina estadística
Más detallesESTADÍSTICA. Tema 4 Regresión lineal simple
ESTADÍSTICA Grado en CC. de la Alimentación Tema 4 Regresión lineal simple Estadística (Alimentación). Profesora: Amparo Baíllo Tema 4: Regresión lineal simple 1 Estructura de este tema Planteamiento del
Más detallesDos variables x e y están relacionadas funcionalmente cuando conocida la primera se puede saber con exactitud el valor de la segunda.
Dos variables x e y están relacionadas funcionalmente cuando conocida la primera se puede saber con exactitud el valor de la segunda. Ejemplos Si se deja caer una piedra, existe una fórmula que nos permite
Más detallesDoc. Juan Morales Romero
Análisis de Correlación y Regresión Lineal ANALISIS DE CORRELACION Conjunto de técnicas estadísticas empleadas para medir la intensidad de la asociación entre dos variables DIAGRAMA DE DISPERSION Gráfica
Más detallesMétodos de Investigación en Psicología (11) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández
Métodos de Investigación en Psicología (11) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández El método incluye diferentes elementos Justificación Planteamiento del problema
Más detallesAnálisis de regresión lineal simple
Análisis de regresión lineal simple El propósito de un análisis de regresión es la predicción Su objetivo es desarrollar un modelo estadístico que se pueda usar para predecir los valores de una variable
Más detallespeso edad grasas Regresión lineal simple Los datos
Regresión lineal simple Los datos Los datos del fichero EdadPesoGrasas.txt corresponden a tres variables medidas en 25 individuos: edad, peso y cantidad de grasas en sangre. Para leer el fichero de datos
Más detallesCORRELACIÓN Y REGRESIÓN. Juan José Hernández Ocaña
CORRELACIÓN Y REGRESIÓN Juan José Hernández Ocaña CORRELACIÓN Muchas veces en Estadística necesitamos saber si existe una relación entre datos apareados y tratamos de buscar una posible relación entre
Más detallesTema 3. Relación entre dos variables cuantitativas
Tema 3. Relación entre dos variables cuantitativas Resumen del tema 3.1. Diagrama de dispersión Cuando sobre cada individuo de una población se observan simultáneamente dos características cuantitativas
Más detallesEstadís6ca y Métodos Numéricos Tema 6. Modelos de Regresión
Estadís6ca y Métodos Numéricos Tema 6. Modelos de Regresión Ángel Barón Caldera Ángel Cobo Ortega María Dolores Frías Domínguez Jesús Fernández Fernández Francisco Javier González Or@z Carmen María Sordo
Más detallesRegresión lineal simple y correlación
Regresión lineal simple y correlación Regresión y Correlación Los análisis de regresión y correlación nos mostrarán cómo determinar tanto la naturaleza como la fuerza de una relación entre dos variables.
Más detalles3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS
1. INTRODUCCIÓN Este tema se centra en el estudio conjunto de dos variables. Dos variables cualitativas - Tabla de datos - Tabla de contingencia - Diagrama de barras - Tabla de diferencias entre frecuencias
Más detallesEstructura de este tema. Tema 4 Regresión lineal simple. Ejemplo: consumo de vino y dolencias cardíacas. Frecuencias
Estructura de este tema Tema 4 Regresión lineal simple José R. Berrendero Departamento de Matemáticas Universidad utónoma de Madrid Planteamiento del problema. Ejemplos Recta de regresión de mínimos cuadrados
Más detallesJesús Eduardo Pulido Guatire, marzo Diagrama de Dispersión y Correlación Lineal Simple
Jesús Eduardo Pulido Guatire, marzo 0 Diagrama de Dispersión y Correlación Lineal Simple Hasta el momento el trabajo lo hemos centrado en resumir las características de una variable mediante la organización
Más detallesEstadís5ca. María Dolores Frías Domínguez Jesús Fernández Fernández Carmen María Sordo. Tema 2. Modelos de regresión
Estadís5ca Tema 2. Modelos de regresión María Dolores Frías Domínguez Jesús Fernández Fernández Carmen María Sordo Departamento de Matemá.ca Aplicada y Ciencias de la Computación Este tema se publica bajo
Más detallesEjercicios de Regresión Lineal
1 Ejercicios de Regresión Lineal 1º) En un determinado proceso industrial, se piensa que la producción Y en toneladas, está linealmente relacionada con la temperatura X. Se toman dos observaciones de producción
Más detallesTema 2: Análisis de datos bivariantes
Tema 2: Análisis de datos bivariantes Los contenidos a desarrollar en este tema son los siguientes: 1. Tablas de doble entrada. 2. Diagramas de dispersión. 3. Covarianza y Correlación. 4. Regresión lineal.
Más detalles15. Regresión lineal. Te recomiendo visitar su página de apuntes y vídeos:
15. Regresión lineal Este tema, prácticamente íntegro, está calacado de los excelentes apuntes y transparencias de Bioestadística del profesor F.J. Barón López de la Universidad de Málaga. Te recomiendo
Más detallesRegresión: implica la obtención de una ecuación mediante la que podamos estimar el valor medio de una variable.
1 DEFINICIONES PREVIAS Regresión: implica la obtención de una ecuación mediante la que podamos estimar el valor medio de una variable. Correlación: es la cuantificación del grado de relación existente
Más detallesElaboró: Luis Casas Vilchis
Correlación de Pearson (r P, r) Una correlación se define como la coincidencia en el patrón de valores altos de una variable con los valores altos en la otra variable, y bajos con bajos y moderados con
Más detallesSILABO DEL CURSO ESTADÍSTICA DESCRIPTIVA 1. DATOS GENERALES
Facultad de Psicología SILABO DEL CURSO ESTADÍSTICA DESCRIPTIVA 1. DATOS GENERALES 1.1. Facultad : Psicología 1.2. Carrera Profesional : Psicología 1.3. Departamento : Ciencias 1.4. Tipo de Curso : Obligatorio
Más detallesTema 8: Regresión y Correlación
Tema 8: Regresión y Correlación Estadística. 4 o Curso. Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 8: Regresión y Correlación Curso 2008-2009 1 / 12 Índice
Más detallesAJUSTE PLANTEAMIENTO DEL PROBLEMA
AJUSTE PLANTEAMIENTO DEL PROBLEMA DIFERENCIA ENTRE INTERPOLACIÓN Y AJUSTE METODOLOGÍA DEL AJUSTE MÉTODO DE MÍNIMOS CUADRADOS MODELO LINEAL MODELO EXPONENCIAL EJEMPLO PLANTEAMIENTO DEL PROBLEMA Cuando los
Más detallesTema 10: Introducción a los problemas de Asociación y Correlación
Tema 10: Introducción a los problemas de Asociación y Correlación Estadística 4 o Curso Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 10: Asociación y Correlación
Más detallesTODO ECONOMETRIA. Bondad del ajuste Contraste de hipótesis
TODO ECONOMETRIA Bondad del ajuste Contraste de hipótesis Índice Bondad del ajuste: Coeficiente de determinación, R R ajustado Contraste de hipótesis Contrastes de hipótesis de significación individual:
Más detallesEstadística Inferencial. Sesión No. 9 Regresión y correlación lineal
Estadística Inferencial Sesión No. 9 Regresión y correlación lineal Contextualización En la administración, las decisiones suelen basarse en la relación entre dos o más variables. En esta sesión se estudia
Más detallesRegresión Lineal. Dra. Noemí L. Ruiz Limardo 2008 Derechos Reservados, Rev 2010
Regresión Lineal Dra. Noemí L. Ruiz Limardo 008 Derechos Reservados, Rev 010 Objetivos de la Lección Conocer el significado de la regresión lineal Determinar la línea de regresión cuando ha correlación
Más detallesREGRESIÓN LINEAL SIMPLE, COEFICIENTE DE DETERMINACIÓN Y CORRELACIONES (EJERCICIOS RESUELTOS)
1 REGRESIÓN LINEAL SIMPLE, COEFICIENTE DE DETERMINACIÓN Y CORRELACIONES (EJERCICIOS RESUELTOS) 1. EN LA REGIÓN DE DRAKUL DE LA REPÚBLICA DE NECROLANDIA, LAS AUTORIDADES ECONÓMICAS HAN REALIZADO UNA REVISIÓN
Más detallesUNIVERSIDAD CENTROAMERICANA JOSE SIMEON CAÑAS FACULTAD DE CIENCIAS ECONOMICAS Y SOCIALES DEPARTAMENTO DE ADMINISTRACIÓN DE EMPRESAS
UNIVERSIDAD CENTROAMERICANA JOSE SIMEON CAÑAS FACULTAD DE CIENCIAS ECONOMICAS Y SOCIALES DEPARTAMENTO DE ADMINISTRACIÓN DE EMPRESAS PROFESOR: Manuel de Jesús Fornos Gómez CICLO 01/2003 GUIA DE EJERCICIOS
Más detallesLectura No. 7. Contextualización. Nombre: Métodos de Análisis ANÁLISIS FINANCIERO 1
Análisis financiero ANÁLISIS FINANCIERO 1 Lectura No. 7 Nombre: Métodos de Análisis Contextualización Los diferentes métodos de análisis que se pueden utilizar para evaluar y, en su defecto, emitir un
Más detallesPRÁCTICA 3. REGRESIÓN LINEAL SIMPLE CON SPSS Ajuste de un modelo de regresión lineal simple Porcentaje de variabilidad explicado
PÁCTICA 3. EGESIÓN LINEAL SIMPLE CON SPSS 3.1. Gráfico de dispersión 3.2. Ajuste de un modelo de regresión lineal simple 3.3. Porcentaje de variabilidad explicado 3.4 Es adecuado este modelo para ajustar
Más detallesPROBABILIDAD Y ESTADÍSTICA. Sesión 4 4. REGRESIÓN Y CORRELACIÓN SIMPLE
PROBABILIDAD Y ESTADÍSTICA Sesión 4 4. REGRESIÓN Y CORRELACIÓN SIMPLE 4.1 Regresión lineal simple y curvilínea 4.1.1 Variable dependiente e independiente 4.1.2 Ecuación de regresión 4.1.2.1 Aplicación
Más detallesREGRESIÓN LINEAL SIMPLE
REGREIÓN LINEAL IMPLE ANÁLII DE REGREIÓN Al continuar con el estudio de la relación entre dos variables X y Y, ahora es pertinente considerar el caso en que es necesario pronosticar la variable dependiente
Más detallesTema 2. Regresión Lineal
Tema 2. Regresión Lineal 3.2.1. Definición Mientras que en el apartado anterior se desarrolló una forma de medir la relación existente entre dos variables; en éste, se trata de esta técnica que permite
Más detallesMODELO DE RESPUESTAS Objetivos 2, 3, 4, 5, 6, 7, Y 8.
UNIVERSIDAD NACIONAL ABIERTA ESTADÍSTICA GENERAL 745) VICERRECTORADO ACADÉMICO INTEGRAL ÁREA DE MATEMÁTICA Fecha: 17/ 01 /009 MODELO DE RESPUESTAS Objetivos, 3, 4, 5, 6, 7, Y 8. OBJ. 1 PTA 1 Una compañía
Más detallesLucila Finkel Temario
Lucila Finkel Temario 1. Introducción: el análisis exploratorio de los datos. 2. Tablas de contingencia y asociación entre variables. 3. Correlación bivariada. 4. Contrastes sobre medias. 5. Regresión
Más detallesAnálisis de Datos y Métodos Cuantitativos para la D.T. VI versión MGM
Universidad Católica del Norte Escuela de Negocios Mineros Magister en Gestión Minera Análisis de Datos y Métodos Cuantitativos para la D.T. VI versión MGM Antofagasta, Junio de 2013 Profesor: Fernando
Más detallesTEMA 2 Diseño de experimentos: modelos con varios factores
TEMA 2 Diseño de experimentos: modelos con varios factores José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Análisis de Datos - Grado en Biología Esquema del tema Modelo bifactorial
Más detallesRelación funcional Dos variables x e y están relacionadas funcionalmente cuando conocida la primera se
Distr ibuciones bidim ensionales Relación funcional Dos variables x e y están relacionadas funcionalmente cuando conocida la primera se puede saber con exactitud el valor de la segunda. Ejemplos Si se
Más detallesDOCUMENTO 8: ESTADÍSTICA BIDIMENSIONAL
DOCUMENTO 8: ESTADÍSTICA BIDIMENSIONAL VARIABLES ESTADÍSTICAS BIDIMENSIONALES. Hasta el momento hemos estudiado una sola característica de una población, pero podríamos considerar, simultáneamente, varias
Más detallesPRUEBA DE HIPÓTESIS BENJAMIN MAMANI CONDORI
PRUEBA DE HIPÓTESIS BENJAMIN MAMANI CONDORI 2014 Para qué es útil la estadística inferencial? Se utiliza para probar hipótesis y generalizar los resultados obtenidos en la muestra a la población o universo.
Más detalles2. ESTADÍSTICAS BIDIMENSIONALES
TEMA. ESTADÍSTICAS BIDIMENSIONALES.... Definición. Objetivos.... Coeficiente de Correlación. Lineal... 4 3. Rectas de regresión.... 7 . Definición. Objetivos En el tema anterior hemos estudiado las distribuciones
Más detalles