Capítulo V Análisis de regresión y correlación lineal Introducción

Documentos relacionados
La línea recta: Serie1

ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE

ANALISIS DE REGRESIÓN Y CORRELACIÓN LINEAL

Universidad Técnica de Babahoyo CORRELACIÓN DE VARIABLES Y REGRESIÓN LINEAL

ANÁLISIS DE REGRESIÓN

TEMA 2: DISTRIBUCIONES BIDIMENSIONALES

3. RELACION ENTRE DOS CONJUNTOS DE DATOS.

Profesor: Hugo S. Salinas. Primer Semestre Tabla 1: Inteligencia y Rendimiento. X Y Figura 1: Inteligencia y Rendimiento.

Lección 3. Análisis conjunto de dos variables

Correlación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r)

Prueba de Hipótesis. Para dos muestras

Método de cuadrados mínimos

CORRELACION Y REGRESIÓN LINEAL

7. ANÁLISIS DE VARIABLES CUANTITATIVAS: REGRESIÓN LINEAL SIMPLE

Tema 4. Regresión lineal simple

Capitulo. Describir la relación entre dos variables Pearson Prentice Hall. All rights reserved

1 JESTADIS\REGRES.DOC

Regresión lineal SIMPLE MÚLTIPLE N A Z IRA C A L L E J A

Estadística II Tema 4. Regresión lineal simple. Curso 2009/10

Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia

Teoría de la decisión

Definición de Correlación

PROBLEMAS SOBRE V. ESTAD. BIDIMENSIONALES. PROFESOR: ANTONIO PIZARRO.

Regresión lineal. Marcelo Rodríguez Ingeniero Estadístico - Magíster en Estadística

Estadísticas Elemental Tema 3: Describir la relación entre dos variables: Correlación y regresión 3.1-1

Tema 3: Análisis de datos bivariantes

Estadística de dos variables

Distribuciones Bidimensionales.

ANÁLISIS DE DATOS EXPERIMENTALES POR MÍNIMOS CUADRADOS

2.3.1 Métodos cuantitativos para los pronósticos. MÉTODOS CUANTITATIVOS

UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS NATURALES Y MUSEO CÁTEDRA DE ESTADÍSTICA CLASE ESPECIAL. Tema:

EJERCICIOS RESUELTOS TEMA 4. Tarea realizada 68 (84,8) --- (---) 96 (112,8) --- (---)

REGRESIÓN LINEAL SIMPLE

Regresión y Correlación

CORRELACIÓN Y REGRESIÓN. Raúl David Katz

ASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN

4.1 Análisis bivariado de asociaciones

Julio Deride Silva. 4 de junio de 2010

Tema 1.- Correlación Lineal

CORRELACIÓN LINEAL SIMPLE

3 Regresión y correlación lineales

TEMA 4 CUESTIONARIO DE AUTOEVALUACIÓN

SOLUCIÓN A LOS EJERCICIOS DEL SPSS Bivariante

Tema 2: Análisis de datos bidimensionales

Tema 9: Estadística en dos variables (bidimensional)

Tema 2: Análisis de datos bivariantes

Estadística para el análisis de los Mercados S3_A1.1_LECV1. Estadística Descriptiva Bivariada

Universidad de Salamanca - Escuela de Educación y Turismo

CUESTIONES Y PROBLEMAS DE DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES PROPUESTOS EN EXÁMENES

TEMA 4 Modelo de regresión múltiple

Unidad IV Introducción a la Regresión y Correlación

Coeficiente de Correlación

Pronósticos, Series de Tiempo y Regresión. Capítulo 4: Regresión Lineal Múltiple

Ajuste por mínimos cuadrados

ESTADÍSTICA APLICADA. Tema 4: Regresión lineal simple

VARIABLES ESTADÍSTICAS BIDIMENSIONALES

Análisis de datos en los estudios epidemiológicos III Correlación y regresión

ESTADÍSTICA. Tema 4 Regresión lineal simple

Dos variables x e y están relacionadas funcionalmente cuando conocida la primera se puede saber con exactitud el valor de la segunda.

Doc. Juan Morales Romero

Métodos de Investigación en Psicología (11) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández

Análisis de regresión lineal simple

peso edad grasas Regresión lineal simple Los datos

CORRELACIÓN Y REGRESIÓN. Juan José Hernández Ocaña

Tema 3. Relación entre dos variables cuantitativas

Estadís6ca y Métodos Numéricos Tema 6. Modelos de Regresión

Regresión lineal simple y correlación

3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS

Estructura de este tema. Tema 4 Regresión lineal simple. Ejemplo: consumo de vino y dolencias cardíacas. Frecuencias

Jesús Eduardo Pulido Guatire, marzo Diagrama de Dispersión y Correlación Lineal Simple

Estadís5ca. María Dolores Frías Domínguez Jesús Fernández Fernández Carmen María Sordo. Tema 2. Modelos de regresión

Ejercicios de Regresión Lineal

Tema 2: Análisis de datos bivariantes

15. Regresión lineal. Te recomiendo visitar su página de apuntes y vídeos:

Regresión: implica la obtención de una ecuación mediante la que podamos estimar el valor medio de una variable.

Elaboró: Luis Casas Vilchis

SILABO DEL CURSO ESTADÍSTICA DESCRIPTIVA 1. DATOS GENERALES

Tema 8: Regresión y Correlación

AJUSTE PLANTEAMIENTO DEL PROBLEMA

Tema 10: Introducción a los problemas de Asociación y Correlación

TODO ECONOMETRIA. Bondad del ajuste Contraste de hipótesis

Estadística Inferencial. Sesión No. 9 Regresión y correlación lineal

Regresión Lineal. Dra. Noemí L. Ruiz Limardo 2008 Derechos Reservados, Rev 2010

REGRESIÓN LINEAL SIMPLE, COEFICIENTE DE DETERMINACIÓN Y CORRELACIONES (EJERCICIOS RESUELTOS)

UNIVERSIDAD CENTROAMERICANA JOSE SIMEON CAÑAS FACULTAD DE CIENCIAS ECONOMICAS Y SOCIALES DEPARTAMENTO DE ADMINISTRACIÓN DE EMPRESAS

Lectura No. 7. Contextualización. Nombre: Métodos de Análisis ANÁLISIS FINANCIERO 1

PRÁCTICA 3. REGRESIÓN LINEAL SIMPLE CON SPSS Ajuste de un modelo de regresión lineal simple Porcentaje de variabilidad explicado

PROBABILIDAD Y ESTADÍSTICA. Sesión 4 4. REGRESIÓN Y CORRELACIÓN SIMPLE

REGRESIÓN LINEAL SIMPLE

Tema 2. Regresión Lineal

MODELO DE RESPUESTAS Objetivos 2, 3, 4, 5, 6, 7, Y 8.

Lucila Finkel Temario

Análisis de Datos y Métodos Cuantitativos para la D.T. VI versión MGM

TEMA 2 Diseño de experimentos: modelos con varios factores

Relación funcional Dos variables x e y están relacionadas funcionalmente cuando conocida la primera se

DOCUMENTO 8: ESTADÍSTICA BIDIMENSIONAL

PRUEBA DE HIPÓTESIS BENJAMIN MAMANI CONDORI

2. ESTADÍSTICAS BIDIMENSIONALES

Transcripción:

Capítulo V Análisis de regresión y correlación lineal Introducción En el capítulo anterior se vio que es muy frecuente encontrar variables que están relacionadas o asociadas entre sí; por ejemplo, las calificaciones de los estudiantes están relacionadas con el tiempo que dedican al estudio, el gasto familiar está relacionado con el ingreso familiar, etc. Existen muchas variables, en especial cuantitativas, que se relacionan en algún grado con otras; entonces, es posible que una de las variables pueda expresarse matemáticamente en función de la otra. Frecuentemente se nos formulan las siguientes preguntas: El peso de las personas está relacionado con la estatura? El tiempo de servicio de trabajo activo tiene relación con la edad? El ingreso o salario está relacionado con el nivel educativo? El ahorro familiar tiene relación con los ingresos? La demanda de un producto dependerá de los precios?, etc. Estadísticamente nos interesa analizar la relación entre dos o más variables, siempre que se tenga un indicio de que entre ellas existe por lo menos cierto grado de dependencia o asociación. Lo importante es medir y expresar funcionalmente esta relación mediante una función o modelo matemático. En el presente capítulo estudiaremos el análisis de regresión entre dos variables X e Y, y el grado de relación entre ellas mediante el análisis de correlación. [33] 33 33

Análisis de regresión lineal simple Si se trata de predecir o explicar el comportamiento de una variable Y, a la que se denomina dependiente o variable respuesta, en función de otra variable X denominada independiente o regresora, Y =f( X ), estamos frente a un problema de análisis de regresión lineal simple; pero si deseamos investigar el grado de asociación entre las variables X e Y estamos frente a un problema de análisis de correlación. Diagrama de dispersión Cómo encontrar la relación entre X e Y? Una de las formas gráficas más sencillas es realizando el diagrama de dispersión, denominado también diagrama de nube de puntos. Este tipo de gráfico se utiliza para visualizar la relación entre las variables y, a partir de dicha relación, observar en qué medida se mantiene el incremento o disminución de una variable a partir del aumento de otra variable. Para su construcción, se trazan en el plano cartesiano los ejes de la abscisa ( X ) y de la ordenada (Y ). En el eje X se colocan los valores de una de las variables y, en el eje Y, los valores de la otra variable. En la intersección correspondiente a cada valor de X y a cada valor de Y se coloca un punto, y así tendremos la nube de puntos. Mostraremos a continuación algunas formas que adquiere el diagrama de dispersión. Figura. Diagramas de dispersión Y Y........................ X Y = a+ bx Y = a bx a) Relación lineal positiva b) Relación lineal negativa X 34 34

Y Y........................................ X Y = a Y = a+ bx + cx c) No hay relación lineal d) Relación no lineal entre X e Y X Como se puede ver en el gráfico (a), los valores de Y se incrementan linealmente conforme X crece, es decir, el conjunto de datos se puede representar por una línea recta ascendente. Por ejemplo, al aumentar la partida presupuestal asignada por el gobierno a un colegio, aumenta la posibilidad de atender una mayor demanda escolar. Es diferente en el gráfico (b), porque cuando los valores de X crecen, los valores de Y decrecen, es decir, el conjunto de datos se puede representar por una línea recta descendente. Así, por ejemplo, cuando aumenta el número de horas semanales que los estudiantes dedican a las distracciones, su rendimiento académico disminuye. En el gráfico (c) no hay ninguna relación entre X e Y ; mientras que el gráfico (d) muestra una relación de tipo curvilínea entre X e Y. Así, por ejemplo, cuando los estudiantes dedican diariamente un mayor número de horas a ver programas de televisión, disminuye su rendimiento académico en el colegio. Como se observa en los diagramas de dispersión, el término lineal empleado se refiere al tipo de relación entre X e Y. Una vez visualizada la relación, los diagramas de dispersión no son suficientes para determinar el grado de la relación entre las variables, por lo que debemos utilizar procedimientos estadísticos para determinar el modelo mas apropiado que exprese el compor- x, y. tamiento del conjunto de datos ( ) i i 35 35

Ajuste de una función de regresión: Método de mínimos cuadrados Ajustar una función de regresión significa encontrar, la función que exprese con mayor precisión la relación entre las variables X e Y. Gráficamente será aquella función que mejor se adecue a la nube de puntos. En este sentido, es recomendable como primer paso construir el diagrama de dispersión o diagrama de nube de puntos para, luego de analizar su forma, decidir por el tipo de función matemática (modelo) o la ecuación de regresión que exprese la relación entre las variables X e Y. Luego, se estiman los parámetros del modelo, para lo cual existen varios métodos, siendo el más usado el método de mínimos cuadrados. Intentamos describir la dependencia de una variable Y sobre una variable independiente X. Emplearemos la ecuación de regresión a fin de apoyar la hipótesis que postula la posible causalidad de los cambios de Y mediante los cambios en X ; para propósitos de predicción de Y en función de X ; y para propósitos de explicación de parte de la variación de Y por X utilizando la última variable como control estadístico. Los estudios de los efectos de la temperatura en el rendimiento académico, el contenido de nitrógeno en el suelo sobre la tasa de crecimiento de una planta, la edad de un estudiante sobre su presión sanguínea, la dosis de un insecticida sobre la mortalidad de una población de insectos, el número de horas de estudio sobre el rendimiento académico, son ejemplos típicos de regresión para los propósitos señalados. Supondremos que el diagrama de dispersión sugiere que la relación entre las dos variables se puede expresar mediante una recta L: Y = a+ bx. El método de mínimos cuadrados garantiza que la recta que representa el comportamiento del conjunto de datos es la recta L, donde la suma de los cuadrados de las diferencias de las ordenadas y i de los puntos observados ( xi, y i), y de las ordenadas yˆ ˆ ˆ i = a+ bx de los puntos ( x, aˆ ˆ i + bx ) que están en la i recta L, sea mínimo. Esto es, se trata de obtener los valores de a y b de tal manera que el valor de la suma de cuadrados de los residuos, SSE, sea mínimo. Es decir: n i i sea mínimo, (5.) i= ( ) ˆ SSE = y y 36 36

donde: y i : son los valores observados de la variable dependiente Y, y ˆi : son los valores estimados de Y, b : es la pendiente de la recta, llamada también coeficiente de regresión, para predecir la variable Y, a : es la constante o intercepto Entonces la ecuación de regresión estimada se expresa como: Yˆ = aˆ + bx ˆ Y....... 0.. 0 0 5 0 5 0 5 30 recta de regresión para predecir Y. Según el método de mínimos cuadrados, se demuestra que â y ˆb valores de a y b que hacen mínima la SSE, satisfacen el denominado sistema de ecuaciones normales: n y = an + b x i i= i= n i X n n n xiyi = a xi + b xi i= i= i=. (5.) Resolviendo el sistema se deducen los siguientes valores para las constantes a y b, denominados valores estimados de los coeficientes de regresión: n n n n yi xi xi xiyi i= i= i= i= n n n xi xi i= i= aˆ = = Y bx (5.3) 37 37

n n n n x y x y bˆ =, i i i i i= i= i= n n n xi xi i= i= (5.4) La recta de regresión nos permite, basándonos en los datos de la muestra, estimar un valor de la variable Y que denotaremos con y ˆi correspondiente a un valor dado x i de la variable X. Para ello es suficiente reemplazar el valor de x i en la recta de regresión y encontraremos el correspondiente valor estimado y ˆi. Ejemplo Con los datos de la tabla, correspondiente al rendimiento académico en el nivel superior (Y ) y al rendimiento académico en el nivel secundario ( X ) de 8 estudiantes: a) Construiremos el diagrama de dispersión. b) Aplicaremos el método de mínimos cuadrados para encontrar los coeficientes de regresión lineal. c) Averiguaremos: Cuál será el rendimiento en educación superior de un estudiante con nota promedio de en la educación secundaria? Tabla : Rendimiento académico en secundaria y en educación superior de un grupo de alumnos Estudiantes X Y 6 5 3 3 5 7 4 4 5 6 6 4 7 3 5 8 0 Solución a) Usando los comando del SPSS presentados en el capítulo VII, se obtiene el diagrama de dispersión presentado en la figura. También presentamos los cálculos para encontrar los valores â y 38 38

ˆb de la ecuación de regresión estimada por el método de mínimos cuadrados. Figura 7 Diagrama de dispersión de rendimiento en secundaria y rendimiento en educación superior Rendimiento en secundaria 5 3 9 0 4 6 Rendimiento en educación superior 8 El diagrama de dispersión nos sugiere que los datos se pueden representar mediante una recta Y = a+ bx. b) Cálculos necesarios para estimar los coeficientes de regresión y usando el método de mínimos cuadrados x i y i x x y i i i 6 5 56 40 3 69 43 5 7 5 55 4 44 68 6 4 56 4 3 5 69 95 0 00 0 Total 06 09 440 466 8 8 8 8 yi xi xi xiyi i= i= i= i= 8 8 8 440 ( 06) n xi xi i= i= 09 440 06 466 aˆ = = = 5, 5 39 39

n n n n x y x y ˆ 8 466 06 09 b= = = 0,6 i i i i i= i= i= n n 8 440 ( 06) n xi xi i= i= Entonces, la recta de regresión de Y sobre X queda expresada como: Yˆ = 5,5+ 0, 6X Si un estudiante obtiene un rendimiento de en secundaria, entonces su rendimiento esperado en educación superior se obtiene reemplazando X por el valor en la recta definida, es decir: Y ˆ = 5,5+ 0,6 = 5,5+ 7,3 =,83. Puede decirse que se estima que un alumno que tiene un rendimiento de puntos en educación secundaria, en educación superior tendrá un rendimiento de,83 puntos. Análisis de correlación lineal Nos proponemos investigar si dos variables son independientes o covarían, esto es, si varían conjuntamente. No expresamos una variable como función de la otra, así como tampoco hacemos distinción alguna entre variables dependientes e independientes. Puede muy bien suceder que, de una pareja de variables cuya correlación se estudia, una sea causa de la otra, aunque nosotros no lo sepamos ni lo sospechemos. Una hipótesis importante, aunque no esencial, es que las dos variables sean efectos de una causa común y lo que se desea conocer es el grado en el que ambas variables varían conjuntamente. Así, podríamos estar interesados en la correlación entre las longitudes de las extremidades superiores y extremidades inferiores en una población de estudiantes, o entre el peso y la estatura de un grupo de estudiantes, o entre los días necesarios para la madurez y el número de semillas en una siembra. La correlación lineal mide el grado de la asociación lineal entre dos variables denotadas con X e Y. Analizando el diagrama de dispersión o nube de puntos podemos visualizar el tipo de correlación lineal entre las variables involucradas. 40 40

Figura 3. Tipos de correlación lineal Y Y........................ X X a) Correlación positiva b) Correlación negativa Y.................... : : :......... c) Correlación nula X Correlación positiva o directa En la figura 3(a), las variables X e Y están correlacionadas positivamente o su variación está en razón directa; es decir, el aumento de la medida de la variable X implica el aumento de la medida de la variable Y. Ejemplo En la tabla se presentan las puntuaciones en Literatura ( X ) y las puntuaciones en Lenguaje (Y ) de un grupo de alumnos de un centro educativo. Se observará su relación a través de un diagrama de dispersión. 4 4

Tabla : Puntuaciones en Literatura y en Lenguaje de un grupo de alumnos Nº Estudiante X Y 5 8 0 3 30 4 6 30 5 6 4 6 4 40 7 8 50 Solución El diagrama de dispersión, usando los comandos del SPSS presentados en el capítulo VII es el siguiente: Figura 4 Puntuaciones en Literatura y Lenguaje de un grupo de alumnos 60 Puntuaciones en Lenguaje 50 40 30 0 0 0 0 0 30 Puntuaciones en Literatura Como se puede observar, cuando aumenta el valor de la variable X (puntuaciones en Literatura) también aumenta el valor de la variable Y (puntuaciones en Lenguaje); luego, visualizando que el tipo de correlación entre las puntuaciones en literatura y lenguaje es positiva. Correlación negativa o inversa Se dice que las variables X e Y están correlacionadas negativamente o su variación está en razón inversa, cuando el aumento de 4 4

la medida de la variable X implica la disminución de la medida de la variable Y, o la disminución de la medida de la variable X implica el aumento de la variable Y, como se puede observar en la figura 3(b). Ejemplo 3 La tabla 3 nos muestra las puntuaciones en Literatura ( X ) y las puntuaciones en Matemática (Y ) de un grupo de alumnos de un determinado centro educativo. Mostraremos el diagrama de dispersión. Tabla 3 Puntuaciones en Literatura y en Matemática de un grupo de alumnos Nº Estudiante xi yi 0 30 30 5 3 38 37 4 40 5 5 60 35 6 65 05 7 80 0 8 90 0 Solución El diagrama de dispersión, usando los comandos del SPSS presentados en el capítulo VII es el siguiente: Figura 5 Puntuaciones en Literatura y Matemática de un grupo de alumnos 40 Puntuaciones en Matemática 30 0 0 0 0 0 40 60 80 00 Puntuaciones en Literatura 43 43

Como se puede apreciar, frente al aumento de las puntuaciones en literatura ( X ) disminuyen las puntuaciones en Matemática (Y ), visualizando la correlación entre X e Y es negativa o inversa. Correlación nula En la figura 3(c) las variables no están correlacionadas entre sí; es este caso, diremos que la correlación entre X e Y es nula; esto lo podemos observar en el siguiente ejemplo. Ejemplo 4 En la tabla 4, la variable X corresponde a las puntuaciones en deporte y la variable Y corresponde a las puntuaciones en Matemática de un grupo de alumnos. Mostraremos el diagrama de dispersión para identificar el tipo de correlación. Tabla 4: Puntuaciones en deporte y en Matemática de un grupo de alumnos Nº Estudiante X Y 0 5 04 0 3 04 35 4 08 05 5 08 40 6 4 05 7 4 5 8 4 40 9 8 0 0 8 35 Solución El diagrama de dispersión, usando los comandos del SPSS presentados en el capítulo VII es el siguiente: 44 44

Figura 6 Puntuaciones en deporte y en Matemática de un grupo de alumnos 50 Puntuaciones en Matemática 40 30 0 0 0 0 0 Puntuaciones en deporte 0 Como se puede apreciar, la correlación entre las puntuaciones en deporte ( X ) y las puntuaciones en matemática (Y ) es nula. Coeficiente de correlación de Pearson ( r ) Existen numerosos coeficientes de correlación en Estadística. El más común de ellos es el denominado coeficiente de correlación producto-momento, cuya formulación se debe a Karl Pearson. El coeficiente de correlación de Pearson se utiliza en el análisis de información cuantitativa, cuando se desea medir el grado de asociación lineal entre dos variables cuantitativas. Sus valores varían entre y. El valor + indica que entre X e Y existe una correlación lineal directa y perfecta; el valor, una correlación lineal inversa y perfecta. El valor 0 indica ausencia de correlación lineal. Para obtener este coeficiente hay una gran variedad de expresiones matemáticas que son equivalentes, destacando las siguientes: a) Para puntuaciones directas o datos originales: r i i ( i)( i) n x y x y = i ( i) i ( i) n x x n y y (5.5) 45 45

b) para puntuaciones Z (puntuaciones tipificadas): r ZZ x y =, (5.6) donde: Z x S x X i i x = Zy =. Sx Sy y Y Propiedades El valor de r se encuentra entre y +, de donde se deduce que: a) Si r > 0, existe correlación directa o correlación positiva, b) Si r < 0, existe correlación inversa o correlación negativa. En la interpretación clásica del coeficiente de correlación se deduce, por ejemplo, que si: a) 0 r < 0,0, la correlación es muy baja, b) 0, 0 r < 0, 40, existe una correlación baja, c) 0, 40 r < 0,70, existe una moderada correlación positiva, d) 0,70 r <,00, existe de moderada a buena correlación positiva, e) r =, 00, existe una perfecta correlación positiva, f), 0 r < 0, 70, existe de moderada a buena correlación inversa, g) r =, 00, existe una perfecta correlación inversa. Ejemplo 5 Se desea saber el grado de relación entre los años de escolaridad de la madre ( X ) y las calificaciones de sus hijos en una prueba de Matemática (Y ). Los datos se presentan en la siguiente tabla. Tabla 5: Años de escolaridad de la madre y calificaciones de sus hijos en una prueba de Matemática Estudiantes X Y 8 5 8 3 3 8 4 6 0 5 7 0 46 46

Solución En la siguiente tabla se presentan los cálculos auxiliares: Estudiantes x i y i xy i i x i 8 96 64 44 5 8 40 5 64 3 3 8 4 9 64 4 6 0 60 36 00 5 7 0 70 49 00 n= 5 9 48 90 83 47 y i Reemplazando los valores obtenidos en la ecuación (5.5) para puntuaciones directas obtenemos: ( ) ( )( ) ( ) ( ) []( ) ( ) 5 90 9 48 58 r = = = 0,9 5 83 9 5 47 8 74x56 El valor del coeficiente de correlación es 0,9, significa una alta correlación positiva; es decir, el nivel de escolaridad de la madre está fuertemente relacionado al rendimiento académico de sus hijos en Matemática. Ejemplo 6 En la segunda y tercera columna de la Tabla 6 se tiene la información sobre coeficientes de inteligencia y puntajes en Matemáticas para una muestra aleatoria de estudiantes que estudiaron el primer año de secundaria en el colegio Cabrera Tapia en el año 000. Encontraremos el coeficiente de correlación de Pearson. El primer día de clases, a todos ellos se les aplicó una prueba para obtener sus coeficientes de inteligencia ( X ) en la escala Stanford-Binet y al término del año se les aplicó una prueba de 35 ítems para evaluar su rendimiento en Matemática. Solución X : puntajes obtenidos en la prueba Stanford-Binet Y : rendimiento en Matemáticas 47 47

Tabla 6: Rendimiento de los estudiantes en Matemática y puntajes obtenidos en la prueba Stanford-Binet x i y i x i xy y i i i 0 7 4400 89 040 5 544 5 680 3 0 5 00 5 650 4 0 9 4400 36 80 5 03 0609 44 36 6 6 0 5876 400 50 7 3 5 769 5 695 8 4 7 996 89 938 9 06 4 36 96 484 0 08 4 664 96 5 8 9 6384 36 43 09 4 88 96 56 Totales 369 9 56859 307 993 Con la fórmula (5.5) obtenemos el coeficiente de correlación de Pearson: (993) 369(9) r = = 0,953 ( (56859) ( 369) ) (307) ( 9) ( ) Se observa muy buena correlación directa y positiva entre coeficiente de inteligencia y el rendimiento académico en el curso de matemática. Ejemplo 7 En la tabla 7 se tiene información de una muestra aleatoria de 5 alumnos del centro educativo Teresa Gonzales de Fanning. Se desea obtener el coeficiente de correlación entre los puntajes obtenidos en Aritmética y Lenguaje para medir su grado de relación. 48 48

Tabla 7: Rendimientos de una muestra de estudiantes del colegio Teresa Gonzales de Fanning, 998. Estudiante Aritmética Lenguaje 5 4 5 3 3 4 5 0 6 3 5 7 5 5 8 5 6 9 6 7 0 5 8 9 3 0 4 5 4 5 3 5 Solución Se ilustran los cálculos auxiliares del coeficiente de correlación de Pearson con los valores observados de las variables notas en Aritmética ( X ) y notas en Lenguaje (Y ). Estudiante x i yi xy x i i i y i 5 6 5 40 56 4 5 96 0 5 3 3 69 56 44 4 44 44 44 5 0 0 00 6 3 5 69 95 5 7 5 5 5 5 5 8 5 6 5 40 56 9 6 7 56 7 89 0 5 44 80 5 3 44 8 9 64 7 8 3 0 00 0 4 5 4 5 0 96 5 3 5 69 95 5 x = 93 y = 04 x = 553 x y = 69 y = 856 i i i i i i Luego, el coeficiente de correlación entre las notas de Aritmética y Lenguaje es: 49 49

5( 69) 93( 04) ( ) ( ) ( ) ( ) r = = 0,878 5 553 93 5 856 04 Se observa una correlación alta y positiva entre los puntajes obtenidos en los cursos de Aritmética y Lenguaje. Ejemplo 8 Para los datos del ejemplo 5, usando comandos del SPSS, se mostrará el diagrama de dispersión y ajustará el modelo de regresión lineal simple. Solución a) Usando comandos presentados en el capítulo VII se obtiene el siguiente diagrama de dispersión. Figura 7 Años de escolaridad de la madre y calificaciones de los hijos en una prueba de Matemática 3 C alificacio nes en M atem á tica 0 9 8 7 3 4 5 6 7 Años de escolaridad de la madre Se observa que existe una relación lineal directa y positiva entre los años de escolaridad de la madre y las calificaciones en una prueba de Matemática que rinden los hijos. b) El siguiente cuadro, también obtenido a partir del SPSS, nos proporciona resultados para encontrar la ecuación de la recta de regresión ajustada por el método de mínimos cuadrados ordinarios. 8 9 50 50

Coefficients a Mode (Constant Años de escolaridad de la madre Standardized Unstandardized Coefficients Coefficients B Std. Beta t Sig. 5,054,38 3,834,03,784,8,90 3,597,037 a. Dependent Variable: Calificaciones en una Prueba de Matemática ˆb â La recta de regresión lineal simple ajustada por el método de mínimos cuadrados es: ˆ Y = 5,054 + 0,784 X, donde nos indica que un incremento de un año en los años de escolaridad de la madre, incrementará en promedio 0,784 puntos la calificación de sus hijos en la prueba de matemática. Ejemplo 9 Usando la información que corresponde a las variables calificación promedio y notas en el curso de álgebra de la base DATOS3- educación, se ajusta la recta de regresión usando el método de mínimos cuadrados. A continuación se presentan el gráfico y las salidas proporcionadas por el SPSS. Solución a) Usando comandos del SPSS se encuentra el siguiente diagrama de dispersión: Figura 8 Notas de Álgebra y calificación promedio de profesores de educación secundaria 8 0 4 6 Notas de Álgebra 5 5

Observamos que las notas de Álgebra y las calificaciones promedio de profesores que participaron en el programa de capacitación, tienen una relación directa o positiva. b) El coeficiente de correlación de Pearson: Model Summary Model R R Square Adjusted R Square Std. Error of the Estim ate,95 a,855,85,5 a. Predictors: (Constant), NOTAS DE ÁLGEBRA r= 0,95 coeficiente de correlación lineal. Se encuentra una correlación alta y positiva entre las notas de álgebra y las calificaciones promedio que alcanzaron los profesores que participaron en el programa de capacitación. c) Los coeficientes de la recta de regresión: Coefficients a Unstandardized C oefficients Standardi zed C oefficien ts Model B Std. Error Beta t Sig. (Constant) 3,853,477,000 NOTAS DE ALGEBRA,708,043,95 6,99,000 a. Dependent Variable: NOTAS PROMEDIO â ˆb con los que se obtiene la ecuación de la recta de regresión ajustada por el método de mínimos cuadrados: ˆ Y = 3,853 + 0,708 X, donde vemos que un incremento en la notas de Álgebra de un punto, incrementará la calificación promedio de los profesores de educación secundaria, en promedio en 0,708 puntos. 5 5

Análisis de regresión lineal múltiple La ecuación de regresión lineal simple estudiada en la sección anterior, se puede generalizar a una ecuación de regresión lineal múltiple, cuando se tenga dos o más variables independientes o regresoras X, X,..., X k, y una variable independiente o respuesta Y. Explicaremos el análisis de regresión lineal múltiple con los datos del ejemplo 0, en el que se muestran los coeficientes de inteligencia (IQ), los promedios de las calificaciones y el tiempo que dedican al estudio estudiantes. Se desea predecir el promedio de las calificaciones de estos estudiantes en función de sus coeficientes de inteligencia y de los tiempos que dedican al estudio. Se tienen dos variables regresoras: coeficiente de inteligencia, X y tiempo dedicado al estudio, X, para explicar el comportamiento de la variable dependiente o respuesta Y : calificación promedio de los estudiantes. Para el problema descrito se postula la forma general de la ecuación de regresión lineal múltiple: Yˆ = aˆ+ bx ˆ + cx ˆ (5.7) donde: ˆ Y : valores estimados de la variable dependiente o respuesta, â, ˆb, ĉ : coeficiente de regresión de la ecuacuón de regresión lineal múltiple, X, X : variables independientes o regresoras, Esta ecuación es muy similar a la utilizada en la regresión lineal simple, excepto que agregamos otra variable independiente. Para hallar los valores de â, ˆb, ĉ, se toma una muestra de los valores ( y i, x i x i ) i =,..., n, y para cada punto se tiene el sistema de ecuaciones, yi = a+ bxi + cxi, donde y i es el i-ésimo valor de la variable Y, x i, x i, los i-ésimos valores de las variables independientes X, X,. Luego, se usa el método 53 53

de mínimos cuadrados para encontrar los valores â de a, ˆb de b y ĉ de c, que hacen mínima la suma de cuadrados de los n errores, es decir, que minimizan ( ) SSE = y yˆ i i. i= Cabe resaltar que el método de mínimos cuadrados conduce a un sistema de ecuaciones denominadas ecuaciones normales, a partir de las cuales, utilizando conceptos de algebra matricial se encuentran los estimadores â, ˆb, ĉ de los parámetros a, b, c tema que está fuera de los objetivos del presente libro y que no será abordado aquí. Todos los problemas de regresión múltiple serán resueltos con el soporte del SPSS, puesto que en la mayoría de las investigaciones el número de observaciones y el número de variables es grande, lo que dificulta el trabajo manual. Ejemplo 0 Para una muestra de estudiantes se dispone de sus coeficientes de inteligencia, tiempo semanal dedicado al estudio y los promedios de sus calificaciones. Vamos a ajustar la ecuación de regresión lineal múltiple, la que explique en función de y, usando el método de mínimos cuadrados. Promedio de calificaciones, Coeficiente intelectual y Tiempo dedicado al estudio Estudiante IQ Tiempo de estudio Promedio de calificaciones ( X ) ( X ) ( Y) 0 8,0 0,6 3 8 6, 4 9 3, 5 4,6 6 5 6,8 7 7 3,6 8 30,0 9 3 3 3, 0 34,6 36 3,0 38 8 3,6 54 54

= + +, para es- Solución Postulamos la ecuación de regresión Y a bx cx tudiar la relación entre Y y las variables X, X, donde: X : Coeficiente intelectual (IQ) X : Tiempo de estudio Y : Promedio de calificaciones Usamos las opciones del SPSS: Activar el SPSS y copiar los datos en un archivo de nombre: COEFICIENTE. En VARIABLE VIEW, definir las siguientes variables: IQ, TIEM- PO y CALIFICA con sus respectivas especificaciones y, en DATA VIEW, colocar los datos de la tabla. Ejecutar ANALYZE/ REGRESSION/LINEAR/ ingresar en DEPENDENT la variable CALIFICA y en INDEPENDENT las variables IQ TIEMPO/OK. El output del SPSS es el siguiente: Coefficients Unstandardized,,,, ˆb Las estimaciones de los parámetros son: a ˆ = 5, 49, ˆb = 0,049 ĉ = 0,8 ĉ Luego, la ecuación de regresión lineal múltiple ajustada por el método de mínimos cuadrados es: â 55 55

Yˆ = 5,49 + 0,049X + 0,8X donde, manteniendo constante la variable tiempo de estudio, un incremento en el coeficiente intelectual (IQ) de un punto, por ejemplo, es acompañado por un incremento en el promedio de calificaciones de 0,049 puntos. En forma similar, manteniendo constante la variable coeficiente intelectual, un incremento de hora en el tiempo de estudio, es acompañado por un incremento en el promedio de calificaciones de 0,8 puntos. Coeficiente de determinación El coeficiente de determinación R, multiplicado por 00, indica el porcentaje de la variación de la variable dependiente y que es explicado por las variaciones de las variables independientes del modelo. También se dice que mide la bondad del ajuste o de la recta de regresión ajustada por el método de mínimos cuadrados. Se puede demostrar que la variabilidad de Y, expresada por la suma de cuadrados total, SST = ( y y), se puede dividir en dos componentes: la suma de cuadrados debido a la regresión, SSR = ( y ) ˆi y, y la suma de cuadrados debido a los residuos, SSE = ( y yˆ ). Es decir:, donde: i i SST : suma de cuadrados del total SSR : suma de cuadrados debido a la regresión SSE : suma de cuadrados debido a los residuos Por ello, resulta natural definir el coeficiente de determinación como: SSR R = SST Retomando nuestro ejemplo en el que la variable dependiente es el promedio de calificaciones de un alumno y la variables inde- i 56 56

pendientes, el coeficiente de inteligencia y el tiempo dedicado al estudio; calcularemos la SST, SSR, SSE y el coeficiente de determinación R, usando el SPSS. El output del SPSS es el siguiente: ANOVA Model Sum of Squares df,,,,,,, SSR R = SST = R 6,389 = = 0,9 7,0 El coeficiente de determinación 0,9 significa que el 9% de las variaciones observadas en la calificación promedio de los alumnos son explicadas por las variaciones del puntajes de coeficiente de inteligencia y del tiempo dedicado al estudio. El valor 0,09 = 0,9, llamado coeficiente de alienación, indica que el 9% de las variaciones observadas en la calificación promedio de los alumnos no son explicables por las variaciones en los puntajes del coeficiente de inteligencia y del tiempo dedicado al estudio, sino por otras variables o factores no considerados en el modelo. Coeficiente de correlación parcial A veces, una alta correlación entre dos variables cuantitativas se interpreta equivocadamente como una relación de causa y efecto entre ellas; pero esa alta correlación puede deberse a la influencia de otras variables subyacentes, denominadas variables espurias. Así, por ejemplo, si se observa una relación positiva entre la asistencia a la iglesia los domingos y la honestidad de las personas mayores, esto no implica necesariamente que las personas son honestas porque van a misa los domingos, pues una razón subyacente para que las dos variables estén correlacionadas puede en- 57 57

contrarse en variables subyacentes como el entrenamiento temprano en asistir a la iglesia y en enseñar a los niños a tener actitudes honestas. El coeficiente de correlación parcial mide la relación lineal entre dos variables, eliminando la influencia que puedan ejercer otras variables. Así, para las variables X, X y X 3, el coeficiente de correlación parcial entre las dos primeras variables mide la relación lineal entre las variables X, X eliminando la influencia que puede ejercer la tercera variable X 3. La fórmula de cálculo es la siguiente: r = 3 r r r r 3 3 ( 3)( 3) r (5.8) donde r.3 es el coeficiente de correlación parcial entre X, y X, controlando X 3. El coeficiente de correlación parcial entre X, y X, controlando X 3 y X se define como: 4 r 34 = r r r r 3 4.3 4 3 ( 4 3)( 4 3) r La fórmula de obtención del coeficiente de correlación parcial entre las variables X i y X,..., X, X,..., X, X,... X es la siguiente: r X j, controlando las variables r + +, i i+ j j+ k, ij,,..., i, i,..., j, j,..., k ij,,..., i, i+,..., j, j+,..., k donde: = s s ij,,..., i, i+,..., j, j+,..., k s ii,,..., i, i+,..., j, j+,..., k jj,,..., i, i+,..., j, j+,..., k s ii,,..., i, i+,..., j, j+,..., k :varianza de la variable X i, controlando las variables X,..., Xi, Xi+,..., X j, X j+,... Xk ; 58 58

s jj,,..., i, i+,..., j, j+,..., k : varianza de la variable X j, controlando las variables X,..., X, X,..., X, X,... X i i+ j j+ k. Ejemplo Con la base de DATOS3-educación se ilustra el cálculo del coeficiente de correlación parcial entre la nota promedio y la nota de Álgebra, controlando la nota de Aritmética. X : notas promedio X : notas de Álgebra X : notas de Aritmética 3 Solución a) Considerar la base DATOS3- educación y calcular los coeficientes de correlación simple entre los pares de variables X, X X, usando los comandos del capítulo VII, la salida es: 3 NOTAS PROMEDIO Pearson Correlation NOTAS DE ÁLGEBRA Pearson Correlation NOTAS DE ARITMÉTICA Pearson Correlation NOTAS NOTAS DE NOTAS DE PROMEDIO ÁLGEBRA ARITMÉTICA,95,903,95,893,903,893 donde: r = 0, 95; r = 0,903; r = 0,893 3 3 y se obtiene el valor del coeficiente de correlación parcial entre la nota promedio ( X ) y la nota de álgebra ( X ), manteniendo constante la nota en aritmética ( X 3 ), usando la ecuación (5.8): ( ) 0,95 0,903 0,893 0,86 r 3 = = = 0, 67 0, 0374. ( 0, 903 )( 0,893 ) El coeficiente de correlación entre la nota promedio y la nota en álgebra es 0,95, en tanto que la correlación entre ellas eliminando la influencia de la nota de aritmética es 0,67; lo que signi- 59 59

fica que la correlación lineal entre la nota de Álgebra y la nota promedio estaba influenciada por la nota en Aritmética. b) Usando el SPSS, se abre la base de DATOS3-EDUCACION y con los comandos del capítulo VII se tiene el siguiente cuadro: Control NOTAS NOTAS DE Variables PROMEDIO ÁLGEBRA NOTAS DE NOTAS Correlation,000,6 ARITMÉTICA PROMEDIO NOTAS DE Correlation,6,000 ÁLGEBRA Como puede observarse, el valor del coeficiente de correlación parcial coincide con el valor ya encontrado. Ejemplo Se sabe que la disposición de las mujeres a trabajar fuera de casa no ha sido la misma en todas las épocas, y también que varía de un lugar a otro y de unos grupos sociales a otros. En estas condiciones, puede preguntarse qué variables influyen para que las mujeres estén más o menos dispuestas a trabajar fuera de casa. Estas preguntas se plantean hoy día los sociólogos y consideran que si la variable dependiente fuera el porcentaje de mujeres trabajadoras, estaría explicada por algunas variables como: el salario que perciben las mujeres, el salario percibido por el marido, el número de hijos, edad de las mujeres, tasa general de desempleo, entre otras. En la base DATOS7-mujeres, se tienen los valores observados de las variables: Z 3 : logaritmo ( X / X ) X : salario promedio de las mujeres X : salario promedio de los hombres X 3 : número promedio de hijos por familia X : edad promedio de las mujeres, para una muestra de 4 señoras casadas. a) Encontrar el coeficiente de correlación lineal entre los salarios de las mujeres y los salarios de los hombres. 60 60

b) Se propone encontrar el coeficiente de correlación parcial entre los salarios de los hombres y las mujeres, controlando la variable edad de las mujeres. Solución a) Abrir la base de DATOS7-mujeres y seleccionar los comandos del SPSS del capítulo VII (procedimientos estadísticos) que permiten obtener el coeficiente de correlación simple. El output del SPSS nos proporciona el coeficiente de correlación simple entre los salarios de los hombres y las mujeres. Correlations Salario de Salario de mujeres hombres Salario de mujeres Pearson Correlation,807 Salario de hombres Pearson Correlation,807 b) Abrir la base DATOS7- mujeres y seleccionar los comandos del capítulo VII que permiten obtener el coeficiente de correlación parcial, de X y X controlando X. 4 El output del SPSS nos proporciona el coeficiente de correlación parcial entre los salarios de los hombres y las mujeres, controlando la edad de las mujeres. Correlations Control Salario de Salario de Variables las mujeres los hombres Edad de las Salario de las Correlation,000,806 mujeres mujeres Salario de Correlation,806,000 los hombres Así, r = 0,807 es el valor del coeficiente de correlación lineal entre los salarios de las mujeres y los salarios de los hombres, valor que indica una buena relación directa entre las variables. Por otro lado, r 4 = 0,806, es el valor del coeficiente de correlación entre los salarios de los hombres y los salarios de las mujeres controlando la edad de las mujeres. Se observa que la correlación entre los salarios de las mujeres y de los hombres no está influenciada por la 6 6

edad de la mujer, puesto que se sigue manteniendo alta cuando la variable edad de las mujeres es controlada. Ejercicios. En los siguientes casos identifique en caso de ser posible la(s) variable(s) dependiente(s) e independiente(s). a) El presupuesto familiar destinado a la educación de los hijos y los ingresos familiares. b) El volumen de ventas de una empresa y la inversión en propaganda. c) El número de hijos por familia y el nivel educativo de los padres. d) El analfabetismo, lugar de residencia y la expansión del servicio educativo. e) La edad y el tiempo efectivo de servicio de los docentes afiliados al sindicato de profesores.. A 0 candidatos del programa de doctorado en Psicología se les aplica una prueba de personalidad ( X ) y un examen general de conocimientos ( Y ). Las puntuaciones fueron las siguientes: Candidato A B C D E F G H I J X,96,46 3,36 3,40,43,,85 3, 3,0,75 Y 59 506 59 60 474 509 550 600 575 540 Realice el análisis de regresión y correlación lineal. 3. Un profesor de Estadística realiza un estudio para investigar la relación que existe entre la ansiedad y el rendimiento de sus estudiantes en los exámenes. Elige a 0 estudiantes para el experimento y, antes de asistir al examen final, los 0 estudiantes respondieron un cuestionario de ansiedad. A continuación se tienen las calificaciones de la prueba final y los puntajes obtenidos en el cuestionario de ansiedad. Ansiedad 8 4 35 39 3 4 50 46 45 37 Examen 8 58 63 89 9 64 55 70 5 7 Final 6 6

a) Elabore el diagrama de dispersión. Utilice la ansiedad como la variable regresora o independiente. b) Describa la relación que muestra el diagrama de dispersión. c) Suponga que la relación es lineal y calcule el valor del coeficiente de correlación e interprete. d) Determine la recta de regresión por mínimos cuadrados para predecir la calificación del examen final dado el nivel de ansiedad. e) Si un estudiante tiene un nivel de ansiedad de 38, qué valor podría predecirse para su calificación en el examen final? 4. Se realiza un estudio con 0 estudiantes de postgrado en Educación. X es el número de problemas resueltos correctamente por un estudiante en clase, X son las puntuaciones obtenidas al aplicarles una prueba psicológica que mide la autoestima, e Y es el número de problemas que cada estudiante espera resolver correctamente en el examen final. Con los datos que se presentan a continuación realice el análisis de regresión lineal múltiple usando el SPSS. Estudiante Número Puntuación en Número de problemas autoestima problemas que espera resueltos resolver en el examen final en clase 4 5 4 8 5 5 3 9 9 8 4 3 33 5 0 39 5 6 38 4 7 4 74 8 8 5 74 9 9 7 0 6 78 7 5. Se aplicó a un grupo de 8 adolescentes sordomudos la prueba de inteligencia de Wechsler para adultos (Wais) y cuatro subtest. Las puntuaciones de ambas aplicaciones son las siguientes: 63 63

Adolescentes Wais Razonamiento Razonamiento Relaciones Velocidad y mecánico abstracto espaciales exactitud 48 38 5 5 48 9 38 5 40 3 47 0 37 0 4 46 0 37 7 0 5 46 7 35 9 8 6 43 34 5 7 7 4 34 4 3 8 4 9 33 0 35 9 4 7 33 3 35 0 40 5 3 5 7 39 5 3 7 3 5 5 8 3 3 7 5 9 9 4 30 6 3 9 37 5 9 5 3 9 6 9 5 9 39 7 8 6 0 8 8 7 6 8 38 a) Realice un análisis de regresión lineal simple de Y con cada uno de los cuatro subtest. b) Realice un análisis de regresión lineal múltiple. 6. Se conocen las edades ( X ) y la presión sanguínea (Y ) de mujeres. Si x = y = x = y = x y = i 68, i 684, i 3446, i 388, i i 89894. a) Encuentre la recta de regresión de Y sobre X. b) Si una mujer tiene 49 años, cuál sería su presión sanguínea? c) Si una mujer tiene 7 años, cuál es la presión sanguínea esperada? 7. La siguiente tabla muestra las calificaciones obtenidas por 0 estudiantes en dos pruebas de Estadística: X : Primera prueba 0 6 6 4 0 8 8 4 Y : Segunda prueba 6 4 4 0 0 6 0 6 64 64

a) Construya el diagrama de dispersión. b) Obtenga la recta de regresión de Y sobre X. c) Si un estudiante obtuvo 4,7 en la primera prueba, cuánto se espera que obtenga en la segunda prueba? 8. Dos profesores, con el propósito de examinar cuál es la influencia que los métodos de enseñanza basados en el trabajo libre y creativo del alumno ejercen sobre su rendimiento escolar, llevaron a cabo una investigación con niños y niñas, en los que evaluaron los siguientes aspectos: Creatividad : CREAT Coeficiente intelectual :C.I. Capacidad de orden : ORDEN Rendimiento escolar :RENDIM. CASO ORDEN C.I. RENDIM. CREAT. CASO ORDEN C.I. RENDIM. CREAT. 8 4 0,85 8,00 3 4 09 0,84 4,50 6 03 0,87 4,00 3 7 3 0,88 7,50 3 5 97 0,90 8,00 33 7 3 0,86 6,00 4 3 94 0,80,00 34 0 06 0,9 8,00 5 4 88 0,70 9,00 35 7 0 0,74 6,00 6 6 76 0,70 4,00 36 6 95 0,6 5,50 7 7 6,00 0,0 37 9 5 0,9 7,00 8 4 86 0,73 5,50 38 6 00 0,6,00 9 4 97 0,99 3,00 39 7 0,7,00 0 3 9 0,75 8,00 40 3 53 0,4 5,00 6,5 3,50 3,50 4 3,5 77 0,,50 5 63 0,73,00 4 7 00 0,65 3,50 3 3 9 0,90 6,00 43 8 05 0,78 5,00 4 5 86 0,8 8,00 44 5 89 0,48 0,00 5 5,5 84 0,8 5,00 45 6 05 0,9 4,50 6 4,5 63 0,6 5,00 46 4 9 0,97 6,00 7 4 88 0,77 7,00 47 3 98 0,6,00 8 0 8 0,99 7,00 48 3 9 0,84 4,00 9 7 0 0,78 6,00 49 6 90 0,63 0,00 0 8 5 0,98 7,00 50 6 98 0,89 6,50 6 93 0,74 6,00 5 6 3,05 6,00 0 30 0,94 7,00 5 4 9 0,84 3,00 3 7 90 0,76 4,00 53 8 98 0,74 5,00 4 5 90 0,8 5,00 54 7 86 0,58 0,50 5 9 0 0, 8,00 55 5 88 0,8,00 6 7 0 0,85 7,00 56 5 88 0,8,50 7 7 99 0,9 6,00 57 5 0 0,75 3,00 8 6 00 0,73 6,00 58 5 0 0,88 6,50 9 6 88 0,64 5,00 59 6 76 0,8 4,00 30 4 74 0,45 3,00 60 4 94 0,65 0,00 65 65

a) Use comandos del SPSS para crear el archivo de datos. b) Existe relación entre inteligencia y creatividad? c) Sobre la base de los datos obtenidos en esta experiencia, podemos afirmar que, a mayor creatividad, corresponde una menor capacidad de orden? d) Sobre la base de los datos obtenidos en esta experiencia, podemos afirmar que existe relación lineal entre rendimiento escolar y creatividad? e) Cuál es la recta que mejor permite predecir la variable rendimiento escolar en función de la variable creatividad? Interprete. f) Manteniendo constante la capacidad intelectual de los alumnos, la creatividad está relacionada con el rendimiento escolar? g) Sobre la base de los datos obtenidos en esta experiencia, podemos afirmar que existe relación lineal entre el rendimiento escolar y la inteligencia? h) Cuál es la ecuación de la recta que permite predecir el rendimiento escolar en función de la variable inteligencia? Interprete. 66 66