DISEÑO Y ANÁLISIS DE DATOS II. ENEO 6. Problema.- Tengamos las puntuaciones de X, las predichas y las residuales:.- Calcular la ecuación de regresión.- Correlación entre X e Y.- Por cada punto que aumenta X la predicha baja.6, así que la pendiente será -.6. Como la relación ha de ser lineal, cuando X vale, el valor de la predicha ha de ser.6 puntos mayor que cuando X vale, así pues la ordenada en el origen vale 5.8. Esto es: Y 5.8.6X.- Sabemos que en relación a las puntuaciones residuales: De donde: e Y Y Sumemos el error a la puntuación pronosticada: Y Y + e En relación a la suma de cuadrados total: ( Y Y (5 4 + (6 4 + (3 4 + ( 4 + (4 4
Y en relación a la explicada: ( ˆ Y Y (5. 4 + (4.6 4 + (4 4 + (3.4 4 + (.8 4 3. 6 Luego: ( Y ( Y Y 3.6.36 La correlación valdrá: r xy.36 ±.6 rxy.6 Ya que la pendiente es negativ Problema.- Tengamos dos variables: X e Y. En relación a X: También: X:,, 3, 4, 5 Estadísticos descriptivos N Mínimo Máximo Media X Y N válido (por lista 5, 5, 3, 5, 5, 4, 5 Coeficientes a Modelo B Beta t Sig. (Constante,9,635,99,58 X,7,9,94 3,656,35 3.- Esto supuesto, completar la tabla siguiente:
3.- Calculemos en primer lugar las puntuaciones pronosticadas: Calculemos la suma de cuadrados explicada: ( ˆ Y Y.9 +.7.6 Y.9 +.7 3.3 Y 3.9 +.7 3 4. Y 4.9 +.7 4 4.6 Y 5.9 +.7 5 5.3 Y (.6 4 + (3.3 4 + (4 4 + (4.6 4 + (5.3 4 4. 9 El coeficiente de correlación coincide con el coeficiente de regresión en estandarizadas:.94.87 Por tanto, la suma de cuadrados total será: ( Y Y ( Y 4.9.87 6 A partir de estos datos ya es fácil calcular el resto de la tabl Nos queda la significación estadística, que debe ser la misma que la de la pendiente de la recta, ya que la probabilidad de que una cierta estructura se deba al azar es la misma siempre, indiferentemente del estadístico de contraste que utilicemos (F de Snedecor o t de Student. ANOVA a Modelo gl F Sig. egresión 4,9 4,9 3,364,35 b esiduo, 3,367 Total 6, 4 b. Problema 3.- Estudiamos la relación entre personalidad (extrovertidos, introvertidos y ambivertidos sobre el tiempo de reacción en una muestra de 7 sujetos. En el siguiente segmento del archivo de datos aparecen las puntuaciones de las distintas variables de los 9 primeros sujetos de la muestra (PE_ hace referencia a las predichas: 3
4.- Calcular la ecuación de regresión que liga personalidad y tiempo de reacción. 5.- Cuál sería el error cometido para un sujeto ambivertido que hubiera obtenido 8 puntos en el tiempo de reacción? SOL.: 4.- Está claro que la codificación es: intro Introvertidos Extrovertidos Ambivertidos extro La ecuación de regresión será: Y b + b X + b X Donde X se refiere a la variable intro y X a la variable extro. Como se sabe b nos indica la media de los que han sido codificados como, que son los ambivertidos, y b a la diferencia entre introvertidos y ambivertido, y b a la diferencia entre extrovertidos y ambivertidos. Por tanto: b 75 b 9.63 75 5.63 b 65.75 75 9.5 Por tanto: Más formal: Y 75 + 5.63X 9.5X 4
ambi int ro extro b b b b + b b + b b + b * + b *+ b * + b * b * b + b 75 * b + b 9.63 65 b 75 b b 9.63 75 5.63 65.75 75 9.5 5.- Como la puntuación pronosticada para los ambivertidos es 75, el que haya obtenido 8 habrá tenido un error de 5 puntos: e Y Y 8 75 5 Problema 4.- Estudiamos la relación de la inteligencia y las horas de estudio sobre la calificación en una determinada asignatura: Coeficientes a Correlaciones Modelo B Beta t Sig. Orden cero Parcial Semiparcial (Constante -7,958,8-6,5, Horas de estudio,87,8,553 6,646,,58,85,553 Inteligencia,96,,739 8,876,,76,97,738 6.- Especifica la ecuación de regresión múltiple en puntuaciones directas y estandarizadas e interpreta sus coeficientes. 7.- Calcula la proporción de variabilidad explicada conjuntamente por las variables independientes. 6.- La ecuación de regresión en directas es: Y 7.958 +.87X +.96X 7.958 hace referencia a la calificación media para horas de estudio y inteligenci Obviamente en esta circunstancia este valor no tiene interés ya que no existe inteligencia de, ni puede haber una calificación negativ.87 es el incremento medio en la calificación por cada hora de estudio manteniendo constante la inteligenci Significativo, con una probabilidad <...96 es el incremento medio en la calificación por cada punto en inteligencia, manteniendo constante las horas de estudio. Significativo, con una probabilidad <.. Y la regresión en estandarizadas: Z Y.553Z +.739Z 5
Como las puntuaciones estandarizadas equivalen a desviaciones tipo,.553 nos indica el cambio medio en desviaciones tipo de Z Y por cada desviación tipo de Z, y.739 el cambio medio en desviaciones tipo de Z Y por cada desviación tipo de Z. En ambos casos manteniendo constante la otra variable. 7.- Por el primer modelo observamos que las horas de estudio explica una proporción de (.58.338. Por otro lado, la proporción que añade la inteligencia (su correlación semiparcial al cuadrado es.738.545. Por tanto, entre ambas explicarán.338 +.545.88. Más formalmente: y. y + y(. (.58 +.738.88 También lo podríamos haber hecho con la correlación de orden cero de la inteligencia y la semiparcial de las horas de estudio: y. y + y(. (.76 +.553.88 Problema 5.- Estudiamos el efecto de la personalidad y de la motivación sobre el rendimiento. La variable personalidad tiene dos niveles (extrovertido e introvertido. Disponemos de la siguiente información: Coeficientes a Modelo B Beta t Sig. (Constante,9,879,59, person cmotiv cmotixperson 3,47,4,47,744,3,6,59,6,36,8 -,779,35 -,56 -,3,38 8.- Podemos considerar que la personalidad modula el efecto de la motivación sobre el rendimiento?. Por cada 5 puntos de mejora en la motivación, cuánto se incrementa el rendimiento en los extrovertidos? y en los introvertidos? 8..- Sí, el cambio en la pendiente (-.779 es estadísticamente significativa (P.38 <.5. 8..- En cuanto al incremento en el rendimiento de los extrovertidos e introvertidos: extro int ro.9 +.6X c (.9 + 3.47 + (.6.779 X c 3.597.67X c El incremento del rendimiento de los extrovertidos será de 5*.6 3.6 puntos Y el de los introvertidos: 5*(-.67 -.835 puntos 6