DISEÑO Y ANÁLISIS DE DATOS EN PSICOLOGÍA II PRÁCTICA 7 Problema 1. Tengamos el siguiente ANOVA obtenido en una investigación con N 15 donde se estudia la relación entre autoeficacia percibida (X y el rendimiento en una tarea (Y. ANOVA 1 Regresión Residual Total Suma de Media cuadrados gl cuadrática F Sig. 43,060???,000 19,873??? Completa la información que falta en el ANOVA realizado. ANOVA 1 Regresión Residual Total Suma de cuadrados gl Media cuadrática F Sig. 43,060 1 43,060 8,168,000 19,873 13 1,59 6,933? Problema.- Hemos estimado una regresión para estudiar la posible relación entre el grado de histrionismo y la autoestima. Hemos utilizado el paquete estadístico SPSS y hemos obtenido los siguientes resultados. Resumen del modelo R R cuadrado?,19 a Variables predictoras: (Constante, Histriónica ANOVA(b Suma de cuadrados gl Media cuadrática F Sig. 1 Regresión? 1 85,106 13,494,000(a Residual? 91? Total 07,88 9 a Variables predictoras: (Constante, Histriónica b Variable dependiente: autoestima
Coeficientes(a Coeficientes no estandarizados Coeficientes estandarizad os B Error típ. Beta t Sig. 1 (Constante 10,14 1,315 7,701,000 Histriónica -,069,019??,000 a Variable dependiente: autoestima a Completa los valores que aparecen con interrogantes en las tablas. Cuánto vale la bondad de ajuste? b Representa en un diagrama de Venn la Bondad de ajuste del modelo c Escribe la ecuación de regresión estimada en puntuaciones directas, centradas y típicas. SOL a En relación a la primera tabla R R 0.19 0. 359. En relación a la segunda tabla: R ( Y Y ( Y Y Y ˆ 0.19 07.88 Y en cuanto a la suma de cuadrados residual: Y 07.88* 0.19 85. 106 ( Y ˆ Y ( Y Y ( Y Yˆ 07.88 85.106 193. 081 La media cuadrática residual: ( Y Y ˆ N K 1 193.081 1.19 91 El coeficiente estandarizado, en la regresión simple, es la correlación entre X e Y: Y en relación al valor de t: β r xx 0.359 t b 0 ( 0.069 0 3.631 S b 0.019
b 0.19 00. c Ecuación en directas: Yˆ 10.14 0. 069X En centradas: yˆ 0. 069x En estandarizadas: Z y 0.359Z x Problema 3.-Tengamos la siguiente tabla donde se expresa la relación entre X (horas invertidas en una tarea e Y (nivel de estrés: 1 (Constante X a. Variable dependiente: Y Coeficientes no estandarizados Coeficientes a Coeficientes estandarizad os B Error típ. Beta t Sig. 1,981,910,178,061,704,165,833 4,65,003 a Qué indica la hipótesis nula? b Cuál es la probabilidad de equivocarnos al rechazar la hipótesis nula? Razona tu respuesta. c Cuál es la proporción de variabilidad explicada por la variable X? d Cuál es el incremento del estrés por dos horas invertidas en la tarea? a Que ambas variables no están relacionadas, que las horas invertidas en la tarea no influyen en el estrés. b Su valor es 0.003, que indica la probabilidad de obtener una pendiente de 0.704 de una supuesta población de pendiente 0. Al rechazar la Ho hay que tener en cuenta, no obstante, que podría ocurrir 0.003 veces desde la Ho y que esas veces nos podríamos equivocar.
c Será el cuadrado de 0.833, que es precisamente la correlación entre horas y estrés. O sea: 0.694. d Si por cada hora es 0.704, por horas será 1.408 puntos. Problema 4.- Tengamos las variables X e Y, tales que los valores de Y son: Y: 5, 7, 7, 6, 9, 8 Por otro lado, en relación a los residuos, sabemos que e Esto supuesto, calcular rxy Calculemos la suma de cuadrados total: ( Y Y (5 7 + (7 7 + (7 7 + (6 7 + (9 7 + (8 7 10 Nos dicen que la suma de cuadrados no explicada es, luego la explicada será 10-8. Por tanto: R Y ( Y Y 8 10 0.8 La correlación valdrá: r xy R 0.8 ± 0.894 Problema 5.- Relacionamos la variable 1 X con la variable Y. Disponemos de las puntuaciones observadas en Y y de las puntuaciones residuales.
Determinar R. Calculemos la suma de cuadrados total: ( Y Y ( 5.4 + (4 5.4 + (8 5.4 + (6 5.4 + (7 5.4 3. 0 Y la no explicada: ( Yˆ Y e ( 1 + ( 0. + (.6 + ( 0.6 + ( 0.8 8. 80 Luego: R Y ( Y Y ( Y Y ( Y Yˆ ( Y Y 3.0 8.80 3.0 14.40 3.0 0.61 Problema 6.- Estudiamos la relación entre X e Y. Disponemos de las puntuaciones observadas en Y y las predichas. Y Yˆ 1.000 1.49 3.000 4.000 5.000 4.000 7.000 4.857 4.000 5.714 Esto supuesto determinar la correlación entre X e Y. En relación a la suma de cuadrados total: ( Y Y (1 4 + (3 4 + (5 4 + (7 4 + (4 4 0 Y en relación a la explicada:
( ˆ Yˆ Y (1.49 4 + (4 4 + (4 4 + (4.857 4 + (5.174 4 10. 8 Luego: R Y ( Y Y 10.8 0 0.54 La correlación valdrá: r xy R 0.54 ± 0.717 Problema 7.- Tengamos los siguientes datos: donde: Coeficientes no es tandarizados Coeficientes a Coeficientes es tandarizad os B Error típ. Beta t Sig. 1 (Constante.500 1.133.441.689 X 1.500.34.930 4.39.0 a. Variable dependiente: Y En relación al sujeto cuarto, cuya puntuación en X es 4, determinar la puntuación prevista en Y, junto a su error asociado (Puntuaciones directas. La puntuación prevista para este sujeto será: Y ˆ a + bx 0.5 + 1.5* 4 6.5 Como ha obtenido 5 puntos, su error asociado será:
e Y Yˆ 5 6.5 1.5 Problema 8.- Supongamos que relacionamos Horas de estudio y Rendimiento. Sabemos que aquellos que no estudian nada obtienen por término medio puntos y que por cada hora de estudio se mejora el rendimiento 0.6 puntos. Determinar la ecuación de regresión en directas. En base al enunciado: Yˆ + 0. 6X Problema 9.- Supongamos que para aprobar la asignatura de Diseños Experimentales hacen falta 4 horas a la semana por término medio. Supongamos igualmente que los que no estudian nada obtienen 1.5 puntos. Esto supuesto, calcular cuantas horas hay que estudiar a la semana para conseguir un notable. La ordenada en el origen es precisamente 1.5, que hace referencia al valor de Y cuando X0. Como hacen falta 4 horas para aprobar: Y ˆ 1.5 + b * 4 5 Despejando b: 5 1. 5 b 0. 875 4 Luego la ecuación de regresión será: Yˆ 1. 5 + 0. 875X Para sacar notable: 7 1. 5 + 0. 875X Despejando X: 7 1. 5 X 6. 9 0. 875
En consecuencia, son necesarias 6.9 horas a la semana para obtener notable. Problema 10.- En una clase de matemáticas compuesta por 50 alumnos, la puntuación media en matemáticas es de 5 puntos y la media de estudio de dicha materia a lo largo de la semana es de 3 horas. Se sabe que los que no estudian nada obtienen puntos. Esto supuesto, determinar el incremento en matemáticas por cada hora de estudio. Nos piden la pendiente, que es precisamente el cambio en Y (Matemáticas por cada unidad de cambio en X (Horas de estudio. Por otro lado, si los que no estudia obtienen puntos, entonces esa es la ordenada en el origen. También sabemos que las medias de X e Y satisfacen la ecuación de regresión: Y a + bx 5 + b * 3 Despejemos b: 5 b 3 1 Ese será el incremento en matemáticas por cada hora de estudio. Problema 11.- En la siguiente tabla se presenta la relación entre Sexo y Estatura en una muestra de 7 estudiantes de 3º de primaria. La codificación es 0 para los niños y 1 para las niñas. Por otro lado, tenemos 14 niños y 13 niñas. 1 (Constante Sexo a. Variable dependiente: Estatura Esto supuesto, calcular: a Interpreta la ecuación de regresión. Cuál es la media de estatura de los niños? Y la niñas? b Ecuación de regresión suponiendo que los niños se codifican como 1 y las niñas como 0. a La ecuación de regresión es: Sustituyendo para niños: Coeficientes no estandarizados Coeficientes a Coeficientes estandarizad os B Error típ. Beta t Sig. 1,91,011 118,387,000 -,035,016 -,40 -,195,038 Y 1.91-0.035X Y para niñas: Y 1.91-0.035X1.91-0.035*01.91 metros
Y 1.91-0.035X1.91-0.035*11.56 metros En consecuencia, la intersección indica la media en Y para la cuando X vale 0. La pendiente indica la diferencia en media de Y para los valores de 1 y 0 en X. En este caso, la diferencia entre niñas y niños. b Si la codificación fuera a la inversa, entonces: Y 1.56 + 0.035X