Regresión con efecto interactivo

4 Regresión con efecto interactivo. Introducción El modelo de regresión múltiple tratado previamente supone la independencia de efectos de las diferentes variables predictoras, En este sentido, es un modelo aditivo - modelo de efectos principales- en el que cada variable ejerce efectos por separado sobre la criterio y el conjunto de estas variables suman sus efectos para predecir dicho resultado. No existe pues, una variable ajena a las contempladas que module o mediatice esta serie de efectos sumados, es decir, que condicione sus influencias. En el ejemplo que tratamos previamente diríamos que la inteligencia ejerce un efecto tal sobre la nota al que se le suma el efecto de la motivación en su correspondiente cuantía-. Si ocurriera que el efecto de la inteligencia sobre la nota fuera diferente según qué nivel de motivación tuviera el sujeto estaríamos hablando de un efecto de interacción entre inteligencia y motivación de tal manera que la relación entre inteligencia y la nota estaría modulado (interferido/condicionado) por la variable motivación. Por ejemplo, en el caso que ocurriera que para valores bajos de inteligencia la motivación se mostrara muy relevante pero no para valores altos de la misma. En los modelos explicativos en los que existen efectos de interacción es necesario contemplar coeficientes que representen específicamente tales efectos. sí, para el caso que comentamos, además de los efectos aditivos de las variables inteligencia y motivación sobre el rendimiento hay que incluir un término que represente la interacción entre las dos ( b ), de tal manera que la ecuación completa queda: Y ˆ = b + b + b + b 0 Este nuevo término representa el producto de las dos variables consideradas ( y ) y su coeficiente, junto con su significación o no, revelará si dicha interacción resulta o no relevante para incorporarla como término explicativo en el modelo.. Interacción entre una variable dicotómica y una cuantitativa. Supongamos, como hemos adelantado antes, que sospechamos que la relación entre inteligencia y rendimiento depende del nivel de motivación del sujeto o lo que es lo mismo, existe interacción entre motivación e inteligencia de tal manera que la motivación resulta una variable relevante para determinados valores de la inteligencia y no para otros. Supongamos dos valores diferentes para la variable motivación (0-59

motivación baja- y -motivación alta-). Estos podrían ser unos datos hipotéticos para dicha investigación: Sujetos (inteligencia) (motivación) Y (rendimiento) 4 5 6 7 8 9 0 85 00 95 80 5 90 00 05 85 80 00 5 5 8 7 4 0 6 6 7 9 9 4 7 Para analizar si el efecto de una de las variables afecta a la variable Y dependiendo de la otra efecto interactivo- es necesario, como hemos indicado antes, introducir un nuevo efecto en el modelo que represente dicha interacción. Para ello añadimos al cuadro de datos anterior una nueva columna que sea el producto de las dos variables predictoras. Sin embargo, si lo hacemos exactamente así, obtendremos una tercera variable redundante con las restantes, es decir, colineal y conocida a partir de ellas impidiendo una adecuada estimación de los coeficientes de la ecuación. Para resolver este problema se procede centrando (cambiando en diferenciales) las puntuaciones de la variable cuantitativa (sus puntuaciones en diferencias respecto a su media) y una vez así, se procede a calcular la nueva variable producto de x (centradas). continuación se desarrollan estas operaciones: Sujetos (inteligencia) (motivación) Y (rendimiento) x x 4 5 6 7 8 85 00 95 80 5 90 00 05 5 8 7 4 0 6 6 7-0,8 4,7 -,8-5,8 9,7-5,8 4,7 9,7 4,7 9,7 9 0 85 80 9 9-0,8-0,8-5,8-5,8 00 5 4 7 4,7 9,7 4,7 9,7 Media 95.8.5 6.8 0 Con estos datos se calcula la ecuación de regresión de x, y x sobre Y. En el SPSS los comandos a activar son los mismos que en el modelo de regresión múltiple: nalizar/regresión/lineal especificando que la variable dependiente es el rendimiento y 60

las independientes la inteligencia centrada, la motivación y la interacción inteligencia centrada x motivación. partir de ello se obtienen, para los datos expuestos y entre otros, los siguientes resultados: Resumen del modelo R cuadrado Error típ. de la Modelo R R cuadrado corregida estimación,88(a),70,590,4597 a Variables predictoras: (Constante), interacc, motivación, Inteligencia Modelo NOV(b) Suma de cuadrados gl Media cuadrática F Sig. Regresión 9,47 9,749 6,80,07(a) Residual,40 8,55 Total 4,667 a Variables predictoras: (Constante), interacc, motivación, Inteligencia b Variable dependiente: nota Modelo Coeficientes(a) Coeficientes no estandarizados Coeficientes estandarizados t Sig. B Error típ. Beta (Constante) -9,6 4,56 -,60,054 Inteligencia,7,045,086,854 5 Motivación,84,77,049,54,806 InteligxMotiv -,57,06 -,56-4,5 a Variable dependiente: nota Por la primera tabla de resultados sabemos que el conjunto de predictores contemplados explican el 70.% de la variabilidad de Y, es decir, la variabilidad del rendimiento queda explicado en un 70.% por la inteligencia, la motivación y la interacción entre ellas. demás, el modelo resulta válido (p=.07) para representar los datos, esto es, constituye una adecuada explicación del rendimiento medido, siendo la ecuación de regresión estimada: = 9.6+ 0.7( ) + 0.84 0.57( ) Los coeficientes que acompañan a la inteligencia y a la interacción resultan significativos (α=.05). Es por eso que concluimos que la inteligencia afecta significativamente al rendimiento: Por cada unidad de incremento en inteligencia respecto a su media es, decir, por cada valor diferencial más- se pronostica un incremento en el rendimiento de 0.7 puntos (cuando adopta un determinado valor). Respecto al efecto interactivo puede afirmarse que el cambio en el nivel de motivación (de baja a alta) produce un decremento del efecto que ejerce la inteligencia en diferencial- sobre el rendimiento en 0.57 puntos. Con otras palabras, el efecto que la inteligencia en diferencial tiene sobre el rendimiento es 0.57 puntos menos con motivación alta que con motivación baja. La motivación por su parte, como efecto principal, no constituye una variable explicativa relevante (p=.806); 6

De manera más pormenorizada, podemos comentar cada uno de estos coeficientes de la siguiente manera: b 0 : -9.6 es el rendimiento esperado en la tarea cuando todos los efectos del modelo valen 0. Es decir, cuando la inteligencia de los sujetos coincide con la media (ya que se mide en diferencial) y la motivación es baja (=0) b :..7 es el incremento esperado en el rendimiento cuando la condición de motivación es baja ( =0) por cada punto más en diferencial de la inteligencia. b :.84 es el incremento pronosticado en el rendimiento cuando =, es decir, cuando los sujetos tienen motivación alta y cuando ( ) es igual a 0, es decir, cuando la inteligencia está en su valor medio. b : -.57, tal y como hemos indicado antes, es el cambio previsto en el efecto de la inteligencia (centrada) sobre el rendimiento cuando la motivación cambia de baja a alta. Esto es lo mismo que decir que la inteligencia constituye un factor más favorecedor del rendimiento con inteligencia baja que con inteligencia alta. En suma, hemos validado un modelo de regresión en el que el efecto de la interacción entre variables es relevante. En este sentido, ocurre que la influencia de una de las variables predictoras sobre la variable criterio está condicionada por el efecto de la otra variable predictora. Si esto es así, resultará aclaratorio analizar cual es concretamente dicho efecto según los valores que adopta la variable moduladora. Tomemos, por ejemplo, y por razones de simplicidad, la variable dicotómica como moduladora. La intención es entonces evaluar el efecto de (inteligencia) sobre el rendimiento bajo cada una de las condiciones de (motivación); esto es, plantear dos ecuaciones de regresión por separado para cada nivel de que manifieste el efecto concreto de sobre Y según se presente un valor u otro de (motivación alta o baja). Resultan, pues, dos ecuaciones de regresión que derivan de las siguientes operaciones: Por un lado, si =0 (motivación baja), sustituyendo en la ecuación original nos queda: = b 0 = b 0 + b ( + b ( ) + b ) + b + b ( 0+ b ( ) ) 0 ˆ Y = b0 + b ( ) Cuando = (motivación alta), la ecuación de regresión original: = b 0 + b ( ) + b + b( ) se reduce a: ˆ Y = b0 + b ( ) + b + b ( ) en la que sacando factor común de : 6

ˆ Y = ( b0 + b ) + ( b + b )( Tenemos, pues, dos ecuaciones de regresión diferentes (de sobre Y) para cada valor de que tienen sentido por cuanto el efecto de sobre Y resulta diferente en cada valor de, es decir, existe un efecto de interacción significativo. Dichas ecuaciones ofrecen los coeficientes necesarios para interpretar las relaciones entre variables dentro de cada valor de y su comparación (en este lugar a partir de criterios gráficos) nos servirá para inferir qué tipo de efecto interactivo se está produciendo entre las variables. Para el caso que tratamos, entonces, y teniendo en cuenta la ecuación de regresión estimada al principio, derivamos las ecuaciones para cada valor de (motivación): Para = 0 (motivación baja): ) Para = (motivación alta): = ( b 0 + b ) + ( b = 9.48 0.084( + b )( ˆ Y = b0 + b = 9.6+ 0.7( ) ) = ( 9.6+ 0.84) + (0.7 0.57)( la luz de estas dos ecuaciones se interpretan mejor los coeficientes que antes describíamos en la ecuación general. Corrobórese que en la primera de ellas (cuando = 0), el efecto de la inteligencia (centrada) sobre el rendimiento es de 0.7. Por su parte, -9.6 sería la nota esperada si la inteligencia del sujeto coincide con la media, es decir, cuando = (y obviamente bajo la condición de motivación baja). Por otro lado, cuando la motivación es alta ( = ), el efecto de la inteligencia en diferencial sobre el rendimiento es de -0.084. Este valor en la segunda ecuación constituye un valor mucho más pequeño además negativo- que en la ecuación anterior (cuando =0). En esta comparación precisamente radica el sentido del efecto interactivo: Obsérvese que la diferencia entre el valor de este coeficiente (-.084) y el de la ecuación anterior (.7) [ (-.084) -.7 = -.57] es justamente -.57, el coeficiente b en la ecuación general, es decir, la diferencia entre el efecto de la inteligencia en motivación baja respecto a su efecto cuando la motivación es alta. Por último, -9.48 es la nota esperada para los sujetos de motivación alta cuanto su inteligencia coincide con la media. La representación gráfica de estos resultados nos ayuda, muy especialmente, a entender el tipo de efecto interactivo que está produciéndose. Se trata de dibujar dos ejes de coordenadas para la relación entre e Y (inteligencia y rendimiento), uno para cada nivel de la variable (motivación). La comparación de ambas gráficas aportará el sentido de la interacción que estudiamos. En el paquete estadístico SPSS se procede como sigue para la consecución de tales ejes de coordenadas: Gráficos/Interactivos/Diagrama de dispersión ubicando las variables inteligencia y nota en el eje de coordenadas como variables de leyenda y la variable motivación como variable de panel. La salida aportada es la siguiente: ) ) = 6

nota 4. Regresión con efecto interactivo 0 0 nota = -9,6 + 0,7 * Inteligencia R-cuadrado = 0,99 Regresión lineal 8 6 nota = 5,5 + -0,08 * Inteligencia R-cuadrado = 0, 4 80 90 00 0 Inteligencia 80 90 00 0 Inteligencia Tal y como suponíamos desde el principio, estas gráficas muestran que el efecto de la inteligencia sobre la nota es mucho más relevante cuando la motivación es baja (además de signo contrario a su efecto cuando la motivación es alta). Es decir, la variabilidad de la nota se explica en un 99% por la variable inteligencia en dicha circunstancia. Cuando la motivación es baja, por el contrario, dicho efecto además de ser negativo, es sustancialmente menor (en este caso la nota queda explicada sólo en un % por cuenta de la inteligencia). Las ecuaciones de regresión para cada caso quedan expuestas en estas gráficas. Estas ecuaciones resultan aproximadas a las calculadas anteriormente a partir de la ecuación general con todos los sujetos de la investigación (hay que tener en cuenta que ahora la muestra se divide en dos grupos). Pueden servir de todas formas para interpretar de forma aproximativa la interacción tal y como comentamos.. Interacción entre dos variables cuantitativas. Volvamos de nuevo al archivo de datos inicial en el que la variable motivación se medía cualitativamente para puntuarla ahora mediante una escala cuantitativa y calculemos las puntuaciones centradas para ambas variables predictoras (x y x): 64

Y Sujetos (Inteligencia) (Motivación) (Nota) 85 0.00 5 00 5.00 8 95 0.00 7 4 80 5.00 4 5 5 5.00 0 6 90 0.00 6 7 00 5.00 6 8 05 5.00 7 9 85 0.00 9 0 80 45.00 9 00 45.00 4 5 0.00 7 Medias 95.8.9 6.8 S..05.95 x x x*x 7,78 87,78 8,78 67,78 0,78 77,78 87,78 9,78 7,78 67,78 87,78 0,78 -,05,95 -,05,95,95 -,05,95,95 6,95,95,95 6,95 -,98 7,7-5,48,7 00,4-7, 048,97 06,5,6 65,57 804,57 74, Solicitamos al paquete estadístico SPSS que nos estime la ecuación de regresión contemplando el término interactivo entre estas variables. Para ello, utilizamos para estimar dicho modelo tanto las variables motivación e inteligencia (en centradas) como el producto entre estas puntuaciones centradas (x*x): nalizar/regresión/llineal especificando que las variables predictoras son x, x y x*x y la variable dependiente o criterio el rendimiento. Los resultados obtenidos, entre otros, son los siguientes: Coeficientes(a) Coeficientes no estandarizados Coeficientes estandarizad os Modelo B Error típ. Beta t Sig. (Constante) -5,99,76 -,807,08 x,55,09,974,947 4 x,97, 6,55 4,40 xxx -,0-6,47-4,75 a Variable dependiente: nota La ecuación resultante es: = 5.99+.55x +.97x. 0 x x 65

La salida proporcionada nos indica además que tanto los efectos independientes de ambos predictores como la interacción entre ellos resultan términos significativos en el modelo de regresión estimado. Ello significa que debemos enfatizar este último efecto ya que, como sabemos, nos está indicando que el efecto de la inteligencia sobre la nota depende de la motivación; o al revés, el efecto de la motivación sobre la nota depende del nivel de inteligencia. En este caso, pues, no tiene sentido enfatizar los efectos de cada una de las variables por separado. Para apreciar más pormenorizadamente este efecto interactivo e interpretarlo se suele identificar distintos niveles de una de las variables s contempladas para conocer cómo se produce la relación entre la otra y la Y bajo estos diferentes valores. Por ejemplo, utilizando la motivación, tendríamos que, para identificar tres niveles diferentes de dicha variable, podemos diferenciar a los sujetos que puntúan en la misma más allá de una DT por encima de su media, más allá de una DT por debajo de su media y DT alrededor de la misma. l fin y al cabo esta especie de categorización supone replantear la inicial variable motivación claramente cuantitativa en una variable pseudocategórica. Para hacer esto pedimos al paquete estadístico que nos proporcione los descriptivos de las variables con las que trabajamos: Estadísticos descriptivos N Mínimo Máximo Media Desv. típ. Inteligencia 80 5 95,8,648 Motivación 0 45,967,04857 Nota 4 0 6,8,9465 N válido (según lista) Replanteando la ecuación inicial: = 5.99+.55x +.97x. 0 x x Y& = ( 5.99+.97x x ) + (.55.0x ) Y sustituyendo en la ecuación reformulada estos diferentes valores de x (sus desviaciones típicas), tenemos: Cuando x > DT: = ( 5.99+.97.04) + (.55.0.04) x = 6.75. 004x Para averiguar de una forma alternativa la relevancia estadística de este término interactivo en el modelo (sabemos que sí lo es -α=.05- pues el valor de p asociado a tal coeficiente es.00 en la tabla anterior), puede procederse mediante el método ya conocido de la estimación por pasos. Es decir, evaluando cuánto aporta la interacción sobre la explicación de la variable Y tras lo que ya explicaban previamente las variables y como efectos principales. Se trata, en este sentido, de estimar el incremento de la variabilidad explicada del modelo comparando aquel sin términos interactivo y aquél que sí lo incorpora evaluando sus significación con la F del incremento 66

Cuando x = 0 DT: Cuando x < DT: Y ˆ = ( 5.99+.97 0) + (.55.0 0) x = 5.99+. 55x Y ˆ = ( 5.99+.97.04) + (.55.0.04) x = 8.59+. x Habiendo planteado estas ecuaciones de regresión para cada valor delimitado de la motivación podemos decir que mientras que para los sujetos de motivación más alta (mayor a una DT sobre la media), el efecto de la inteligencia sobre el rendimiento es negativo y muy pequeño en los otros dos grupos resulta positivo. demás, entre éstos, es más prominente para los sujetos cuya motivación es menor, es decir, aquellos que muestran una puntuación menor a una DT por debajo de la media. Lo que podemos preguntarnos a continuación es si estos coeficientes estimados por ecuación resultan o no estadísticamente significativos. Esto supone preguntarse a su vez sobre la naturaleza de la interacción, es decir, implica indagar sobre el sentido y la fuerza en que la inteligencia influye sobre el rendimiento en cada una de las condiciones de la variable moduladora Si estos sentidos y/o fuerzas cambian de unas condiciones (ecuaciones) a otras, estamos ante la presencia de un efecto interactivo. unque lo hayamos probado anteriormente de manera global (por su significación en el coeficiente en la ecuación de regresión general), ahora tenemos la oportunidad de analizarlo con mayor minuciosidad, reparando en las condiciones concretas en que éste resulta relevante. En esta línea debemos calcular la significación de cada uno de los coeficientes de las ecuaciones anteriores. Como se sabe, la t de un coeficiente corresponde a la siguiente formulación: b t = S b siendo b el valor del coeficiente a estudiar y S b su error típico. Dicho error típico se calcula de la siguiente manera para el caso que nos ocupa: S b = S + + ZS Z S siendo Z los diferentes valores de las pseudocategorías delimitadas para la variable moduladora (DT por encima de su media, 0 DT alrededor de la media y DT por debajo de su media), S la varianza de la variable x, S la covarianza entre las variables x y x (esto es, el producto de x*x) y S la varianza de la variable x (o producto). En nuestro caso y obteniendo la tabla de varianzas covarianzas entre las variable implicadas: 67

Correlaciones de los coeficientes(a) Modelo xxx x x Correlaciones xxx 0 -,66 -,99 x -,66 0,66 x -,99,66 0 Covarianzas xxx -7,4E- 7,54E-006 005 - x -7,4E- 005 6 x - 6,049 a Variable dependiente: nota se tiene para cada uno de los coeficientes: S b S b = S + ZS + Z S =.00+.04 (.000074) + (.04).00000754 =.07 S b = S + ZS+ Z S =.00+ 0 (.000074) + (0).00000754 =.044 = S + ZS + Z S =.00+ (.04) (.000074) + (.04).00000754 =.05 Por lo que sus correspondientes valores de t serían: t b.004 = = =.07 Sb.07 b.55 t b = = =.5 Sb.044 b. t b = = = 6. S.05 b b Buscando en las tablas on line la p correspondiente a cada una de estos valores t para 0 gl obtenemos: t b tiene asociada una probabilidad de.97 t tiene asociada una probabilidad de.0055 b t tiene asociada una probabilidad de.000 b Con estos valores podemos concluir que el primer coeficiente no resulta significativo (α=.05) con lo cual, la inteligencia no influye sobre el rendimiento cuando el nivel de motivación es alta (menor a DT por debajo de su media). Sin embargo, tanto cuando el nivel de motivación es medio como bajo la inteligencia sí es una variable relevante en el rendimiento. Digamos que la inteligencia sólo asume un papel relevante en la tarea en cuestión si la motivación del sujeto es media-baja. En esto radica el efecto de interactivo. Esta tabla se obtiene en el SPSS mediante las siguientes instrucciones: nalizar/regresión/lineal con los predictores y la variable criterio en sus lugares correspondientes y en opciones se marca la petición matriz de covarianzas 68