Coeficiente de correlación semiparcial



Documentos relacionados
COEFICIENTE DE CORRELACIÓN SEMIPARCIAL

REGRESIÓN LINEAL CON SPSS

Medidas de asociación

Distribuciones bidimensionales. Regresión.

DESCOMPOSICIÓN FACTORIAL

SESIÓN PRÁCTICA 7: REGRESION LINEAL SIMPLE PROBABILIDAD Y ESTADÍSTICA. PROF. Esther González Sánchez. Departamento de Informática y Sistemas

La estadística en Internet

COEFICIENTE DE CORRELACIÓN PARCIAL

Regresión lineal múltiple

Ecuaciones. 3º de ESO

Tema Correlación. Correlación. Introducción

Nociones de Estadística Descriptiva. Medidas de tendencia central y de variabilidad

Entre las múltiples formas de baremar un test, destacamos las siguientes: - Baremos cronológicos: Edad Mental y Cociente Intelectual.

INTRODUCCIÓN DIAGRAMA DE DISPERSIÓN. Figura1

Se dice que dos monomios son semejantes cuando tienen la misma parte literal

4,2 + 0,67 Y c) R 2 = 0, En la estimación de un modelo de regresión lineal se ha obtenido:

Tema 11: Intervalos de confianza.

bloques SC Suma de Cuadrados k trat bloques

MODELO DE RESPUESTAS Objetivos del 1 al 9

4. Medidas de tendencia central

Nivel socioeconómico medio. Nivel socioeconómico alto SI NO TOTAL

POTENCIAS. MÚLTIPLOS Y DIVISORES. MÁXIMO COMÚN DIVISOR Y MÍNIMO COMÚN MÚLTIPLO.

UNIVERSIDAD DE CIENCIAS EMPRESARIALES Y SOCIALES Facultad de Psicología y Ciencias Sociales. Licenciatura en Sociología. ESTADÍSTICA II (Plan 2008)

PRODUCTOS NOTABLES. Definición: son aquellos productos cuyo desarrollo se conocen fácilmente por simple observación. Y son:

Análisis de Datos CAPITULO 3: MEDIDAS DE VARIABILIDAD Y ASIMETRÍA

Probabilidad. La probabilidad mide la frecuencia con la que aparece un resultado determinado cuando se realiza un experimento.

Ámbito Científico y Tecnológico. Repaso de números enteros y racionales

Práctica 1: Introducción a SPSS 1

Inferencia estadística III. Análisis de Correlación. La inferencia estadística también se puede aplicar para:

5 Relaciones entre variables.

Lección 49. Funciones I. Definición

ANÁLISIS CUANTITATIVO DE DATOS EN CIENCIAS SOCIALES CON EL SPSS (I) Tablas de contingencia y pruebas de asociación

Estadística descriptiva. Representación de datos descriptivos

Se utilizarán las letras mayúsculas, tales como A, B y C para nombrar conjuntos. Por ejemplo: a i. o e

5 DIVISIÓN DE POLINOMIOS. RAÍCES

Los números naturales

Una población es el conjunto de todos los elementos a los que se somete a un estudio estadístico.

PARTE QUINTA- EL CUADRO DE MANDO EN LA EMPRESA

DETERMINANTES página 251 DETERMINANTES. Por ejemplo: es un determinante de tres filas y tres columnas.

Anexo C. Introducción a las series de potencias. Series de potencias

Problemas resueltos. Temas 10 y 11 11, 9, 12, 17, 8, 11, 9, 4, 5, 9, 14, 9, 17, 24, 19, 10, 17, 17, 8, 23, 8, 6, 14, 16, 6, 7, 15, 20, 14, 15.

Apuntes de matemáticas 2º ESO Curso Lenguaje algebraico.

METODO SIMPLEX ANALISIS DE SENSIBILIDAD Y DUALIDAD

Potencia estadística

Ámbito Científico-Tecnológico Módulo III Bloque 3 Unidad 2 Cuanto más, mejor y viceversa

TEMA 2: EL INTERÉS SIMPLE

TEMA 2: TEORÍA DE CONJUNTOS Y CONJUNTOS NUMÉRICOS.

PROBLEMAS DE DIAMANTE 2.1.1

MEDICION DE PRODUCTIVIDAD EN FUNCION DE LOS OBJETIVOS DE LA EMPRESA

lasmatemáticas.eu Pedro Castro Ortega materiales de matemáticas

SEGMENTOS RECTILÍNEOS: DIRIGIDOS Y NO DIRIGIDOS

PROBABILIDAD Y ESTADÍSTICA. Sesión 5 (En esta sesión abracamos hasta tema 5.8)

Estacionariedad Estacionariedad estacionariedad

Capítulo III Diseños de bloques completos al azar

CURSO BÁSICO DE MATEMÁTICAS PARA ESTUDIANTES DE ECONÓMICAS Y EMPRESARIALES. Unidad didáctica 4. Números reales y números complejos

Tutorial MT-b6. Matemática Tutorial Nivel Básico. Álgebra

operaciones inversas Para unificar ambas operaciones, se define la potencia de exponente fraccionario:

5. Producto de dos binomios de la forma: ( ax + c)( bx d )

TEMA 2: POLINOMIOS IDENTIDADES NOTABLES. Ejercicios: 1. Desarrolla las siguientes identidades: 2. Expresa como producto de factores:

CALIDAD 1 JOSÉ MANUEL DOMENECH ROLDÁN PROFESOR DE ENSEÑANZA SECUNDARIA

1.2 Números enteros El concepto de número entero

4. " $#%&' (#) para todo $#* (desigualdad triangular).

DISEÑO Y ANÁLISIS DE DATOS EN PSICOLOGÍA II

Ecuaciones de primer grado

b) Haz otra distribución en 12 intervalos de la amplitud que creas conveniente.

Tema 1. Álgebra lineal. Matrices

Teoría de errores. Departamento de Análisis Matemático Universidad de La Laguna

Expresiones algebraicas

donde k es el número de parámetros en el modelo, incluyendo el término independiente. Es fácil comprobar la relación que mantienen R 2 y R 2

Algebra de Boole. Algebra de Boole. Ing. José Alberto Díaz García. EL Diseño Lógico. Página 1

Proyecciones. Producto escalar de vectores. Aplicaciones

CURSOSO. Aritmética: Númerosnaturalesyenteros. Númerosracionalesyfraciones. MATEMÁTICAS. AntonioF.CostaGonzález

Razones y Proporciones

CURSO BÁSICO DE MATEMÁTICAS PARA ESTUDIANTES DE ECONÓMICAS Y EMPRESARIALES


Unidad 1: Números reales.

ESTADÍSTICA INFERENCIAL

Conjuntos Un conjunto es una colección de objetos. A cada uno de esos objetos se llama elemento del conjunto.

Capítulo 8. Geometría euclídea. 8.1 Problemas métricos

Estadística II Examen Final - Enero Responda a los siguientes ejercicios en los cuadernillos de la Universidad.

Y = ßo + ß1X + ε. La función de regresión lineal simple es expresado como:

El uso de la Técnica de Regresión Lineal Múltiple para la evaluación de la dotación de personal en el I.N.S.S.

Una distribución de frecuencias es una herramienta estadística muy útil para organizar un grupo de observaciones.

FUNCIONES. Definición de función. Ejemplos.

Repaso de Álgebra. Los subconjuntos de los reales de relevancia para nuestra discusión serán denotados según indicamos a continuación:

Tema 5. Derivación Matricial.

TRABAJO PRÁCTICO ESTADISTICA APLICADA (746)

Tabla de Derivadas. Función Derivada Función Derivada. f (x) n+1. f (x) y = f (x) y = ln x. y = cotg f (x) y = ( 1 cotg 2 f (x)) f (x) = f (x)

Investigación de Mercados

GUIA PRACTICA PARA LA APLICACIÓN DE MS EXCEL TECNOLOGIA/ INFORMATICA

Tema 3. Medidas de tendencia central Ejercicios resueltos 1

Distribución muestral de proporciones. Algunas secciones han sido tomadas de: Apuntes de Estadística Inferencial Instituto Tecnológico de Chiuhuahua

2.5. Asimetría y apuntamiento

Matemática Empresarial

, y efectuar la multiplicación 10000

El conjunto de los complejos. Escritura cartesiana y binómica. Representación gráfica.

EJERCICIOS RESUELTOS TEMA 7


CAPITULO 5 LA DETERMINACIÓN DEL INGRESO DE EQUILIBRIO

Algebra Operativa. Matías Enrique Puello Chamorro 26 de julio de 2015

Transcripción:

Coeficiente de correlación semiparcial 1.- Introducción...1.- Correlación semiparcial... 3.- Contribución específica de las distintas variables al modelo de egresión Múltiple... 3 4.- Correlación semiparcial de orden superior... 4 5.- Correlación semiparcial múltiple... 5 6.- Significación estadística de los coeficiente de correlación semiparcial... 6 1.- Introducción Una de las cuestiones fundamentales en el análisis de la regresión consiste en determinar la importancia relativa que tienen sobre la variable dependiente cada una de las variables explicativas. Hasta ahora, el tema de la regresión múltiple se ha centrado fundamentalmente en el cálculo de, su significación y los coeficientes b asociados, pero nada se ha dicho de la contribución particular de cada una de las variables términos de proporción de variación explicada. En este sentido, en las próxima páginas se ofrecen una herramienta conceptual extraordinariamente útil -correlación semiparcial- que permite determinar el papel real representado por cada una de las variables al margen de su protagonismo aparente. Las correlaciones semiparciales tienen interés igualmente dentro de lo que se puede llamar control estadístico de variables, por cuanto permite conocer las distintas fuentes de variación que determinan la variable dependiente investigada, y por tanto, permite, de acuerdo con el modelo concebido, asignar causalidad a ciertas variables explicativas. En este sentido, este tema puede considerarse como un preludio de los modelos causales que serán estudiados más adelante. 1

.- Correlación semiparcial Como se ha indicado, en el cuadrado de la correlación múltiple queda reflejada la proporción de variación explicada por el conjunto de regresores, pero nada se dice de la contribución específica de cada uno de ellos. Por otro lado, las correlaciones simples (al cuadrado) de cada una de las variables explicativas podrían ser, en principio, un indicador de dichas contribuciones, pero, como se verá, frecuentemente las distintas variables explicativas, están a su vez, correlacionadas entre sí, compartiendo variabilidad, y por tanto, elementos comunes, no siendo siempre fácil atribuir la fuente original de tales elementos compartidos. Tengamos, en este sentido, las variables X 1, X e Y, cuyas correlaciones son las siguientes: ry 1 = 0.7 ry = 0.6 y. 1 = 0.8 Una primera ojeada puede hacernos pensar que la variable X 1 contribuye en la variabilidad de Y en una proporción de 0.7 =0.49 y que la variable X contribuye en una proporción de 0.6 =0.36. No obstante, se sabe por la correlación múltiple que la proporción de variación explicada es de 0.8 =0.64. El total de ambas contribuciones no es igual a la suma, luego está claro que ambas variables explicativas no son fuentes independientes de variabilidad, sino que comparten una cierta cantidad de la misma. Existe, pues, redundancia entre ambas variables. El siguiente diagrama de Venn ilustra lo que queremos decir: d Y a b c X 1 X El campo de variación de las distintas variables queda reflejada en los diferentes círculos (de área total, la unidad), de tal manera que la contribución de X 1 en Y es a+b, y la de X, b+c. La contribución total de X 1 y X será a+b+c. Queda una parte -d- que es la variabilidad que no logran explicar entre X 1 y X.

La proporción de variación explicada por la variable X 1 será precisamente la intersección del círculo correspondiente a X 1 y del círculo indicado por Y. Así pues: r y 1 = a+ b= 0.49 Y la proporción de variación explicada por X : r y = b+ c= 0.36 Como entre ambas variables explican una proporción de 0.64, es evidente que la contribución adicional de X 1 sobre la que explica X será: r y(1.) = r = 0.64 0.36= 0. 8 y.1 y a Esto es, lo que añade X 1 a X es una proporción de variación explicada de 0.8. La raíz cuadrada de este valor se expresa como y(1.) y se define como coeficiente de correlación semiparcial. Así: = 0.8 0.59 r y ( 1.) = Por otro lado, lo que añade X a X 1 será: r y(.1) = r = 0.64 0.49= 0. 15 y.1 y1 c Es decir, la inclusión de X supone un incremento sobre la proporción de variación explicada por X 1 de 0.15 puntos. Su coeficiente de correlación semiparcial será: r y (.1) = 0.15= 0.387 3.- Contribución específica de las distintas variables al modelo de egresión Múltiple Las correlaciones semiparciales tienen especial interés para conocer el reparto de las contribuciones de las variables X sobre la variable Y. Frecuentemente las variables explicativas están solapadas y hay que utilizar algún criterio que permita asignar las zonas compartidas a variables específicas. A este respecto, ha de establecerse una jerarquía entre tales variables de forma que las de mayor orden jerárquico tienen prioridad respecto a su variabilidad compartida, a las que se les adjudica. Así, cuando el orden es 1º X 1 y º X las contribuciones observadas por las distintas variables serán: y. 1 = ry 1+ ry(.1) = 0.49+ 0.15= 0.64 3

Por el contrario, cuando el orden de entrada es 1º X y º X 1 entonces: y. 1 = ry + ry(1.) = 0.36+ 0.8= 0.64 Se observa la importancia del orden de entrada; de esta forma, cuando la variable X 1 entra en primer lugar explica una proporción de 0.49 y deja tan sólo un resto de 0.15 para X. Cuando X es la variable de mayor rango en el modelo, explica una proporción de 0.36 y deja para X 1 una proporción explicada de 0.8. Es importante destacar que los mismos datos, según el acento que se ponga en cada una de las variables llevará al investigador al conclusiones muy diferentes respecto a su participación en el modelo. La siguiente tabla ilustra lo que estamos comentando: Var. Explicativa Orden Incremento Orden Incremento X 1 1 0.49 0.8 X 0.15 1 0.36 y.1 0.64 0.64 Así pues, la contribución específica de las distintas variables depende de su orden de entrada. Cuanto más intercorrelacionadas estén y más tarde se introduzcan menos explicarán. En cierto sentido, la importancia relativa concedida a cada una de las variables, cuando existe redundancia, es subjetiva y depende en gran parte del juicio del investigador y del dominio que tenga de la materia. No existen reglas que especifiquen claramente el orden de entrada. No obstante, se suele utilizar el criterio de maximizar progresivamente la variación explicada de la variable dependiente, por lo que se introducen las variables en orden de mayor a menor proporción de variación explicada. 4.- Correlación semiparcial de orden superior Las correlaciones expuestas del tipo r y(1.) o r y(.1) se denominan correlaciones semiparciales de primer orden porque es una variable cuya influencia se elimina. No obstante, puede interesar eliminar la influencia de más variables, por ejemplo, r y(1.3) expresa que la variable Y es relacionada con la variable X 1 eliminando de ésta la influencia de X y X 3. Se trata de una correlación semiparcial de orden dos. Una correlación de orden tres sería r y(1.34) donde se relaciona Y con X 1 eliminado la influencia de X, X 3, y X 4. En general una correlación semiparcial del tipo r y(i.3..(i)...k) es una correlación semiparcial de orden k-1 que indica la correlación entre Y y X i eliminado de ésta la influencia de las restantes variables explicativas. 4

El procedimiento para calcular las correlaciones semiparciales de orden superior es equivalente al ya expuesto para correlaciones de primer orden. A este efecto, resulta de nuevo ilustrativo recurrir a los diagramas de Venn. Supongamos, ahora, que disponemos de cuatro variables: Y, X 1, X, y X 3, y deseamos calcular r y(3.1): Y X 3 X 1 X Está claro que la contribución específica de X 3 será: r = y( 3.1) y.13 y.1 Si deseamos recomponer la aportación de cada una de las variables suponiendo que el orden de entrada sea X 1, X, y X 3 : = r + r + r y. 13 y1 y(.1) y(3.1) Pero si el orden de entrada fuera X 3, X, y X 1, entonces: = r + r + r y. 13 y3 y(.3) y(1.3) 5.- Correlación semiparcial múltiple Todas las correlaciones estudiadas anteriormente han sido siempre entre dos variables, la variable dependiente Y y una variable explicativa X i, eliminando la influencia, bien de una variable (correlación semiparcial simple de primer orden) o de un conjunto de k variables (correlación semiparcial simple de orden k). La correlación semiparcial múltiple hace referencia a la correlación entre una variable dependiente y un conjunto de variables explicativas eliminado la influencia de una o varias variables del conjunto de variables explicativas. Está claro que las correlaciones 5

semiparciales múltiples pueden ser a su vez, de primer orden o de orden superior. En términos de proporción de variación, el cuadrado del coeficiente de correlación semiparcial múltiple expresa la contribución que de la variación de la variable dependiente suponen una serie de variables explicativas eliminado la influencia de otras. De esta forma, y(1.3) indica la correlación semiparcial de Y con las variables X 1 y X eliminando la influencia de X 3. En términos de proporción de variación se calculará de la siguiente manera: = y( 1.3) y.13 y.3 Si por ejemplo, deseamos calcular y(1.34) : = y( 1.34) y.134 y.34 Obsérvese que en el cálculo de las correlaciones semiparciales (al cuadrado), sea simple o múltiple, de primer orden o de orden superior, siempre se calcula de la misma manera. Se trata de una diferencia entre dos elementos, donde el primero de ellos hace referencia a la correlación múltiple (al cuadrado) de la variable Y con todas las variables explicativas consideradas, y donde el segundo elemento indica la correlación (al cuadrado) de la variable Y con las variables explicativas a eliminar. 6.- Significación estadística de los coeficiente de correlación semiparcial Las pruebas con estos coeficientes consiste básicamente en comprobar si la variación explicada por la variable o variables introducidas supera la varianza aleatoria o residual. En este sentido, la fórmula a aplicar es equivalente a las ya conocidas con la única diferencia que el numerador está constituido por el incremento en términos de proporción de variación que supone la adición de las variables estudiadas. Puesto que el numerador está formado por una diferencia de sus grados de libertad corresponde a tal diferencia. Supongamos que deseamos conocer la significación estadística de y(1.34). Esta expresión se calcula como la diferencia entre dos sumandos: = y( 1.34) y.134 y.34 El primer sumando y.134 tiene k=4 grados de libertad, tantos como variables independientes consideradas, mientras que el segundo sumando y.34, por la misma lógica, tiene k 1 = grados de libertad. Así pues, la prueba F a realizar será (supongamos que operamos con 0 sujetos): y(1.34) k k F = 1 1 y.134 N k 1 y(1.34) = 1 y.134 15 Compararemos el cociente F obtenido con el de las tablas para y 15 grados de libertad. 6

Problema 1.- Tengamos los siguientes datos: y. 1 = 0.35 r1 = 0.4 ry3 = 0.5 r31 = 0 r3 = 0 Determinar y.13. SOL: Tenemos que: = r + r + r y. 13 y.1 y(.1) y(3.1) Por otro lado, se sabe: = r + r y. 1 y.1 y(.1) Como X 3 no correlaciona ni con X ni con X 1 : r = r y( 3.1) y3 Por tanto: = 0.35+ 0.5 y. 13 = y.1+ ry3 = 0.6 Lo que se ilustra mejor gráficamente: Y X 3 X 1 X 1 X 7