Capítulo 2 Variable Estadística Bidimensional 21 Distribución de Frecuencias Bidimensional Sea una población de n individuos donde estudiamos, simultáneamente, dos variables X e Y Seanx 1,x 2,,x k las modalidades de X e y 1,y 2,,y p las modalidades de Y La distribución de frecuencias bidimensional de estas dos variables se presenta mediante una tabla de doble entrada X\Y y 1 y 2 y j y p n i x 1 n 11 n 12 n 1j n 1p n 1 x 2 n 21 n 22 n 2j n 2p n 2 x i n i1 n i2 n ij n ip n i x k n k1 n k2 n kj n kp n k n j n 1 n 2 n j n p n 1
2 Variable Estadística Bidimensional 211 Frecuencias Absolutas Se define la frecuencia absoluta correspondiente a la pareja de valores (x i,y j ) como n ij = número de individuos que presenta la modalidad x i de X e y j de Y para i =1,,k, j =1,,p Claramente, se verifica que n = n ij 212 Frecuencias Relativas Se define la frecuencia relativa correspondiente a la pareja de valores (x i,y j ) como f ij = n ij n = proporción de individuos que presenta la modalidad x i de X e y j de Y para i =1,,k, j =1,,p Claramente, se verifica que 1= f ij 22 Distribuciones Marginales Las distribuciones marginales corresponden al estudio, por separado, de cada una de las dos variables que componen una variable estadística bidimensional Cada distribución marginal será, por tanto, una distribución unidimensional y, consecuentemente, se le podrá aplicar cualquiera de los resultados estudiados en el Capítulo 2 221 Distribución Marginal de X Es la distribución de todas las observaciones de X independientemente de las de Y Se obtiene sumando, para cada x i, las frecuencias correspondientes a todos los valores de
Distribuciones Marginales 3 Y,esdecir X n i f i x 1 n 1 f 1 x 2 n 2 f 2 x i n i f i x k n k f k n 1 donde, para cada i =1,,k, n i = n ij = n i1 + n i2 + + n ip se denomina Frecuencia Marginal Absoluta de x i,y f i = n i n = f ij se denomina Frecuencia Marginal Relativa de x i Se verifica que n i = n, f i =1 Media Marginal de X x = f i x i = 1 n n i x i Varianza Marginal de X Var(X) = f i (x i x) 2 = f i x 2 i x 2
4 Variable Estadística Bidimensional 222 Distribución Marginal de Y Es la distribución de todas las observaciones de Y independientemente de las de X, se obtiene sumando, para cada y j, las frecuencias correspondientes a todos los valores de X, esdecir Y n j f j y 1 n 1 f 1 y 2 n 2 f 2 y j n j f j donde, para cada j =1,,p, y p n p f p n 1 n j = n ij = n 1j + n 2j + + n kj se denomina Frecuencia Marginal Absoluta de y j,y f ij f j = n j n = se denomina Frecuencia Marginal Relativa de y j Se verifica que n j = n, f j =1 Media Marginal de Y ȳ = f j y j = 1 n n j y j Varianza Marginal de Y Var(Y )= f j (y j ȳ) 2 = f j yj 2 ȳ 2
Distribuciones Condicionadas 5 23 Distribuciones Condicionadas Las distribuciones condicionadas corresponden al estudio de una variable cuando la otra toma presenta, exactamente, un valor concreto Cada distribución condicionada será, por tanto, una distribución unidimensional y, consecuentemente, se le podrá aplicar cualquiera de los resultados estudiados en el Capítulo 2 231 Distribución Condicionada de X a Y = y j Para cada j =1,,pfijo, la distribución de X condicionada a Y = y j es la distribución de la variable X restringida a los individuos que presentan modalidad y j de Y,esdecir X/Y = y j n j i (j fijo) f j i = nj i /n j x 1 n j 1 = n 1j f j 1 = nj 1 /n j x 2 n j 2 = n 2j f j 2 = nj 2 /n j x i n j i = n ij f j i = nj i /n j x k n j k = n kj f j k = nj k /n j n j 1 Observemos que existen p distribuciones condicionadas de X a Y (una para cada valor de Y ) Media de X condicionada a Y = y j x j = f j i x i = 1 n j n ij x i Varianza de X condicionada a Y = y j Var j (X) = f j i (x i x j ) 2 = f j i x2 i x 2 j
6 Variable Estadística Bidimensional 232 Distribución condicionada de Y a X = x i Para cada i =1,,kfijo, la distribución de Y condicionada a X = x i es la distribución de la variable Y restringida a los individuos que presentan modalidad x i de X, es decir Y/X = x i n i j (i fijo) f i j = ni j /n i y 1 n i 1 = n i1 f i 1 = ni 1 /n i y 2 n i 2 = n i2 f i 2 = ni 2 /n i y j n i j = n ij f i j = ni j /n i y p n i p = n ip fp i = n i p/n i n i 1 Observemos que existen k distribuciones condicionadas de Y a X (una para cada valor de X) Media de Y condicionada a X = x i ȳ i = f i jy j = 1 n i n ij y j Varianza de Y condicionada a X = x i Var i (Y ) = P p f i j (y j ȳ i ) 2 = P p f i j y2 j ȳ2 i Se verifican las siguientes relaciones f ij = f i j f i = f j i f j (la demostración queda propuesta) Observemos que sólo hemos considerado las distribuciones condicionadas de una variable cuando la otra presenta un valor fijado Este estudio se puede generalizar al caso en que se condiciona, no a un único valor de la variable, sino a todo un conjunto de valores
Independencia Estadística de Variables 7 24 Independencia Estadística de Variables Diremos que X es estadísticamente independiente de Y (o, simplemente, independiente de Y ) si todas las distribuciones condicionadas X/Y = y j son iguales entre sí, para cualquier y j al que se condicione, es decir, X es independiente de Y f j i no depende de j f 1 i = f 2 i = = f p i En tal caso, las distribuciones condicionadas X/Y = y j coinciden con la marginal de X, esdecir ½ X es independiente de Y f j i =1,,k i = f i para j =1,,p Diremos que Y es estadísticamente independiente de X (o, simplemente, independiente de X) si todas las distribuciones condicionadas Y/X = x i son iguales entre sí, para cualquier x i al que se condicione, es decir, Y es independiente de X fj i no depende de i fj 1 = fj 2 = = fj k En tal caso, las distribuciones condicionadas Y/X = x i coinciden con la marginal de Y,esdecir ½ i =1,,k Y es independiente de X fj i = f j para j =1,,p Se puede demostrar que la independencia es recíproca, esto es, X es independiente de Y Y es independiente de X Esto permite hablar de variables independientes entre sí (diremos, simplemente, que X e Y son independientes) De las definiciones anteriores se deduce que X es independiente de Y n ij = n i n j n f ij = f i f j
8 Variable Estadística Bidimensional 25 Dependencia Funcional de Variables Cuando dos variables no son estadísticamente independientes, se dice que son estadísticamente dependientes La dependencia estadística más fuerte es la llamada Dependencia Funcional Se dice que X depende funcionalmente de Y siacadamodalidady j de Y corresponde una única modalidad de X (en cada columna de la tabla bidimensional hay un término, y sólo uno, diferente de cero) Se dice que Y depende funcionalmente de X siacadamodalidadx i de X corresponde una única modalidad de Y (en cada fila de la tabla bidimensional hay un término, y sólo uno, diferente de cero) En general, la dependencia funcional no es recíproca, como muestra el siguiente ejemplo: X\Y y 1 y 2 y 3 y 4 x 1 4 0 7 0 x 2 0 6 0 0 x 3 0 0 0 9 X depende funcionalmente de Y = Y NO depende funcionalmente de X 26 Covarianza Se trata de una característica numérica conjunta bidimensional que indica el sentido en que crecen o decrecen las variables por término medio Concretamente, si la covarianza es positiva, las dos variables varían en el mismo sentido (las dos crecen o las dos decrecen) y, si es negativa, las variables varían en sentido opuesto (una crece cuando la otra decrece y viceversa) La covarianza de dos variables, X e Y,sedefine como Cov(X, Y )=σ XY = f ij (x i x)(y j ȳ) = 1 n n ij x i y j xȳ Se dice que X e Y son incorreladas si su covarianza es nula, esto es X e Y son incorreladas Cov(X, Y )=0
Representaciones Gráficas 9 Se tiene la siguiente relación INDEPENDENCIA = 6 = INCORRELACIÓN es decir, si dos variables son independientes, entonces son incorreladas (demuéstrese), pero si las variables son incorreladas, no se puede afirmar nada sobre su dependencia o independencia estadística 27 Representaciones Gráficas Como las distribuciones condicionadas y marginales son unidimensionales, todos los gráficos estudiados en el Capítulo 1 son aplicables a dichas distribuciones En las distribuciones bidimensionales se suelen emplear los siguientes gráficos: 271 Diagrama de Dispersión o Nube de Puntos Consiste en representar los pares de puntos (x i,y j ) en el plano junto con su correspondiente frecuencia absoluta conjunta n ij 272 Estereograma o Histograma Tridimensional Se trata de un gráfico en tres dimensiones donde un eje corresponde a la variable X, otro a la variable Y y el tercero a las frecuencia absoluta conjunta Si las variables son discretas, el estereograma estará compuesto por barras (diagrama de barras tridimensional); si las variables son continuas, el estereograma estará formado por paralelepípedos (histograma tridimensional) cuyos respectivos volúmenes son proporcionales a las correspondientes frecuencias absolutas conjuntas