Tema 5: Vectores aleatorios bidimensionales.

Transcripción

1 Estadística 52 Tema 5: Vectores aleatorios bidimensionales. Hasta ahora hemos estudiado las variables aleatorias unidimensionales, es decir, los valores de una característica aleatoria. En muchos casos, interesa estudiar dos o más características y su relación: peso y altura, renta y consumo, producción y gastos de mantenimiento, inversión tecnológica y número de obreros,... Por comodidad vamos a estudiar los vectores aleatorios bidimensionales, aunque el estudio de variables n-dimensionales es análogo. Definición 1 Se denomina vector aleatorio bidimensional a una aplicación del espacio de sucesos de un experimento aleatorio en IR 2, X =(X, Y ):Ω IR 2. Definición 2 Se dice que se ha definido la distribución conjunta del vector si se conocen: 1. Los resultados posibles del vector (es decir, su soporte, que denotaremos por S X opors (X,Y ) ). 2. Las probabilidades de cada resultado posible. 5.1 Vectores discretos bidimensionales. Definición 3 Diremos que un vector aleatorio bidimensional X = (X, Y ) es discreto si sus dos componentes son variables aleatorias discretas. El soporte del vector es S X = S X S Y, donde S X = {x 1,x 2,...,x k } y S Y = {y 1,y 2,...,y h } yse puede representar como pares de números reales: {(x i,y j ),i =1, 2,...,k j =1, 2,...,h} (donde k o h pueden ser finitos o ser ). Función de probabilidad conjunta: Definición 4 Sea X = (X, Y ) un vector aleatorio bidimensional discreto; se define la función de probabilidad conjunta sobre el soporte del vector {(x i,y j ),i =1, 2,...,k j =1, 2,...,h}, como: p ij = p(x = x i,y = y j )=p({ω Ω/X(ω) =x i,y(ω) =y j }) Propiedades 1 (a) p(x = x i,y = y j ) 0 (b) p(x = x i,y = y j )=1 i j

2 Estadística 53 El vector aleatorio queda perfectamente determinado si conocemos su soporte y la función de probabilidad conjunta. Ejemplo 1: Se lanzan dos dados y se consideran las variables aleatorias: X= suma de los resultados Y= valor absoluto de la diferencia En este caso, p(x 4,Y =2)=p({(1, 3), (3, 1)}) =1/18 y de igual forma se obtiene la distribución conjunta p(x = x i,y = y j ): Y \X /36 0 1/36 0 1/36 0 1/36 0 1/36 0 1/ /18 0 1/18 0 1/18 0 1/18 0 1/ /18 0 1/18 0 1/18 0 1/ /18 0 1/18 0 1/ /18 0 1/ / Función de distribución conjunta: Como en el caso de variables aleatorias, la distribución de un vector aleatorio se puede dar también utilizando una función de "probabilidades acumuladas", llamada función de distribución: F (x, y) =p(x x, Y y), x,y IR. Función de probabilidad marginal: Puesto que X e Y son variables aleatorias unidimensionales discretas, podemos hablar de su ley de probabilidad que está relacionada con la distribución conjunta por las igualdades: p X (x i )=p(x = x i )= j p Y (y j )=p(y = y j )= i p(x i,y j ) p(x i,y j ) Proposición 1 Las funciones de probabilidad p X y p Y definen una probabilidad, es decir, se verifica que: p X (X = x i ) 0, p X (X = x i )=1 i

3 Estadística 54 p Y (Y = y j ) 0, p Y (Y = y j )=1 j Estas probabilidades marginales se pueden añadir a la tabla de distribución conjunta: Y \X /36 0 1/36 0 1/36 0 1/36 0 1/36 0 1/36 6/ /18 0 1/18 0 1/18 0 1/18 0 1/18 0 5/ /18 0 1/18 0 1/18 0 1/ / /18 0 1/18 0 1/ / /18 0 1/ / / /18 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36 Función de probabilidad condicionada: En algunos casos, poseemos información sobre el resultado de una de las variables, información que puede ser útil para tener información sobre la otra variable. La distribución de probabilidades de alguna de las variables X e Y sobre el subconjunto del correspondiente soporte, formado por los puntos en los que la otra variable toma determinados valores, se denomina condicionada. Se puede hablar, por ejemplo, de la variable aleatoria X/(Y = y j ), cuyo soporte es el mismo de X y su ley de probabilidad viene dada por: p(x = x i /(Y = y j )) = p(x = x i,y = y j ) p(y = y j ) = p(x = x i,y = y j ) p(x = x k,y = y j ) k Análogamente se tiene la variable unidimensional Y/(X = x i ), cuyo soporte es S Y probabilidades viene dada por: y su ley de p(y = y j /(X = x i )) = p(x = x i,y = y j ) p(x = x i ) = p(x = x i,y = y j ) p(x = x i,y = y k ) k Proposición 2 Las funciones de probabilidad p X/Y =yj y p Y/X=xi definen un probabilidad, es decir, se verifica que: p X/Y =yj (x i ) 0, p Y/X=xi (y j ) 0, p X/Y =yj (x i )=1 i p Y/X=xi (y j )=1 j

4 Estadística 55 Está claro que se pueden definir otras distribuciones condicionadas, como por ejemplo: p(x = x i /Y y j ), p(y = y j /x m X x n ),... Ejemplo 2: Volviendo a la tirada de dos dados y considerendo las variables: X= suma de los resultados Y= valor absoluto de la diferencia podemos considerar la variable X/(Y 2), cuyo soporte es S X/(Y 2) = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12} y cuya distribución de probabilidades viene dada por: X/(Y 2) p(x = x i /Y 2) 1/24 2/24 3/24 4/24 5/24 6/24 5/24 4/24 3/24 2/24 1/24 Observación 1 Obsérvese que estas distribuciones condicionadas son distribuciones de variables aleatorias discretas. 5.2 Vectores aleatorios continuos bidimensionales: Definición 5 Llamaremos vector aleatorio continuo bidimensional a un vector aleatorio X =(X, Y ) para el cuál existe una función f(x, y), integrable Riemann en IR 2, tal que: (a) f(x, y) 0, (x, y) R 2 (b) f(x, y)dxdy =1 (c) p(x x, Y y) = x y f(s, t)dtds La función f(x, y) se denomina función de densidad conjunta del vector X y también se denota por f XY (x, y). Observación 2 La condición (a), significa que la función f(x, y) determina un sólido V (que puede ser infinito) en IR 2. La condición (b) nos dice que el volumen de ese sólido tiene que ser 1. La expresión (c) define una función en IR 2, llamada función de distribucióndel vector aleatorio: F (x, y) =p(x x, Y y) = x y f(s, t)dtds

5 Estadística 56 Distribuciones marginales: Definición 6 Se define la función de densidad marginal de X como: f X (x) = y se define la función de densidad marginal de Y: f Y (y) = f(x, y)dy f(x, y)dx Observación 3 f X (x) es el área de la sección que origina en V el plano X=x. f Y (y) es el área de la sección que origina en V el plano Y=y. Proposición 3 Las funciones f X y f Y son funciones de densidad de variables aleatorias unidimensionales. Distribución condicionada: En el caso de una v.a. continua, la densidad de cualquier punto es cero, pero eso no significa que no pueda ocurrir, por ello tiene perfecto sentido plantearnos, por ejemplo, la variable X condicionada por que ha ocurrido Y = y 0. Definición 7 Sea (X, Y ) un vector aleatorio continuo con función de densidad f(x, y). Si (x, y) es un punto de continuidad de f, f Y es continua en y y f Y (y) > 0, entonces la función de densidad de la distribución condicionada de X/(Y = y) viene dada por: f X/Y =y (x) =f(x = x/y = y) = f(x, y) f Y (y) Observación 4 De esta definición se deduce que F X/Y =y (x) = x f(t, y) dt f Y (y) Este valor corresponde a la proporción de área de la sección de V con el plano Y=y, correspondiente al semiplano X x. 5.3 Independencia de variables aleatorias Definición 8 Si el vector aleatorio es discreto entonces X e Y son independientes si y sólo si p(x i,y j )= p X (x i )p Y (y j ) para cada (x i,y j ) S (X,Y ).

6 Estadística 57 Se puede deducir fácilmente que X e Y son independientes si y sólo si: p(x i /(Y = y j )) = p X (x i ) y p(y j /(X = x i )) = p Y (y j ) Definición 9 Si el vector aleatorio es continuo entonces X e Y son independientes si y sólo si f(x, y) = f X (x)f Y (y) para cada (x, y) IR 2. Igualmente, se deduce fácilmente que X e Y son independientes si, y sólo si: f(x/(y = y)) = f X (x) y f(y/(x = x)) = f Y (y) (en aquellos puntos en donde están definidas estas densidades). Generalización a n variables: Definición 10 Las v.a discretas X 1,X 2,...X n se dicen independientes si y sólo si p(x 1 = x 1,X 2 = x 2,...X n = x n )=p X1 (x 1 )p X2 (x 2 )...p Xn (x n ) para cada (x 1,...,x n ) S (X1,X 2,...,X n). Ejemplo 3: Puede comprobarse que las variables X e Y definidas en el ejemplo 1 no son independientes. Ejemplo 4: En el experimento de tirar dos dados correctos, vamos a definir las variables X 1 y X 2 de la siguiente forma: X 1 =2si al menos uno de los resultados es par y X 1 =1si los dos resultados son impares X 2 =3si al menos un resultado es múltiplo de 3 y X 2 =0si ninguno de los dos resultados es múltiplo de 3. Puede comprobarse que la tabla de doble entrada del vector (X 1,X 2 ) es : X 1 \X /36 5/36 9/ /36 15/36 27/36 16/36 20/36 Las variables X 1 y X 2 son independientes, puesto que = = = = Definición 11 El vector aleatorio continuo (X 1,...,X n ) tiene componentes que son independientes si ysólosif(x 1,x 2,...,x n )=f X1 (x 1 )...f Xn (x n ).

7 Estadística Funciones de vectores aleatorios En ocasiones, los sucesos a estudiar se expresan como una relación funcional de variables aleatorias (por ejemplo, el suceso X + Y 1, óxy 62.5). Por ello, vamos a introducir brevemente las funciones de vectores aleatorios. Proposición 4 Si(X,Y)esunvectoraleatorioyh : IR 2 IR es una función continua, entonces h(x,y) es una variable aleatoria que, si el vector es continuo, será continua. La distribución de una función de un vector aleatorio se obtiene a partir de la distribución conjunta del vector: p(h(x, Y ) z) =p({(x, y)/h(x, y) z}) 5.5 Medidas características de un vector aleatorio Las distribuciones marginales y condicionadas son distribuciones unidimensionales y por tanto se pueden considerar sus medidas características (media, mediana, varianza, etc) como en el caso de una variable. Las componentes de un vector aleatorio pueden estar relacionadas en alguna forma. Al igual que estudiamos en el tema de descriptiva, uno de los tipos de relación de mayor interés es la relación lineal. Una medida de esta relación lineal la proporciona la covarianza, que en el caso discreto se define como: Definición 12 Se define la covarianza del vector discreto (X,Y) como: σ XY = Cov(X, Y )= (x i E(X))(y j E(Y ))p(x = x i,y = y j ) i=1 j=1 Definición 13 Se define la covarianza del vector continuo (X,Y) como: σ XY = Cov(X, Y )= (x E(X))(y E(Y ))f(x, y)dxdy Propiedades 2 (a) Cov(X,Y) = Cov(Y,X) (b) Cov(X, Y )= x i y j p(x = x i,y = y j ) E(X)E(Y ), si (X,Y) es discreto, y Cov(X, Y )= i=1 j=1 xyf(x, y)dxdy E(X)E(Y ), si(x,y)escontinuo. (c) Cov(aX+b,cY+d) = accov(x,y) (d) Si X e Y son independientes, entonces Cov(X, Y )=0.

8 Estadística 59 La covarianza tiene el inconveniente de depender de las unidades de medida de las variables. Una medida adimensional de la posible relación lineal es el coeficiente de correlación lineal de Pearson, que se define de la forma siguiente: Definición 14 Se define el coeficiente de correlación lineal del vector (X,Y) como: ρ = Cov(X, Y ) σ X σ Y Sus propiedades son análogas a las del coeficiente de correlación estudiado en estadística descriptiva. En ocasiones interesa estudiar ciertas variables aleatorias definidas a partir de un vector bidimensional, y especialmente, las medidas principales de esa variable. h : IR 2 IR es una función continua, Si (X,Y) es un vector aleatorio y Definición 15 Se define E(h(X,Y)) como: si (X,Y) es discreto. E(h(X, Y )) = h(x i,y j )p(x i,y j ) i=1 j=1 si (X,Y) es continuo. E(h(X, Y )) = h(x, y)f(x, y) dxdy Como consecuencia de la definición anterior, se deducen las propiedades siguientes: Propiedades 3 Si (X,Y) es un vector aleatorio bidimensional y a,b son números reales: (a) E(aX + by )=ae(x)+be(y ). (b) Var(aX + by )=a 2 Var(X)+b 2 Var(Y )+2abCov(X, Y ). (c) Si X e Y son independientes: Var(aX + by )=a 2 Var(X)+b 2 Var(Y ). (d) Si X e Y son independientes: E(aXY )=ae(x)e(y ).