3. Variables aleatorias Estadística Ingeniería Informática Curso 2009-2010 Estadística (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 1 / 33
Contenidos 1 Variables aleatorias y su distribución 2 Transformación de variables aleatorias 3 Medidas características de una variable aleatoria Esperanza Momentos de una variable aleatoria. Varianza Otras medidas características Estadística (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 2 / 33
Variables aleatorias y su distribución Si en un experimento aleatorio, a cada suceso elemental del espacio (Ω, P) le asignamos un valor numérico obtenemos una variable que hereda de Ω la probabilidad P, y que denominamos variable aleatoria. La probabilidad P de que X tome un valor concreto a, P(X = a), es la probabilidad que corresponde a la unión de los sucesos aleatorios elementales a los que hemos asignado ese valor a. Estadística (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 3 / 33
Variables aleatorias y su distribución Ejemplo 1: Experimento aleatorio: lanzar un dado. v.a. más natural X : asignar a cada cara del dado su valor numérico X toma seis valores, del 1 al 6, con probabilidad P(X = a) = 1, a = 1,..., 6 6 v.a. (no tan natural) Y : asignar el valor 1 a las caras que son múltiplos de tres y el valor 0 a las que no lo son, { 1, con probabilidad p = 1 Y = 3 0, con probabilidad p = 2 3 Estadística (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 4 / 33
Variables aleatorias y su distribución Ejemplo 2: Vamos a realizar un experimento aleatorio que consiste en seleccionar una persona al azar. Para cada persona observamos el número de hermanos que tiene y su peso. Podemos usar las v.a. s: - X para el número de hermanos, cuyos valores serán números enteros a partir de cero, - Y para el peso; con rango de valores todos los posibles entre los ĺımites naturales; entre dos valores posibles de Y se podrían obtener infinitos valores intermedios (si utilizáramos aparatos con suficiente precisión). Estos infinitos valores en el rango de la variable es lo que diferencia a las variables continuas (Y ) de las discretas (X ). Estadística (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 5 / 33
Variables aleatorias y su distribución Definición: Una variable aleatoria X es una función X : Ω R, que a cada elemento del espacio muestral le hace corresponder un número real. El conjunto de valores reales que tienen asociado algún elemento del espacio muestral se denomina rango de la v.a.: Ω X = {x R : s Ω, X (s) = x} Si Ω X es un conjunto finito o numerable, entonces la variable aleatoria se denomina discreta. En caso de que Ω X sea un intervalo, finito o infinito, entonces la variable aleatoria se denomina continua. Estadística (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 6 / 33
Variables aleatorias y su distribución Cómo asignamos una probabilidad P a los valores del rango de una v.a.? ( cómo hereda la variable X la función de probabilidad P del espacio Ω?) Dado A R, la probabilidad de A viene dada por P(A) = P(X A) = P(s Ω : X (s) A) La función de { } masa (v.a. discreta) densidad (v.a. continua) caracteriza P (inducida por P) qué significa? que conocida la función de masa/densidad de X podemos calcular la probabilidad de cualquier subconjunto A R por qué usarlas? porque son más fáciles de calcular y de manipular Estadística (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 7 / 33
Variables aleatorias y su distribución Función de masa (v.a.discreta) Es una función que representa la probabilidad de que X tome cada uno de los posibles valores (discretos) x i, i = 1,..., n,...: p : R [0, 1] x i p(x i ) = P(X = x i ) = = P(s Ω : X (s) = x i ) Propiedades: 1. 0 p(x) 1, x R 2. p(x i ) = 1 i 3. Dado A R, P(X A) = p(x i ) x i A Estadística (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 8 / 33
Variables aleatorias y su distribución Función de densidad (v.a.continua) Es una función f : R R que describe la probabilidad de X de la siguiente manera: si tenemos un subconjunto de números reales A R, la probabilidad de que la variable aleatoria continua X tome un valor en dicho conjunto es P(X A) = f (x)dx. A No hay que confundir la probabilidad P(X = a) con el valor de la función de densidad en a, f (a) Propiedades: 1. f (x) 0, x R, 2. f (x)dx = 1. R Estadística (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 9 / 33
Variables aleatorias y su distribución Como consecuencia: b P(a X b) = f (x)dx a P(X = a) = f (x)dx = {a} a a f (x)dx = 0 la probabilidad de que una v.a. continua X tome un valor a es cero P(X a) = P(X < a) P(X a) = P(X > a) Estadística (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 10 / 33
Variables aleatorias y su distribución Función de distribución Otra función F que caracteriza la función de probabilidad P de una v.a. X : F (x) = P(, x] = P(s Ω : X (s) x), x R Propiedades: 1. ĺım x F (x) = 0 2. ĺım x F (x) = 1 3. x 1 < x 2 F (x 1 ) F (x 2 ) (monótona no decreciente) 4. F (x + ) = ĺım F (x + h) = F (x) h 0 + (continua por la derecha) Estadística (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 11 / 33
Variables aleatorias y su distribución Como consecuencia: P(a, b] = P(, b] P(, a] = F (b) F (a) P(a, b) = P(, b) P(, a] = F (b ) F (a) P[a, b] = P(, b] P(, a) = F (b) F (a ) P[a, b) = P(, b) P(, a) = F (b ) F (a ) P{a} = P(, a] P(, a) = F (a) F (a ) (salto de probabilidad en a) donde P(, a) = F (a ) Si F tiene un salto en un punto a entonces P(a) > 0 Estadística (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 12 / 33
Variables aleatorias y su distribución Función de distribución de una v.a.discreta F (x) = x i x P(X = x i ) = x i x p(x i ) es una función continua a trozos (función en escalera) Función de distribución de una v.a.continua F (x) = x f (t)dt F es continua: no tiene saltos (todos los conjuntos formados por un solo punto tienen probabilidad cero) df (x) Calculamos f (x) a partir de F (x) derivando: f (x) = dx Estadística (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 13 / 33
Variables aleatorias y su distribución Ejemplo 1: Experimento aleatorio: lanzar cuatro veces una moneda equilibrada. Espacio muestral: Ω = {CCCC, CCC+, CC + C, C + CC, +CCC, CC + +, C + C+, C + +C, +CC+, +C +C, ++CC, +++C, ++C+, +C ++, C +++, ++++} X v.a. que expresa el número de cruces obtenidas; toma el valor 0 cuando el resultado es {CCCC}, el valor 1 si ocurre el suceso {CCC+, CC + C, C + CC, +CCC}, el valor 2 si aparece {CC + +, C + C+, C + +C, +CC+, +C + C, + + CC}, el valor 3 para los resultados {+ + +C, + + C+, +C + +, C + ++}, y el valor 4 si sale {+ + ++}. P(x i ) = 1 x i = 0 4 x i = 1 6 x i = 2 4 x i = 3 1 x i = 4 F (x) = 0 x < 0 1 0 x < 1 5 1 x < 2 11 2 x < 3 15 3 x < 4 = 1 x 4 Estadística (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 14 / 33
Variables aleatorias y su distribución Ejemplo 1 (cont.): Se quiere hallar la probabilidad de que aparezcan más de dos cruces: o también: P(X > 2) = P(X = 3) + P(X = 4) = 4 + 1 = 5 P(X > 2) = 1 P(X 2) = 1 F (2) = 5 Se quiere calcular la probabilidad de que el número de cruces sea más de 1 y menos de 4: P{1 < X < 4} = P(X = 2) + P(X = 3) = 4 + 6 = 10 Estadística (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 15 / 33
Variables aleatorias y su distribución Ejemplo 2: Sea X una variable aleatoria continua, caracterizada por la siguiente función de densidad: { k(x f (x) = 2 + 1) si 0 < x < 3 0 en el resto Para que sea función de densidad, la integral en R debe ser 1: 1 = R f (x)dx = 3 0 k(x 2 + 1)dx = (k x 3 ) 3 3 + kx 0 = k 33 3 + 3k = = 9k + 3k = 12k k = 1 12 Función de distribución: 0, x < 0 x F (x) = k(t 2 + 1)dt, 0 x 3 0 1, x > 3 = 0, x < 0 x 3 + 3x, 0 x 3 36 1, x > 3 Estadística (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 / 33
Transformación de variables aleatorias Transformación de variables aleatorias Dadas una variable aleatoria X y una función real de variable real g : R R queremos estudiar la distribución de la variable aleatoria transformada por g de X, Y = g(x ) Basta con calcular la función de distribución de Y (P está caracterizada por F ) F Y (y) = P Y (Y y) = P Y (g(x ) y) = P X (X A y ), donde A y = {x : g(x) y} (en muchos casos es sencillo de calcular) Estadística (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 17 / 33
Transformación de variables aleatorias Transformación de una v.a.discreta Función de distribución: F Y (y) = P X (X A y ) = x i A y p X (x i ) = g(x i ) y Función de masa: p Y (y) = P Y (Y = y) = P Y (g(x ) = y) = Transformación de una v.a.continua Función de distribución (g continua y creciente): g(x i )=y p X (x i ) p X (x i ) F Y (y) = P Y (g(x ) y) = P X (X g 1 (y)) = F X (g 1 (y)) Función de densidad (g derivable e inyectiva): f Y (y) = f X (x) dx dy Estadística (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 18 / 33
Transformación de variables aleatorias Ejemplo: Dadas la variable aleatoria continua X, con función de densidad f X (x) = 2x, 0 < x < 1, y la función continua g(x) = 3x + 1, calcular la función de densidad de la variable aleatoria continua Y = g(x ). Como x = g 1 (y) = y 1, 3 y dx dy = 1 3 = 1 3, será: f Y (y) = 1 3 f X ( y 1 3 ) = 2y 2 9, (1 < y < 4) Estadística (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 19 / 33
Transformación de variables aleatorias Ejemplo (cont.): Alternativamente, podemos calcular f Y de la siguiente manera: Función de distribución de Y : F Y (y) = P(Y y) = P(g(X ) y) = P ( X g 1 (y) ) = F X ( g 1 (y) ) = = y 1 3 0 2tdt = t 2 y 1 3 = 0 (y 1)2, 9 y derivamos F Y para obtener la función de densidad: f Y (y) = 2(y 1) 9 = 2y 2 9 Estadística (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 20 / 33
Medidas características de una variable aleatoria Medidas características de una v.a. El estudio y comparación de la distribución de probabilidad de distintas variables aleatorias es más sencillo mediante el uso de constantes (medidas características de la variable) que caracterizan la tendencia central de las distribuciones (o valor central alrededor del cual se encuentran repartidas de forma equilibrada las probabilidades), la dispersión (mayor o menor densidad en torno al valor central), etc. Estadística (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 21 / 33
Medidas características de una variable aleatoria Esperanza Esperanza (I) medida característica de tendencia central más importante también se denomina esperanza matemática, media o valor esperado de la v.a. se denota como E[X ] o µ X representa el valor promedio o centro de gravedad de los valores que toma la variable, ponderando éstos mediante la correspondiente probabilidad. Estadística (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 22 / 33
Medidas características de una variable aleatoria Esperanza Esperanza (II) Esperanza de una v.a.discreta µ X = E[X ] = i x i p X (x i ) Dada g : R R, la esperanza de Y = g(x ), viene dada por µ Y = E[Y ] = i g(x i )p X (x i ) Esperanza de una v.a.continua µ X = E[X ] = R xf X (x)dx Dada g : R R, la esperanza de Y = g(x ), viene dada por µ Y = E[Y ] = g(x)f X (x)dx R Estadística (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 23 / 33
Medidas características de una variable aleatoria Esperanza Esperanza (III) Propiedades: Dadas las variables aleatorias X, Y y dos números reales a, b R, se tiene: E[aX + b] = ae[x ] + b E[X + Y ] = E[X ] + E[Y ] (es un operador lineal) Estadística (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 24 / 33
Medidas características de una variable aleatoria Momentos de una variable aleatoria. Varianza Momentos valores esperados de ciertas funciones de X se pueden definir alrededor de cualquier punto de referencia alrededor del cero momentos ordinarios o respecto al origen alrededor de la esperanza de X momentos centrales o respecto a la media Momento ordinario de orden k: α k = E[X k ] α 1 = µ X (el momento ordinario de orden 1 es la media de X ) Momento central de orden k: µ k = E[(X µ X ) k ] µ 1 = E[X µ X ] = E[X ] µ X = µ X µ X = 0 (el momento central de orden 1 de cualquier v.a. es cero) Dos v.a. con los mismos momentos tienen la misma distribución de probabilidad (los momentos caracterizan la distribución de probabilidad) Estadística (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 25 / 33
Medidas características de una variable aleatoria Momentos de una variable aleatoria. Varianza Varianza (I) momento central de orden 2: µ 2 = E[(X µ X ) 2 ] se denota por V (X ) o σ 2 X representa la distancia cuadrática promedio a la media dispersión de una v.a. en torno a su media su raíz cuadrada, σ, se denomina desviación típica E[(X µ X ) 2 ] = E[X 2 ] µ 2 X (el momento central de orden 2 es igual al momento ordinario de orden 2 menos el cuadrado del momento ordinario de orden 1) Estadística (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 26 / 33
Medidas características de una variable aleatoria Momentos de una variable aleatoria. Varianza Varianza (II) Varianza de una v.a.discreta σx 2 = V (X ) = E[(X µ X ) 2 ] = (x i µ X ) 2 p X (x i ) i o alternativamente: σ 2 X = E[X 2 ] µ 2 X = i x 2 i p X (x i ) µ 2 X Varianza de una v.a.continua σx 2 = V (X ) = E[(X µ X ) 2 ] = (x µ X ) 2 f X (x)dx o alternativamente: σx 2 = E[X 2 ] µ 2 X = R R x 2 f X (x) dx µ 2 X Estadística (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 27 / 33
Medidas características de una variable aleatoria Momentos de una variable aleatoria. Varianza Varianza (III) Propiedades: Dada una variable aleatoria X y dos números reales a, b R, se verifica: V (X ) = E[X 2 ] (E[X ]) 2 V (ax ) = a 2 V (X ) V (b) = 0 V (ax + b) = a 2 V (X ) Desigualdad de Chebichev: P( X µ X > kσ X ) 1 k 2 Estadística (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 28 / 33
Medidas características de una variable aleatoria Otras medidas características Mediana (I) Mediana de una v.a. X Es el valor Me tal que P(X < Me) 1 2, y F (Me) = P(X Me) 1 2 es una medida de tendencia central en el sentido de que es el valor para el cual la distribución de probabilidad queda dividida en dos partes iguales Estadística (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 29 / 33
Medidas características de una variable aleatoria Otras medidas características Mediana (II) Mediana de una v.a.discreta es el primer valor (o rango de valores) que acumula (por la izquierda) una probabilidad mayor o igual a 1 2 Mediana de una v.a.continua es el valor que verifica F (Me) = 1 2 Estadística (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 30 / 33
Medidas características de una variable aleatoria Otras medidas características Coeficiente de variación CV X = σ X µ X expresa la magnitud de la dispersión de una variable aleatoria con respecto a su valor esperado permite comparar la dispersión relativa de dos distribuciones de probabilidad especialmente útil cuando la escala de medida de las variables que queremos comparar difiere notablemente Estadística (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 31 / 33
Medidas características de una variable aleatoria Otras medidas características Ejemplo: Sea la variable aleatoria discreta X correspondiente al número de cruces obtenidas al lanzar 4 veces una moneda 1 x i = 0 4 Función de masa: P(x i ) = Media: µ X = 0 x i = 1 6 x i = 2 4 x i = 3 1 x i = 4 1 + 1 4 + 2 6 + 3 4 + 4 1 = 2 La función de distribución a la izquierda de 2 es 5 11 y en 2 es Me =2. Varianza: σx 2 = 02 1 + 12 4 + 22 6 + 32 4 + 42 1 22 = = 1 1 Coeficiente de variación: CV X = 2 = 1 2 Estadística (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 32 / 33
Medidas características de una variable aleatoria Otras medidas características Ejemplo: Sea la variable aleatoria continua X, con función de densidad f X (x) = 2x, si 0 < x < 1. 1 Media: µ X = x 2xdx = 2x 3 1 0 3 = 2 0 3 = 0,67 La mediana será el valor Me tal que 1 Me 2 = 2xdx = x 2 Me = Me 2, 0 0 1 luego Me = 2 = 0,71 1 Momento ordinario de orden 2: E[X 2 ] = x 2 2xdx = 2x 4 1 0 4 = 1 0 2 σx 2 = 1 ( ) 2 2 2 = 1 3 18 = 0,05 Coeficiente de variación: CV X = = 1 2 2 2 = 4 1 18 2 3 Estadística (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 33 / 33