3..- Introducción. Tema 3. VARIABLES ALEATORIAS. Objetivo: Encontrar modelos matemáticos para el trabajo con probabilidad de sucesos. En particular, se quiere trabajar con funciones reales de variable real. Una probabilidad es una función P : Ω R, donde Ω es un álgebra de sucesos. Queremos trabajar con probabilidades a partir de funciones F: R R. 3..- Variables aleatorias. Idea: Asociar cada resultado del eperimento con un número y así podremos ya trabajar sólo con números reales. Una variable aleatoria (v.a.) será una función que asigne a cada suceso un número. Ejemplo: ) X: Sensación que provocan las asignaturas de matemáticas Asociamos cada respuesta con un número, según se considere que la sensación es positiva (+), negativa () o neutra (). Por ejemplo: ) X: Número de caras al lanzar 3 monedas Sensa Mates X buena miedo - pesadas - trabajo - mal rollo - no me provocan desagradable - curiosidad ninguna no me gustan - puff - Sucesos X4 {,,} {c,,} {,c,} {,,c} {c,c,} {,c,c} {c,,c} {c,c,c} 3 Opcional: La formalización del concepto de variable aleatoria es la siguiente:
Definición. Sea E el espacio muestral asociado a un eperimento aleatorio y Ω un álgebra de sucesos asociado a E. Llamaremos variable aleatoria a una función X : E R, tal que para cualquier intervalo B = (-, b] de la recta real, el suceso X ( B) X ( B) = { ω E/ X( ω) B}. Ejemplos. Ω siendo ) X: Sensación que provocan las asignaturas de matemáticas X ( ) X ( ) (, ] = = {miedo, pesadas, mal rollo, puff, } (sucesos a los que X asigna el valor ) ) X: Número de caras al lanzar 3 monedas ((,]) = ({, }) = {{,, },{,, },{,, },{,, }} X X c c c (sucesos a los que X asigna el valor ó ) (Fin de lo opcional) Con el concepto de v.a. podemos definir probabilidades asociadas a números reales o a intervalos: PX ( = a) = PX ( ( a)) =P(sucesos que X asocia con el valor a) o bien PX ( B) = PX ( ( B)) = P(sucesos que X asocia con un valor del intervalo B) Ejemplo: X: Número de caras al lanzar 3 monedas ( ({})) { } { } { } ( ) PX ( = ) = P X = P c,,, c,,, c,, = 8 4 PX ( ) = PX ( (,]) = PX ( = óx= ) = P( {,, },{ c,, },{ c,, },{ c,, }) = 8 3 PX ( > ) = PX ( = 3) = P( { ccc,, }) = 8 Estudiaremos dos tipos de variables aleatorias: Discretas: el conjunto de posibles valores que toma la variable es discreto (es decir, finito o numerable). Continuas: el conjunto de posibles valores es uno o varios intervalos de la recta real. Ejemplos: Discretas: X: Número de caras al lanzar 3 monedas (puede tomar sólo los valores,,,3) X: Sensación que provocan las asignaturas de matemáticas (puede tomar sólo los valores,,)
X: Número de llamadas diarias que se hacen por teléfono móvil (puede tomar los valores,,,3, infinito numerable) Continuas: Y: Estatura de una población (en centímetros) (puede tomar cualquier valor en el intervalo [,5] ) Y: Error cometido al redondear una nota media a un decimal (puede tomar cualquier valor en el intervalo [.5,.5] ) Y3: Tiempo máimo que he estado hablando por teléfono alguna vez (en minutos) (puede tomar cualquier valor en el intervalo [,+ ) ) Para cada tipo definiremos a continuación funciones reales de variable real para trabajar con sus probabilidades: Función de masa o distribución de probabilidad para v.a. discretas. Función de densidad para v.a. continuas. Y posteriormente definiremos la función de distribución (concepto más general) que nos permite trabajar con todas las v.a. 3.3.- Variables aleatorias discretas. Función de masa. Si tenemos una v.a. discreta la forma habitual de describir sus probabilidades es dar la probabilidad que toma cada uno de los valores que puede tomar: Ejemplo: X: Número de caras al lanzar 3 monedas 3 3 PX ( = ) = ; PX ( = ) = ; PX ( = ) = ; PX ( = 3) = 8 8 8 8 Z: Número de tiradas con un dado hasta que nos sale el primer 5 (puede tomar los valores,,3,.. hasta el infinito) PX 5 5 5 ( = ) = ; ( ) ; ( 3) ;...; ( n) ;... 6 PX = = = = = = 6 6 PX 6 6 PX 6 6 Lo denominaremos distribución de probabilidad de X o función de masa de X. Para dar una definición general, denotaremos por: { i } a los valores que tienen probabilidad positiva y los denominaremos puntos de masa de la v.a. X. ( i I siendo I un conjunto finito o numerable.) P( X = i) = pi a sus probabilidades respectivas, y al conjunto de todas ellas lo denominaremos función de masa o distribución de probabilidad de la v.a. X. Se cumple que P( X ) p = i = i y pi =. i I n- 3
La función de masa de las variables aleatorias discretas pueden representarse gráficamente mediante un diagrama donde, en el eje OX dibujaríamos los distintos puntos de masa de la variable y en ordenadas las probabilidades correspondientes. Ejemplo: X: Número de caras al tirar 3 monedas 3.4.- Variables aleatorias continuas. Función de densidad. Recordamos que una v.a. X es continua si el conjunto de posibles valores que puede tomar la variable es uno o varios intervalos de la recta real. También recordamos que las variables estadísticas continuas se representaban agrupadas en intervalos, y que asociamos probabilidad con frecuencias relativas. Si se tiene un número suficientemente grande de datos, y representamos el histograma de frecuencias relativas (percentage) con las clases cada vez más finas, se obtendría el perfil de una curva que es representativa de la distribución de las frecuencias de dicha variable. Esta curva será siempre positiva (las frecuencias relativas lo son) y encierra debajo de ella la suma de todas las frecuencias relativas (). Esta idea nos permite caracterizar la distribución de probabilidad de las v.a. continuas mediante una función que denominaremos función de densidad. 4 Histogram.4 Density Trace percentage 3 49 59 69 79 89 99 9 Peso density.3.. 5 6 7 8 9 PESO GM3 percentage 5 4 3 Histogram 6 7 8 9 Estatura density.6.5.4.3.. Density Trace 6 65 7 75 8 85 9 ESTATURA GM3 4
Definición. Llamamos función de densidad a toda función f: R R que verifica: f ( ),. +. f () t dt = Toda función de densidad determina la distribución de probabilidad de una v.a. continua de la siguiente forma: P a< X < b = f t dt a b.. ( ) ( ),, b a. P( X = ) = f ( t) dt =,. 3. Entonces P( a< X < b) = P( a X < b) = P( a X b) = P( a< X b ) Observación: Los valores eactos de las v.a. continuas tienen probabilidad. Sólo hay probabilidad no nula en intervalos. Ejemplos. Y: Estatura de una población percentage 5 4 3 Histogram 6 7 8 9 Estatura density.6.5.4.3.. Density Trace 6 65 7 75 8 85 9 ESTATURA GM3 5
Función de densidad: P(Y<6) P(7<Y<8) Y3: Tiempo máimo que he estado hablando por teléfono alguna vez percentage 4 3 Histogram 4 8 6 Duración llamadas (X.) density 8 6 4 Density Trace 3 6 9 5 8 Duración llamadas 6
Función de densidad y probabilidades: P(Y3>6) P(3<Y3<6) P(Y3<45) Y: error al redondear a un decimal. La variable puede tomar valores.5<<.5. Como la probabilidad es homogénea en todo el intervalo y fuera de él no hay probabilidad, la densidad será una función constante f()=k si.5<<.5, y será nula en el resto. Para hallar el valor de k, utilizamos la propiedad + de que f () t dt = : + +.5 f( t) dt = kdt = k. = k = Por tanto:.5 si. 5 < <. 5 f( ) = resto 7
Para calcular probabilidades:.5 P( Y < ) = f ( t) dt = dt + dt =.5 =.5 +... 5 ( ) PY ( <.) = P(.< Y <.) = dt=. (.) =. 3.5.- Función de distribución de una variable aleatoria. Para tener una función representativa válida para todo tipo de v.a., se define la función de distribución. Definición. Dada una variable aleatoria X, definimos la función de distribución asociada a X a una función F: R R. definida como F ( ) = P( X ) Observación: La función de distribución de una v.a. viene a ser como la distribución de frecuencias relativas acumuladas de una variable estadística. Ejemplos: Número de llamadas diarias que se hacen por teléfono móvil Si consideramos la v.a. X: Número de llamadas diarias que hacen por teléfono móvil los estudiantes del GM3 (curso /5), podríamos tomar como 8
Distribución de probabilidad P(X = )=.377 P(X = )=.359 P(X = )=.795 P(X = 3)=.6 P(X = 4)=.56 P(X = 5)=.56 5 n= P( X = n) = Función de distribución si < si < si <, P( X= ).377si < si <, P( X= ) + P( X= ).6667s i < F () = PX ( ) = si < 3, P( X= ) +... + P( X= ) =.846 si < 3 si 3 < 4, P( X= ) +... + P( X= 3).9487 si 3 < 4 si 4 < 5, P( X= ) +... + P( X= 4).9744 si 4 < 5 si 5, P( X= ) +... + P( X= 5) si 5 Representaciones gráficas Histograma de frecuencias relativas acumuladas Función de distribución percentage 8 6 4-3 4 5 6 Llamadas diarias Frecuencias relativas acumuladas Función de distribución Función de distribución de una v.a. discreta. La función de distribución de una v.a. discreta es una función escalonada con saltos en los puntos de masa. 9
Cálculo de probabilidades a partir de la función de distribución de una v.a. discreta: Idea: hay probabilidad en aquellos puntos en los que hay salto, y la probabilidad es precisamente la magnitud del salto. Formalmente, si denotamos F ( ) lim F( ) P( X ) siguientes igualdades:. ( = ) = ( ) ( ) P X a F a F a. o = = <, entonces se cumplen las. P( a< X b) = F( b) F( a), a, b. 3. P( a X b) F( b) F( a ), a, b =. P a< X < b = F b F a a b. 4. ( ) ( ) ( ),, P a X < b = F b F a a b. 5. ( ) ( ) ( ),, o Ejemplo: Si X es una v.a. con función de distribución si <.3 si <.7 si <.5 F( ) =.8 si.5 < 3.95 si 3 < 4 si 4 de probabilidad y las siguientes probabilidades P(X<), P( X<4)., hallar su distribución Hay probabilidad en los puntos donde hay salto :,,.5, 3 y 4. Sus probabilidades son la magnitud del salto : P(X=)=.3=.3 P(X=)=.7.3=.4 P(X=.5)=.8.7=. P(X=3)=.95.8=.5 P(X=4)=.95=.5 Para hallar P(X<), P( X<4), lo más sencillo es ver qué puntos con probabilidad cumplen la condición dada: P(X<)=P(X=)+P(X=)=.3+.4=.7 P( X<4)=P(X=)+P(X=.5)+P(X=3)=.4+.+.5=.55 Función de distribución de una v.a. continua. Ejemplo: Sea Y: error al redondear a un decimal. La función de densidad es si. 5 < <. 5 f( ) =. resto
Por definición, su función de distribución es F( ) = P( X ). Al ser una v.a. continua, las probabilidades se calculan a partir de la función de densidad: F = P X = f t dt. ( ) ( ) () Como f() está definida a trozos, las probabilidades serán diferentes según el intervalo en donde se encuentre : si.5 : dt.5 F( ) = f ( t) dt = si.5 < <.5: dt dt +.5.5. 5 si.5: dt + dt+ dt.5.5 si.5, F( ) = ( +.5) si.5 < <.5 si.5 Observamos que F() es una función continua, y que es una primitiva de la función de densidad, F ( ) = f ( ) (recuérdese el Teorema Fundamental del Cálculo). Estas propiedades son generalizables para cualquier v.a. continua. Si X es una v.a. continua con función de densidad f(), y F() es la función de distribución de X, se verifica: Ejemplos: ( ) ( ), F = f t dt F es una función continua. F ( ) = f ( ), en aquellos puntos en donde f() es continua. b ( ) ( ) ( ) P a< X < b = f( ) d= F b F a, a, b a Y3: tiempo máimo que he estado hablando por teléfono La función de densidad es.4 f( ) = (.4) e si ; por tanto: si <, dt si < F( ) = f ( t) dt = =.4.4t, + (.4) si.4 e ( + 5) si dt te dt Es una función continua, pues es continua en ambos tramos y éstos coinciden en =. Además, es fácil comprobar que F ()=f().
Histograma de frecuencias relativas acumuladas Función de distribución Histogram percentage 8 6 4 4 8 6 Duración llamadas Para hallar probabilidades a partir de la función de distribución: P(3<Y3<6) = F(6) F(3) =.354 P(Y3<45) = F(45) F() = F(45) = F(45) =.537 P(Y3 6) = F(+ ) F(6) = F(6) =.384 Observación: En las v.a. continuas no influye que sea > ó, pues en un punto aislado la probabilidad siempre es. Cálculo de la función de densidad a partir de la función de distribución. Las anteriores propiedades, en particular el que F ()=f(), nos permite calcular la función de densidad de una v.a. continua a partir de su función de distribución. si < Por ejemplo, si F( ) =, es la función de distribución de una v.a., su función e si si < de densidad es f( ) = F ( ) =. e si Propiedades de las funciones de distribución (en general). F ( ) = y F ( + ) =.. F es monótona no decreciente. 3. F es continua por la derecha. Teorema. Una función F: R R es función de distribución de una variable aleatoria X si y solo si F cumple las tres propiedades anteriores.
Ejemplo: De las funciones representadas gráficamente a continuación, la de la derecha no es función de distribución pues no es monótona (entre y 3 es mayor que, y luego decrece para valer del 3 en adelante). Las otras dos sí son funciones de distribución, la de la izquierda de una v.a. continua (pues continua) y la del centro de una v.a. discreta (escalonada). 3.6.- Transformaciones de variables aleatorias. Dada X una v.a., nos interesa estudiar Y = g(x) y obtener su distribución de probabilidad en el caso de que Y sea una v.a. si X es discreta, Y es discreta. si X es continua, Y puede ser discreta o continua, dependiendo de quién sea g. El método general se basa en PY ( = y) = P( X= g ( y ) ) o bien ( ) = ( ( )) PY B P X g B. si Y es discreta hallaremos su distribución de probabilidad y si Y es continua conviene trabajar con la función de distribución. Ejemplos: Problemas 6 d) y 7. 3.7.- Independencia de variables aleatorias. Dos v.a. X e Y son independientes si el conocimiento de una de ellas no aporta información respecto de los valores de la otra. 3
La formalización de esta idea para v.a. se escapa de las posibilidades de este curso. Sí se utilizará la propiedad de que, cuando hay independencia, la probabilidad de la intersección es el producto de las probabilidades. 3.8.- Esperanza y varianza de funciones de variables aleatorias. Las medidas de posición, dispersión y asimetría que se estudiaron para variables estadísticas se pueden definir también de forma análoga para v.a. Medidas de posición Medida de posición frecuencia relativa probabilidad densidad Variable estadística V.a. discreta V.a. continua Media o esperanza X = = n k i i I j= j n j n μ = E( X) = ipi μ = E [ X] = ( ) i I f d Propiedades de la media / esperanza Mediana Cuantiles de orden α ax + b = ax + b ax + + ax = ax + + a X n n n n Es un valor tal que, ordenados en magnitud los datos, el 5% es menor que él y el 5% mayor. Es un valor tal que, ordenados en magnitud los datos, el α% es menor que él y el resto mayor. E[ ax + b] = ae[ X] + b [ ] E a X + + a X = a E[ X ] + + a E[ X ]. n n n n P( X < Me) y P( X > Me ) Conocida la función de distribución F, buscamos Me tal que: v.a. discretas F( Me ) y F( Me) ( ) α ( ) α v.a. continuas F( Me ) =, P X < y P X > α Conocida la función de distribución F, buscamos α tal que: v.a. discretas F( ) α y F( ) α α α α v.a. continuas F( α ) = α Ejemplos: Hallar media, mediana y los cuartiles de: Y: error al redondear a un decimal. Recordamos que la función de densidad es f()= si.5<<.5, y su función de distribución si.5, F( ) = ( +.5) si.5 < <.5. si.5 4
.5 E( X) = f( ) d= d = =. 5.5. 5 Para hallar la mediana, igual que en descriptiva mirábamos las frecuencias relativas acumuladas, ahora observamos los valores de la función de distribución; en concreto buscamos cuándo toma el valor.5. En este caso, buscamos el valor Me tal que: F(Me)=.5 (Me +.5)=.5 Me=. Para los cuarteles, buscamos: Q : F(Q )=.5 (Q +.5)=.5 Q =-.5 Q 3 : F(Q 3 )=.75 (Q 3 +.5)=.75 Q 3 =.5. (Si no se conoce la función de distribución, también se pueden hallar resolviendo las ecuaciones: Me Análogamente se resolverían: Me.5 ( ) f ( ) d =.5 d =.5 Me +.5 =.5 Me = Q Q3 f( ) d=.5; f( ) d =.75.) X: número de caras al lanzar 3 monedas Recordamos su distribución de probabilidad y función de distribución: Distribución de probabilidad P(X = ) = /8 P(X = ) = 3/8 P(X = ) = 3/8 P(X = 3) = /8 Función de distribución si < si < /8 si <.5 si < F () = 4/8 si < =.5 si < 7/8 si < 3.875 si < 3 si 3 si 3 Tenemos: 3 3 EX ( ) = PX ( = ) + PX ( = ) + PX ( = ) + 3 PX ( = 3) = + + 3 = =.5 8 8 8 8 En el caso discreto, para hallar la mediana buscamos Me tal que: F( Me ) y F( Me) En este caso, como F()=.5 si <, cualquier valor del intervalo [,) verifica la propiedad de la mediana. En estos casos, tomaremos como valor de la mediana el punto medio de dicho intervalo, Me=.5. Q =: Si buscamos F()=.5, coincide con el salto en =; esto es equivalente a verificar: F( - )=.5.5 y F()=.5.5. Q 3 =: Si buscamos F()=.75, coincide con el salto en = ; esto es equivalente a verificar: F( - )=.5.75 y F()=.875.75. 5
Interpretación de las medidas de posición de una v.a.: Y3: Tiempo máimo que he estado hablando por teléfono Hacemos los siguientes cálculos con DERIVE: Si la media es 5, quiere decir que tiempo medio que, como máimo, ha estado un estudiante hablando por teléfono es de 5 minutos. Para los cuantiles, la interpretación se hace en términos de probabilidad: si la mediana es 4.96, se puede decir que: o la probabilidad de que el tiempo máimo de una llamada sea menor que 4.96 minutos es del 5%; o la probabilidad de que el tiempo máimo de una llamada sea mayor que 4.96 minutos es del 5%; o (redondeando) la probabilidad de que la máima duración de una llamada sea mayor de 4 minutos es de más del 5%. si el primer cuartil es 4.3, se puede decir que: o la probabilidad de que el tiempo máimo de una llamada sea menor que 4.3 minutos es del 5%; o la probabilidad de que el tiempo máimo de una llamada sea mayor que 4.3 minutos es del 75%; o (redondeando) que la probabilidad de que el tiempo máimo de una llamada sea menor de 5 minutos es mayor del 5%. si el tercer cuartil es 67.3, se puede decir que: o la probabilidad de que el tiempo máimo de una llamada sea menor que 67.3 minutos es del 75%; o la probabilidad de que el tiempo máimo de una llamada sea mayor que 67.3 minutos es del 5%; o (redondeando) que la probabilidad de que el tiempo máimo de una llamada sea mayor que hora, es de más del 5%. Teorema Sea X una variable aleatoria cualquiera y sea Y = g(x) una transformación de X tal que Y es una variable aleatoria. Entonces, g ( i) pi si Xes discreta E[ g( X) ] = i= gf ( ) ( d ) si Xes continua Ejemplos: Problemas 6 d) y 7. 6
Definiciones. Dada una v.a. X llamamos momento respecto al origen de orden k a k αk = E X, k =,,.... Dada una v.a. X con esperanza μ, llamamos momento respecto a la media de orden k a k ( μ),,,... μk = E X k = La utilidad de los momentos de una variable aleatoria se verá más adelante en el tema de estimación puntual. Medidas de dispersión Medida de dispersión Varianza Variable estadística V.a. discreta V.a. continua V(X) = ( ) n ( ) = σ = ( μ) V X E X i i X n = k ( j μ) p j = ( μ) j= f ( ) d Propiedades de la varianza V ( X). V( X) = i X n i I V ( ax + b) = a V ( X ) V ( X + Y) = V ( X) + V( Y) + Cov( X, Y) V ( X). V ( X) = E X E[ X] V ( ax + b) = a V ( X ) ( ) Si X e Y son independientes: V X + Y = V X + V Y ( ) ( ) ( ) Desviación típica ( ) dt = V X σ = V ( X) Coeficiente de variación de Pearson Ejemplos: CV = dt V( X) CV = = X E[ X] σ μ Hallar varianza, desviación típica y coeficiente de variación de: ) X: número de caras al lanzar 3 monedas Recordamos su distribución de probabilidad: P(X=)=P(X=3)=/8; P(X=)=P(X=)=3/8; y que la esperanza es E(X)=.5. ( ) ( ) V( X) = EX ( ) EX ( ) = PX ( = ) + PX ( = ) + PX ( = ) + 3 PX ( = 3).5 = 3 3 = + + ( ) = 8 8 8 3.5.75 7
Por tanto: V(X)=.75; σ = V ( X) =.866 ; CV=.866/.5=.58 (58%) ) Y: error al redondear a un decimal. Recordamos que la función de densidad es f()= si.5<<.5, y su función de distribución si.5, F( ) = ( +.5) si.5 < <.5. si.5 3.5 V X = EX ( ) EX ( ) = f( d ) = d= =.83333.5 3 ( ) ( ) σ = V ( X) =.9 ; En este caso, como E(Y)=, no tiene sentido hallar el coeficiente de variación..5.5 3) Y3: tiempo máimo que he estado hablando por teléfono Teniendo que la densidad es.4 f( ) = (.4) e si >, calculamos V(Y3): Por tanto, V(Y3)=5; σ = 5 =35.35 minutos; CV= 35.35/5=.7 (7%) Interpretación gráfica de la media y la desviación típica 8
,4,3,, Medias iguales y distinta desviación típica - -6-6 Medias distintas e igual desviación típica 3 Medidas de asimetría Medida de asimetría Coeficiente de asimetría de Pearson Variable estadística 3( X Me) CAP = dt Variable aleatoria ( μ ) 3 Me P = σ Coeficiente de asimetría de Fisher Interpretación CAF = n n 3 ( i X) E ( X μ ) 3 μ i= 3 F = = 3 3 3 ( dt) CAP > ó CAF > : asimétrica a la derecha CAP < ó CAF < : asimétrica a la izquierda CAP = ó CAF = : simétrica σ σ P > ó F > : asimétrica a la derecha P < ó F < : asimétrica a la izquierda P = ó F = : simétrica 9
Ejemplos: ) X: número de caras al lanzar 3 monedas Gráficamente se ve que la distribución es simétrica. También se comprueba con los coeficientes: CAP= pues E(X)=Me=.5. Además, también CAF=, pues: 3 3 3 3 3 ((.5) ) ((.5) ( ) (.5) ( ) (.5) ( ) (3.5) ( 3) ) E X = PX= + PX= + PX= + PX= = 3 3 = + + + = 8 8 8 8 3 3 3 3 (.5) (.5) (.5) (.5) ) Y: error al redondear a un decimal. Gráficamente se ve que la distribución es simétrica. También se comprueba con los coeficientes: CAP= pues E(X)=Me=. Además, también CAF=, pues: 4.5 3 3 3 3 E( ( X ) ) E( X ) = = f( ) d= d = =.5 4.5.5 3) Y3: tiempo máimo que he estado hablando por teléfono Observando la gráfica de la función de densidad se observa una clara asimetría a la derecha. Esto se corrobora calculando los coeficientes, que en ambos casos tienen valores positivos. CAP= 3(5-4.95)/(35.35)=.68 > Teniendo que la densidad es.4 f( ) = (.4) e si >, el coeficiente de asimetría de Fisher, CAF, viene dado por: