Ejercicios de Modelos de Probabilidad Elisa M. Molanes-López, Depto. Estadística, UC3M Binomial, Geométrica, Exponencial, Uniforme y Normal Ejercicio 1. En un canal de comunicación la probabilidad de error en la transmisión de un bit es del,8 %. Sabiendo que los bits se empaquetan en bloques de información y la transmisión de cada bit dentro del bloque es independiente del resto, se pide: a) Calcule la probabilidad de que se produzca algún error en la transmisión de un bloque formado por 1 bits. b) Calcule la probabilidad de que se produzcan menos de 15 errores en la transmisión de un bloque de 1 bits si sabemos que se observó algún error en la transmisión del bloque. Solución: Sabemos que Pr(E) =,8, donde E denota el suceso error en la transmisión de un bit. a) Sea X la v.a. que cuenta el número de bits de un bloque de 1 bits que se transmiten erróneamente. Se tiene entonces que X sigue un modelo Binomial con parámetros n = 1 y p =,8. Nos piden Pr(X 1). Por la propiedad del suceso contrario y usando la función de probabilidad del modelo binomial se concluye que: ( ) 1 Pr(X 1) = 1 Pr(X = ) = 1 (,8) (1,8) 1 = 1,325 =,9997. b) Nos piden la probabilidad condicionada siguiente Pr(X < 15 X 1). Se verifica que Además, Pr(X < 15 X 1) = Pr(1 X < 15) Pr(X 1) Pr(1 X 14) = Pr(,5 N(µ, σ) 14,5) (,5 µ = Pr σ = Pr(1 X 14).,9997 N(, 1) 14,5 µ σ donde estamos utilizando el hecho de que X al ser Binomial con n = 1 > 3 y npq = 1,8,992 = 7,936 > 5 se puede aproximar por un modelo Normal con media µ = E[X] = np = 1,8 = 8 y varianza σ 2 = V ar[x] = npq = 7,936. En consecuencia se tiene que, Pr(1 X 14) = Pr ( 2,66 N(, 1) 2,31) = F N(,1) (2,31) F N(,1) ( 2,66) ), =,9896 (1 F N(,1) (2,66)) =,9896 1 +,9961 =,9857 = 98,57 %. De modo que Pr(X < 15 X 1) =,9857,9997 =,986. 1
Ejercicio 2. Sea T la variable aleatoria horas que un operario necesita para realizar una actividad específica en una cadena de producción, que sigue un modelo exponencial con función de densidad dada por f(t) = 1,5 exp( 1,5t), t (, ). a) Suponiendo que el operario repite dicha actividad de forma independiente, determine el número medio de veces que consigue realizar dicha actividad en 2 horas y la probabilidad de que en 2 horas consiga realizarla al menos 1 vez. b) Calcule la función de distribución de T y el tiempo t que necesita invertir en dicha actividad si sólo el 1 % de las veces que realiza dicha actividad necesita invertir más tiempo. c) Calcule la probabilidad de que el tiempo empleado en realizar dicha actividad no supere la hora y media. d) Suponiendo que los operarios trabajan de forma independiente unos de otros, cuál es la probabilidad de que exactamente 2 de 1 operarios, inviertan más de hora y media en realizar la actividad en cuestión? Solución: a) Sea X la v.a. que cuenta el número de veces que un operario consigue realizar dicha actividad en 1 hora, y sea Y la v.a. que cuenta el número de veces que un operario consigue realizar dicha actividad en 2 horas. Se sabe que X se distribuye según una Poisson con parámetro λ 1 = 1,5 actividades/h. Por la reproductividad de la Poisson, entonces Y sigue un modelo de Poisson con parámetro λ 2 = 2λ 1 = 3 actividades cada 2 horas. Dado que en un modelo de Poisson su parámetro coincide con su media, se tiene que E[Y ] = 3. Por otra parte, nos piden Pr(Y 1). Por la propiedad del suceso contrario y la función de probabilidad de una Poisson se concluye que: Pr(Y 1) = 1 Pr(Y < 1) = 1 Pr(Y = ) = 1 exp( λ)λ! b) Calculemos la distribución del tiempo exponencial T. F T (t) = t f T (y)dy = t = exp( 15y)] y=t y= = 1 e 3 =,952 = 95,2 %. 1,5 exp( 1,5y)dy = exp( 1,5t) + exp() = 1 exp( 1,5t), t >. Por otra parte, también nos piden el tiempo en horas t que verifica que F T (t ) = Pr(T t ) =,9 (equivalentemente, se tiene que Pr(T > t ) =,1). De modo que, despejando t en 1 exp( 1,5t ) =,9, se obtiene que: exp( 1,5t ) =,1 1,5t = ln(,1) t = ln(,1) 1,5 = 1,5351 horas. 2
c) Nos piden Pr(T 1,5), es decir, F T (1,5). Utilizando el apartado b) se obtiene que Pr(T 1,5) = 1 exp( 1,5 1,5) =,8946 = 89,46 %. d) Sea Z la v.a. que cuenta el número de operarios, de un total de 1, que invierten más de 1,5 horas en realizar dicha actividad individualmente. Nos piden, Pr(Z = 2), donde Z sigue un modelo Binomial con parámetros n = 1 (los diez operarios) y p = Pr(T > 1,5) = 1,8946 =,154, la probabilidad de que un operario en concreto necesite más de hora y media para realizar dicha actividad. Entonces, se tiene que: Pr(Z = 2) = ( 1 2 ) (,154) 2 (1,154) 8 =,251 = 2,51 %. Ejercicio 3. La v.a. T representa el tiempo en horas de las conexiones que un empleado realiza a lo largo de una jornada laboral desde su puesto de trabajo a dominios de la red que no están relacionados directamente con su trabajo, y tiene como función de densidad la función f T (t) = 3 exp( 3t), si t >. Si un empleado es pillado, según la política de la empresa se le sanciona con una cantidad que asciende a Z = exp(t ) euros. Con estos datos, se pide: a) Determine la densidad de la v.a. Z. b) Calcule la probabilidad de que un sancionado tenga que pagar menos de 5 euros. c) Cuál es la probabilidad de que un empleado se encuentre más de media hora conectado a la red sin trabajar? d) Para evitar que los empleados se dediquen a malgastar sus horas de trabajo, el director de la empresa decide controlar los accesos de 1 empleados elegidos al azar. Cuál es la probabilidad de que exactamente 7 de ellos dediquen más de media hora al día a estar conectados a la red sin trabajar? Solución: a) Sea T las horas que dedica al ocio un empleado durante una jornada laboral, y sea Z la sanción en euros que debe pagar dicho empleado si es pillado, v.a. que viene dada como una transformación de la v.a. T de partida según la expresión Z = exp(t ). Entonces se tiene que, z(t) = exp(t), t(z) = ln(z) y dt(z) dz = 1 z. Además, dado que T toma valores en (, ) se tiene que Z toma valores entre exp() = 1 y exp( ) =, es decir Z toma valores en (1, ). Dado que la transformación exponencial es derivable en inyectiva en (, ), sabemos que la función de densidad de Z viene dada por f Z (z) = f T (t(z)) dt(z) dz = 3 exp( 3 ln(z)) 1 z = 3(exp(ln(z))) 3 z 1 = 3z 4, z (1, ). b) Nos piden Pr(Z < 5 euros). Dado que Z es v.a. continua de la cual sabemos su densidad (por el apartado anterior), se tiene que: Pr(Z < 5) = 5 1 f Z (z)dz = 5 1 3 z 4 dz = z 3] z=5 z=1 = (5) 3 + (1) 3 = 1 1 5 3 =,992. 3
c) Nos piden Pr(T >,5) = 1 Pr(T,5). Dado que T es v.a. continua con densidad dada por f T se tiene que: Pr(T,5) = =,5,5 f T (t)dt 3 exp( 3t)dt = exp( 3t)] t=,5 t= = exp( 3/2) + 1 =,7769. Por lo tanto, la probabilidad pedida es Pr(T >,5) = 1,7769 =,2231. d) Sea Y la v.a. que cuenta el número de empleados (de un total de n = 1) que dedican más de media hora al ocio (es decir, T >,5h) durante la jornada laboral. Se verifica que Y se distribuye según un modelo Binomial con parámetros n = 1 y p = Pr(T >,5) =,2231. Utilizando la función de probabilidad de este modelo, la probabilidad que nos piden Pr(Y = 7) viene dada por: ( ) 1 Pr(Y = 7) = (,2231) 7 (1,2231) 3 =,15 =,15 %. 7 Ejercicio 4. En unos grandes almacenes, el número X de devoluciones por hora que se producen en una determinada sección sigue una Poisson. Sin embargo, se sabe que de 1h a 16h el número medio de devoluciones a la hora es de 2 mientras que de 16h a 21h el número medio de devoluciones a la hora es de 4. Nótese que se supone que el establecimiento permanece abierto ininterrumpidamente desde las 1h a las 21h y que las devoluciones se producen de manera independiente a lo largo del día. a) Calcule la probabilidad de que no se produzca ninguna devolución de 1h a 11h. b) Calcule la probabilidad de que se produzcan no más de 3 devoluciones a lo largo de un día de trabajo. Solución: Denotemos por X 1 la v.a. que contabiliza el número de devoluciones por hora que se producen en una determinada hora en la franja de 1h a 16h y denotemos por X 2 la v.a. que contabiliza el número de devoluciones por hora que se producen en una determinada hora en la franja de 16h a 21h. Dado que en un modelo de Poisson, su media y su parámetro coinciden, se tiene que X 1 es Poisson con λ 1 = 2 y X 2 es Poisson con λ 2 = 4. a) Nos piden Pr(X 1 = ). Utilizando la función de probabilidad de una Poisson con parámetro 2, se concluye que. Pr(X 1 = ) = exp( λ)λk k! = e 2 2! = e 2 =,1353 = 13,53 %. b) Sea Y la v.a. que cuenta el número de devoluciones que se producen a lo largo de un día (es decir, de 1h a 21h, durante el horario de apertura de dicho establecimiento). Por la propiedad de independencia y la reproductividad de la Poisson se sabe que Y sigue una Poisson con parámetro λ = 6 2 + 5 4 = 32, es decir, se producen por término medio 32 devoluciones al día. 4
Nos piden la probabilidad del suceso {Y 3}, es decir, Pr(Y 3). Para calcular este valor y dado que λ = 32, utilizaremos el hecho de que una v.a. de Poisson se puede aproximar por un modelo Normal cuando el parámetro λ > 5. En concreto, Y N(µ, σ) donde µ = E[Y ] = λ = 32 y σ = V ar(y ) = λ = 32. Utilizando el factor de correción de,5 unidades (dado que estamos aproximando un modelo discreto a través de un modelo continuo), y estandarizando para expresar el suceso de interés en términos de una Normal estándar (con media y desviación típica 1), se tiene que, Pr( Y 3) = Pr(,5 N(µ, σ) 3,5) ( ),5 32 3,5 32 = Pr N(, 1) 32 32 = Pr( 5,75 N(, 1),27) = Pr(N(, 1),27) P r(n(, 1) 5,75) = 1 Pr(N(, 1),27) (1 Pr(N(, 1) 5,75)) = 1,664 (1 1) =,3936 = 39,36 %. Ejercicio 5. Indique si las siguientes afirmaciones son verdaderas o falsas. Razone su respuesta. a) El siguiente código en MATLAB/Octave devuelve para a un valor muy cercano a cero: n=1; x=poissrnd(8,n,1); y=(x>4); a=sum(y)/n b) El siguiente código en MATLAB/Octave aproxima por simulación el valor de E[exp( X)], siendo X un modelo Uniforme en ( 1, 1): n=1; u=rand(n,1); x=2*u-1; mux=sum(x)/n; muy=exp(-mux) Solución: a) Esta afirmación es falsa. Este código aproxima Pr(X > 4), siendo X una Poisson de parámetro λ = 8. Se sabe que el valor teórico de esta probabilidad es igual a 1 Pr(X = ) Pr(X = 1) Pr(X = 2) Pr(X = 3) Pr(X = 4) =,94. b) Esta afirmación es falsa. Este código devuelve exp( E[X]) que no coincide con E[exp( X)]. Ejercicio 6. a) Complete el siguiente código en MATLAB/Octave para aproximar Pr(X >,1), donde X denota una v.a. continua con densidad f X (x) = 3x 2, si x (, 1). 5
n = 1; u = rand(n,1); x =... ; cond = (x... ); p = sum(cond)/n b) Indique la veracidad o falsedad de la siguiente afirmación y razone su respuesta. Solución: Sea X una v.a. que se distribuye según un modelo uniforme continuo en el intervalo (, 1) y sea Y = exp(x 2 ) una transformación de X, entonces Y es una v.a. continua con densidad dada por f Y (y) = (2y ln y) 1 si y (1, e). a) Dado que X tiene densidad dada por f X (x) = 3x 2, si x (, 1), entonces su función de distribución viene dada por: F X (x) = x f X (y)dy = x 3y 2 dy = x 3, x (, 1). Utilizando el método de la transformación inversa para generar valores de X, debemos resolver en x la ecuación F X (x) = u, donde u denota un número uniformemente distribuido entre (, 1). De modo que, x = u 1/3. Por lo tanto las dos lineas de código que faltan serían: x = u.^(1/3); cond = (x >.1); b) Esta afirmación es verdadera. Veámoslo a continuación. Dado que X se distribuye según un modelo uniforme continuo en (, 1) se tiene que f X (x) = 1, si x (, 1). Consideremos la transformación g(x) = exp(x 2 ). Se verifica que g(x) es derivable en (, 1) por tratarse de una composición de funciones derivables en (, 1) (la exponencial y la función cuadrática) e inyectiva en (, 1). De modo que la función de densidad de Y = g(x) viene dada por la expresión: f Y (y) = f X (x(y)) dx(y) dy, donde x(y) = ln(y), dx(y) dy =,5(ln(y)),5 y 1 y, dado que X toma valores entre y 1, la v.a. Y toma valores en el intervalo (g() = 1, g(1) = e). En conclusión se tiene que: f Y (y) = 1 2y ln(y), y (1, e). Ejercicio 7. Una empresa de telefonía móvil cobra a sus clientes,25 euros por cada minuto de conversación. Si X denota el tiempo (en minutos) que una persona invierte en cada llamada realizada desde su móvil, la compañía le cobrará lo mismo (1,25 euros) si habla 5 minutos que 4,15 minutos. Se sabe además que X se puede modelizar a través de una exponencial con media 125 segundos. 6
a) Considere la v.a. Y = [X] + 1, donde [x] denota la parte entera de x R. Compruebe que dicha variable sigue una distribución Geométrica e identifique su parámetro p. b) Escriba el coste en función de Y y determine el coste medio por llamada. c) Ante la queja de algunos clientes, el director de la compañía se plantea cobrar por el tiempo exacto X que dure la llamada. Con esta estrategia se pretende ser más justo, pero sin que eso conlleve el tener una ganancia media por llamada inferior a la de antes. Determine cuál debe ser el coste por minuto que el encargado deberá cobrar para que esto así suceda. d) Indique qué devuelve el siguiente código en MATLAB/Octave: n=1; lambda=.48; u=rand(n,1); t=-log(1-u)/lambda; prob=sum(<t & t<1)/n Solución: Se sabe que X sigue un modelo Exponencial con media E[X] = 125/6 min. De modo que su parámetro será: λ = 1 E[X] = 6/125 =,48 min 1. Además, se sabe que el coste es una v.a. discreta porque los valores que toma son {,25,,5,,75,...}, un conjunto infinito numerable. a) Dado que Y = [X] + 1, para comprobar que sigue un modelo Geométrico, lo primero que debemos hacer es comprobar que sus posibles valores coinciden con los de dicho modelo. En efecto así sucede puesto que cuando X (, 1) entonces Y = + 1 = 1, cuando X [1, 2) entonces Y = 1 + 1 = 2, y así sucesivamente. Por lo tanto se ve que Y toma valores en {1, 2, 3,...}. En segundo lugar debemos tratar de demostrar que la función de probabilidad de Y se puede escribir como la de un modelo Geométrico, es decir, que Pr(Y = k) = p(1 p) k 1, para un determinado p, con k {1, 2, 3,...}. En efecto, esto también se verifica porque cuando Y = k eso significa que X [k 1, k) y entonces se tiene que: Pr(Y = k) = k k 1 f(x)dx = k k 1 λ exp( λx)dx = exp( λx)] x=k x=k 1 = e,48(k 1) e,48k = e,48(k 1) (1 e,48 ) = (e,48 ) k 1 (1 e,48 ) = (1 e,48 ) (1 (1 e,48 )) k 1. De modo que denotando p = 1 e,48 =,3812 se puede concluir que Y sigue un modelo Geométrico con parámetro p =,3812. b) El coste C se puede escribir en función de Y como C =,25 Y. Además E[C] =,25E[Y ]. Como Y es Geométrica de parámetro p =,3812, sabemos que su media es E[Y ] = 1/p = 1/,3812. En consecuencia se concluye que: E[C] =,25E[Y ] =,25/,3812 =,6558 euros. 7
c) Debemos buscar la tarifa t de modo que el nuevo coste D sea tal que D = t X y E[D] E[C] =,6558. Sabiendo que E[X] = 125/6, se puede concluir que: E[D] = t 125/6,6558, lo que implica que t 6,6558/125 =,3148. Es decir, la tarifa actual debe ser t =,3148 euros/min, lo que significa que si una persona habla 4.15 minutos ahora se le cobrará por exactamente ese tiempo y el coste de su llamada será,3148 4,15 = 1,3645 1,31 euros. En cambio, si una persona habla exactamente 5 minutos ahora se le cobrará,3148 5 = 1,574 euros. Como vemos, con el nuevo sistema de tarifas, el coste es más justo, en el sentido de que se le cobra más a la persona que más habla. Sin embargo, con este nuevo sistema estas dos personas han salido perdiendo pues antes sólo se les cobraba 1.25 euros. Los usuarios que sí se beneficiarán de la nueva tarifa serán aquellos que hablen menos de,25/,3148 =,7942 min. d) Este código en MATLAB/Octave devuelve la probabilidad de que una llamada dure menos de 1 minuto (X < 1), lo cual coincide con la probabilidad de que Y = 1, es decir coincide con p =,3812. 8