Universidad de la República Facultad de Ingeniería PROBABILIDAD Y ESTADÍSTICA Curso 2018 - Primer Semestre Práctico 2: Definición axiomática y probabilidad condicional Ejercicio 1 Un dado cargado Si un dado está cargado de modo tal que P ({i}) = αi, i = 1, 2,..., 6. 1. Determinar el valor de α 2. Cuál es la probabilidad de sacar 5? 3. Cuál es la probabilidad de sacar par? Ejercicio 2 Propiedades de la probabilidad Sea (Ω, P) un espacio de probabilidad, A y B sucesos. Demostrar que: 1. Si A B entonces P (B \ A) = P (B) P (A). Deducir que P (A) P (B). 2. P (A B) max{p (A), P (B)} y P (A B) min{p (A), P (B)}. 3. Si A, B y C son sucesos entonces se cumple que: P (A B C) = P (A) + P (B) + P (C) P (A B) P (A C) P (B C) + P (A B C). 4. Si A 1,..., A n son sucesos probar que: ( n ) P A i = P (A i ). i=1 1 i n 1 i<j n Ejercicio 3 Cálculos a partir de los axiomas Sean (Ω, P) un espacio de probabilidad, A y B sucesos. P (A i A j ) + + ( 1) n 1 P (A 1... A n ) 1. Si A y B son tales que P (A) = 1/3 y P (B) = 1/2. Determinar el valor de P (A c B) en los siguientes casos: (a) A y B incompatibles (A B = ). (b) A B. (c) P (A B) = 1/8. 2. Si A y B son tales que P (A) = 3/8, P (B) = 1/2, P (A B) = 1/4. Calcular: (a) P (A c ) y P (B c ). (b) P (A B). (c) P (A c B c ). (d) P (A c B) y P (A B c ). Ejercicio 4 Sobre la definición de probabilidad condicional Sea (Ω, P) un espacio de probabilidad, A y B sucesos. 1. Calcular P (A B) en los siguientes casos: (a) B A (b) A B = (c) Qué pasa si P (B) = 0? 2. Supongamos que P (A) = 1 2, P (B) = 1 3 y P (A B) = 1 4. Calcular: 1
(a) P (A B) (b) P (B A) (c) P (A c B) (d) P (B c A) (e) P (A c B c ) (f) P (B c A c ) 3. Sean A y B sucesos tales que P (A) = 1 4 y P (A B) = 1 3. Calcular P (B) en los siguientes casos: (a) Si A y B son independientes (b) Si A y B son disjuntos (o incompatibles) (c) Si A es un subconjunto de B Ejercicio 5 Usando una tabla de contingencia Los empleados de una compañía se encuentran separados en tres divisiones: administración, operación de planta y ventas. La siguiente tabla indica el número de empleados en cada división clasificados por género: 1. Son O y M incompatibles? Mujer (M) Hombre (H) Totales Administración (A) 20 30 50 Operación de planta (O) 60 140 200 Ventas (V) 100 50 150 2. Si se elige aleatoriamente un empleado: Totales 180 220 400 (a) Hallar P (V M) y P (V H). Deducir P (V ) (b) Hallar P (M O), P (M A) y P (M V ). Deducir P (M) (c) Indicar si los sucesos V y H son independientes. Justifique su respuesta. (d) Indicar si los sucesos A y M son independientes. Justifique su respuesta. Ejercicio 6 Sobre la definición de independencia 1. En una caja se tienen 4 tickets con dos números cada uno (1,2) (1,3) (4,2) (4,3). Se elige un ticket al azar. Los dos números que aparecen en el ticket son dependientes o independientes? 2. Y si la caja contiene los tickets (1,2) (1,3) (1,3) (4,2) (4,2) (4,3)? 3. Completar los números de los tickets de la siguiente caja (1, ) (1,2) (1,2) (1,3) (3,1) (3,2) (3, ) (3, ) de modo que los números de un ticket elegido al azar sean independientes. Ejercicio 7 Independientes dos a dos, y de a tres? Se tira una moneda dos veces y se consideran los sucesos: A = {en la primera tirada sale cara}, B = {en la segunda tirada sale cara}, C = {en las dos tiradas salen un número y una cara, en cualquier orden}. Estudiar la independencia de a pares. Son A, B y C independientes? 2
Ejercicio 8 Cuál es el mejor fármaco? Un investigador quiere determinar las eficacias relativas de dos fármacos. Los resultados (diferenciando entre hombres y mujeres) fueron los siguientes: Hombres Mujeres Fármaco I Fármaco II Fármaco I Fármaco II Éxito 19 1000 200 10 Fracaso 1 1000 1800 190 1. Calcular la probabilidad de que el Fármaco I tenga éxito sabiendo que el paciente es hombre. Y sabiendo que el paciente es mujer? 2. Repetir los cálculos de la parte anterior para el Fármaco II. 3. Cuál es la probabilidad de elegir al azar una de las personas en tratamiento y que sea mujer? Y de que sea hombre? 4. Calcular la probabilidad de éxito de cada fármaco e indicar cuál de los dos considera más exitoso. Ejercicio 9 Bolillas y urnas 1. Se consideran tres cajas con bolillas: La caja 1 contiene 10 bolillas de las cuales 4 son rojas La caja 2 contiene 6 bolillas de las cuales 1 es roja La caja 3 contiene 8 bolillas de las cuales 3 son rojas Escogemos al azar una caja y luego sacamos una bolilla al azar Cuál es la probabilidad de que la bolilla sea roja? 2. Se considera una caja que contiene 6 bolillas rojas, 4 blancas y 5 azules. (a) Se extraen tres bolillas en forma sucesiva y sin reposición. Calcular la probabilidad que la primera sea roja, la segunda blanca y la tercera azul. Los resultados son independientes? (b) Repetir la parte anterior, suponiendo que las extracciones se realizan con reposición. 3. Se consideran dos cajas con bolas. La caja 1 contiene 3 bolas rojas y 2 azules, la caja 2 contiene 2 bolas rojas y 8 azules. Se lanza una moneda, si se obtiene cara se saca una bola de la caja 1, y si se obtiene cruz se saca una bola de la caja 2. (a) Hallar la probabilidad que la bola extraída sea roja. (b) Si se sabe que la bola extraída es roja, cuál es la probabilidad que provenga de la caja 1? 4. De una caja que contiene 3 bolas rojas y 2 azules se extrae una bola al azar y se la coloca en una segunda caja que contiene 4 bolas azules y 2 rojas. A continuación, se extrae una bola al azar de la segunda caja. (a) Cuál es la probabilidad de que se extraiga la misma bola que se extrajo de la primera caja? (b) Cuál es la probabilidad de que la bola extraída de la segunda caja sea roja? (c) Si la bola extraída de la segunda caja es roja, cuál es la probabilidad de que sea la misma bola que se extrajo de la primera caja? Ejercicio 10 Anticuerpos del virus del sida Una prueba para detectar la presencia de anticuerpos del virus del sida en la sangre tiene una probabilidad del 0.997 de detectarlos cuando éstos están presentes y una probabilidad de 0.003 de no detectarlos. Cuando los anticuerpos del virus del sida no están presentes, la probabilidad de que la prueba dé positivo (falso positivo) es de 0.015 y la probabilidad de que dé negativo es 0.9856. Se supone que el 1% de una gran población tiene anticuerpos del virus del sida en su sangre. 1. La información proporcionada incluye cuatro probabilidades condicionales y una probabilidad no condicionada. Asignar letras a los sucesos y expresar la información como P (A), P (B A) y así sucesivamente. Utilizar esta notación en lo que resta del ejercicio. 3
2. Cuál es la probabilidad de que la persona escogida no tenga anticuerpos del virus del sida y sin embargo el resultado de la prueba sea positivo? 3. Cuál es la probabilidad de que la persona escogida tenga anticuerpos del virus del sida y el resultado de la prueba sea positivo? 4. Cuál es la probabilidad de que el resultado de la prueba sea positivo? 5. Hallar la probabilidad de que una persona de la población no tenga anticuerpos del virus del sida sabiendo que el resultado de la prueba fue positivo. 6. Supongamos ahora que la probabilidad de que una persona tenga anticuerpos del virus del sida en su sangre es p. Calcular la probabilidad de que la persona tenga dichos anticuerpos sabiendo que el resultado de la prueba fue positivo (en función de p). Cuánto tiene que valer p para que dicha probabilidad sea mayor que 0.5? Y mayor que 0.9? Ejercicio 11 Sobre los falsos positivos Se estima que en Uruguay hay 40.000 personas celíacas. Se asume que la población del Uruguay es de 3.400.000 habitantes. 1. Un primer indicio de la enfermedad celíaca es la presencia de un número elevado de anticuerpos IgA endomysial en una muestra de sangre. Se sabe que para dicho examen de sangre: la probabilidad de que el examen sea positivo dado que la persona es celíaca es de 0.92 (se denomina sensibilidad del examen). la probabilidad de que el examen sea negativo dado que la persona no es celíaca es de 0.985 (se denomina especificidad del examen) Calcular las siguientes probabilidades: (a) Probabilidad de que el examen sea positivo dado que la persona no es celíaca. (b) Probabilidad de que el examen sea negativo dado que la persona es celíaca. (c) Probabilidad de que el examen sea positivo. Idem para examen negativo. (d) Probabilidad de que la persona sea celíaca dado que el examen es positivo. 2. Otra posibilidad para detectar la enfermedad celíaca en una muestra de sangre es la presencia de anticuerpos IgA tissue transglutaminase. En la tabla siguiente se muestran los resultados obtenidos para una muestra aleatoria de mil personas: Examen Positivo Examen Negativo Celíaco 11 1 No Celíaco 40 948 Calcular la sensibilidad y especificidad de este examen. Ejercicio 12 Sorteo arreglado? El resultado del sorteo por los cuartos de final de la Champions League del año 2013 fue: Málaga - Borussia Dortmund Real Madrid - Galatasaray Paris Saint Germain - Barcelona Bayern Munich - Juventus Se puede ver que en estos cruces los 4 equipos grandes (Real Madrid, Barcelona, Bayern Munich y Borussia Dortmund) no compiten entre ellos, lo que resulta sin dudas en semifinales y final con mayor atractivo. Muchos comentaristas deportivos en su momento dudaron de la legitimidad del sorteo, suponiendo que el mismo fue irregular (esto es, que el resultado no fue fruto meramente del azar). En lo que sigue se plantea un modelo bayesiano para analizar la legitimidad del sorteo. Supongamos que en el bolillero hay 4 bolillas marcadas (que corresponden a los 4 equipos grandes) y 4 sin marcar (que corresponden a los otros 4 equipos). Lo único que nos interesa aquí es que los 4 equipos no se crucen entre ellos. Se saca una bolilla y luego otra y eso marca uno de los cruces. Así con los cuatro cruces. Por lo tanto queremos que las bolillas marcadas y sin marcar se alternen. 4
1. Suponiendo que el sorteo es legítimo, probar que la probabilidad de que los 4 equipos grandes no se cruces es igual a 8/35. Interpetar este resultado en términos de frecuencias. 2. Se consideran los siguientes sucesos: L = {el sorteo fue legítimo} y E = {los cuatro grandes se evitan}. (a) Probar que: P (L E) P (L c E) = P (L) P (L c ) P (E L) P (E L c ). (b) Supongamos que tenemos una creencia a priori que nos indica que la probabilidad de que el sorteo haya sido arreglado es p, esto es P (L c ) = p. Probar que P (L E) = 1 35p/8 1 p + 35p/8. Esta probabilidad se conoce como probabilidad a posteriori. i. Graficar la probabilidad hallada en función de p. ii. Cuál sería la probabilidad a posteriori si p = 0.2? iii. Cuál es la mínimo valor de p para el cuál se verifica que la probabilidad a posteriori es menor a 0.5? Ejercicio 13 Culpable? Problema divertido Se ha cometido un asesinato. El asesino es con seguridad una de las dos personas X e Y. Ambas personas están prófugas de la justicia, y luego de una investigación inicial, ambos fugitivos son igualmente probables de ser el asesino. Al avanzar la investigación se revela que el asesino del crimen tiene sangre tipo A. Diez por ciento de la población tiene sangre tipo A. Una investigación suplementaria revela que la persona X tiene sangre tipo A, pero no ofrece información alguna sobre el tipo de sangre de la persona Y. Cuál es la probabilidad de que la persona X sea el asesino? Ejercicios suplementarios Se sugiere hacer los siguientes ejercicios (con solución) del Capítulo 1 del libro Probabilidad y Estadística, Serie Schaum, Segunda Edición (2003) de Spiegel-Schiller-Srinivasan: del 1.8 al 1.17. 5
Preguntas Conceptuales 1. Dos extracciones se harán al azar y con reposición de la urna 1, 1, 2, 2, 3 (a) Si la primera extracción es 1, qué chances hay de sacar 2 en la segunda? (b) Si la primera extracción es 2, qué chances hay de sacar 2 en la segunda? (c) Cambian las chances si se extrae sin reposición? 2. Si A y B son sucesos independientes y B y C también son sucesos independientes. Puede afirmarse que A y C son independientes? En caso afirmativo demostrarlo, en caso contrario dar un contraejemplo. 3. Indicar si la siguiente afirmación es verdadera o falsa: A es independiente de A si y sólo si P (A) = 0 ó P (A) = 1. 4. Dados A y B sucesos no nulos, se cumple que P (A B c ) = 1 P (A B). Verdadero o Falso? Probar o dar un contraejemplo 5. En una caja se tienen 4 bolillas numeradas del 1 al 4. Se sacan dos bolillas al azar y con reposición. Luego de que se sacan las dos bolillas, se pierde la primera y nadie recuerda cuál había salido. Pregunta: los resultados de la primer y segunda extracción son independientes? Verdadero o falso? Explicar. 6. Para alentar la promisoria carrera de tennis de Pablito, su padre le ofrece un premio si gana al menos dos sets seguidos en una serie de tres sets a ser jugados con su padre y con el campeón del club alternadamente. Entonces la serie puede ser: Padre-Campeón- Padre o Campeón-Padre-Campeón. Pablito puede elegir cuál serie jugar. Sabiendo que el campeón del club es mejor jugador que el padre, cuál de las dos series deberá elegir? Justifique su respuesta. 7. La probabilidad de un evento A es 1/2. La probabilidad de un evento B es 1/3. Indicar para cada una de las siguientes afirmaciones son verdaderas o falsas. Explicar. La probabilidad de que ocurran A y B debe ser 1/2 1/3 = 1/6. Si A y B son independientes, la probabilidad de que ambos ocurran debe ser 1/2 1/3 = 1/6. Si A y B son incompatibles, la probabilidad de que ambos ocurran debe ser 1/2 1/3 = 1/6. La probabilidad de que al menos uno de los dos ocurra debe ser 1/2 + 1/3 = 5/6. Si A y B son independientes, la probabilidad de que al menos uno de los dos ocurra debe ser 1/2 + 1/3 = 5/6. Si A y B son incompatibles, la probabilidad de que al menos uno de los dos ocurra debe ser 1/2 + 1/3 = 5/6. 8. Una moneda se tira 10 veces. Verdadero o falso? Explicar: (a) La probabilidad de obtener 10 caras seguidas es 1/1024. (b) Dado que las primeras 9 fueron cara, la probabilidad de obtener 10 caras sguidas es 1/2. 9. Una moneda equilibrada se tira cinco veces y hasta ahora todas las veces salió cara. Cuál de las siguientes afirmaciones es la correcta? (a) Es más probable que en la siguiente tirada salga número. (b) Es igual de probable que en la siguiente tirada salga cara o número. 6