PROBABILIDAD Y ESTADÍSTICA

Universidad de la República Facultad de Ingeniería PROBABILIDAD Y ESTADÍSTICA Curso 2018 - Primer Semestre Práctico 2: Definición axiomática y probabilidad condicional. SOLUCIÓN Ejercicio 1 Un dado cargado Solución de los Ejercicios Si un dado está cargado de modo tal que P ({i}) = αi, i = 1, 2,..., 6. 1. Como las probabilidades tienen que sumar 1, se obtiene que α = 1 21. 2. P ( Sacar 5 ) = α 5 = 5 21. 3. P ( Sacar par ) = α 2 + α 4 + α 6 = 4 7. Ejercicio 2 Propiedades de la probabilidad Sea (Ω, P) un espacio de probabilidad, A y B sucesos. 1. B\A = B A c, por lo tanto B = (A B) (B\A). Por ser unión disjunta de sucesos resulta que P (B) = P (B A) + P (B\A). Si usamos que A B, tenemos que B A = A y por lo tanto P (B\A) = P (B) P (A). Dado que P (B\A) 0, se deduce que P (B) P (A). 2. Hay ver que P(A B) es mayor a P(A) y a P(B). Para eso, notar que tanto A como B están incluidos en A B y usar la parte anterior. Idem para A B. 3. Considerando A B C como la unión de dos sucesos: A B y C, resulta que: P (A B C) = P (A B) + P (C) P ((A B) C) = P (A) + P (B) P (A B) + P (C) P ((A C) (B C)) = P (A) + P (B) P (A B) + P (C) (P (A C) + P (B C) P (A B C)) = P (A) + P (B) + P (C) P (A B) P (A C) P (B C) + P (A B C) 4. Se demuestra por inducción completa ( (el caso base ya está probado en la parte anterior). Luego, n n 1 ) se descompone la unión A i como A i A n donde la probabilidad del primer término se i=1 i=1 calcula usando la hipótesis de inducción y la de la intersección de ambos -previo uso de propiedad distributiva- también. Ejercicio 3 Cálculo a partir de los axiomas Sean (Ω, P) un espacio de probabilidad, A y B sucesos. 1. Si A y B son tales que P (A) = 1/3 y P (B) = 1/2. Determinar el valor de P (A c B) en los siguientes casos: (a) Si A y B son incompatibles (disjuntos), P(A c B) = 1 2. (b) Si A B, P(A c B) = P(B) P(A) = 1 6. (c) Si P (A B) = 1/8, P(A c B) = P(B) P(A B) = 3 8. 2. Si A y B son tales que P (A) = 3/8, P (B) = 1/2, P (A B) = 1/4. (a) P(A c ) = 5 8 y P(Bc ) = 1 2. (b) P(A B) = 5 8. (c) P(A c B c ) = 1 P(A B) = 3 8. (d) P(A c B) = 1 4 y P(A Bc ) = 1 8. 1

Ejercicio 4 Sobre la definición de probabilidad condicional 1. (a) P(A B) = P(A B) P(B) (b) P(A B) = P(A B) P(B) = P(B) P(B) = 1. = P( ) P(B) = 0. (c) Si P(B) = 0 no se puede calcular P(A B) usando la definición. 2. (a) P(A B) = 1/4 1/3 = 3 4. (b) P(B A) = 1/4 1/2 = 2 4 = 1 2. (c) P(A c B) = 1 P(A B) = 1 3 4 = 1 4. (d) P(B c A) = 1 P(B A) = 1 2 4 = 1 2. (e) P(A c B c ) = P(Ac B c ) P(B c ) = P((A B)c ) 1 P(B) = 1 P(A B) 1 P(B) = 5/12 2/3 = 5 8. (f) P(B c A c ) = P(Bc A c ) P(A c ) = 5/12 = 5 1 1 6. 2 3. (a) Por ser A y B independientes P(A B) = P(A)P(B) y por lo tanto P(A B) = P(A)+P(B) P(A)P (B) = P(A) + P(B)(1 P(A)). Por lo tanto 1 3 = 1 4 + 3 4 P(B) de donde P(B) = 1 9. (b) P(A B) = P(A) + P(B), de donde P(B) = 1 3 1 4 = 1 12. (c) Dado que A B, resulta que A B = B y por lo tanto P(B) = 1 3. Ejercicio 5 Usando una tabla de contingencia Se definen los siguientes sucesos: O = { El empleado trabaja en Operación de planta}, A = {El empleado trabaja en Administración} y V = {El empleado trabaja en Ventas}, H = {El empleado es hombre} y M = {El empleado es mujer}. De la tabla se obtiene que: 1. No son incompatibles (disjuntos) ya que #(O M) = 60 (i.e. O M ) 2. (a) P(V M) = 100 180 = 5 9 (b) P(M O) = 60 200 = 3 20 10, P(M A) = 50 = 2 5 (c) P(V H) = 50 400 = 1 8 (d) P(A M) = 20 independientes. y P(V H) = 50 220 = 5 22. Luego P(V ) = P (V H) + P(V M) = 3 8 y P(M V ) = 100 150 = 2 3. Luego, P(M) = P(M O)P(O) + P(M A)P(A) + P(M V )P(V ) = 60 + 20 + 100 P(M O) + P(M A) + P(M V ) = = 9 400 20 400 = 1 20 y P(H)P(V ) = 11 y P(A)P(M) = 50 Ejercicio 6 Sobre la definición de independencia 3 20 8 = 33 160 1 8 9 400 20 = 9 160 1 20 por lo que V y H no son independientes por lo que A y M no son 1. Para verificar independencia hay que verificar que para todo par de números a, b {1, 2, 3.4} se verifica P(a, )P(, b) = P(a, b). Por ejemplo, P(1, ) = P(1, 2) + P(1, 3) = 1 2 y P(, 2) = P(1, 2) + P(4, 2) = 1 2. Por otra parte P(1, 2) = 1 4 = P(1, )P(, 2). Repitiendo el procedimiento con los demás valores se obtiene que ambos números son independientes. 2. En este caso no son independientes: P(1, ) = 1 2, P(, 3) = 1 2 y P(1, 3) = 1 3 1 1 2 2. 3. Queremos a tal que P(1, a) = P(1, )P(a, ) lo cual ocurre sólo si a = 1. Luego, para que b y c cumplan que P(3, b) = P(3, )P(, b) y P(3, c) = P(3, )P(, c) tiene que ser b = 2 y c = 3. 2

Ejercicio 7 Independientes dos a dos, y de a tres? Se considera el siguiente espacio muestral (equiprobable): Ω = {CC, CN, NC, NN}. Notar que A = {CC, CN}, B = {CC, NC} y C = {CN, NC}. 1. P(A B) = P(CC) = 1 4 = P(A)P(B). Lo mismo ocurre para P(B C) y P(A C), de lo que se concluye que los sucesos son independientes dos a dos 2. Los tres sucesos no son independientes ya que A B C = y por lo tanto P(A B C) = 0 P(A)P(B)P(C). Ejercicio 8 Cuál es el mejor fármaco? Se definen los sucesos: F 1 = { El fármaco 1 tiene éxito}, y F 2 = {El fármaco 2 tiene éxito}, H = {El paciente es hombre} y M = {El paciente es mujer}. De la tabla se obtiene que: 1. P(F 1 H) = 19 200 20 = 0.95 y P(F 1 M) = 2000 = 1 10 = 0.1. 2. P(F 2 H) = 1000 2000 = 1 2 5 y P(F 2 M) = 1 20 = 0.05. 3. P(H) = 2020 4220 = 101 211 y P(M) = 2200 4220 = 110 211. 4. Teniendo en cuenta que al analizar la eficacia del Fármaco 1 (resp. Fármaco 2) solo tomamos en cuenta la población (hombres y mujeres) a los cuáles se les suministro dicho fármaco y usando la fórmula de la probabilidad total, se tiene que: P(F 1) = 19 20 20 2020 + 200 2000 2000 2020 = 0.108, P(F 2) = 1000 2000 2000 2200 + 10 200 200 2200 = 0.46. Observar que el Fármaco I tiene notoriamente mejores resultados para hombres y para mujeres, sin embargo cuando calculamos la probabilidad de éxito en general tenemos que el Fármaco II tiene mejores resultados. Por qué? Ejercicio 9 Bolillas y Urnas 1. Se definen los sucesos R = {la bolilla es roja} y C i = {se seleccionó la caja i} con i = 1, 2, 3. Usando probabilidad total, puede verse que P(R) = P(R C 1 )P (C 1 ) + P(R C 2 )P(C 2 ) + P(R C 3 )P (C 3 ) = 4 1 10 3 + 1 6 También puede pensarse con un diagrama de árbol. 1 3 + 3 1 8 3 2. (a) Escribiendo la probabilidad buscada como P(1R 2B 3A) donde 1R es el suceso la primera bolilla es roja, 2B es el suceso la segunda bolilla es blanca, y 3A la tercer bolilla es azul, tenemos que P(1R 2B 3A) = P(3A 1R 2B)P(2B 1R)P(1R) = 5 4 6 13 14 15 Los resultados no son independientes ya que, por ejemplo, P(2B 1R) P(2B 1A). (b) Como ahora el experimento es con reposición se tiene que los extracciones sucesivas son independientes y P(1R 2B 3A) = P(1R)P(2B)P(3A) = 6 4 5 15 15 15. 3. (a) Nuevamente utilizando la fórmula de la probabilidad total (o un diagrama de árbol) resulta que: P(R) = P(R C 1 )P(C 1 ) + P(R C 2 )P(C 2 ) = 3 1 5 2 + 2 1 10 2. 3

(b) Utilizando la fórmula de Bayes tenemos que: P(C 1 R) = P(R C 1)P(C 1 ) P(R) = 3 1 5 2 3 1 5 2 + 2 1 10 2 4. (a) P( extraer ambas veces la misma bola ) = 1 7 ya que sólo interesa que la bola extraída en el segundo movimiento sea la que se había depositado en la caja antes. (b) P(2R) = P(2R 1R)P(1R) + P(2R 1A)P(1A) = 3 3 7 5 + 2 2 7 5, siendo 2R el suceso la segunda bola es roja, 1R la primera bola es roja y 1A la primera bola es azul. (c) Si denominamos M al suceso salió ambas veces la misma bola por las partes anteriores tenemos que la probabilidad buscada es P(M 2R) = P(2R M)P(M) 1 7. El único factor nuevo es P(2R M) = 3 5. P(2R) = 3 5 3 3 7 5 + 2 2 7 5 Ejercicio 10 Anticuerpos del virus del sida 1. Se consideran los sucesos: E = {Los anticuerpos del virus del sida están presentes en la sangre del sujeto} y T + = {El resultado del test dio positivo}. De la letra se tiene que: P(E) = 0, 01, P(T + E) = 0, 997, P(T + c E) = 0, 003, P(T + E c ) = 0, 015 y P(T + c E c ) = 0, 9856. 2. P(E c T +) = P(T + E c )P(E c ) = 0, 015 0, 99 = 0, 0149 3. P(E T +) = P(T + E)P(E) = 0, 997 0, 01 = 0, 00997 4. P(T +) = P(E c T +) + P(E T +) = 0, 0249 5. P(E c T +) = P(T + Ec )P(E c ) P(T +) = 0,015 0,99 0,0249 = 0, 596. Ejercicio 11 Sobre los falsos positivos De los datos de personas celíacas en Uruguay obtenemos que 1. De la letra obtenemos los siguientes datos: P(persona celíaca) = 40000 3400000 = 4 340 0.012. P(examen + persona celíaca) = P(E + P C) = 0.92, P(examen - persona no celíaca) = P(E P NC) = 0.985. Por lo cual obtenemos (a) P(E + P NC) = 1 0.985 = 0.015 (b) P(E P C) = 1 0.92 = 0.08 (c) Usando la fórmula de la probabilidad total se tiene que: P(E+) = P (E+ P C) P(P C)+P(E+ P NC) P(P NC) = 0.92 0.012+0.015 0.988 = 0.0256. (d) P(P C E+) = P(E ) = 1 P(E+) = 1 0.0256 = 0.9744. P(E+ P C) P(P C) P(E+) = 0.92 0.012 0.0256 = 0.43125 nḿuero de personas celíacas con examen positivo 2. Sensibilidad = P(E+ C) = número de personas celíacas Especifidad = P(E NC) = 0.9595. = 11 12 = 0.9167. nḿuero de personas no celíacas con examen negativo 948 número de personas no celíacas 988 = 4

Ejercicio 12 Sorteo arreglado? 1. P(Los equipos grandes no se cruzan) = C4 1 C4 1 C3 1 C3 1 C2 1 C2 1 = 16 9 4 C2 8C6 2 C4 2 28 15 6 = 8 35 = 0.29 El resultado anterior se deduce del siguiente razonamiento: Para el primer cruce hay C 8 2 formas de elegir dos equipos, C 4 1 formas de elegir al equipo grande y C 4 1 formas de elegir al equipo no grande. Para el segundo cruce hay C 6 2 formas de elegir dos equipos, C 3 1 formas de elegir al equipo grande y C 3 1 formas de elegir al equipo no grande. Para el tercer cruce hay C 4 2 formas de elegir dos equipos, C 2 1 formas de elegir al equipo grande y C 2 1 formas de elegir al equipo no grande. El cuarto cruce queda completamente determinado por los cruces anteriores. En las notas de teórico de la primera semana se incluye este mismo resultado utilizando otro procedimiento. 2. (a) P(L E) P(L c E) = P(E L)P(L) P(E) P(E) P(E L c )P(L c ) = P(L)P(E L) P(L c )P(E L c ) (b) Si P(L c ) = p tenemos que P(L) = 1 p y usando la parte anterior resulta que P(L E) = P(L c E). (1 p)p(e L) pp(e L c ) Usando que P (E L)0 8 35, P(E Lc ) = 1 y P(L c E) = 1 P(L E) se obtiene que: Despejando se obtiene el resultado deseado: P(L E) = (1 p) 8 35 (1 P(L E)) p P(L E) = 1 35p 8 35p 8 + (1 p) 1) Graficando dicha probabilidad en función de p obtenemos 2) Si p = 0, 2 sustituyendo se tiene P(L E) = ( 4 ) = 0, 522, es decir que la probabilidad 5 + 7 8 es mayor que 0.5. 3) De la gráfica se ve que P(L E) decrece con p. El valor buscado es entonces el único p tal que P(L E) = 0, 5. Resolviendo la ecuación en p se tiene que p = 8 43 = 0.19. Ejercicio 13 Problema Divertido - Culpable? 7 8 Se consideran los siguientes eventos H = {la persona X es el asesino} y E = {la persona X tiene sangre tipo A} Las probabilidades antes de conocer la nueva evidencia (es decir el suceso E) son: P(H) = P(H c ) = 1 2 5

Además sabemos que: P(E H) = 1 y que P(E H c ) = 1 10 de donde, Aplicando Bayes tenemos que P(E) = P(E H)P(H) + P(E H c )P(H c ) = 1 1 2 + 1 10 1 2 P(H E) = P(E H)P(H) P(E) = P(E) 1 1 2 1 1 2 + 1 10 1 2 = 10 11 = 0.91. Es decir que la nueva evidencia, aumentó la probabilidad de que X fuera el asesino de 0.5 a 0.91. 1. (a) 2 4. (b) 2 4. Respuestas a las Preguntas conceptuales (c) La primera no cambia, la segunda es 1 4. 2. No son necesariamente independientes. Tomar como contraejemplo A = C. 3. Verdadera. Se demuestra usando la definición de independencia y notando que A A = A. 4. Es falso. Un posible contraejemplo es tomar A y B independientes, con P (A) = 1 3. No obstante, pueden encontrarse contraejemplos con sucesos no independientes. 5. Si las extracciones fueron hechas con reposición los resultados son independientes. Si en cambio la bola se perdió impidiendo la reposición, entonces los resultados no son independientes. 6. Sea p (resp. q) la probalidad de ganarle al padre (resp. campeón). Sea S 1 (resp. S 2 ) la serie PCP (CPP). Entonces P (ganar S 1 ) = pq(2 p) y P (ganar S 2 ) = pq(2 q). Dado que q > p resulta que la probabilidad de ganar S 1 es mayor al a probabilidad de ganar S 2. Por lo tanto conviene la serie PCP. 7. Falso. Esto ocurre sólo si A y B son independientes. Verdadero Falso. Si son incompatibles la probabilidad de que ambos ocurran es 0. Falso. Eso sólo ocurre si son incompatibles. En general dicha probabilidad es P (A) + P (B) P (A B). Verdadero 8. Ambas son verdaderas ya que puede asumirse que las tiradas son independientes. 9. Es correcta la afirmación (b) ya que las tiradas son independientes y los resultados equiprobables. 6