Apuntes de Probabilidad La teoría de la probabilidad tuvo sus inicios en el análisis de los juegos de azar de siglo XVII. En este tema, trataremos aspectos relaciones con la teoría de probabilidad. En primer lugar, se hace una aproximación intuitiva a la noción de experimento aleatorio, suceso y a la idea de probabilidad. Más adelante, estos conceptos se formalizan con el estudio de las propiedades asociadas a los espacios probabilísticos y con las distintas aproximaciones a la probabilidad, como, por ejemplo, la conocida Ley de Laplace. 1. Factorial de un número y números combinatorios Previamente a introducir las técnicas de conteo, recordamos estos dos conceptos básicos: Factorial de un número n: el factorial de n se denota n! y se calcula de la siguiente forma: Propiedades: - 0! = 1 - n! = n (n 1)! n! = n (n 1) (n 2) 3 2 1 Número combinatorio: se define como n sobre m y se calcula de la siguiente forma: ( n m ) = n! m! (n m)! 2. Técnicas de recuento. Combinatoria En el Cálculo de Probabilidades, a menudo se presentan conjuntos demasiado grandes como para poder enumerar exhaustivamente sus elementos, aunque, por otra parte, obedecen a unas reglas de formación fijas que permiten construir procedimientos para conocer su cardinal, sin necesidad de elaborar una lista de elementos. La Combinatoria agrupa los procedimientos orientados a contabilizar el número de elementos de conjuntos de este tipo, sin necesidad de enumeraciones. Se encarga de analizar las formas de agrupar u ordenar los elementos de un conjunto siguiendo determinadas reglas y también estudia las formas en las que un suceso puede acontecer. Empezaremos el tema recordando las configuraciones de conteo habituales: variaciones, permutaciones, combinaciones (con y sin repetición), así como la técnica de diagrama en árbol. 2.1 Diagrama en árbol: se trata de un método gráfico de conteo que consiste en ir señalando todos los posibles resultados simulando las ramas de un árbol. Determina el número de palabras distintas de 5 letras que puedan formarse con las letras {A, E, I, L, M, N, P} de forma que haya una vocal en la primera posición. Para ello, deben rellenarse cinco posibles posiciones (1 para cada letra): La primera posición debe ocuparse por una vocal y, para ello, hay tres elecciones posibles {A, E, I} 3 La segunda posición debe ocuparse por una letra diferente de la primera, de modo que, sea cual sea la primera, hay 6 posibilidades 3 6 Elegidas la primera y la segunda letras, hay 5 elecciones posibles para la tercera posición 1
3 6 5 Razonando análogamente de esta misma forma para las posiciones restantes: 3 6 5 4 3 Es decir, el número de palabras distintas es 3 6 5 4 3 = 1080 El resultado final del ejemplo sigue una regla de conteo (diagrama en árbol): si los conjuntos A 1, A 2, A k tienen n 1, n 2,, n k elementos, respectivamente, entonces el producto cartesiano A 1 xa 2 x xa k tiene n 1 xn 2 x xn k elementos. 2.2 Variaciones ordinarias (sin repetición) de n elementos tomados de m en m (n > m): consiste en enumerar todos los posibles grupos diferentes de m elementos a partir de n elementos. - Los elementos no pueden repetirse. - Sí importa el orden en el que los colocamos. n! V n,m = (n m)! De cuántas formas pueden recibir el oro, la plata y el bronce los 10 participantes de una carrera de atletismo? En este caso, se trata de variaciones sin repetición de 10 elementos tomados de 3 en 3. 10! V 10,3 = (10 3)! = 10! = 10 9 8 = 720 formas 7! 2.3 Variaciones con repetición de n elementos tomados de m en m (n > m): en este caso, al tomar los m elementos del conjunto de n elementos inicial, estos sí pueden repetirse. - Los elementos pueden repetirse. - Sí importa el orden en el que los colocamos. VR n,m = n m Cuántos códigos de longitud 10 se pueden formar combinando los signos + y -? Para la primera posición tenemos dos posibilidades: + o ; para la segunda posición tendríamos de nuevo dos posibilidades: + o Razonando análogamente por el resto de posiciones, tendríamos dos posibilidades en cada una de ellas, por lo tanto: Es decir, se trata de VR 2,10 = 2 10 2 2 2 2 2 2 2 2 2 2 = 2 10 2.4 Permutaciones (sin repetición) de n elementos: se trata de variaciones ordinarias en las que n = m. P n = n! De cuántas formas pueden sentarse 5 amigos en 5 asientos consecutivos del cine? En el primer asiento de la izquierda pueden sentarse cualquiera de los 5, en el asiento consecutivo cualquiera de los 4 restantes y así sucesivamente. Es decir, hay 5 4 3 2 1 = 120 formas 2
2.5 Permutaciones con repetición de n elementos: se trata de permutaciones de n elementos, donde hay elementos que se repiten. n P 1,n 2, n k n! n = n 1! n 2! n k! Cuántos números diferentes se pueden formar con las cifras: 1, 1, 1, 2, 3, 4, 4, 6? En total hay 8 elementos, pero el 1 aparece repetido 3 veces y el 4 aparece repetido 2 veces. Por tanto, se trata de permutaciones con repetición. P 3,2 8 = 8! = 80 números 3! 2! 2.6 Combinaciones de n elementos tomados de m en m: consiste en enumerar todos los posibles subconjuntos de m elementos a partir de n elementos. - Los elementos no pueden repetirse. - No importa el orden en el que los colocamos. C n,m = ( n m ) = n! m! (n m)! Tenemos una urna con 10 bolas de diferente color y extraemos dos al azar, cuántas combinaciones posibles existen? Habrá tantas combinaciones como formas posibles de extraer dos bolas de la urna, es decir, C 10,2 = ( 10 2 ) = 10! 2! (10 2)! = 10! = 45 combinaciones 2! 8! 3. Experimentos aleatorios Existen fenómenos donde la concurrencia de unas circunstancias fijas no permite anticipar cuál será el efecto producido. Por ejemplo, si una moneda cae al suelo, no es posible conocer por anticipado el punto exacto donde irá a parar; cuando se colocan bolas idénticas numeradas en una bolsa y se extrae una bola a ciegas, no es posible determinar con total certeza qué bola será elegida; etc. Estos experimentos son llamados aleatorios, puesto que el resultado del fenómeno en estudio es consecuencia del azar. Los experimentos no aleatorios se llaman deterministas. En estas situaciones el carácter impredecible del azar hace inútil cualquier intento de hallar reglas deterministas que rijan la aparición de los resultados individuales. Sin embargo, es falso decir que el azar no está sometido a leyes, lo que ocurre es que no son leyes necesarias, que determinen unívocamente el resultado de cada experimento, sino que atañen a la frecuencia de los resultados que se obtienen cuando el fenómeno se repite un gran número de veces. El Cálculo de Probabilidades se ocupa de estudiar experimentos aleatorios; es decir, situaciones que, repetidas bajo condiciones idénticas, pueden dar lugar a diversos resultados A 1, A 2,, de manera que no puede predecirse con certeza absoluta cuál de ellos ocurrirá. Ante fenómenos de azar, la tendencia natural es tratar de medir el grado de verosimilitud de los diversos acontecimientos posibles asignando una probabilidad a cada uno de ellos; es decir, un 3
valor numérico que informa de la frecuencia con que hay que esperar que se presente cada uno, después de numerosas observaciones del fenómeno. En concreto, la probabilidad de cada acontecimiento posible es un número de [0, 1], que expresa la frecuencia teórica con que dicho acontecimiento se presentará en una serie indefinidamente larga de repeticiones del experimento realizadas en condiciones idénticas. En el estudio de un experimento aleatorio hay dos conceptos fundamentales: Los posibles acontecimientos que pueden producirse; es decir, el espacio muestral y sus correspondientes sucesos. La valoración de la probabilidad de los acontecimientos posibles. 4. Espacio muestral y sucesos aleatorios En primer lugar, introducimos las siguientes definiciones: 4.1 Definiciones En un experimento aleatorio, el espacio muestral se conoce como el conjunto de todos los resultados posibles que constituyen un fenómeno aleatorio y se denota por E. Es habitual decir que el espacio muestral E es: discreto si tiene un número finito de elementos. continuo en caso contrario. Se llaman sucesos a los distintos subconjuntos de E. Podemos distinguir dos tipos: Sucesos elementales: cada uno de los resultados posibles del espacio muestral. Sucesos compuestos: formados por varios sucesos elementales (uniones de sucesos elementales). Se considera el lanzamiento de dos monedas. El espacio muestral es: E = {(C, C), (C, X), (X, C), (X, X)} donde C = "cara" y X = "cruz". El suceso "obtener dos caras" (C, C) es elemental (análogo para el suceso "obtener dos cruces") y el suceso "obtener una cara" {(C, X), (X, C)} es compuesto. La identificación de los sucesos relativos a un experimento aleatorio implica disponer de operaciones para formar nuevos sucesos desde otros sucesos dados. Por este motivo, introducimos las operaciones entre sucesos: 4.2 Operaciones elementales entre sucesos Dados dos sucesos asociados a un experimento aleatorio, se definen las siguientes operaciones: Unión de sucesos: si A y B son subconjuntos de E, entonces A B se describe como "ocurre A u ocurre B"; es decir, el resultado pertenece o bien a A, o bien a B o bien a ambos simultáneamente. Intersección de sucesos: si A y B son subconjuntos de E, entonces A B se describe como "ocurren A y B simultáneamente". Si A B =, se dice que A y B son sucesos incompatibles. 4
Contrario o complementario de un suceso: si A E, entonces A c o A es el suceso formado por todos los sucesos elementales que no están en A. Es importante observar que: A A = E y A A = Diferencia de sucesos: si A y B son subconjuntos de E, entonces A B es la intersección del primer suceso con el contrario del segundo, A B = A B. Diferencia simétrica de sucesos: si A y B son subconjuntos de E, entonces definimos el suceso A B = (A B) (B A) es decir es el suceso que se verifica si y solo si se verifica uno y solo uno de los sucesos A o B. 4.3 Propiedades de las operaciones con sucesos o Conmutativa: A B = B A ; A B = B A o Asociativa: (A B) C = A (B C) ; (A B) C = A (B C) o Idempotente: A A = A ; A A = A o Existencia de neutros: A = A ; A E = A o Absorción: A E = E ; A = o Simplificativa: A (A B) = A ; A (A B) = A o Distributiva:A (B C) = (A B) (A C) ; A (B C) = (A B) (A C) o Complementación: E = ; = E o Involución: A =A o Leyes de dualidad o de Morgan: A B = A B o E es el suceso seguro y el suceso imposible. ; A B = A B 5. Espacio de probabilidad. Definición de probabilidad El Cálculo de Probabilidades no se estableció como una ciencia matemática hasta principios del siglo XX. En esta época el desarrollo de las Ciencias Naturales implicó fuertes demandas sobre esta disciplina y se hizo necesario estudiar los conceptos básicos de la Teoría de la Probabilidad. 5.1 Aproximación frecuentista La probabilidad de un determinado suceso se puede definir como el valor al que tienden las frecuencias relativas cuando se repite el experimento aleatorio un elevado número de veces. El valor límite de la frecuencia relativa de un suceso es lo que se desea expresar mediante su probabilidad frecuentista. (Ley de los grandes números) Supongamos que tenemos una urna con 3 bolas idénticas, dos blancas y una roja. Entonces si se extrae una bola al azar, la frecuencia se conoce con exactitud: P("Obtener bola roja") = 2 3 = 0 666 ; P("Obtener bola blanca") = 1 3 = 0 333 En cambio: (i) suponemos que repitiendo el experimento 12 veces, se extrae 7 veces una bola roja y 5 veces una bola blanca; es decir frecuencia de "obtener roja" = 7 12 = 0 58333 frecuencia de "obtener blanca" = 5 12 = 0 41666 5
(ii) repitiendo el experimento 120 veces, se obtiene 69 rojas y 51 blancas; es decir frecuencia de "obtener roja" = 69 120 = 0 575 frecuencia de "obtener blanca" = 51 120 = 0 425 (iii) repitiendo el experimento 1200 veces, se obtiene 822 rojas y 378 blancas; es decir frecuencia de "obtener roja" = 822 1200 = 0 685 frecuencia de "obtener blanca" = 378 1200 = 0 315 Análogamente, el experimento podría repetirse 10000, 100000, concluyendo que en una sucesión ilimitada de repeticiones, en idénticas condiciones, las frecuencias tras cada repetición tienden a aproximarse hacia ciertos valores límites, que son las probabilidades. 5.2 Propiedades de la probabilidad Sean A, B sucesos de un espacio muestral E: o 0 p(a) 1 o p( ) = 0 ; p(e) = 1 o p(a) = 1 p(a ) o Si A B entonces p(a) p(b) o Regla de la Adición: p(a B) = p(a) + p(b) p(a B) Si los sucesos son incompatibles, entonces: p(a B) = p(a) + p(b) 5.3 Ley de Laplace Para calcular las probabilidades de los sucesos relativos a un experimento aleatorio con espacio muestral finito, existe una norma de utilidad cuando todos los sucesos elementales son equiprobables, es decir, tienen la misma probabilidad. Esta regla se conoce como Ley de Laplace y fue propuesta por P.S. Laplace (1749-1827) y representa el primer antecedente explícito del concepto de probabilidad. En caso de estar ante un experimento aleatorio, donde los sucesos son equiprobables, la probabilidad de un suceso se puede calcular mediante la aplicación de la ley de Laplace de la siguiente forma: nº de casos favorables al suceso A p(a) = nº de casos posibles del espacio muestral E La probabilidad de un suceso se calcula como el cociente del nº de casos favorables entre el nº de casos posibles Calcula la probabilidad de obtener un número par al lanzar un dado perfectamente equilibrado. El espacio muestral del experimento aleatorio es: E = {1, 2, 3, 4, 5, 6}. A la vista de los resultados, la intuición parece indicar que la probabilidad pedida es 1 2, no obstante, vamos a comprobarlo. El dado está equilibrado, es decir, la posibilidad de obtener una cifra u otra, a priori, es la misma. Por tanto, los resultados posibles son equiprobables y podemos aplicar la Ley de Laplace: 6
Definimos el suceso A= obtener un nº par : p("obtener un nº par") = nº de resultados pares nº de casos posibles = {2, 4, 6} {1, 2, 3, 4, 5, 6} = 3 6 = 1 2 6. Probabilidad condicionada Hasta este momento, las probabilidades de los sucesos han tenido un carácter estático, es decir, antes de realizar el experimento, es posible emitir un juicio sobre su resultado, indicando la frecuencia de aparición de cada uno de los sucesos que pueden ocurrir. No obstante, es frecuente considerar situaciones intermedias donde el experimento no ha concluido o, en el caso de experimentos que se desarrollan en varias etapas, nos interesamos por el resultado de una etapa inicial ya conociendo el resultado en una etapa posterior. Es evidente que disponer de cierto tipo de información adicional respecto de un determinado experimento aleatorio puede modificar las probabilidades que se asignan en principio a cada uno de los sucesos. Supongamos una urna con tres bolas negras numeradas del 1 al 3 y dos blancas con el 4 y el 5: La probabilidad de que saquemos una bola y sea la 5, utilizando la Ley de Laplace, es 1/5. Sin embargo, si en el momento de la extracción hemos podido ver que la bola era blanca, la probabilidad de que sea la 5 es entonces 1/2. Diremos en este caso que 1/2 es la probabilidad del suceso sacar la bola 5, condicionado al suceso la bola es blanca. Esta es la idea de probabilidad condicionada. 6.1 Definición de Probabilidad condicionada La probabilidad de un suceso B cuando sabemos que ha ocurrido otro suceso A, con p(a) > 0, se llama probabilidad condicionada. Se escribe p(b A), se lee probabilidad de B condicionada a A y su valor es: p(a B) p(b A) = p(a) A partir de la definición de la probabilidad condicionada, se puede calcular la probabilidad de la intersección de dos sucesos despejando directamente de la expresión anterior de probabilidad de B condicionada a A. Este método se conoce como regla del producto o de la multiplicación: 6.2 Regla del producto o de la multiplicación p(a B) = p(b A) p(a) Del mismo modo, si despejamos de la probabilidad de A condicionada a B: p(a B) = p(a B) p(b) 6.3 Dependencia e independencia de sucesos En general, condicionar un suceso A a otro B modifica la probabilidad del primero, pero esto no siempre es así, pues podría ocurrir que A y B no tuvieran mucho que ver. Esto lo justifica la siguiente definición de sucesos independientes: 7
Diremos que dos sucesos A y B son independientes, si se cumple que: p(a B) = p(a) ; p(b A) = p(b) Es decir, el hecho de que ocurra uno de ellos, no condiciona la probabilidad del segundo. En el caso de que A y B sean sucesos independientes, entonces se cumple que la probabilidad de su intersección es el producto de las probabilidades de cada uno de ellos. A y B independientes, entonces p(a B) = p(a B) p(b) = p(a) p(b) 7. Teorema de la Probabilidad Total y Teorema de Bayes 7.1 Teorema de la Probabilidad Total Consideremos un experimento aleatorio con espacio muestral Ey un conjunto de sucesos n A 1, A 2, A n incompatibles dos a dos (A i A j = i j), tales que E = i=1 A i donde además p(a i ) > 0 i = 1,, n Sea S un suceso cualquiera con probabilidades condicionadas p(s A i ) i = 1,2, n conocidas. Entonces se verifica que: n p(s) = p(a i ) p(s A i ) = p(a 1 ) p(s A 1 ) + p(a 2 ) p(s A 2 ) + + p(a n ) p(s A n ) i=1 E A 1 A 2. A n A 1 S A 2 S S A n S Demostración p(s) = p(e S) = p((a 1 A 2 A n ) S) = = p(a 1 S) (A 2 S) (A n S) = p(a 1 S) + p(a 2 S) + + p(a n S) = = p(a 1 ) p(s A 1 ) + p(a 2 ) p(s A 2 ) + + p(a n ) p(s A n ) 7.2 Teorema de Bayes Consideremos un experimento aleatorio con espacio muestral E y un conjunto de sucesos n A 1, A 2, A n incompatibles dos a dos, (A i A j = i j), tales que E = i=1 A i donde además p(a i ) > 0 i = 1,, n Entonces para cada suceso S con p(s) > 0 se verifica p(a i S) = o lo que es lo mismo p(a i ) p(s A i ) p(a 1 ) p(s A 1 ) + p(a 2 ) p(s A 2 ) + + p(a n ) p(s A n ) p(a i S) = p(a i) p(s A i ) p(s) Las probabilidades p(a i ) se conocen con el nombre de probabilidades a priori, p(a i S) son las probabilidades a posteriori y p(s A i ) son las verosimilitudes con i = 1, n. 8
Demostración p(a i S) = p(a i S) p(a p(s) i S) = p(s) p(a i S) p(s A i ) = p(a i S) p(a p(a i ) i S) = p(a i ) p(s A i ) de donde p(s) p(a i S) = p(a i ) p(s A i ) i = 1,, n y, por tanto, despejando: p(a i S) = p(a i) p(s A i ) p(s) = p(a i ) p(s A i ) p(a 1 ) p(s A 1 ) + p(a 2 ) p(s A 2 ) + + p(a n ) p(s A n ) 9