Probabilidades: Variables aleatorias y distribuciones discretas de probabilidad
Variable aleatoria Una variable aleatoria es una regla para asignar un número a todos los resultados posibles de un eperimento aleatorio, i.e. una variable aleatoria asocia un valor numérico con cada resultado posible del eperimento aleatorio. Por lo general se usan letras mayúsculas para designar a la variable aleatoria y minúscula para indicar los posibles resultados que toma la variable aleatoria, i.e. P( ) Ejemplo 1: Arrojo una moneda. = sale cara. 1 0 si sale cara en caso contrario P( 1) P(salga cara) P( 0) P(salga ceca)
Variable aleatoria Ejemplo : Arrojo dos dados. Sea = la suma de los valores de las caras de los dados Asociación entre los lanzamiento de dos dados y la vaiable aleatoria que representa la Casos posibles suma de las caras Valor de la variable aleatoria Número de ocurrencias Probabilidad (1,1) 1 1/36 (1,) (,1) 3 /36 (1,3) (,) (3,1) 4 3 3/36 (1,4) (,3) (3,) (4,1) 5 4 4/36 (1,5) (,4) (3,3) (4,) (5,1) 6 5 5/36 (1,6) (,5) (3,4) (4,3) (5,) (6,1) 7 6 6/36 (,6) (3,5) (4,4) (5,3) (6,) 8 5 5/36 (3,6) (4,5) (5,4) (6,3) 9 4 4/36 (4,6) (5,5) (6,4) 10 3 3/36 (5,6) (6,5) 11 /36 (6,6) 1 1 1/36
Variable aleatoria Se dice que una variable aleatoria es discreta si el numero de valores que puede tomar es contable (ya sean estos finitos o infinito). Se dice que una variable aleatoria es continua si puede tomar cualquier valor numérico en un intervalo o conjuntos de intervalos de la recta numérica. Ejemplos: los eperimentos que se basan en escala de medición como el tiempo, peso, altura, distancia, temperatura, etc.
Distribuciones de probabilidad de variables aleatorias discretas Sea una variable aleatoria discreta. Se llama p ) a la función de probabilidad de la variable aleatoria satisface las siguientes propiedades ( P( ), si 1. p( ) P( ) 0 para todos los valores. p( ) 1 Distribución de probabilidad de la suma de dos dados de probabilidad 0.18 0.16 0.14 0.1 0.1 0.08 0.06 0.04 0.0 0 3 4 5 6 7 8 9 10 11 1 valores de
Distribuciones de probabilidad de variables aleatorias discretas La función de distribución acumulada de la variable aleatoria es la probabilidad de que sea menor o igual a un valor específico y está dada por F ( ) P( ) p( ) La función de distribución acumulativa F() de una variable aleatoria discreta es una función no decreciente que cumple 1.. 0 F( ) 1 F( ) i F( para cualquier j ) si i j i Función de distribución acumulada de la suma de los dados i 3. P( ) 1 P( ) 1 F( ) 1. 1 0.8 F() 0.6 0.4 0. 0 3 4 5 6 7 8 9 10 11 1 valores de
Ejemplo Los datos siguientes describen la cantidad de empleados en cada uno de los 5 niveles ejecutivos de una importante empresa petrolera. Suponga que se desea seleccionar una muestra de empleados a nivel ejecutivo para una encuesta acerca de las condiciones laborales. Sea la variable aleatoria que indica el nivel de un empleado seleccionado. Cantidad de empleados 1 18 3 3 84 4 300 5 31 Nivel ejecutivo Total 465 Con estos datos construya la función de probabilidad de. Grafique. Pruebe que la función de probabilidad cumple con las condiciones requeridas Calcule la función de distribución acumulada para los valores de. Grafique.
Ejercicio Si es una v.a. discreta la P( ) a. es mayor que b. es menor que P( ) P( ) c. es igual a P( ) d. es menor que o igual a e. es mayor que o igual a P( ) P( ) Dos vs. as. con la misma función de probabilidad son la misma v.a.? Verdadero Falso
Valor esperado o esperanza matemática El valor esperado o esperanza de una variable aleatoria (v.a.)es un concepto clave en el estudio de las distribuciones de probabilidad. La esperanza de una v.a. tiene sus orígenes en los juegos de azar, ya que los apostadores quería saber cual era la esperanza que tenían de ganar el juego. En este sentido, la esperanza representa la cantidad de dinero promedio que el jugador está dispuesto a pagar para jugar el juego después de un número grande de apuestas. Esta interpretación también es válida para una v.a.; i.e. el valor promedio de una variable aleatoria después de un número grande de eperimentos es su valor esperado o esperanza matemática. El valor esperado de una v.a. discreta se define como E( ) P( ) p( )
Valor esperado o esperanza matemática Ejemplo: Sea = la suma de los valores de las caras de los dados. Mostrar que la esperanza de es 7. Asociación entre los lanzamiento de dos dados y la vaiable aleatoria que representa la Casos posibles suma de las caras Valor de la variable aleatoria Número de ocurrencias Probabilidad (1,1) 1 1/36 (1,) (,1) 3 /36 (1,3) (,) (3,1) 4 3 3/36 (1,4) (,3) (3,) (4,1) 5 4 4/36 (1,5) (,4) (3,3) (4,) (5,1) 6 5 5/36 (1,6) (,5) (3,4) (4,3) (5,) (6,1) 7 6 6/36 (,6) (3,5) (4,4) (5,3) (6,) 8 5 5/36 (3,6) (4,5) (5,4) (6,3) 9 4 4/36 (4,6) (5,5) (6,4) 10 3 3/36 (5,6) (6,5) 11 /36 (6,6) 1 1 1/36 E( ) P( ) p( )
Valor esperado de una función de una v.a. Sea una v.a. discreta con función de probabilidad p( ) P( ) y sea g( ) una función de. entonces el valor esperado de g( ) es E g( ) g( ) P( ) g( ) p( ) Ejemplo: Cierta empresa está considerando cambiar una máquina de montaje por su comportamiento defectuoso. De acuerdo con las estadísticas de la empresa, la distribución de probabilidades para el número de veces que la máquina se paraliza en una semana es la siguiente Cantidad de desperfectos en la semana Probabilidad de ocurrencia Hallar la media del número de desperfectos. 0 1 3 4 0.1 0.6 0.4 0.16 0.06 Se ha estimado que cada desperfecto le cuesta a la compañía un abono fijo semanal de $1000 más $1500 en pérdidas de producción. Hallar la media del costo semanal por desperfecto.
Varianza y desvío estándar Ya vimos, al analizar un conjunto de datos, que la media o promedio por sí solo, podía resultar muy poco informativo. Por lo tanto, así como usamos la varianza para resumir la dispersión de un conjunto de datos, definimos la varianza de una v.a. para hablar de su variabilidad. El desvío estándar (o desvío típico),, es la raíz cuadrada positiva de la varianza. Recordar que está en las mismas unidades que la variable original. Otra forma de epresar la varianza es ) ( ) ( ) ( ) ( ) ( ) ( p P E Var ) ( p E
Varianza y desvío estándar Ejemplo: calcular la varianza y el desvío estándar de la v.a. = la suma de los valores de las caras de los dados Var ( ) E( ) ( ) P( ) ( ) p( ) E p ) ( Asociación entre los lanzamiento de dos dados y la vaiable aleatoria que representa la Casos posibles suma de las caras Valor de la variable aleatoria Número de ocurrencias Probabilidad (1,1) 1 1/36 (1,) (,1) 3 /36 (1,3) (,) (3,1) 4 3 3/36 (1,4) (,3) (3,) (4,1) 5 4 4/36 (1,5) (,4) (3,3) (4,) (5,1) 6 5 5/36 (1,6) (,5) (3,4) (4,3) (5,) (6,1) 7 6 6/36 (,6) (3,5) (4,4) (5,3) (6,) 8 5 5/36 (3,6) (4,5) (5,4) (6,3) 9 4 4/36 (4,6) (5,5) (6,4) 10 3 3/36 (5,6) (6,5) 11 /36 (6,6) 1 1 1/36
Varianza y desvío estándar de una función lineal Sea una v.a. con media y varianza y sean a y b dos constantes. Definamos la v.a. Z a b. Entonces la media y la varianza de Z son Z E( Z) E( a b ) a b Z Var ( Z) Var ( a b ) b Y el desvío estándar de Z es Demostrar Z b Calcular la varianza del número de desperfectos y del costo semanal por desperfecto en la máquina.
Media y varianza: momentos de primer y segundo orden Tanto a como a se los llama momentos poblacionales para distinguirlos de los momentos muestrales y. s Momentos muestrales Uso de la frecuencia relativa f/n Media muestral i f i n 1 n En particular, Varianza muestral s En particular, f ( i ) i n 1 s ( i ) n 1 i i i Momentos poblacionales Uso de la probabilidad p() Media poblacional i p( i i Varianza poblacional ( i i ) ) p( i )
La distribución binomial Se trata de una de las distribuciones discretas más útiles. George Louis Leclerc (1707-1788) lanzó una moneda 4.040 veces y obtuvo.048; i.e. un 50.69% de caras John Kerrich, matemático inglés apresado durante la II Guerra Mundial, lanzó una moneda 10.000 veces. La proporción de caras obtenidas fue 5.067 Jacob Bernoulli (1654-1705) dedicó varias décadas a estudiar el problema y logró demostrar matemáticamente que el porcentaje de caras que se obtendría al lanzar una moneda indefinidamente era del 50%.
El proceso de Bernoulli Dio origen a los ensayos de Bernoulli. En que consiste un ensayo de Bernoulli? 1. Un eperimento que tiene sólo dos resultados posibles (v.g. cara y ceca). A uno de ellos se lo llama éito y al otro fracaso.. La probabilidad de éito es p y la de fracaso 1-p. Una v.a. con distribución Bernoulli consiste en un único ensayo en el que el resultado ocurre (éito) o no ocurre (fracaso). Por lo tanto, un ensayo de Bernoulli está unívocamente caracterizado por un único número: la probabilidad de éito p. Ejemplos Lanzo una moneda: cara con probabilidad p(=0.5) y ceca con probabildad q=1-p (=0.5) Nacimiento de un hijo: con probabilidad p (=0.48~1/) es niña y con probailidad q=1-p es varón Multiple choice con 5 opciones y sin conocimiento (puro azar): con probabilidad p (=1/5) la respuesta es correcta y con probabilidad q=1-p (=4/5) es errada.
La distribución Binomial Que cualidad presentan los posibles resultados de un ensayo de Bernoulli? Cuando los ensayos de Bernoulli se repiten n veces de manera independiente (independiente idénticamente distribuidos i.i.d), se dice entonces que se tiene un eperimento binomial. En definitiva un eperimento binomial son n ensayos de Bernoulli, i.i.d.. Clásico ejemplo: Arrojo una moneda n veces o n monedas una vez. Cada arrojar de la moneda es un ensayo de Bernoulli. El número total de éitos obtenidos después de n ensayos i.i.d. de Bernoulli es una v.a. binomial
La distribución Binomial En un eperimento binomial la v.a. de interés es la cantidad de éitos obtenidos en n ensayos. Sea = número total de éitos obtenidos en n ensayos de Bernoulli puede tomar los valores {0,1,,3,n}. Se trata de una v.a. discreta. La distribución de probabilidades de la v.a. se llama distribución binomial. A diferencia de la distribución de Bernoulli, la distribución binomial tiene dos números (o parámetros) relevantes El número de ensayos: n La probabilidad de éito: p
La distribución Binomial Cómo se calcula la probabilidad de tener eactamente k éitos cuando la v.a. es ~Bi(n, p)? Sea una v.a. que representa el nro de éitos en n ensayos de Bernoulli y sea p la probabilidad de éito. Se dice entonces que ~Bi(n, p) ( tiene una distribución binomial) con función de probabilidad n k nk n! k nk P( k) p (1 p) p (1 p) para k k k!( n k)! 0,1,,... n El nombre de distribución binomial proviene de la epansión del binomio 1 p p n
La función n tomados de a k Cuál de las siguientes epresiones es falsa? Hay n maneras diferentes de obtener un éito en n n ensayos, n 1 Hay sólo una manera de obtener n éitos en n ensayos, n 1 n Hay sólo una manera de obtener n fracasos en n n ensayos, 0 1 Hay n-1 maneras de obtener n-1 éitos en n ensayos n n 1 n 1
La distribución Binomial Ejemplo: Un vendedor de seguros visitas a 10 familias seleccionadas al azar. El resultado a cada familia se clasifica como éito si la familia compra la póliza de seguro y como fracaso en caso contrario. Se sabe que la probabilidad de que una familia seleccionada la azar compre una póliza de seguro es del 0.10. 1. De que tipo de distribución estamos hablando? Especifique la v.a. y fundamente.. Cuál es la probabilidad de que eactamente 1 familia adquiera la poliza? Y eactamente tres familias? 3. Cuál es la probabilidad de que por lo menos 1 familia adquiera el seguro?
La distribución Binomial 0.45 0.4 0.35 0.3 0.5 0. 0.15 0.1 0.05 Diferentes distribuciones binomiales con n=10 0 0 1 3 4 5 6 7 8 9 10 P=0.10 p=0.5 p=0.9
Condiciones de una v.a. binomial Cuál de las siguientes no es condición para que una v.a. se distribuya según una binomial? Los ensayos deben ser independientes. El número de ensayos n, debe ser fijo. El resultado de cada ensayo sólo puede ser clasificado como éito o fracaso. El número deseado de éitos, k, debe ser mayor que el número de ensayos. La probabilidad de éito, p, debe ser la misma en cada ensayo.
Esperanza de una v.a. binomial Una encuesta de Gallup del año 01, indica que el 6. de los americanos son obesos. En una muestra de 10 americanos, cuál es la probabilidad de que eactamente 8 sean obesos? Bastante pequeña Bastante grande En Ecel =DISTR.BINOM(8,10,0.6,FALSO) 8 a. 0.6 0.738 c. 8 0.6 10 8 b. d. 0.738 10 0.6 8 10 0.6 8 8 0.738 0.738 8
Esperanza de una v.a. binomial Continuando con el ejemplo anterior, en una muestra de 100 americanos, cuantos obesos esperaría encontrar? Bien fácil Formalmente, el valor esperado de una v.a. binomial np 1000.6 6. Esto no significa que cada vez que tomemos una muestra al azar de 100 americanos, vamos a encontrar eactamente 6. americanos obesos. De hecho, ese valor esperado es imposible de encontrar. Algunas veces encontraremos más y algunas veces menos. Pero cuanto más o cuanto menos, i.e. que variabilidad podríamos esperar encontrar?
Esperanza y varianza de una v.a. binomial np np(1 p) npq np(1 p) npq Volviendo a la encuesta de Gallup sobre la tasa de obesidad np( 1 p) 1000.6(1 0.6) 4.4 En una muestra de 100 americanos se espera 6. obesos en promedio con un desvío estándar de 4.4
Teorema de Chebyshev Chebyshev (1867), establece la desigualdad, también llamada teorema de Chebyshev, que establece una cota o límite inferior para la probabilidad de que la v.a. de interés caiga en un intervalo de la forma k Desigualdad de Chebyshev: Sea una v.a. con media finita y varianza. Entonces para cualquier constante k 1 se tiene que P( 1 k ) 1 k Este resultado vale cualquiera sea la distribución de. Se trata de un resultado muy conservador ó P( k ) 1 k
Aplicaciones de la v.a. binomial Suponga que se tomó una muestra de 55 americanos y 8 resultaron obesos. En base a la encuesta de Gallup de 01, consideraría este resultado como inusual? Sea una v.a. Bernoulli con p=0.4. Cuál es la E()? Calcular la esperanza utilizando la definición. Y la Var()? Sea Y~Bi(5,0.4). Cuál es la E(Y)? Y la Var(Y)?
La distribución de Poisson La distribución de Poisson (Siméon D. Poisson, probabilista francés S.I) es otra distribución discreta muy utilizada. En este tipo de eperimentos, el número de ocurrencias o éitos se epresan por unidad de tiempo, por unidad de área, por volumen, por pieza, etc. # de personas que sufren un ataque cardíaco por día en CABA. # de individuos alcanzado por un rayo en un año en una comunidad. # de errores de tipeo por página. # de solicitudes de seguros procesadas por una institución en un día cualquiera. # de vacantes durante un año en la Corte Suprema de Justicia. # de defectos en piezas similares (rollos de telas, etc). # de siniestros en determinada compañía de seguros. #de personas de más de 100 años en una comunidad. La distribución de Poisson describe el número de eventos raros que podrían ocurrir en una unidad de tiempo/espacio/volumen, para una población (relativamente) fija y grande, donde los individuos de la población son independientes.
La distribución de Poisson Sea una v.a. = número de eventos que ocurren por unidad de tiempo/espacio/. Se dice que sigue una distribución de Poisson con parámetro λ y función de probabilidad dada por k e P( k; ) k 0,1,,3,..., k! 0 El parámetro λ de la distribución de Poisson, representa el número promedio de ocurrencias del evento aleatorio que se observa por unidad de tiempo/espacio/etc. El único parámetro necesario para caracterizar la distribución de Poisson es λ A diferencia de la binomial, en la v.a. de Poisson, el número de ocurrencias no tiene límite superior, aunque las probabilidades se hacen muy pequeñas después de los primeros éitos.
Ejemplo: la distribución de Poisson Un banco recibe en promedio 6 cheques sin fondo por día, cuáles son las probabilidades de que reciba a. Cuatro cheques sin fondo en un día dado, b. 10 cheques sin fondo en dos días consecutivos cualesquiera c. Al menos cheques por día. En ecel =POISSON(4,6,FALSO)=0.1338 En ecel =POISSON(1,6,VERDADERO)=0.01735
Supuestos de la distribución de Poisson Es posible dividir el intervalo de tiempo (hora, día, año, etc.) en pequeños subintervalos La probabilidad de ocurrencia permanece constante a lo largo de los intervalos. La probabilidad de dos o más ocurrencias en un subintervalo es suficientemente pequeña como para ignorarla. Las ocurrencias son independientes.
Ejemplo: la distribución de Poisson A medida que λ (# promedio de ocurrencias) crece la distribución de Poisson se hace más simétrica. 0.3 0.5 0. 0.15 0.1 0.05 0 0 1 3 4 5 6 7 8 9 10 11 1 13 14 15 16 17 18 19 0 1 3 lamda= lamda=4 lamda=6 lamda=10
La aproimación de Poisson a la Binomial La distribución de Poisson es muy reconocida también porque puede ser utilizada para aproimar la distribución Bi(n,p) cuando n es grande y p es lo suficientemente pequeño, de modo que q=1-p es casi 1, entonces la ocurrencia del evento es rara. En este caso la distribución Bi(n,p) puede ser aproimada por la Poisson con parámetro λ=np=μ. Sea ~Bi(n,p). Se puede probar matemáticamente que, bajo las condiciones anteriores, y llamando λ=np se tiene que p lim n pequeño P( k) p lim n pequeño n k p k k k! nk 1 p e
Ejemplo: aproimación de Poisson a la binomial Suponga que la probabilidad de que un pasajero de AA pierda su equipaje de acuerdo con los registros de la empresa es del 5%. Se toma una muestra al azar de 00 pasajeros de AA en un día determinado. a. Cuál es la probabilidad de que más de dos pasajeros hayan etraviado su equipaje? b. Y cuál que la hayan etraviado a lo sumo 10 pasajeros? En ecel =POISSON(10,10,VERDADERO)=0.583 La Poisson aproima razonablemente bien a la Binomial cuando n 50 y p 0.05
Esperanza y varianza de una Poisson Sea una v.a. con distribución de Poisson con parámetro λ. Entonces E( ) Var ( ) Ejercicio: El número de accidentes promedio que ocurren en una fábrica es de 3 al año. En el último año se registraron 7 accidentes. Este número llamó la atención a los responsables de la seguridad laboral. Cuán probable es que ocurran por lo menos 7 accidentes? Es este valor un indicio de un cambio en la media? En ecel =1- POISSON(6,3,VERDADERO)=1-0.967=0.033