Universidad de Los Andes Facultad de Ciencias Forestales y Ambientales Escuela de Ingeniería Forestal Departamento Manejo de Bosques Cátedra de Biometría Forestal Asignatura: ESTADISTICA Y BIOMETRIA Profesor Argenis Mora Garcés Práctico IV Distribuciones de Probabilidad de Variables Discretas: La Binomial y la Poisson en R. a) Distribución Binomial en R. En el cuadro 1 se describe los comandos necesarios para calcular probabilidades bajo una función de probabilidad Binomial. Primero notamos que la función en R llamada dbinom sirve para determinar la probabilidad exacta de un valor de conteo x de un total (size=) de posibles con una probabilidad de éxito (prob=). Cuadro 1. Instrucciones R para el uso de la distribución Binomial. Función en R Opciones necesarias resultado dbinom( ) x, size=, prob= Produce P(X = x); la probabilidad exacta de un valor x cualquiera pbinom( ) pbinom( ) x, size=, prob= lower.tail=true x, size=, prob= lower.tail=false Produce P(X x); la probabilidad de encontar un valor igual o menor a x; cola inferior Produce P(X x); la probabilidad de encontar un valor igual o mayor a x; cola superior Sigamos el siguiente ejemplo: Sobre una parcela se ha determinado que la probabilidad de un árbol presente ataques por un patógeno foliar es de un 15 % (probabilidad de éxito es de 0.15; P = 0.15). Sí se seleccionan un total de 10 árboles (size=10), a) cuál será la probabilidad de que 2 de esos 10 árboles presenten ataques del patógeno? b) cuál será la probabilidad de que 5 de esos 10 árboles presenten ataques del patógeno?, c) cuál será la probabilidad de que todos esos 10 árboles presenten ataques del patógeno? Para la pregunta a) se pide P(X = 2), se puede usar la siguiente instrucción en R > dbinom(2, size=10, prob=0.15) [1] 0.2758967 Para la pregunta b) se pide P(X = 5), se puede usar la siguiente instrucción en R > dbinom(5, size=10, prob=0.15)
[1] 0.008490856 Para la pregunta c) se pide P(X = 10), se puede usar la siguiente instrucción en R > dbinom(10, size=10, prob=0.15) [1] 5.766504e-09 ahora respondamos las siguientes preguntas relacionadas al problema anterior: d) cuál es la probabilidad de encontrar 3 o menos árboles con presencia del patógeno?, e) cuál es la probabilidad de encontrar 4 o más árboles con presencia del patógeno? f) cuál es la probabilidad de encontrar entre 3 a 8 árboles con presencia del patógeno? La pregunta d) se pide P(X 3), hace referencia a encontrar probabilidades de cola izquierda (menores a ) y se debe usar la función pbinom, como sigue: > pbinom(3, size=10, prob=0.15, lower.tail=true) [1] 0.9500302 nótese que fue necesaria la instrucción lower.tail=true lo cual quiere decir que deseamos la probabilidad de cola inferior o izquierda. Parece obvio que si necesitamos resolver la pregunta e) se pide P(X 4), a la instrucción lower.tail debemos sustituirle TRUE por la palabra FALSE, pues se nos pregunta la probabilidad de encontrar 4 o más árboles (cola superior o derecha), > pbinom(4, size=10, prob=0.15, lower.tail=false) [1] 0.009874091 y finalmente, se requiere determinar la probabilidad de un intervalo de valores es decir, la probabilidad de encontrar entre 3 a 8 árboles con presencia del patógeno, se lee P(3 x 8); este se puede determinar de varias maneras. Como la suma de las probabilidades de cada valor x, osea, P(X= 3) +P(X= 4)+ P(X= 5) +P(X= 6)+ P(X= 7) +(P(X=8); así > dbinom(3, size=10, prob=0.15)+ dbinom(4, size=10, prob=0.15) +dbinom(5, size=10, prob=0.15) +dbinom(6, size=10, prob=0.15)+ dbinom(7, size=10, prob=0.15)+ dbinom(8, size=10, prob=0.15) [1] 0.1798032 otra manera, donde se escribiría menos, es restar la probabilidad de cola inferior o izquierda de 8 menos la probabilidad de cola izquierda o inferior de 2; P(X 8) P(X 2) > pbinom(8, size=10, prob=0.15, lower.tail=true)-pbinom(2, size=10, prob=0.15, lower.tail=true) [1] 0.1798032 Recordemos que estos cálculos de probabilidad fueron basados en dos parámetros: probabilidad de éxito de 0.15 y n = 10 árboles seleccionados. Ahora construyamos la tabla completa de probabilidades de acuerdo a estos dos parámetros, P=0.15 y n=10 > x<-0:10 > tabla < data.frame(x,p0.15=dbinom(0:10, size= 10, prob= 0.15)) > tabla
x P0.15 1 0 1.968744e-01 2 1 3.474254e-01 3 2 2.758967e-01 4 3 1.298337e-01 5 4 4.009571e-02 6 5 8.490856e-03 7 6 1.248655e-03 8 7 1.259148e-04 9 8 8.332598e-06 10 9 3.267686e-07 11 10 5.766504e-09 Y visualicemos en un histograma las probabilidades binomiales anteriores > plot(0:10, dbinom(0:10, size=10, prob=0.15), type = "h", lwd = 5, main = "Función de Distribución de Probabilidad para P=0.15 y n=10", ylab="probabilidad de X", xlab="número de árboles", font=2, cex.lab=1.5) Nótese como la distribución de las probabilidades es sesgada hacia la izquierda. Ahora construiremos en un solo gráfico cuatro histogramas mostrando las distribuciones de probabilidades para n = 10, pero con las probabilidades de éxito de P=0.10, P=0.30, P=0.50 y P=0.90 > par(mfrow=c(2,2)) > plot(0:10,dbinom(0:10,size=10,prob=0.10),type='h', ylab="probabilidad", main="p=0.10") > plot(0:10,dbinom(0:10,size=10,prob=0.25),type='h', ylab="probabilidad", main="p=0.25") > plot(0:10,dbinom(0:10,size=10,prob=0.50),type='h', ylab="probabilidad", main="p=0.50") > plot(0:10,dbinom(0:10,size=10,prob=0.90),type='h', ylab="probabilidad", main="p=0.90") > par(mfrow=c(1,1) Ahora note como cambia la forma de la distribución binomial cuando la probabilidad de éxito cambia de 0.1 hasta 0.9.
b) Distribución Poisson en R. En el cuadro 2 se describe los comandos necesarios para calcular probabilidades bajo una función de probabilidad Poisson. Primero notamos que la función en R llamada dpois sirve para determinar la probabilidad exacta de un valor de conteo x de acuerdo al parámetro lambda. Cuadro 2. Instrucciones R para el uso de la distribución Poisson. Función en R Opciones necesarias resultado dpois( ) x, lambda= Produce P(X = x); la probabilidad exacta de un valor x cualquiera ppois( ) ppois( ) x, lambda= lower.tail=true x, lambda= lower.tail=false Produce P(X x); la probabilidad de encontar un valor igual o menor a x; cola inferior Produce P(X x); la probabilidad de encontar un valor igual o mayor a x; cola superior Sigamos el siguiente ejemplo: En un rodal plantado con árboles de Pino caribe se ha determinado que en promedio 2.2 larvas de cortezas son encontradas en muestras de corteza de 100 cm 2 tomadas a 1,3 m sobre el suelo. Encuentre la probabilidad de que al seleccionar un trozo de corteza de 100 cm 2 se encuentre a) exactamente 3 larvas, b) menos de 3 larvas y c) mas de 3 larvas. Es de notar que el promedio 2.2 larvas por cada 100 cm 2 de corteza representa el parámetro lambda (λ), único elemento necesitado para determinar las probabilidades. Así que para la pregunta a) se pide P(X = 3), se puede usar la siguiente instrucción en R > dpois(3, lambda=2.2) [[1] 0.1966387 Para la pregunta b) se pide P(X < 3), es decir, una probabilidad de cola inferior o izquierda que sería equivalente a preguntar P(X < 3) = P(X 2). Se puede usar la siguiente instrucción en R > ppois(2, lambda=2.2, lower.tail=true ) [1] 0.6227137 Para la pregunta c) se pide P(X > 3), es decir, una probabilidad de cola superior o derecha que sería equivalente a preguntar P(X > 3) = P(X 4). Se puede usar la siguiente instrucción en R > ppois(4, lambda=2.2, lower.tail=false) [1] 0.07249631
Ahora construyamos la tabla completa de probabilidades de acuerdo al parámetro lambda= 2.2 > x<-0:15 > tabla < data.frame(x,lambda2.2=dpois(0:15, lambda=2.2)) > tabla x lambda2.2 1 0 1.108032e-01 2 1 2.437669e-01 3 2 2.681436e-01 4 3 1.966387e-01 5 4 1.081513e-01 6 5 4.758656e-02 7 6 1.744840e-02 8 7 5.483784e-03 9 8 1.508041e-03 10 9 3.686322e-04 11 10 8.109908e-05 12 11 1.621982e-05 13 12 2.973633e-06 14 13 5.032302e-07 15 14 7.907903e-08 16 15 1.159826e-08 y lo visualizamos en un histograma, nótese que hemos fijado que los valores de x van desde 0 hasta 15 con la instrucción 0:15 > plot(0:15,dpois(0:15,lambda=2.2),type='h', ylab="probabilidad", main="distribucion Poisson para lambda=2.2") como se hizo para la binomial ahora construiremos varias histogramas para la distribución poisson con diferentes valores de lambda: 0.1, 1.0, 5 y 10. usamos la siguientes instrucciones en R > par(mfrow=c(2,2)) > plot(0:15,dpois(0:15,0.1),xlab="",ylab="prob",type='h',main="lambda 0.1") > plot(0:15,dpois(0:15,1),xlab="",ylab="prob",type='h',main="lambda 1") > plot(0:15,dpois(0:15,5),xlab="",ylab="prob",type='h',main="lambda 5") > plot(0:15,dpois(0:15,10),xlab="",ylab="prob",type='h',main="lambda 10") > par(mfrow=c(1,1))
Ejercicios complementarios (puede realizarlos con R, con las tablas o aplicando la fórmula de la función de probabilidad respectiva) 1. Utilice la tabla de la distribución binomial para determinar las siguientes probabilidades: a) sí n=5 y p=0.2, hallar p(x=0) = b) sí n=10 y p=0.40, hallar p(x=9)= c) sí n=15 y p=0.50, hallar p(x=8)= d) sí n=7 y p= 0.83, hallar p(y=6)= e) sí n=9 y p=0.90, hallar p(y=9)= 2. Un examen está compuesto por 10 preguntas de verdadero y falso. Suponga que un estudiante, que no se preparó para tomar la prueba, recurre a la moneda para seleccionar sus respuestas y decide que sí sale cara esta es falsa y, sí sale sello, contestará verdadero. Cuál es la probabilidad de que el estudiante apruebe el examen sí para hacerlo debe responder al menos 7 correctamente?. 3. La empresa petrolera PDVSA se avocó a hacer perforaciones en el sureste de la región norte del Orinoco. Para ver la factibilidad financiera de que fuera conveniente hacer las perforaciones, PDVSA contrató los servicios de una firma de estudios estadísticos. Se sabe que, cada pozo perforado se clasifica como productivo o no productivo. La experiencia de es que, en este tipo de exploraciones, se sabe por experiencia que, el 15% de los pozos perforados son productivos. Para las exploraciones petroleras se seleccionaron aleatoriamente 12 sitios. Con esta información en mente, hacer los siguientes cálculos. (a) Cuál es la probabilidad de que los 12 pozos que se perforen en cada uno de los 12 sitios, sean productivos? (b) Cuál es la probabilidad de que ningún pozo perforado sea productivo? (c) Cuál es la probabilidad de que exactamente un pozo sea productivo? (d) Para hacer rentable al país, cuando menos tres de los pozos de exploración deben ser productivos. Siendo así, Cuál es la probabilidad de que el negocio sea rentable? (e) Encuentre la media y la varianza del número de exploraciones exitosas. 4. Un sistema de protección contra incendios está constituido con n unidades de radar que funcionan independientemente, cada una con probabilidad de 0.9 de detectar un incendio en la zona que cubren todas las unidades. Responda lo siguiente:
a) Sí n = 5 y un incendio se presenta en la zona, cuál es la probabilidad de que exactamente 4 unidades lo detecten?, y b) cuál sería la probabilidad de que al menos una unidad lo detecte? c) Defina la variable aleatoria discreta estudiada en este ejemplo. Parte 2. Distribución de probabilidad POISSON. 5. Utilice la tabla de distribución POISSON para encontrar: a) si µ=2.5, hallar P(Y=2)= b) si µ =8.0, hallar P(Y=8)= c) si µ =0.5, hallar P(Y=1)= d) si µ = 3.7, hallar P(Y=0)= 6. Sea Y una variable aleatoria con una distribución de Poisson con media = 2. Encuentre a) P(Y = 4) c) P(Y > 4) b) P(Y < 4) d) P( 2 < Y 4) 7. En un almacén en particular el número de clientes llegan al mostrador de caja por hora, tiene una distribución de probabilidad de Poisson con un promedio de siete clientes por hora. En una hora dada, Cuál es la probabilidad de que a) No lleguen más de tres clientes?. b) Lleguen al menos dos clientes?. c) Lleguen exactamente cinco clientes?. 8. Cierto tipo de árboles tiene retoños dispersos de manera aleatoria sobre un área extensa, con una densidad promedio de retoños de aproximadamente de 5 por 250 m 2. a) Encuentre la probabilidad de que un botánico, al escoger aleatoriamente parcelas de 250 m 2 en esa área, no encuentre retoño alguno en ninguna de las parcelas. b) Cuál deberá ser la probabilidad de encontrar más de 1 retoño?.