Familias de distribuciones

Capítulo 2 Familias de distribuciones 2.1. Introducción Las distribuciones estadísticas son usadas para modelar poblaciones a través de un miembro de una familia de distribuciones. Cada familia se encuentra indexada por uno o más parámetros que permiten establecer ciertas características sobre la distribución. Se podría considerar, por ejemplo, que la distribución normal es un modelo razonable para una población en particular aún cuando no sea posible especificar por el momento el valor de la media, es decir se elige una familia paramétrica de distribuciones normales con media µ. 2.2. Distribuciones discretas Una variable aleatoria X se dice tiene una distribución discreta si su rango es numerable. En muchas situaciones, esta variable aleatoria toma valores enteros. Se presentan a continuación las principales distribuciones discretas. Distribución uniforme discreta Una variable aleatoria X tiene distribución uniforme discreta (1, N) si: Pr(X = x N) = 1 N x = 1, 2,, N (2.2.1) 12

CAPÍTULO 2. FAMILIAS DE DISTRIBUCIONES 13 donde N es un número entero. La media y varianza de la distribución uniforme discreta son: E[X] = N + 1 2 Var (X) = (N + 1)(N 1) 12 Si el espacio muestral es cualquier rango de enteros N 0, N 0 + 1,, N 1 entonces la función de probabilidad es: Pr(X = x N 0, N 1 ) = En general, se denota por X UD(N 0, N 1 ). Distribución hipergeométrica 1 N 0 N 1 + 1 Una variable aleatoria X tiene distribución hipergeométrica (N, M, n) si: Pr(X = x N, M, n) = ( )( ) M N M x n x ( ) (2.2.2) N n La media y varianza de la distribución hipergeométrica son: ( ) (N M)(N n) E[X] = n M N Var (X) = nm N N(N 1) La notación para la distribución hipergeométrica es X H(N, M, n). Ejemplo 2.2.1 Un ingeniero de control de calidad inspecciona una muestra tomada al azar de dos calculadoras manuales de cada lote de tamaño 18. El lote sera aceptado si ambas calculadoras están en buenas condiciones de trabajo de otra manera se inspecciona todo el lote y el costo se carga al vendedor. Cuál es la probabilidad de que un lote se acepte sin tener que hacer una inspección total si éste contiene cuatro calculadoras que no están en buenas condiciones de trabajo? Se define la variable X = número de calculadoras en buenas condiciones seleccionadas en la muestra de tamaño cuatro, entonces X H(N = 18, M = 14, n = 2). En R los parámetros para esta distribución son H(m = 14, n = 4, k = 2) donde k es el tamaño de muestra, m = M y n = N M.

CAPÍTULO 2. FAMILIAS DE DISTRIBUCIONES 14 > dhyper(x = 2, m = 14, n = 4, k = 2) [1] 0.5947712 Distribución binomial Una variable aleatoria tiene distribución Bernoulli(p) si: 1 con probabilidad p X = 0 con probabilidad 1 p con 0 p 1. El valor de X = 1 es comunmente llamado éxito y p la probabilidad de éxito. La media y varianza de la distribución Bernoulli son: E[X] = p Var (X) = p(1 p) y se denota por X B(p). Si se tiene una secuencia de variables aleatorias independientes tales que X i B(p) entonces la variable aleatoria Y = n i=1 X i tiene distribución binomial(n, p) y su función de probabilidad es: Pr(Y = y n, p) = ( ) n p y (1 p) n y, y = 0, 1, 2,, n (2.2.3) y Se denota por Y BI(n, p). La media y varianza de la distribución binomial son: E[Y ] = np Var (Y ) = np(1 p) Ejemplo 2.2.2 Un informe aparecido en el diario Gestión indica que el 58 % de los trabajadores de Lima tienen sueldos superiores al mínimo vital. Si se entrevista a 50 trabajadores de Lima elegidos al azar hallar la probabilidad de que más de 36 de ellos tengan sueldos superiores al mínimo vital. Sea la variable aleatoria Y = número de trabajadores con sueldos superiores al mínimo vital, entonces Y BI (n = 50, p = 0,58). Usando R se tiene: > 1 - pbinom(q = 36, size = 50, prob = 0.58) [1] 0.01415173

CAPÍTULO 2. FAMILIAS DE DISTRIBUCIONES 15 Distribución Poisson Una variable aleatoria X que toma valores en los enteros no negativos tiene distribución Poisson(λ) si: Pr(X = x λ) = e λ λ x, x = 0, 1, 2, (2.2.4) x! La media y varianza de la distribución Poisson son: E[X] = λ Var (X) = λ Se denota por X P (λ). Ejemplo 2.2.3 Considere un operador telefónico que recibe, en promedio, cinco llamadas cada tres minutos según un proceso de Poisson. Cuál es la probabilidad de no recibir llamadas en el siguiente minuto? Cuál es la probabilidad de recibir al menos dos llamadas? Sea X = número de llamadas telefónicas recibidas en un minuto, entonces X P (λ = 5/3). Usando R se tiene: > dpois(x=0, lambda=5/3) [1] 0.1888756 > 1 - ppois(q=1, lambda=5/3) [1] 0.4963317 Distribución binomial negativa Suponga que se desea contar el número de ensayos necesarios para obtener un número fijo de éxitos en una secuencia de ensayos independientes con distribución B(p). Sea la variable aleatoria X definida como el ensayo en el que se obtiene el r-ésimo éxito, donde r es un entero, entonces: Pr(X = x r, p) = ( ) x 1 p r (1 p) x r, x = r, r + 1, (2.2.5) r 1

CAPÍTULO 2. FAMILIAS DE DISTRIBUCIONES 16 y se dice que X tiene distribución binomial negativa(r, p). La media y varianza de la distribución binomial negativa son: (1 p) E[X] = r p Var (X) = r(1 p) p 2 y se denota por X BN (r, p). La distribución binomial negativa también se define en términos de la variable aleatoria Y = número de fracasos antes del r-ésimo éxito, es decir Y = X r. Luego, la fórmula alternativa de la distribución binomial negativa es: ( ) r + y 1 Pr(Y = y r, p) = p r (1 p) y, y = 0, 1, 2, (2.2.6) y Ejemplo 2.2.4 Se sabe que la tasa de fallas en una línea de producción es del 10 %. Si en una inspección de control de calidad se analizan los productos que salen de dicha línea de producción. Cuál es la probabilidad que sea necesario inspeccionar ocho productos para encontrar el tercer producto defectuoso? Sea X =número de productos inspeccionados hasta encontrar el tercero defectuoso, entonces X BN (r = 3, p = 0,10). Usando R se tiene: > dnbinom(x=8, size=3, prob=0.10) [1] 0.01937102 Distribución geométrica La distribución geométrica es un caso especial de la distribución binomial negativa. Si se toma r = 1 en 2.2.5 se tiene: Pr(X = x p) = p(1 p) x 1, x = 1, 2, (2.2.7) la que define la función de probabilidad de una variable aleatoria X con distribución geométrica(p) que se puede interpretar como el ensayo en el que se obtiene el primer éxito. La media y varianza son:

CAPÍTULO 2. FAMILIAS DE DISTRIBUCIONES 17 E[X] = 1 p Var (X) = (1 p) p 2 y se denota por X G(p). La distribución geométrica tiene una propiedad interesante conocida como la propiedad de falta de memoria. Para enteros s > t se tiene: Pr(X > s X > t) = Pr(X > s t) (2.2.8) Ejemplo 2.2.5 La probabilidad de que un estudiante para piloto apruebe el examen escrito para obtener una licencia de piloto privado es 0,7. Cuál es la probabilidad de que el estudiante apruebe el examen en el tercer intento? Sea X = número de intentos hasta obtener la licencia de piloto privado, entonces X G(p = 0,7). En R se debe considerar que la variable aleatoria geométrica se define como el número de intentos antes de obtener la licencia de piloto, entonces la probabilidad pedida es: > dgeom(x=2, prob=0.7) [1] 0.063 2.3. Distribuciones continuas El interés en la sección anterior se centro en aquellas variables aleatorias cuyo rango puede ser descrito como una lista finita o infinita numerable de valores. Por otro lado, las variables aleatorias continuas son aquellas cuyo rango esta formado por un conjunto infinito no numerable de valores. En esta sección se presentan algunas de las familias más conocidas de distribuciones continuas que constituyen algunos de los modelos más utilizados en Estadística.

CAPÍTULO 2. FAMILIAS DE DISTRIBUCIONES 18 Distribución uniforme La distribución uniforme continua se define sobre el intervalo [a, b] con la siguiente función de densidad: 1 a x b b a f(x a, b) = (2.3.1) 0 de otro modo La media y varianza de la distribución uniforme continua son: E[X] = a + b 2 y se denota por X UC(a, b). Var (X) = (b a)2 12 Ejemplo 2.3.1 El tiempo que un trabajador de construcción civil utiliza durante su refrigerio para ir a la cafetería, almorzar y regresar a su puesto de trabajo es una variable aleatoria con distribución uniforme en el intervalo de 0 a 25 minutos. Si el horario de refrigerio de los trabajadores empieza al mediodía y en ese momento Juan decide ir a la cafetería. Calcular la probabilidad que Juan este de vuelta a su puesto de trabajo en menos de un cuarto de hora. Sea X = tiempo (en minutos) que un trabajador de construcción civil utiliza durante su refrigerio para ir a la cafetería, almorzar y regresar a su puesto de trabajo, entonces X UC(a = 0, b = 25). Usando R se tiene: > punif(q=15, min=0, max=25) [1] 0.6 Distribución gamma La distribución gamma es una familia flexible de distribuciones sobre [0, ). Si α es una constante positiva, la integral: ˆ 0 t α 1 e t dt es finita y su valor define la función gamma:

CAPÍTULO 2. FAMILIAS DE DISTRIBUCIONES 19 Γ(α) = ˆ 0 t α 1 e t dt (2.3.2) Esta función satisface muchas relaciones útiles, en particular: Se tiene que para cualquier entero n > 0: Γ(α + 1) = αγ(α), α > 0 (2.3.3) como la integral en 2.3.2 es positiva, se tiene que: Γ(n) = (n 1)! (2.3.4) f(t) = tα 1 e t Γ(α), 0 < t < (2.3.5) es una función de densidad. Si se define la variable aleatoria X = βt, donde β es una constante positiva se obtiene la familia gamma(α, β): f(x α, β) = 1 Γ(α)β α xα 1 e x/β, 0 < x < (2.3.6) donde α > 0 es llamado el parámetro de forma y β > 0 el parámetro de escala. La media y varianza de la distribución gamma son: y de denota por X G(α, β). E[X] = αβ Var (X) = αβ 2 Ejemplo 2.3.2 Suponga que el tiempo que un estudiante emplea en revisar su correo electrónico tiene una distribución gamma con media de 20 minutos y varianza de 80 minutos 2. Cuál es la probabilidad de que un alumno necesite entre 20 y 30 minutos para revisar su correo electrónico? Sea X = tiempo (en minutos) que un estudiante emplea en revisar su correo electrónico, entonces X G(α = 5, β = 4). Usando R se tiene: > pgamma(q=30, shape=5, scale=4) - pgamma(q=20, shape=5, scale=4) [1] 0.3084314

CAPÍTULO 2. FAMILIAS DE DISTRIBUCIONES 20 Existen dos casos importantes de la distribución gamma. Si se toma α = p/2, donde p es un entero y β = 2, entonces la función de densidad gamma se convierte en: f(x p) = 1 Γ(p/2)2 p/2 xp/2 1 e x/2, 0 < x < (2.3.7) que es conocida como la función de densidad chi-cuadrado con p grados de libertad y se denota por X χ 2 p. Otro caso especial se obtiene cuando α = 1, es decir: f(x β) = 1 β e x/β, 0 < x < (2.3.8) conocida como la función de densidad exponencial con parámetro de escala β y se denota por X E (β). La distribución exponencial comparte la propiedad de pérdida de memoria de la geométrica, es decir que para s > t 0: Pr(X > s X > t) = Pr(X > s t) Otra distribución relacionada a la familia gamma y exponencial es la distribución Weibull. Si X E (β) entonces Y = X 1/γ tiene distribución W(γ, β) cuya función de densidad es: donde γ > 0 y β > 0. Distribución normal f Y (y γ, β) = γ β yγ 1 e yγ /β, 0 < y < (2.3.9) La función de densidad de la distribución normal con media µ y varianza σ 2 es dada por: f(x µ, σ 2 ) = 1 2πσ e (x µ)2 2σ 2, < x < (2.3.10) Se denota por X N (µ, σ 2 ) donde: E[X] = µ Var (X) = σ 2

CAPÍTULO 2. FAMILIAS DE DISTRIBUCIONES 21 Si X N (µ, σ 2 ) entonces la variable aleatoria Z = (X µ)/σ tiene distribución N (0, 1) conocida como distribución normal estándar. Se puede probar que la función de densidad normal 2.3.10 toma su valor máximo en x = µ y que sus puntos de inflección (donde la curva cambia de cóncava a convexo) son x = µ ± σ. La probabilidad que X este contenida en 1, 2 o 3 desviaciones estándar alrededor de su media es: Pr( X µ σ) = Pr( Z 1) = 0,6826 Pr( X µ 2σ) = Pr( Z 2) = 0,9544 Pr( X µ 3σ) = Pr( Z 3) = 0,9974 Ejemplo 2.3.3 El peso de los melones que comercializa una tienda de frutas sigue una distribución normal con media de 2 kilogramos y desviación estándar de 500 gramos. Los melones inferiores a 1,9 kg no se comercializan y se envían a la fábrica de conservas. Cuál es la probabilidad que un melón elegido al azar no sea enviado a la fábrica de conservas? Sea X = peso de los melones (en kilogramos) que comercializa la tienda de frutas. entonces X N (µ = 2, σ 2 = 0,5 2 ). Usando R se tiene: > 1 - pnorm(q=1.9, mean=2, sd=0.5) [1] 0.5792597 Distribución beta La familia de distribuciones beta es una familia continua en (0, 1) indexada por dos parámetros. La función de densidad beta(α, β) es: f(x α, β) = 1 B(α, β) xα 1 (1 x) β 1, 0 < x < 1 (2.3.11) se denota por X BE(α, β) donde α > 0, β > 0 y B(α, β) es la función beta: B(α, β) = ˆ 1 0 x α 1 (1 x) β 1 dx

CAPÍTULO 2. FAMILIAS DE DISTRIBUCIONES 22 La función beta está relacionada con la función gamma a través de la siguiente identidad: B(α, β) = Γ(α)Γ(β) Γ(α + β) (2.3.12) El cálculo de los momentos para esta distribución se obtiene a través de la siguiente expresión: E[X n ] = B(α + n, β) B(α, β) = Γ(α + n)γ(α + β) Γ(α + β + n)γ(α) Usando 2.3.3 y 2.3.13 con n = 1 y n = 2 se obtiene: (2.3.13) E[X] = α α + β Distribución Cauchy Var (X) = αβ (α + β) 2 (α + β + 1) (2.3.14) La distribución Cauchy es una distribución simétrica con forma de campana sobre (, ) cuya función de densidad es: f(x θ) = 1 π 1, < x < (2.3.15) 1 + (x θ) 2 La media de la distribución de Cauchy no existe por lo que tampoco existen los momentos para esta distribución. En particular, la función generatriz de momentos no existe. Distribución log-normal Si X es una variable aleatoria cuyo logaritmo tiene distribución normal, es decir log X N (µ, σ 2 ) entonces X tiene distribución log-normal. La función de densidad de X es: f(x µ, σ 2 ) = 1 1 (log x µ) 2 2πσ x e 2σ 2 < x < (2.3.16) < µ < y σ > 0, conocida como la función de densidad lognormal. Los momentos de X pueden obtenerse usando 2.3.16 o la relación con la distribución normal:

CAPÍTULO 2. FAMILIAS DE DISTRIBUCIONES 23 E[X] = e µ+σ2 /2 Var (X) = e 2(µ+σ2) e 2µ+σ2 (2.3.17) Se denota por X LN (µ, σ). Distribución doble exponencial La distribución doble exponencial se toma reflejando la distribución exponencial alrededor de su media. Su función de densidad esta dada por: f(x µ, σ) = 1 2σ e x µ /σ < x < (2.3.18) < µ < y σ > 0. La distribución doble exponencial proporciona una distribución simétrica con colas más pesadas. La media y varianza de esta distribución son: Se denota por X DE(µ, σ). E[X] = µ Var (X) = 2σ 2 2.4. Familias exponenciales Una familia de funciones de densidad o probabilidad es llamada una familia exponencial si puede expresarse como: { k } f(x θ) = h(x)c(θ) exp w i (θ)t i (x) (2.4.1) i=1 donde h(x) 0, t 1 (x),, t k (x) son funciones de las observaciones x, c (θ) 0 y w 1 (θ),, w k (θ) son funciones del vector de parámetros θ. Muchas familias mencionadas en la sección anterior son familias exponenciales. Estas incluyen las familias continuas normal, gamma, beta y las familias discretas binomial, Poisson y binomial negativa. Para verificar si una familia de funciones de probabilidad o densidad es una familia exponencial, se deben identificar las funciones h(x), c(θ), w i (θ) y t i (x) para demostrar que la familia tiene la forma 2.4.1. Ejemplo 2.4.1 La distribución BI(n, p) pertenece a una familia exponencial si n conocido.

CAPÍTULO 2. FAMILIAS DE DISTRIBUCIONES 24 Ejemplo 2.4.2 La distribución N (µ, σ) pertenece a una familia exponencial. El rango de la distribución no puede depender de θ en una familia exponencial. La definición completa de la función de probabilidad o densidad debe incluir el rango a través del uso de una función indicadora. Definición 2.4.1 La función indicadora de un conjunto A, denotado por I A (x), es la función: 1 x A I A (x) = 0 x / A Ejemplo 2.4.3 La función de densidad dada por: f(x θ) = θ 1 exp {1 (x/θ)}, x > θ (2.4.2) x. no es una familia exponencial ya que el rango no depende solamente de 2.5. Familias de locación y escala En esta sección se discutirán tres técnicas para construir familias de distribuciones. Estos tipos son: familias de locación, escala y locación-escala. Cada familia se construye especificando una función de densidad simple, digamos f(x), llamada la función de densidad estándar de la familia. Luego todas las funciones de densidad en la familia se generan transformando la función de densidad estándar en la forma prescrita. Definición 2.5.1 Sea f(x) una función de densidad. Entonces la familia de funciones de densidad f(x µ) indexada por el parámetro < µ < es llamada la familia de locación con función de densidad estándar f(x) y µ es el parámetro de locación para la familia. Ejemplo 2.5.1 Sea f(x) = e x, x 0. Para formar la familia de locación se reemplaza x con x µ: e (x µ) x µ 0 f(x µ) = 0 x µ < 0 = e (x µ) x µ 0 x < µ

CAPÍTULO 2. FAMILIAS DE DISTRIBUCIONES 25 Figura 2.1: Miembros de una familia de locación 0.0 0.2 0.4 0.6 0.8 1.0 0 2 4 6 8 10 Definición 2.5.2 Sea f(x) una función de densidad. Entonces para todo σ > 0, la familia de funciones de densidad (1/σ)f(x/σ) indexada por el parámetro σ, es llamada la familia de escala con función de densidad estándar f(x) y σ es el parámetro de escala de la familia. Ejemplo 2.5.2 La distribución gamma con α fijo y la distribución normal con µ = 0 son ejemplos de familias de escala. En cada caso la función de densidad estándar se obtiene tomando el parámetro de escala igual a 1.

CAPÍTULO 2. FAMILIAS DE DISTRIBUCIONES 26 Figura 2.2: Miembros de una familia de escala 0.0 0.2 0.4 0.6 0.8 1.0 6 4 2 0 2 4 6 Definición 2.5.3 Sea f(x) una función de densidad. Entonces la familia de funciones de densidad (1/σ)f ((x µ)/σ), < µ < y σ > 0, indexada por los parámetros (µ, σ) es llamada la familia de locación-escala con función de densidad estándar f(x), µ es el parámetro de locación y σ es el parámetro de escala. Ejemplo 2.5.3 La distribución normal y la distribución exponencial son ejemplos de familias de locación-escala.

CAPÍTULO 2. FAMILIAS DE DISTRIBUCIONES 27 Figura 2.3: Miembros de una familia de locación-escala 0.0 0.2 0.4 0.6 0.8 1.0 6 4 2 0 2 4 6 El cálculo de una probabilidad para cualquier miembro de una familia de locación escala puede obtenerse en términos de la variable estandarizada Z ya que: ( X µ Pr(X x) = Pr x µ ) ( = Pr Z x µ ) σ σ σ El cálculo de las probabilidades para la distribución normal usando la distribución normal estándar es un claro ejemplo.