Distribuciones de probabilidad Prof, Dr. Jose Jacobo Zubcoff Departamento de Ciencias del Mar y Biología Aplicada
Inferencia estadística: Parte de la estadística que estudia grandes colectivos a partir de una pequeña parte de éstos (Población - Muestra) Características de la muestra Tipos de procedimientos: Introducción Representativa de la población Alcanzar objetivos precisión fijados Inferencia paramétrica: Se admite que la distribución de la pob. pertenece a una familia paramétrica de distribuciones Inferencia no paramétrica: No supone una distribución de prob. y las hipótesis son más generales (como simetría)
Introducción Inferencia Estadística Muestra Población x µ s σ
Tipos de variables Introducción Variables cualitativas, categóricas o atributos: No toman valores numéricos y describen cualidades. Ej. Clasificación en base a una cualidad. Variables cuantitativas discretas: Toman valores enteros, por lo generar contar el nº de veces que ocurre un suceso. Variables cuantitativas continuas: Toman valores en un intervalo, por lo general medir magnitudes continuas. Variables aleatorias
Variables aleatorias Introducción Variable aleatoria: Cualquier función medible que asocia a cada suceso en un experimento aleatorio un número real Variable aleatoria discretas: Una variable aleatoria es discreta si toma valores aislados o puntuales Variable aleatoria continua: Una variable aleatoria es continua si puede tomar cualquier valor dentro de uno o varios intervalos determinados
Introducción Ejemplo: Estudio de dejar de fumar con parches de nicotina respecto a la edad de dichos pacientes sobre 189 pacientes. 0.40 1.00 0.35 0.90 0.80 0.30 0.70 0.25 0.60 fr 0.20 fr acum. 0.50 0.15 0.40 0.30 0.10 0.20 0.05 0.10 0.00 30-39 40-49 50-59 60-69 70-79 80-89 Edad Nº de intervalos entre 4 y 10 0.00 0 1 2 3 4 5 6 Intervalo r = 1+ 1.33ln( n) r = 1+ 3.33(log189) = 8.558 9
Introducción Caracterización: Variables aleatorias discretas (v.a.d.): Función de probabilidad: Asigna a cada posible valor de una variable discreta su probabilidad. Para valores x1, x2,, xn, se asocia una p1, p2,, pn, donde ( n/ ) P X = x ) y p i = 1 ( i Función de distribución: F(x) en un valor x es la probabilidad de que X tome valores menores o iguales a x. Acumula toda la probabilidad entre menos infinito y el punto considerado i= 1 F( x) = P( X x)
Introducción Caracterización: Variables aleatorias continuas (v.a.c.): Función de densidad: Es una función no negativa de integral 1 Función de distribución: Para las v.a.c. queda definida por: x F ( x) = P( X x) = f ( u) du P( a < X < b) = P( a X b) = f ( x) dx = F( b) F( a) b a
Introducción Función de Probabilidad frente a Función de densidad Función de Distribución
Introducción Función esperanza matemática: Variables aleatorias discretas: E[ X ] = i 1 x i p i Variables aleatorias continuas con función de densidad f: E [ X ] = xf ( x) dx + E[X] es el primer momento respecto al origen y por tanto representa la media, esperanza o valor de X
Función Varianza: El momento de orden 2 respecto a la media responde a V[X] y se define como: 1. Discretas: Introducción V[ X ] = µ 2 2 = ( xi E[ X ]) p i 2. Continuas: 2 V [ X ] = µ = ( x E[ X ]) f ( x) dx + 2
Modelos de distribución discreta
Proceso de Bernoulli Ejemplo: Se ha efectuado un experimento sobre avistamientos de cetáceos en un punto determinado. En 200 salidas efectuadas se han anotado 10 avistamientos de cachalote. Describir el experimento: Solución: X = Avistar cachalotes X=1 (éxito) = 10/200 = 0.05 (5%) X=0 (fracaso) q 1 p = 0.95 p 0.05
Distribución Binomial Resultado de ejecutar n veces un experimento de Bernoulli. Condiciones: Condiciones no varían Experimentos independientes (prob. no condicional) Definición del proceso: X Nº de éxitos en los n intentos independientes Cantidad de veces que se ejecuta (n) Prob. de éxito (p) Veces que se obtiene el éxito en las veces que se ejecuta (k)
Distribución Binomial Definición: Distribución discreta aplicable a poblaciones con solo dos elementos complementarios (ser o no ser). Condición: Las definidas por las pruebas de Bernoulli: Solo pueden darse dos resultados Pruebas independientes entre si Probabilidades constantes Ejemplos de aplicación: Situaciones duales día seco/ día húmedo 2 µ = np σ = npq
Distribución Binomial Expresión: Para p=prob. de éxito y q=1-p=prob. de fracaso P( X = x) Cuándo utilizarla? = n x n x otrox Cuando nos dan una determinada cantidad de elementos Cada elemento puede o no cumplir la condición Dan o se puede calcular la prob. de que se de la condición La pregunta es Cuál es la prob. de que determinados elementos cumplan la condición? p x 0 q 0 x n
Distribución Binomial Ejemplo De una población de cetáceos se sabe que el 60% son machos. Si se extrae un conjunto de 10 de ellos, cuál es la probabilidad de que en ese conjunto haya 7 hembras? X = Nº de hembras en el conjunto n = 10 P = 0.4 P( X 10 = 7) = 0.4 7 7 0.6 10 7 = 0.042 Cuál es la probabilidad de que hayan 3 o menos hembras? P( X 3) = P( X = 0) + P( X = 1) + P( X = 2) + P( X = 3) = 0.382 Tabla Binomial
Distribución Binomial Cuál es la probabilidad de que en ese conjunto haya 7 machos o menos? PROBLEMA CON LAS TABLAS (p hasta 0.5) n = 10 P = 0.6 P(X<7) Complementario n = 10 P = 0.4 P(X>3) P( X 3) = 1 P( X 2) = 0.1673 P( X 7) = 1 0.1673 = 0.8327
Distribución Binomial
Proceso de Poisson Generalización en un soporte continuo del proceso de Bernoulli. Características: Distribución de Poisson Proceso estable: A largo plazo produce un número medio de sucesos constante por unidad de observación Aparece aleatoriamente de forma independiente (sin memoria) X Nº de éxitos en los n intentos en el soporte continuo La función viene caracterizada por el parámetro λ = E [ X ] = Var[ X ]
Distribución de Poisson Definición: La distr. De Poisson con parámetro es la que tiene como función de masa: P( X = x) = e Suele presentarse como límite de la distribución binomial cuando y p 0 n λ x λ x! 0 x x < 0 0 λ = E [ X ] = Var[ X λ( λ > 0) ]
Distribución de Poisson Cuándo y cómo utilizarla? Se conoce como de sucesos raros. Suele utilizarse como aproximación de una binomial con la misma media y o con n > 30 p < 0. 1 np = λ > 30 Su función de probabilidad puede ajustarse sustituyendo el parámetro de la función por la media. Binomial np = λ >1 Poisson p < 0.1 µ = np σ = npq npq > 5 λ > 5 σ = µ = λ λ A partir de Peña, 2001 Normal
Distribución de Poisson
Distribución de Poisson Ejemplo Los avistamientos de cachalotes sigue una distribución de Poisson de media 2 avistamientos en un transecto de muestreo de 1km de recorrido tras una salida en barco. Calcula la probabilidad de: 1. Ningún avistamiento en el recorrido del barco: P( X = 0) = e 2 0 2 0! = 0.135 2. Menos de cinco en el mismo recorrido: 2 3 4 2 2 2 2 P( X 4) = e 1+ 2 + + + = 0.947 2! 3! 4! 3. Y menos de seis si consideramos un recorrido de 5km P( X ' 5/ λ ) = e 10 10 0! 0 10 + 1! 1 10 + 2! 2 10 + 3! 3 10 + 4! 4 10 + 5! 5 = 0.067 ' λ = λ 5 = 10
Distribución de Poisson Y menos de nueve si consideramos un recorrido de 2km ' λ = λ 2 = 4 P( X ' 8/ λ ) = 0.018 + 0.073 + 0.147 + 0.195 + 0.195 + 0.156 + 0.104 + 0.06 + 0.03 = 0.978 Utilización de la tabla
Distribución Binomial Comando a utilizar con R: dbinom(x,tamaño,prob): Función de probabilidad pbinom(x,tamaño,prob): F. prob. acumulada qbinom(prob,tamaño,prob): Quantiles rbinom(nobs,tamaño,prob): Números pseudoaleatorios
Distribución Poisson Comando a utilizar con R: dpois(x,lambda): Función de probabilidad ppois(x,lambda): F. prob. acumulada qpois(prob,lambda): Quantiles rpois(nobs,lambda): Números pseudoaleatorios