Estadísticas y distribuciones de muestreo D I A N A D E L P I L A R C O B O S D E L A N G E L 7/11/011 Estadísticas Una estadística es cualquier función de las observaciones en una muestra aleatoria que no depende de parámetros desconocidos. Por ejemplo, si X 1, X,,X n es una muestra aleatoria de tamaño n, entonces la media de la muestra X, la varianza de la muestra S y la desviación estándar S son estadísticas. X n X i ( X i X ) i 1 i 1 S n n 1 n El proceso de extraer conclusiones en torno a poblaciones con base en datos de muestras utiliza estadísticas en forma considerable. 1
Distribuciones muestrales 3 Supóngase que se toma una muestra aleatoria de tamaño n, X 1, X,, X n de una población con distribución Normal, N(m,s ). Cada observación es una v.a. con distribución N(m,s ) Entonces la media X es una v. a. con distribución N(m,s /n) Teorema de Límite Central Si X es la media de una muestra aleatoria de tamaño n que se toma de una población con media m y varianza s, entonces, el estadístico X m Z s / n Se aproxima a una distribución Normal estándar cuando n tiende a infinito. 4 Observación: esta aproximación será mejor para n 30 sin importar la forma de la población. Si n < 30 la aproximación es buena sólo si la población no difiere mucho de una distribución Normal.
Distribución Ji cuadrada c Sean Z 1, Z,, Z n variables aleatorias con distribución normal estándar, es decir N(0,1). Entonces n Y Z i 1 i Z 1 Z... Zn cn Tiene la función de densidad Ji cuadrada con n grados de libertad 5 Distribución Ji cuadrada c 6 3
Características de Ji cuadrada c Asimétrica y asintótica al eje x por la derecha; Su dominio va de 0 a + Área bajo la curva desde 0 a + =1 Tiene parámetro = n (g.l.) Al aumentar n se aproxima a la normal Representa distribución muestral de varianza. Entre las aplicaciones: Determinación intervalos confianza para varianzas Pruebas de hipótesis para una varianza El ajuste de datos a una distribución dada conocida Las pruebas de independencia. 7 Gráficas de Ji cuadrada c 8 4
Distribución Ji cuadrada c 9 =DISTR.CHI(x; ) Probabilidad c Excel Devuelve la probabilidad de una variable aleatoria continua siguiendo una distribución Ji cuadrada de una sola cola con gl. P(X>c ) 10 5
Probabilidad c 11 Probabilidad c Inversa Excel =PRUEBA.CHI.INV(P, ) 1 Devuelve el valor de c para una probabilidad dada, de una distribución Ji-cuadrada de una sola cola con g.l. 6
Ejercicios Ji cuadrada c 13 a) Calcular la probabilidad de obtener un valor mayor de 3.7 en una distribución c con = 14 g.l., es decir P( c 14 3.7) b) Calcular el valor de c después del cual se encuentre el 5 % del área en una distribución Ji-cuadrado con 4 g.l., es decir P( c c ) 0.05 4 Distribución t de Student 14 Desarrollada con base en distribuciones de frecuencia empíricas por el estadístico William Gosset, cuyo seudónimo era Student. Gosset trabajó en la Cervecería Guiness de Dublín y tenía dificultades al usar la distribución Normal en muestras pequeñas The probable error of a mean Biometrika 1908 Fisher fue quien encontró mas aplicaciones para ésta. 7
Distribución t de Student 15 La distribución muestral de la media de una muestra aleatoria X se ajusta muy bien a la distribución Normal si se conoce s. Si n es grande, esto no presenta ningún problema, aún cuando s sea desconocida, por lo que en este caso es razonable sustituirla por s. Sin embargo, en el caso de usar valores de n < 30, o sea en el caso de pequeñas muestras, esto no funciona tan bien, y la distribución que mejor se ajusta es la t de Student. Distribución t de Student 16 Sean Z es una v.a. Normal estándar y V es una v.a. Ji con k grados de libertad. Si Z y V son independientes, entonces la v.a. Z T V / k tiene una distribución t con n grados de libertad, cuya función de densidad es: 8
Distribución t de Student Definiendo el estadístico t: 17 t = x - m s / n Se puede probar que siendo `x la media de una muestra de tamaño n tomada de una población Normal con media m y varianza s, el estadístico t es el valor de una variable aleatoria con distribución "t" de Student y parámetro (grados de libertad) = n-1. Distribución t de Student 18 9
Distribución t de Student 19 Características de la distribución t Tiene media igual 0, es asintótica al eje x y su dominio va de - a + ; El área bajo la curva desde - a + es igual a 1 m 0, s depende parámetro (grados libertad) Varianza > 1, pero se aproxima a 1 cuando n Al aumentar n, la distribución t se aproxima a la Normal; n > 30 ó más, excelente aproximación Entre las aplicaciones: 0 Estimación de intervalos de confianza para medias a partir de muestras pequeñas Pruebas de hipótesis basadas en muestras < 30 10
Distribución t de Student 1 Distribución t de Student Las tablas brindan sólo los puntos porcentuales de la cola superior 11
=DISTR.T(x,,colas) Probabilidad t en Excel Devuelve el área a la derecha de x (a) x= valor de t (solo positivo) = grados de libertad Colas = 1 o colas colas= 1, P( X>t ) colas =, P( X > t); P(X > t o X < -t). 3 Probabilidad t Inversa en Excel =DISTR.T.INV(a, ) Devuelve el valor de t de dos colas, después del cual se encuentra el a x 100% del área de la curva. P( X > t) = P(X < -t o X > t). Para una cola, remplazar a por a. 4 1
Ejercicio distribución t de Student a) Calcular la probabilidad de obtener un valor mayor que,6 en una distribución t con 9 gdl b) Calcular la probabilidad de obtener un valor mayor que,6 o menor que -,6 en una distribución t con 9 gdl c) Calcular el valor de t después del cual se encuentre el 5% del área de la curva con 9 gdl d) Calcular el valor de t para a= 0,05 con 9 gdl y dos colas 5 Distribución "F de Fisher Sean W y Y v.a. con distribución Ji cuadrada, independientes con n 1 y n grados de libertad respectivamente. Entonces el cociente 6 W / n F Y / n Sigue la distribución F con n 1 = u g.l. en el numerador y n = v g.l. en el denominador y su función de densidad es: 1 13
Distribución "F de Fisher También llamada "F de Fisher - Schnedecor Representa la distribución muestral de la razón de dos varianzas. Es decir que se obtiene de la razón de dos distribuciones Ji-cuadradas. Definimos el estadístico F como: El cual es el valor de una variable aleatoria que tiene distribución F con parámetros n 1 y n 7 s F = s 1 Propiedades de distribución F Asimétrica, y asintótica al eje x por el lado derecho Su dominio va de 0 a + Área bajo curva desde 0 a + =1 Tiene parámetros n 1 y n Entre sus aplicaciones: Pruebas de hipótesis entre varianzas Análisis de varianza Análisis de covarianza. 8 14
Gráfica de la distribución F 9 Propiedades de Distribución F 30 E( F) n n V ( F) n n ( n 1 ( n1 n ) ) ( n 4) 15
Gráfica de la distribución F 31 =DISTR.F(x, 1, ) Probabilidad F Excel 3 Devuelve el área a la derecha de un valor en una distribución F con 1 y g.l. P( F>x ) 16
Probabilidad F Inversa Excel =DISTR.F.INV(a, 1, ) Devuelve el valor crítico de F(a) para una distribución F con 1, g.l. 33 Ejercicios sobre la distribución F 34 a) Determine la probabilidad de tener un valor de F mayor que 9.8 en una distribución F con 1 =3 y =3 g.l. b) Halle la el valor crítico de F (0.05) para 1 =3 y =15 g.l. 17