5.3. Distribuciones Derivadas de la Normal El propósito de esta sección es enunciar varios teoremas importantes que nos dirán que realizando diferentes transformaciones de la v.a. normal podremos obtener variables aleatorias como la Ji-cuadrada, la T de Student ó la F de Fisher. Más adelante en los capítulos de Intervalos de Confianza y Pruebas de Hipótesis estas transformaciones serán esenciales para entender los métodos que desarrollaremos. Además, también definiremos los cuantiles de cada una de estas distribuciones y mostraremos la forma de calcularlos utilizando R. Sabemos que si Z N(0,) entonces a partir de ella podemos calcular cualquier probabilidad para cualquier X N(µ,σ 2 ), pues Z = X µ. Anteriormente vimos que utilizando R si buscamos Φ(z) para algún z R, σ podemos usar la función pnorm de la siguiente forma: Φ(z) = F Z (z) = P Z (Z z) = pnorm(z,0,) Además de la probabilidad acumulada, otra cantidad importante son los cuantiles (o percentiles) de la distribución normal estándar. Si Z N(0,) y (0,) sea z el número real que cumple con P(Z > z ) = Φ(z ) = (5.) a z se le llama el 00() percentil ó cuantil de la distribución normal estándar. De 5. vemos que para encontrar el percentil z, podemos despejar Φ(z ), de donde Φ(z ) = y buscar en tablas de la distribución normal estándar el valor z que acumule una probabilidad de. En R podemos calcular z haciendo lo siguiente. El valor z tal que Φ(z ) =, se encuentra directamente con la función z = qnorm(,0,). Por ejemplo si queremos calcular z 0.025, entonces = 0.025 = 0.975, utilizando la función de R z 0.025 = qnorm(0.975,0,).96 Y podemos verificar lo anterior de forma muy sencilla Φ(.96) = pnorm(.96, 0, ) 0.975. De forma general podemos representar al cuantil z como se muestra en la Figura 5.. fz(z) z z Figura 5.: Cuantil z de la normal estándar
De la Figura 5. podemos ver claramente el significado del cuantil z. A la izquierda de z hay un área de y a la derecha de z hay un área de. Vamos a pasar a la primer distribución derivada de la normal. Teorema Si Z,Z 2,...,Z n son n variables aleatorias independientes N(0,), entonces n Zi 2 χ 2 n (5.2) i= En donde χ 2 n es una Ji-cuadrada con n grados de libertad. Del Teorema se puede ver que si se tiene una sola v.a. Z N(0,), entonces Z 2 = χ 2 Si W es una v.a. χ 2 n entonces para toda (0,) la cantidad χ 2,n se define P(W > χ 2,n) = P(W χ 2,n) = (5.3) a χ 2,n se le llama el 00( ) percentil ó cuantil de la distribución Ji-cuadrada con n grados de libertad. El significado del cuantil para la Ji-cuadrada con n grados de libertad es exactamente el mismo que para la normal estándar. Esto se muestra en la Figura 5.2 fw(w) 2 χ,n w Figura 5.2: Cuantil χ 2,n de la Ji-cuadrada con n grados de libertad Para calcular los cuantiles de la Ji-cuadrada en R vemos que de la ecuación 5.3, se tiene que P(W χ 2,n) =, entonces el número real χ 2,n que satisface esta ecuación lo calculamos de la siguiente forma χ 2,n = qchisq(,n) Como comentario final acerca de la Ji-cuadrada, sólo tenemos que hacer notar que los valores que la v.a. χ 2 n son todos no negativos pues esta distribución se origina a partir del elevar al cuadrado la normal estándar y sabemos 2
que x 2 0 x R. Por lo que con esta distribución jamas tendremos que preocuparnos por los valores negativos. Nuestra siguiente distribución se origina a partir de una transformación de normal estándar y la Ji-cuadrada. Teorema 2 Si Z N(0,), W χ 2 n y además Z y W son v.a. independientes, entonces Z W/n T n En donde T n es la v.a. T de Student con n grados de libertad. La v.a. T de Student se comporta de forma muy parecida a la normal y puede tomar el valor de cualquier número real. De hecho T n para n suficientemente grande y la normal estándar son casi la misma distribución. De este comentario tenemos que la v.a. T n es simétrica y por lo tanto P(T n < t) = P(T n > t) = P(T n t) t R Si T es una v.a. T n entonces para toda (0,) la cantidad t,n se define P(T > t,n ) = P(T t,n ) = (5.4) a t,n se le llama el 00() percentil ó cuantil de la distribución T de Student con n grados de libertad. En R t,n se puede calcular de la siguiente forma t,n = qt(,n) Los cuantiles t,n se puede interpretar viendo la Figura 5.3 ft(t) t,n t Figura 5.3: Cuantil t 2,n de la T de Student con n grados de libertad Por último en esta parte vamos a escribir el teorema que origina la distribución F de Fisher. 3
Teorema 3 Si χ 2 n y χ 2 m son dos variables aleatorias independientes con n y m grados de libertad, respectivamente, entonces χ 2 n/n χ 2 m/m F n,m En donde a la v.a. F n,m se le conoce como la F de Fisher con n y m grados de libertad. Una propiedad importante de la F se desprende del teorema anterior F m,n = F n,m. Si F es una v.a. F n,m entonces para toda (0,) la cantidad f,n,m se define P(F > f,n,m ) = P(F f,n,m ) = (5.5) a f,n,m se le llama el 00() percentil ó cuantil de la distribución F de Fisher con n y m grados de libertad. Para calcular el cualtil f,n,m en R lo hacemos de ls siguiente manera f,n,m = qf(,n,m) Para llevar la misma secuencia que en la definición de los cuantiles anteriores, se muestra la Figura 5.4 para tener una interpretación de f,n,m. gf(f) f,n,m f Figura 5.4: Cuantil f,n,m de la F de Fisher con n y m grados de libertad Para cerrar esta sección enunciaremos dos corolarios que hacen uso de los teoremas anteriores. Corolario Sea X,X 2,...,X n una m.a. de una población N(µ,σ 2 ) Como X N(µ, σ2 n ) Z = X µ σ/ N(0,) (Justificación en clase) n Y = n σ 2 i= (X i X) 2 = (n )S2 σ χ 2 2 n (Justificación en clase) V = Z = n( X µ) Y/n S T 2 n (Del Teorema 2 y clase pues S 2 y X son independientes) 4
El corolario nos servirá para construir intervalos de confianza y pruebas de hipótesis para µ. Corolario 2 Sea X,X 2,...,X n una m.a. de una población N(µ,σ) 2 y Y,Y 2,...,Y m una m.a. de una población N(µ 2,σ2), 2 por el corolario se tiene que W = n σ 2 i= (X i X) 2 = (n )S 2 σ 2 X χ2 n y W 2 = m σ2 2 i= (Y i Ȳ )2 = (m )S 2 σ2 2 Y χ2 m, si las muestras aleatorias son independientes una de otra entonces W y W 2 son independientes una de otra y por el teorema 3 G = W /n W 2 /m = σ 2 S 2 X σ 2 2 S 2 Y F n,m El corolario 2 nos servirá más adelante para construir intervalos de confianza y pruebas de hipótesis acerca del cociente de varianza de dos poblaciones normales. Es muy importante que el estudiante además de saber cómo se calculan los cuantiles de cada distribución en R también sepa hacerlo utilizando tablas, esto principalmente porque el examen se realizará utilizando tablas, aunque en la práctica el uso de R será el más conveniente. 5