9. EL VALOR-P. Para esta hipótesis alternativa, el valor-p es la probabilidad que queda a la derecha del valor Tobs. bajo la curva de densidad.

Documentos relacionados
Estadística Avanzada y Análisis de Datos

Test de Kolmogorov-Smirnov

Técnicas Cuantitativas para el Management y los Negocios I

Pruebas de bondad de ajuste

D.2 ANÁLISIS ESTADÍSTICO DE LAS TEMPERATURAS DE VERANO

INTERVALO DE CONFIANZA PARA LA PROPORCIÓN

Técnicas de validación estadística Bondad de ajuste

PROBABILIDAD Y ESTADÍSTICA. Sesión 5 (En esta sesión abracamos hasta tema 5.8)

Unidad Temática 5 Estimación de parámetros: medias, varianzas y proporciones

Estadistica II Tema 1. Inferencia sobre una población. Curso 2009/10

Pruebas de Bondad de Ajuste

TEMA 4: CONTRASTES DE HIPÓTESIS. CONCEPTOS BÁSICOS

DISTRIBUCIONES DE PROBABILIDAD (RESUMEN)

Teoría de la decisión Estadística

Nivel socioeconómico medio. Nivel socioeconómico alto SI NO TOTAL

CONCEPTOS FUNDAMENTALES

Técnicas de Inferencia Estadística II. Tema 3. Contrastes de bondad de ajuste

Técnicas de validación estadística Bondad de ajuste

Problemas resueltos. Tema 12. 2º La hipótesis alternativa será que la distribución no es uniforme.

Tema 2. Contraste de hipótesis en una población

Tema 11: Intervalos de confianza.

Estadística Inferencial. Sesión 5. Prueba de hipótesis

Econometria. 4. Modelo de Regresión Lineal Simple: Inferencia. Prof. Ma. Isabel Santana

Pruebas de acceso a enseñanzas universitarias oficiales de grado Castilla y León

6. ESTIMACIÓN DE PARÁMETROS

Pruebas de Acceso a Enseñanzas Universitarias Oficiales de Grado (PAEG) Matemáticas aplicadas a las Ciencias Sociales II - Junio Propuesta B

La distribución t de student. O lo que es lo mismo: La relación entre la cerveza y los estudios de estadística

A. PRUEBAS DE BONDAD DE AJUSTE: B.TABLAS DE CONTINGENCIA

Intervalos para la diferencia de medias de dos poblaciones

Estadística II Tema 3. Comparación de dos poblaciones. Curso 2010/11

ÍNDICE CAPITULO UNO CAPITULO DOS. Pág.

1) Características del diseño en un estudio de casos y controles.

Grado en Química Bloque 1 Funciones de una variable

ESTADÍSTICA INFERENCIAL

3. VARIABLES ALEATORIAS

Estimación por intervalos

Problemas resueltos. Temas 10 y 11 11, 9, 12, 17, 8, 11, 9, 4, 5, 9, 14, 9, 17, 24, 19, 10, 17, 17, 8, 23, 8, 6, 14, 16, 6, 7, 15, 20, 14, 15.

ESTADISTICA INFERENCIAL

Tema 5: Principales Distribuciones de Probabilidad

Tema 5. Muestreo y distribuciones muestrales

Muestreo y estimación: problemas resueltos

La distribución normal o gaussiana es la distribución. Definición 42 Se dice que una variable X se distribuye como normal con parámetros µ y σ si

Muestreo y Distribuciones muestrales. 51 SOLUCIONES

Estadística II Tema 2. Conceptos básicos en el contraste de. Curso 2010/11

Estadística inferencial. Aplicación con el SPSS

TEMA II: DISTRIBUCIONES RELACIONADAS CON LA NORMAL

DISTRIBUCIONES DE PROBABILIDAD

Estadística Inferencial 3.7. Prueba de hipótesis para la varianza. σ gl = n -1. Es decir: Ho: σ 2 15 Ha: σ 2 > 15 (prueba de una cola)

CÁLCULO DE SIGNIFICANCIA ESTADÍSTICA PARA RESULTADOS SIMCE

Unidad 7: Muestreo de aceptación

Una población es el conjunto de todos los elementos a los que se somete a un estudio estadístico.

Selectividad Junio 2007 JUNIO 2007

Métodos Numéricos: Resumen y ejemplos Tema 5: Resolución aproximada de ecuaciones

3. Análisis univariable y bivariable

ANÁLISIS CUANTITATIVO DE DATOS EN CIENCIAS SOCIALES CON EL SPSS (I) Tablas de contingencia y pruebas de asociación

Distribución de Probabilidad Normal

Validación de los métodos microbiológicos HERRAMIENTAS ESTADISTICAS. Bqca. QM Alicia I. Cuesta, Consultora Internacional de la FAO

Teoría de la estimación

x R F (x) := P (X 1 (, x]) = P ({e Ω : X(e) x}) = P (X x) salvo que en este caso esta función es siempre una función continua.

Índice general Intervalo de confianza para la media si la varianza poblacional es. conocida desconocida... 3

Julio Deride Silva. 27 de agosto de 2010

BLOQUE 3 TEMA 9 MODELOS ESTADÍSTICOS Y PROBABILIDAD. LA CURVA NORMAL

Estadística II Examen Final - Enero Responda a los siguientes ejercicios en los cuadernillos de la Universidad.

Distribuciones de probabilidad. El teorema central del límite

Propiedades en una muestra aleatoria

Ejercicios de Variables Aleatorias

P (X 5) = P (x = 5) + P (X = 6) + P (X = 7) + P (X = 8) = =

Propuesta A. 2 0 b) Dada la ecuación matricial: X = , despeja y calcula la matriz X. (0.75 ptos) 2 1

JUNIO Opción A

Medidas de Dispersión

DOCUMENTO 3: DISTRIBUCIÓN DE PROBABILIDAD DE V. A. CONTINUA: LA DISTRIBUCIÓN NORMAL

PRUEBAS PARA DOS MUESTRAS RELACIONADAS

SESIÓN 5 RELACIÓN ENTRE LOS VALORES NUMÉRICOS

CÁLCULO DE SIGNIFICANCIA ESTADÍSTICA PARA RESULTADOS DE LAS PRUEBAS SIMCE

ESTADISTICA APLICADA: PROGRAMA

Distribución Normal Curva Normal distribución gaussiana

7. Distribución normal

Diferencia de medias. Estadística II Equipo Docente: Iris Gallardo Andrés Antivilo Francisco Marro

Prueba de hipótesis. 1. Considerando lo anterior específica: a. La variable de estudio: b. La población: c. El parámetro. d. Estimador puntual:

Análisis de Capabilidad (Porcentaje Defectuoso)

ESTADÍSTICA INFERENCIAL

4. Medidas de tendencia central

Funciones Exponenciales y Logarítmicas

Estadística. Estadística

1. El sistema de los números reales

José A. Jiménez Nieto

2. CURVAS PLANAS, ECUACIONES PARAMÉTRICAS Y COORDENADAS POLARES

Análisis estadístico básico (I) Magdalena Cladera Munar Departament d Economia Aplicada Universitat de les Illes Balears

Límites de una función

LA DISTRIBUCIÓN NORMAL

Tema 13: Contrastes No Paramétricos

Soluciones Examen de Estadística

Tema 1. Modelo de diseño de experimentos (un factor)

11. PRUEBAS NO PARAMÉTRICAS

Teorema de Bayes. mientras que B tiene una tasa de defectos del 4%.

3.3 Funciones crecientes y decrecientes y el criterio de la primera derivada

Propuesta A. =, despeja y calcula la matriz X. (0.75 ptos)

Inferencia de información

Colegio Beato Carlos Manuel Rodríguez Departamento de Matemáticas. Mapa curricular Algebra I 8 vo grado

TRABAJO PRÁCTICO ESTADISTICA APLICADA (746)

Transcripción:

VALOR-P 9. EL VALOR-P. Hemos visto que para realizar una prueba de hipótesis se necesita el valor del correspondiente estadístico de prueba P. El valor de P se calcula en base a los datos muestrales. Por ejemplo, si es una prueba de hipótesis sobre el valor de la media poblacional, y se conoce la varianza de la distribución, el estadístico de prueba P es la variable aleatoria Z que es N(0.1). Se calcula el valor zobs de Z; y se compara con el valor crítico zcrit. Este valor crítico depende de la hipótesis alternativa. Frecuentemente, en vez de usar el valor zobs, se usa la probabilidad que está limitada por zobs. Esa probabilidad se denomina valor-p. Veamos a continuación la definición de valor-p, que depende del tipo de prueba (bilateral, lateral superior, o lateral inferior). Valor-p en las pruebas de hipótesis sobre la media VALOR-P EN LA PRUEBA LATERAL SUPERIOR. Sea T un estadístico utilizado en una prueba de hipótesis. (no necesariamente con distribución t de Student). Sea una prueba de hipótesis lateral superior (Por ejemplo, H o : µ = µ o ; H a : µ > µ o ). Sea Tobs el valor calculado de T a partir de los datos de la muestra. Para esta prueba el valor-p está definido por P(T > T obs ) = Valor-P = 1 - FT (T obs ) ; donde FT (Tobs) es el valor de la función de distribución acumulada de T, en el punto Tobs. Para esta hipótesis alternativa, el valor-p es la probabilidad que queda a la derecha del valor Tobs. bajo la curva de densidad. La siguiente Figura ejemplifica el valor-p, para el caso de la distribución Normal. En este caso el estadístico es Z; y el valor observado del estadístico es Zobs; el nivel de significación es α = 0,05. Al usar el valor-p para evaluar Ho, el criterio de rechazo (que en todos los casos lo determina Ha) se transforma en: Si valor-p < α, se rechaza H o, y se acepta H a. 0.4 Función de densidad 0.3 0. 0.1 α = 0,05 Nivel P 0-4 -3 - -1 0 1 3 4 Z obs Z 0,05 Z IX (b) - 1

VALOR-P Valor-P en la prueba lateral inferior. VALOR-P EN LA PRUEBA LATERAL INFERIOR. Sea T un estadístico utilizado en una prueba de hipótesis. Sea una prueba de hipótesis lateral inferior (Por ejemplo, H o : µ = µ o ; H a : µ < µ o ). Sea T obs el valor calculado de T a partir de los datos de la muestra. Para esta prueba el valor-p está definido por P(T < T obs ) = Valor-P = F T (T obs ) ; Al usar el valor-p para evaluar Ho, el criterio de rechazo se transforma en: Si valor-p < α, se rechaza H o, y se acepta H a. La siguiente Figura ejemplifica el valor-p, para el caso de la distribución Normal. En este caso el estadístico es Z; y el valor observado del estadístico es z obs ; el nivel de significación es α = 0,05. 0.4 Función de densidad 0.3 0. 0.1 α = 0,05 Nivel P 0-4 -3 - -1 0 1 3 4 Z obs Z Z 0,05 VALOR-P EN LA PRUEBA BILATERAL. Sea T un estadístico utilizado en una prueba de hipótesis. Sea una prueba de hipótesis bilateral (Por ejemplo, H o : µ = µ o ; H a : µ µ o ). Sea T obs el valor calculado de T a partir de los datos de la muestra. Se cumple: P( T > T obs ) = (1 F T ( T obs ) ) Para esta prueba el valor-p está definido por: Nivel -p = (1 FT ( T obs) ) El criterio de rechazo de la hipótesis nula H o en este caso también es: valor-p < α. IX (b) -

VALOR-P La siguiente Figura ejemplifica el valor-p, para el caso de la distribución Normal, donde el estadístico es Z; y el valor observado del estadístico es zobs; el nivel de significación es α = 0,05. Function Plot (NTEORLIM.STA 10v*100c) Normal(x, 0,1) 0.4 Función de densidad 0.3 0. 0.1 α = 0,05 (Valor P) / α = 0,05 0-4 -3 - -1 0 1 3 4 Z obs Z0,05 Z Z 0,05 La siguiente Tabla agrupa las definiciones del valor-p según el tipo de prueba (lateral superior, lateral inferior, o bilateral). Tipo de prueba Valor-P Criterio de Rechazo de Ho, al nivel α. Lateral superior P( T > Tobs ) = 1 - FT (Tobs) Valor-P α Lateral inferior P( T < Tobs ) = FT (Tobs) Valor-P α Bilateral *P( T > Tobs ) = (1 FT ( T obs ) ) Valor-P α Una vez que el valor-p fue calculado, la decisión sobre H o, para el nivel α previamente elegido, es: Si valor-p α, entonces se rechaza H o, y se acepta H a. Si valor-p > α, entonces no se rechaza H o. Ejemplo. Sea el caso de una prueba lateral superior, tal que H o : µ = µ o ; y H a : µ > µ o. El nivel de significación α de la prueba es 0,05. De la muestra se calcula Zobs = 1,78. El valor-p correspondiente a Zobs, es 0.037. La zona de rechazo de H o es: valor-p α. En este caso se cumple la condición de rechazo de H o. Ejemplo. Sea el caso de una prueba bilateral, tal que H o : µ = µ o ; H a : µ µ o. El nivel α es igual a 0,05. De la muestra se calcula Zobs = 1,78. El valor-p correspondiente es 0.075 ( por ser P(Z > Zobs) = 0,037 ). La zona de rechazo es: valor-p α. En este caso no se rechaza Ho. IX (b) - 3

VALOR-P La especificación del nivel de significación α antes de realizar la prueba, es imprescindible aunque el resultado se exprese en valor-p. Si el nivel α no se expresa de antemano, la conclusión se estaría acomodando a posteriori. Esto último quitaría a la prueba de hipótesis su validez. IX (b) - 4

ERROR DEL SEGUNDO TIPO ERROR DEL SEGUNDO TIPO En esta sección analizaremos el error de segundo tipo β de una prueba de hipótesis. Para ello introduciremos la función de operación característica, L(φ), donde φ es el parámetro sobre el que se efectúa la prueba de hipótesis. También introduciremos la función de potencia de la prueba, H(φ). Funciones de operación característica y de potencia Sea X una variable aleatoria cuya función de densidad de probabilidad f(x) es conocida, excepto por el valor de uno de sus parámetros, π. Se efectúa una prueba de hipótesis sobre el valor de ese parámetro. La hipótesis nula es Ho: π = π o. La hipótesis alternativa Ha puede ser cualquiera de las siguientes: 1) Ha: π < π o ; ) Ha: π > π o ; 3) Ha: π π o. Se denomina función característica, de una prueba específica de hipótesis, a la función L(π) tal que: L(π) = P(Aceptar Ho cuando el valor del parámetro es π). Una función estrechamente relacionada a L(π) es la función de potencia H(π) de la prueba. La definición de H(π) es: Se denomina función de potencia de una prueba específica de hipótesis, a la función H(π) tal que: H(π) = P(Rechazar Ho cuando el valor del parámetro es π). Se cumple la siguiente relación: H(π) = 1 L(π) Las funciones de operación característica, y de potencia tienen las siguientes propiedades: 1) Si π = π o, entonces Ho es cierta. En este caso se cumple: L(π o ) = 1 α. Esta es la probabilidad de no rechazar Ho cuando es cierta. H(π o ) = α. Esta es la probabilidad de rechazar Ho cuando es cierta. ) Si π π o, entonces Ho es falsa. En este caso se cumple: L(π) = β. Esta la probabilidad de aceptar Ho cuando es falsa, si el parámetro tiene valor π. H(π) = 1 β. Esta la probabilidad de rechazar Ho cuando es falsa, si el parámetro tiene valor π. Debe quedar claro que tanto la función de operación característica L(π) como la función de potencia H(π) tomarán distintos formas para distintas pruebas de hipótesis. Caso de una prueba de hipótesis sobre la media de una variable normal En los ejemplos que se dan a continuación X es una variable aleatoria con distribución N(µ, σ), con σ conocida. La prueba de hipótesis tiene hipótesis nula Ho: µ = µ o. El tamaño de la muestra aleatoria de X, es n. El estadístico de prueba es IX (b) - 5

ERROR DEL SEGUNDO TIPO Z = x µ σ o n PRUEBA LATERAL INFERIOR H o : µ = µ o ; Ha: µ < µ o. En esta prueba la zona de rechazo es zobs < zα (que también se puede escribir como zobs < z1-α). A continuación, deduciremos la expresión de la función de operación característica L( µ) para esta prueba de hipótesis. Por la definición de L(µ), se tiene: L(µ o ) = P(Aceptar Ho cuando la media es µ o ) = P(zobs > zα) = 1 α. En la expresión anterior, reemplazamos zobs por su definición, y se obtiene: L(µ o ) = P x µ σ o n > z α = 1 - α. Deseamos ahora obtener L(µ). Con ese fin, sumamos a ambos miembros de la desigualdad el término x µ n ; y se obtiene: σ x µ o x µ x µ L( µ ) P n + n > zα + n. σ σ σ ó: x µ x µ o x µ L( µ ) P n > zα n + n, σ σ σ ó: x µ µ o µ L( µ ) P n > zα + n + n. σ σ σ Si usamos la definición: x µ Z = n, donde µ es la media verdadera (desconocida), se obtiene finalmente: σ, L(µ) = µ o µ 1 P z < zα + n = β para µ µ o ; σ o, equivalentemente: L(µ) = Φ µ µ o z α + n = β para µ µ o 1. σ Esta es la función de operación característica correspondiente a la prueba de hipótesis Ho: µ = µ o ; Ha: µ<µ o ; con N(µ, σ ), para el caso de que la muestra aleatoria tiene tamaño n, y la variable aleatoria X es N(µ, σ ), con σ conocido, y el nivel de significación es α. Observemos que esa expresión matemática indica que si α es grande, β es pequeño, y viceversa. En efecto, si α es grande, entonces - z α es grande en valor absoluto. Por coniguiente, la función de distribución Φ es será mayor, por consiguiente L(µ) (que es igual a β si µ µ o ) será menor. Se cumplen las siguientes propiedades de L(µ), y de H(µ): IX (b) - 6

ERROR DEL SEGUNDO TIPO L(µ o ) = 1 α; para µ = µ o. L(µ) = β ; para µ < µ o. H(µ o ) = α; para µ = µ o. H(µ) = 1 β ; para µ < µ o. Con frecuencia queremos controlar el valor de la probabilidad β del error de tipo II. Si se requiere que α tome un valor dado, la única manera de controlar la probabilidad β es mediante el tamaño de la muestra n. Ejemplo: Sea la variable aleatoria tiempo de secado de una pintura, que indicamos por X. Se sabe que X ~N(µ, σ), donde σ = 30 min. Se introdujo un nuevo procedimiento químico que se cree puede disminuir el tiempo medio de secado. 1) Se desea evaluar la hipótesis nula Ho: µ = 340 min; contra la hipótesis Ha: µ < 340 min, al nivel α = 0,05%. De una muestra de tamaño n igual a 16 elementos, se obtuvo una media muestral igual a 330 minutos. El estadístico de prueba es: Z = X µ σ o n El criterio de rechazo de Ho es: zobs < z α. Reemplazando valores, se obtiene zobs = -1,33. De tablas se obtiene -z 0,05 =-1,65. zobs no cae en la zona de rechazo. Por consiguiente no se rechaza Ho. Ahora pasamos a examinar cuál es la probabilidad de que la hipótesis nula Ho sea aceptada cuando es falsa (error de tipo II). Esa probabilidad es función del valor verdadero de la media de la distribución, µ. Es decir, β (µ). Obviamente, desconocemos el valor verdadero de la media de la distribución. Sin embargo, podemos hallar el valor de β que corresponde a distintos µ. Es decir, podemos construir escenarios del tipo Qué pasaría si...? La función de operación característica para la prueba de hipótesis unilateral inferior está dada por: L(µ) = 1 µ o µ Φ zα + n, que es igual a β, para µ µo. σ La siguiente Figura muestra la gráfica de L(µ) para la prueba unilateral inferior. IX (b) - 7

ERROR DEL SEGUNDO TIPO Probabilidad de rechazar H0 (Potencia) Distribución Normal; n = 16. Hipotesis sobre la media: H0=340.000 H1= 330.000 Sigma poblacional: 30.0000 alfa: 0.050 (unilateral) beta: 0.6 1 0.9 0.8 0.7 0.6 β 1 α 0.5 0.4 0.3 0. 1 β 0.1 0 305. 310. 315. 30. 35. 330. 335. 340. 345. Media verdadera En esta figura los valores de β (µ) se leen desde el límite superior hasta la curva. Para el valor que se usa en la hipótesis nula (340 min), la ordenada es igual a 1-α; esa es la probabilidad de no rechazar la hipótesis nula. En la gráfica de L(µ) se lee que el valor de β es 0.6 para una supuesta µ verdadera igual a 330 min; esto es una probabilidad muy alta de ocurrencia de un error de tipo II para ese valor de µ. Identifiquemos ahora el intervalo de valores de µ que tienen una probabilidad β o, o mayor, de generar un error de tipo II. Adoptamos β o = 0,1. La gráfica de la función de operación característica indica que para esta prueba de hipótesis, cada valor de µ dentro del intervalo 340 min > µ > 318 min podría generar un error de tipo II con probabilidad mayor que 0,1, si fuese la media verdadera de la distribución. Veamos el cálculo directamente de la L(µ). Calcularemos el valor de µ que es la solución de la ecuación: µ ο L(µ) = 1 µ o µ Φ zα + n β o, donde β o fue elegido igual a 0,1. σ Esa es la ecuación que deben satisfacer los valores µ. Si alguno de ellos fuese la media verdadera de la distribución, entonces tendría una probabilidad menor que 0,1 de producir un error del tipo II. o, equivalentemente: µ o µ Φ zα + n 0,9. σ La solución se obtiene despejando µ de la siguiente ecuación: 340 µ 1,65 + 4 30 1,8 De aquí se obtiene µ 318 min. Por consiguiente, para α = 0,05; y una muestra de 16 elementos, si se acepta Ho, existe una probabilidad β 0,10 que se comenta un error del segundo tipo si el valor verdadero de la media de X es µ 318 min. IX (b) - 8

ERROR DEL SEGUNDO TIPO TAMAÑO DE MUESTRA PARA QUE β β O, CON α FIJO A continuación determinaremos el tamaño mínimo n de la muestra para que β β o, donde β o es un valor preestablecido por el ingeniero. Comúnmente se adopta β o = 0,10. Veremos que también es necesario determinar a partir de qué valor de µ se está interesado en que se cumpla β β o. El valor de la probabilidad del error de tipo II, β, está dado para esa prueba de hipótesis lateral inferior por: µ o µ L(µ) = 1 Φ zα + n = β, para µ µ o. σ Queremos que β (que es función de µ, entre otros parámetros) no supere un valor dado β o. Por consiguiente, se tiene: L(µ) = 1 µ o µ Φ zα + n β o. σ o: µ o µ Φ zα + n 1 β o. σ Esta última ecuación tiene por solución: µ o µ zα + n zβo ; donde zβo cumple: P(Z > zβo) = β o. σ Al despejar n, se obtiene finalmente: σ ( ) n zβo + zα ; esta es la condición sobre el tamaño de la muestra para que µ o µ L(µ) β o para un valor dado de α Comúnmente se elige β o = 0,1. En este caso es zβo= 1,8. PRUEBA LATERAL SUPERIOR 1) La prueba de hipótesis es Ho: µ = µ o ; Ha: µ > µ o. ) El estadístico de prueba es X µ o Z = σ / n 3) El criterio de rechazo de Ho es zobs > zα. Por consiguiente la zona de aceptación de Ho es zobs < zα. 4) Por definición de zα, el valor de L(µ) para µ = µ o está dado por: L(µ o ) = P(Z < zα) = 1 α; Reemplazando Z en la ecuación anterior por su definición se obtiene: L(µ o ) = X µ o P < z σ / n α = 1 α. IX (b) - 9

ERROR DEL SEGUNDO TIPO Sumando a ambos lados de la desigualdad el término de término, se obtiene: L(µ) = X µ X µ X µ o P < zα + σ / n σ / n σ / n L(µ) = P Z < z ; ó finalmente: X µ σ / n µ o µ µ o µ + = Φ zα + σ / n σ / n α., y efectuando un pasaje Para la prueba de hipótesis H o: µ = µ o ; Ha: µ > µ o. de una variable aleatoria X Normal (µ, σ ), con σ conocido, la función de operación característica L(µ) esta dada por : L(µ) = P Z < z µ o µ µ o µ + = Φ zα + σ / n σ / n α. donde el estadístico de prueba Z está dado por X µ σ / n. La correspondiente función de potencia H(µ) está dada por: H(µ) = 1 Φ z α µ o µ + σ / n Ejemplo. Continuamos con la misma variable aleatoria X del problema anterior; X~N(µ, σ), con σ = 30 min. Se obtuvo una muestra de 16 elementos; y el promedio de esa muestra x es igual a 370 min. Ahora efectuaremos una prueba de hipótesis para examinar si el tiempo medio de secado aumentó. Esta es una prueba lateral superior. Las hipótesis son: Ho: µ = 340 min; Ha: µ > 340 min. El estadístico es nuevamente Z = X µ σ / n. 1) Se desea evaluar la hipótesis nula Ho: µ = 340 min; contra la hipótesis Ha: µ > 340 min, al nivel α = 0,05%. ) Determinaremos el valor µ m tal que la probabilidad β de aceptar Ho si µ µ m, sea menor que 0,1. En caso de que no se rechace Ho, conoceremos el intervalo (µo; µm] de valores de µ que podrían haber producido la aceptación de Ho si hubo un error de tipo II, con una probabilidad de 10% o mayor. Respuesta a la parte 1 La prueba tiene las hipótesis Ho: µ = 340 min; Ha: µ > 340 min. El nivel de significación α es 0,05. Se obtuvo una muestra de 16 elementos; y el promedio de esa muestra x es igual a 350 min. IX (b) - 10

ERROR DEL SEGUNDO TIPO El criterio de rechazo de Ho es : z obs > zα. El valor calculado del estadístico de prueba Z es: zobs = 1.33. El valor crítico zα es igual a 1,65. Por consiguiente no se rechaza Ho. Respuesta a la parte Buscamos la solución de la ecuación: L(µ) = Φ z µ o µ + σ / n α 0,1. Resolviendo esta ecuación se obtiene: z α µ o µ + 1,8; por consiguiente (con zα = 1,65) µ 361.9 min. σ / n Este resultado indica que cualquier valor en el intervalo semi abierto (340 min, 361,9 min] tiene una probabilidad mayor que 10% de producir un error de tipo II. La siguiente figura muestra la función potencia H(µ) para esta prueba de hipótesis. Para µ = 34,8 el utilitario calculó β = 0,14. Probabilidad de aceptar Ho Variable normal Media: H0=340.0 min Sigma: 30.0 alfa unilateral: 0.050 0. 0.1 0. 0.3 β 0.4 0.5 1 α 0.6 0.7 0.8 1 β 0.9 1 335. 340. 345. 350. 355. 360. 365. 370. 375. α Media En general, si la hipótesis nula se rechaza, el L(µ) no provee información de utilidad. Por el contrario, si el Ho no se rechaza, L(µ) provee la probabilidad β (µ) de que valores de µ distintos del propuesto en la Ho puedan originar un error de tipo II. PRUEBA BILATERAL. Las hipótesis son: Ho: µ = µ o. Ha: µ µ o. La zona de aceptación de Ho es zα/ < Z < zα/. Por consiguiente, la función de operación característica es: x µ o x µ L(µ) = P zα / < n< zα /. Sumando n a ambos miembros de la σ σ desigualdad se obtiene, después de un pasaje de términos, y de emplear la definición de función de distribución: µ o µ µ o µ L(µ) = Φ zα / + n Φ zα / + n. σ σ La función de potencia está dada por: IX (b) - 11

ERROR DEL SEGUNDO TIPO µ o H(µ) = 1 Φ zα / + n + Φ zα / + σ µ µ µ La siguiente figura muestra la función de potencia, para la prueba bilateral con hipótesis nula Ho: µ = 340 minutos; y Ha: µ µ o : Probabilidad def Rechazar H0 (Potencia) 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0. 0.1 o σ Distribucion Normal; n = 16 Media: H0=340.0. Sigma: 30.0 alpha: 0.050 (bilateral) 1 α 1 β Media verdadera n 0 50. 300. 350. 400. 450. IX (b) - 1

BONDAD DE AJUSTE BONDAD DE AJUSTE Una prueba de bondad de ajuste consiste en evaluar, en base a una muestra aleatoria {x 1, x,..., x n }, la hipótesis de que una variable aleatoria X tiene una dada distribución de probabilidad F(x). Cuando los datos están en forma numérica, las dos pruebas de bondad de ajuste más populares son la prueba de K-S (Kolmogorov - Smirnov), y la prueba ji-cuadrado, χ. Esta última prueba no puede aplicarse cuando la muestra tiene un tamaño pequeño. En este último caso hay que recurrir a la prueba de K-S. Prueba Ji-cuadrado Para realizar la prueba ji-cuadrado de bondad de ajuste se construye primeramente un histograma de los datos de la muestra. Cada clase 'i' del histograma contendrá O i valores observados. A continuación se calculan los valores esperados E i correspondiente a cada clase 'i '. El estadístico χ definido por: χ ( O E ) r i i =, tiene una distribución ji-cuadrado con r-m-1 grados de i = 1 E i libertad, donde r es el número de clases del histograma, y m es el número de parámetros de la distribución teórica que fueron estimados a partir de los valores de la muestra. La siguiente es una descripción paso a paso del procedimiento para efectuar la prueba de bondad de ajuste ji-cuadrado. Sea una muestra {x 1, x,..., x n }, de n elementos de la variable aleatoria X. A fin de ejemplificar los distintos pasos que componen a la prueba ji-cuadrado usaremos la siguiente muestra de una variable aleatoria X: 109,0-119,40-134,10-110,73-103,91-13,67-130,10-119,40-103,14-138,66-11,8-114,7-130,10-14,95-136,09-139,74-113,36-109,90-113,71-115,38-107,56-105,90-13,67-11,65-1,1-11,8-11,51-115,05-116,33-13,96. Esta muestra, de tamaño n igual a 30, tiene las siguientes características: x = 10,1; s = 11,43. El máximo muestral es 139,74; el mínimo muestral es 103,14. El rango de la muestra es 36,60. La prueba de bondad de ajuste ji-cuadrado, está compuesta de los siguientes pasos: 1. Si la variable aleatoria X es continua, se subdivide el recorrido de la muestra de X en r clases (o intervalos mutuamente excluyentes). Conviene que las clases tengan el mismo ancho; aunque esto no es imprescindible. Frecuentemente, la primer y la última clase son mayores que los otros intervalos. Si la variable aleatoria X es discreta, se consideran todos los valores de la variable aleatoria en el recorrido muestral. Tanto si X fuese discreta como si fuese continua, se unen clases contiguas (o valores contiguos en el caso de una variable aleatoria discreta), para evitar que cada clase tenga menos de 5 valores. La prueba ji-cuadrado esta basada en un teorema límite, valido para n. En general, se espera que la prueba sea válida si el número de frecuencias esperadas para cada intervalo, n p i, es por lo menos igual a 5. Ejemplo: En base a la muestra anterior, construimos un histograma. El número de clases que utilizaremos depende del tamaño de la muestra. Ensayaremos con distintas cantidades de clases hasta encontrar al número adecuado. En el primer ensayo probamos un número de clases igual al cociente entre el número de datos, y un número promedio de datos por clase. Elegimos 6 datos en promedio para cada clase. La cantidad de clases, k, está dada por k = n/6 = 5. IX (b) - 13

BONDAD DE AJUSTE Para obtener límites de clase que preferentemente sean número enteros, elegimos para el límite inferior del histograma X = 100; y para el límite superior X = 140. El ancho de los intervalos, entre los límites de clases, resulta igual a 8 unidades. El histograma en forma de tabla es el siguiente: X 100 108 108 116 116 14 14 13 13 140 Casos 4 11 7 3 5 1 10 Valores observados, O i 8 6 4 0 90 100 110 10 130 140 150 160 X Este histograma posee clases con menos de 5 valores. Por consiguiente, debemos cambiarlo. El siguiente histograma cumple con el requisito de que el número de valores observados es 5 en todas las clases. X 111 (111 119] (119 17] X >17 7 9 7 7 En este histograma efectuamos la convención de que el límite superior de cada clase pertenece a la clase. El límite inferior no pertenece a la clase. Esta asimetría en la definición de los intervalos de clase es irrelevante.. Se determina el número O i de observaciones que pertenecen a cada clase i. Se cumple: O 1 + O +... + O n = n. 3. Se ajusta una distribución teórica F(x) a la muestra. Para ello habrá un cierto número m de parámetros que habrá que estimar a partir de los datos de la muestra. La forma del histograma ayuda a orientarse en la elección de F(x). Ejemplo. Para el caso que estamos ejemplificando, el histograma sugiere que F(x) podría ser la distribución Normal con µˆ = x = 10,1; y σ = s = 11,43. 4. En base a la distribución teórica propuesta, F(x), se calculan las frecuencias esperadas E i de valores en una muestra de tamaño n que corresponden a cada intervalo i. Ejemplo. Los valores Ei están indicados en la siguiente Tabla, conjuntamente con resultados de operaciones que definimos más adelante. IX (b) - 14

BONDAD DE AJUSTE 1 3 4 5 6 7 8 Clase Oi Zi Zi+1 Φ(Zi) Φ(Zi+1) pi Ei ( Oi E ) i / Ei ; 111 7 0,798 0 0,1 0,1 6,36 0,06 111 ; 119 9 0,798 0,098 0,1 0,461 0,49 7,47 0,31 119 ; 17 7 0,098 0,60 0,461 0,76 0,65 7,95 0,11 17; + 7 0,60 + 0,76 1 0,74 8,,01 Σ Σ = 1 Σ=30 =30 χ =,49 ν = 4-1=1. χ 0,05, ν =1 = 3,841. La zona de rechazo de la hipótesis nula es χ > χ α,ν. Se obtuvo χ < 3,841. Por consiguiente, no se rechaza la hipótesis nula: La variable aleatoria X proviene de una distribución Normal. 5. Se elige un nivel de significación α para la prueba de bondad de ajuste. Para este ejemplo elegimos α = 0,05 6. Se calcula el estadístico χ mediante el algoritmo: r χ = i= 1 ( O E ) donde Ei = n pi; y pi es la probabilidad teórica de que la variable aleatoria X tome un valor comprendido dentro del intervalo i. i E i i Se cumple: donde n es el tamaño de la muestra. p 1 + p +... + p n = 1 Las columnas a 6 muestran los resultados de los pasos intermedios del cálculo de las frecuencias esperadas, Ei, y la columna 7 contiene los valores esperados en cada clase, Ei. En este caso en particular, las probabilidades p i que se usan están dadas por p i = Φ(z i+1 ) - Φ(z i ). 7. La variable aleatoria χ tiene una distribución ji-cuadrado con ν = r - m - 1 grados de libertad, donde r es el número de clases en que se subdividió la muestra, y m es el número de parámetros estimados. El valor de χ 0,05, ν = 1 es igual a 3,84. Ejemplo. El valor de χ está al pie de la columna 8. Se obtuvo χ =,49. Equivalentemente, podemos analizar el resultado utilizando el nivel-p. El nivel-p de este resultado es 0,11. Como el nivel-p es mayor que 0,05, no se rechaza la hipótesis nula. 8. El criterio de rechazo de la hipótesis nula, Ho: La muestra proviene de la distribución de probabilidad propuesta, está dado por P ( χ obs >χ α ). Si se rechaza Ho, se acepta la hipótesis alternativa Ha: La muestra no proviene de la distribución de probabilidad propuesta. IX (b) - 15

BONDAD DE AJUSTE Ejemplo. Para el ejemplo que estamos desarrollando, se obtuvo observado es menor que el nula. χ 0,05, ν =1. χ 0,05,1 =3,841. El χ Por consiguiente no se rechaza la hipótesis Ejemplo.: Distribución de Poisson (Tomado del libro de Meyer) En una malla de 165 celdas se contó el número de granos de grafito en cada celda. Así se obtuvieron los datos de la siguiente Tabla. Evalúe la hipótesis de que el número de granos en cada una de las celdas es una variable aleatoria con una distribución de Poisson. X Oi pi n*pi = Ei (Oi-Ei) /Ei 7 0,054 8,965 0,431 3 7 0,081 13,46 3,076 4 0 0,16 0,750 0,07 5 34 0,155 5,654,715 6 30 0,160 6,431 0,48 7 17 0,141 3,34 1,73 8 0,109 18,037 0,871 9 1 0,075 1,389 5,985 10 7 0,097 16,006 5,068 Sumas: 165 1 165 χ : 0,377 14,067 χ 0,05 Nivel p 0,0048 1 El estimador del promedio es µˆ = x i O i = 6,18. µˆ también es el estimador 165 del parámetro λ. En la Tabla están indicados los valores observados Oi; la probabilidad pi para cada clase de la variable X, el valor de Ei; y el valor de χ. Los grados de libertad para la prueba son 7 (9 clases, menos 1 gdl por estimar λ, menos 1 grado de libertad). La hipótesis nula Ho es : La función de distribución de X es la distribución de Poisson. La hipótesis alternativa es: La función de distribución de X no es la distribución de Poisson. El criterio de rechazo de Ho es: χ > χ 0,05; 7 gdl. El valor observado de χ es 0,377. El valor crítico de ji-cuadrado, para un nivel de significación del 0,05, y para 7 grados de libertad, es χ c = 14,067. Por IX (b) - 16

BONDAD DE AJUSTE consiguiente se rechaza la hipótesis nula, y se acepta la hipótesis alternativa: La distribución de la variable X no es la distribución de Poisson. Utilicemos ahora el nivel p para evaluar la hipótesis nula. Para el valor de calculado a partir de la muestra, el nivel p es =0,0048. El criterio de rechazo es nivel p < 0,05. Por consiguiente, se rechaza la hipótesis nula, y se acepta la hipótesis alternativa. χ Ejemplo 3. Distribución Binomial El siguiente problema está propuesto en el libro de Freund, Miller, y Johnson. El problema describe la prueba de bondad de ajuste de una distribución Binomial. Además, muestra la diferencia entre presuponer un valor de probabilidad binomial p, y estimar a partir de los datos al valor de esa probabilidad p. Se examinan muestras diarias de n = 4 centrifugadoras de una cierta línea de producción. De cada muestra es determina el número X de centrifugadoras que requieren ajuste. Los resultados obtenidos en 00 días consecutivos de trabajo están indicados en la siguiente Tabla 1. TABLA 1. VALORES OBSERVADOS DE X X : 0 1 3 Oi : 101 79 19 1 Se quiere evaluar la siguiente hipótesis nula: X tiene una distribución Binomial, con parámetro p = 0,1. Obsérvese que el valor de p ha sido definido; es decir, este valor de p no proviene de un cálculo basado en los datos. La prueba de bondad de ajuste se efectuará con un nivel de significación α igual 0,05. La clase correspondiente a X = 3, contiene solamente un valor observado. Por consiguiente, reordenamos la Tabla, fusionando la clase X = 3 con la clase X =. De esta manera todas las clases contienen más de 5 valores. La Tabla indica los valores observados, y los resultados de cálculos intermedios. N es el número total de muestras diarias, e igual a 00 (Se efectúan 00 observaciones del valor X). El tamaño de cada muestra es n = 4. TABLA. PRUEBA DE BONDAD DE AJUSTE DE UNA BINOMIAL (N=00 MUESTRAS) X Oi pi N pi =Ei (Oi Ei)/Ei 0 101 0,6561 131, 6,95 1 79 0,916 58,3 7,35 0 0,053 10,4 8,86 Sumas: 00 1,0000 00 3,16 = χ Las probabilidades pi se obtienen a partir de la distribución Binomial b(x; 4; 0,1). Para la clase X, se tiene pi = 1 B(x; 4; 0.1). Los grados de libertad ν para esta prueba son ν = 3 1 =. No se descontaron grados de libertad por estimación de parámetro, porque la probabilidad p fue definida. El criterio de rechazo de Ho es χ > χ (0,05;ν=); donde χ (0,05; ν=) = 5,991. IX (b) - 17

BONDAD DE AJUSTE En razón de que χ = 3,16, se rechaza la hipótesis nula; y se concluye que X no tiene una distribución Binomial con p = 0,10, al 5% de nivel de significación.evaluemos la hipótesis nula en base al nivel - p. El nivel - p correspondiente a χ es igual a 9,3510 06. Por consiguiente, el nivel - p del valor χ es mucho menor que 0,05; y se rechaza Ho. A continuación cambiaremos el problema. Anteriormente, el valor de p, fue definido. Ahora lo estimamos a partir de los datos. Esto traerá como consecuencia que en la prueba de bondad de ajuste, los grados de libertad, ν, son 3 1 1=1. Obsérvese la diferencia con el ejemplo anterior. Para estimar al valor de p, usaremos la relación µ = n p; donde n es el tamaño de la muestra diaria (4 en este caso) ; y µ es la media muestral de X. El valor de µ es estimado mediante el promedio muestral x. Se tiene: 1 x = = i = i k N 0 x i O i = 0,6. k es el número de clases en que se subdividió la muestra. N es el total de muestras diarias, e igual a 00. n es el tamaño de cada muestra e igual a 4. El estimador de la probabilidad p del suceso la centrifugadora necesita ser ajustada, pˆ, es igual a x /n = 0,15. La hipótesis nula de esta nueva prueba de hipótesis es: X tiene una distribución Binomial (x; 4; 0,15). Los cálculos intermedios están indicados en la siguiente Tabla: Oi pi N pi =Ei (Oi Ei)/Ei 0 101 0,50 104,4 0,11 1 79 0,3685 73,7 0,38 0 0,1095 1,9 0,16 Sumas: 00 1,0000 00,0 0,65 = χ Para ν = 1 grado de libertad, se tiene rechazo de Ho es χ (0,05; v=1) = 3,84. El criterio de χ > 3,84. El criterio no se cumple. Por consiguiente no se rechaza la hipótesis nula; y se acepta que X tiene una distribución Binomial con p = 0,15. Si usamos el nivel-p para evaluar la hipótesis, se tiene que el nivel - p de 0,40. El nivel-p de χ > 0,05. Por consiguiente, no se rechaza Ho. χ es La prueba χ también se usa para verificar si los datos utilizados en la bondad de ajuste, fueron tomados aleatoriamente. El criterio de análisis consiste en dudar acerca de la aleatoriedad de la muestra, si el ajuste de la distribución propuesta es demasiado bueno. En este caso la hipótesis nula es Ho: Hay indicios estadísticamente significativos de que la muestra no es aleatoria, porque el ajuste es demasiado bueno. La hipótesis alternativa es Ha: El ajuste de la distribución propuesta, a la muestra no es excesivamente bueno, y no hay indicios estadísticamente significativo, al nivel 1 α, de que la muestra no sea aleatoria. El criterio de rechazo de Ho es : IX (b) - 18

BONDAD DE AJUSTE χ > χ (1 α; ν) ; donde ν son los grados de libertad de la prueba. Ejemplo. En el caso anterior de la segunda parte del ejemplo anterior, se tiene que χ (1 0,05; 1) = 0,0039. El χ observado es igual a 0,65. Por consiguiente se rechaza Ho al 5% de nivel de significación, y consideramos que el ajuste de la distribución Binomial a la muestra no es lo suficientemente bueno como para sospechar que la muestra no es aleatoria. Prueba de Kolmogorov-Smirnov Sea F(x) la función de distribución acumulada de una variable aleatoria X. Una vez obtenida la muestra de la variable aleatoria X, esta se ordena de menor a mayor y se le asigna un número de orden, k, a cada elemento (al menor valor muestral se le asigna el número de orden k = 1, y al mayor valor muestral se le asigna el número de orden k = n). Este ordenamiento permite calcular la función de distribución empírica S(x) que está definida por: S( x) donde k es el número de observaciones menor o igual que x, y n es el tamaño de la muestra. Las hipótesis son: H o : S(x) pudo haber provenido de la distribución F(x), al α por ciento de nivel de significación. H a : S(x) no proviene de la distribución F(x), al α por ciento de nivel de significación. Para cada x, se define a la desviación entre ambas distribuciones por D = F(x) - S(x). Si S(x) proviene de la distribución F(x), por razones puramente aleatorias, para cada x observada F(x) y S(x) difieren. La diferencia entre ambas distribuciones se mide por la máxima distancia entre ellas D. Sin embargo, si la diferencia D es muy grande, podemos rechazar la hipótesis nula H o sobre la base de que ocurrió un suceso raro. La prueba de K-S se basa en la distribución del máximo valor observado, D max, de D. La región de rechazo de H o es D max > D crítico (α, n), donde D crítico es positivo. El D critico para un dado nivel de significación α, y un dado tamaño de muestra, se obtiene de tablas. Cuando n > 35 se utilizan las siguientes ecuaciones para calcular el D crítico para el nivel α indicado. k n Ejemplo D crítico para los α indicados Nivel α 0,10 0,05 0,01 1, n 1,36 n 1,63 n La siguiente es una muestra de una variable aleatoria cuya distribución de probabilidad se desconoce. Los valores de la muestra fueron ordenados de menor a mayor. S(x) es la función de distribución empírica; F N (x) son los valores de la función de distribución Normal (µ = x; σ = s), calculados para los mismos valores de x que S(x). IX (b) - 19

BONDAD DE AJUSTE A continuación se docima la hipótesis nula H o : S(x) podría provenir de la distribución Normal con µ = X, σ = s, contra la hipótesis alternativa Ha : S(x) no proviene de una distribución Normal, al nivel del 5%. x S(x) FN(x) D 76.91 1 0.99 0.01 67.16 0.9 0.73 0.17 66.67 0.8 0.70 0.10 63.74 0.7 0.51 0.19 63.61 0.6 0.50 0.10 63.5 0.5 0.48 0.0 60.86 0.4 0.3 0.08 58.1 0.3 0.18 0.1 57.97 0. 0.17 0.03 57.68 0.1 0.15-0.05 Se encuentra que D máximo = 0,19. El D(crítico, 5%, n=10) es igual 0,410. La zona de rechazo de H o es Dmáximo > 0,41. Por consiguiente no se rechaza la hipótesis nula. Este resultado es aproximado porque hemos tratado un caso en que n = 10, y usamos el algoritmo que es exacto a los fines prácticos para n > 35. Prueba de aleatoriedad La gran mayoría de los análisis que se efectúan en estadística, son válidos solamente para muestras aleatorias. Los elementos que integran a la muestra deben ser independientes entre si. Aquí veremos una prueba para docimar la hipótesis de que la muestra es aleatoria. Para ello necesitamos definir el concepto de racha. Se denomina racha a una sucesión de símbolos iguales que representan una propiedad, y que pueden estar separados, o no, por otros símbolos que representan otras propiedades. Aquí nos interesa el caso en que a cada valor de una muestra se le asigna alguno de dos símbolos posibles. Sea una muestra aleatoria de tamaño n. Para identificar las rachas hacemos lo siguientes: Anotamos el orden en que los valores muestrales son obtenidos. Determinamos la mediana muestral. Luego asignamos el símbolo + a los valores muestrales superiores a la mediana, y el símbolo - a los valores menores o iguales que la mediana muestral. Una representación de una muestra de tamaño n = 10 es, por ejemplo, + + + + ++. Los tres primeros valores obtenidos son superiores a la mediana, luego se obtuvieron dos valores menores o iguales que la mediana, etc. Es decir, primero se obtuvo una racha de 3 +, luego una racha de, luego una racha de 1 +, una racha de, y finalmente una racha de +. En total hay r = 5 rachas. Hay n 1 = 6 clases positivas (o símbolos positivos), y n = 4 clases negativas (o símbolos negativos). IX (b) - 0

BONDAD DE AJUSTE La cantidad r de rachas que puede ocurrir en una muestra de tamaño n, si la muestra es aleatoria, tiene una distribución aleatoria específica. Si tanto n 1 como n son mayores que 0, r tiene una distribución Normal, con media y desvío dados por: n1 n µ r = + 1 ; n + n 1 La variable Z definida por Z r µ r = ; σ r n1 n ( n1 n n1 n) ( n + n ) ( n + n 1) σ r r =. 1 1 tiene distribución Normal N(0, 1). Para un dado nivel de significación α, la zona de rechazo de Ho es: Ejemplo. Z obs < - Z α/ ; ó Z obs > Z α/ Se obtuvo la siguiente muestra de la variable aleatoria X: X Clase Racha N o X Clase Racha N o 0.366 0 1 0.007 0 0.819 1 0.373 0 9 0.97 1 0.579 1 10 0.637 1 0.488 0 11 0.088 0 3 0.87 1 1 0.931 1 0.319 0 0.998 1 4 0.365 0 0.450 0 5 0.509 0 13 0.85 1 6 0.918 1 14 0.444 0 7 0.104 0 0.544 1 0.495 0 15 0.809 1 8 0.908 1 16 Clase 0: Menor que la mediana; clase 1: mayor o igual que la mediana. Mediana 0,56. Se quiere docimar la hipótesis nula H o : la muestra es aleatoria, contra la hipótesis la muestra no es aleatoria, al 5% de nivel de significación. De la muestra se tiene: r = 16; n 1 = 1; n = 1. La media está dada por µ r = 13.0; σ =,39. El valor crítico del 5% es Z 0,05 = 1,96. El Z obs es 1,5. El criterio de rechazo de H o es Z obs <-1,96; ó Z obs > 1,96. IX (b) - 1