www.jmontenegro.wordpress.com UNI ESTIMACIÓN Y PRUEBA DE HIPÓTESIS INTERVALOS DE CONFIANZA PROF. JOHNNY MONTENEGRO MOLINA
Objetivos Desarrollar el concepto de estimación de parámetros Explicar qué es una prueba de hipótesis Diferenciar grupos de una población utilizando pruebas de Student
Estimación por Intervalos de Confianza En estadística se llama estimación al conjunto de técnicas que permiten dar un valor aproximado de un parámetro (Ej.: μ) de una población a partir de estadísticos, generados por los datos (Ej: x, S, n).
Estimación por Intervalos de Confianza Un estimador puntual de un parámetro es un valor que puede ser considerado representativo de este y se obtiene a partir de alguna función de la muestra, por Ej., promedio muestral, estima puntualmente a, el promedio poblacional.
Estimación por Intervalos de Confianza La estimación por intervalos consiste en la obtención de un intervalo dentro del cual estará el valor del parámetro estimado, con una cierta probabilidad. El promedio poblacional, μ, se estima por un intervalo calculado a partir de S y de muestras. x
Estimación por Intervalos de Confianza El intervalo de confianza de con un 95 de confianza, IC 95 %, es el más usado y para muestras de más de 30 datos se calcula como : IC 95 % de μ = ± 1.96 Para menos de 30 datos se usa: x ( s / n) IC 95 % de μ = ± t ( s / ( n 1)) x Donde t es el valor dado por la distribución t de Student con n-1 Grados de Libertad, para un 95 % se busca el valor del t 0.975, ya que esta es una prueba de dos colas.
Estimación por Intervalos de Confianza El IC 95 % nos dice que con un 95 % de confiabilidad en este intervalo encuentro el promedio de la población, el cual desconozco. Para esto necesito conocer de la muestra los siguientes estadísticos:, S y n. x
Estimación por Intervalos de Confianza El gráfico de IC 95 % se usa cuando se cruza una variable discreta que genera grupos, con una variable continua. En este gráfico se observan los promedios de cada grupo con sus intervalos de confianza al 95 %, estos en forma de dos rayas. Veamos un ejemplo de este tipo.
Estimación por Intervalos de Confianza Gráfico de Promedios e Intervalos de Confianza de, t 95%, desagregada por sexo, de la Edad de una población adulta. 49 48 47 46 45 44 43 42 Ho mbre Mujer Sexo
Estimación por Intervalos de Confianza En este tipo de gráfico es interesante observar si los intervalos de confianza de los diferentes promedios tienen valores superpuestos, ya que si es así, al hacer una prueba de hipótesis lo más probable que la respuesta sea de hipótesis nula, es decir los promedios superpuestos pertenecen a un mismo promedio poblacional.
Generalidades de las pruebas de Hipótesis Una hipótesis estadística es una asunción relativa a una o varias poblaciones, que puede ser cierta o no. Las hipótesis estadísticas se pueden contrastar con la información extraída de las muestras y tanto si se aceptan como si se rechazan se puede cometer un error. La hipótesis formulada con intención de rechazarla se llama hipótesis nula y se representa por H 0. Rechazar H 0 implica aceptar una hipótesis alternativa (H A ).
Generalidades de las pruebas de Hipótesis H 0 cierta H 0 falsa H A cierta H 0 rechazada Error tipo I (a ) Decisión correcta H 0 no rechazada Decisión correcta (*) (*) Decisión correcta que se busca a = p (rechazar H 0 siendo H 0 cierta) b = p (aceptar H 0 siendo H 0 falsa) (*) Error tipo II (b )
Los pasos necesarios para realizar un contraste relativo a un parámetro θ son: 1. Establecer la hipótesis nula en términos de igualdad H 0 : θ = θ 0 2. Establecer la hipótesis alternativa, que puede hacerse de tres maneras, dependiendo del interés del investigador H 0 : θ θ 0 ó θ > θ 0 ó θ < θ 0
En el primer caso se habla de contraste bilateral o de dos colas, utilizada generalmente con la distribución Normal o la t de Student. En los otros dos casos se tiene un contraste lateral derecho en el segundo caso, o izquierdo en el tercer caso, ambos son pruebas de una cola. Con la distribución X 2 y la F, por ser distribuciones asimétricas positivas los contrastes son unilaterales por el lado derecho.
3. Elegir un nivel de significación: Nivel crítico para α, generalmente del 5 % en las ingenierías. 4. Elegir un estadístico de contraste: Este estadístico de contraste es un estadístico cuya distribución es conocida en H 0, que esté relacionado con θ y permite establecer, en base a dicha distribución, la región crítica: región en la que el estadístico calculado tiene una probabilidad menor que a.
5. Calcular el estadístico para una muestra aleatoria y compararlo con la región crítica: Si el estadístico tiene en valor absoluto, un valor menor al valor tabular de la distribución conocida correspondiente al a se acepta H 0. Si el valor p calculado es > a 0.05 ocurre H0 Si el valor p calculado es a 0.05 ocurre H1
PRUEBA DE HIPÓTESIS CON PRUEBAS t
El promedio de una muestra pertenece a población con promedio conocido. Esta es una prueba que permite contrastar si una muestra de una variable difiere significativamente de un promedio poblacional dado o no. Generalmente este promedio es histórico.
La hipótesis nula es H 0 : reformular El estadístico de contraste es el valor t calculado: x t c s / n
Ejemplo: Históricamente la edad de los alumnos que entran a primer año de la Universidad es de 18 años. Se quiere saber si para el año que viene la edad de ingreso será la misma a la histórica, para estudiar esto se tomó una muestra de 36 estudiantes del último año de secundaria y se calculó la edad de ingreso a la universidad. En función de los datos observados surge la hipótesis de que la edad de los estudiantes es mayor que 18 años. La muestra de 36 sujetos dio los siguientes datos: x = 18.5 S=3.6
Solución Se trata de un contraste sobre medias. La hipótesis nula (lo que queremos rechazar) es: H 0: µ= 18 La hipótesis alternativa H 1: µ> 18 Este es un contraste lateral derecho. Fijamos "a priori" el nivel de significación en 0,05 y la región crítica T>t α Si el contraste hubiera sido lateral izquierdo, la región crítica sería T<t 1- α y si hubiera sido bilateral T<t 1- α /2 o T>t α /2. En este ejemplo t (35)0,05 =1,69.
Calculamos el valor de t c en la muestra 18.5 18 " t c " 3.6 0.82 36 1 No está en la región crítica (no es mayor que 1,69), por tanto no rechazamos H 0, concluimos que la edad histórica de ingreso se mantiene.
Dos promedios tomados en una misma muestra, en momentos diferentes, son iguales.
Dos promedios tomados en una misma muestra, en momentos diferentes, son iguales. Esta es una prueba t para muestras relacionadas, donde pretendemos contrastar las medias de una misma muestra que se ha medido dos veces en los mismos sujetos. Por ejemplo si en grupo de estudiantes queremos comparar el resultado del primer examen parcial de una asignatura con el del segundo parcial, se pretende saber si estos promedios difieren o no.
El estadístico de contraste es: t c S d d / n Donde d es el promedio de las diferencias de los datos repetidos, S d es la desviación estándar de las diferencias. n es el número de pares (diferencias).
Los promedios de dos muestras o grupos pertenecen a una misma población.
Los promedios de dos muestras o grupos pertenecen a una misma población. Esta es una prueba de hipótesis muy usada cuando se tienen dos grupos y se quiere saber si estos tienen un mismo promedio poblacional. La hipótesis nula es H 0: µ 1 = µ 2, la hipótesis alternativa es H 0 : µ 1 µ 2
Hay diferentes tipos de prueba t, pero suponiendo varianzas iguales, el estadístico a calcular se hace: " t c " n S 1 X 1 2 1 1 X n 2 S 2 2 2 1
Ejemplo En un ensayo para evaluar la vida útil de dos productos. La variable medida es el tiempo de vida útil en años: producto T, n = 35; x = 3,7 años de vida y s 2 =13,9; producto P n = 40; x = 15,1 años y s 2 = 12,8. El producto P tiene igual vida útil que el producto T? Se trata de un contraste sobre diferencias de medias
Como no conocemos como son las varianzas entre sí, el modelo nos obliga a verificar si la varianzas son iguales, si fueran distintas es otra la prueba t a realizar. Para ello se debe plantear primero un contraste de prueba de hipótesis de variancias. Si las variancias son iguales se sigue con la prueba t que se presenta, sino se debe hacer otra variante de prueba t de más difícil cálculo.
Hipótesis de Variancias H 2 2 H 2 2 0 : T P : 1 T P El estadístico de contraste es una 2 2 prueba F = S P / S T 13.9 /12.8 1.09, como el valor F de tabla es 1.74, en consecuencia aceptamos la H 0 y concluimos que las varianzas son iguales.
Luego se hace la prueba de hipótesis de promedios con el estadístico antes detallado. " t" 15.1 3.7 13.9 12.8 P T 35 1 40 1 13.28
Se concluye que se rechaza la H 0, ya que el valor t calculado es mayor que el valor de tabla con n 1 + n 2 2, 35 + 40-2 = 73 grados de libertad. Con estos grados de libertad y con un alfa del 5% bilateral (2.5 % de rechazo en cada extremo) el valor t es de 2.0, valor menor que 13.28.
Concluimos que los promedios de años de vida útil de los dos productos son distintos.
GRACIAS POR SU ATENCIÓN!!