INTERVALOS DE CONFIANZA condicional en que!! sea verdadero hipótesis nula H :!!.5%.5%! -.96sd! -sd!! +sd! +.96sd Si el nivel de significación es 5%, la estimación obtenida (círculo pequeño) no nos permitiría rechazar la hipótesis nula. PREGUNTA: QUÉ MIDE EL NIVEL DE SIGNIFICACIÓN? Intervalos de Confianza condicional en que!! sea verdadero región de aceptación para hipótesis nula H :!!.5%.5%! -.96sd! -sd!! +sd! +.96sd
Intervalos de Confianza Empecemos al revés: dado un valor estimado del parámetro, cómo sabemos si rechazamos o no la hipótesis nula al nivel de significación del 5%? 3 Intervalos de Confianza condicional en que!! sea verdadero hipótesis nula H :!!! H :!!. Lo que hacemos es calcular la distribución suponiendo que la hipótesis nula es cierta. 4
Intervalos de Confianza condicional en que!! sea verdadero hipótesis nula H :!!! -.96sd! -sd!! +.96sd Es decir, dibujamos la distribución de condicional en que H :!! sea verdadero. Pero para ello, necesitamos conocer la desviación típica de la distribución. En un primer momento lo asumimos conocido. En este dibujo se observa que la hipótesis nula no se contradice con nuestra estimación. 5 Intervalos de Confianza hipótesis nula H :!!! Supongamos otra hipótesis nula 6
Intervalos de Confianza condicional en que!! sea verdadero hipótesis nula H :!! b! -.96sd!! +sd! +.96sd Habiendo dibujado la condicional en que esta hipótesis sea verdadera, es posible observar qué hipótesis son compatibles con la estimación. 7 Intervalos de Confianza hipótesis nula H :!!! Aquí hay otra hipótesis nula. 8
Intervalos de Confianza condicional en que!! sea verdadero hipótesis nula H :!!!! -.96sd! -sd! +sd pero no es compatible con nuestra estimación. 9 Intervalos de Confianza condicional en que!! verdadero sea hipótesis nula H :!!! - sd!! + sd! +.96sd Existe por tanto un valor máximo de! compatible con nuestra estimación. Llamaremos a éste!.
Intervalos de Confianza condicional en que!! verdadero sea hipótesis nula H :!! rechazar si! >!! -.96 sd! +.96 sd rechazar si! > +.96 sd! - sd!! + sd! +.96sd Para rechazar la hipótesis, debe caer en el área del.5% de la cola, por lo que debería ser.96 desviaciones típicas menor que!. Intervalos de Confianza () condicional en que!! sea verdadero () condicional en que!! sea verdadero () ()!! -.96sd! -sd! +sd! - sd!! + sd! +.96sd Este diagrama muestra los valores posibles de!, conjuntamente con las distribuciones asociadas de.
Intervalos de Confianza rechazar si! >! rechazar si! <! +.96 sd -.96 sd 95% intervalo de confianza: -.96 sd <! < +.96 sd () ()!! -.96sd! -sd! +sd! - sd!! + sd! +.96sd Cualquier valor en el intervalo! -! sería compatible con el valor estimado para esta muestra. Este es el intevalo de confianza al 95%. 3 Intervalos de Confianza 95% intervalo de confianza Desviación típica conocida -.96 sd <! < +.96 sd 99% intervalo de confianza -.58 sd <! < +.58 sd Desviación típica estimada 95% intervalo de confianza - t crit (5%) se <! < + t crit (5%) se 99% intervalo de confianza - t crit (%) se <! < + t crit (%) se De la misma manera, usando un test de significación al % para identificar las hipótesis compatibles con el valor estimado, es posible construir un intervalo al 99%.! y! estarán ahora a.58 desviaciones típicas a la derecha y a la izquierda de, respectivamente. Cuando la desviación típica no es conocida, es necesario estimarla y la distribución ya no será una normal, sino una t. 4
CONTRASTES DE UNA COLA H :!! H :!!.5%.5%! -sd!! +sd! +sd!! -sd! puede tomar dos posibles valores,!, o!. 5 Contrastes de una cola H :!! H :!!.5%.5%! -sd!! +sd! +sd!! -sd Un ejemplo es la duración de las baterías de un cargamento que hay que controlar, que pueden ser de larga o corta duración. La hipótesis nula es que son de CORTA duración. 6
Contrastes de una cola H :!! H :!!.5%.5%! -sd!! +sd! +sd!! -sd Supongamos que el resultado de una muestra da lugar al punto azul. Dado este resultado no rechazaríamos la hipótesis nula. 7 Contrastes de una cola H :!! H :!!.5%.5%! -sd!! +sd! +sd!! -sd En este caso rechazaríamos la hipótesis nula. 8
Contrastes de una cola H :!! H :!!.5%.5%! -sd!! +sd! +sd!! -sd O en este caso nos quedaríamos con la nula. 9 Contrastes de una cola H :!! H :!!.5%.5%! -sd!! +sd! +sd!! -sd Pero un resultado como éste nos introduce en un problema. El primer impulso es rechazar H, dado que está en la región de rechazo H.
Contrastes de una cola H :!! H :!!.5%.5%! -sd!! +sd! +sd!! -sd Observad que este resultado muestral hace que rechazemos H, pero contradice H mucho más. Contrastes de una cola H :!! H :!!.5%.5%! -sd!! +sd! +sd!! -sd La probabilidad de obtener un resultado como éste es mucho menor bajo H que bajo H.
Contrastes de una cola H :!! H :!!.5%! -sd!! +sd! +sd!! -sd Por esta razón, debería eliarse la cola baja de la zona de rechazo para H. Es decir, solamente debería utilizarse la cola derecha como zona de rechazo. 3 Contrastes de una cola H :!! H :!!.5%! -sd!! +sd! +sd!! -sd Por lo tanto, la probabilidad del Error Tipo I es.5%, el nivel de significación. 4
Contrastes de una cola H :!! H :!! 5%! -sd!! +sd! +sd!! -sd Sin embargo, es posible construir un contraste al 5% extendiendo la cola de rechazo, que empezará a.645 desviaciones típicas de la media. La razón que está detrás de un nivel del 5% es el intercambio entre el error Tipo I y Tipo II. 5 Contrastes de una cola H :!! H :!! 5%! -sd!! +sd! +sd!! -sd Observad que la lógica de eliar la cola de la izquierda depende de que! sea mayor que!. Esto es generalizable al caso en que la hipótesis alternativa establece simplemente que! es mayor que!. Naturalmente, la hipótesis alternativa estará justificada por cuestiones de índole económico o empírico. 6
Contrastes de una cola H :!! H :! <!!! -sd! -sd!! +sd! +sd Algunas veces, dada la hipótesis nula H :!!, a partir de la teoría económica o experiencia previa se podría eliar la posibilidad de que! sea mayor que!. En este caso utilizaríamos un contraste a una sola cola, pero la cola izquierda. 7 Contrastes de una cola H :!! H :!!.5%.5%! -sd!! +sd! +sd!! -sd Veamos ahora cómo un contraste a una sola cola mejora el intercambio del riesgo entre el error tipo I y II. Empezaremos asumiendo que! toma solamente dos valores,! y!. Supongamos que se realiza un contraste de dos colas al 5% de significatividad. Por tanto, si H es verdad, 8 hay un riesgo del 5% de cometer el error tipo I.
Contrastes de una cola H :!! H :!!.5%.5%! -sd!! +sd! +sd!! -sd Sin embargo, si H fuera falsa, la probabilidad de no rechazarla cometiendo el error tipo II sería el área gris claro de la figura. Observar que bajo el error tipo II, la nula es falsa y alternativa es verdadera, por lo que la distribución sería la de la derecha. El área gris claro da la probabilidad de una estimación que esté en el area de aceptación de H, condicional a que H es verdadera. 9 Contrastes de una cola H :!! H :!! 5%! -sd!! +sd! +sd!! -sd Sin embargo, el error Tipo II es menor que en el caso de las dos colas. Por tanto, no se ha aumentado la probabilidad del error tipo I y se ha logrado reducir la probabilidad de cometer el error tipo II. Cuando la alternativa es H :! >! o H :! <!, que es el caso más general, no es posible hacer el gráfico. A pesar de ello, realizando un contraste de una cola con seguridad se disuye el error 3 tipo II.
Contrastes de una cola modelo: Y! +! X + u H :! Interpretar esta Hipótesis Nula: qué significa suponer que!?. 3 Contrastes de una cola H :! H :! rechazar H no rechazar H rechazar H.5%.5% -.96 sd.96 sd 3
Contrastes de una cola H :! H :! > no rechazar H rechazar H 5%.65 sd Naturalmente, si es posible justificar la utilización de un contraste de una sola cola, por ejemplo, con H :! >, la zona de rechazo estaría a.65 sd por encima de cero. Esto haría más factible el rechazo de H y por tanto, la demostración de que Y no está afectado por variaciones de X. 33 Contrastes de una cola H :! H :! > no rechazar H rechazar H 5%.65 sd Asumiremos que la desviación típica de es conocida y que la distribución es normal. En la práctica, la desviación típica debe ser estimada y por tanto, es necesario utilizar una distribución t. A pesar de ello, el análisis es el mismo y por eso se opta por esta forma más sencilla. El valor crítico de un contraste de una cola es siempre menor que de dos colas, por tanto, 34 el error tipo II será menor.
Contraste F de Bondad de Ajuste R SCT SCE + SCE SCT!! ( Y ˆ i ( Y SCR i Y ) Y ) R, es una medida de bondad del ajuste: pero es un estadístico, tiene una distribución y cabría preguntarse si podemos contrastar la bondad de dicho ajuste. 35 Contraste F de Bondad de Ajuste R SCT SCE + SCE SCT!! ( Y ˆ ( Y SCR i i Y ) Y ) La nula en este caso es si el modelo tiene algún poder explicativo. Dado que sólo existe una variable explicativa, el contraste es equivalente a preguntarse si dicha variable explica los movimientos de la variable dependiente. 36
Contraste F de Bondad de Ajuste R SCE SCT!! ( Y ˆ i ( Y i Y ) Y ) F ( k, n k ) SCE /( k SCR /( n ) k ) ESS TSS RSS TSS ( k ) ( n k ) R /( k ) ( R )/( n k ) El contraste F de bondad de ajuste se define en base al número k de parámetros estimados en el modelo: en el caso de una regresión simple, serían dos; n es el número de observaciones en el modelo. 37 Contraste F de Bondad de Ajuste R SCT SCE + SCE SCT!! ( Y ˆ i ( Y SCR i Y ) Y ) F ( k, n k ) SCE /( k SCR /( n ) k ) SCE SCT SCR SCT ( k ) ( n k ) R /( k ) ( R )/( n k ) F es una función monótona del R. 38
Contraste F de Bondad de Ajuste F R 39 Contraste F de Bondad de Ajuste F R El estadístico F tendrá una distribución bajo la nula y, por tanto, podremos construirnos una región de rechazo. Por ejemplo, es posible construirse un contraste al 5%. Observar que el valor crítico dependerá del número de observaciones y variables explicativas. 4
Contraste F de Bondad de Ajuste R SCT SCE + SCE SCT!! ( Y ˆ ( Y SCR i i Y ) Y ) Observar que en el caso de la regresión simple, el contraste F es equivalente al t. La duda es si estos contrastes, al ser diferentes, pueden llevarnos a conclusiones contradictorias. 4 Contraste F de Bondad de Ajuste Aquí demostramos que la respuesta es negativa, ya que el contraste F no es más que el cuadrado del contraste t. 4
Contraste F de Bondad de Ajuste 43 Contraste F de Bondad de Ajuste. reg Ingresos S Source SS df MS Number of obs 57 ---------+------------------------------ F(, 568) 65.64 Model 3977.386 3977.386 Prob > F. Residual 3449.6569 568 6.5979875 R-squared.36 ---------+------------------------------ Adj R-squared. Total 38397.37 569 67.4867 Root MSE 7.7845 ------------------------------------------------------------------------------ Ingresos Coef. Std. Err. t P> t [95% Conf. Interval] ---------+-------------------------------------------------------------------- S.7355.345 8...898.3336 _cons -.394.835 -.764.445-4.966354.84347 ------------------------------------------------------------------------------ Esta es la salida de los salarios por hora condicional a los años de estudio para una muestra de 57 trabajadores. 44