Práctica 7. Cotrastes de hipótesis Práctica 7 CONTRATE DE IPÓTEI Objetivos Utilizar los cotrastes de hipótesis para decidir si u parámetro de la distribució de uos datos objeto de estudio cumple o o ua cierta codició. Aálisis de las relacioes etre cotrastes de hipótesis e itervalos de cofiaza. Uso del P para el aálisis de ua y dos muestras cotrastes de hipótesis sobre la media poblacioal. Ídice. Costrucció de cotrastes de hipótesis.. Aálisis de ua y dos muestras co el P. 3. Ejercicios.
Práctica 7. Cotrastes de hipótesis. Costrucció de cotrastes de hipótesis. Alguas ivestigacioes se realiza para decidir si u parámetro θ de ua cierta distribució verifica o o cierta codició. Esta codició se deomia hipótesis ula y se represeta por mietras que la suposició cotraria se llama hipótesis alterativa y se deota. U cotraste de hipótesis trata de dar u mecaismo para decidir si se rechaza o o la hipótesis ula e favor de la alterativa usado la iformació proporcioada por ua muestra cuyo comportamieto depede del parámetro. e suele hablar sólo de rechazar o aceptar o rechazar). e puede cometer dos tipos de errores. Rechazar siedo cierta error de tipo I). Aceptar siedo falsa error de tipo II) Lo ideal sería miimizar las probabilidades de cometer ambos tipos de error. E la práctica, lo que se hace es fijar la cota para la probabilidad de cometer u error de tipo I e u valor α tamaño del test o ivel de sigificació) pequeño e itetar que la probabilidad de cometer el error de tipo II sea lo meor posible. Resumiedo, el problema cosiste e decidir si se rechaza o o la hipótesis ula a partir de los datos proporcioados por ua muestra. Al igual que e la costrucció de itervalos de cofiaza se busca u bue estimador del parámetro que resuma la iformació proporcioada por la muestra) y se costruye u test o prueba basado e dicho estimador de forma que si el valor del estimador cumple ua cierta codició se rechaza la hipótesis ula y si o la verifica se acepta. Esta codició se expresa por medio de u cierto subcojuto de posibles valores para el estimador llamado regió crítica. i el estimador toma u valor perteeciete a esta regió crítica se rechaza y e caso cotrario, se acepta. La regió crítica R se costruye de forma que la probabilidad de cometer el error de tipo I sea como mucho α, y, detro de lo posible, miimizar la probabilidad de cometer el error de tipo II.
Práctica 7. Cotrastes de hipótesis 3. Aálisis de ua y dos muestras co el P.. Prueba t para ua muestra ea ua muestra de ua distribució Nµ, ) Para el cotraste µ = µ µ µ co descoocida) U bue estimador para µ es la media muestral X y para es la cuasivariaza muestral. X µ Etoces T = sigue ua distribució t de tudet co - grados de libertad. La regió crítica R se costruye de la forma R = { T > x}. Ituitivamete, el cotraste establece que si la media muestral X difiere mucho del valor µ se debe rechazar la hipótesis ula. Para que se verifique que Prechazar cierta) sea como mucho α, esto es, P T > x) = α. el valor x tiee que ser t -; α, por seguir T ua distribució t -. La regió crítica queda etoces R = X µ > t -, α Ejemplos. La duració de ua determiada compoete electróica sigue ua distribució ormal. Los resultados de ua muestra aleatoria de esta clase de compoetes so, 35, 75, 89, 5, 5, horas. Realizar co α =.5 el cotraste de hipótesis µ = µ. Abrir el fichero de datos EJEMPLO.AV. eleccioar el procedimieto Prueba T para ua muestra, eligiedo el meú AalizarComparar mediasprueba T para ua muestra. 3. eleccioar la variable duracio e itroducir el valor e la vetaa correspodiete a Valor de prueba 4. Pulsar Aceptar
Práctica 7. Cotrastes de hipótesis 4 Estadísticos para ua muestra DURACION N Desviació Error típ. de Media típ. la media 7 8,574,79 75,8658 Prueba para ua muestra DURACION Valor de prueba = 95% Itervalo de cofiaza para la Diferecia diferecia t gl ig. bilateral) de medias Iferior uperior,43 6, 8,574-77,654 94,8 Para iterpretar el cotraste de hipótesis hay que usar el valor que aparece e la casilla ig. bilateral). E esta casilla está represetada la sigificació o p-valor. E este caso este p-valor es la probabilidad de que T > t =,43. La iterpretació se resume e lo siguiete i el p-valor es meor que el tamaño del test α es porque el valor del estimador usado para el cotraste perteece a la regió crítica y, por tato, se rechaza la hipótesis ula. i, por el cotrario, el p-valor es mayor que α, dicho valor o está e la regió crítica y se acepta la hipótesis ula. E este ejemplo, se debe aceptar la hipótesis ula. Relació etre itervalos de cofiaza y cotrastes de hipótesis La regió de aceptació complemetario de la regió crítica) de u cotraste de hipótesis para u parámetro θ co tamaño α coicide co u itervalo de cofiaza para θ al -α)x %. E el caso del cotraste visto ateriormete, la regió de o rechazo o aceptació) es W C = { T t -; α } = X µ t -, α = X t µ X + t -, α -, α Otra forma de iterpretar el cotraste es ver si el está coteido e el itervalo de cofiaza al 95% para la diferecia de medias, que tambié lo proporcioa el programa. i esto es así como e el ejemplo) se acepta la hipótesis ula y se rechaza e caso cotrario. La prueba T es válida siempre que el tamaño muestral sea suficietemete grade o, e caso cotrario, cuado la muestra provega de ua població co distribució ormal.
Práctica 7. Cotrastes de hipótesis 5.. Prueba t para dos muestras idepedietes Ahora se tiee dos muestras ua proveie de ua distribució Nµ, ) y otra de ua Nµ, ) Para el cotraste co = µ µ µ µ, descoocidas) se obtiee la siguiete regió crítica R = { T > t m; α } = > m, * t α Y X Depediedo de si las desviacioes típicas so iguales o diferetes se tiee diferetes valores para m y *. Para distiguir etre ambos casos se hace u cotraste previo. E realidad el que se hace es = = Este se resuelve usado la regió crítica R = { )}, ;, ;, α α F F F siedo F = que sigue ua distribució F de Fisher-edecor co - y - grados de libertad. y so los tamaños muestrales correspodietes y las respectivas cuasivariazas muestrales), i las variazas so iguales m = + y * = + p siedo p = ) ) + + E caso cotrario m se estima mediate ua expresió u poco complicada mith-atterhwaite) m = + + ) ) ) y * = +
Práctica 7. Cotrastes de hipótesis 6 Ejemplos. e quiere comparar la calidad de dos máquias que fabrica u cierto compoete eléctrico. e ha tomado datos sobre la catidad de compoetes estropeados e diferetes lotes obteiédose para la máquia los siguietes datos 5, 6, 7,, 3, 5, 6, 3, 7, 5, 6, 7, 5, 3 y para la máquia 8, 9, 5, 7, 9,, 5, 3, 9, 8. Cotrastar la igualdad de medias co α =,5 Para poder efectuar la prueba T para muestras idepedietes, P ecesita ua columa e el editor de datos que cotega los valores de la variable cuyas medias e las dos poblacioes se desea comparar, y otra que idica la població o grupo a que perteece cada idividuo.. Abrir el fichero EJEMPLO.AV. Aparece e el archivo las columas fallos y maquia.. eleccioar AalizarComparar mediasprueba T para muestras idepedietes. 3. eleccioar la variable umérica fallos y situarla e la vetaa de Cotrastar variables. A cotiuació, seleccioar la variable de agrupació maquia y pulsar Defiir grupos. 4. Especificar los dos valores de la variables de agrupació que defie cada máquia Usar valores especificados. Escribir u valor para el Grupo y otro para el Grupo. Los casos co otros valores si existe) quedará excluidos. Puto de corte. Escribir u úmero que divida los valores de la variable de agrupació e dos cojutos. Todos los códigos meores que el puto de corte forma u grupo y los mayores o iguales que el puto de corte forma el otro grupo. 5. Pulsar Aceptar Estadísticos de grupo FALLO MAQUINA,, N Desviació Error típ. de Media típ. la media 4 5,,664,4447 9,4,936,94 Prueba de muestras idepedietes FALLO e ha asumido variazas iguales No se ha asumido variazas iguales Prueba de Levee para la igualdad de variazas F ig. t gl ig. bilateral) Prueba T para la igualdad de medias Diferecia de medias 95% Itervalo de cofiaza para la Error típ. de diferecia la diferecia Iferior uperior,33,43 5,984, 5,6,9359 3,659 7,549 5,474 3,87, 5,6,3 3,393 7,87
Práctica 7. Cotrastes de hipótesis 7 Para la iterpretació de este cotraste, primero se observa la columa Prueba de Levee para la igualdad de variazas. E este caso, co α=,5 se acepta que las variazas so iguales. Posteriormete, e la fila iferior aparece los dos cotrastes sobre la igualdad de medias para la variable fallos uo co variazas iguales y otro co diferetes. E este caso, hay que fijarse e la fila correspodiete a variazas iguales. El p-valor es meor que,5, por lo que se rechaza la hipótesis ula. Esta prueba T es válida siempre que los tamaños muestrales sea suficietemete grades o cuado las muestras provega de poblacioes co distribucioes ormales..3. Prueba t para dos muestras depedietes E este caso, se tiee dos distribucioes ormales apareadas. Esto ocurre, por ejemplo, cuado se mide dos variables sobre ua muestra de idividuos. e tiee ua variable D = X-Y que sigue ua distribució Nµ D, D ) El cotraste a efectuar es µ µ D D = e obtiee la siguiete regió crítica R = { T > t -; α } = X Y D > t -, α Ejemplos 3. e quiere comparar la rapidez de dos programas iformáticos A y B para la resolució de cierta clase de problemas de igeiería hidráulica. Para ello se aaliza 9 casos utilizado tato el programa A como el B. Los tiempos obteidos para resolver estos casos fuero Caso 3 4 5 6 7 8 9 Programa A.5 3. 5.7 9.8.6.5.3.6 4. Programa B.3.9 3..9.. 9.9.8.3 Cotrastar co α =,5 si la diferecia de los tiempos medios de resolució es. Para efectuar la Prueba T para muestras emparejadas, a diferecia de las muestras idepedietes, se ecesita ua columa e los datos para cada ua de las variables a comparar.. Abrir EJEMPLO3.AV. eleccioar AalizarComparar mediasprueba T para muestras relacioadas
Práctica 7. Cotrastes de hipótesis 8 3. eleccioar las dos variables e cuya diferecia estamos iteresados. Al hacer la primera selecció e la columa de variables, esta aparece e el recuadro seleccioes actuales como variable, y al realizar la seguda selecció aparecerá como variable. E ese mometo, ya seleccioadas las dos es cuado se puede itroducir e la columa variables relacioadas. 4. Pulsar Aceptar. Estadísticos de muestras relacioadas Par PROGRAMA PROGRAMB Desviació Error típ. de Media N típ. la media,3667 9,833,6,8333 9,6,3387 Prueba de muestras relacioadas Par PROGRAMA - PROGRAMB Media Desviació típ. Diferecias relacioadas 95% Itervalo de cofiaza para la diferecia Error típ. de la media Iferior uperior t gl ig. bilateral),5333,436,4787 -,576,637,4 8,98 e observa el p-valor e la columa ig. bilateral). Como es mayor que,5 se acepta la igualdad de medias. Esta prueba T es válida siempre que el tamaño muestral sea suficietemete grade o cuado las muestra provega de poblacioes co distribució ormal. Ejercicios. Durate los últimos 5 años el úmero de ordeadores qu evede por semaa cierta empresa iformática es aproximadamete ormal Nµ, ). E ua muestra aleatoria simple de semaas de los últimos 5 años, dicha empresa vedió 75, 68, 7, 69, 83, 65, 88, 77, 67 y 8 ordeadores. Cotrastar si el valor medio de las vetas es co α=,. Cotrastar si el peso medio de u cierto tipo de piezas mecáicas difiere segú sea fabricados e dos lugares diferetes A y B co u ivel de sigificació igual a,. Los datos obteidos so los siguietes A 8, 97, 85, 73, 9, 97,, 94 B 99, 9, 85, 79, 9, 96, 5. 3. Estudiar si u cierto tipo de compoete mecáico es simétrico o o e base a la medida de sus lados izquierdo y derecho co u ivel de sigificació,5. Los datos que se ha obteido e las medidas so Pieza 3 4 5 Izquierdo.5 3. 5.7 9.8.6 Derecho.3.9 3..9.