Pasos básicos para docimar ua hipótesis:. Defiir cual es la població y el o los parámetro de iterés.. Establecer la hipótesis (ula y alterativa). 3. Establecer el ivel de sigificació α. 4. Recoger los datos y verificar los supuestos. 5. Calcular el test estadístico usado los datos. La forma geeral del test estadístico es: Test Estadístico= estimador putual valor ulo error estádar 6. Calcular el valor p (Prob. de observar u test estadístico igual o más extremo bajo 0 H ). 7. Tomar ua decisió e iformar la coclusió e térmios del problema establecido por el ivestigador.
Capítulo 9: Comparació de medias 9. Muestras pareadas versus muestras idepedietes Supoga que estamos iteresados e comparar salarios de hombres y mujeres y tomamos ua muestra aleatoria de 4 matrimoios. Juaita Pérez María Cárcamo Rosa Campos Julia del Valle Diseño pareado Pedro Moya Jua Cerda Diego Maroto Pablo Mora Esta muestra se dice pareada y el tamaño muestral correspode al úmero de pares (matrimoios), o al úmero de idividuos. Cuado los datos so pareados, os iteresa comparar las respuestas de cada par.
Aalizamos las diferecias etre las respuestas de cada par: Datos pareados = sueldo mesual e miles de $ Salario mujer Salario hombre Diferecias 50 00-50 450 30 40 500 500 0 60 300-40 Promedio diferecias -,5 La vetaja pricipal de los diseños pareados es que os ayuda a reducir el sesgo por variables cofudetes. Geeralmete las variables que se elige para parear so variables que puede iflueciar la respuesta. Cuado comparamos los resultados de observacioes pareadas, los efectos de estas variables de pareamieto se cacela. Depediedo del problema a ivestigar podemos parear los sujetos segú edad o sexo o estado de salud, etc.
Cuado comparamos resultados de observacioes pareadas, los efectos de variables cofudetes se cacela.
Otro tipo de diseño pareado es cuado cada sujeto sirve como su propio cotrol. Diseño pareado : medidas e 0 idividuos que fuero parte de u estudio médico para reducir la presió saguíea. Número Sexo Edad Ntabletas Presió_ates Presió_después 00 M 45 00. 00. 00 M 4 98.5 00.0 003 F 5 00.8 0............. 09 M 45 00.0 00.4 00 M 37 3 0.5 00.8
Supoga ahora que queremos comparar los salarios de hombres y mujeres etre los profesores de la Uiversidad. Para comparar vamos a teer que cotrolar variables como jerarquía académica, años de trabajo, etc. Diseño idepediete Marcela Paz Pedro Letelier Móica Nuñez Nemesio Lara Iés Mirada Atoio Jarpa Claudia Pio Patricio Bravo Carlos Pérez Jua Gozález E el esquema idepediete vamos a comparar las respuestas de u grupo co las respuestas del otro grupo.
Calculamos medidas de resume de uo y otro grupo y comparamos las diferecias. Datos pareados = sueldo mesual e miles de $ Salarios mujeres Salarios hombres 50 00 450 30 500 500 60 300 70 600 Promedio mujeres 35,0 Promedio hombres 438,3
9. Muestras pareadas E u diseño pareado las uidades so parecidas (de hecho puede ser las mismas), mietras que las uidades de distitos pares so diferetes. E diseños pareados aalizamos las diferecias.
Test t para muestras relacioadas Supuestos: La muestra de las diferecias es ua muestra aleatoria de ua població de diferecias. El modelo de las diferecias es Normal, supuesto que o es relevate si el tamaño de la muestra es grade. Hipótesis: H 0 : µ d = 0 versus H : µ d 0 o H : µ d > 0 o H : µ d < 0. Se determia el ivel de sigificacia α Datos: Muestra de diferecias de la cual se calcula el promedio de las diferecias d y la desviació estádar de las diferecias s d. Test estadístico observado: Este es el test estadístico y su distribució bajo H 0, es ua distribució t co - grados de libertad. El valor-p del test, depede de la hipótesis alterativa. t = s d d
Extitores E la revista que publica SERNAC Cosumo y Calidad de Vida de 99, se hace u aálisis comparativo etre lo rotulado y lo real, de la carga de ua muestra de 8 extitores. A SERNAC le iteresa ivestigar la diferecia etre la carga que aparece e la etiqueta (rotulado) y la carga real. Marca Carga rotulado Carga real Diferecia Gramos Gramos gramos Kidee 500 30 70 Werer 000 550 450 Stop-flames 000 650 350 The mosters 000 60 380 Victoria 000 750 50 Abc 000 540 460 Ig. Asociados 4000 3740 60 Asytex 000 980 0
SPSS realiza esta prueba (Aalizar, Comparar medias, Prueba t para muestras relacioas) Salida para el problema de los extitores: Estadísticos de muestras relacioadas Par Carga rotulado Carga real Desviació Error típ. de Media N típ. la media 87.50 8 75.970 66.5 88.50 8 779.556 75.65 Prueba de muestras relacioadas Par Carga rotulado - Carga real Media Desviació típ. Diferecias relacioadas 95% Itervalo de cofiaza para la Error típ. de diferecia la media Iferior Superior t gl Sig. (bilateral) 305.00 4.5 50.036 86.68 43.3 6.096 7.000
Salida para el problema de la base de datos médica: Estadísticos de muestras relacioadas Par Presió_ates Presió_después Desviació Error típ. de Media N típ. la media 00.060 0.64.597 00.045 0..730 Prueba de muestras relacioadas Par Presió_ates - Presió_después Media Desviació típ. Diferecias relacioadas 95% Itervalo de cofiaza para la Error típ. de diferecia la media Iferior Superior t gl Sig. (bilateral).05.774.75 -.346.376.087 9.93 7 Histograma 6 5 4 3 Frecuecia 0 -.5 -.0 -.5 0.0.5.0.5 Diferecias
9.3 Comparado medias de muestras idepedietes Two Idepedet Radom Samples Take a simple radom sample of size Take a simple radom sample of size Populatio Populatio Parámetros: Media població = µ Media població = µ Desviació estádar població y =σ
Supuestos para u diseño de dos muestras idepedietes: Teemos ua muestra aleatoria simple de µ,σ N. observacioes de ua població ( ) Teemos ua muestra aleatoria simple de µ,σ N. observacioes de ua població ( ) Las dos muestras aleatorias so idepedietes.
Estadísticos muestrales del diseño de dos muestras idepedietes: = tamaño muestra = tamaño muestra x = media de la muestra x = media de la muestra s = desviació estádar de la muestra s = desviació estádar de la muestra
Estamos iteresados e comparar las medias poblacioales µ y µ, el parámetro de iterés es la diferecia etre las medias µ µ. Para ecotrar u test de hipótesis ecesitamos coocer la distribució muestral de la diferecia etre las medias muestrales X X.
Distribució muestral de X muestras idepedietes X para dos. El promedio de la diferecia etre medias muestrales es: µ X X = µ µ. El error estádar de la diferecia etre medias muestrales es: σ X = σ X + 3. La distribució de X X es ormal:. X X ~ N µ µ, σ +.
La desviació estádar de X σ + X es: De los datos obteemos dos desviacioes estádar, s y s, las cuáles so estimadores de σ. Necesitamos combiar estas dos estimacioes e u estimador comú o global de la desviació estádar:. s p = ( ) ( ) s + ( + ) s
E el caso que =, s p será: s + s s p = Como es de supoer al usar estimacioes de la variaza σ ya o podemos usar la distribució Normal, sio que usaremos u test t.
Test t para muestras idepedietes Supuestos: Se tiee dos muestras idepedietes co distribució Normal, cada ua co media µ y µ desviació estádar σ. Hipótesis: H 0 : µ µ = 0 versus H : µ µ 0 o H : µ µ > 0 o H : µ µ < 0 Nivel de sigificació α. Datos: medias muestrales x y x, y las desviacioes estádar s y s.
Test estadístico observado: dode s p = t = ( s x x p + ) s + ( + ) s y la distribució bajo la hipótesis ula de la variable t es ua t de Studet co ( + - ) grados de libertad. Valor p: Ecotramos el valor p usado la distribució t( + - ). La direcció del extremo depede de la hipótesis alterativa. Decisió: Si el valor p es meor o igual a α rechazamos H 0.
SPSS Se desea saber si la grasa que es absorbida por rosquillas fritas difiere etre tipos de grasa (aimal y vegetal). Para ello se friero uidades experimetales e las grasas de iterés. Determie si las diferecias de absorció observadas etre las grasas so estadísticamete sigificativas. Aimal 64 7 68 77 56 95 78 9 97 8 85 77 Vegetal 66 49 64 70 68 75 93 78 7 63 76 58 0 00 90 80 70 60 Absorció 50 40 N = Aimal Vegetal Tipo de grasa
Estadísticos de grupo Absorció Tipo de grasa Aimal Vegetal N Desviació Error típ. de Media típ. la media 78.50.48 3.588 69.5.030 3.84 Absorció Se ha asumido variazas iguales No se ha asumido variazas iguales Prueba de Levee para la igualdad de variazas F Sig. Prueba de muestras idepedietes t gl Sig. (bilateral) Prueba T para la igualdad de medias Diferecia de medias 95% Itervalo de cofiaza para la Error típ. de diferecia la diferecia Iferior Superior.30.583.98.067 9.5 4.797 -.698 9.98.98.694.067 9.5 4.797 -.706 9.06
Supuestos de la prueba t para medias idepedietes:. Normalidad
. Homogeeidad de variazas (Homocedasticidad) Si las desviacioes estádar de la població o so coocidas pero además o las podemos asumir iguales para comparar las medias podemos usar el test estadístico: s s x x t + =. La distribució muestral bajo la hipótesis ula es ua distribució t pero co uos grados de libertad aproximados: + + = s s s s gl Pero por suerte teemos softwares que ya está programados para hacer estos cálculos.
El programa SPSS realiza u test para verificar la homogeeidad de variazas (Test de Levee): Hipótesis Test Estadístico Distribució bajo Ho H 0 : σ σ = 0 F F de Fisher co grados de libertad H 0 : σ σ 0 Co el test estadístico observado y la distribució F de Fisher se calcula el valor p. Si el valor p es mayor que 0,05 etoces aceptamos la hipótesis de homogeeidad de variazas, es decir asumimos que se cumple la homocedasticidad.
4. Otros tests Si o se cumple los supuestos existe test alterativos que o hace supuestos acerca de la distribució de los estimadores coocidos como métodos o paramétricos.
Pasos para resolver problema de comparació de medias: Asumiedo idepedecia etre los grupos y ormalidad lo primero será:. Comparar las variazas: test de Levee. Si se acepta el supuesto de homogeeidad de variaza etoces podemos usar el test t de comparació de medias, asumiedo variazas iguales. 3. Si NO se acepta el supuesto de homogeeidad de variaza etoces debemos usar el test t de comparació de medias, que NO asume variazas iguales.
Solució para el problema de las roscas: Prueba de muestras idepedietes Absorció Se ha asumido variazas iguales No se ha asumido variazas iguales Prueba de Levee para la igualdad de variazas F Sig. t gl Sig. (bilateral) Prueba T para la igualdad de medias Diferecia de medias 95% Itervalo de cofiaza para la Error típ. de diferecia la diferecia Iferior Superior.30.583.98.067 9.5 4.797 -.698 9.98.98.694.067 9.5 4.797 -.706 9.06. Test homogeiedad de variazas: H 0 : σ σ = H 0 : σ σ 0 0 Test estadístico observado: F=0,3, valor-p=0,583 > 0,05 Por lo tato aceptamos el supuesto de homocedasticidad.. Procedemos co la hipótesis de iterés: H H 0 : µ µ = : µ µ Estadístico t=,98, valor-p=0,067, por lo tato o teemos suficiete evidecia para cocluir que sea distita la absorció de grasa. 0 0