Análisis de Varianza La prueba t se emplea para encntrar si las medias de ds grups difieren significativame. Qué pasa si tres más grups sn cmparads?, n se puede utilizar las pruebas t múltiple, ya que: a) Se increma el riesg de dar un resultad fals psitiv, al realizar más de un análisis sbre un mism cnjunt de dats. b) Es difícil interpretar la verdadera influencia de la variable que actúa cm factr de clasificación, prque genera diferes niveles de significación (p), resultantes de las cmparacines re sus subgrups. Es decir se increma dramáticame la prbabilidad (α) de un errr de tip I. Cuand se realiza más de una prueba t, la prbabilidad de un más errres de tip I es mayr que el nivel α establecid Para superar este prblema y aclarar la interpretación de nuestr resultad, necesitams una prueba estadística que mantenga el errr α a un nivel cnstante, haciend una decisión glbal única acerca de si existe una diferencia significativa re las más medias muestrales que buscams cmparar. La técnica estadística cncida cm análisis de varianza ANOVA desarrllada pr el inglés Sir Rnald Fisher en la década de ls añs veinte, se utiliza para determinar si las diferencias re varias medias del muestre sn más grandes de l que se esperaría si sól se tmara en cua el azar en cas de que la hipótesis nula fuese cierta. En tras palabras, ls prcedimis ANOVA se pueden usar para determinar si es n raznable cncluir que n tdas las medias del muestre prviene de la misma pblación. El análisis de varianza plantea el prblema cm un mdel matemátic, en el cual la variable dependie es la variable cuantitativa (denminada niveles del factr a las categrias), y la variable independie la variable cualitativa (también denminada factr). En el mdel de una vía sól hay una variable independie; si hubiese ds en el mdel, se aplicaría el análisis de la varianza de ds vías, etc. Para ANOVA, la hipótesis nula es una sla per incluye tdas las hipótesis: 0 : µ l µ.. µ j Para realizar un análisis de varianza, tratams la variación en un cnjunt de puntajes cruds cm si se pudiera dividir en ds cmpnes: la distancia re ls puntajes cruds y su media de grup, cncida cm la variación de ls grups y la distancia re las medias de ls grups, cncida cm variación re grups. El análisis de varianza prduce una razón F, cuy numeradr represa la variación re ls grups que se cmparan y cuy denminadr cntiene una estimación de la variación de ests grups. La razón F indica la magnitud de la diferencia re ls grups en relación cn la
magnitud de la variación de cada grup. Miras mayr sea la razón F, mayr será la prbabilidad de rechazar la hipótesis nula y aceptar la hipótesis de investigación. Cuand se alcanza la significación en algun de ls factres estudiads, es lógic preguntarse cuál de las hipótesis alternativas es la que rigina la significación. Est es equivale a preguntarse qué media medias sn diferes re sí. Ests enigmas se resuelven mediante prcedimis "a psterir" para cmparar más de ds medias, ls cuales funcinarán eficieme, si previame el factr en estudi ha resultad significativ en alguna técnica multivariante previa, cm el ANOVA.. Ejempl de ANOVA. Supngams que en un estudi querems cmparar de frma simultánea varias medias. Pr ejempl, en un estudi querems cncer el cmprtami de la tensión arterial sistólica (TAS) en las distintas clases sciales. Para ell deberíams hacer una cmparación simultánea de TAS re las clases sciales alta, media y baja. En base al planteami anterir el factr (variable cuantitativa y dependie) sería la TAS, miras que a las categrías de la clase scial de la variable independie y cualitativa, se le denmina niveles de factr. Pr l tant este ejempl es de un factr cn niveles. Al cmparar las medias, l que se esta analizand es si la TAS depende de la categría de la variable; si la TAS varía significativame de una clase scial a tra, es que el valr de la TAS depende, en parte, de la categría de la variable a que pertenezca el individu. En este cas, tenems una variable independie y una sla dependie, y éste es el mdel básic del análisis de la varianza de una vía, también denminad de un factr, que es la variable independie. Se pdría plantear un estudi en el que la variable dependie fuera la TAS y hubiese ds variables independies, la clase scial y el sex. En este cas se tendría que realizar un análisis de varianza de ds factres, cn ds variables independies cualitativas (factres). Si se tuviera una variable dependie (cuantitativa) y tres independies cualitativas (tres factres), se pdría platear un mdel de análisis de la varianza de tres factres, etc.. Supuests para la ANOVA. Una cmparación re más medias independies. Para el cas de ds muestras Ft y se btienen resultads idéntics.. Ls dats deben tener un nivel de medición de interval de razón.. Deben ser dats btenids a través del muestr aleatri. 4. Una distribución nrmal. 5. Independencia de las muestras.
. Prcedimi ANOVA de Una Vía. Establecer la hipótesis nula y la alterna.. Elegir el nivel de significación.. Encntrar la media de cada muestra. 4. Encntrar la suma de cuadrads ( Χ ) Χ. N ( ) ( ) Χ Χ 5. Encntrar la suma de cuadrads re ls grups N N 6. Encntrar la suma de ls cuadrads de ls grups 7. Obtener ls grads de libertad re ls grups gl K 8. Obtener ls grads de libertad de ls grups gl N K 9. Encntrar la media cuadrática re grups µ C gl 0. Encntrar la media cuadrática de ls grups µ C gl µc. Obtener la razón F F µ C. Determinar la razón F de la tabla (ubicar ls gl en denminadr cn el nivel de significación y gl para del numeradr).. Determinar de que área se encura la razón btenida. 4. Expresar la decisión en términs del prblema. El análisis de la varianza se basa en que, si existen diferencias significativas re las medias de cada grup, la varianza re grups se verá incremada y pr l tant será significativame distinta y mayr que la varianza de grups; esta diferencia será detectada pr la prueba de la F de Snedecr. La varianza re grups n puede ser menr que la varianza de grups (salv una pequeña prbabilidad, debida al azar); pr l tant, el cntraste de hipótesis se planteara de una sla cla, puest que únicame se cntrasta la psibilidad de que la varianza re grups sea mayr que la varianza de grups, ya que n tendría sid cntrastar que sea menr. Si la prueba de la F de Snedecr detecta diferencias significativas re la varianza de grups y la varianza re grups, ell indica que al mens una de las medias es significativame distinta de las demás (puede ser una más de una). De ahí el nmbre de análisis de varianza, pues detecta diferencias re medias analizand diferencias re varianzas.
.. Ejempl Un prfesr hiz que ls alumns de su clase de estadística evaluaran está de excele, buena, regular mala. Un estudiante graduad recgió las evaluacines y asegur a ls estudiantes que el prfesr n las recibiría hasta que las calificacines del curs n hubieran sid enviadas a la ficina de servicis académics. La evaluación (es decir, el tratami) que cada estudiante diera al prfesr se hiz cncrdar cn la calificación del curs, cuy rang era de 0 a 00. A cntinuación se presa la infrmación de la muestra. Existe una diferencia en a escala media de ls estudiantes en cada una de las cuatr categrías de evaluación?. Utilice un nivel de significancia de 0.0. Excele Buen Regular Mal 94 75 70 68 90 68 7 70 85 77 76 7 80 8 78 65 88 80 74 68 65 65 Excele Buen Regular Mal x x x x x x x x 94 8,86 75 5,65 70 4,900 68 4,64 90 8,00 68 4,64 7 5,9 70 4,900 85 7,5 77 5,99 76 5,776 7 5,84 80 6,400 8 6,889 78 6,084 65 4,5 88 7,744 80 6,400 74 5,476 68 4,64 65 4,5 65 4,5 Σ 49 0,56 9 0,8 50 7,8 44 8,64 4 5 7 6 n µ 87.5 78.0 7.86 69.00. Establecer la hipótesis nula y la alterna. : µ µ µ µ : µ µ µ µ. Elegir el nivel de significación. α 0.0. Encntrar la media de cada muestra. µ 87.5; µ 78.0; µ 7.86; µ 69.00 4 4 4
4. Encntrar la suma de cuadrads ( 056+ 08+ 78 + 864) ( Χ ) Χ. N ( 49 + 9+ 50 + 44) 485.09 5. Encntrar la suma de cuadrads re ls grups ( 49 + 9+ 50 + 44) ( ) ( ) Χ Χ 49 9 50 44 + + + 890.68 4 5 7 6 6. Encntrar la suma de ls cuadrads de ls grups 485.09 890.68 594.4 7. Obtener ls grads de libertad re ls grups gl 4 8. Obtener ls grads de libertad de ls grups gl 4 8 890.68 9. Encntrar la media cuadrática re grups µ C 96. 89 594.4 0. Encntrar la media cuadrática de ls grups µ C. 0 8 96.89. Obtener la razón F F 8. 99.0. Determinar la razón F de la tabla (ubicar ls gl en denminadr cn el nivel de significación y gl para del numeradr). F c 5.09. Determinar de que área se encura la razón btenida. El valr F es mayr a F c de md que se encura en zna de rechaz. 4. Expresar la decisión en términs del prblema. Se cncluye que las medias de la pblación n sn iguales. Las puntuacines medias n sn iguales en cada un de ls cuatr grups de clasificación, n es psible determinar que grups de tratami sn diferes..4 Ejercicis. Supnga que se puede medir el Ceficie Intelectual de ls miembrs de tres muestras de clases sciales: alta, media y baja, y deseams cmprbar la hipótesis de que el ceficie intelectual varía según la clase scial. Se btuviern ls siguies resultads: Alta (N5) Media (N5) Baja (N5) X X X 0 0 0 5 5 00 0 5 90 0 0 00 85 N N 5
Plantear la slución, cnsiderand un nivel de significación de 0.05. Supnga que un cnjunt de estudiantes fuern clasificads de acuerd cn ls tres tips del prgrama de bachillerat: general, académic y vcacinal. Se desea saber si la habilidad de ls estudiantes en escritura difiere re ls tres tips de prgramas del bachillerat. Ls dats que se btuviern sn ls siguies: General (N6) Académic (N6) Vcacinal (N6) X X X 65 6 57 54 5 54 54 59 49 59 6 9 47 65 46 65 6 4 Plantear la slución, cnsiderand un nivel de significación de 0.05 6
.5 Cmparacines Múltiples (Métd de Tukey). La prueba F, que abarca varis cncepts, en un análisis de varianza (ANOVA) es una prueba de hipótesis, :µ µ µ µ j ; per qué pasa si es rechazada? El rechazar es equivale a cncluir que n tdas las J medias del muestr prvienen de pblacines que tienen la misma media, µ; existen diferencias significativas re las J medias del muestr. Cuand J, sól hay una diferencia re medias, per para J >, se utilizan ls prcedimis estadístics cncids cm cmparacines múltiples para encntrar cuáles diferencias sn estadísticame significativas, cm es el cas del métd de Tukey. Este métd está diseñad para determinar cuál(es) par(es) de medias del muestr difiere(n) en más de l que se esperaría si slame se tmaran en cua ls errres del muestre. La prueba estadística que se utiliza en el métd Tukey y alguns trs métds de cmparacines múltiples es la estadística de rang estudizad, q. La prueba estadística q es la razón de la diferencia re un par de medias del muestr ( X i X j ) y el errr estándar de la media, S X..5. Prcedimi:. Enunciar la.. Especificar el nivel de significancia α.. Numer de muestras K. 4. Grads de libertad gl N K. 5. Encntrar la q c en la tabla Punts Prcuales Superires de la Amplitud Estudizada de Tukey (qα). 6. Cnstruya una matriz de las diferencias re ls pares de medias. 7. Calcular DMS Tukey q c * µ C * + n n 8. Cmparar DMS Tukey vs la diferencia re cada par de medias pblacinales; Si las diferencias sn mayres a la DMS nces se cncluye que existe evidencia para cncluir que hay diferencia re ese par de medias. Cuand tdas las n del grup sn iguales, td el prcedimi Tukey puede simplificarse encntrand la diferencia mínima re ds medias necesaria para rechazar la hipótesis nula (). Esta diferencia mínima se denmina la diferencia significativa justa DSJ, es la diferencia mínima re un par de medias para la cual la hipótesis nula puede ser rechazada en el nivel de significancia α, cm se muestra en la ecuación siguie: DSJ S X ( q ) * c 7
.5. Ejempl. Cnsiderar el ejempl anterir para realizar este prcedimi.. Enunciar la : µ µ µ µ µ µ µ µ µ µ µ µ ; : ; : 4; : ; : 4; :. Especificar el nivel de significancia α. α.0.05. Numer de muestras K. K 4 4. Grads de libertad gl N K. 4 gl 4 8 5. Encntrar la q c en la tabla Punts Prcuales Superires de la Amplitud Estudizada de Tukey (qα). q c 4.00 6. Cnstruya una matriz de las diferencias re ls pares de medias. Medias Aritméticas Excele Buen Regular Mal 87.5 78.0 7.86 69.00 Excele 87.5-9.05 4.9 8.5 Buen 78.0 - - 5.4 9.0 Regular 7.86 - - -.86 Mal 69.00 - - - - 7. Calcular para cada par de medias el DMS Tukey q c * µ C * n + n DMS Tukey Excele Buen Regular Mal 4 5 7 6 Excele 4-0.90 0.9 0.49 Buen 5 - - 9.5 9.84 Regular 7 - - - 9.04 Mal 6 - - - - 8
8. Cmparar DMS Tukey vs la diferencia re cada par de medias pblacinales y cncluir En base al cuadr anterir pdems cncluir que la muestra "excele" y "regular" el valr es mayr al de la DMS Tukey (smbread cn rj) pr l cual se rechaza la hipótesis nula : µ µ. Misma situación se presa re las muestras "excele" y "mal" : µ µ ). ( 4 9
Punts Prcuales Superires de la Amplitud Estudizada de Tukey (q α ) G. L. Errr α 5 6 7 8 9 0 4 5 6 7 8 9 0 4 0 40 60 0 Inf. p : Númer de Tratamis 4 5 6 7 8 9 0 4 5 6 7 8 9 0 0.05.64 4.60 5. 5.67 6.0 6. 6.58 6.80 6.99 7.7 7. 7.47 7.60 7.7 7.8 7.9 8.0 8. 8. 0.0 5.70 6.97 7.80 8.4 8.9 9. 9.67 9.97 0.4 0.48 0.70 0.89.08.4.40.55.68.8.9 0.05.46 4.4 4.90 5. 5.6 5.89 6. 6. 6.49 6.65 6.79 6.9 7.0 7.4 7.4 7.4 7.4 7.5 7.59 0.0 5.4 6. 7.0 7.56 7.97 8. 8.6 8.87 9.0 9.0 9.49 9.65 9.8 9.95 0.08 0. 0. 0.4 0.54 0.05.4 4.6 4.68 5.06 5.6 5.6 5.8 6.00 6.6 6.0 6.4 6.55 6.66 6.76 6.85 6.94 7.0 7.09 7.7 0.0 4.95 5.9 6.54 7.0 7.7 7.68 7.94 8.7 8.7 8.55 8.7 8.86 9.00 9. 9.4 9.5 9.46 9.55 9.65 0.05.6 4.04 4.5 4.89 5.7 5.40 5.60 5.77 5.9 6.05 6.8 6.9 6.9 6.48 6.57 6.65 6.7 6.80 6.87 0.0 4.74 5.6 6.0 6.6 6.96 7.4 7.47 7.68 7.87 8.0 8.8 8. 8.44 8.55 8.66 8.76 8.85 8.94 9.0 0.05.0.95 4.4 4.76 5.0 5.4 5.4 5.60 5.74 5.87 5.98 6.09 6.9 6.8 6.6 6.44 6.5 6.58 6.64 0.0 4.60 5.4 5.96 6.5 6.66 6.9 7. 7. 7.49 7.65 7.78 7.9 8.0 8. 8. 8. 8.4 8.49 8.57 0.05.5.88 4. 4.65 4.9 5. 5.0 5.46 5.60 5.7 5.8 5.9 6.0 6. 6.0 6.7 6.4 6.40 6.47 0.0 4.48 5.7 5.77 6.4 6.4 6.67 6.87 7.05 7. 7.6 7.48 7.60 7.7 7.8 7.9 7.99 8.07 8.5 8. 0.05..8 4.6 4.57 4.8 5.0 5.0 5.5 5.49 5.6 5.7 5.8 5.90 5.99 6.06 6.4 6.0 6.6 6. 0.0 4.9 5.4 5.6 5.97 6.5 6.48 6.67 6.84 6.99 7. 7.5 7.6 7.46 7.56 7.65 7.7 7.8 7.88 7.95 0.05.08.77 4.0 4.5 4.75 4.95 5. 5.7 5.40 5.5 5.6 5.7 5.80 5.88 5.95 6.0 6.09 6.5 6. 0.0 4. 5.04 5.50 5.84 6.0 6. 6.5 6.67 6.8 6.94 7.06 7.7 7.6 7.6 7.44 7.5 7.59 7.66 7.7 0.05.06.7 4.5 4.45 4.69 4.88 5.05 5.9 5. 5.4 5.5 5.6 5.7 5.79 5.86 5.9 6.00 6.05 6. 0.0 4.6 4.96 5.40 5.7 5.98 6.9 6.7 6.5 6.67 6.79 6.90 7.0 7.0 7.9 7.7 7.4 7.4 7.48 7.55 0.05.0.70 4. 4.4 4.64 4.8 4.99 5. 5.5 5.6 5.46 5.55 5.64 5.7 5.79 5.85 5.9 5.97 6.0 0.0 4. 4.89 5. 5.6 5.88 6.08 6.6 6.4 6.54 6.66 6.77 6.87 6.96 7.05 7. 7.0 7.7 7. 7.9 0.05.0.67 4.08 4.7 4.60 4.78 4.94 5.08 5.0 5. 5.40 5.49 5.58 5.65 5.7 5.79 5.85 5.90 5.96 0.0 4.7 4.8 5.5 5.56 5.80 5.99 6.6 6. 6.44 6.55 6.66 6.76 6.84 6.9 7.00 7.07 7.4 7.0 7.6 0.05.00.65 4.05 4. 4.56 4.74 4.90 5.0 5.5 5.6 5.5 5.44 5.5 5.59 5.66 5.7 5.79 5.84 5.90 0.0 4. 4.78 5.9 5.49 5.7 5.9 6.08 6. 6.5 6.46 6.56 6.66 6.74 6.8 6.90 6.97 7.0 7.09 7.5 0.05.98.6 4.0 4.0 4.5 4.7 4.86 4.99 5. 5. 5. 5.9 5.47 5.55 5.6 5.68 5.74 5.79 5.84 0.0 4.0 4.74 5.4 5.4 5.66 5.85 6.0 6.5 6.7 6.8 6.48 6.57 6.66 6.7 6.80 6.87 6.94 7.00 7.05 0.05.97.6 4.00 4.8 4.49 4.67 4.8 4.96 5.07 5.7 5.7 5.5 5.4 5.50 5.57 5.6 5.69 5.74 5.79 0.0 4.07 4.70 5.09 5.8 5.60 5.79 5.94 6.08 6.0 6. 6.4 6.50 6.58 6.65 6.7 6.79 6.85 6.9 6.96 0.05.96.59.98 4.5 4.47 4.65 4.79 4.9 5.04 5.4 5. 5. 5.9 5.46 5.5 5.59 5.65 5.70 5.75 0.0 4.05 4.67 5.05 5. 5.55 5.7 5.89 6.0 6.4 6.5 6.4 6.4 6.5 6.58 6.65 6.7 6.78 6.84 6.89 0.05.95.58.96 4. 4.45 4.6 4.77 4.90 5.0 5. 5.0 5.8 5.6 5.4 5.49 5.55 5.6 5.66 5.7 0.0 4.0 4.64 5.0 5.9 5.5 5.69 5.84 5.97 6.09 6.9 6.9 6.7 6.45 6.5 6.59 6.65 6.7 6.76 6.8 0.05.9.5.90 4.7 4.7 4.54 4.68 4.8 4.9 5.0 5.0 5.8 5.5 5. 5.8 5.44 5.50 5.54 5.59 0.0.96 4.54 4.9 5.7 5.7 5.54 5.69 5.8 5.9 6.0 6. 6.9 6.6 6. 6.9 6.45 6.5 6.56 6.6 0.05.89.49.84 4.0 4.0 4.46 4.60 4.7 4.8 4.9 5.00 5.08 5.5 5. 5.7 5. 5.8 5.4 5.48 0.0.89 4.45 4.80 5.05 5.4 5.40 5.54 5.65 5.76 5.85 5.9 6.0 6.08 6.4 6.0 6.6 6. 6.6 6.4 0.05.86.44.79 4.04 4. 4.9 4.5 4.6 4.74 4.8 4.9 4.98 5.05 5. 5.6 5. 5.7 5. 5.6 0.0.8 4.7 4.70 4.9 5. 5.7 5.9 5.50 5.60 5.69 5.77 5.84 5.90 5.96 6.0 6.07 6. 6.7 6. 0.05.8.40.74.98 4.6 4. 4.44 4.55 4.65 4.7 4.8 4.88 4.94 5.00 5.06 5. 5.6 5.0 5.4 0.0.76 4.8 4.60 4.8 4.99 5. 5.5 5.6 5.45 5.5 5.60 5.67 5.7 5.79 5.84 5.89 5.9 5.98 6.0 0.05.80.6.69.9 4.0 4.4 4.6 4.48 4.56 4.64 4.7 4.78 4.84 4.90 4.95 5.00 5.05 5.09 5. 0.0.70 4.0 4.50 4.7 4.87 5.0 5. 5. 5.0 5.8 5.44 5.5 5.56 5.6 5.66 5.7 5.75 5.79 5.8 0.05.77..6.86 4.0 4.7 4.9 4.9 4.47 4.55 4.6 4.68 4.74 4.80 4.85 4.89 4.9 4.97 5.0 0.0.64 4. 4.40 4.60 4.76 4.88 4.99 5.08 5.6 5. 5.9 5.5 5.40 5.45 5.49 5.54 5.57 5.6 5.65 0