Relacones entre varables cualtatvas Problema: xste relacón entre el estado nutrconal y el rendmento académco de estudantes de enseñanza básca? stado Nutrconal Malo Regular Bueno TOTAL Bajo 13 95 3 55 Rendmento Académco Promedo 9 45 35 575 Sobre 7 3 7 17 TOTAL 9 575 135 1 Ya vmos cómo podemos descrbr los datos que provenen de este tpo de problema, medante tablas de contngenca o de doble entrada. n esta undad revsaremos los test estadístcos dsponbles, el test de J cuadrado y el test F. Test de J-cuadrado xsten varos tests de J cuadrado * que srven para contestar dstntas preguntas, pero estos tenen certas característcas comunes: 1. Los datos conssten en frecuencas observadas (O), esto es, cuantos ítems o sujetos caen en cada categoría.. Se calculan las frecuencas esperadas () bajo H, esto es, las frecuencas que esperamos ver en cada categoría s la correspondente hpótess nula es correcta. 3. Comparamos las frecuencas observadas con las esperadas por medo del test estadístco que será una medda de cuán cerca están las frecuencas observadas de las frecuencas esperadas bajo H. ntonces, s la "dstanca" es grande, tenemos evdenca para rechazar H. l test de J cuadrado es: χ ( O ) = S las frecuencas observadas están cerca de las frecuencas esperadas bajo H, entonces el estadístco de χ debe ser chco. Valores grandes del estadístco ndcan dferencas entre lo observado y lo esperado. Como sólo valores grandes son evdenca a favor de la hpótess alternatva, los tests de J cuadrado son unlaterales y la dreccón del extremo es haca la derecha. l valor-p será la probabldad de observar un test estadístco gual o mayor al calculado, asumendo que la hpótess nula es certa. 4. La relacón entre el test y la dstrbucón funcona ben sempre cuando el número esperado es al menos 5. n general los softwares estadístcos verfcan este supuesto. Propedades de la dstrbucón de J-cuadrado χ ( gl) - La dstrbucón no es smétrca, es sesgada a la derecha - Sus valores son cero o postvos, no negatvos. - La dstrbucón está defnda por el número de grados de lbertad. - l promedo de la dstrbucón de J-cuadrado es gual a sus grados de lbertad. - La varanza de la dstrbucón de J-cuadrado es dos veces sus grados de lbertad ( gl). * sencalmente la prueba de asocacón que veremos aquí y las pruebas de bondad de ajuste. 1
gl=1 gl=4 gl=1 5 1 15 χ Fgura: Dstrbucones de J cuadrado con dstntos grados de lbertad
Tabla de J cuadrado 3
Prueba de asocacón o de ndependenca * La prueba de asocacón, permte al nvestgador saber s exste asocacón entre dos varables cualtatvas. jemplo: Para evaluar un nuevo tratamento, cuyos resultados son desconocdos, se trata a 1 pacentes con el nuevo tratamento y a 13 pacentes (selecconados aleatoramente) con un tratamento antguo y se regstra s mejora o no. stado Tratamento xpermental Antguo Total Mejora 9 11 No mejora 3 11 14 Total 1 13 5 a) Planteamento de la hpótess Hpótess de nuldad ( H ): No hay asocacón entre el estado del pacente y el tratamento, es decr, el porcentaje de pacentes que mejora es el msmo, sn mportar a qué tratamento fue sometdo. Smbólcamente, H P = P : en que P representa el porcentaje de mejoría. exp ant Hpótess alternatva ( H 1 ): Hay asocacón entre el estado del pacente y el tratamento, es decr, el porcentaje de pacentes que mejora es dferente entre los sometdos al tratamento expermental y los sometdos al tratamento antguo. Smbólcamente, H 1 : P exp Pant stadístca a utlzar: en que: O = frecuenca observada en la celda = frecuenca esperada en la celda χ fxc = Σ = 1 ( O ) fxc = número de celdas, se obtene multplcando número de flas (f) por número de columnas (c). n este problema =4 b) Cálculo del J-cuadrado Bajo la hpótess nula, no hay asocacón entre el estado del pacente y el tratamento; por lo tanto, el porcentaje que mejora debería ser el msmo para los dos tratamentos. Su mejor estmacón será: 11/5, 44%, vale decr, el porcentaje de mejoría observado en el total. La frecuenca esperada ( ) de los que mejoran la obtenemos aplcando este porcentaje a los totales margnales, respectvamente. 11 11 1 = 1= 5,8 = 13= 5, 7 5 5 Por analogía, la frecuenca esperada ( ) de los que no mejoran la obtendremos aplcando 14/5, 56% el porcentaje de los que no mejoran a los totales margnales, respectvamente. 14 14 3 = 1= 6,7 4 = 13= 7, 8 5 5 * Algunos textos hacen la dstncón entre una prueba de J cuadrado de ndependenca y una prueba de J cuadrado de homogenedad. l cálculo y la nterpretacón práctca de cada procedmento son déntcos. Utlzamos la prueba de asocacón para nclur ambos tpos. 4
Una manera alternatva para el cálculo de las frecuencas esperadas para determnada celda utlza los totales de la fla y de la columna en que se encuentra el valor observado de la celda: l estadístco observado a partr de los datos de este ejemplo es: = (total fla x total columna)/ Total χ OBS = ( 9 5,8) ( 5,7) ( 3 6,7) ( 11 7,8) 5,8 + 5,7 + 6,7 + 7,8 = 9, c) Grados de lbertad ste test de J cuadrado tene dstrbucón de J cuadrado con (número de flas - 1) x (número de columnas - 1) grados de lbertad. n este ejemplo, (-1) x (-1) = 1 grado de lbertad Comparemos con la salda del SPSS: Ch-cuadrado de Pearson Correccón por contnudad a Razón de verosmltudes stadístco exacto de Fsher Asocacón lneal por lneal N de casos váldos Pruebas de ch-cuadrado Sg. asntótca Valor gl (blateral) 9. b 1.3 6.744 1.9 9.638 1. 8.64 1.3 5 a. Calculado sólo para una tabla de x. Sg. exacta (blateral) Sg. exacta (unlateral).5.4 b. casllas (.%) tenen una frecuenca esperada nferor a 5. La frecuenca mínma esperada es 5.8. 5
Supuestos del test de J cuadrado La prueba de J cuadrado no asume dstrbucón alguna para las observacones, es decr es una prueba no paramétrca. Un supuesto básco al utlzar esta prueba consste en que cada observacón regstrada en la tabla de contngenca es ndependente de las demás. "Independenca" en este contexto sgnfca que no más de una observacón vene de cada undad observaconal. La undad más común es una persona. S hay 96 personas en estudo, el número total de observacones en la tabla de contngenca deberá ser 96. S la msma persona contrbuye en más de una entrada en una tabla, la prueba de J cuadrada no es apropada. Por últmo, un supuesto mportante es saber que el estadístco de J cuadrado sgue una dstrbucón de J cuadrado sempre que los valores esperados sean mayores que 5, s esto no se cumple, el test no es váldo. Qué hacer s tenemos frecuencas esperadas menores que 5? l test de probabldad exacta de Fsher Se utlza para el análss de tablas de contngenca cuando no se cumple el requsto del tamaño mínmo para aplcar el método de J cuadrado, que exge que los valores esperados en cada celda de la tabla sean al menos 5. l test de probabldad exacta de Fsher requere el cálculo de las probabldades ndvduales para las dstntas maneras (combnacones) en que pueden aparecer las frecuencas dentro de las celdas de la tabla de contngenca, mantenendo constantes las frecuencas margnales. No vamos a revsar los cálculos para la prueba de Fsher sno que revsaremos la solucón que nos da la salda SPSS cuando analzamos tablas de contngenca. Paradoja de Smpson (opconal) Ya hemos revsado el problema de las varables confundentes, el efecto de estas varables podría nfluencar la asocacón entre dos varables categórcas. jemplo: Suponga que el Mnstero de Salud nos entrega datos sobre la mortaldad de dos Hosptales de la Regón. Los datos en una tabla de x nos muestran la sobrevvenca de pacentes después de crugía en el hosptal A y B, donde sobrevvenca sgnfca que el pacente está vvo al menos 6 semanas después de la crugía. HOSPITAL A B stado Vvo 37 784 pacente Muerto 63 16 Total 1 8 Hosptal A perde 63/1 = 3% de los pacentes de crugía y Hosptal B perde 16/8 = % de los pacentes de crugía. Conclumos que el Hosptal B es "mejor". Pero, no todas las crugías son del msmo tpo. Luego, se entregan nuevos datos que ncluyen la condcón de los pacentes antes de la crugía clasfcados como "buena" o "mala". stado Buena condcón Mala condcón Hosptal Hosptal A B A B Sobrevve 594 59 stado Sobrevve 1443 19 Muere 6 8 Muere 57 8 Total 6 6 Total 15 S analzamos ahora según la condcón, resulta que en el Hosptal A sólo 6/6 = 1% muere y en el Hosptal B 8/6 = 1,3% muere entre los pacentes que estaban en buenas condcones. ntre los pacentes que están en malas condcones en el Hosptal A sólo 57/15 = 3,8% muere y en el Hosptal B 8/ = 4% muere. ste fenómeno es conocdo como la paradoja de Smpson. 6