9.1.Análisis de tablas de contingencia
Qué es una tabla de contingencia? Observamos datos de frecuencias de sucesos Diseños de cohortes Diseños de casos y controles Diseños transversales Estamos interesados en evaluar si podemos aceptar hipótesis como: Independencia de sucesos Homogeneidad de probabilidades entre grupos
Ejemplos Estudio transversal Sobre un total de 2479 encuestas, se evalúa la posible relación entre el nivel social y el nivel máximo de estudios alcanzado a los 30 años. Tabla de contingencia Nivel social * Nivel de estudios Nivel social Bajo Medio Alto Nivel de estudios Primarios Medios Bachillerato Universitarios 123 145 245 97 610 222 343 344 233 1142 123 134 225 245 727 468 622 814 575 2479
Ejemplos Estudio transversal (1) Según nivel social (2) Según nivel de estudios Tabla de contingencia Nivel social * Nivel de estudios Nivel social Bajo Medio Alto Nivel de estudios Primarios Medios Bachillerato Universitarios 123 145 245 97 610 20,2% 23,8% 40,2% 15,9% 100,0% 222 343 344 233 1142 19,4% 30,0% 30,1% 20,4% 100,0% 123 134 225 245 727 16,9% 18,4% 30,9% 33,7% 100,0% 468 622 814 575 2479 18,9% 25,1% 32,8% 23,2% 100,0% (1) Tabla de contingencia Nivel social * Nivel de estudios Nivel social Bajo Medio Alto % de Nivel de estudios % de Nivel de estudios % de Nivel de estudios % de Nivel de estudios Nivel de estudios Primarios Medios Bachillerato Universitarios 123 145 245 97 610 26,3% 23,3% 30,1% 16,9% 24,6% 222 343 344 233 1142 47,4% 55,1% 42,3% 40,5% 46,1% 123 134 225 245 727 26,3% 21,5% 27,6% 42,6% 29,3% 468 622 814 575 2479 (2)
Tabla de contingencia Nivel social * Nivel de estudios Nivel social Bajo Medio Alto Nivel de estudios Primarios Medios Bachillerato Universitarios 123 145 245 97 610 20,2% 23,8% 40,2% 15,9% 100,0% 222 343 344 233 1142 19,4% 30,0% 30,1% 20,4% 100,0% 123 134 225 245 727 16,9% 18,4% 30,9% 33,7% 100,0% 468 622 814 575 2479 18,9% 25,1% 32,8% 23,2% 100,0% 50 (1) Según nivel social 40 30 Podemos concluir que el nivel social se asocia a un nivel superior de estudios? Porcentaje 20 10 0 Primarios Bachillerato Nivel social Bajo Medio Alto Medios Universitarios Nivel de estudios Casos ponderados por OBS
Ejemplo Diseño de cohortes Queremos comparar tres tratamientos, evaluando la proporción de s respecto de un tratamiento control. Tabla de contingencia * Control A B C 35 23 11 10 79 50,0% 50,0% 18,6% 22,2% 35,9% 32,9% 26,1% 39,0% 26,7% 31,8% 17,1% 23,9% 42,4% 51,1% 32,3% 70 46 59 45 220
Ejemplo Tabla de contingencia * Diseño cohortes Control A B C 35 23 11 10 79 50,0% 50,0% 18,6% 22,2% 35,9% 32,9% 26,1% 39,0% 26,7% 31,8% 17,1% 23,9% 42,4% 51,1% 32,3% 70 46 59 45 220 60 Podemos concluir que el tratamiento C es mejor? Hasta qué punto son efectivos los tratamientos A y B? Porcentaje 50 40 30 20 10 0 Control A B C Casos ponderados por OBS
Tablas de contingencia RxC Estrategia general de análisis Considerar si los resultados de la tabla son compatibles con la hipótesis nula correspondiente Independencia de sucesos Igualdad (homogeneidad) de probabilidades entre grupos (diseños de cohortes) Evaluar los residuales ajustados
La hipótesis nula en tablas que corresponden a grupos independientes (cohortes) Tabla de contingencia * Control A B C 35 23 11 10 79 50,0% 50,0% 18,6% 22,2% 35,9% 32,9% 26,1% 39,0% 26,7% 31,8% 17,1% 23,9% 42,4% 51,1% 32,3% 70 46 59 45 220 H 0 : La probabilidad de es la misma en todos los tratamientos
La hipótesis nula en tablas que corresponden a grupos independientes (cohortes). Evaluación de la tabla Tabla de contingencia * Control A B C 35 23 11 10 79 50,0% 50,0% 18,6% 22,2% 35,9% 32,9% 26,1% 39,0% 26,7% 31,8% 17,1% 23,9% 42,4% 51,1% 32,3% 70 46 59 45 220 Si los tratamientos son equivalentes, la estimación de las probabilidades de es: P()=0.359, P()=0.318, P()=0.323 Hasta qué punto los resultados de la tabla son compatibles con la hipótesis de igualdad?
La hipótesis nula en tablas que corresponden a grupos independientes (cohortes). Evaluación de la tabla Tabla de contingencia * Control A B C 35 23 11 10 79 50,0% 50,0% 18,6% 22,2% 35,9% 32,9% 26,1% 39,0% 26,7% 31,8% 17,1% 23,9% 42,4% 51,1% 32,3% 70 46 59 45 220 Si los tratamientos son equivalentes, la estimación de P()=0.359 P(/C)=0.50, P(/A)=0.50, P(/B)=0.186,P(/C)=0.22 Estos resultados son compatibles con la hipótesis de igualdad en todos los grupos?
La hipótesis nula en tablas que corresponden a grupos independientes (cohortes). Evaluación de la tabla Tabla de contingencia * Si la hipótesis de igualdad es cierta p<0.001 Por lo tanto, debemos concluir que los resultados no son compatibles con esta hipótesis Cómo podemos interpretar los resultados? Control A B C 35 23 11 10 79 50,0% 50,0% 18,6% 22,2% 35,9% 32,9% 26,1% 39,0% 26,7% 31,8% 17,1% 23,9% 42,4% 51,1% 32,3% 70 46 59 45 220 Pruebas de chi-cuadrado Valor gl Sig. asintótica (bilateral) Chi-cuadrado de Pearson 28,260 a 6,000 Razón de verosimilitud 29,182 6,000 Asociación lineal por lineal 22,619 1,000 N de casos válidos 220 a. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 14,32.
Tabla de contingencia * Control A B C 35 23 11 10 79 50,0% 50,0% 18,6% 22,2% 35,9% 3,0 2,2-3,2-2,1 32,9% 26,1% 39,0% 26,7% 31,8%,2 -,9 1,4 -,8 17,1% 23,9% 42,4% 51,1% 32,3% -3,3-1,4 1,9 3,0 70 46 59 45 220 Concepto de residual ajustado Si P(/C)=P() el residual ajustado en la casilla correspondiente debe estar entre -1.96 y 1.96 El residual ajustado nos indica qué casillas se apartan de la hipótesis de igualdad de probabilidades En la casilla correspondiente a los controles que experimentan una de grado () el residual ajustado es igual a 3.0 Por lo tanto, la hipótesis de igualdad no se cumple en esa casilla.
Tabla de contingencia * Control A B C 35 23 11 10 79 50,0% 50,0% 18,6% 22,2% 35,9% 3,0 2,2-3,2-2,1 32,9% 26,1% 39,0% 26,7% 31,8%,2 -,9 1,4 -,8 17,1% 23,9% 42,4% 51,1% 32,3% -3,3-1,4 1,9 3,0 70 46 59 45 220 Residuales >1.96 Indican resultados superiores a los esperados Residuales <-1.96 Indican resultados inferiores a los esperados
Tabla de contingencia * Control A B C 35 23 11 10 79 50,0% 50,0% 18,6% 22,2% 35,9% 3,0 2,2-3,2-2,1 32,9% 26,1% 39,0% 26,7% 31,8%,2 -,9 1,4 -,8 17,1% 23,9% 42,4% 51,1% 32,3% -3,3-1,4 1,9 3,0 70 46 59 45 220 Residuales No significativos Indican resultados compatibles con los esperados
Tabla de contingencia * Control A B C 35 23 11 10 79 50,0% 50,0% 18,6% 22,2% 35,9% 3,0 2,2-3,2-2,1 32,9% 26,1% 39,0% 26,7% 31,8%,2 -,9 1,4 -,8 17,1% 23,9% 42,4% 51,1% 32,3% -3,3-1,4 1,9 3,0 70 46 59 45 220 Residuales <-1.96 Indican resultados inferiores a los esperados Residuales >1.96 Indican resultados superiores a los esperados
Tabla de contingencia * Control A B C 35 23 11 10 79 50,0% 50,0% 18,6% 22,2% 35,9% 3,0 2,2-3,2-2,1 32,9% 26,1% 39,0% 26,7% 31,8%,2 -,9 1,4 -,8 17,1% 23,9% 42,4% 51,1% 32,3% -3,3-1,4 1,9 3,0 70 46 59 45 220 El tratamiento A se comporta de manera parecida al control El tratamiento C es mejor El tratamiento B presenta resultados similares al tratamiento C
Tabla de contingencia * Control A B C 35 23 25 33 116 50,0% 50,0% 34,2% 48,5% 45,1% 1,0,7-2,2,7 32,9% 26,1% 31,5% 17,6% 27,2% 1,2 -,2 1,0-2,1 17,1% 23,9% 34,2% 33,8% 27,6% -2,3 -,6 1,5 1,3 70 46 73 68 257 Pruebas de chi-cuadrado Chi-cuadrado de Pearson Razón de verosimilitud Asociación lineal por lineal N de casos válidos Sig. asintótica Valor gl (bilateral) 11,436 a 6,076 12,147 6,059 3,143 1,076 257 a. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 12,53.
Tabla de contingencia * Control A B C 35 23 25 33 116 50,0% 57,5% 45,5% 49,3% 50,0%,0 1,0 -,8 -,1 23 12 20 22 77 32,9% 30,0% 36,4% 32,8% 33,2% -,1 -,5,6 -,1 12 5 10 12 39 17,1% 12,5% 18,2% 17,9% 16,8%,1 -,8,3,3 70 40 55 67 232 Pruebas de chi-cuadrado Chi-cuadrado de Pearson Razón de verosimilitud Asociación lineal por lineal N de casos válidos Sig. asintótica Valor gl (bilateral) 1,536 a 6,957 1,562 6,955,162 1,687 232 a. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 6,72.
Ejemplos de interpretación de tablas
Tabla de contingencia Nivel social * Nivel de estudios Nivel social Bajo Medio Alto Nivel de estudios Primarios Medios Bachillerato Universitarios 123 145 245 97 610 20,2% 23,8% 40,2% 15,9% 100,0%,9 -,9 4,4-4,9 222 343 344 233 1142 19,4% 30,0% 30,1% 20,4% 100,0%,7 5,2-2,7-3,0 123 134 225 245 727 16,9% 18,4% 30,9% 33,7% 100,0% -1,6-4,9-1,3 8,0 468 622 814 575 2479 18,9% 25,1% 32,8% 23,2% 100,0% Pruebas de chi-cuadrado Chi-cuadrado de Pearson Razón de verosimilitud Asociación lineal por lineal N de casos válidos Sig. asintótica Valor gl (bilateral) 92,343 a 6,000 90,090 6,000 29,305 1,000 2479 a. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 115,16.
Tabla de contingencia * Control A B 35 23 23 81 50,0% 50,0% 50,0% 50,0%,0,0,0 23 12 11 46 32,9% 26,1% 23,9% 28,4% 1,1 -,4 -,8 12 11 12 35 17,1% 23,9% 26,1% 21,6% -1,2,4,9 70 46 46 162 100,0% 100,0% 100,0% 100,0% Chi-cuadrado de Pearson Razón de verosimilitud Asociación lineal por lineal N de casos válidos Pruebas de chi-cuadrado Sig. asintótica Valor gl (bilateral) 2,089 a 4,719 2,105 4,716,374 1,541 162 a. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 9,94.
Tabla de contingencia * Control A B 35 23 23 81 50,0% 50,0% 50,0% 50,0%,0,0,0 23 12 11 46 32,9% 26,1% 23,9% 28,4% 1,1 -,4 -,8 12 11 12 35 17,1% 23,9% 26,1% 21,6% -1,2,4,9 70 46 46 162 100,0% 100,0% 100,0% 100,0% Estimar la proporción esperada de s tipo () en el tratamiento B p0q0 π = P( / B) π p0 ± z1 α / 2 N π 0.261± 1.96 π ( 0.134, 0.388) 0.261 0.739 46