Prueba Ji-cuadrado de Independencia cuando solo tengo datos en tabla (datos tabulados): Objetivo de la prueba: se utiliza cuando se tiene una muestra de n individuos que se clasifican respecto a dos variables, preferentemente cualitativas (nominales dicotómicas o politómicas) y se desea conocer a partir de datos muestrales, si existe asociación de estas a nivel poblacional. Hipótesis: H 0 : Existe poblacionalmente independencia entre las variables estudiadas (no existe asociación entre las variables estudiadas) H 1 : No existe poblacionalmente independencia (existe asociación entre las variables estudiadas) En las tablas 2x2 se emplea la prueba Ji-cuadrado Corrección de Yates siempre. Limitaciones de la prueba: -Se necesita que más del 20% de los valores esperados estén por encima de 5 y que ninguna celda tenga valor esperado menor a 1. -Si la tabla es de 2x2, todas las celdas deben tener valores esperados por encima de 5. -En el caso de la tabla de 2x2 si existe una sola celda con valor esperado menor que 5, esto representaría un 25% de las celdas con esa condición, por lo que se utilizaría la Prueba de las Probabilidades exactas de Fisher en lugar de la Prueba χ 2, ya que en éste caso no es posible agrupar categorías. -En el caso de las tablas 2x2 se sugiere incluir en el estadígrafo la corrección de continuidad de Yates, que consiste en restarle ½ al numerador de la expresión, para atenuar el efecto de usar una distribución continua para representar una distribución discreta de frecuencias muestrales. El estadígrafo de prueba y la regla de decisión son similares a los de la Prueba Jicuadrado de homogeneidad. Aspectos que diferencian a las Prueba de χ 2 de Independencia y a la Prueba de χ 2 de Homogeneidad: Tipo de muestreo Número de muestras Hipótesis a contrastar Conclusiones
Prueba Tipo de muestreo Independencia Transversal Homogeneidad Cohorte Casos Control o # de muestras Usos Probar la hipótesis nula según la cual en la población existe Una muestra independencia entre los dos criterios de clasificación. Probar la hipótesis nula de que 2 o más muestras, en las muestras extraídas provienen general f muestras de una población homogénea independientes según algún criterio de clasificación. Errores más frecuentes en el uso de las Pruebas de Independencia y Homogeneidad: No inspeccionar los datos antes de realizar cualquier prueba de hipótesis. Clasificar una variable cuantitativa en su naturaleza con una escala de menor para poder realizar la prueba. Utilizar la prueba cuando una de las variables es cualitativa ordinal (en ese caso se emplea la Ji-cuadrado Tendencia Lineal). Usar el estadístico como una medida de asociación (estas pruebas son de significación de asociación y no dan una medida de asociación, solo permiten identificar si existe o no asociación pero no cuantifican la magnitud de esa asociación en caso de que exista). Usar la prueba cuando se dispone de valores promedios o porcentajes (la prueba solo puede realizarse con las frecuencias observadas, no con medidas de resumen). En las tablas FxC: no se debe utilizar la prueba cuando más del 20% de las celdas tienen frecuencias esperadas menores que 5 o al menos 1 de las celdas tiene frecuencia esperada inferior a 1. En las tablas 2x2: no se debe utilizar la prueba cuando una frecuencia esperada es menor que 5. En ese caso debe realizarse la Prueba de Fisher-Irwin o de probabilidad exacta de Fisher. Ejemplo: se desea conocer si existe asociación entre el hábito de fumar y el bajo peso al nacer en una población, para lo cual se selecciona una muestra aleatoria de 100 recién nacidos, obteniéndose los resultados siguientes: Bajo peso al nacer Hábito de fumar Sí No Total Presente 30 10 40 Ausente 20 40 60 Total 50 50 100 Considere un α=0,05.
Note usted que el tamaño de muestra es fijo (n=100) pero la distribución según las categorías de ambas variables es aleatoria. Como se parte de una muestra y se clasifican los individuos acorde a dos variables cualitativas se empleará la Ji-cuadrado de Independencia. Hipótesis. H 0 : Hay independencia entre las variables hábito de fumar y bajo peso al nacer ((la ocurrencia de una variable no afecta la ocurrencia de la otra o también no hay asociación entre las variables hábito de fumar y bajo peso al nacer) H 1 : No hay independencia entre las variables hábito de fumar y bajo peso al nacer (la ocurrencia de una variable modifica la ocurrencia de la otra o hay asociación entre las variables hábito de fumar y bajo peso al nacer) Se introducen los datos en el programa de la siguiente forma: Es decir, se tienen tres variables: Var00001, Var00002 y frecuencias_observadas. Quedará así en la Vista de variables: Luego hay que ir al menú Datos, Ponderar casos y darclic en Ponderar casos. Quedará así:
Después saldrá la siguiente ventana: Ahora daremos clic en la variable Frecuencias observadas de para activarla, luego marcaremos con un clic donde dice Ponderar casos mediante y pasaremos la variable Frecuencias observadas de para donde dice Variable de frecuencia. Debe quedarles así:
Luego vamos al menú Analizar, Estadísticos descriptivos, Tablas de contingencia y daremos clic en Tablas de contingencia. Debe quedarles así: Luego saldrá el siguiente cuadro de diálogo: Ahora daremos un clic en la variable Var00001 para activarla y la pasaremos hacia el cuadro que dice Filas: y luego daremos un clic en la variable Var00002 para activarla y la pasaremos hacia el cuadro que dice Columnas:. Luego debe quedarles así:
Después en el botón Estadísticos que queda a la derecha y arriba de ese cuadro de diálogo anterior daremos clic y saldrá el siguiente cuadro de diálogo: Ahí daremos un clic para activar el cuadrito que está delante de donde dice Chicuadrado y luego daremos clic en el botón de abajo donde dice Continuar. Debe quedarles así:
Ahora volvemos al cuadro de diálogo anterior y daremos clic en el botón Aceptar y saldrán los siguientes resultados: Resultados: Tablas de contingencia [Conjunto_de_datos3] D:\0-Bioestadistica\13-Pruebas en SPSS\Pruebas no paramétricas\ji-cuadrado\2-independencia\1-base de datos. Prueba Jicuadrado de Indep. Con datos tabulados.sav Resumen del procesamiento de los casos Casos Válidos Perdidos Total N Porcentaje N Porcentaje N Porcentaje VAR00001 * VAR00002 100 100,0% 0 0,0% 100 100,0% Tabla de contingencia VAR00001 * VAR00002 Recuento VAR00002 Total 1 2 1 30 10 40 VAR00001 2 20 40 60 Total 50 50 100 Pruebas de chi-cuadrado Valor gl Sig. asintótica (bilateral) Chi-cuadrado de Pearson 16,667 a 1,000 Corrección por continuidad b 15,042 1,000 Razón de verosimilitudes 17,261 1,000 Sig. exacta (bilateral) Sig. exacta (unilateral) Estadístico exacto de Fisher,000,000 Asociación lineal por lineal 16,500 1,000 N de casos válidos 100 a. 0 casillas (0,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 20,00. b. Calculado sólo para una tabla de 2x2. Interpretación: Vemos en la tabla titulada Resumen del procesamiento de los casos estudiados donde se observa que el 100 % de los casos fueron válidos.
Vemos en la tabla titulada Tabla de contingencia Var00001 * Var00002 el recuento de los casos que pertenecen a cada categoría de las dos variables de estudio. La tabla titulada Pruebas de chi-cuadrado nos muestra el valor del estadígrafo Corrección por continuidad ya que se trata de una tabla 2x2, cuyo valor fue de 15,042, con un grado de libertad. El valor de p (Sig. asintótica (bilateral)) fue de 0,000 y como es menor de 0,05 y debajo de la tabla aclaran que 0 casillas (0,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 20,00, puede concluirse que con un nivel de significación del 5% hay suficiente evidencia para plantear que las variables hábito de fumar y bajo peso al nacer están asociadas (se rechaza la hipótesis nula de independencia por tanto existe asociación entre las variables).