11. PRUEBAS NO PARAMÉTRICAS

Documentos relacionados
Parte de las notas tomadas de: Prof. Edgar Acuña UNIVERSIDAD DE PUERTO RICO RECINTO UNIVERSITARIO DE MAYAGUEZ

CAPÍTULO 11 PRUEBAS NOPARAMÉTRICAS

UAP PRUEBAS DE HIPÓTESIS NO PARAMÉTRICAS

Parte de las notas fueron tomadas de: Profra.. Leticia de la Torre, Tecnológico de Chihuahua Prof. Edgar Acuña, Universidad de Puerto Rico

Ejemplos del Suplemento 1 resueltos con Minitab

Pruebas de bondad de ajuste

Problemas resueltos. Temas 10 y 11 11, 9, 12, 17, 8, 11, 9, 4, 5, 9, 14, 9, 17, 24, 19, 10, 17, 17, 8, 23, 8, 6, 14, 16, 6, 7, 15, 20, 14, 15.

PRUEBAS PARA DOS MUESTRAS RELACIONADAS

7. INFERENCIA ESTADÍSTICA

Estadística Avanzada y Análisis de Datos

Estadística Inferencial. Sesión No. 8 Pruebas de hipótesis para varianza.

Métodos Estadísticos de la Ingeniería Tema 10: Inferencia Estadística, Intervalos de Confianza Grupo B

Técnicas de Inferencia Estadística II. Tema 3. Contrastes de bondad de ajuste

TEMA 5 Inferencia no paramétrica. Guía docente:

Tema Correlación. Correlación. Introducción

Tema 7. Introducción Metodología del contraste de hipótesis Métodos no paramétricos

F X > F Y F X < F Y F X 6= F Y

no paramétrica comparar más de dos mediciones de rangos (medianas)

Estadísticas Pueden ser

ANÁLISIS CUANTITATIVO DE DATOS EN CIENCIAS SOCIALES CON EL SPSS (I) Tablas de contingencia y pruebas de asociación

Métodos de Investigación en Psicología (11) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández

Distribución muestral de proporciones. Algunas secciones han sido tomadas de: Apuntes de Estadística Inferencial Instituto Tecnológico de Chiuhuahua

no paramétrica comparar dos mediciones de rangos (medianas)

Problemas resueltos. Tema 12. 2º La hipótesis alternativa será que la distribución no es uniforme.

Técnicas de validación estadística Bondad de ajuste

Técnicas de validación estadística Bondad de ajuste

Técnicas Cuantitativas para el Management y los Negocios I

Tema 5: Principales Distribuciones de Probabilidad

TRABAJO PRÁCTICO ESTADISTICA APLICADA (746)

UNIVERSIDAD TECNICA PARTICULAR DE LOJA ESTADISTICA Y PROBABILIDAD ENSAYO N 8

Diferencia de medias. Estadística II Equipo Docente: Iris Gallardo Andrés Antivilo Francisco Marro

Vanesa Berlanga y María José Rubio. Clasificación de pruebas no paramétricas. Cómo aplicarlas en SPSS

CÁLCULO DE SIGNIFICANCIA ESTADÍSTICA PARA RESULTADOS SIMCE

Práctica 1: Introducción a SPSS 1

CAPÍTULO 7 INFERENCIA ESTADÍSTICA

Y = ßo + ß1X + ε. La función de regresión lineal simple es expresado como:

La distribución t de student. O lo que es lo mismo: La relación entre la cerveza y los estudios de estadística

ACTIVIDAD 5: Correlación y Regresión Lineal

Estadística Inferencial 3.7. Prueba de hipótesis para la varianza. σ gl = n -1. Es decir: Ho: σ 2 15 Ha: σ 2 > 15 (prueba de una cola)

Índice de contenidos. Primera parte Introducción al SPSS. 1. Estructura del SPSS

EJERCICIOS DEL CAPITULO 4

Teoría de la decisión Estadística

PRUEBAS PARAMETRICAS Y PRUEBAS NO PARAMETRICAS. jujo386@hotmail.com

1º BACH CCSS - MATEMÁTICAS - PROBLEMAS DE ANÁLISIS ESTADÍSTICO DE UNA VARIABLE ˆ EJERCICIO 25

Validación de los métodos microbiológicos HERRAMIENTAS ESTADISTICAS. Bqca. QM Alicia I. Cuesta, Consultora Internacional de la FAO

SnapStat: Análisis de Una Muestra

Nivel socioeconómico medio. Nivel socioeconómico alto SI NO TOTAL

Julia García Salinero. Departamento de Investigación FUDEN. Introducción

Comparación de dos grupos independientes Solución no paramétrica. En capítulo 12: Métodos no paramétricos

10.3. Sec. Prueba de hipótesis para la media poblacional. Copyright 2013, 2010 and 2007 Pearson Education, Inc.

Determinación del tamaño muestral para calcular la significación del coeficiente de correlación lineal

CAPÍTULO 9 REGRESIÓN LINEAL

D.2 ANÁLISIS ESTADÍSTICO DE LAS TEMPERATURAS DE VERANO

Estadística inferencial. Aplicación con el SPSS

Conocer la forma de analizar las Medidas de Tendencia Central de una distribución con OpenOffice Calc.

1) Características del diseño en un estudio de casos y controles.

CÁLCULO DE SIGNIFICANCIA ESTADÍSTICA PARA RESULTADOS DE LAS PRUEBAS SIMCE

ESTADISTICA APLICADA: PROGRAMA

ANÁLISIS ESTADÍSTICO PRUEBA DE HIPOTESIS

MEDIDAS DE ASIMETRÍA Y CURTOSIS EMPLEANDO EXCEL

ÍNDICE CAPITULO UNO CAPITULO DOS. Pág.

Econometria. 4. Modelo de Regresión Lineal Simple: Inferencia. Prof. Ma. Isabel Santana

Tema II. Las muestras y la teoría paramétrica

Estadística II Tema 4. Regresión lineal simple. Curso 2010/11

Segunda práctica de REGRESIÓN.

Muestreo y Distribuciones muestrales. 51 SOLUCIONES

CONCEPTOS FUNDAMENTALES

Potencia estadística

Práctica de AJUSTE DE DISTRIBUCIONES II (ajuste de datos)

1. Límites normales de tolerancia: estos límites asumen que los datos son una muestra aleatoria de una distribución normal.

IIC Sistemas Recomendadores

7.6 Comparación entre dos medias Poblacionales usando muestras independientes

CONTENIDO. Prólogo a la 3. a edición en español ampliada... Prólogo...

Estadística II Tema 3. Comparación de dos poblaciones. Curso 2010/11

Medidas de asociación

TEMA II: DISTRIBUCIONES RELACIONADAS CON LA NORMAL

Tema 11: Intervalos de confianza.

Indicaciones para el lector... xv Prólogo... xvii

CAPITULO 4: DESARROLLO. En los capítulos anteriores hemos estudiado las bases del problema de la ruta

PROGRAMA COMPLETO DEL CURSO DE BIOESTADÍSTICA APLICADA A LAS CIENCIAS DE LA SALUD

1. IDENTIFICACIÓN DE LA ASIGNATURA

DISTRIBUCIONES DE PROBABILIDAD (RESUMEN)

Análisis de Capabilidad (Porcentaje Defectuoso)

10. DISEÑOS EXPERIMENTALES

MATEMÁTICAS APLICADAS A LAS C.C. SOCIALES

Métodos Estadísticos de la Ingeniería Tema 11: Contrastes de Hipótesis Grupo B

FUNDAMENTOS METODOLÓGICOS EN PSICOLOGÍA ANÁLISIS BÁSICOS CON SPSS

COMPARACIÓN DE SUPERFICIES DE RESPUESTA CON BÚSQUEDA TABÚ Y ALGORITMOS GENÉTICOS

INTERVALO DE CONFIANZA PARA LA PROPORCIÓN

Grado en Química Bloque 1 Funciones de una variable

Estadísticos Aplicados en el SPSS 2008

Intervalos para la diferencia de medias de dos poblaciones

PRUEBAS NO PARAMÉTRICAS

Conceptos del contraste de hipótesis

TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD

Distribuciones bidimensionales. Regresión.

SEMINARIO DE INVESTIGACIÓN IV

8. ANÁLISIS DE DATOS. Dr. Edgar Acuña Departmento de Matematicas Universidad de Puerto Rico- Mayaguez

3. VARIABLES ALEATORIAS

Tests de Hipótesis. Métodos no paramétricos ESTADÍSTICA (Q) Algunas consideraciones sobre las inferencias sobre la media de una población Normal

Transcripción:

. PRUEBAS NO PARAMÉTRICAS Edgar Acuña http://math.uprm/edu/~edgar UNIVERSIDAD DE PUERTO RICO RECINTO UNIVERSITARIO DE MAYAGUEZ

PRUEBAS NO PARAMÉTRICAS Se estudiarán las pruebas noparamétricas, las cuales no requieren asumir normalidad de la población y que en su mayoría se basan en el ordenamiento de los datos. Todas las pruebas vistas en este capítulo requieren que la población sea continua. El parámetro que se usa para hacer las pruebas estadísticas es la Mediana y no la Media. En MINITAB, para las pruebas noparamétricas se elige la secuencia STAT 4Noparametrics.

Pruebas No paramétricas para Prueba de los Signos una sola muestra Se usa para hacer pruebas de hipótesis acerca de la mediana de una población de una variable continua. Ho: La Mediana poblacional es igual a un valor dado. Ha: La mediana es menor (mayor ó distinta) del valor dado. La prueba estadística está basada en la distribución Binomial con probabilidad de éxito p=½, puesto que la probabilidad de que un dato sea mayor o menor que la mediana es ½. Para calcularla se determinan las diferencias de los datos con respecto al valor dado de la mediana y se cuentan los signos positivos y negativos.

Pruebas Noparamétricas para una sola muestra Cuando la hipótesis alterna es "mayor que" y el número de diferencias positivas es mayor que las diferencias negativas entonces, el "p-value" se calcula por c n P = ( ) i= 0 i n donde c es el número de diferencias positivas y, n es igual al número de datos pero, si hay datos de valor igual a la mediana que se asume en la hipótesis nula entonces, n es igual al número de datos menos la cantidad de datos iguales a la mediana asumida, cuando el número de diferencias positivas es menor que el número de diferencias negativas entonces el "p-value" es igual a n n P = ( ) i= c i n

Pruebas Noparamétricas para una sola muestra Si la hipótesis alterna es "menor que" y el número de diferencias positivas es mayor que el número de diferencias negativas entonces p-value = P en caso contrario p-value = P. Cuando la hipótesis alterna es de dos lados y el número de diferencias positivas son mayores que el número de diferencias negativas entonces el p-value = P, si hay menor número de diferencias positivas entonces p-value =P y si hay igual número de diferencias positivas y negativas entonces, p-value =. Si n>0 se puede usar aproximación Normal a una Binomial con p = q = 0.5, para calcular los p-values. Es decir, Z = X.5n..5 n

Ejemplo Probar si los datos del tiempo de vida después del transplante del ejemplo 7.5 sugieren que la mediana sea distinta de 5. Ho, es que la mediana del tiempo de sobrevivencia es igual a 5 años Ha, es que la mediana del tiempo de sobrevivencia es distinta de 5 años. Sign Test for Median: tiempo Sign test of median = 5.000 versus not = 5.000 N Below Equal Above P Median tiempo 7 0 5 0.7744 3.700 Interpretación: Como el p-value es mayor que.05 se aceptará la hipótesis nula. Es decir que la mediana del tiempo de vida después del transplante es 5. En este ejemplo el p-value es veces la probabilidad de que una binomial con n= y p =.5 sea menor o igual que 5, ya que el número de diferencias positivas es menor que el de las negativas. Si usamos aproximación normal a la binomial el p-value = P(X 5) =.7778,

Pruebas Noparamétricas para una sola muestra La Prueba de Rangos con signos de Wilcoxon Es usada para hacer pruebas de hipótesis acerca de la mediana. La prueba estadística se basa en el estadístico de Wilcoxon (945), el cual se calcula de la siguiente manera: Se resta de cada dato el valor de la mediana que se considera en la hipótesis nula. Se calcula los rangos de las diferencias sin tomar en cuenta el signo de las mismas ( o sea en valor absoluto). En el caso de haber empate se asigna un rango promedio a todas las diferencias empatadas es decir; se les asigna el rango: (menor rango del grupo del empate + mayor rango del grupo del empate)/. El estadístico W de Wilcoxon será la suma de los rangos correspondientes a las diferencias positivas.

Pruebas Noparamétricas para una sola muestra Cuando la hipótesis alterna es "mayor que" y la suma de los rangos correspondientes a las diferencias positivas es mayor que el de las diferencias negativas, entonces el p-value se calcula por P =P(W W c ), donde W c es el valor calculado de la prueba de Wilcoxon. Cuando la suma de los rangos correspondientes a las diferencias positivas es menor que el de las diferencias negativas, entonces el p-value se calcula por P =P(W W c )

Pruebas Noparamétricas para una sola muestra Si la hipótesis alterna es "menor que", y la suma de los rangos correspondientes a las diferencias positivas es mayor que el de las diferencias negativas, entonces p-value =P. En caso contrario p-value =P. Cuando la hipótesis alterna es de dos lados y la suma de los rangos correspondientes a las diferencias positivas es mayor que el de las diferencias negativas, entonces el p-value =P, si la suma de los rangos correspondientes a las diferencias positivas es la menor entonces p-value =P y si las sumas de los rangos correspondientes a las diferencias positivas y negativas son iguales entonces p-value =.0.

Ejemplo Probar si los datos del tiempo de vida después del transplante del ejemplo 7.5 sugieren que la mediana sea distinta de 5. Solución: La hipótesis nula Ho, es que la mediana del tiempo de sobrevivencia es igual a 5 años y la hipótesis alterna Ha, es que la mediana de los tiempos de sobrevivencia es distinta de 5 años. Sign Test for Median: tiempo Sign test of median = 5.000 versus not = 5.000 N Below Equal Above P Median tiempo 7 0 5 0.7744 3.700 Interpretación: Como el P-value es mayor que.05 se aceptará la hipótesis nula. Es decir que la mediana del tiempo de vida después del transplante es 5.0. En este ejemplo el P-value es veces la probabilidad de que una binomial con n= y p=.5 sea menor o igual que 5, ya que el número de diferencias positivas es menor que el de las negativas.

La Prueba de Rangos con signos de Wilcoxon Al igual que la prueba de los signos, es usada para hacer pruebas de hipótesis acerca de la mediana. La prueba estadística se basa en el estadístico de Wilcoxon (945), el cual se calcula de la siguiente manera: Se resta de cada dato el valor de la mediana que se considera en la hipótesis nula. Se calcula los rangos de las diferencias sin tomar en cuenta el signo de las mismas ( o sea en valor absoluto). En el caso de haber empate se asigna un rango promedio a todas las diferencias empatadas es decir; se les asigna el rango: (menor rango del grupo del empate + mayor rango del grupo del empate)/. Finalmente el estadístico W de Wilcoxon será la suma de los rangos correspondientes a las diferencias positivas.

La Prueba de Rangos con signos de Wilcoxon Cuando la hipótesis alterna es "mayor que" y la suma de los rangos correspondientes a las diferencias positivas es mayor que el de las diferencias negativas, entonces el p-value se calcula por P =P(W W c ), Cuando la suma de los rangos correspondientes a las diferencias positivas es menor que el de las diferencias negativas, entonces el p-value se calcula por P =P(W W c ). Si la hipótesis alterna es "menor que", y la suma de los rangos correspondientes a las diferencias positivas es mayor que el de las diferencias negativas, entonces p-value =P. En caso contrario pvalue =P. Cuando la hipótesis alterna es de dos lados y la suma de los rangos correspondientes a las diferencias positivas es mayor que el de las diferencias negativas, entonces el p-value =P, si la suma de los rangos correspondientes a las diferencias positivas es la menor entonces pvalue =P y si las sumas de los rangos correspondientes a las diferencias positivas y negativas son iguales entonces p-value =.0.

Cuando n es mayor que 6, se usa aproximación Normal para hallar el p-value de la prueba pues, se puede mostrar que el estadístico de Wilcoxon se aproxima a una normal con media igual a n(n+)/4, y varianza n(n+)(n+)/4, cuando no hay empates. z = n( n + ) W 4 n( n + )(n + ) ~ N(0,) 4 Si hubiera empates entonces, la varianza sufre una ligera modificación z = n( n + ) W 4 n( n + )(n + ) 4 ~ N(0,) g es el número de grupos empatados y t i es el tamaño del i-ésimo grupo empatado. g i= t 3 i t i

En MINITAB, para hacer la prueba de Wilcoxon se sigue la secuencia STAT 4Noparametrics 4-Sample Wilcoxon. Ejemplo. Aplicar la prueba de Wilcoxon a los datos del ejemplo anterior. Solución: La ventana de diálogo se completará como se muestra en la figura. Los resultados en la ventana session serán Wilcoxon Signed Rank CI: tiempo Confidence Estimated Achieved Interval N Median Confidence Lower Upper tiempo 4.63 94.5.85 7.30 Interpretación: Como el p-value =.906 es mayor que.05 no se rechaza la hipótesis nula. Es decir, hay suficiente evidencia estadística para concluir que la mediana de los tiempos de vida es 5.0.

Pruebas Noparamétricas para muestras pareadas La prueba de los signos y la prueba de Wilcoxon se pueden usar también como una prueba alterna a la prueba de t para comparaciones pareadas. En este caso se aplica la prueba noparamétrica a las diferencias entre los dos grupos. Ejemplo.3. Se desea probar si el rendimiento en la prueba de aprovechamiento matemático es mejor que en la prueba de aptitud matemática. Para ello se toma una muestra de los resultados de 40 estudiantes: Wilcoxon Signed Rank Test: diferenc Test of median = 0.000000 versus median > 0.000000 N for Wilcoxon Estimated N Test Statistic P Median diferenc 40 40 59.0 0.008 7.75 Interpretación: Como el p-value es menor que.05, se rechaza la hipótesis nula y se concluye que hay evidencia estadística de que el rendimiento en aprovechamiento es mejor que en aptitud.

La prueba de Mann-Withney para dos muestras independientes Se usa cuando se quiere comparar dos poblaciones usando muestras independientes, es decir; es una prueba alterna a la prueba de t para comparar dos medias usando muestras independientes. También es conocida como la prueba de suma de rangos de Wilcoxon. La hipótesis nula es que la mediana de las dos poblaciones son iguales y la hipótesis alterna puede ser que la mediana de la población sea mayor ( menor ó distinta) de la mediana de la población. Cuando tanto n como n sean mayores que 0, se puede demostrar que si No hay empates, entonces W se distribuye aproximadamente como una normal con media n(n +n +)/ y varianza n n (n +n +)/. n ( n W z = n n ( n + n + n + ) + ) ~ N(0,)

La prueba de Mann-Withney para dos muestras independientes Cuando hay empates entonces, la varianza es modificada y se obtiene: z = n n [ n + n W n ( n + g + n + ) t 3 i t = ( n + n )( n + n ) i i ~ N(0,) donde, g y t i tienen el mismo significado dado anteriormente. En MINITAB, para hacer la prueba de Mann-Withney, se sigue la secuencia STAT 4Noparametrics 4Mann-Withney.

Ejemplo Usando los datos del ejemplo 7. probar si el rendimiento en la prueba de aprovechamiento matemático de los estudiantes de escuela pública y privada es el mismo. Los datos son como siguen: privada pública 64 580 767 638 64 704 7 694 65 65 689 67 63 689 Solución Mann-Whitney Test and CI: privada, pública N Median privada 6 665.5 pública 8 630.5 Point estimate for ETA-ETA is 6.5 95.5 Percent CI for ETA-ETA is (-47.0,04.0) W = 56.5 Test of ETA = ETA vs ETA not = ETA is significant at 0.556 The test is significant at 0.55 (adjusted for ties) Interpretación: Como el p-value 0.55 (ajustado por empates), es mayor que 0.05 se acepta hipótesis nula. Es decir; que hay evidencia estadística para concluir que el rendimiento en aprovechamiento matemático es el mismo para estudiantes de escuela pública y privada.

La prueba de Kruskal-Wallis para comparar más de dos grupos La prueba de Kruskal-Wallis, es una alternativa a la prueba F del análisis de varianza para diseños de clasificación simple. En este caso se comparan varios grupos pero usando la mediana de cada uno de ellos, en lugar de las medias. Ho: La mediana de las k poblaciones consideradas son iguales y Ha: Al menos una de las poblaciones tiene mediana distinta a las otras. H = k n( n + ) i= R i n i 3( n + ) donde, n es el total de datos.

La prueba de Kruskal-Wallis para comparar más de dos grupos Si hay empates en los datos entonces, se aplica la siguiente modificación a H. H ' = H g 3 ti i= 3 n t n i Se puede mostrar que si los tamaños de cada grupo son mayores que 5 entonces, H se distribuye como una Ji-Cuadrado con, k- grados de libertad. Luego, la hipótesis nula se rechaza si. H > χ k, α Para hacer la prueba de Kruskal-Wallis en MINITAB, los datos de la variable cuantitativa deben ir en una columna y los niveles del factor en otra. No se permite en este caso entrar los grupos en columnas separadas.

Ejemplo Usar la prueba de Kruskal-Wallis para comparar los métodos de enseñanza del ejemplo 0. Solución: Ho: Las medianas de los tres métodos de enseñanza son iguales y Ha: Al menos uno de los métodos de enseñanza tiene mediana distinta a los otros. Kruskal-Wallis Test: notas versus método Kruskal-Wallis Test on notas método N Median Ave Rank Z 6 6.50 5.4 -.9 7 85.00 3.8.7 3 5 74.00 8.4-0.54 Overall 8 9.5 H = 8.3 DF = P = 0.06 H = 8.5 DF = P = 0.06 (adjusted for ties) Interpretación: Como el p-value es 0.06 menor que.05, se rechaza la hipótesis nula y se concluye que los métodos no son todos iguales. Es decir; al menos uno de los métodos tiene mediana distinta a los otros.

El Coeficiente de Correlación de Spearman La correlación de Spearman mide el grado de asociación entre dos variables cuantitativas que siguen una tendencia siempre creciente o siempre decreciente. es más general que el Coeficiente de correlación de Pearson, la correlación de Spearman, en cambio se puede calcular para relaciones exponenciales o logarítmicas entre las variables. Para hallar los ordenamientos, se usa la opción Rank del menú Calc. Los ordenamientos se guardan en otras columnas y luego se halla simplemente el coeficiente de correlación usual entre éstas dos columnas usando la opción correlación del submenú Basic Statistics del menú STAT. MINITAB también incluye en el menú de Pruebas Noparamétricas a la Prueba de Friedman para análisis de diseños en bloques al azar y la prueba de Mood.

Ejemplo Calcular el coeficiente de Correlación de Spearman y compararlo con el coeficiente de correlación de Pearson para los siguientes datos: Años como Realtor (X) Casas Vendidas(Y) 3 4 6 7 8 5 0 6 9 6 9 3 9 34 37 40 45 Solución: Ordenando los datos de cada variable se obtiene: rankx 3 4 5 6 7 8 9 0 ranky 3 4 5 0 6 7 8 9 La correlación de Spearman de las variables X e Y será igual a la correlación de Pearson entre las variables rankx y ranky dando un valor de 0.879 lo que indica una alta asociación entre las variables. Sin embargo; la correlación de Pearson entre las variables X e Y da solamente 0.37, lo que indica una baja asociación lineal entre las variables. Notar que el "outlier" 9 ha afectado grandemente al coeficiente de correlación de Pearson, pero no ha tenido efecto sobre la correlación de Spearman.