PRUEBA DE KOLMOGOROV SMIRNOV (Contraste sobre la forma de la distribución) F(X) es la función de distribución que hipotetizamos.



Documentos relacionados
ANÁLISIS DE DATOS NO NUMERICOS

Indicaciones específicas para los análisis estadísticos.

PRUEBAS NO PARAMÉTRICAS

Tema 3. Comparaciones de dos poblaciones

MATEMÁTICAS CCSS II Sobrantes 2010 (Modelo 1) SELECTIVIDAD ANDALUCÍA

Covarianza y coeficiente de correlación

ESTIMACIÓN. puntual y por intervalo

1. MEDIDAS DE TENDENCIA CENTRAL

3. ANÁLISIS ESTADÍSTICOS DE LAS PRECIPITACIONES EN EL MAR CASPIO

VECTORES EN EL ESPACIO. 1. Determina el valor de t para que los vectores de coordenadas sean linealmente dependientes.

x y 8000 x + y a) La región factible asociada a las restricciones anteriores es la siguiente: Pedro Castro Ortega lasmatematicas.

TEMA 5 VALIDEZ DE LA INVESTIGACIÓN (II): Validez de conclusión estadística

MEDIDAS DE TENDENCIA CENTRAL

INFERENCIA ESTADÍSTICA. ESTIMACIÓN DE LA MEDIA

Métodos y Diseños utilizados en Psicología

MATEMÁTICAS CCSS II Sobrantes 2010 (Modelo 1) SELECTIVIDAD ANDALUCÍA OPCIÓN A EJERCICIO 1

Problemas de Probabilidad resueltos.

Estimación de una probabilidad

TEMA 2. FILOSOFÍA DE LOS GRÁFICOS DE CONTROL. Principios básicos de los gráficos de control. Análisis de patrones.

Detergente Lavad.1 Lavad.2 Lavad.3 Media A B C D Media

IES Fco Ayala de Granada Junio de 2012 (General Modelo 4) Soluciones Germán-Jesús Rubio Luna

Departamento de Matemática Aplicada a la I.T. de Telecomunicación

REPASO CONCEPTOS BÁSICOS DE ESTADÍSTICA. DISTRIBUCIÓN NORMAL.

Un problema sobre repetidas apuestas al azar

APROXIMACIÓN DE LA DISTRIBUCIÓN BINOMIAL A LA NORMAL, LA CALCULADORA Y

Pruebas de Acceso a las Universidades de Castilla y León

Profr. Efraín Soto Apolinar. Función Inversa

Control Estadístico de Procesos

Lección 24: Lenguaje algebraico y sustituciones

Capítulo 7: Distribuciones muestrales

Esta encuesta se ha remitido a los alumnos al inicio del programa, en 4 centros de La Rioja (2 de Logroño, 1 de Rioja Alta y 1 de Rioja Baja).

RIESGO Y RENTABILIDAD DE LA EMPRESA (Riesgo y Rendimiento) Qué es lo que determina el rendimiento requerido de una inversión?

IES Fco Ayala de Granada Septiembre de 2011 (Modelo 5) Soluciones Germán-Jesús Rubio Luna

Tema 12: Contrastes Paramétricos

INFORME DE ANÁLISIS DE ENCUESTAS DE SATISFACCIÓN DE USUARIOS PERÍODO

Clase 4: Probabilidades de un evento

ENCUESTA DE OPINIÓN SOBRE EL GRADO DE CONOCIMIENTO DE LOS CIUDADANOS DE LA PROVINCIA DE TOLEDO ACERCA DE LAS ASOCIACIONES DE CONSUMIDORES

Programa de Statgraphics. TITULO: Aplicaciones del Análisis de la Varianza. Resolución de dos Ejercicios propuestos paso por paso.

E 1 E 2 E 2 E 3 E 4 E 5 2E 4

Medidas de tendencia central o de posición: situación de los valores alrededor

Matrices equivalentes. El método de Gauss

Espacios vectoriales y aplicaciones lineales.

Análisis de medidas conjuntas (conjoint analysis)

UNED. [TEMA 3] Análisis de datos para diseños de dos grupos. Muestras independientes.

Cómo aplicar las pruebas paramétricas bivariadas t de Student y ANOVA en SPSS. Caso práctico.

1 Espacios y subespacios vectoriales.

Análisis de Regresión Múltiple con Información Cualitativa: Variables Binarias o Ficticias

1. a) Definimos X =número de personas con síntomas si examino sólo una persona, la cual sigue una distribución B(1, p), donde

Capítulo 3 Marco Metodológico.

PRUEBAS PARAMETRICAS Y PRUEBAS NO PARAMETRICAS. Juan José Hernández Ocaña

Media vs mediana vs moda Cual medida de tendencia central es mas adecuada? MEDIA conveniencias:

Definición Se llama suceso aleatorio a cualquier subconjunto del espacio muestral.

CORRELACIÓN Y PREDICIÓN

MEDICION DEL TRABAJO

Problemas. Intervalos de Confianza y Contrastes de Hipótesis

Los polinomios. Un polinomio es una expresión algebraica con una única letra, llamada variable. Ejemplo: 9x 6 3x 4 + x 6 polinomio de variable x

ANÁLISIS ESTADÍSTICO Calculadora Gráfica TI 83 Plus José Carlos Vega Vilca, Ph.D.

Tema 9 Estadística Matemáticas B 4º E.S.O. 1 TABLAS DE FRECUENCIAS Y REPRESENTACIONES GRÁFICAS EN VARIABLES DISCRETAS

CAPITULO III MARCO METODOLÓGICO 3.1 DISEÑO Y TÉCNICAS DE RECOLECCIÓN DE INFORMACIÓN:

EL DESARROLLO DEL JUEGO Y EL USO DEL JUGUETE

Tema 1: Test de Distribuciones de Probabilidad

Selectividad Septiembre 2013 OPCIÓN B

Capítulo 17 Análisis de correlación lineal: Los procedimientos Correlaciones bivariadas y Correlaciones parciales

EJERCICIOS RESUELTOS DE VARIABLES CUALITATIVAS

Lección 4: Suma y resta de números racionales

INTRODUCCIÓN A LA PROBABILIDAD.

PRUEBAS DE ACCESO A LA UNIVERSIDAD L.O.E.

Ecuaciones de primer grado con dos incógnitas

Introducción a la Econometría

DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS [TEMA

TABLAS DE CONTINGENCIA (CROSS-TAB): BUSCANDO RELACIONES DE DEPENDENCIA ENTRE VARIABLES CATEGÓRICAS 1

Asignatura: Econometría. Conceptos MUY Básicos de Estadística

Intervalo para la media (caso general)

1.1. Introducción y conceptos básicos

1 Ejemplo de análisis descriptivo de un conjunto de datos

ANÁLISIS DE UN JUEGO DE CARTAS: LAS SIETE Y MEDIA

Prof. Dr. José Perea Dpto. Producción Animal ANÁLISIS DE EXPERIMENTOS

Los modelos que permite construir el ANOVA pueden ser reducidos a la siguiente forma:

Experimentos con un solo factor: El análisis de varianza. Jhon Jairo Padilla Aguilar, PhD.

Solución ESTADÍSTICA. Prueba de evaluación contínua 2 - PEC2

Universidad de Málaga

Se enfría una sandía al ponerla abierta al sol?

1.4. Comparación con otras actividades de ocio

Métodos estadísticos y numéricos Contraste de hipótesis pag. 1 PROBLEMAS RESUELTOS DE CONTRASTE DE HIPÓTESIS

Aplicaciones de Estadística Descriptiva

TABLA DE DECISION. Consideremos la siguiente tabla, expresada en forma genérica, como ejemplo y establezcamos la manera en que debe leerse.

Métodos generales de generación de variables aleatorias

-Género: no nos ha quedado claro cómo influye este parámetro en el gasto en ocio, si positiva o negativamente.

Capítulo 19 Análisis no paramétrico: El procedimiento Pruebas no paramétricas

OPCIÓN A 0 1 X = Podemos despejar la matriz X de la segunda ecuación ya que la matriz. 1 1 ; Adj 0 1 X =

Esther Sui-chu Ho Evelyn Yee-fun Man Facultad de Educación Instituto de Investigación Educativa de Hong Kong Universidad China de Hong Kong

EJERCICIOS DEL TEMA 1

Diseños de Investigación 40 conceptos que debes conocer

TEMA 4: Variables binarias

Hay diferencias en la media del HOMA entre los diabéticos y los no diabéticos? Resumen del procesamiento de los casos

2. MÉTODOS, INSTRUMENTOS Y ESTRATEGIAS

La ventana de Microsoft Excel

Tema 1: Fundamentos de lógica, teoría de conjuntos y estructuras algebraicas: Apéndice

Pruebas de Hipótesis de Una y Dos Muestras. UCR ECCI CI-1352 Probabilidad y Estadística Prof. M.Sc. Kryscia Daviana Ramírez Benavides

Comparación de medias

Transcripción:

PRUEBA DE KOLMOGOROV SMIRNOV (Contraste sobre la forma de la distribución) PRUEBAS NO PARAMÉTRICAS F(X) es la función de distribución que hipotetizamos. Fs(X) es la probabilidad o proporción teórica de valores que deben ser iguales o menores que x suponiendo cierta la hipótesis planteada, S(X) es la función de distribución obtenida en la muestra. En resumen tendremos: Hipótesis: H 0 : F (X) = Fs (X) H 1 : F (X) Fs (X) Muestra: n observaciones independientes. Estadístico de contraste: D n = máxima Fs (X) S (X) Ejemplo: Las puntuaciones obtenidas por una muestra de sujetos en una prueba de habilidad han sido las siguientes: 48,1; 47,8; 45.1; 46,3; 45,4; 47,; 46,6; y 46. Sabiendo que la media en dicha prueba es 40 y su desviación típica es 3, podemos afirmar que la distribución de las puntuaciones sigue una normal, con un α = 0,01? Solución: 1. Hipótesis: H 0 : F (X) = Fs (X) de una N(µ, σ) H 1 : F (X) Fs (X) de una N(µ, σ). Muestra: 8 observaciones indep. 3. Tipificamos las puntuaciones para poder trabajar con una N (0,1). X i 48,1,7 47,8,6 45,1 1,7 46,3,1 45,4 1,8 47,,4 46,6, 46 Z i 1

4. Ordenamos las puntuaciones, obtenemos Fs (X) y S (X) y calculamos la diferencia entre ambas para cada valor de X. Z i Fs (X) S(X) Fs(X) S(X) 1,7 0,9554 0,15 0,8304 1,8 0,9641 0,50 0,7141,0 0,977 0,375 0,60,1 0,981 0,500 0,481, 0,9861 0,65 0,3611,4 0,9918 0,750 0,418,6 0,9953 0,875 0,103,7 0,9965 1.000 0.0035 Para α = 0,01 y n = 8 en la tala encontramos un valor de 0,543, por tanto, se rechaza H 0 PRUEBA DE MANN WHITNEY (Diferencias en tendencia central, muestras independientes) Supuestos: Las dos muestras son aleatorias respecto a su población correspondiente. Todas las observaciones son independientes entre si. La variable considerada es continua en ambas poblaciones. El nivel de medida de los datos es al menos ordinal. La F(X) de la variable en ambas poblaciones, si difiere en algo es en la localización. Hipótesis: H 0 : Las poblaciones son iguales H 1 : Las poblaciones son distintas. Muestra: n a y n b obs. independientes. Estadístico de contraste: Si N = n a + n b es pequeño T = S {n b (n b + 1)} / dónde: n b es el tamaño de la muestra mas pequeña. S es la suma de los posibles valores ordinales de los n b elementos dentro del conjunto N Si N = n a + n b es grande: T (n a n b )/ Z = [(n a n b ) (n a + n b -1)/1] 0,5

dónde: n a y n b representan los tamaños de ambas muestras. T es el valor del estadístico Esta prueba es más conocida como la U de Mann Whitney y se suele calcular como: (U + 0,5) (n a n b )/ Z = [(n a n b ) (n a + n b +1)/1] 0,5 Donde U es el menor de los siguientes estadísticos: U a = (n a n b ) + [ n a (n a +1)/] - S a U b = (n a n b ) + [ n b (n b +1)/] - S b Ejemplo: Se desea construir una prueba de psicomotricidad en la que no presenten diferencias significativas las personas ciegas de nacimientos con respecto a las videntes. Se toman al azar dos ciegos de nacimiento y tres videntes, todos de la misma edad, el mismo sexo y educación similar. Los datos obtenidos en la prueba fueron: Ciegos: 16, 19 Videntes: 0, 17, 5 Hay evidencia suficiente para firmar que ambos grupos son iguales en la prueba? (α = 0,05) Solución: 1. Hipótesis: H 0 : Las poblaciones son iguales. H 1 : Las poblaciones son distintas.. Muestras: y 3 obs. independientes 3. Obtenemos la distribución muestral de los órdenes posibles para el tamaño de muestra más pequeño. Si H 0 es cierta las ( + 3) obs. aparecerán ordenadas de cualquier modo. Tenemos entonces que: N = {C, C, V, V, V} que pueden aparecer ordenados de 10 maneras distintas y todas ellas equiprobables. 3

Comb. Ordenes 1 3 4 5 S (de C) 1 V V V C C 9 V V C V C 8 3 V C V V C 7 4 C V V V C 6 5 V V C C V 7 6 V C V C V 6 7 C V V C V 5 8 V C C V V 5 9 C C V V V 3 10 C V C V V 4 La f(x) correspondiente a la variable suma de órdenes correspondientes a la muestra de ciegos será: S 3 4 5 6 7 8 9 f(s) 1/10 1/10 /10 /10 /10 1/10 1/10 es decir, esta sería la distribución muestral de S 4. Ordenamos los datos de nuestra muestra: datos 16 17 19 0 5 grupo C V C V V orden 1º º 3º 4º 5º 5. Calculamos el valor de S para la muestra de ciegos: S = 1 + 3 = 4 Si miramos en la distribución muestral de S que hemos construido vemos que: P(S 4) = 1/ 10 + 1/10 = 0,0 Por consiguiente este resultado es muy probable de acuerdo con la H 0, por lo que no podemos rechazarla ya que la probabilidad de aparición del resultado es mucho mayor que 0,05. 6. Si utilizamos es estadístico T, tenemos que: T = S {n b (n b + 1)} / T = 4 { ( + 1)} / T = 1 4

Debemos averiguar P (T 1), para ello obtenemos la distribución de T que en este caso es: T 0 1 3 4 5 6 f(t) 1/10 1/10 /10 /10 /10 1/10 1/10 luego la P (T 1) = 0,0 y, por tanto, el resultado es igual al anterior. 7. Vamos a hacerlo utilizando el estadístico U. De acuerdo con lo visto, tenemos que: U a = (n a n b ) + [ n a (n a +1)/] - S a U b = (n a n b ) + [ n b (n b +1)/] - S b En nuestro caso, U a = () (3) + [ (+1) / ] 4 = 5 U b = () (3) + [3 (3+1) / ] 11 = 1 Por tanto usaremos U b y sustituyendo, tendremos que: (1 + 0,5) ()(3)/ Z = [()(3) ( + 3 +1)/1] 0,5 Z = - 0,867. luego no se rechaza H 0 Supuestos: PRUEBA DE WILCOXON (Diferencias en tendencia central, muestras dependientes) n observaciones sometidas a dos tratamientos T X y T Y. calculamos las diferencias entre las puntuaciones obtenidas en cada tratamiento y eliminamos las que sean cero obtenemos k n diferencias no nulas que ordenamos de menor a mayor. delante del número de orden ponemos un signo - si X < Y y un signo + si X > Y en caso de no haber diferencias entre los dos tratamientos se verificará que: P(X < Y) = P(X > Y) para todas las diferencias, es decir: P(d -) = P(d +) = 0,5 5

Hipótesis: H 0 : Las poblaciones son iguales H 1 : Las poblaciones son distintas. Muestra: n observaciones dependientes. Estadístico de contraste: Si n es pequeño: W = O i Dónde O i representa los órdenes obtenidos con signo positivo Si n es grande: : Ejemplo: (W + 0,5) k (k +1) / 4 Z = [k (k + 1) (k + 1) / 4 ] 0,5 Un investigador hipotetiza que de cada par de gemelos univitelinos el nacido en primer lugar es mas agresivo. Para comprobarlo aplica una prueba de agresividad a 15 pares de gemelos univitelinos obteniendo los siguientes resultados: N1(X) 76 80 86 87 85 95 97 75 N(Y) 70 75 84 90 81 95 87 7 N1(X) 87 96 98 77 80 87 89 N(Y) 9 85 88 76 85 81 84 1. Calculamos las diferencias (X Y) y les asignamos el orden correspondiente: X - Y Orden signo 6 10,5 + 5 7,5 + + -3 3,5-4 5 ++ 0 10 1,5 + 3 3,5 + -5 7,5-11 14 + 10 1,5 + 1 1 + -5 7,5-6 10,5 + 5 7,5 + 1. Calculamos el estadístico de contraste: W = O i = 86,5 En la tabla vemos que W 14, 0,95 = 80 luego rechazamos H 0 ya que el valor obtenido en la muestra es mayor 6

PRUEBA DE KRUSCAL WALLIS (k muestras independientes) PRUEBAS NO PARAMÉTRICAS Supuestos: Las k muestras son aleatorias. Las N = n 1 + n +. + n k observacioes son independientes. La variable es continua. El nivel de medida es, al menos, ordinal. Las poblaciones son iguales excepto, posiblemente, en los promedios. Hipótesis: H 0 : Las k poblaciones son iguales. H 1 : Las k poblaciones son distintas. Muestra: N = n 1 + n +. + n k obs. indep. Estadístico de contraste: 1 ( S j ) T = 3( n 1) nn ( + 1) n + j que sigue una χ con (k 1) g.l. donde: n = número total de observaciones n j = tamaño de la muestra j S j = suma de órdenes que le corresponden a los elementos de la muestra j. Ejemplo: Un psicólogo está interesado en el efecto producido por una terapia conductual y una cognitiva sobre las conductas de autoestimulación en niños entre y 4 años. Para ello, prepara un experimento con niños y los asigna aleatoriamente a los dos grupos experimentales y a un grupo control. Después de 15 días de tratamiento obtuvo los resultados que aparecen en la tabla. Hay evidencia para concluir que existen diferencias significativas entre los tratamientos con un nivel de confianza del 99%? 7

Control n = 5 Conductual n = 8 1 13 13 16 18 14 14 14 7 13 8 1 8 4 7 3 6 4 5 9 Cognitivo n = 9 Solución: 1. Hipótesis: H 0 : Las tres poblaciones son iguales. H 1 : Las tres poblaciones difieren.. Muestra: n 1 = 5; n = 8 y n 3 = 9, es decir, observaciones independientes. 3. Ordenamos las puntuaciones y les asignamos el orden correspondiente: G X i O i G X i O i C 1,5 Cog 9 1 Cog 1,5 C 1 13,5 Cog 3 3 C 1 13,5 Cog 4 4,5 Cog 13 16 Cd 4 4,5 Cd 13 16 Cog 5 6 Cd 13 16 Cd 6 7 C 14 19 Cd 7 8,5 Cog 14 19 Cog 7 8,5 Cd 14 19 Cog 8 10,5 C 16 1 Cd 8 10,5 Cd 18 4. Sumamos los órdenes que le corres-ponden a cada muestra: Grupo n O i Control 5 68.5 Conductual 8 103,5 Cognitivo 9 81 8

5. Calculamos el valor del estadístico: 1 ( S j ) T = 3( n 1) nn ( + 1) n + j 1 68,5 103,5 81 T = + + 3(3) (3) 5 8 9 T =,3, luego H 0 no se rechaza ya que: 0,005χ = 0,010 y 0,995 χ = 10,60 PRUEBA DE FRIEDMAN (Diferencias en tendencia central, k muestras dependientes) Supuestos: Si tenemos las puntuaciones de n personas bajo k condiciones distintas, la matriz de datos obtenida sería: Cond. 1.. k Sujetos 1 3 4..... n X 11 X 1 X 13 X 14... X 1n X 1 X X 3 X 4.. X n.......... X k1 X k X k3 X k4.. X kn En esta situación, tenemos que las puntuaciones en las filas de la matriz son independientes entre si, mientras que las puntuaciones de cada columna están relacionadas. Como siempre, la H 0 implica que no existen diferencias entre las k condiciones, por tanto las puntuaciones de los n sujetos se distribuirán de forma aleatoria en cada condición. Si se ordenan las puntuaciones obtenidas por cada persona, tendremos que en todas las columnas de la matriz de datos estarán los k números naturales aunque en distinto orden, pero su suma será siempre igual a: k(k+1)/. Cond. Sujetos 1 3 4..... n 9

1 3 4 1 3 1. 4 3 3. 1 1 4 1 3. 4 4 4. 3 Llamamos O j a la suma de los órdenes obtenidos por los n sujetos en la condición j. Si la H 0 es cierta esta suma será igual o muy parecida en las k condiciones. Por el contrario, si las condiciones son distintas, esta suma diferirá significativamente de unas condiciones a otras. Hipótesis: H 0 : Las poblaciones son iguales H 1 : Las poblaciones son distintas. Muestra: n observaciones dependientes. Estadístico de contraste: 1 F = O j 3n(k + 1) nk (k + 1) que sigue una χ con k-1 grados de libertad y donde: k es el nº de condiciones n es el nº de observaciones O j es la suma de los órdenes en la condición j. Ejemplo: Un psicólogo está interesado en comprobar si las puntuaciones en una prueba de razonamiento abstracto se modifican o se mantienen constantes entre los 7, 8 y 9 años de edad. Con este fin, selecciona una muestra aleatoria de 10 niños y mide su razonamiento abstracto cuando tienen 7 años y vuelve a realizar el registro con estos niños cuando tienen 8 y 9 años. Las puntuaciones obtenidas han sido las siguientes: Niños Edad 1 3 4 5 6 7 8 9 10 7 70 81 74 65 80 90 68 71 6 88 8 78 80 79 71 8 91 69 75 6 95 9 77 83 81 69 84 93 69 79 64 93 10

De acuerdo con estos datos, qué se puede concluir a un nivel de significación del 0,05? Solución: Hipótesis: H 0 : Las poblaciones son iguales H 1 : Las poblaciones son distintas. Muestra: n observaciones dependientes. Ordenamos las puntuaciones obtenidas por cada niño en las tres condiciones y obtenemos la siguiente tabla: Niños Edad 1 3 4 5 6 7 8 9 10 7 1 1 1 1 1 1 1 1,5 1 8 3 1 3,5 1,5 3 9 3 3 3 3,5 3 3 Calculamos la suma de los órdenes obtenidos en cada una de las condiciones y tenemos: Edad O j 7 11,5 8 9 6,5 Obtenemos el valor del estadístico de contraste: 1 F = O j 3n(k + 1) nk (k + 1) 1 F = (11,5 + + 6,5 ) 30(4) 30(4) F = 11,85 Dado que 0,095 χ = 5,99, se rechaza H 0 y concluimos que las puntuaciones cambian con la edad. 11