Estadstca No Parametrca CLASE 3 Pruebas Basadas en la Dstrbucon Bnomal JAIME MOSQUERA RESTREPO
Bnomal Test La prueba bnomal es quzás la prueba mas antgua encontrada en al lteratura. Se encuentra asocada a la ocurrenca de eventos de naturaleza dcotoma, concebdos bajo algunas crcunstancas partculares Su versatldad ha logrado que sea expandda a múltples aplcacones.
Recordando los supuestos Se cuenta con n repetcones de un ensayo tpo Bernoull Los ensayos son concebdos de manera ndependente La probabldad de obtener alguna de las dos categorías excluyentes es constante
Procedmento Planteamento de hpótess : P = P vs : P P, P < P, P > P a Estadístco de Prueba: B: Numero de eventos favorables a una categoría de referenca en los n ensayos.
: P > P Regla de decsón Rechazar o s el valor de B supera el percentl 1 α de la dstrbucón bn( n, P ) : P < P Rechazar o s el valor de B es nferor al percentl de la dstrbucón bn( n, P ) α
Ejemplo En el lanzamento de una moneda supuestamente legal se obtuveron los sguentes resultados. + - + + + + - - + + + - + + + + - - + + Exste evdenca para pensar que la moneda no es legal? Cual es numero mínmo de (+) para rechazar la pótess? Cual es el valor P asocado a la prueba?. Asuma que realmente la moneda esta cargada con P(+) =.7 Cual es la potenca de la prueba
Dstrbucón Asntótca Para Muestras Grandes Como ya conocemos la dstrbucón bnomal tene un comportamento asntótco que puede ser modelado a través de la dstrbucón normal E( B) = np ; Var( B) = np (1 P ) Cuando: n > max( P ;1 P ) 9 mn( P ;1 P ) Estadstca Matematca Con aplcacones ; 6ta edcon (Mendenhall, pag 357)
Algunas Aplcacones - Percentles Algún nvestgador socal ha afrmado que el 25% de los habtantes de la cudad de Cal ganan menos de un salaro mínmo. Para corroborar esta hpótess ha tomado una muestra aleatora de 2 ndvduos. Obtenendo los sguentes resultados Indvduo Salaro Indvduo Salaro 1 589954 11 511959 2 394463 12 311914 3 698851 13 28618 4 95295 14 454474 5 88967 15 495299 6 996627 16 226414 7 213282 17 536415 8 63164 18 56919 9 8695 19 676971 1 43266 2 57691 Consdera usted que la afrmacón del nvestgador es certa?
Algunas Aplcacones Centramento (Prueba del Sgno) Se toman 1 muestras de un baño de cultvo sobre placa utlzado en un proceso de fabrcacón de componentes electróncos, y se mde el p del baño obtenendo los sguentes resultados: 7.91, 7.85, 6.82, 8.1, 7.46, 6.95, 7.5, 7.35, 7.25, 7.42. Los ngeneros creen que el valor de la medana del p es 7.. La muestra ndca que esta proposcón es correcta? Encuentra el valor P de esta prueba
Prueba del sgno El evento + representa al evento Y o > X Y X > El evento - representa al evento Y < o Y X < X La prueba del sgno es una prueba para comparar la probabldad de dferencas postvas vs. la probabldad de dferencas negatvas Ignorando empates, la hpótess será: : P( + ) = P( ) Equvalente a una prueba bnomal, con : P( + ) 1 2 o : p = * = p p* = 1 2
Datos Observacones bvaradas de una muestra aleatora Supuestos ( X, ) Las varables aleatoras bvaradas Y, con =1,..,n son mutuamente ndependentes La escala de medcón es al menos ordnal P( + ) > P( ) Las parejas son nternamente consstente. S para alguna pareja ( X, Y ) entonces P ( + ) > P ( ) para todas las parejas y vceversa pótess 1 : P( + ) = : P( + ) P( ) P( ) 1 : P( + ) : P( + ) > P( ) P( ) 1 : P( + ) P( ) : P( + ) < P( )
La hpótess nula es nterpretada como: Dos colas: Los X s tenen el msmo parámetro de localzacón Y s que los : E ( X ) = E( Y ) Una cola: : E ( X ) E( Y ) Una cola : E ( X ) E ( Y ) Estadístco de prueba ( ) El numero de pares X, donde X Y o Y X > Y < T + = Numero total de +
La dstrbucón del estadístco de prueba se deduce con base en la comparacón de la probabldad de dferencas postvas con la probabldad de dferencas negatvas, tal que entonces es lo msmo que P : ( + ) + P( ) = 1 P ( + ) = P( ) ( + ) : P = sendo equvalente a una prueba Bnomal con p* = y cuando no hay empates esta prueba es nsesgada y consstente 1 2.5
Regla de decsón La regón de rechazo de tamaño α esta dada por Dos colas: Rechazar Una cola: Rechazar Una cola: Rechazar t s s s T T T t o n t t T n t donde el valor se obtene como t = 1 n 2 + wα n 1 o t = + 2 2 ( n w n ) el valor w se obtene de las tablas de la dstrbucón bnomal s n < 2 o de la dstrbucón normal s n 2 α
Ejemplo Un artículo nforma sobre un estudo en el que se modela el motor de un cohete reunendo el combustble y la mezcla de encenddo dentro de un contenedor metálco. La resstenca al esfuerzo cortante de la unón entre los dos tpos de sustancas es una característca mportante en este estudo. En el sguente slde se muestran los resultados obtendos al probar 2 motores selecconados al azar. Se desea probar la hpótess de que la medana de la resstenca al esfuerzo cortante es 2 ps, utlzando un nvel de sgnfcanca del.5.
Los datos Observacón Resstenca al esfuerzo cortante x Sgno de la dferenca x -2 Observacón Resstenca al esfuerzo cortante x Sgno de la dferenca x -2 1 2158.7 + 11 2165.2 + 2 1678.15-12 2399.55 + 3 2316. + 13 1779.8-4 261.3 + 14 2336.75 + 5 227.5 + 15 1765.3-6 178.3-16 253.5 + 7 1784.7-17 2414.4 + 8 2575.1 + 18 22.5 + 9 2357.9 + 19 2654.2 + 1 2256.7 + 2 1753.7 -
Algunas Aplcacones Efectvdad de tratamentos Se afrma que una nueva deta reducrá el peso del 8% de las mujeres en un período de dos semanas. Se regstran los pesos de 1 mujeres que sguen esta deta antes y después de un período de dos semanas, y se obtenen los sguentes datos: Mujer Peso antes Peso después 1 58.5 6. 2 6.3 54.9 3 61.7 58.1 4 69. 62.1 5 64. 58.5 6 62.6 59.9 7 56.7 54.4 8 63.6 6.2 9 68.2 62.3 1 59.4 58.7
Algunas Aplcacones Tendencas Cox and Stuart Total annual precptaton s recorded yearly for 19 years. Ths record s examned to see f the amount of precptaton s tendng to ncrease or decrease. The precptaton n nche was: 45.25, 45.83, 41.77, 36.26, 45.37, 52.25, 35.37, 57.16, 35.37, 58.32, 41.5, 33.72, 45.73, 37.9, 41.72, 36.7, 49.83, 36.24, 39.9 Do you know tath ths record present a tendng to ncrease or decrease? What s your null and alternatve hypothess?
Prueba de tendenca Cox y Stuart Datos Observacones son una secuenca de varables aleatoras, ordenadas usando un crtero especfco Esta prueba es usada para detectar cualquer tpo de patrón no aleatoro Supuestos Las varables aleatoras son mutuamente ndependentes La escala de medcón es al menos ordnal Las varables están déntcamente dstrbudas o hay tendenca. O sea: es mas probable que la ultma varable sea mayor que la anteror o vceversa
pótess 1 : No hay tendenca : Exste un patron de tendenca 1 : No hay una tendenca crecente : ay una tendenca crecente ( postva) 1 : No hay una tendenca decrecente : ay una tendenca decrecente ( negatva)
Estadístco de prueba Agrupando las varables aleatoras en pares ( X, X ), ( X 1 1+ c 2, X 2+ c ),, ( X donde s n es par o s n n, X n c ) c = ( n +1) 2 + c = n 2 es mpar Reemplazando cada par con un + s X < X + c o un - s Descartando los empates, el numero de pares es n* El estadístco de prueba es el numero total de + X > X + c T=Total de parejas con X < X + c
Algunas Aplcacones - Correlacon Cochran (1937) comparo la reaccón de un grupo de pacentes a dos drogas para determnar s hay una correlacón postva entre las reaccones de cada pacente a dos tpos de drogas Pacente D-1 D-2 Pacente D-1 D-2 1 +.7 +1.9 6 +3.4 +4.4 2-1.6 +.8 7 +3.7 +5.5 3 -.2 +1.1 8 +.8 +1.6 4-1.2 +.1 9. +4.6 5 -.1 -.1 1 +2. +3.4
pótess Estadístco de prueba 1 : No hay correlacon postva : ay correlacon postva Pacente D-1 D-2 Pacente D-1 D-2 2-1.6 +.8 1 +.7 +1.9 4-1.2 +.1 8 +.8 +1.6 3 -.2 +1.1 1 +2. +3.4 5 -.1 -.1 6 +3.4 +4.4 9. +4.6 7 +3.7 +5.5 La prueba se hace sobre los datos ordenados por la D-1 usando los datos de D-2
Las cnco parajes en la secuenca de observacones de D-2 son: (+.8,+1.9);(+.1,+1.6);(+1.1,+3.4);(-.1,+4.4); (+4.6,+5.5). El estadístco de prueba es T + =5 ( ) P T + = 5 n = 5, p =.5 =.312 Los datos sumnstran sufcente nformacón para pensar que exste una correlacón postva entre la respuesta de los pacentes a la medcamento 1 y su respuesta al medcamento 2.
Ejercco (Un caso conocdo) Al programa académco de estadístca ngresan anualmente cohortes de 1 estudantes, algunos de los cuales llegan con la convccón de estudar esta carrera, mentras que otra parte se encuentra totalmente decddo a cambarse. Stuacón preocupante. Se pensa que los cursos ntroductoros de estadístca podrían hacer cambar sus ntencones, o ejercer el efecto contraro. Para evaluar estas hpótess, la dreccón del programa y la coordnacón de autoevaluacon han preguntado a 78 de estudantes su ntencón de cambarse antes y después del curso de Introduccón a la estadístca. Los resultados se pueden resumr en una tabla tpo como la sguente E1 E2 E3 E4 E5 E6 E7 E8 E78 Inco C Q Q C C C C Q. C Fn Q Q C Q Q C Q Q. Q Cual sera su mecansmo para valorar esta hpótess?
Ejercco (Un caso conocdo) Tabla resumen de resultados FINAL INICIO Q C Q 2 1 C 38 15 Caso partcular Tempo 2 Tempo 1 1 Caso general a b 1 c d
Prueba de McNemar Datos Observacones bvaradas ndependentes meddas en escala nomnal con dos categorías Los datos están resumdos en una tabla de contngenca 2x2 Supuestos Las parejas,j son mutuamente ndependentes La escala de medcón es nomnal con dos categorías La dferenca P( X =, Y = 1) P( X = 1, Y = ) < o o P( X =, Y = 1) P( X = 1, Y = ) = P( X =, Y = 1) P( X = 1, Y = ) >
pótess : P( X =, Y = 1) = P( X = 1, Y = ) : P( X =, Y = 1) P( X = 1, Y = ) 1 S los eventos (,1) son llamados + y los eventos (1,) son llamados -. Los eventos (1,1) y (,) son empates que no se tenen en cuenta. Las hpótess anterores son equvalente a 1 : P ( + ) : P ( + ) = P ( ) P ( )
Estadístco de prueba s b + c 2 T = 2 b Prueba bnomal S b + c > 2 y prueba de una cola Aproxmacón normal U = b c b + c S b + c > 2 y prueba blateral Aproxmacón J Cuadrado T 1 = ( b c) b + c 2 Coonover