Capítulo 12 CONTRASTES NO PARAMÉTRICOS

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Capítulo 12 CONTRASTES NO PARAMÉTRICOS"

Transcripción

1 Capítulo 1 CONTRASTES NO PARAMÉTRICOS 1.1 Introduccón 1. Contrastes de ajuste a una dstrbucón teórca 1..1 Contrastes basados en la dstrbucón de frecuencas muestral El contraste ch-cuadrado, χ Contraste de Kolmogorov-Smrnov 1.. Contrastes basados en estadístcos de poscón Contraste de sgnos 1... Contraste de la medana Contraste de Wlcoxon de rangos con sgnos Contraste de Normaldad 1.3 Contrastes de homogenedad entre dstrbucones Contrastes de homogenedad en muestras bdmensonales apareadas Contraste del sgno Contraste de Wlcoxon 1.3. Contrastes de homogenedad generales Contraste de Kolmogorov-Smrnov para dos muestras Contraste de Mann-Whtney de sumas de rangos Contraste de Segel-Tukey de gualdad de varanzas Contraste de Kruskal-Walls Contraste ch-cuadrado Contraste de rachas 1.4 Contrastes de aleatoredad Contraste de rachas 1.4. Contraste de dferencas sucesvas 1.5 Contrastes de asocacón entre dstrbucones Contraste de Spearman de correlacón por rangos 1.5. Contraste de Kendall Tablas de contngenca Coefcentes de correlacón para datos cualtatvos

2 1 1. INTRODUCCIÓN En ocasones, el nvestgador no está seguro acerca del tpo de dstrbucón de probabldad de la que proceden las observacones muestrales que ha recogdo, y le parece muy arresgado hacer un supuesto concreto acerca de la msma. Los procedmentos que hemos analzado en capítulos anterores consderan la stuacón contrara, en que se hace un supuesto específco acerca de la famla de dstrbucones de probabldad que generó la muestra, y se procede a estmar los parámetros que caracterzan la dstrbucón correspondente: Posson, Normal, etc., y posblemente se lleven a cabo contrastes de hpótess acerca de valores numércos de dchos parámetros. Vamos a consderar en este capítulo stuacones en que el nvestgador no está nteresado en los valores de parámetros concretos, entre otras razones, porque tampoco está muy seguro acerca de la famla de dstrbucones de probabldad con la que está trabajando, y quere aprender algo acerca de la msma. En tal stuacón, el nvestgador puede estar nteresado, precsamente, en detectar el tpo de dstrbucón de que procede su muestra, es decr, en llevar a cabo : a) contrastes de ajuste de una dstrbucón muestral a una dstrbucón teórca y, en partcular, contrastes de Normaldad, que son el prmer tpo de contrastes que veremos en este Capítulo. El segundo tpo de preguntas se refere a s dos o más muestras ndependentes proceden de una msma dstrbucón de probabldad, sn necesdad de especfcar de qué tpo es ésta: b) contrastes de homogenedad entre dstrbucones. El tercer tpo de cuestones se refere a la posble ndependenca de dstntas característcas observadas en la muestra, con ndependenca del tpo de dstrbucón que sga cada una de ellas: d) contrastes de ndependenca entre característcas muestrales. Todos estos contrastes son denomnados no paramétrcos o ndependentes de la dstrbucón, a dferenca de los paramétrcos, aquellos que se basan en un supuesto específco acerca de la dstrbucón de probabldad poblaconal, como son tanto los de tpo t de Student, como los de ch-cuadrado y los contrastes F que vmos en el Capítulo XX, y que requeren el conocmento o la estmacón de los valores paramétrcos relevantes. Estos contrastes son generalmente rápdos y fácles de utlzar, y apenas precsan nngún supuesto. Muchos de ellos tenen la enorme ventaja de ser aplcables a datos cualtatvos, cuya clasfcacón ha de ser necesaramente ordnal, stuacón típca en la que no podríamos aplcar muchos contrastes paramétrcos, que se basan en la consderacón de una dstrbucón de probabldad de tpo contnuo: Normal, t de Student, etc. Tampoco es obvo que en las stuacones en las que parece sufcentemente adecuado efectuar un supuesto concreto acerca de la dstrbucón poblaconal, como puede ser la Normaldad, sea generalmente preferble utlzar contrastes paramétrcos, pues los contrastes no paramétrcos tenen algunas ventajas, entre ellas el tener expresones sencllas y bastante ntutvas, y son váldos en muestras muy cortas, en las que los procedmentos paramétrcos pueden no serlo. Además, no requeren la estmacón de parámetros de nnguna dstrbucón de probabldad.. CONTRASTES DE AJUSTE A UNA DISTRIBUCIÓN TEÓRICA.1 Contrastes basados en la dstrbucón de frecuencas muestral.1.1 El contraste ch-cuadrado La dea básca de este contraste consste en comparar las frecuencas observadas en la muestra para cada suceso relevante, con las que deberían haberse obtendo en una poblacón que pertenecese a una dstrbucón de probabldad específca. La hpótess alternatva es que la muestra procede de una dstrbucón de probabldad dferente de la que utlzamos en el

3 contraste. El contraste puede aplcarse tanto a dstrbucones dscretas como contnuas, pero prevamente el nvestgador debe establecer una partcón del espaco muestral en k sucesos mutuamente exclusvos. En este tpo de contraste, la hpótess nula recoge una determnada dstrbucón de probabldad teórca, que mplca una determnada probabldad p para cada uno de los k sucesos consderados, con ' k p ' 1. La probabldad p, multplcada por el tamaño muestral, n, '1 proporcona la frecuenca teórca T = np que debería haberse observado en la muestra, de ser la hpótess nula certa, para cada uno de los k sucesos, con: ' k np ' n' n p ' n. Por otra parte, '1 '1 cada uno de tales sucesos tene su propa frecuenca muestral observada, O = n, con ' n. ' k n '1 S la muestra procedera efectvamente, de la dstrbucón de probabldad que hemos recogdo en la hpótess nula, ambas frecuencas, la teórca, T, y la empírca, O, es decr, la observada en la muestra, no deberían dferr mucho. El estadístco: P k&1 ' 'k '1 (O & T ) T ' ' k (n & np ) '1 np propuesto por Pearson, sgue una dstrbucón ch-cuadrado con un número de grados de lbertad gual al número de sucesos dferentes consderados, k, menos uno [ver Apéndce 1]. No todas las frecuencas de una dstrbucón multnomal son ndependentes entre sí, puesto que el tamaño muestral n está dado, y la suma de las k frecuencas debe ser gual a n. Exste, por tanto, una restrccón entre todas ellas, y sólo k-1 son ndependentes. Por eso es que la dstrbucón de probabldad del estadístco de Pearson es χ k-1. Para que la dstrbucón ch-cuadrado sea una aproxmacón razonable, es precso que las frecuencas observadas en la muestra para cada suceso sean mayores o guales a 5. S algún suceso tene frecuenca nferor, debe agruparse con otros. Como en algunas ocasones anterores, estamos utlzando nuevamente una dstrbucón de tpo contnuo para aproxmar varables dscretas. Es convenente, por tanto, utlzar la correccón de contnudad de Yates en el cálculo del estadístco ch-cuadrado, cuando sólo exste un grado de lbertad, es decr, cuando las dos varables en consderacón pueden presentarse en la forma de tan sólo dos alternatvas dferentes, y las frecuencas de casllas son pequeñas: P ' j m '1 (*O & E * & 0,5) E En muestras pequeñas, en que cada frecuenca esperada se encuentra entre 5 y 10, es convenente comparar ambos valores de la dstrbucón ch-cuadrado, corregdo y sn corregr, y confar en obtener la concordanca entre los resultados que de ambas se dervan. Por últmo, hay que tener en cuenta que s es precso estmar algún parámetro para caracterzar la dstrbucón teórca, entonces el número de grados de lbertad de la dstrbucón ch-cuadrado del estadístco de Pearson perde un grado de lbertad adconal por cada parámetro estmado. Generalmente, cuando se rechaza la hpótess nula de ajuste a la dstrbucón teórca especfcada, se dspone de sufcente nformacón como para precsar en qué sentdo es el rechazo, como veremos en algunos ejemplos. Ejemplo El ejemplo típco de esta stuacón consdera un dado, del que se han obtendo 300 tradas, y cuya perfeccón, entendda como ausenca de sesgos en los resultados, se pretende

4 contrastar. La partcón del espaco de sucesos es clara en este caso, pues consste en los 6 resultados dstntos que pueden observarse. La hpótess nula H 0 recoge en tal caso una dstrbucón de probabldad unforme. Es decr, la hpótess nula es que el dado está, efectvamente, correctamente construdo, y, al no tener sesgos, la probabldad teórca con que deberíamos observar cada uno de los sucesos posbles: 1,, 3, 4, 5 y 6, es de 1/6, lo que aparece en la segunda línea del Cuadro 1.1: 3 Cuadro 1.1 Resultado Total Observada (O ) Teórca (E ) mentras que la prmera línea presenta las frecuencas que suponemos que se observaron en el expermento. Ello genera un valor del estadístco: P ' ' 6 '1 (O&T ) T ' (44&50) % (6&50) % (5&50) % (45&50) % (50&50) % (47&50) ' ' 36%144%4%5%0%9 50 ' ' 4,36 que debemos comparar con una ch-cuadrado con 6-1 = 5 grados de lbertad. Esta es una tabla de clasfcacón smple en la que la lsta de frecuencas observadas de una característca se compara con la de una dstrbucón teórca. A lo largo de este capítulo utlzaremos tablas de clasfcacón, smples y múltples, es decr, de una o varas característcas, sobre las que defnremos contrastes del tpo ch-cuadrado, como el que acabamos de ver. En ellos, el número de grados de lbertad en tablas como la anteror es gual a: (m-1)(n-1), sendo m y n el número de columnas y de flas. En nuestro caso: (m-1)(n-1) = (6-1)(-1) = (5)(1) = 5, que es el valor de k-1 en este caso. El valor crítco para la dstrbucón ch-cuadrado con 5 grados de lbertad a nveles de sgnfcacón del 0,05 y 0,01 es, respectvamente: 11,1 y 15,1. Nuestro estadístco es nferor a ambos valores, por lo que no rechazamos la hpótess nula de que el dado es correcto, tenendo todos los resultados posbles, del 1 al 6, gual probabldad. Ejemplo 1..- Supongamos ahora que, en un examen de preguntas con múltple eleccón, cada una con 4 opcones, un alumno contesta correctamente 40 de entre las 100 preguntas que se le formularon. Cómo podemos contrastar la hpótess nula de que el alumno conoce, efectvamente, la matera de la que se ha examnado? Para ello, construmos el cuadro: Cuadro 1. Respuestas Total Correctas Incorrectas Frecuencas observadas:

5 4 Frecuencas teórcas: La hpótess nula consste en creer que el alumno contesta sn conocer la respuesta. S así fuese, contestando al azar y puesto que hay cuatro opcones en cada pregunta, el alumno habría contestado correctamente una de cada cuatro preguntas, es decr, 5 de las 100 cuestones formuladas. Por ello tenemos las frecuencas teórcas de la últma columna de la tabla. El estadístco ch-cuadrado toma el valor: P ' ' '1 (O&T ) T ' ' '1 (n&np ) np ' (40&5) 5 % (60&75) 75 ' 5 5 % 5 75 ' 9 % 3 ' 1 que excede sobradamente de los valores crítcos de la dstrbucón ch-cuadrado con 1 grado de lbertad a los nveles de sgnfcacón del 0,05 y 0,01, que son: 3,84 y 6,63. En consecuenca, rechazamos la hpótess nula, habendo encontrado evdenca en el sentdo de que el alumno conoce la matera mejor que para smplemente creer que ha contestado las cuestones al azar. Ejemplo Un partdo polítco manfesta que el 75% de la poblacón es favorables a sus propuestas polítcas. Para contrastar tal hpótess frente a la alternatva de que el porcentaje de smpatzantes es nferor, se efectúa una encuesta a personas, a las que se les pregunta s son o no favorables a dcho partdo polítco, obtenendo el resultado de que 680 lo son, mentras que las 30 restantes se manfestan como no favorables al partdo polítco. Ello conduce al cuadro: Frecuencas Cuadro 1.3 Opnón del encuestado Favorable No favorable Total Observadas Teórcas en la que aparecen las frecuencas teórcas que surgen de la opnón emtda por dcho partdo polítco. En consecuenca, tenemos el valor del estadístco: P ' ' '1 & T ) (O T ' ' '1 (n&np ) np ' (680&750) 750 % (30&50) 50 ' 6,13 que excede con mucho del valor crítco de las tablas correspondentes a la dstrbucón chcuadrado con 1 grado de lbertad. Consecuentemente, rechazamos la hpótess nula y, con ello, la opnón emtda por el partdo polítco en consderacón. Como el número de smpatzantes observado, 680, es nferor al que correspondería a la proporcón anuncada, 0,75, al rechazar la hpótess nula pasamos a creer que la verdadera proporcón es nferor a ésta. El msmo contraste puede resolverse utlzando la aproxmacón Normal a la dstrbucón bnomal. Recordemos que, para valores grandes de n, la dstrbucón bnomal B(n,p) puede aproxmarse por una N(np, np(1-p)), por lo que la proporcón, que no es sno el cocente de la bnomal B(n,p) por n, se aproxma por una dstrbucón N(p, p(1-p)/n). Así, bajo la hpótess nula

6 de que la opnón del partdo polítco es correcta, la proporcón muestral sgue, aproxmadamente, una dstrbucón N(0,75 ;σ ) donde la desvacón típca es: 5 F' (0,75) (0,5) ' 0, Por tanto, el ntervalo de confanza del 0,95 de una cola comprende valores superores a: (0,75)-(1,65)(0,0137) = 0,77. Por tanto, como la proporcón muestral, 0,68, cae fuera del ntervalo del 95%, consttuye sgnfcatva evdenca en contra de la hpótess nula, que postulaba la veracdad de la afrmacón del partdo polítco, y que habremos de rechazar, en favor de que la proporcón de smpatzantes es nferor al 75%..1. Contraste de Kolmogorov-Smrnov. El contraste de Kolmogorov-Smrnov sgue una dea smlar al anteror, pero en vez de comparar las probabldades de dversos sucesos, compara los valores de las funcones de dstrbucón, tanto en la muestra, como la que teórcamente se dervaría de la poblacón que se ha explctado en la hpótess nula. El estadístco de Kolmogorov-Smrnov consste en la máxma dstanca observada entre ambas funcones de dstrbucón: D n ' Supremo * F (x)&f(x) n * x donde F n (x) denota la funcón de dstrbucón muestral, y hay que comparar su valor con unas tablas específcas de este estadístco, pues no sgue nnguna dstrbucón conocda. Para tamaños muestrales, n, superores a 100, el valor crítco puede obtenerse medante: & ln (" /)/n, sendo 1-α el nvel de confanza. Lógcamente, se rechaza la hpótess nula s el estadístco toma un valor superor al de las tablas. Bajo H 0, la muestra fue extraída de la poblacón consderada en dcha hpótess nula, por lo que las funcones de dstrbucón muestral y teórca serían tan smlares que, ncluso tomando su máxma dstanca, ésta sería sufcentemente reducda. Cuando el valor numérco del estadístco excede del valor crítco de las tablas, se consdera que no es sufcentemente reducdo, consttuyendo evdenca en el sentdo de que las funcones de dstrbucón dferen una de otra y, por ello, la hpótess nula debe rechazarse. La dstrbucón del estadístco de Kolmogorov-Smrnov es ndependente del tpo de dstrbucón de la que fue extraída la muestra, lo cual es nteresante, pues nos permte utlzar una únca tabla de valores crítcos para este estadístco; de lo contraro, deberíamos tener una tabla para cada tpo de dstrbucón de probabldad F ncluda en H 0. Este contraste puede utlzarse asmsmo con dstrbucones de tpo dscreto, pero entonces sólo podemos decr que α es el máxmo nvel de sgnfcacón del contraste que hayamos dseñado. Para aplcar el contraste con dstrbucones contnuas es precso agrupar sus valores en clases o ntervalos, con lo que se perde certa nformacón. Al utlzar úncamente la nformacón muestral ncorporada en la máxma dstanca entre las funcones de dstrbucón, este estadístco gnora mucha nformacón muestral, a dferenca del contraste basado en el estadístco χ de Pearson. El estadístco de Kolmogorov-Smrnov puede utlzarse para construr bandas de confanza para una dstrbucón teórca desconocda F(x), a partr de una dstrbucón empírca. Para ello, fjado un valor de α, tomamos de la tabla el valor crítco D n correspondente a α y n, el tamaño muestral del que se dspone. El extremo superor F s (x) de la banda para F(x) se construye sumando D n a la funcón de dstrbucón empírca, hasta que se alcanza el nvel 1,

7 permanecendo entonces en éste. El nvel nferor F (x) es gual a cero hasta que la dstrbucón empírca llega a ser gual o mayor a D n. A partr de entonces, F (x) = F(x) - D n. Ejemplo Volvendo al ejemplo del lanzamento del dado, podemos construr el cuadro de ambas funcones de dstrbucón: 6 Cuadro 1.4 Resultado Funcón de dstrbucón 0,145 0,353 0,57 0,677 0,843 1,0 muestral Funcón de dstrbucón teórca 0,167 0,333 0,500 0,667 0,833 1,0 Dferencas en valor absoluto 0,0 0,00 0,07 0,010 0,010 0 con una máxma dferenca de 0,07. En nuestro caso, con n = 300, tenemos, para α = 0,05, un valor crítco de 0,035. Como el valor del estadístco de Kolmogorov-Smrnov que hemos obtendo es nferor a este nvel crítco, no rechazamos la hpótess nula de que la muestra procede de la poblacón teórca, que asgnaba probabldad 1/6 a cada resultado posble.. Contrastes basados en estadístcos de poscón. Otro enfoque para contrastar el grado de ajuste de la dstrbucón muestral a una dstrbucón teórca se basa en el uso de meddas de poscón, como la medana, los cuartles, etc.. La dea es que s la muestra procede de la dstrbucón hpotétca que se consdera, entonces sus medanas no deberían ser muy dferentes, pero tampoco sus cuartles, etc.. Por tanto, estos contrastes se basan en la dstanca entre los estadístcos de poscón de la muestra y los teórcos. Dstntos contrastes utlzan dstntos estadístcos de poscón...1 Contraste de los sgnos Este contraste consdera un percentl q, 0 < q < 99 en la poblacón que se consdera bajo la hpótess nula. Denotemos por θ el valor numérco del percentl q en la dstrbucón teórca. A contnuacón, defnmos para cada elemento muestral una funcón ndcatrz X que toma el valor 1 s el dato está por debajo de θ, y 0 s la observacón muestral está por encma de θ. Este es un fenómeno Bernoull, con probabldad p ' q puesto que, por defncón de percentl, 100 bajo la hpótess nula, exactamente q% de los elementos poblaconales están por debajo de θ, y (100-q)% está por encma de θ. S consderamos ahora la suma de tales funcones ndcatrz: X ' ' n '1 X esta varable segurá una dstrbucón bnomal B(n,p). Se recoge evdenca en contra de la hpótess nula cuando el porcentaje de elementos muestrales por debajo de θ, el teórco percentl de orden q, es muy superor o muy nferor a q%. Deberemos hacer, por tanto, un contraste de dos colas, y determnar los valores crítcos λ y λ s, tales que:

8 7 P [X$8 s ] ' ' n x'8 s n x q 100 x 1& q 100 n&x ' " P [X#8 ] ' ' 8 x'0 n x q 100 x 1& q 100 n&x ' " El contraste se denomna de los sgnos porque consdera el número de sgnos postvos y negatvos de las dferencas x -θ, sendo x cada una de las observacones muestrales. Cuando el tamaño muestral es sufcentemente grande, podemos utlzar la aproxmacón Normal a la dstrbucón bnomal, con lo que el cálculo de estos valores crítcos se smplfca enormemente. Ejemplo S tomamos el prmer cuartl como crtero de ajuste de la dstrbucón muestral a una dstrbucón teórca, la probabldad de que un elemento muestral esté por debajo de él es 0,5, sendo 0,75 la probabldad de que sea superor. Supongamos que dsponemos de una muestra de tamaño n = 0. El número de observacones muestrales por debajo del prmer cuartl sgue, por tanto, una dstrbucón B(0;0,5). De acuerdo con las tablas, esta varable toma un valor gual o nferor a 1 con probabldad 0,043, y un valor gual o nferor a 9 con probabldad 0,9861. En consecuenca, tenemos: P(# X#9) ' 0,9618, próxma a un nvel de confanza del 95%. Supongamos que θ es el prmer cuartl bajo la hpótess nula; deberíamos esperar tener en la muestra un número entre y 9 de datos nferores a θ. Uno ó, o ben 10 ó más datos nferores a θ constturían evdenca contra H 0. Alternatvamente, s tuvéramos como hpótess alternatva que el prmer cuartl es superor a θ, utlzaríamos el hecho de que una varable B(0;0,5) toma un valor gual o nferor a 8 con probabldad 0,9591. Por tanto, 9 o más observacones muestrales por debajo de θ sería un número excesvo bajo H 0, lo que nos llevaría a rechazar dcha hpótess en favor de la alternatva... El contraste de la medana Un caso partcular del anteror, de especal nterés, consste en el uso de la medana como estadístco de ajuste. Una vez calculada la medana m de la dstrbucón teórca, entonces la mtad de los elementos muestrales deberían estar por encma de m y la mtad restante por debajo de m, s la muestra procede realmente de la poblacón teórca. Evdentemente, no se espera que esto sea exactamente certo en todas las muestras, pero s la dvsón que m ntroduce en la muestra deja porcentajes de elementos por encma y por debajo muy dferentes de 50%, entonces tendremos evdenca sgnfcatva en contra de la poblacón teórca que hayamos especfcado bajo H 0, que deberemos rechazar. Ahora habrá que determnar un valor crítco λ tal que: P [X$8] ' ' n X'8 n X 1 n ' " y puede utlzarse nuevamente la aproxmacón Normal s el tamaño muestral es sufcentemente

9 8 grande. El otro valor crítco que delmta el ntervalo de confanza del 100(1-α)% es n-λ..3. Contraste de Wlcoxon de rangos con sgnos Los contrastes de sgnos anterores consderan s las observacones muestrales están por encma o por debajo de un determnado estadístco de referenca, pero no tenen en cuenta la magntud de sus dstancas a dcho estadístco. El contraste de Wlcoxon salva tal lmtacón, consderando los valores numércos de las dferencas x - m, donde m es la medana de la dstrbucón teórca. Una vez calculadas, se ordenan crecentemente los valores absolutos de dchas dferencas, y se asgna a cada una de ellas su rango, sendo éste el orden que ocupa cada dferenca en dcha secuenca crecente. El estadístco T + de Wlcoxon consste en la suma de los rangos que corresponden a las dferencas que eran postvas, antes de tomar valores absolutos, mentras que el estadístco T - consste en la suma de los rangos que corresponden a las dferencas que eran negatvas. Un valor elevado de T + ndcará que las mayores dferencas tenen sgno postvo, de modo que la poblacón no parece ser smétrca alrededor de m, estando desplazada haca la derecha. Un valor reducdo ndca que las mayores dferencas se producen con datos por debajo de m, sugrendo que está desplazada haca la derecha. Por últmo, el estadístco T de Wlcoxon consste en la suma de todos los rangos, habendo asgnado esta vez a cada uno de ellos el sgno de la dferenca x - m. Dcho de otra forma: T = T + - T -. Los rangos asgnados de este modo a una muestra de tamaño n consttuyen una secuenca formada por los prmeros n números naturales. Bajo la hpótess nula de smetría alrededor de m, deberíamos esperar que la mtad de los rangos provnese de dferencas de sgno postvo, y la otra mtad, de dferencas de sgno negatvo. Además, cada uno de ellos debería ser postvo o negatvo con probabldad 1/. Por tanto, el rango k-ésmo toma valores k y -k con probabldad 1/ en cada caso, por lo que tene esperanza cero, y lo msmo ocurrrá con el estadístco T. En consecuenca, la varanza de T concde con la suma de los cuadrados de los n prmeros números naturales, es decr: Var(T) ' n (n%1) (n%1) 6 Una prmera forma de utlzacón del contraste de Wlcoxon consste en utlzar el estadístco T, con la aproxmacón Normal a su dstrbucón, con esperanza cero y la varanza que acabamos de ver. Una segunda forma se basa en el uso del estadístco T +. Como este estadístco utlza sólo los rangos procedentes de dferencas x - m postvas, su suma debería ser gual, en promedo, a la mtad de la suma de los n prmeros números naturales, de modo que: E(T % ) ' n (n%1) 4 mentras que su varanza es la cuarta parte de la del estadístco T: Var(T % ) ' n (n%1) (n%1) 4

10 Exste una tabla de valores crítcos del estadístco T de rangos de Wlcoxon con la cual puede compararse el estadístco s no se quere efectuar la aproxmacón Normal, aunque ésta es muy convenente. S el estadístco muestral de Wlcoxon está por debajo del valor crítco de las tablas, no podremos mantener la hpótess nula de smetría alrededor de m. Ejemplo Consderemos los resultados que en un examen de nglés ha obtendo un grupo de 0 alumnos. Queremos contrastar que las calfcacones proceden de una poblacón smétrca alrededor de una medana gual a Cuadro 1.8 Calfcacones en el examen de nglés Calfcacones Dferencas x m Rangos 13, , ,5 8-15,5-8 15,5 4,5-4,5 11,5 Al asgnar rangos, cuando una determnada magntud para la dferenca x - m aparece repetda, se asgna a cada una de ellas el promedo de los rangos que corresponderían a dchas observacones. Así, la menor dferenca observada es de magntud 1, que aparece en tres ocasones, a las que corresponderían rangos 1, y 3. Su promedo es, que asgnamos a cada una de las tres observacones. La sguente magntud, que es, aparece en dos ocasones, a las que corresponderían rangos 4 y 5, cuyo promedo, 4,5, es el rango que asgnamos a ambas observacones. El estadístco T + es gual a 141,5, mentras que T - = 68,5, por lo que T = T + - T - = 141,5-68,5 = 73, con esperanza nula, y varanza: (0)(1)(41)/6 = 870. Por tanto, el rato: [T- E(T)]/%Var(T) que se dstrbuye N(0,1) en muestras grandes, toma el valor: 73/(53,57) = 1,363, que está dentro del ntervalo de confanza del 95% de dcha dstrbucón. Por tanto, en la medda en que dcha aproxmacón sea correcta, no rechazamos la hpótess nula de que la dstrbucón es smétrca alrededor de su medana. S utlzamos el estadístco T + tpfcado: [T + - E(T + )]/%Var(T + ), que tene como dstrbucón aproxmada N(0,1) en muestras grandes, toma en esta muestra un valor: [141,5-105]/(6,79) = -1,36 que está nuevamente dentro de la banda de confanza del 95% para la N(0,1). El lector puede comprobar que el estadístco que podría obtener con T - conduce al msmo resultado numérco..4 Contraste de Normaldad Un caso especal de ajuste a una dstrbucón teórca se produce cuando la hpótess nula especfca que dcha dstrbucón es Normal. Para efectuar el contraste, se calculan la meda, así como la varanza muestral, S x, y se ordena la muestra en sentdo crecente. A contnuacón, se toman las dferencas entre mayor y menor elementos, segundo mayor y menor, terceros elementos menor y mayor, etc.. Cada una de estas dferencas vene corregda por un coefcente que se toma de una tabla construda al efecto por Shapro y Wlk, y se agregan los resultados en una suma D. El estadístco de Shapro-Wlk es el cocente:

11 10 W ' D ns x y el valor crítco se toma de una segunda tabla propuesta por estos autores. El valor crítco que proporcona esta tabla para un nvel de sgnfcacón α es el mínmo que puede tomar el estadístco W s la poblacón de la que se extrajo la muestra es Normal. Ejemplo 1.XX.- Las calfcacones del examen de nglés, ordenadas, son: 6 < 64 < 65 < 67 < 67 < 68 < 69 < 71 < 71 < 7 < 73 < 73 < 73 < 74 < 74 < 75 < 76 < 79 < 80 < 83 y el estadístco es: D'(0,473) (83&6)%(0,31) (80&64)%(0,57) (79&65)%(0,09) (76&67)%(0,169) (75&67)% (0,133) (74&68)%(0,101) (74&69)%(0,071) (73&(71)%(0,04) (73&71)%(0,014) (73&7)'3,44 que, genera un estadístco: W' (3,44) 0 (7,96) ' 0,983 que, casualmente, concde con el valor crítco de las tablas al 95% de confanza, y es nferor al valor crítco al 99%, que es de 0,988. El valor crítco al 90% es 0,979, por lo que no hay mucha evdenca n a favor n en contra de la Normaldad en este caso. Otro contraste de Normaldad, muy popular en el trabajo econométrco, utlza el hecho, ya menconado en el Capítulo XX de que toda poblacón Normal tene coefcentes de asmetría y de curtoss gual a cero. C.M.Jarque y A.K.Bera probaron que, s la dstrbucón de probabldad es Normal, entonces el estadístco: JB ' n AS % (K&3) 6 4 se dstrbuye como una ch-cuadrado con grados de lbertad. Para los msmos datos del ejemplo anteror, la hoja de cálculo NOPARAM.WQ1 contene los cálculos, que conducen a un valor numérco de 0,434 para este estadístco, muy nferor a los valores crítcos, a los nveles de sgnfcacón habtuales, de la dstrbucón χ, por lo que no rechazamos la hpótess nula de Normaldad. 3. CONTRASTES DE HOMOGENEIDAD ENTRE DISTRIBUCIONES Los contrastes de homogenedad de entre dstrbucones tratan de dscernr s dos muestras ndependentes pueden haber sdo extraídas de la msma dstrbucón de probabldad poblaconal. La hpótess nula es que las dstrbucones de probabldad de las que se extrajeron ambas muestras son déntcas aun sendo desconocdas, sendo la hpótess alternatva que ambas

12 11 dstrbucones son dferentes. 3.1 Contrastes de homogenedad en muestras bdmensonales apareadas Una clase mportante de problemas cubre los casos en que tenemos, ben observacones de varas característcas de un conjunto de ndvduos, o ben medcones de una msma característca en dstntos nstantes de tempo. En ambos casos tenemos varas observacones para cada ndvduo en la muestra, y queremos contrastar la homogenedad de las dstrbucones de cada una de dchas observacones. Estas son muestras pareadas, en las que tendremos el msmo número de observacones de cada una de las característcas, a dferenca de los casos que analzaremos posterormente. Los contrastes de rangos que vamos a examnar se basan en la dea de que, s las dos muestras proceden de gual poblacón, entonces no debería haber mucha dferenca entre los rangos de sus elementos, una vez que estos se huberan ordenado crecente o decrecentemente. Todos estos contrastes de rangos producen los msmos resultados con ndependenca de que los elementos muestrales se ordenen crecente o decrecentemente. Los contrastes denomnados de sgno se basan úncamente en la dferenca entre los elementos ordenados de ambas muestras, mentras que los contrastes de rangos más generales utlzan asmsmo nformacón acerca de la magntud de las dstancas que separan los elementos que ocupan gual rango en las dos muestras ordenadas. Son smlares a los que ya analzamos en la Seccón XX para el caso de ajuste a una dstrbucón teórca Contraste del sgno El contraste del sgno se utlza para contrastar la homogenedad de dos poblacones contnuas, utlzando como nformacón muestras de gual tamaño, selecconadas de cada una de las poblacones. El contraste se basa en ordenar de acuerdo con algún crtero las observacones en cada muestra, y comparar cada par de ellas, substtuyendo los dos números por un sgno más, un sgno menos o un cero, según que el elemento de la prmera muestra sea superor, nferor o gual al elemento correspondente de la segunda muestra. Ejemplo Supongamos que el grupo anteror de alumnos realza un segundo examen de nglés a la vuelta de una estanca en el Reno Undo. Este examen es de déntca dfcultad al prmero, y se pretende con él analzar la efectvdad de la estanca en el extranjero en cuanto al aprendzaje del nglés. Los resultados en ambos exámenes fueron: Alumno Calfcacón antes de la estanca Cuadro 1.6 Calfcacón después de la estanca , , ,

13 , , , , , , , , , , , , , , ,0 La hpótess nula es: H 0 : la estanca no ayudó a mejorar el nvel de nglés de los alumnos. En esta aplcacón no tene sentdo pensar que la estanca en el Reno Undo fue perjudcal para el nvel de nglés de los alumnos, por lo que el contraste será de una sola cola. La hpótess alternatva es: H 1 : la estanca contrbuyó a mejorar el nvel de nglés de los alumnos. En un contraste de dos colas la hpótess alternatva consderaría tanto la posbldad de que la estanca haya, efectvamente, contrbudo a mejorar el nvel de nglés de los alumnos, como que haya contrbudo a deterorarlo. Podemos observar que la calfcacón del examen realzado al regreso de la estanca es, en 13 alumnos, superor a la calfcacón obtenda antes de la estanca, mentras que para dos alumnos fue déntca. S la hpótess nula fuese certa, esperaríamos que, a la vuelta de la estanca en el Reno Undo, la probabldad de obtener un mejor resultado en la prueba de nglés fuese gual a la probabldad de obtener un resultado nferor, ambas gual a 1/. Estaríamos entonces ante una varable aleatora bnomal para cada alumno, que se materalza en dos sucesos: calfcacón superor, calfcacón nferor, con probabldades: p = 1-p = 0,5. Elmnando de la muestra los alumnos cuya calfcacón no varía, tenemos un total de 18 alumnos, con 13 sgnos postvos. Bajo H 0, estaríamos ante una varable bnomal: B(18; 0,5), con esperanza matemátca: E(X) = np = (18)(0,5) = 9 y varanza gual a: np(1-p) = 18(0,5) = 4,5, por lo que la desvacón típca sería,1. Utlzando la aproxmacón Normal a la dstrbucón bnomal, podemos calcular (aproxmadamente) la probabldad de obtener 13 o más sgnos postvos: P(X$1,5)'P X&µ F $ 1,5&µ F ' P Z$ 1,5&9 )'P(Z$1,651,1

14 donde hemos ncorporado la habtual correccón por ser la dstrbucón que se aproxma de tpo dscreto. Generalmente se utlza esta aproxmacón, porque el cálculo de las probabldades bnomales es sumamente complejo. Trabajando al nvel de sgnfcacón α = 0,05, en un contraste de una cola, tendríamos un nvel crítco para la varable N(0,1) de 1,645. Es decr, bajo la hpótess nula, estaríamos en presenca (aproxmadamente) de una varable N(9;,1), y con probabldad 0,95, el resultado de la prueba estandarzada debería ser nferor a 1,645. Nuestro resultado es superor, s ben lgeramente, por lo que el supuesto contendo en H 0, que nos ha servdo para obtener la dstrbucón Normal no puede mantenerse. Rechazaríamos la hpótess nula y pasaríamos a aceptar la hpótess alternatva de que la estanca en UK ha servdo para mejorar el nvel de nglés de los alumnos en el grupo de estudo. El nvel crítco para el contraste de una cola al nvel de confanza del 0,99 (nvel de sgnfcacón de 0,01) es de,33, en cuyo caso no rechazaríamos la hpótess nula y mantendríamos la hpótess de que la estanca en UK no ha servdo para mejorar el nvel de nglés de los alumnos en el grupo de estudo, mentras que al 90%, el rechazo es bastante claro. En casos en que el contraste a un determnado nvel de sgnfcacón tene una resolucón tan margnal como aquí ha ocurrdo trabajando al 5%, el nvestgador debe decdr s se decanta por aumentar o dsmnur dcho nvel, y resolver el contraste al nuevo nvel escogdo. En este ejemplo podríamos habernos desplazado al 0,10 o al 0,01, pero ha parecdo más nteresantes la segunda opcón, que nos ha llevado a no rechazar la hpótess nula, muy posblemente porque quséramos estar seguros de que las dferencas realmente exsten s es que creemos detectarlas. Este contraste tene la msma lmtacón que el smlar que ya examnamos en la Seccón 1.., de tener en cuenta úncamente los sgnos de las dferencas, pero no su magntud, a dferenca del contraste de Wlcoxon que presentamos a contnuacón. A dferenca de éste, sn embargo, el contraste del sgno tene la ventaja de poder ser utlzado con dstrbucones cualtatvas Contraste de Wlcoxon El contraste de Wlcoxon para la homogenedad de dstrbucones es muy smlar al contraste de gual nombre que ya vmos para el ajuste de una dstrbucón muestral a una dstrbucón teórca. Ejemplo S tomamos nuevamente el ejemplo de los alumnos de nglés, el Cuadro presenta todos los cálculos necesaros para obtener el estadístco T de Wlcoxon: en la cuarta columna aparece no sólo el sgno de cada dferenca, sno tambén su magntud. Al gual que en el contraste de los sgnos, gnoramos los casos en que las observacones numércas en ambas muestras concden. La qunta columna asgna rangos a tales dferencas, asgnando a las observacones con gual rango, el promedo de estos, de gual modo que hcmos en el contraste descrto en la Seccón..3. De acuerdo con la hpótess nula, las dferencas provenen de una dstrbucón smétrca con medana cero. El contraste de Wlcoxon se basa en que, s las dos muestras fuesen homogéneas, entonces las dferencas entre cada dos observacones correspondentes no sólo se dstrburían unformemente entre valores postvos y negatvos, sno que tambén sus magntudes se dstrburían smétrcamente: habría, en promedo, tantas dferencas pequeñas de sgno postvo 13

15 como de sgno negatvo, y tantas dferencas grandes de un sgno como de otro. En nuestro ejemplo, los rangos postvos suman 15,5, mentras que los rangos negatvos suman 45,5, lo cual parece, a smple vsta, bastante heterogéneo. S el valor del estadístco T de Wlcoxon es sufcentemente pequeño, es decr nferor al nvel crítco de las tablas, es que esta suma menor es sgnfcatvamente nferor a la otra suma mayor, rompendo la smetría que debe cumplrse bajo la hpótess nula. En consecuenca, rechazamos ésta. Ya hemos argumentado que nuestro ejemplo se presta a un contraste de una sola cola. La dea es que la estanca en el Reno Undo puede haber aumentado el nvel de nglés de los alumnos, por lo que la medana sería ahora superor a la de antes. Por tanto, s el valor del estadístco excede del valor crítco de las tablas, tendremos evdenca sgnfcatva en contra de la hpótess de que ambas medanas son guales. Los valores de la tabla de Wlcoxon para T - [al fnal de este texto] para n = 18, y nveles de sgnfcacón de 0,05 y 0,01 son 40 y 33, respectvamente, que son superados por el valor de nuestro estadístco, 45,5. En consecuenca, no rechazamos la hpótess nula de homogenedad de resultados en los exámenes de nglés de antes y después de la estanca en UK, mantenendo por tanto que dcha estanca no contrbuyó a mejorar sgnfcatvamente el nvel de nglés del grupo de alumnos. A partr de n = 5, es mejor utlzar el hecho de que la suma de los rangos postvos, T+, se dstrbuye aproxmadamente Normal, con: E(T) ' n(n%1) ; Var(T) ' n(n%1)(n%1) ;. 4 4 En nuestro ejemplo, con n = 18, aun no sendo la stuacón más recomendable para la aproxmacón, tendríamos una dstrbucón Normal con esperanza matemátca 85,5 y desvacón típca gual a,96, de modo que el valor de nuestro estadístco, estandarzado, sería: 14 Z ' T & E(T) Var(T) ' 45,5&85,5,96 '&1,74 que conducría a rechazar la hpótess nula al 99% de confanza, aunque no al 99%, ya que los valores crítcos de la N(0,1) para contrastes de una cola, a nveles de sgnfcacón de 0,05 y 0,01 son, respectvamente, 1,645 y,33. A pesar de no ser totalmente apropada en nuestro caso la aproxmacón Normal conduce, al 95% de confanza, a los msmos resultados que obtuvmos sn dcha aproxmacón. El resultado numérco del contraste es el msmo, sólo que cambado de sgno, s en vez de T +, se utlza T Contrastes de homogenedad generales Examnamos en esta seccón contrastes de homogenedad entre muestras cualesquera, no necesaramente procedentes de un msmo conjunto de ndvduos, a dferenca de los casos comprenddos en la seccón anteror. Por tanto, vamos a comparar muestras de tamaños generalmente dferentes entre sí Contraste de Kolmogorov-Smrnov para dos muestras Este contraste puede utlzarse para la hpótess nula de que las dstrbucones contnuas de las que han sdo extraídas dos muestras aleatoras smples de tamaños n 1 y n, son guales. Para llevarlo a cabo se dvde el espaco muestral en k ntervalos (o sucesos) dsjuntos, se calculan ambas funcones de dstrbucón empírcas, F (x) n1 y F (x) n, y se toma el estadístco:

16 15 D n1, n ' supremo * F n1 (x)&f (x) n * x S las dos muestras proceden de la msma poblacón, sus funcones de dstrbucón empírcas no pueden ser muy dstntas, por lo que el contraste es sempre de una cola, y se rechaza la hpótess nula de gual dstrbucón s el estadístco toma un valor sufcentemente grande. Para ello, se utlzan las tablas de este estadístco, para encontrar el umbral λ tal que: P (D $8) n1 ' ". Dcho valor crítco puede aproxmarse, cuando ambas muestras son grandes,,n por: 8 ' k n 1 % n n 1 n sendo k = 1,; 1,36; 1,63 a nveles de confanza del 90%, 95% y 99%, para el contraste de dos colas, y de k = 1,07; 1, y 1,5 para contrastes de una sola cola. El contraste de Kolmogorov-Smrnov tene más potenca para el caso en que las dstrbucones tenen dferentes medanas que para el caso en que, tenendo la msma poscón central, dferen en su dspersón. Ejemplo.- Supongamos que dsponemos de dos muestras, ambas sobre el ntervalo [0,1]: Muestra 1: 0,65 0,31 0,4 0,81 0,1 0,91 0,7 0,41 0,94 0,61 0,5 0,1 0,16 0,74 0,65 0,83 0,44 0,4 0,56 0,73 Muestra : 0,15 0,94 0,81 0,7 0,1 0,35 0,18 0,74 0,73 0,6 0,85 0,91 0,18 0,3 0,65 a partr de las cuales obtenemos las sguentes dstrbucones empírcas sobre ntervalos de longtud 0,0: Funcones de dstrbucón empírcas F n (x) 0#x<0,0 0,0#x<0,40 0,40#x<0,60 0,60#x<0,80 0,80#x<1,00 Muestra 1: n 1 = 0 0,10 0,0 0,50 0,80 1,0 Muestra : n = 15 0,0 0,40 0,40 0,73 1,0 La máxma dferenca entre ambas funcones de dstrbucón se produce en el segundo ntervalo, y es de: 0,0-0,40 = -0,0. El valor crítco de las tablas del estadístco de Kolmogorov-Smrnov para estos tamaños muestrales es de 13/30 = 0,433, por lo que no rechazamos la hpótess nula de gualdad de dstrbucones de probabldad. La aproxmacón: n 1 %n )/n 1 n es, en este caso, gual a 0,464, no muy dferente del valor de las tablas. Tampoco en esta comparacón rechazaríamos la hpótess de gualdad de dstrbucones. 3.. El contraste de Mann-Whtney de sumas de rangos Este estadístco, ntroducdo smultáneamente por Mann y Whtney en 1947, se utlza para contrastar s dos muestras, extraídas ndependentemente, proceden de la msma poblacón. El únco

17 supuesto precso es que la poblacón o poblacones de que se han extraído las muestras, sean de tpo contnuo, pero no requere smetría. La hpótess nula H 0 es que las esperanzas matemátcas de ambas poblacones son guales, mentras que la alternatva puede establecer que las esperanzas matemátcas son dferentes (contraste de dos colas), o que una de ellas, prevamente escogda, es superor a la otra (contraste de una cola). Este contraste resume, por tanto, las característcas de la dstrbucón de probabldad en su esperanza matemátca. El planteamento lógco del contraste es, por tanto, gual al del contraste de gualdad de esperanzas que ya resolvmos medante un estadístco t de Student cuando suponíamos que ambas poblacones eran Normales. El estadístco U se construye, al gual que los anterores, a partr de las sumas de rangos. Supongamos que dsponemos de dos muestras de tamaño n 1 y n, tomadas de dos poblacones potencalmente dferentes. Comenzamos consderando ambas como una muestra global de tamaño n 1 +n, y asgnamos rangos a todos estos elementos, resolvendo casos de gualdad de rangos del msmo modo que en los estadístcos prevos, gnorando dchas observacones. Después, calculamos las sumas de rangos, R 1 y R, de ambas muestras. A contnuacón, calculamos los estadístcos: 16 U 1 ' n 1 n % n 1 (n %1) 1 U ' n 1 n % n (n %1) & R 1 & R y se compara el menor de ellos U m = mn (U 1, U ), con los valores crítcos de las tablas específcamente calculadas para este estadístco, que aparecen en el Apéndce XX. S el valor del estadístco muestral es nferor al de las tablas, se rechaza la hpótess nula de gualdad de dstrbucones de probabldad. Ejemplo 10.- Una determnada unversdad cree que es posble que los alumnos que proceden de nsttucones prvadas de enseñanza meda tengan dstnto rendmento académco en las lcencaturas unverstaras que aquellos que provenen de nsttucones públcas. Con el objeto de contrastar esta hpótess, se recogen aleatoramente los sguentes resultados de las pruebas de selectvdad: Cuadro 1.7 Puntuacón Prv ada Públ ca que genera las dos prmeras flas en la sguente tabla de rangos, obtendos a partr de la muestra agregada: Cuadro 1.8 Rangos en la muestra global Prvada 3 5,5 13,5 30,5 13,5 18, ,5 7,5 0,5 4 5,5 10,5 1 10,5 319,5

18 17 Públca 18,5 3 7,5 16,5 15 3,5 30,5 5,5 10,5 16,5 10,5 3,5 5,5 08,5 Prvada < Públca Las sumas de los rangos son 319,5 y 08,5, respectvamente, y tenemos n 1 =18 observacones para alumnos de escuelas prvadas y n = 14 para los que provenen de escuelas públcas, de modo que tenemos: U 1 = (18)(14) + (18)(19)/ - 319,5 = ,5 = 103,5 U = (18)(14) + (14)(15)/ - 08,5 = ,5 = 148,5 El menor estadístco es U 1, con un valor de 103,5 que excede del valor crítco al nvel de sgnfcacón de 0,05 para el contraste de una cola, que es gual a 8 (ver Tabla XX en el Apéndce XX). En consecuenca, nfermos que la menor suma de rangos no es substancalmente nferor a la suma mayor y, en consecuenca, las dos poblacones no parecen dferentes, en base a las dos muestras de que dsponemos. No rechazamos la hpótess nula de homogenedad poblaconal, por lo que los alumnos provenentes de ambos tpos de nsttucones parecen obtener resultados académcos smlares. Convene tener en cuenta que a través de la relacón: U 1 + U = n 1 n, puede obtenerse un estadístco a partr del otro, de modo que basta calcular uno de ellos. S el que calculemos es nferor a (n 1 n )/, sabremos que hemos obtendo el estadístco más bajo, es decr, el que queremos comparar con los valores crítcos de las tablas, y s no, su "complemento": U j = n 1 n - U,,j = 1,, j,es el estadístco que deseamos utlzar, sn necesdad de tener que utlzar la expresón que aparece en su defncón. Bajo la hpótess nula de gualdad de dstrbucón de probabldad para ambas muestras, el estadístco U m no debe tomar valores excesvamente grandes. Hay que obtener valores crítcos λ y λ s, tales que: P 8 < U m <8 s ' 1&" tenendo en cuenta que la tabla al fnal del texto proporcona las probabldades p, p'p(u#u m ). Exste tambén para este estadístco una aproxmacón Normal, obtenda por Mann- Whtney para cuando tanto n 1 como n aumentan de tamaño. Dcha dstrbucón Normal, que aproxma el comportamento del estadístco U tene por esperanza matemátca y varanza: E(U m ) ' n 1 n ; Var(U ) m ' n 1 n (n 1 %n %1) ; 1 y parece proporconar aproxmacones admsbles cuando ambos tamaños muestrales son superores a 0. En nuestro ejemplo, tenemos:

19 18 E(U m ) ' (18)(14) ' 16 Desvacón típca(u m ) ' (18)(14)(18%14%1) 1 ' 6,3 por lo que el valor estandarzado de nuestro estadístco, 103,5, es gual a: Z ' 103,5 & 16 6,3 ' 0,85 que está notablemente por debajo de los valores crítcos para el contraste de una cola en una poblacón Normal(0,1), a los nveles de sgnfcacón habtuales: 0,10, 0,05 ó 0,01. En consecuenca, no rechazamos la hpótess nula, llegando así a la msma conclusón que en el análss anteror. Una segunda forma de calcular el estadístco consste en comparar cada dato de una de las dos muestras, con todos los de la otra, para contablzar el número de ocasones en que se tene que el prmero es nferor al segundo. S efectuamos este ejercco con los datos del ejemplo, la tercera fla del cuadro muestra que cada puntuacón de un alumno de enseñanza prvada resulta nferor a las puntuacones obtendas por los alumnos de enseñanza públca en 99 ocasones. Además, puede comprobarse que se producen 9 casos de empates, con gual calfcacón entre alumnos de ambos tpos de enseñanza. Sumando la mtad de los empates, 4,5, al total de 99, tenemos 103,5, el msmo valor del estadístco que antes ya calculamos Contraste de Segel-Tukey de gualdad de varanzas El procedmento de Mann-Whtney fue adaptado por S.Segel y J.Tukey puede adaptarse para contrastar s dos muestras ndependentes han sdo extraídas de poblacones con gual varanza, frente a la hpótess alternatva de que han sdo extraídas de poblacones con varanzas dferentes. Para ello, una vez ordenados todos los elementos de ambas muestras, combnados, se asgnan rangos comenzando desde el menor y el mayor, haca el centro: al menor valor se le asoca el rango 1; al valor más elevado y al que le precede se asgnan los rangos y 3 ; al segundo y tercer valores más bajos se asgnan los rangos 4 y 5, y así sucesvamente. S el número total de observacones en ambas muestras es par, una de ellas se quedará sn rango. Las expresones anterores se utlzan para calcular el estadístco R m, que es la suma de rangos de la muestra de menor tamaño. La nterpretacón del contraste estrba en que s una de las dos muestras procede de una poblacón con mayor dspersón, recbrá los rangos menores, mentras que la que procede de una muestra de menor varabldad recbrá los rangos mayores. Puede aprecarse que el contraste tene nterés cuando condconamos en que ambas dstrbucones tenen una meda de poscón central smlar. El estadístco R m puede aproxmarse, para n 1 +n > 0, por una dstrbucón Normal: R m - N n m (n%1) n 1 n (n%1) ; donde n m = mn(n 1,n ), y n = n 1 +n.

20 Ejemplo 1.7 (NOPARAM.WQ1).- Supongamos que, para tratar de evaluar las dferentes capacdades de 16 hombres y 14 mujeres, se somete a un examen lógco a una muestra de 16 estudantes varones y 14 estudantes mujeres, obtenendo los sguentes resultados: 19 Puntuacón Hombre s Mujeres Las calfcacones ordenadas son: 64m; 66h; 68h; 70h; 70m; 70h; 7h; 74m; 74h; 74h; 76m; 76h; 76h; 78m; 78m; 80m; 8m; 8m; 8h; 8h; 84h; 84h; 84m; 85h; 88m; 90m; 90h; 90m; 9h; 94m; donde hemos anotado s corresponden a hombres o mujeres. Los rangos correspondentes a este contraste son: 64m; 66h; 68h; 70h; 70m; 70h; 7h; 74m; 74h; 74h; 76m; 76h; 76h; 78m; 78m; 80m; 8m; 8m; 8h; 8h; 84h; 84h; 84m; 85h; 88m; 90m; 90h; 90m; 9h; 94m; con rangos: 1m 4h 5h 8h 9m 1h 13h 16m 17h 0h 1m 4h 5h 8m 9m -- 7m 6m 3h h 19h 18h 15m 14h 11m 10m 7h 6m 3h m que producen sumas de rangos 01 para hombres y 34 para mujeres. La dstrbucón aproxmada es: N (14) (31) (14) (16) (31) ; 1 ' N 17 ; 578,67

21 con desvacón típca: σ = 4,06. Como el estadístco procedente de la muestra de menor tamaño, la de mujeres, es 34, que no resulta sgnfcatvamente dstnto del valor esperado en una poblacón N(17;578,7), no rechazamos la hpótess nula de que ambas poblacones tenen gual dspersón El contraste de Kruskal-Walls Este estadístco, propuesto por W.H.Kruskal y W.A.Walls en 195, generalza el estadístco U, cuando se trabaja con más de muestras ndependentes y se pretende contrastar la hpótess nula de que todas ellas proceden de la msma poblacón. El procedmento es déntco al segudo con el estadístco U, sólo que ahora utlzamos el estadístco H: 0 H ' 1 n (n%1) R 1 % R % R 3 %...% R k n 1 n n 3 n k & 3(N%1) sendo n el tamaño de cada una de las k muestras ndependentes de que se dspone, y R las respectvas sumas de rangos. n denota la suma de los k tamaños muestrales: n ' ' k. Todo n '1 lo que se requere es que la poblacón o poblacones de las que se extrajeron las muestras, sean de tpo contnuo. La hpótess nula es que las medas de las k poblacones de donde se extrajeron las muestras son déntcas. Para ello, se ordenan los valores combnados de todas las k muestras en orden crecente, y se asgnan rangos. La dstrbucón del estadístco H depende del número de muestras consderadas y de sus tamaños, por lo que es precso dsponer de un amplo número de tablas de valores crítcos. Kruskal y Walls probaron que s la hpótess nula es certa, y s cada muestra consta de al menos 5 observacones, entonces el estadístco H sgue una dstrbucón ch-cuadrado con k-1 grados de lbertad, y rechazamos la hpótess nula de homogenedad de las poblacones cuando el valor del estadístco H que hemos obtendo en nuestra aplcacón excede del valor de las tablas de dcha dstrbucón. Las tablas de Kruskal-Walls dependen del número de muestras dstntas, k, por lo que hay que dsponer de varas de ellas. No las presentamos aquí, y sugermos la aproxmacón χ k-1 menconada. El contraste de Kruskal-Walls es más potente que un contraste no paramétrco semejante, como el contraste de la medana que a contnuacón presentamos, cuando se utlza para varos grupos. Es algo menos potente que el contraste paramétrco F, pero más sencllo de utlzar. Ejemplo Una agenca ofcal está preocupada acerca de la posbldad de que las práctcas de precos que se sguen en cudades pequeñas para un determnado producto, reflejan práctcas de monopolo. Para contrastar dcha posbldad toma muestras de tamaño 6 en tres cudades: una de menos de habtantes, otra de menos de habtantes, y otra muestra en una gran cudad. S detecta que los precos son mayores en las cudades pequeñas, tendrá certa evdenca acerca de práctca monopolsta en las msmas, por la poca presenca de competenca. Las observacones muestrales fueron: Precos en cudad pequeña: 186, 16, 146, 174, 19, 178 Precos en cudad meda: 166, 14, 180, 135, 16, 174 Precos en gran cudad: 14, 16, 118, 135, 17, 156

H 0 : La distribución poblacional es uniforme H 1 : La distribución poblacional no es uniforme

H 0 : La distribución poblacional es uniforme H 1 : La distribución poblacional no es uniforme Una hpótess estadístca es una afrmacón con respecto a una característca que se desconoce de una poblacón de nterés. En la seccón anteror tratamos los casos dscretos, es decr, en forma exclusva el valor

Más detalles

Problema: Existe relación entre el estado nutricional y el rendimiento académico de estudiantes de enseñanza básica?

Problema: Existe relación entre el estado nutricional y el rendimiento académico de estudiantes de enseñanza básica? Relacones entre varables cualtatvas Problema: xste relacón entre el estado nutrconal y el rendmento académco de estudantes de enseñanza básca? stado Nutrconal Malo Regular Bueno TOTAL Bajo 13 95 3 55 Rendmento

Más detalles

Medidas de Variabilidad

Medidas de Variabilidad Meddas de Varabldad Una medda de varabldad es un ndcador del grado de dspersón de un conjunto de observacones de una varable, en torno a la meda o centro físco de la msma. S la dspersón es poca, entonces

Más detalles

) para toda permutación (p p 1 p

) para toda permutación (p p 1 p 09 Elena J. Martínez do cuat. 004 Análss de la varanza de dos factores El problema anteror consderaba la comparacón de muestras para detectar dferencas entre las respectvas poblacones. En el modelo de

Más detalles

CAPÍTULO 4 MARCO TEÓRICO

CAPÍTULO 4 MARCO TEÓRICO CAPÍTULO 4 MARCO TEÓRICO Cabe menconar que durante el proceso de medcón, la precsón y la exacttud de cualquer magntud físca está lmtada. Esta lmtacón se debe a que las medcones físcas sempre contenen errores.

Más detalles

CURSO INTERNACIONAL: CONSTRUCCIÓN DE ESCENARIOS ECONÓMICOS Y ECONOMETRÍA AVANZADA. Instructor: Horacio Catalán Alonso

CURSO INTERNACIONAL: CONSTRUCCIÓN DE ESCENARIOS ECONÓMICOS Y ECONOMETRÍA AVANZADA. Instructor: Horacio Catalán Alonso CURSO ITERACIOAL: COSTRUCCIÓ DE ESCEARIOS ECOÓMICOS ECOOMETRÍA AVAZADA Instructor: Horaco Catalán Alonso Modelo de Regresón Lneal Smple El modelo de regresón lneal representa un marco metodológco, que

Más detalles

Estadísticos muéstrales

Estadísticos muéstrales Estadístcos muéstrales Hemos estudado dferentes meddas numércas correspondentes a conjuntos de datos, entre otras, estudamos la meda, la desvacón estándar etc. Ahora vamos a dstngur entre meddas numércas

Más detalles

Prueba de Inferencia Estadística y Contraste de Hipótesis. 8 de octubre de 2012 GRUPO A

Prueba de Inferencia Estadística y Contraste de Hipótesis. 8 de octubre de 2012 GRUPO A Prueba de Inferenca Estadístca y Contraste de Hpótess 8 de octubre de 01 GRUPO A 1.- Se ha observado un ángulo cnco veces, obtenéndose los sguentes valores: Se pde: 65º5 ; 65º33 ; 65º3 ; 65º8 ; 65º7 a)

Más detalles

14. Contrastes no paramétricos

14. Contrastes no paramétricos 14. Contrastes no paramétrcos 1 Contrastes no paramétrcos En la leccón anteror nos hemos ocupado de contrastes paramétrcos. Determnábamos la plausbldad de certas hpótess sobre los valores de parámetros

Más detalles

Estas medidas serán más significativas cuanto más homogéneos sean los datos y pueden ser engañosas cuando mezclamos poblaciones distintas.

Estas medidas serán más significativas cuanto más homogéneos sean los datos y pueden ser engañosas cuando mezclamos poblaciones distintas. UIDAD 3: Meddas estadístcas Las meddas estadístcas o parámetros estadístcos son valores representatvos de una coleccón de datos y que resumen en unos pocos valores la normacón del total de datos. Estas

Más detalles

Análisis de la varianza de un factor

Análisis de la varianza de un factor Análss de la varanza de un factor El test t de muestras se aplca cuando se queren comparar las medas de dos poblacones con dstrbucones normales con varanzas guales y se observan muestras ndependentes para

Más detalles

COLEGIO INGLÉS MEDIDAS DE DISPERSIÓN

COLEGIO INGLÉS MEDIDAS DE DISPERSIÓN COLEGIO IGLÉS DEPARTAMETO IVEL: CUARTO MEDIO PSU. UIDAD: ESTADISTICA 3 PROFESOR: ATALIA MORALES A. ROLADO SAEZ M. MIGUEL GUTIÉRREZ S. JAVIER FRIGERIO B. MEDIDAS DE DISPERSIÓ Las meddas de dspersón dan

Más detalles

Un estimado de intervalo o intervalo de confianza ( IC

Un estimado de intervalo o intervalo de confianza ( IC Un estmado puntual, por ser un sólo número, no proporcona por sí msmo nformacón alguna sobre la precsón y confabldad de la estmacón. Debdo a la varabldad que pueda exstr en la muestra, nunca se tendrá

Más detalles

Tema 1:Descripción de una variable. Tema 1:Descripción de una variable. 1.1 El método estadístico. 1.1 El método estadístico. Describir el problema

Tema 1:Descripción de una variable. Tema 1:Descripción de una variable. 1.1 El método estadístico. 1.1 El método estadístico. Describir el problema Tema :Descrpcón de una varable Tema :Descrpcón de una varable. El método estadístco. Descrpcón de conjuntos de datos Dstrbucones de frecuencas. Representacón gráfca Dagrama de barras Hstograma. Meddas

Más detalles

Medidas de centralización

Medidas de centralización 1 Meddas de centralzacón Meda Datos no agrupados = x X = n = 0 Datos agrupados = x X = n = 0 Medana Ordenamos la varable de menor a mayor. Calculamos la columna de la frecuenca relatva acumulada F. Buscamos

Más detalles

Erratas y modificaciones

Erratas y modificaciones Erratas y modfcacones Págna 39 Tabla fnal: Dce: Expermental T Debe decr: Expermental T Págna 40 Tabla comenzo: Dce: T 0 Debe decr: T Dce: 3 T Debe decr: 3 T Págna 05 Párrafo : Debe qutarse el acento de

Más detalles

Tema 6. Estadística descriptiva bivariable con variables numéricas

Tema 6. Estadística descriptiva bivariable con variables numéricas Clase 6 Tema 6. Estadístca descrptva bvarable con varables numércas Estadístca bvarable: tpos de relacón Relacón entre varables cuanttatvas Para dentfcar las característcas de una relacón entre dos varables

Más detalles

Probabilidad Grupo 23 Semestre Segundo examen parcial

Probabilidad Grupo 23 Semestre Segundo examen parcial Probabldad Grupo 3 Semestre 015- Segundo examen parcal La tabla sguente presenta 0 postulados, algunos de los cuales son verdaderos y otros son falsos. Analza detendamente cada postulado y elge tu respuesta

Más detalles

Análisis de la varianza de un factor

Análisis de la varianza de un factor Análss de la varanza de un factor El test t de muestras se aplca cuando se queren comparar las medas de dos poblacones con dstrbucones normales con varanzas guales y se observan muestras ndependentes para

Más detalles

Ejemplo: Consumo - Ingreso. Ingreso. Consumo. Población 60 familias

Ejemplo: Consumo - Ingreso. Ingreso. Consumo. Población 60 familias Ejemplo: Consumo - Ingreso Ingreso Consumo Poblacón 60 famlas ( YX ) P = x [ YX ] E = x Línea de regresón poblaconal 80 60 Meda Condconal 40 20 00 [ X = 200] EY o o o o [ X = 200] EY 80 o o o 60 o 40 8

Más detalles

Tema 1.- Variable aleatoria discreta (V2.1)

Tema 1.- Variable aleatoria discreta (V2.1) Tema.- Varable aleatora dscreta (V2.).- Concepto de varable aleatora A cada posble resultado de un expermento lo llamamos suceso elemental, y lo denotamos con ω, ω 2, Llamamos espaco muestral al conjunto

Más detalles

ENUNCIADOS DE LOS EJERCICIOS PROPUESTOS EN 2011 EN MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES. 3 y

ENUNCIADOS DE LOS EJERCICIOS PROPUESTOS EN 2011 EN MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES. 3 y ENUNCADOS DE LOS EJERCCOS PROPUESTOS EN 011 EN MATEMÁTCAS APLCADAS A LAS CENCAS SOCALES. EJERCCO 1 a (5 puntos Raconalce las epresones y. 7 b (5 puntos Halle el conjunto de solucones de la necuacón EJERCCO

Más detalles

Estadísticos muéstrales

Estadísticos muéstrales Estadístcos muéstrales Una empresa dedcada al transporte y dstrbucón de mercancías, tene una plantlla de 50 trabajadores. Durante el últmo año se ha observado que 5 trabajadores han faltado un solo día

Más detalles

Problemas donde intervienen dos o más variables numéricas

Problemas donde intervienen dos o más variables numéricas Análss de Regresón y Correlacón Lneal Problemas donde ntervenen dos o más varables numércas Estudaremos el tpo de relacones que exsten entre ellas, y de que forma se asocan Ejemplos: La presón de una masa

Más detalles

SEMANA 13. CLASE 14. MARTES 20/09/16

SEMANA 13. CLASE 14. MARTES 20/09/16 SEMAA 3. CLASE. MARTES 20/09/6. Defncones de nterés.. Estadístca descrptva. Es la parte de la Estadístca que se encarga de reunr nformacón cuanttatva concernente a ndvduos, grupos, seres de hechos, etc..2.

Más detalles

Histogramas: Es un diagrama de barras pero los datos son siempre cuantitativos agrupados en clases o intervalos.

Histogramas: Es un diagrama de barras pero los datos son siempre cuantitativos agrupados en clases o intervalos. ESTADÍSTICA I. Recuerda: Poblacón: Es el conjunto de todos los elementos que cumplen una determnada propedad, que llamamos carácter estadístco. Los elementos de la poblacón se llaman ndvduos. Muestra:

Más detalles

( ) MUESTREO ALEATORIO SIMPLE SIN REEMPLAZO ( mas ) y Y. N n. S y. MUESTREO ALEATORIO SIMPLE SIN REEMPLAZO ( mas )

( ) MUESTREO ALEATORIO SIMPLE SIN REEMPLAZO ( mas ) y Y. N n. S y. MUESTREO ALEATORIO SIMPLE SIN REEMPLAZO ( mas ) MUETREO ALEATORIO IMPLE I Este esquema de muestreo es el más usado cuando se tene un marco de muestreo que especfque la manera de dentfcar cada undad en la poblacón. Además no se tene conocmento a pror

Más detalles

INTRODUCCIÓN AL ANÁLISIS DE DATOS SEPTIEMBRE 2014 Código asignatura: EXAMEN TIPO TEST MODELO B DURACION: 2 HORAS.

INTRODUCCIÓN AL ANÁLISIS DE DATOS SEPTIEMBRE 2014 Código asignatura: EXAMEN TIPO TEST MODELO B DURACION: 2 HORAS. eptembre 04 EAMEN MODELO B ág. INTRODUCCIÓN AL ANÁLII DE DATO ETIEMBRE 04 Códgo asgnatura: 60037 EAMEN TIO TET MODELO B DURACION: HORA olucones 0 4 40 30 0 0 0 44 4 39 6 4 36 37 3 8 00 0 0 03 04 Nº de

Más detalles

EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 6 de Junio de :00 horas. Pregunta 19 A B C En Blanco. Pregunta 18 A B C En Blanco

EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 6 de Junio de :00 horas. Pregunta 19 A B C En Blanco. Pregunta 18 A B C En Blanco EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 6 de Juno de 3 9: horas Prmer Apelldo: Nombre: DNI: Teléfono: Segundo Apelldo: Grupo y Grado: Profesor(a): e mal: Pregunta A B C En Blanco Pregunta

Más detalles

ESTADÍSTICA UNIDIMENSIONAL

ESTADÍSTICA UNIDIMENSIONAL ESTADÍSTICA UNIDIMENSIONAL La estadístca undmensonal trata de resumr la nformacón contenda en una tabla que contene nformacón de una sola varable en unos pocos números. Las meddas de poscón pueden ser:

Más detalles

Tema 4: Variables aleatorias

Tema 4: Variables aleatorias Estadístca 46 Tema 4: Varables aleatoras El concepto de varable aleatora surge de la necesdad de hacer más manejables matemátcamente los resultados de los expermentos aleatoros, que en muchos casos son

Más detalles

Estadistica No Parametrica

Estadistica No Parametrica Estadstca No Parametrca CLASE 3 Pruebas Basadas en la Dstrbucon Bnomal JAIME MOSQUERA RESTREPO Bnomal Test La prueba bnomal es quzás la prueba mas antgua encontrada en al lteratura. Se encuentra asocada

Más detalles

16/02/2015. Ángel Serrano Sánchez de León

16/02/2015. Ángel Serrano Sánchez de León Ángel Serrano Sánchez de León Índce Introduccón Varables estadístcas Dstrbucones de frecuencas Introduccón a la representacón gráfca de datos Meddas de tendenca central: meda (artmétca, geométrca, armónca,

Más detalles

SEMANA 5 MEDIDAS DE TENDENCIA CENTRAL Y POSICIÓN

SEMANA 5 MEDIDAS DE TENDENCIA CENTRAL Y POSICIÓN Estadístca SEMANA 5 MEDIDAS DE TENDENCIA CENTRAL Y POSICIÓN LOGRO DE APRENDIZAJE: Al fnalzar la sesón, el estudante estará en la capacdad de calcular e nterpretar meddas de tendenca central y poscón de

Más detalles

MUESTREO EN POBLACIONES FINITAS

MUESTREO EN POBLACIONES FINITAS MUESTREO EN POBLACIONES FINITAS Antono Morllas A.Morllas: Muestreo 1 MUESTREO EN POBLACIONES FINITAS 1. Conceptos estadístcos báscos. Etapas en el muestreo 3. Tpos de error 4. Métodos de muestreo 5. Tamaño

Más detalles

Tema 8 - Estadística - Matemáticas CCSSI 1º Bachillerato 1

Tema 8 - Estadística - Matemáticas CCSSI 1º Bachillerato 1 Tema 8 - Estadístca - Matemátcas CCSSI 1º Bachllerato 1 TEMA 8 - ESTADÍSTICA 8.1 NOCIONES GENERALES DE ESTADÍSTICA 8.1.1 INTRODUCCIÓN Objetvo: La estadístca tene por objeto el desarrollo de técncas para

Más detalles

CAPÍTULO 1: VARIABLES ALEATORIAS Y SUS DISTRIBUCIONES

CAPÍTULO 1: VARIABLES ALEATORIAS Y SUS DISTRIBUCIONES CAÍTULO : VARIABLES ALEATORIAS SUS DISTRIBUCIONES En este capítulo el alumno debe abordar el conocmento de un mportante concepto el de VARIABLE ALEATORIA tpos de varables aleatoras cómo se dstrbue la funcón

Más detalles

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio.

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio. Tema 9 - Estadístca - Matemátcas B 4º E.S.O. 1 TEMA 9 - ESTADÍSTICA 9.1 DOS RAMAS DE LA ESTADÍSTICA 9.1.1 - INTRODUCCIÓN La estadístca tene por objeto el desarrollo de técncas para el conocmento numérco

Más detalles

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio.

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio. Tema 9 - Estadístca - Matemátcas B 4º E.S.O. 1 TEMA 9 - ESTADÍSTICA 9.1 DOS RAMAS DE LA ESTADÍSTICA 9.1.1 - INTRODUCCIÓN Objetvo: La estadístca tene por objeto el desarrollo de técncas para el conocmento

Más detalles

Aspectos fundamentales en el análisis de asociación

Aspectos fundamentales en el análisis de asociación Carrera: Ingenería de Almentos Perodo: BR01 Docente: Lc. María V. León Asgnatura: Estadístca II Seccón A Análss de Regresón y Correlacón Lneal Smple Poblacones bvarantes Una poblacón b-varante contene

Más detalles

Algunas aplicaciones del test del signo

Algunas aplicaciones del test del signo 43 Algunas aplcacones del test del sgno Test de Mc emar para sgnfcacón de cambos: En realdad este test se estuda en detalle en Métodos no Paramétrcos II, en el contexto de las denomnadas Tablas de Contngenca.

Más detalles

Aprende fácil estadística aplicada con SPSS Adquiere destrezas y habilidades para realizar diagnósticos

Aprende fácil estadística aplicada con SPSS Adquiere destrezas y habilidades para realizar diagnósticos Gestón Aeronáutca: Estadístca Teórca Facultad Cencas Económcas y Empresarales Departamento de Economía Aplcada Profesor: Santago de la Fuente Fernández Aprende fácl estadístca aplcada con SPSS Adquere

Más detalles

EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 19 de Septiembre de :30 horas. Pregunta 19 A B C En Blanco

EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 19 de Septiembre de :30 horas. Pregunta 19 A B C En Blanco EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 19 de Septembre de 01 15:30 horas Prmer Apelldo: Nombre: DNI: Teléfono: Segundo Apelldo: Grupo y Grado: Profesor(a): e mal: Pregunta 1 A B C

Más detalles

IN540: Métodos Estadísticos para economía y gestión Profesores: Marcelo Henríquez, Felipe Avilés Auxiliares: José Miguel Carrasco

IN540: Métodos Estadísticos para economía y gestión Profesores: Marcelo Henríquez, Felipe Avilés Auxiliares: José Miguel Carrasco Departamento de Ingenería Industral Facultad de Cs. Físcas y Matemátcas Unversdad de Chle IN540: Métodos Estadístcos para economía y gestón Profesores: Marcelo Henríquez, Felpe Avlés Auxlares: José Mguel

Más detalles

Descripción de una variable

Descripción de una variable Descrpcón de una varable Tema. Defncones fundamentales. Tabla de frecuencas. Datos agrupados. Meddas de poscón Meddas de tendenca central: meda, medana, moda Ignaco Cascos Depto. Estadístca, Unversdad

Más detalles

Figura 1

Figura 1 5 Regresón Lneal Smple 5. Introduccón 90 En muchos problemas centífcos nteresa hallar la relacón entre una varable (Y), llamada varable de respuesta, ó varable de salda, ó varable dependente y un conjunto

Más detalles

Modelos unifactoriales de efectos aleatorizados

Modelos unifactoriales de efectos aleatorizados Capítulo 4 Modelos unfactorales de efectos aleatorzados En el modelo de efectos aleatoros, los nveles del factor son una muestra aleatora de una poblacón de nveles. Este modelo surge ante la necesdad de

Más detalles

Métodos específicos de generación de diversas distribuciones discretas

Métodos específicos de generación de diversas distribuciones discretas Tema 3 Métodos específcos de generacón de dversas dstrbucones dscretas 3.1. Dstrbucón de Bernoull Sea X B(p). La funcón de probabldad puntual de X es: P (X = 1) = p P (X = 0) = 1 p Utlzando el método de

Más detalles

A. Una pregunta muy particular que se puede hacer a una distribución de datos es de qué magnitud es es la heterogeneidad que se observa.

A. Una pregunta muy particular que se puede hacer a una distribución de datos es de qué magnitud es es la heterogeneidad que se observa. MEDIDA DE DIPERIÓ A. Una pregunta muy partcular que se puede hacer a una dstrbucón de datos es de qué magntud es es la heterogenedad que se observa. FICHA º 18 Las meddas de dspersón generalmente acompañan

Más detalles

Modelos lineales Regresión simple y múl3ple

Modelos lineales Regresión simple y múl3ple Modelos lneales Regresón smple y múl3ple Dept. of Marne Scence and Appled Bology Jose Jacobo Zubcoff Modelos de Regresón Smple Que tpo de relacón exste entre varables Predccón de valores a partr de una

Más detalles

Variables Aleatorias

Variables Aleatorias Varables Aleatoras VARIABLES ALEATORIAS. Varable aleatora. Tpos.... Dstrbucón de probabldad asocada a una varable aleatora dscreta... 4. Funcón de dstrbucón. Propedades... 5 4. Funcón de densdad... 7 5.

Más detalles

1. Variable aleatoria. Clasificación

1. Variable aleatoria. Clasificación Tema 7: Varable Aleatora Undmensonal 1. Varable aleatora. Clasfcacón. Caracterzacón de una varable aleatora. Varable Aleatora dscreta. Varable Aleatora contnua 3. Característcas de una varable aleatora.

Más detalles

AJUSTE DE LA CURVA DE PROBABILIDAD DEL ESCURRIMIENTO MEDIO HIPERANUAL ANUAL SEGÚN LA TEORÍA S B JOHNSON.

AJUSTE DE LA CURVA DE PROBABILIDAD DEL ESCURRIMIENTO MEDIO HIPERANUAL ANUAL SEGÚN LA TEORÍA S B JOHNSON. AJUSTE DE LA CURVA DE PROBABILIDAD DEL ESCURRIMIENTO MEDIO HIPERANUAL ANUAL SEGÚN LA TEORÍA S B JOHNSON. Revsta Voluntad Hdráulca No. 57, 98. Págnas 58-64 RESUMEN Se nforma sobre el desarrollo del método

Más detalles

Control de la exactitud posicional por medio de tolerancias

Control de la exactitud posicional por medio de tolerancias Control de la exacttud posconal por medo de tolerancas Francsco Javer Arza López José Rodríguez-Av María Vrtudes Alba Fernández Plan Estatal de Investgacón Centífca y Técnca y de Innovacón 2013-2016. Ref.:

Más detalles

17/02/2015. Ángel Serrano Sánchez de León

17/02/2015. Ángel Serrano Sánchez de León Ángel Serrano Sánchez de León 1 Índce Introduccón Varables estadístcas Dstrbucones esde frecuencas c Introduccón a la representacón gráfca de datos Meddas de tendenca central: meda (artmétca, geométrca,

Más detalles

Inferencia en Regresión Lineal Simple

Inferencia en Regresión Lineal Simple Inferenca en Regresón Lneal Smple Modelo de regresón lneal smple: Se tenen n observacones de una varable explcatva x y de una varable respuesta y, ( x, y)(, x, y),...,( x n, y n ) el modelo estadístco

Más detalles

VARIABLE ALEATORIA DISCRETA. DISTRIBUCIÓN BINOMIAL.

VARIABLE ALEATORIA DISCRETA. DISTRIBUCIÓN BINOMIAL. VARIABLE ALEATORIA DISCRETA. DISTRIBUCIÓN BINOMIAL. Concepto de varable aleatora. Se llama varable aleatora a toda aplcacón que asoca a cada elemento del espaco muestral de un expermento, un número real.

Más detalles

TEMA 7. ANÁLISIS DE SUPERVIVENCIA

TEMA 7. ANÁLISIS DE SUPERVIVENCIA TEMA 7. ANÁLISIS DE SUPERVIVENCIA CONTENIDOS 7. Funcón de supervvenca. 7.2 Estmacón no paramétrca de la funcón de supervvenca. 7.2. Tempos de supervvenca dscretos. Estmador de Kaplan-Meer. 7.2.2 Tempos

Más detalles

INTRODUCCIÓN. Técnicas estadísticas

INTRODUCCIÓN. Técnicas estadísticas Tema : Estadístca Descrptva Undmensonal ITRODUCCIÓ Fenómeno determnsta: al repetrlo en déntcas condcones se obtene el msmo resultado. (Ejemplo: lómetros recorrdos en un ntervalo de tempo a una velocdad

Más detalles

I.E.S. Historiador Chabás -1- Juan Bragado Rodríguez

I.E.S. Historiador Chabás -1- Juan Bragado Rodríguez Problema La sguente tabla epresa la estatura en cm. de soldados: Talla 5 56 60 6 68 6 80 8 88 Soldados 6 86 50 8 95 860 85 6 9 a) Haz un hstograma que represente la estatura en metros de los soldados.

Más detalles

3 - VARIABLES ALEATORIAS

3 - VARIABLES ALEATORIAS arte Varables aleatoras rof. María B. ntarell - VARIABLES ALEATORIAS.- Generaldades En muchas stuacones epermentales se quere asgnar un número real a cada uno de los elementos del espaco muestral. Al descrbr

Más detalles

Tema 1: Análisis de datos unidimensionales

Tema 1: Análisis de datos unidimensionales Tema : Análss de datos undmensonales. Varables estadístcas undmensonales. Representacones gráfcas.. Característcas de las dstrbucones de frecuencas undmensonales.. Varables estadístcas undmensonales. Representacones

Más detalles

9Soluciones a los ejercicios y problemas

9Soluciones a los ejercicios y problemas 38 S a todos los datos de una dstrbucón le sumamos un msmo número, qué le ocurre a la meda? Y a la desvacón típca? Y s multplcamos todos los datos por un msmo número? Llamamos a al valor sumado a cada

Más detalles

Variable aleatoria: definiciones básicas

Variable aleatoria: definiciones básicas Varable aleatora: defncones báscas Varable Aleatora Hasta ahora hemos dscutdo eventos elementales y sus probabldades asocadas [eventos dscretos] Consdere ahora la dea de asgnarle un valor al resultado

Más detalles

Variables Aleatorias

Variables Aleatorias Varables Aleatoras VARIABLES ALEATORIAS. Varable aleatora. Tpos.... Dstrbucón de probabldad asocada a una varable aleatora dscreta... 4. Funcón de dstrbucón. Propedades... 5 4. Funcón de densdad... 7 5.

Más detalles

, x es un suceso de S. Es decir, si :

, x es un suceso de S. Es decir, si : 1. Objetvos: a) Aprender a calcular probabldades de las dstrbucones Bnomal y Posson usando EXCEL. b) Estudo de la funcón puntual de probabldad de la dstrbucón Bnomal ~B(n;p) c) Estudo de la funcón puntual

Más detalles

Tema 1: Estadística Descriptiva Unidimensional

Tema 1: Estadística Descriptiva Unidimensional Fenómeno determnsta: al repetrlo en déntcas condcones se obtene el msmo resultado. Fenómeno aleatoro: no es posble predecr el resultado. La estadístca se ocupa de aquellos fenómenos no determnstas donde

Más detalles

TRABAJO 1: Variables Estadísticas Unidimensionales (Tema 1).

TRABAJO 1: Variables Estadísticas Unidimensionales (Tema 1). TRABAJO 1: Varables Estadístcas Undmensonales (Tema 1). Técncas Cuanttatvas I. Curso 2016/2017. APELLIDOS: NOMBRE: GRADO: GRUPO: DNI (o NIE): A: B: C: D: En los enuncados de los ejerccos que sguen aparecen

Más detalles

Población 1. Población 1. Población 2. Población 2. Población 1. Población 1. Población 2. Población 2. Frecuencia. Frecuencia

Población 1. Población 1. Población 2. Población 2. Población 1. Población 1. Población 2. Población 2. Frecuencia. Frecuencia MAT-3 Estadístca I Tema : Meddas de Dspersón Facltador: Félx Rondón, MS Insttuto Especalzado de Estudos Superores Loyola Introduccón Las meddas de tendenca central son ndcadores estadístcos que resumen

Más detalles

EJERCICIO 1 1. VERDADERO 2. VERDADERO (Esta afirmación no es cierta en el caso del modelo general). 3. En el modelo lineal general

EJERCICIO 1 1. VERDADERO 2. VERDADERO (Esta afirmación no es cierta en el caso del modelo general). 3. En el modelo lineal general PRÁCTICA 6: MODELO DE REGRESIÓN MÚLTIPLE SOLUCIÓN EJERCICIO. VERDADERO. VERDADERO (Esta afrmacón no es certa en el caso del modelo general. 3. En el modelo lneal general Y =X β + ε, explcar la forma que

Más detalles

EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 20 DE JUNIO DE horas

EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 20 DE JUNIO DE horas EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 0 DE JUNIO DE 018 15.30 horas Prmer Apelldo: Nombre: DNI: Teléfono: Segundo Apelldo: Grupo y Grado: Profesor(a): e-mal: Pregunta 1 A B C En Blanco

Más detalles

DISTRIBUCIONES BIDIMENSIONALES

DISTRIBUCIONES BIDIMENSIONALES Matemátcas 1º CT 1 DISTRIBUCIONES BIDIMENSIONALES PROBLEMAS RESUELTOS 1. a) Asoca las rectas de regresón: y = +16, y = 1 e y = 0,5 + 5 a las nubes de puntos sguentes: b) Asgna los coefcentes de correlacón

Más detalles

MEDIDAS DE ASOCIACIÓN: COEFICIENTES DE CORRELACIÓN Y DE REGRESIÓN I.- Introducción En el tema I estudiamos las medidas descriptivas para una

MEDIDAS DE ASOCIACIÓN: COEFICIENTES DE CORRELACIÓN Y DE REGRESIÓN I.- Introducción En el tema I estudiamos las medidas descriptivas para una MEDIDAS DE ASOCIACIÓ: COEFICIETES DE CORRELACIÓ DE REGRESIÓ I.- Introduccón En el tema I estudamos las meddas descrptvas para una varable, y además, planteamos que tales meddas tambén exsten para dos o

Más detalles

Capítulo 2: ANALISIS EXPLORATORIO de DATOS Estadística Computacional 1º Semestre 2003

Capítulo 2: ANALISIS EXPLORATORIO de DATOS Estadística Computacional 1º Semestre 2003 Unversdad Técnca Federco Santa María Departamento de Informátca ILI-80 Capítulo : ANALISIS EXPLORATORIO de DATOS Estadístca Computaconal º Semestre 003 Profesor :Héctor Allende Págna : www.nf.utfsm.cl/~hallende

Más detalles

Análisis del caso promedio. Técnicas Avanzadas de Programación - Javier Campos 70

Análisis del caso promedio. Técnicas Avanzadas de Programación - Javier Campos 70 Análss del caso promedo Técncas Avanzadas de Programacón - Javer Campos 70 Análss del caso promedo El plan: Probabldad Análss probablsta Árboles bnaros de búsqueda construdos aleatoramente Tres, árboles

Más detalles

Nos interesa asignar probabilidades a valores numéricos obtenidos a partir de fenómenos aleatorios, es decir a variables aleatorias.

Nos interesa asignar probabilidades a valores numéricos obtenidos a partir de fenómenos aleatorios, es decir a variables aleatorias. Estadístca (Q) Dana M. Kelmansky 5 Varables Aleatoras Nos nteresa asgnar probabldades a valores numércos obtendos a partr de fenómenos aleatoros, es decr a varables aleatoras. Por ejemplo, calcular la

Más detalles

VARIABLE ALEATORIA DISCRETA. DISTRIBUCIÓN BINOMIAL.

VARIABLE ALEATORIA DISCRETA. DISTRIBUCIÓN BINOMIAL. VARIABLE ALEATORIA DISCRETA. DISTRIBUCIÓN BINOMIAL. Concepto de varable aleatora. Se llama varable aleatora a toda aplcacón que asoca a cada elemento del espaco muestral de un epermento, un número real.

Más detalles

2 Dos tipos de parámetros estadísticos

2 Dos tipos de parámetros estadísticos Dos tpos de parámetros estadístcos Págna 198 1. Calcula la meda, la medana y la moda de cada una de estas dstrbucones estadístcas: a) 4, 5, 6, 6, 6, 6, 7, 11, 1, 17 b), 1, 6, 9,, 8, 9,, 14, c), 3, 3, 3,

Más detalles

1º. a) Deducir la expresión de la fórmula de derivación numérica de tipo x,x,x,x,.

1º. a) Deducir la expresión de la fórmula de derivación numérica de tipo x,x,x,x,. º. a Deducr la expresón de la fórmula de dervacón numérca de tpo x,x,x,x,. nterpolatoro que permte aproxmar f (x* con el soporte { } 3 x 4 b Demostrar que en el caso de que el soporte sea de la forma:

Más detalles

TEMA 3. VARIABLE ALEATORIA

TEMA 3. VARIABLE ALEATORIA TEMA 3. VARIABLE ALEATORIA 3.. Introduccón. 3... Dstrbucón de Probabldad de una varable aleatora 3... Funcón de Dstrbucón de una varable aleatora 3.. Varable aleatora dscreta 3... Funcón masa de probabldad

Más detalles

ESTADÍSTICA. Definiciones

ESTADÍSTICA. Definiciones ESTADÍSTICA Defncones - La Estadístca es la cenca que se ocupa de recoger, contar, organzar, representar y estudar datos referdos a una muestra para después generalzar y sacar conclusones acerca de una

Más detalles

Licenciatura en Administración y Dirección de Empresas INTRODUCCIÓN A LA ESTADÍSTICA EMPRESARIAL

Licenciatura en Administración y Dirección de Empresas INTRODUCCIÓN A LA ESTADÍSTICA EMPRESARIAL INTRODUCCIÓN A LA ESTADÍSTICA EMPRESARIAL Relacón de Ejerccos nº 2 ( tema 5) Curso 2002/2003 1) Las cento trenta agencas de una entdad bancara presentaban, en el ejercco 2002, los sguentes datos correspondentes

Más detalles

MATEMÁTICAS para estudiantes de primer curso de facultades y escuelas técnicas

MATEMÁTICAS para estudiantes de primer curso de facultades y escuelas técnicas Unversdad de Cádz Departamento de Matemátcas MATEMÁTICAS para estudantes de prmer curso de facultades y escuelas técncas Tema 13 Dstrbucones bdmensonales. Regresón y correlacón lneal Elaborado por la Profesora

Más detalles

Tema 1.3_A La media y la desviación estándar

Tema 1.3_A La media y la desviación estándar Curso 0-03 Grado en Físca Herramentas Computaconales Tema.3_A La meda y la desvacón estándar Dónde estudar el tema.3_a: Capítulo 4. J.R. Taylor, Error Analyss. Unv. cence Books, ausalto, Calforna 997.

Más detalles

Estimación de incertidumbres en calibración de Osciladores

Estimación de incertidumbres en calibración de Osciladores Estmacón de ncertdumbres en calbracón de Oscladores J. Maurco López R. Dvsón de Tempo Frecuenca Centro Naconal de Metrología maurco.lopez@cenam.mx Resumen La frecuenca de salda de los oscladores debe ser

Más detalles

Un ejemplo de Análisis Factorial de Correspondencias

Un ejemplo de Análisis Factorial de Correspondencias Estadístca Anàls de Dades (curs 001-00) Un ejemplo de Análss Factoral de Correspondencas Se trata de estudar la estructura de las ventas de una empresa que dstrbuye 10 productos en 8 mercados. Para ello

Más detalles

PyE_ EF2_TIPO1_

PyE_ EF2_TIPO1_ UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉICO FACULTAD DE INGENIERÍA DIVISIÓN DE CIENCIAS BÁSICAS COORDINACIÓN DE CIENCIAS APLICADAS DEPARTAMENTO DE PROBABILIDAD Y ESTADÍSTICA SEGUNDO EAMEN FINAL RESOLUCIÓN SEMESTRE

Más detalles

Ejercicios y Talleres. puedes enviarlos a

Ejercicios y Talleres. puedes enviarlos a Ejerccos y Talleres puedes envarlos a klasesdematematcasymas@gmal.com www.klasesdematematcasymas.com EJERCICIOS DE REGRESIONES Y ANALISIS DE COVARIANZA Analzar la nformacón recoplada por medo de los dferentes

Más detalles

SOLUCIONES A LOS EJERCICIOS DE LA UNIDAD

SOLUCIONES A LOS EJERCICIOS DE LA UNIDAD Pág. 1 Págna 0 PRACTICA Meda y desvacón típca 1 Las edades de los estudantes de un curso de nformátca son: 17 17 18 19 18 0 0 17 18 18 19 19 1 0 1 19 18 18 19 1 0 18 17 17 1 0 0 19 0 18 a) Haz una tabla

Más detalles

EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 17 de Mayo de :00 horas

EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 17 de Mayo de :00 horas EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 7 de Mayo de 08 9:00 horas Prmer Apelldo: Nombre: DNI: Teléfono: Segundo Apelldo: Grupo y Grado: Profesor(a): e-mal: Pregunta A B C En Blanco

Más detalles

ESTADÍSTICA BIDIMENSIONAL ÍNDICE GENERAL

ESTADÍSTICA BIDIMENSIONAL ÍNDICE GENERAL ESTADÍSTICA BIDIMESIOAL ÍDICE GEERAL 1.-Varable Estadístca Bdmensonal. Tablas de frecuenca... 1.1.- Concepto de varable estadístca bdmensonal. Eemplos.... 1..-Tablas bdmensonales de frecuencas. Tablas

Más detalles

ACTIVIDADES ESTADÍSTICA UNIDIMENSIONAL. a) Calcula la temperatura media y la temperatura mediana de la semana.

ACTIVIDADES ESTADÍSTICA UNIDIMENSIONAL. a) Calcula la temperatura media y la temperatura mediana de la semana. Matemátcas Aplcadas a las Cencas Socales I ACTIVIDADES ESTADÍSTICA UNIDIMENSIONAL 1) Se ha meddo la temperatura en grados centígrados la presón atmosférca en mm en una cudad durante una semana obtenéndose

Más detalles

Prueba de Evaluación Continua

Prueba de Evaluación Continua Estadístca Descrptva y Regresón y Correlacón Prueba de Evaluacón Contnua 1-III-18 1.- Dada la varable x y la nueva varable y=a+bx, ndcar (demostrándolo) la expresón exstente entre las respectvas medas

Más detalles

TEMA 1.- CONCEPTOS BÁSICOS

TEMA 1.- CONCEPTOS BÁSICOS TEMA 1.- CONCEPTOS BÁSICOS 1.1.- Cuestones tpo test 1.- En las encuestas personales puede codfcarse, por ejemplo, con un cero las que son contestadas por una mujer y con un uno las que lo son por un varón.

Más detalles