Simulació Fiaciera Pruebas Estadísticas No Paramétricas Para modelos estadísticos, pruebas estadísticas e iferecia o paramétrica. Estos so métodos libres de distribució, es decir, o se basa e supuestos de que los datos provega de ua distribució de probabilidad determiada. So importates e la ecoometría porque co frecuecia o se cooce los parámetros de las series de tiempo co las que se trabaja. El termio estadístico o paramétrico tambié puede hacer referecia a u estadístico (fució sobre ua muestra) cuya iterpretació o depede de que la població se ajuste a cualquier distribució parametrizada. Estos métodos se usa cuado los datos tiee u rakig pero o ua iterpretació umérica clara, Ej. Las preferecias. Como hace pocos supuestos, su aplicació es más amplia que los métodos paramétricos. Se aplica e situacioes dode se cooce poco sobre la aplicació e cuestió. Además, por basarse e meos supuestos, estos métodos so más robustos. Tambié so más simples de implemetar. Auque e alguas situacioes se justifique la caracterizació de parámetros, los métodos o paramétricos so más fáciles de usar. Todo esto deja poco espacio para el mal uso y mal iterpretació. (mayor objetividad) Los modelos o paramétricos difiere de los modelos paramétricos e que la estructura del modelo o es especificada a priori, si o que es determiada co los datos. Esto o sigifica que el modelo carezca de parámetros, si o que el úmero y aturaleza de los parámetros es flexible y o fijada e adelato. Muchas pruebas de bodad de ajuste o parametricas se basa e la estimació de míima distacia cotrastado la estimació de máxima verosimilitud e las paramétricas. U histograma es u estimado o paramétrico simple de ua distribució de probabilidad. La estimació de desidad kerel (Kerel desity estimatio - Parze widow) provee mejores estimados de la desidad que los histogramas. La regresió o paramétrica y semi-paramétrica se basa e kerels, splies, y wavelets. Métodos: Coeficiete de correlació de ragos Spearma Ma-Whitey U Kruskal-Wallis aálisis de variaza (ANOVA) de ua vía Friedma aálisis de variaza (ANOVA) de dos vías Prueba Durbi Prueba de corridas Wald-Wolfowitz Prueba Kolmogorov-Smirov Prueba Aderso-Darlig Métodos utilizados como complemetos: Estadístico Durbi-Watso (detecta la presecia de autocorrelació e los residuos de u aálisis de regresió solo valido para regresores estocásticos) Prueba LM de correlació serial Breusch-Godfrey (más geeral y complemeto de DW) Prueba Jarque-Bera (bodad de ajuste que mide discrepacia co ormalidad basada e la custosis y asimetría de la muestra) Prueba χ 2 (básica)
Simulació Fiaciera Estimació de míima distacia Es u método estadístico para ajustar u modelo matemático a datos, usualmete la distribució empírica. La prueba Kolmogorov-Smirov utiliza el supremo (máximo) de la diferecia absoluta etre la distribució empírica y el estimado. La prueba Aderso-Darlig es similar a la KS, pero e vez de utilizar el puto de diferecia máxima etre la distribució empirica y el estimado, utiliza pesos suaves basados e itegració de diferecias sobre el itervalo completo y luego pesado por el reciproco de la variaza. Fució de distribució empirica (f.d.e.) Es ua fució de distribució de probabilidad acumulada que cocetra probabilidad / e cada úmeros e la muestra. Sea X,,X ua variable aleatoria i.i.d. e R co f.d.c. F(x). La fució de distribució empirica F (x) basada e la muestra X,,X es ua fució step (escalera) defiida por úmero de elemetos e la muestra x F = = I ( Xi x) dode I(A) es el idicador del eveto A. Para x fija, I(X i x) es ua variable aleatoria Beroulli co parámetro p = F(x), por ede F (x) es ua variable aleatoria Biomial co media F(x) y variaza F(x)( - F(x)). Propiedades asitóticas Por la ley fuerte de los úmeros grades F (x) a.s. F(x) para x fija. D Por el teorema del límite cetral ( F x) ) N( 0, F( x)( x)) ). El teorema Berry-Essée provee la tasa de esta covergecia. Kolmogorov demostró que F x) coverge e distribució a la distribució Kolmogorov, provisto que F(x) es cotiua. La prueba Kolmogorov-Smirov de bodad de ajuste se basa e este hecho. Fució característica (idicadora) Es ua fució defiida sobre el cojuto X que idica la membresía de u elemeto del subcojuto A de X. A (x) = si x A, 0 si x A. Se relacioa al cocepto de las variables dummy (e aálisis de regresió, estadística o cofudir co el sigificado del térmio e matemáticas, variable libre).
Simulació Fiaciera Prueba Kolmogorov-Smirov La prueba KS es ua forma de estimació de míima distacia usada como prueba o paramétrica de igualdad de distribucioes de probabilidad uidimesioales, utilizada para comparar ua muestra co ua distribució de probabilidad de referecia (KS -muestra), o para comparar dos muestras (KS 2-muestra). El estadístico KS cuatifica ua distacia etre la fució de distribució empirica de la muestra y la fució de distribució acumulada de la distribució de referecia, o etre las fucioes de distribució empirica de dos muestras. La distribució ula (distribució de probabilidad del estadístico de prueba cuado la H 0 es verdadera) de este estadístico es calculada bajo la hipótesis ula que las muestras so extraídas de la misma distribució (e el caso de 2-muestra) o que la muestra es extraída de la distribució de referecia (e el caso -muestra). E cada caso, las distribucioes cosideradas bajo la H 0 so distribucioes cotiuas si restriccioes. La prueba KS se puede modificar para servir como prueba de bodad de ajuste. E el caso especial de probar la ormalidad de la distribució, muestras so estadarizadas y comparadas co la distribució ormal estádar. Esto es equivalete a cuadrar la media y variaza de la distribució de referecia igual a los estimados muestral, y es sabido que utilizar la muestra para modificar la H 0 reduce la potecia de la prueba. La prueba Lilliefors es ua adaptació que iteta corregir este sesgo, pero o es ta potete como la AD. La fució de distribució empirica F para i.i.d. observacioes X i es defiida como F = I( Xi x) dode I(X i x) es igual a si X i x ; y 0 e cualquier otro caso. El estadístico KS para ua f.d.c. F(x) dada es D = sup F x) dode sup S es el supremo del cojuto S. Por el teorema x Gliveko-Catelli, si la muestra proviee de la distribució F(x), etoces D a.s. 0. Kolmogorov fortaleció este resultado proveyedo efectivamete la tasa de esta covergecia. El teorema Dosker provee u resultado más fuerte (utilizado el limite del proceso G como u proceso Gaussiao). La distribució Kolmogorov es la distribució de la variable aleatoria K = sup B( t) dode B(t) es el Browia bridge (proceso estocástico tiempo cotiuo, t [0,] cuya distribució de probabilidad es la distribució de probabilidad codicioal de u proceso Wieer B(t) Browia motio dada la codició B(0) = B() = 0). La f.d.c. de K esta dada 2 2 2 2 2 i 2i x 2π (2i ) π /(8x ) por P( K x) = 2 ( ) e = e x
Simulació Fiaciera Prueba KS Bajo la hipótesis ula que la muestra proviee de ua distribució hipotética F(x), D sup B( F( t)) coverge e distribució, dode B(t) es el Browia bridge. t Si F es cotiua, etoces bajo la hipótesis ula D coverge a la distribució Kolmogorov, la cual o depede de F. Este resultado se cooce como el teorema de Kolmogorov (existe otros teoremas de Kolmogorov e otras áreas de la matemática). La bodad de ajuste, o prueba KS, es costruida utilizado los valores críticos de la distribució de Kolmogorov. La H 0 se rechaza para el ivel α si D > K α ; dode K α se ecuetra de P(K K α ) = α. La potecia asitótica de esta prueba es. Si la forma o parámetros de F(x) so determiados de X i, la iigualdad puede o sosteerse. E este caso, métodos de Mote Carlo so requeridos para determiar el ivel de rechazo de α. Prueba KS 2-muestra La prueba KS se puede utilizar para probar si dos distribucioes de probabilidad uidimesioales subyacetes difiere. E este caso el estadístico KS es D, = sup F F y la H 0 se rechaza para el ivel α si D, > Kα x + Limites de cofiaza para la forma de la fució de distribució Mietras que la prueba KS es usualmete usada para probar si ua F(x) dada es la distribució de probabilidad subyacete de F (x), el procedimieto puede ser ivertido para dar limites de cofiaza e F(x) misma. Si se elige u valor critico del estadístico de prueba D α tal que P(D > D α ) = α ; etoces ua bada de acho ± D α alrededor de F (x) cotedrá e su totalidad a F(x) co probabilidad α. Casos dode se utiliza la prueba KS La prueba KS se utiliza e casos dode, por ejemplo, o se deba cofiar e la prueba t de Studet. A pesar del teorema del limite cetral, existe situacioes e dode es u error cofiar e la prueba t. Situacioes dode los grupos muestrales o difiere e media, pero si difiere e otra medida, Ej. Sustacialmete e variabilidad. Esos grupos de datos so diferetes pero la prueba t o vería la diferecia. Situacioes dode los grupos muestrales so muy pequeños (Ej. < 20) que difiere e media, pero distribucioes o-ormales cubre la diferecia. Ej. Dos sets proveietes extraídos de distribucioes logormales co medias sustacialmete distitas. Para cojutos de datos grades, el TLC sugiere que la prueba t produce resultados validos au cuado los datos o se distribuye ormalmete. Si embargo, sets de datos altamete o-ormales causa que la prueba t arroje resultados fallidos, au para N grade.
Simulació Fiaciera Ilustració gráfica de la prueba KS La prueba KS esta basada e la máxima distacia etre estas dos curvas. Limitacioes de la prueba KS Solo aplica a distribucioes cotiuas. Tiede a ser más sesible cerca del cetro de la distribució que e las colas. La distribució tiee que estar totalmete especificada. Es decir, si localizació, escala, y parámetros de forma so estimados de los datos, la regió crítica de la prueba KS ya deja de ser valida. Se debe determiar por simulació. Es por esto que la prueba de bodad de ajuste AD es preferible, auque solo se puede usar para pocas distribucioes especificas.
Simulació Fiaciera Prueba Aderso-Darlig La prueba AD es ua forma de estimació de míima distacia, y uo de los estadísticos más potetes para detectar discrepacia co respecto a ormalidad. Se puede utilizar co u tamaño muestral bajo ( 25). Tamaños muestrales muy grades puede rechazar el supuesto de ormalidad co ta solo pequeñas imperfeccioes. La prueba AD ve si la muestra proviee de ua distribució específica. La fórmula del estadístico A para ver si los datos proviee de ua distribució co f.d.c. F es A 2 = S. Para ello, los datos {Y < < Y } debe estar ordeados. S 2k = k= [ l F( Y ) + l( Y ))] k + k El estadístico de prueba puede etoces ser comparado cotra los valores críticos de la distribució teórica (depediedo de que F es utilizada) para determiar el p-valor. La prueba AD para ormalidad es ua prueba de distacia o prueba de fució de distribució empirica. Esta basada e el cocepto de que cuado se da ua distribució subyacete hipotética, los datos puede ser trasformados a ua distribució uiforme. Los datos muestrales trasformados puede etoces ser probados para uiformidad co ua prueba de distacia. Procedimieto Esta explicació esta basada e ua prueba para ua distribució ormal Los datos X i para i =,, de la variable X que se quiere probar se orgaiza ascedetemete (meor a mayor). La media X y desviació estádar s so calculadas para la muestra X. Los X X valores X i se estadariza como Y i i =. Co la f.d.c. ormal estádar Φ, A 2 se calcula s como A 2 = S = (2i ) Y i Y + i 44444444 2444444443 [ lφ( ) + l( Φ( ))] [(2i )l Φ( Y ) + (2( i) + ) l( Φ( ))] i Y i La prueba es uidireccioal (ua cola), etoces si el estadístico A es mayor al valor critico, se rechaza la hipótesis ula de que la distribució sigue ua forma especifica.
Simulació Fiaciera Si la desviació estádar s = 0 ó Φ(Y i ) = (0 ó ), etoces A 2 o puede ser calculado y es idefiido. (otar que lim LX = ). Cualquier otra distribució teórica se puede asumir x 0 utilizado la respectiva f.d.c. Cada distribució teórica tiee sus propios valores críticos. La H 0 sigue la verdadera distribució (e el ejemplo N(0,) ). La prueba AD es ua modificació de la prueba KS y da mayor peso a las colas que KS. La KS es libre de distribució e el setido que los valores críticos o depede e la distribució específica que se está probado. La AD hace uso de la distribució específica al calcular los valores críticos. Esto tiee la vetaja de permitir ua prueba más sesible y la desvetaja de teer que calcular los valores críticos para cada distribució.