Sobre los intervalos de confianza y de predicción Javier Santibáñez 7 de abril de 2017

Sobre los itervalos de cofiaza y de predicció Javier Satibáñez 7 de abril de 2017 Itervalos de cofiaza Se costruye itervalos de cofiaza para los parámetros poblacioales. Supogamos que teemos ua muestra aleatoria X = {X 1,..., X } de ua població F x θ), co θ fijo pero descoocido. U itervalo de cofiaza 1001 α)% para θ está formado por dos estadistícos LX) y UX) tales que P LX) θ UX)) 1 α Por ejemplo, cosiderar ua muestra aleatoria X = {X 1,..., X } de ua població Nµ, σ 2 ), co µ y σ 2 descoocidos. De los cursos de iferecia estadística, se sabe que X µ ) S t 1 dode X = 1 i=1 X i y S 2 = 1) 1 i=1 Xi X ) 2. De lo aterior, se sigue que los estadísticos so tales que L X) = X t α/2) 1 S 2 / U X) = X + t α/2) 1 S 2 / P LX) µ UX)) = 1 α Ejemplo. Itervalo para la media de ua població ormal. Cosideremos ua realizació de ua muestra aleatoria de tamaño 15 de ua població N5, 1). set.seed1010) x <- rorm15, 5, 1); x ## [1] 5.131541 4.102090 6.351945 5.420075 4.711540 6.364561 6.938725 ## [8] 2.639017 4.405886 4.455447 4.804092 4.169927 3.564619 4.923929 ## [15] 5.725868 x <- meax); x ## [1] 4.913951 s <- varx); s ## [1] 1.283195 Calculamos los estadísticos LX) y UX) co α = 0.05 para esta muestra e particular. lx <- x - qt0.975, 14) * sqrts / 15); lx ## [1] 4.286637 1

ux <- x + qt0.975, 14) * sqrts / 15); ux ## [1] 5.541265 Los resultados so Lx) = 4.29 y Ux) = 5.54. Qué sigifica esto? Iterpretació de los itervalos de cofiaza Ua vez que se observa la muestra X = x, el euciado Lx) θ Ux) ya o es probabilista, puesto que todas las catidades so fijas. Segú la iterpretació frecuetista de la probabilidad, si repitieramos el experimeto que geeró los datos, u úmero grade de veces, el itervalo Lx), Ux)) cotedría a µ e el 95% de los casos. Ua vez que se observa los datos, el itervalo es fijo, por lo que de coocer el verdadero valor del parámetro, se podría decidir si está o o icluido e el itervalo. Si embargo o se cooce, por ello eso de la cofiaza e que el itervalo observado sea uo de los que cotiee al verdadero valor del parámetro. Ejemplo cotiuació) El euciado µ está etre 4.29 y 5.54 co ua cofiaza del 95%, es correcto. Si embargo, esto sigifica que cofiamos e que el itervalo 4.29, 5.54) sea uo de los que sí cotiee a µ. Como coocemos el verdadero valor de µ sabemos que el itervalo observado sí cotiee al parámetro. Co el siguiete código se simula 5000 muestras de la població N5, 1), co cada realizació se calcula Lx) y Ux) y se verifica si cotiee al parámetro µ. vx <- c); vs <- c) for i i 1:5000){ muestra <- rorm15, 5, 1) vx[i] <- meamuestra) vs[i] <- varmuestra) } vlxc <- vx - qt0.975, 14)*sqrtvs/15) vuxc <- vx + qt0.975, 14)*sqrtvs/15) auxc <- vlxc <= 5) & 5 <= vuxc) cobertura <- 100*sumauxc)/5000); cobertura ## [1] 94.62 El resultado es que e el 94.6 % de los casos el parámetro está coteido e el itervalo calculado, que es aproximadamete el 95% que se esperaba. A cotiuació se represeta graficamete 100 de los itervalos simulados se puede ver como sólo e 7 casos los el itervalo o cotiee a µ, que dista poco de los 5 que se esperaba. 2

3.5 4.0 4.5 5.0 5.5 6.0 6.5 Itervalos de predicció Se costruye itervalos de cofiaza para variables aleatorias. Supogamos que teemos ua muestra aleatoria X de ua població F x θ) y se quiere predecir el valor de ua ueva observació X ew a partir de la ifromació de la muestra observada. Formalmete X ew X por lo que toda la iformació sobre X ew se obtiee del hecho que viee de u població F x θ). Como θ es descoocido, es ecotrar dos estadísticos, fucioes de X cuya distribució o depeda de los parámetros descoocidos. U itervalo de cofiaza está formado por dos estadísticos L p X) y U p X) tales que P L p X) X ew U p X)) 1 α Ua vez observada la muestra, X = x, el euciado L p x) X ew U p x) aú es probabilista, puesto que X ew es ua variable aleatoria. Si embargo, o ecesariamete P L p x) X ew U p x)) 1 α Por lo que el itervalo observado L p x), U p x)) o es u itervalo de probabilidad 1 α para X ew. Como se asume que X ew es idepediete de X, se sigue que Etoces, X ew X N 0, σ 2 1 + 1 )). Por lo tato, los estadísticos X ew X ) t S 2 1 1 + 1 L p X) = X t α/2) 1 U p X) = X + t α/2) 1 S 2 S 2 1 + 1 ) 1 + 1 ) 3

so tales que P L p X) X ew U p X)) = 1 α Ejercicio de simulació Co la muestra del ejemplo aterior se calcula u itervalo de cofiaza para ua ueva observació como sigue: lx <- x - qt0.975, 14)*sqrts*1+1/15)); lx ## [1] 2.404696 ux <- x + qt0.975, 14)*sqrts*1+1/15)); ux ## [1] 7.423206 El itervalo que resulta es L p x) = 2.4 y Ux) = 7.42. Qué sigifica estos resultados? Iterpretació de los resultados Como se mecioó ateriormete, el itervalo o es de probabilidad para X ew. El euciado, ua ueva observació X ew estará etre 2.4 y 7.42 co probabilidad 0.95 es falso, porque como X ew N5, 1), tal probabilidad es 0.99. La iterpretació correcta es e térmios de la cofiaza. El euciado ua ueva observació X ew estará etre 2.4 y 7.42 co 95% de cofiaza es la iterpretació correcta. Qué sigifica la emph e predicció? la iterpretació es la siguiete, si repetimos el experimeto que geeró a x u úmero grade de veces, para cada repetició observamos X ew, y verificamos si x ew está coteida o o e el itervalo L p x), U p x)); se espera que e el 95% de las repeticioes el itervalo de predicció cubra a x ew. Por lo tato, los itervalos de predicció tambié so itervalos de cofiaza. Co el siguiete código se simula 5000 muestras de la població N5, 1), co cada realizació se calcula L p x) y U p x), se simuala 5000 uevas observacioes de la població y se verifica si cada realizació de L p x) y U p x) cotiee a la observació de X ew que correspde. vx <- c); vs <- c) for i i 1:5000){ muestra <- rorm15, 5, 1) vx[i] <- meamuestra) vs[i] <- varmuestra) } vlxp <- vx - qt0.975, 14)*sqrtvs*1+1/15)) vuxp <- vx + qt0.975, 14)*sqrtvs*1+1/15)) xew <- rorm5000, 5, 1) auxp <- vlxp <= xew) & xew <= vuxp) cobertura <- 100*sumauxp)/5000); cobertura ## [1] 95.1 El resultado es que e el 95.1 % de los casos el parámetro está coteido e el itervalo calculado, que es aproximadamete el 95% que se esperaba. A cotiuació se represeta graficamete 100 de los itervalos simulados se puede ver como sólo e 4 casos los el itervalo o cotiee a la ueva observació, que dista poco de los 5 que se esperaba. 4

2 3 4 5 6 7 8 Difecias etre predicció y cofiaza Lo primero que se debe otar es que los itervalos de predicció para ua ueva observació so más amplios que los itervalos de cofiaza para los parámetros descoocidos. Por qué? El tamaño del itervalo de cofiaza para el parámetro θ depede de la icertidumbre de la estimació que hacemos a partir de ua muestra. Mietras que el tamaño del itervalo de predicció para ua ueva observació tiee dos fuetes de icertidumbre, ua debida a la estimació de los parámetros descoocidos y la otra es propia de la aleatoriedad que supoemos, proque se debe recordar que esa ueva observació es ua variable aleatoria!. Cofiaza Predicció 2 3 4 5 6 7 8 2 3 4 5 6 7 8 Para eteder mejor la diferecia etre cada tipo de itervalo, cosideremos el caso extremo e que coocemos los verdaderos parámetros de la població. E tal caso, se elimia completamete la icertidumbre sobre µ, por lo que o tedría setido costuir u itervalo de cofiaza para este parámetro. Mietras que ua ueva observació aú es aleatoria, porque ese es uestro supuesto, etoces aú podríamos costruir u itervalo de predicció. 5