ESTIMACIÓN PUNTUAL. ESTIMACIÓN POR INTERVALOS DE CONFIANZA. 1. INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA El objetivo básico de la iferecia estadística es hacer iferecias o sacar coclusioes sobre la població a partir de la iformació coteida e ua muestra aleatoria de la població. Más específicamete, podemos decir que la iferecia estadística cosiste e el proceso de selecció y utiliació de u estadístico muestral, mediate el cual, utiliado la iformació que os proporcioa ua muestra aleatoria, os permite sacar coclusioes sobre características poblacioales. Cualquier iferecia o coclusió obteida de la població, ecesariamete, estará basada e u estadístico muestral, es decir, e la iformació proporcioada por la muestra (formalmete defiimos u estadístico como ua fució de las observacioes muestrales). La elecció del estadístico apropiado depederá de cuál sea el parámetro poblacioal que os iterese. El valor verdadero del parámetro será descoocido y u objetivo sería estimar su valor, por lo que tal estadístico se deomia estimador. Las iferecias sobre el valor de u parámetro poblacioal θ se puede obteer básicamete de dos maeras: a partir de estimació o bie a partir del cotraste de hipótesis. E la estimació, basta seleccioar u estadístico muestral cuyo valor se utiliará como estimador del valor del parámetro poblacioal. E el cotraste de hipótesis, se hace ua hipótesis sobre el valor del parámetro θ y se utilia la iformació proporcioada por la muestra para decidir si la hipótesis se acepta o o. Ambos métodos de iferecia estadística utilia las mismas relacioes teóricas etre resultados muestrales y valores poblacioales. Así pues, ua muestra es sacada de la població y u estadístico muestral es utiliado para hacer iferecias sobre el parámetro poblacioal. E estimació, la iformació muestral es utiliada para estimar el valor del parámetro θ. E el cotraste de hipótesis, primero se formula la hipótesis sobre el valor de θ y la iformació muestral se utilia para decidir si la hipótesis formulada debería ser o o rechaada. Pero cuado se utilia la iferecia para estimar u parámetro poblacioal debemos decir cómo de buea es esa iferecia, o sea debemos dar ua medida de su bodad. Para ello será ecesario coocer la diferecia existete etre la estimació del parámetro poblacioal, calculada a partir de ua muestra específica de tamaño, y el valor verdadero del parámetro poblacioal.. EL PROBLEMA DE LA ESTIMACIÓN: ESTIMACIÓN PUNTUAL La estimació estadística se divide e dos grades grupos: la estimació putual y la estimació por itervalos. La estimació putual cosiste e obteer u úico úmero calculado a partir de las observacioes muestrales, y que es utiliado como estimació del valor del parámetro θ. Se le llama estimació putual porque a ese úmero, que se utilia como estimació del parámetro θ, se le puede asigar u puto sobre la recta real. E la estimació por itervalos se obtiee dos putos ( u extremo iferior y u extremo superior) que defie u itervalo sobre la recta real, el cual cotedrá co cierta seguridad el valor del parámetro θ. El estimador del parámetro poblacioal θ es ua fució de las variables aleatorias u observacioes muestrales y se represeta por =g ( X1, X,..., X ) Para ua realiació particular de la muestra ( x1, x,..., x ) se obtiee u valor específico del estimador que recibe el ombre de estimació del parámetro poblacioal θ y lo otaremos por = g ( x 1, x,..., x ) 1
Vemos pues que existe diferecia etre estimador y estimació. El estimador es u estadístico y, por tato, ua variable aleatoria y el valor de esta variable para ua muestra cocreta ( x1, x,..., x ) será la estimació putual. El estimador θ tedrá su distribució muestral. E la tabla.1 expresamos diferetes parámetros poblacioales, sus estimadores y sus estimacioes. Parámetro poblacioal Media Variaa Proporció p Estimador Estimació X i xi i1 i1 ˆ X x 1 1 ˆ S ( X i X ) s xi x 1 i1 1 i1 X úmeroéxitos x pˆ pˆ úmeropruebas TABLA.1 Parámetros poblacioales, estimadores y estimacioes. Para la elecció de estos estimadores putuales os hemos basado, pricipalmete e la ituició y e la posible aalogía de los parámetros poblacioales co sus correspodietes valores muestrales, pero éste o será el método más adecuado para la obteció de estimadores putuales, auque e este caso se obtiee estimadores satisfactorios para los parámetros poblacioales. E geeral, el problema de obteer estimadores putuales o será ta secillo, por ello teemos que dar propiedades que sería deseables que se cumpliera por los diferetes estimadores putuales obteidos, auque o existe u mecaismo o método úico que os permita obteer el mejor estimador putual e todas las circustacias. Nuestro objetivo ahora será dar alguas propiedades deseables de los estimadores putuales, co el fi de poder coocer la bodad de los mismos, pues cuatas más propiedades verifique los estimadores putuales mejores será. * PROPIEDADES DESEABLES DE LOS ESTIMADORES PUNTUALES a) Estimador isesgado Si teemos u gra úmero de muestras de tamaño y obteemos el valor del estimador e cada ua de ellas, sería deseable que la media de todas estas estimacioes coicidiera co el valor de μ. Se dice que u estimador es isesgado si su esperaa matemática coicide co el valor del parámetro a estimar. b) Estimador eficiete Se dice que los estimadores so eficietes cuado geera ua distribució muestral co el míimo error estádar,es decir, etre dos estimadores isesgados de u parámetro dado es más eficiete el de meor variaa.
c) Estimador cosistete U estimador se dice cosistete cuado su valor tiede hacia el verdadero valor del parámetro a medida que aumeta el tamaño de la muestra. Es decir, la probabilidad de que la estimació sea el verdadero valor del parámetro tiede a 1. d) Estimador suficiete Se dice de u estimador que es suficiete cuado es capa de extraer de los datos toda la iformació importate sobre el parámetro. 3. ESTIMACIÓN POR INTERVALOS La estimació putual es poco útil, pues solo obteemos u valor como aproximació al que tratamos de estimar. Es mucho más iteresate obteer u itervalo detro del cual se tiee ua cierta cofiaa de que se ecuetre el parámetro que tratamos de estimar. El objetivo que se pretede co los itervalos de cofiaa es obteer u itervalo de poca amplitud y co ua alta probabilidad de que el parámetro θ se ecuetre e su iterior. Así pues, elegiremos probabilidades cercaas a la uidad, que se represeta por 1-α y cuyos valores más frecuetes suele ser 0'90, 0'95 y 0'99. Luego si deseamos obteer ua estimació por itervalo del parámetro poblacioal θ descoocido, tedremos que obteer dos estadísticos X1, X,..., X y X1, X,..., X que os dará los valores extremos del itervalo, tales que P X1, X,..., X X1, X,..., X 1 Al valor 1-α se le llama coeficiete de cofiaa, y Al valor 100(1-α) % se le llama ivel de cofiaa. a) Itervalo de cofiaa para la proporció poblacioal. Si p represeta la proporció de éxitos e ua muestra aleatoria de tamaño suficietemete grade y q=1-p, etoces u itervalo de cofiaa aproximado para la proporció poblacioal p al ivel de cofiaa del 100(1-α)% viee dado por: pˆ(1 pˆ) pˆ(1 pˆ) pˆ pˆ, e dode / es tal que P[Z> / ]= y la variable aleatoria Z sigue ua distribució N(0,1). 3
b) Itervalo de cofiaa para la media de ua població ormal, siedo σ coocida Supogamos que teemos ua muestra aleatoria de observacioes de ua distribució N(μ, σ). Si σ es coocida, y la media muestral observada es x, etoces el itervalo de cofiaa para la media poblacioal μ, al ivel de cofiaa del 100(1-α)% viee dado por: dode / es tal que x, x / / P( Z /) y la variable aleatoria Z N(0,1). c) Itervalo de cofiaa para la media de ua població ormal, siedo σ descoocida y <30. Supogamos que teemos ua muestra aleatoria de <30 observacioes de ua distribució N(μ,σ). Si σ es descoocida, y la media y la desviació típica muestral observadas so x y s, respectivamete, etoces el itervalo de cofiaa para la media poblacioal μ, al ivel de cofiaa del 100(1-α)% viee dado por: s s x t/, x t/ dode t / es tal que Pt 1 t / y la variable 1 t sigue ua distribució t-studet co -1 grados de libertad. d) Itervalo de cofiaa para la variaa de ua població ormal. Supogamos ua muestra aleatoria de observacioes de ua distribució N(μ,σ). Si σ es descoocida y la variaa muestral observada es s etoces el itervalo de cofiaa para la variaa poblacioal al ivel de cofiaa del 100(1-α)% viee dado por: ( 1)ˆ s ( 1)ˆ s, 1, / 1,1 / dode es tal que: 1,1 / y es tal que: 1, / P 1 1,1 / P 1 1, / 1 4
y la variable aleatoria sigue ua distribució 1 de Pearso co -1 grados de libertad. e) Itervalo de cofiaa para la diferecia de medias e poblacioes ormales idepedietes Supogamos dos muestras idepedietes de tamaño x y y procedetes de poblacioes ormales. N x, x y y, y N, respectivamete. Si las medias para las muestras observadas so x e y, etoces u itervalo de cofiaa, al ivel de cofiaa del 100(1-α)%, para las diferecias de medias poblacioales x y viee dado por: ( x y) x y /,( x y) x y / x y x y e dode / es el úmero tal que: P Z / y la variable aleatoria Z sigue ua N(0, 1). 4. ESTIMACIÓN DEL TAMAÑO MUESTRAL Sabemos que si tomamos ua muestra aleatoria simple de tamaño procedete de ua població N(μ,σ), siedo σ coocida, el itervalo de cofiaa al ivel del 100(1-α)% para la media poblacioal μ veía dado por: I x /, x / Siedo la amplitud del itervalo L ( x / ) ( x / ) / (*) Si, previamete, se fija la logitud del itervalo L y deseamos coocer el tamaño de la muestra para obteer ese itervalo al ivel de cofiaa del 100(1-α)%, bastará despejar de la expresió (*), pues L, y σ so coocidos, y tedremos que el tamaño de la muestra será: / 4 L / el cual os permitirá costruir u itervalo al ivel de cofiaa del 100(1-α)% y de amplitud L para la media de ua població ormal co σ coocida. Tambié podríamos hacer el siguiete raoamieto cuado σ sea coocido, si la media μ fuera el valor cetral del itervalo, etoces x estimaría putualmete a μ si error alguo, 5
x x μ --------------------------- ---------------- --------------------------- error / x / Pero geeralmete x o será exactamete igual a μ y etoces se comete u error, E= x -μ, que como máximo será: E= / etoces si queremos determiar el tamaño de muestra ecesario para obteer u itervalo de cofiaa para la media poblacioal μ, admitiedo u error E, tedremos que despejado de la expresió aterior: E / / pq ˆ ˆ Igualmete se tedría para ua proporció : =4 = ˆ ˆ / pq L E 6