Dra. Diaa M. Kelmasky 109 13. INTERVALOS DE CONFIANZA PARA LA MEDIA DE UNA POBLACIÓN NORMAL Supogamos que X1,...,X es ua muestra aleatoria de ua població ormal co media μ y variaza. Sabemos que la media muestral, X = X i /, es u estimador isesgado y cosistete de μ. Si embargo, o esperamos que la media muestral coicida co μ, e cambio esperamos que esté cerca de μ. Muchas veces, más que u estimador putual, es más útil especificar u itervalo sobre el que tegamos el grado de cofiaza de que μ se ecuetre detro de él. Para obteer dicho itervalo os basamos e la distribució del estimador putual. 13.1 INTERVALOS DEL 95% DE CONFIANZA PARA LA MEDIA DE UNA POBLACIÓN NORMAL VARIANZA CONOCIDA Cuado X1,...,X es ua muestra aleatoria de ua població Normal co media μ y variaza el estimador putual de μ, X, tiee distribució ormal co media μ y variaza / y resulta que ( X μ) tiee distribució N (0, 1) (Normal Estádar). Por lo tato ó equivaletemete ( X μ) P 1.96 < < 1.96 = 0.95 P X 1.96 < μ < X + 1.96 = 0.95 La expresió aterior sigifica que el 95% de las veces, que se calcule la media muestral a partir de ua muestra aleatoria de tamaño de ua població N(μ, ), μ diferirá de la media muestral como máximo e 1.96 uidades. Si ahora observamos que la variable aleatoria X toma el valorx, cofiamos co ua cofiaza del 95%, que μ se ecuetre e el itervalo x 1.96, x + 1.96 (1) El itervalo aterior es u itervalo de 95% de cofiaza para μ. Por qué cofiamos?
Dra. Diaa M. Kelmasky 110 Ejemplo. Supogamos que cuado se determia el coteido (μ) de ua sustacia e u compuesto, dicha determiació es ua variable aleatoria ( X ) ormalmete distribuida co media μ y variaza 4. E este caso podemos represetar a la determiació (X), cuado el coteido verdadero de la sustacia es μ, como μ + ε ( X = μ + ε, modelo de Gauss si sesgo). La variable aleatoria ε represeta el error de medició y tiee distribució Normal co media 0 y variaza 4. Supogamos que para reducir la variaza de la estimació, se determia el mismo coteido 9 veces: 5, 8.5, 1, 15, 7, 9, 7.5, 6.5, 10.5, 81 y se calcula el promedio: x = = 9. 9 Costruyamos u itervalo de cofiaza del 95% para μ: 9 1.96, 9 + 1.96 = ( 7.69, 10.31) 3 3 Teemos ua cofiaza del 95%, que el coteido verdadero se ecuetre etre 7.69 y 10.31. Por qué cofiamos? 13. INTERVALOS CONFIANZA PARA LA MEDIA DE UNA POBLACIÓN NORMAL CON VARIANZA CONOCIDA PARA CUALQUIER NIVEL DE CONFIANZA ESPECIFICADO. El valor crítico z α de ua distribució ormal estádar es el valor que deja a su derecha, bajo la curva de desidad ormal estádar, u área α: P { Z > z α } = α dode Z es ua v.a. co distribució N(0,1).
Dra. Diaa M. Kelmasky 111 Nuevamete cosideremos ua muestra aleatoria de ua població Normal co ( X μ) media μ y variaza ( X1,...,X ) luego la variable aleatoria tiee distribució N (0, 1) Por lo tato ó equivaletemete ( X μ) P zα / < < zα / = 1 α P X zα / < μ < X + zα / = 1 α Luego, u itervalo para μ co el 100*(1-α)% de cofiaza está dado por x zα /, x + zα / () siedo x el valor observado de la media muestral. Observació: El itervalo dado e () o es aleatorio. Esto sigifica que μ perteece ó o perteece al itervalo costruido y o lo sabemos. Cuado α = 0.05, cofiamos que μ perteezca a dicho itervalo, co u ivel de cofiaza del 95%. 13.3 TAMAÑO DE MUESTRA NECESARIO PARA LA OBTENCIÓN DE UN INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIÓN NORMAL CON LONGITUD PREFIJADA La logitud del itervalo de cofiaza dado por la ecuació () es zα /
Dra. Diaa M. Kelmasky 11 Supogamos que os iteresa afirmar co u ivel de cofiaza del 99% que μ se ecuetra detro de u itervalo de logitud L, cuá grade tiee que ser?. Como el ivel de cofiaza es 99%, α=0.01. Por lo tato α/ = 0.005, Z 0.005 =.58 y la logitud del itervalo de cofiaza es 5.16 Para que la logitud sea L debemos elegir de maera que o sea 5.16 = L = ( 5.16 / L) E geeral o será etero y se elige el meor que cumple qué? ( 5.16 / L) Por Ejemplo (cotiuació). Si iteresa obteer u itervalo co u ivel de cofiaza del 99% de logitud L =1, como = 4 resulta ( 5.16 * ) = 106,5. Luego deberá elegirse = 107. OBSERVACIÓN U itervalo de cofiaza para μ, es u rago de valores etre los cuales cofiamos se ecuetre μ Por qué cofiamos? Si costruimos u itervalo del 95% de cofiaza sigifica que 95 de cada 100 veces que utilicemos la ecuació (1) para calcularlo, el itervalo obteido cotedrá al verdadero valor μ. Cofiamos que uestro itervalo sea uo de esos 95 itervalos bueos.
Dra. Diaa M. Kelmasky 113 Ua vez que hemos costruido el itervalo, la probabilidad de que μ perteezca a dicho itervalo es 0 (si μ o perteece) ó 1 (si μ perteece) pero o lo sabemos. Es decir, deja de teer setido platear ua probabilidad cuado hemos hallado el itervalo resultate. 13.4 INTERVALOS CONFIANZA PARA LA MEDIA DE UNA POBLACIÓN NORMAL CON VARIANZA DESCONOCIDA Hemos desarrollado los itervalos de cofiaza ateriores basádoos e ( X μ) que tiee distribució N(0,1). Como o coocemos la variaza la estimamos por ( X ) = = i X S i 1, 1 sabemos que la variaza muestral S es u estimador isesgado y cosistete de. Para hallar los itervalos de cofiaza para la media de ua població ormal utilizaremos el siguiete resultado: ( X μ) T -1 = S tiee distribució t co -1 grados de libertad.
Dra. Diaa M. Kelmasky 114 Por lo tato ( X μ) < t S P t 1, α / < 1, α / = 1 α ó equivaletemete P X S S t < μ < X + t 1, α / 1, α / = 1 α Por lo tato si observamos que X = x y S = s diremos que s s μ x t 1, α /, x + t 1, α / (3) co u 100*(1-α)% de cofiaza Ejemplo. Cotiuació. Supogamos ahora que cuado se determia el coteido (μ) de ua sustacia e u compuesto, dicha determiació es ua variable aleatoria ( X ) ormalmete distribuida co media μ y variaza descoocida. Si cosideramos los valores obteidos e las mismas 9 determiacioes y estimamos la variaza resulta: x = 9 y s = 9.5 ó s = 3.08 Como t 8,0.05 =.306, de (3), u itervalo del 95% cofiaza para μ es 3.08 3.08 9.306, 9 +.306 = 3 3 ( 6.63, 11.37)
Dra. Diaa M. Kelmasky 115 Hay dos razoes por las cuales el itervalo (6.63, 11.37) tiee mayor logitud que el obteido ateriormete (7.69, 10.31). la variaza estimada 9.5, es mayor que el valor coocido 4 cosiderado previamete. aú cuado la variaza estimada hubiese sido 4, el itervalo estimado tedría mayor logitud debido a que el valor crítico de la t 8 es.306 mietras que el de la Normal es 1.96 para 1-α = 0.95. El itervalo hubiese sido (9-.306*/3, 9+.306*/3) = (7.46, 10.54) Cómo es ua distribució t co grados de libertad? La fució de desidad de probabilidad co grados de libertad es: f (t) correspodiete a la distribució t f ( t) = Γ(( + 1) / ) t 1 + π Γ( / ) ( + 1) /, t R es simétrica alrededor del cero y tiee forma de campaa, similar a la curva Normal. puede obteerse como la fució de desidad de la siguiete variable aleatoria: Z T =, V / ~ χ 1 dode Z y V so v.a. idepedietes tales que Z ~ N(0,1) y V (chicuadrado co grados de libertad); Ua derivació de la distribució t se publicó e 1908. Su autor, el químico William Sealy Gosset, trabajaba e la fábrica de cerveza Guiess e Dubli. La empresa le prohibía a sus empleados realizar cualquier tipo de publicacioes por lo cual el trabajo de Gosset fue escrito bajo el pseudóimo de Studet. A diferecia de la Normal, su dispersió depede de los grados de libertad. A medida que aumeta los grados de libertad las curvas de desidad t tiede a ser idistiguibles de la curva Normal estádar. E el ejemplo, supoemos que los datos proviee de ua distribució Normal, como el desvío es descoocido (lo estimamos por s), el estadístico e el que basamos el itervalo tiee distribució t co -1 (8) grados de libertad.
Dra. Diaa M. Kelmasky 116 OBSERVACIÓN La logitud de u itervalo de cofiaza para μ o siempre es mayor cuado la variaza es descoocida ya que puede ocurrir que el desvío estádar s resulte meor que. Si embargo e promedio la logitud del itervalo es mayor cuado es descoocida: se puede demostrar que tα, 1E( S) z α 14. INTERVALOS DE CONFIANZA PARA LA VARIANZA DE UNA DISTRIBUCIÓN NORMAL Si X1,...,X es ua muestra aleatoria de ua distribució Normal de parámetros μ y, etoces podemos costruir u itervalo de cofiaza para utilizado el hecho que S ( 1) ~ χ 1 (chi-cuadrado co -1 grados de libertad ) Luego
Dra. Diaa M. Kelmasky 117 P χ 1,1 α / χ 1, α / S ( 1) = 1 α ó equivaletemete ( 1) S P χ 1, α / ( 1) S 1,1 α / χ = 1 α Por lo tato, cuado S = s, u itervalo del 100*(1-α)% de cofiaza para está dado por ( 1) s ( 1) s, χ 1, α / χ 1, 1 α / Ejemplo. Se espera que u procedimieto estadarizado produzca aradelas co muy pequeña desviació e su espesor. Supoga que se elige al azar 10 de tales aradelas y se mide su espesor obteiédose e pulgadas: 0.13, 0.14, 0.16, 0.10, 0.130, 0.133, 0.15, 0.18, 0.14, 0.16. Iteresa calcular u itervalo del 90% de cofiaza para el desvío del grosor de las aradelas producidas por este procedimieto. Solució. s =1.366 x 10-6 χ9,0.05 = 16.917; χ9, 0.95 = 3.334-5 9 x 1.366 x 10 16.917-6 = 7.67 x 10 ; -5 9 x 1.366 x 10 3.334-6 = 36.875 x 10 Luego, co ua cofiaza del 90% 6 6 ( 7.67 x 10 ; 36.875 x 10 ) Tomado raíz cuadrada, co ua cofiaza del 90%,
(.686 x 10 3 ; 6.07 x 3 ) 10 Dra. Diaa M. Kelmasky 118 15.1 INTERVALOS CON NIVEL DE CONFIANZA APROXIMADOS PARA LA MEDIA DE UNA VARIABLE BINOMIAL. Muestras Grades. Cosideremos ua població de artículos que puede o cumplir co ciertas ormas e proporcioes p y 1-p, descoocidas. Si elegimos ua muestra de artículos al azar y registramos X i 1 = 0 si el artículo cumple co las ormas si el artículo o cumple co las ormas Etoces X = X i es la catidad de artículos de la muestra que cumple co las i= 1 ormas. Si podemos supoer que cada artículo cumple o o co las ormas e forma idepediete, resulta que X ~ Bi(, p) siedo p la proporció de artículos e la població que cumple co las ormas. Para costruir u itervalo de cofiaza para p os basaremos e la aproximació de la distribució Biomial por la distribució Normal cuado es suficietemete grade. X p p(1 p) ~ aprox N(0,1) Por lo tato, para cualquier α e el itervalo (0,1) X p P zα / < < zα / 1 α p(1 p) ó equivaletemete dode X p ˆ =. pˆ p P zα / < < zα / 1 α (4) p(1 p) /
Dra. Diaa M. Kelmasky 119 Para despejar u itervalo de cofiaza para p de la expresió (4) se reemplaza los meores (<) por iguales (=). Se obtiee así ua ecuació cuadrática e p cuyas solucioes so los extremos del itervalo de cofiaza buscado p = z pˆ + α / ± zα / 1+ ( zα / pˆ(1 pˆ ) z + α / 4 ) / Como es grade los térmios e z so despreciables y el itervalo resultate es el mismo que se obtiee al reemplazar p por pˆ e el deomiador de la expresió (4). Luego u itervalo de cofiaza co ivel de cofiaza aproximado 1-α para p está dado por p p p p p ˆ ˆ(1 ˆ ) ˆ(1 ˆ ) zα /, pˆ + zα / (5) Este itervalo puede utilizarse siempre que pˆ 5 y (1 pˆ) 5. Ejemplo. Se elige al azar, de u lote grade, ua muestra de 100 trasistores. Mediate ua prueba, se determia que 80 de ellos satisface las ormas vigetes. U itervalo de cofiaza del 95% para p, la verdadera proporció de trasistores que cumple co los requerimietos, está dado por ( 0.8 1.96 0.8(0.) /100; 0.8 + 1.96 0.8(0.) /100) = ( 0.716; 0.8784) Esto es, co u aprox. 95% de cofiaza, etre 7.16% y 87.84% de los trasistores cumple co los requerimietos. 15. PROCEDIMIENTO EN DOS PASOS: TAMAÑO DE MUESTRA NECESARIO PARA LA OBTENCIÓN DE UN INTERVALO DE CONFIANZA CON LONGITUD PREFIJADA PARA UNA PROPORCIÓN La logitud del itervalo de cofiaza dado por la ecuació (5) pˆ(1 pˆ ) zα / depede del parámetro que os iteresa estimar. Para hallar u tamaño de muestra de maera que la logitud del itervalo resultate sea aproximadamete L se procede e dos pasos:
Dra. Diaa M. Kelmasky 10 Paso 1: se toma ua muestra iicial de tamaño 1 y se obtiee u estimador iicial p ~ Paso : se utiliza la proporció estimada e el paso 1 para determiar el tamaño total resolviedo la siguiete ecuació: ~ p (1 ~ p) z α / = L elevado ambos miembros de la igualdad al cuadrado ó ( z ) ~ p (1 ~ p ) = L α / / ( z ) ~ p (1 ~ p ) L = α / / Ejemplo. U laboratorio itroduce u procedimieto, que le resulta más ecoómico, para la obteció de u reactivo que luego evasa e frascos. La probabilidad que el reactivo del u frasco elegido al azar cumpla las ormas de calidad es descoocida ( p ). Iteresa obteer u itervalo de 99% de cofiaza cuya logitud sea aproximadamete 0.05. Paso 1. E ua muestra iicial de 30 frascos, 6 de ellos resultaro aceptables por lo que el estimador iicial es ~ p =6/30 = 0.87. Paso. El tamaño muestral requerido es ( z ) 0.005 4(.58) 6 4 = (6/ 30)(1 6/ 30) = = 131 (0.05) (0.05) 30 30 Deberíamos tomar ua muestra adicioal de 101 frascos. Si, por ejemplo, 1040 de ellos resulta aceptables (mateiedo aprox. la proporció iicial) el itervalo de 99% de cofiaza para la verdadera proporció de compoetes aceptables es: 1066 1066 z 1066 1066 1066 + 1 0.005 z ; 1066 1 0. 005 131 131 131 131 131 131 (0.84091; 0.89101) OBSERVACIÓN Hemos visto que la logitud del itervalo de cofiaza para p es L si está dado por = ( z / ) ~ (1 ~ α p p ) / L
Dra. Diaa M. Kelmasky 11 Hemos visto (pág 101 secció 1.1 figura ) que la fució g(p) = p(1-p) defiida e el itervalo [0,1] toma su valor máximo 1/4 cuado p = 1/. Luego ua cota superior para es: ( zα / ) / L ( ) De esta maera, si se elige ua muestra de tamaño mayor o igual a z α / / L, garatizamos la obteció de u itervalo de cofiaza para p de logitud o mayor a L si teer que realizar u muestreo adicioal. 16. INTERVALOS DE CONFIANZA PARA LA MEDIA DE UNA DISTRIBUCIÓN EXPONENCIAL La distribució expoecial es utilizada e estudios sobre cofiabilidad como modelo del tiempo hasta la falla de u dispositivo. Por ejemplo el tiempo de vida de u compoete semicoductor podría estar modelado como ua variable aleatoria co media 40 000 horas. Recíprocamete, supoiedo que u modelo expoecial es el adecuado para modelar el tiempo de vida de u compoete, podríamos estar iteresados e estimar su vida media mediate u itervalo de cofiaza. Supogamos que X1,...,X es ua muestra aleatoria de ua distribució expoecial de parámetro λ, Xi ~ ε(λ). Sabemos que E(Xi)=1/λ, luego la media muestral Xi / es u estimador isesgado y cosistete de 1/λ. Para obteer u itervalo de cofiaza para 1/λ es ecesario recordar que Luego, para cualquier α (0,1) ó equivaletemete, P χ λ X i ~ χ i= 1,1 α / λ X i χ, α / i= 1 X i X i= 1 1 i= 1 P χ λ, α / χ,1 i α / = 1 α = 1 α
Dra. Diaa M. Kelmasky 1 Luego, u itervalo de 100(1-α)% de cofiaza para 1/λ es X i X i i= 1 i= 1, χ, α / χ,1 α / Ejemplo. Ua fábrica produce artículos cuyos tiempos de vida (e horas) se supoe idepedietes co fució de desidad expoecial comú a todos: λx f ( x) = λ e, 0 < x < Si la suma los tiempos de vida de los primeros 10 artículos es 1 740 cuál es u itervalo de cofiaza del 95% para 1/λ? Como 0,0.05= 34.169 χ 0, 0.975= 9.661 χ, luego el itervalo es x 1740 x 1740, 34.169 9.661 Es decir que co u ivel de cofiaza del 95% el tiempo de vida medio se ecuetra e el itervalo (101.847, 360.11). Para la costrucció de todos los itervalos de cofiaza hemos partido de ua fució que depede de la muestra y del parámetro para el cual os iteresa costruir el itervalo. La fució es ua ueva variable aleatoria cuya distribució es coocida. Este es u procedimieto geeral que describimos a cotiuació. 17. MÉTODO GENERAL PARA OBTENER INTERVALOS DE CONFIANZA. Sea X 1, X,..., X ua m.a. de ua distribució que depede de u parámetro θ. Supogamos que existe ua fució T ( X 1, X,..., X, θ ) (es decir, ua fució de la muestra y del parámetro) cuya distribució es coocida y o depede de θ i de igú otro parámetro descoocido. Etoces, como la distribució de T es coocida, se puede hallar dos valores a y b tales que
Dra. Diaa M. Kelmasky 13 ( a T X, X,..., X, θ ) ) = 1 α P ( 1 b A partir de esta expresió, si T es ua fució moótoa de θ, es posible despejar θ de la expresió aterior y obteer u itervalo de cofiaza para θ. La fució T X, X,...,, ) se deomia pivote. ( 1 X θ Ejemplo: Sea X 1, X,..., X ua m.a. de ua distribució expoecial de parámetro λ. Hemos visto que la suma de v.a. expoeciales idepedietes es ua v.a co distribució Gamma, es decir i= 1 X i ~ Γ(, λ) λ Vale además que si V ~ Γ( α, λ) y a > 0 etoces av ~ Γ α,. Luego a La fució λ X i i= 1 χ λ X ~ χ i= 1 i 1 = Γ,, que depede del parámetro de iterés y cuya distribució es coocida ( ), permitió costruir itervalos de cofiaza para λ (secció 4) 18. INTERVALOS DE CONFIANZA DE NIVEL APROXIMADO PARA LA MEDIA DE UNA DISTRIBUCIÓN CUALQUIERA Muchas veces se descooce la distribució de la cual proviee los datos y e otras es muy difícil hallar la distribució exacta de la fució pivote. Utilizaremos el teorema cetral del límite para obteer ua fució pivote cuya distribució será coocida aproximadamete. Esta fució os permitirá despejar u itervalo de cofiaza. Pero el precio que hay que pagar es la pérdida del ivel exacto. Ya hemos visto u ejemplo de esta situació cuado obtuvimos itervalos de cofiaza co ivel aproximado para el parámetro p de ua distribució Biomial (secció 15.1). Cosideremos ahora ua m.a. X 1, X,..., X de ua distribució F, cualquiera, tal que E(Xi) = μ y V(X i ) = <. Nos iteresa hallar u itervalo de cofiaza para μ. Sabemos que X es u estimador isesgado y cosistete de μ. No coocemos su distribució exacta porque o coocemos la de X i, pero sabemos que
Dra. Diaa M. Kelmasky 14 X μ D N(0,1) Si fuera coocido, esta fució podría servir de pivote para el itervalo de ivel aproximado, pero qué usamos si es descoocido? Propiedad: D Y Y p U a U Y D ay s Como s p por ser u estimador cosistete, etoces p 1 y p 1. s Luego, X μ D N(0,1) p 1 s X μ D N(0,1) s A partir de este resultado, X μ P zα / zα / 1 α s y se obtiee el siguiete itervalo de cofiaza para μ, de ivel aproximado 1 - α s X zα /, X + zα / s