Capítulo 6 ItroduccióalaIferecia Estadística 6.1. Itroducció El pricipal objetivo de la Estadística es iferir o estimar características de ua població que o es completamete observable (o o iteresa observarla e su totalidad) a través del aálisis de ua parte de ella a la que llamamos muestra. Las razoes por las que geeralmete se trabaja co muestras so pricipalmete: - Ecoómicas. - Tiempo: si la població es muy grade llevaría tato tiempo aalizarla que icluso la característica de iterés podría variar e ese período. Por ejemplo, la tasa de paro. - Destrucció: la medició de cierta característica podría llevar a la destrucció del idividuo. Por ejemplo, al estudiar la supervivecia de ciertos aimales a u tratamieto. Lo que se hace etoces es aalizar la muestra y extrapolar coclusioes desde la muestra a la població. Ahora bie, para cosiderar válidas e la població las coclusioes obteidas e la muestra, ésta ha de represetar bie a la població (represetativa). Por lo tato, la selecció de la muestra es de suma importacia, y para ello hay diversos métodos (métodos de muestreo). Cuado se ituye que la característica e estudio puede presetar valores homogéeos 99
100 Capítulo 6. Itroducció a la Iferecia Estadística e la població, ua forma de obteer ua muestra represetativa es eligiédola al azar. A este método de selecció de la muestra se le llama muestreo aleatorio simple y es el más secillo. La Iferecia Estadística se puede clasificar e iferecia paramétrica e iferecia o paramétrica. La iferecia paramétrica tiee lugar cuado se cooce la distribució de la variable de estudio e la població, y el iterés recae sobre los parámetros descoocidos de la misma. La iferecia o paramétrica tiee lugar si o se cooce la distribució y sólo se supoe propiedades geerales de la misma. Nosotros os cetramos e la iferecia paramétrica, y uestro objetivo será iferir o estimar parámetros poblacioales a partir de la iformació que os proporcioa ua muestra. Supogamos que estudiamos ua variable X e ua població y sabemos que preseta ua distribució F θ, dode θ es el parámetro de la distribució y es descoocido. Los problemas de iferecia que puede darse so: de estimació, e los que se busca u valor (estimació putual) para θ o u cojuto de valores posibles para el mismo (estimació por itervalos de cofiaza), y de cotraste, cuyo objetivo es comprobar si es cierta o falsa cierta hipótesis formulada sobre el parámetro θ. E el Tema 7 se estudia la estimació putual y por itervalos de cofiaza, y e Tema 8 estudiaremos problemas de cotraste de hipótesis. Ejemplo: Supogamos que queremos estudiar el tiempo de fallo de ua població de cierto tipo de compoetes. Ituimos (por estudios ateriores por ejemplo) que el tiempo de fallo X sigue ua distribució Expoecial, X Exp(λ), co λ descoocido, ya que o observamos el tiempo de fallo de todos los compoetes de la població. Tedremos que estimar su valor e base a la iformació que proporcioa ua muestra. Dado que E(X) =1/λ, y parece lógico estimar la media poblacioal co la media muestral x, teemos que λ ˆ =1/ x. 6.2. Muestra aleatoria simple. Estadísticos muestrales Sea X la variable aleatoria de iterés e la població, co fució de probabilidad o desidad f(x; θ), dode θ deota el parámetro o parámetros descoocidos. Ua muestra aleatoria simple (m.a.s.) de tamaño es u cojuto de variables X 1,..., X tales que: - X 1,..., X so idepedietes - X 1,..., X so idéticamete distribuidas, co la misma distribució que la variable poblacioal X.
6.3. Distribucioes de muestreo 101 Nota: ua vez observada la variable sobre los idividuos de la muestra, tedremos valores u observacioes x 1,..., x. U estadístico es ua fució de las variables aleatorias de la muestra, e la cual o aparece parámetros descoocidos. U estadístico es por lo tato ua variable aleatoria, y lo deotamos por T (X 1,..., X ). El valor que toma el estadístico ua vez observada la muestra es T (x 1,..., x ). Al ser los estadísticos variable aleatorias, presetará distribucioes de probabilidad, a las que llamamos distribucioes de muestreo. Si u estadístico lo usamos para estimar u parámetro descoocido de la població (por ejemplo la media µ, variazaσ 2, etc.) lo llamaremos estimador de ese parámetro. Al valor que toma ua vez observada la muestra se le llama estimació putual del parámetro. Para cada parámetro habrá que ecotrar "el mejor estimador", para cometer e la estimació el meor error posible. El error de estimació depede fudametalmete de la variabilidad poblacioal y del tamaño de la muestra. Ejemplos de estadísticos so los siguietes: - Media muestral: - Variaza muestral: X = X 1 +... + X S 2 = X (X i X) 2 i=1 1 6.3. Distribucioes de muestreo 6.3.1. Media muestral Sea X 1,..., X ua m.a.s. de ua població X co E(X) =µ y Var(X) =σ 2.Elestadístico media muestral hemosvistoquesedefie como Se puede comprobar que: X = X 1 +... + X E( X)=µ y Var( X)= σ2 El Teorema Cetral del Límite segú vimos establece que: µ µ, X = X 1 +... + X N ( ), σ Delia Motoro Cazorla. Dpto. de Estadística e I.O. Uiversidad de Jaé.
102 Capítulo 6. Itroducció a la Iferecia Estadística Sea X 1,..., X ua m.a.s. de ua població X co distribució N(µ, σ). Etoces, X = X µ 1 +... + X σ N µ,, al ser combiació lieal de variables ormales e idepedietes. 6.3.2. Variaza muestral Sea X 1,..., X ua m.a.s. de ua població X co E(X) =µ y Var(X) =σ 2.Elestadístico variaza muestral se defie como X (X i µ) 2 S 2 = i=1 1 Sea X 1,..., X ua m.a.s. de ua població X co distribució N(µ, σ). Etoces: ( 1)S 2 σ 2 χ 2 1 y X y S 2 so idepedietes. 6.3.3. Diferecia de medias muestrales Sea X 1,...,X 1 ua m.a.s de ua població X, e Y 1,..., Y 2 ua m.a.s. de ua població Y. Supoemos que las poblacioes X e Y so idepedietes y co distribucioes ormales N(µ 1,σ 2 1) y N(µ 2,σ 2 2) respectivamete. Se puede presetar los siguietes casos: (a) σ 2 1,σ 2 2 coocidas: oequivaletemete X Y N Z = µ 1 µ 2, s σ 2 1 + σ2 2, 1 2 X Y (µ 1 µ 2 ) q N(0, 1) σ 2 1 1 + σ2 2 2 (b) σ 2 1 = σ 2 2 = σ 2 descoocidas: T = X Y (µ 1 µ 2 ) q t 1+ 22, 1 S p 1 + 1 2
6.3. Distribucioes de muestreo 103 siedo S p = s ( 1 1)S 2 1 +( 2 1)S 2 2 1 + 2 2 y S 2 1 y S 2 2 las variazas muestrales de X e Y respectivamete. 6.3.4. Cociete de variazas muestrales Sea X 1,...,X 1 ua m.a.s de ua població X, e Y 1,..., Y 2 ua m.a.s. de ua població Y. Supoemos que las poblacioes X e Y so idepedietes y co distribucioes ormales N(µ 1,σ 2 1) y N(µ 2,σ 2 2) respectivamete. Etoces, F = S 2 1 σ 2 1 S 2 2 σ 2 2 F 11, 21 Estudiamos además la distribució de ua proporció muestral y de la diferecia de dos proporcioes muestrales. 6.3.5. Proporció muestral Sea X 1,...,X ua m.a.s. de ua població X. Sea p la proporció de idividuos e la població que preseta ua determiada característica, y ˆp la proporció muestral. Etoces, r ˆ p(1 p) p N(p, ) Nota: El úmero de idividuos que preseta la característica e la muestra sigue ua distribució B(, p), que co suficietemete grade se puede aproximar a ua N(p, p p(1 p)). Por lo tato, la proporció muestral sigue tambié ua distribució Normal co los parámetros arriba idicados. 6.3.6. Diferecia de proporcioes muestrales Sea X 1,...,X 1 ua m.a.s de ua població X, e Y 1,..., Y 2 ua m.a.s. de ua població Y. Supoemos que las poblacioes X e Y so idepedietes. Deotamos por p 1 y p 2 las proporcioes poblacioales y por p ˆ 1 y p ˆ 2 las correspodietes proporcioes muestrales. Delia Motoro Cazorla. Dpto. de Estadística e I.O. Uiversidad de Jaé.
104 Capítulo 6. Itroducció a la Iferecia Estadística Etoces: Por lo tato: ˆ p 1 p ˆ 2 N Z = p 1 p 2, ˆ p 1 ˆ + p 2(1 p 2 ) 1 s p 1 (1 p 1 ) p 2 (p 1 p 2 ) r p1 (1 p 1 ) + p 2(1 p 2 ) 1 1 1 N(0, 1) 6.4. Ejercicios 1. Ua cemetera elabora u tipo de cemeto que tiee u coteido medio de aditivo B542 de 100mg/kg co ua desviació típica de 10 mg/kg. Supoemos que la distribució es Normal. Calcula la probabilidad de que al tomar ua muestra de 20kg de la producció diaria el coteido de aditivo sea, e media, meor de 95 mg/kg. 2. E ua idustria se fabrica uos cables cuya resistecia sigue ua distribució Normal de media 200 ohmios y desviació típica de 15 ohmios. Se toma ua muestra de 15 cables. a) Qué probabilidad hay de que la media muestral sea meor que 195 ohmios?. b) Qué tamaño de la muestra se debe tomar para garatizar ua duració media de la muestra superior a 195 ohmios co ua probabilidad mayor o igual que el 95 %. 3. Se toma ua muestra de 25 observacioes de ua població Normal que tiee ua variaza σ 2 =10. Cuál es la probabilidad de que la variaza muestral sea mayor que 16?. 4. La vida eficaz de u compoete sigue ua distribució Normal de media 5000 horas y desviació típica de 40 horas. Nos propoe u uevo compoete y os garatiza ua vida media de 5050 horas y desviació típica de 30 horas. Decidimos hacer ua prueba y tomamos 25 compoetes de cada grupo. Decidimos cambiar de proveedor si la diferecia de duració es, e media, al meos de 25 horas. Si el uevo proveedor está e lo cierto, qué probabilidad tiee de que le compremos sus compoetes?. 5. Si S1 2 y S2 2 so las variazas muestrales de m.a.s. idepedietes de tamaños 1 =10y 2 =20tomadas de poblacioes ormales que tiee las mismas variazas, calcular la probabilidad de que el cociete de variazas muestrales S1 2 / S2 2 sea meor que 2.42.
6.4. Ejercicios 105 6. El resultado de ua ecuesta de opiioes fue que el 59 % de la població española piesa que la situació ecoómica es buea o muy buea. Supogamos, extrapolado los resultados del sodeo a la població etera que la proporció de todos los españoles co esta opiió es efectivamete 0.59. a) Muchos de los sodeos tiee u marge de error de orde ±3 putos. Cuál es la probabilidad de que ua muestra aleatoria de 300 españoles presete ua proporció muestral que o se aleje e más de 0.03 de la proporció autética p =0,59?. b) Cotesta a la preguta aterior para ua muestra de 600 idividuos y otra de 1200. Cuál es el efecto de aumetar el tamaño muestral?. 7. E codicioes ormales, ua máquia produce piezas co ua tasa de defectuosas del 1 %. Para comprobar que la máquia sigue bie ajustada, se escoge al azar cada día 100 piezas e la producció y se les somete a u test. Cuál es la probabilidad de que, si la máquia está bie ajustada, haya e ua de esas muestras más del 2 % de piezas defectuosas?. Delia Motoro Cazorla. Dpto. de Estadística e I.O. Uiversidad de Jaé.