UNIDAD 3.- INFERENCIA ESTADÍSTICA I 1. ESTADÍSTICA INFERENCIAL. MUESTREO La Estadística es la ciecia que se preocupa de la recogida de datos, su orgaizació y aálisis, así como de las prediccioes que, a partir de esos datos puede hacerse. Los aspectos ateriores hace que pueda hablarse de dos tipos de Estadística: Descriptiva e Iferecial La Estadística Descriptiva se ocupa de tomar los datos de u cojuto dado, orgaizarlos e tablas o represetacioes gráficas y del cálculo de uos úmeros que os iforme de maera global del cojuto estudiado. No utiliza la Probabilidad. La Estadística Iferecial trata sobre la elaboració de coclusioes para ua població, partiedo de los resultados de ua muestra y del grado de fiabilidad de las coclusioes. Utiliza la Probabilidad La estadística iferecial se divide e: Estadística iductiva: Se ecarga de estimar los parámetros de ua població, y lo puede hacer de dos formas distitas: - Mediate u úico valor o estimació putual - Mediate u itervalo o estimació por itervalos Estadística deductiva: Su fi es comprobar si la iformació que proporcioa la muestra cocuerda o o co la hipótesis estadística formulada: - Mediate los cotrastes de hipótesis Defiició: Los parámetros poblacioales o parámetros so los ídices cetrales y de dispersió que defie a ua població (media, variaza, proporció..). Defiició: Los estadísticos muestrales o estadísticos so los ídices cetrales y de dispersió que defie a ua muestra (media, variaza, proporció.. muestrales). Los estadísticos que más vamos a usar so: - µ ó x, la media muestral - σ ó s, la desviació típica muestral 2. MUESTREOS ALEATORIOS E la iferecia estadística es ecesario utilizar muestras, que represete a la població. Esto se cosigue mediate las técicas de muestreo. Para poder obteer iformació de la població a través de la muestra es ecesario que ambas tega características parecidas, e tal caso se dice que la muestra es represetativa de la població. Ejemplo: Se hace u estudio sobre los pesos de los recié acidos, para ello se cosidera la variable aleatoria: X = " peso de u recié acido" La població sobre la que se hace el estudio so todos los iños que ace. No se puede aalizar toda la població (los iños o para de acer), por lo que es ecesario tomar ua muestra. 1 UNIDAD 3.- Iferecia Estadística I
Es importate saber cuál debe ser el tamaño de la muestra para que sea represetativa, parece evidete que 2 iños o so suficietes, pero cuátos pesar? Por otro lado hay de determiar cómo elegir a los iños, importa el sexo?, puede ser todos acidos el mismo día?, o e el mismo hospital? Tipos de muestreo Muestreo co reemplazamieto: es el que se realiza cuado u elemeto tomado de la població vuelve de uevo a ella para poder volver a ser elegido. E esta situació, cada miembro de la població puede seleccioarse más de ua vez. Este tipo de muestreo hace que ua població fiita pueda ser cosiderada, al meos e su aspecto teórico, como ua població ifiita. Muestreo si reemplazamieto: es el que se efectúa si devolver a la població los elemetos que se va eligiedo para costruir la muestra. E este caso, cada miembro de la població o puede seleccioarse más de ua vez. Muestreo o aleatorio o o probabilístico: es el que se realiza de forma que todos los elemetos de la població o tiee la misma probabilidad de ser icluidos e la muestra. Este tipo de muestreo suele ser de escasa represetatividad y poco válidas las iferecias que pueda hacerse Muestreo aleatorio: es el que se efectúa teiedo e cueta que cada miembro de la població tiee la misma probabilidad de ser elegido e la muestra. Co este tipo de muestreo, las muestras so represetativas, es posible coocer los posibles errores cometidos y puede hacerse iferecias estadísticas. Es el más utilizado ya que preseta u mayor grado de fiabilidad y es el que vamos a estudiar más e detalle Muestreo aleatorio Los tipos fudametales de muestreos aleatorios so tres: Muestreo aleatorio simple: Cosiste e listar todos los elemetos de la població y seleccioar aleatoriamete los elemetos de la muestra. El muestreo aleatorio simple se etederá co reemplazamieto segú las directrices dadas por la comisió de Selectividad. Muestreo aleatorio sistemático: Se suele utilizar para ahorrar costes, y e este tipo de muestreo es ecesario ordear a los idividuos de la població asigádoles de este modo u úmero ordial a cada uo. Dividimos N (tamaño de la població) etre (tamaño de la muestra), os da como resultado u º N k = (llamado coeficiete de elevació), y después elegimos, al azar, uo de los k primeros idividuos de la població, por ejemplo el que ocupa el lugar k, y a partir de ahí la muestra se iría obteiedo escogiedo idividuos de k e k hasta completar todos los elemetos que compoe la muestra. Muestreo aleatorio estratificado: Es el que se utiliza cuado e la població se puede distiguir varios colectivos (estratos) cuya presecia queremos reflejar e la muestra. Supogamos que teemos k estratos o colectivos que os divide a la població. Llamaremos N1, N2, N3,... N k al º de elemetos de la població que tiee cada estrato, es decir su tamaño. Se cumple que N1 + N2 + N3 +... + Nk = N. Sea 1, 2, 3,..., k al úmero de idividuos de los respectivos estratos que hay e la muestra (co 1 + 2 + 3 +... + k = ). Segú el criterio que elijamos para reflejar los estratos e la muestra, teemos dos subtipos e este muestreo: co afijació igual (tambié llamada costate o simple) y co afijació proporcioal. 2 UNIDAD 3.- Iferecia Estadística I
E el caso de muestreo aleatorio estratificado co afijació igual, o se toma e cueta el úmero de idividuos que compoe cada estrato, sio que todos tiee la misma presecia e la muestra. Por ejemplo, si hay 5 estratos, de cada uo se elegiría 5 idividuos para la muestra, idepedietemete del peso que cada uo de ellos tuviera e la població. Es decir, 1 = 2 = 3 =... = k =. No suele ser k represetativa y se usa poco. E el caso de muestreo aleatorio estratificado co afijació proporcioal, sí se toma e cueta el tamaño de cada estrato. Lo que se pretede es que la muestra matega, e su composició, la misma proporció de idividuos que cada estrato tega e la població. Este tipo es el más usado. 1 2 3 k E este caso ha de ser proporcioales y por tato se ha de cumplir que = = =... = = N1 N2 N3 Nk N De estas proporcioes podemos saber el º de elemetos de cada estrato que ha de teer la muestra Ejemplo: E cierta població habita 1500 iños y jóvees, 7500 adultos y 1000 aciaos. Se desea realizar u estudio para coocer el tipo de actividades de ocio que se desea icluir e el uevo parque e costrucció. Para ello, va a ser ecuestados 200 idividuos elegidos al azar. a) Si se utiliza muestreo estratificado co afijació igual, cuál será el tamaño muestral correspodiete a cada estrato? b) Si se utiliza muestreo estratificado co afijació proporcioal, cuál será el tamaño muestral correspodiete a cada estrato? a) E el muestreo estratificado co afijació igual dividimos el total de la muestra etre 3 (iños, adultos, aciaos) y tomamos esa catidad de cada estrato. E uestro caso 200/ 3 = 66 66, como so persoas elegimos 66 iños, 67 adultos y 67 viejos, porque 66 + 67 + 67, (la suma tiee que ser 200 y teemos que aproximar los datos) b) E el muestreo estratificado co afijació proporcioal debe cosiderarse los estratos formados por iños y jóvees, adultos y aciaos. El tamaño de cada uo de los estratos debe ser proporcioal a la catidad de idividuos de cada uo de ellos. Así, se tiee que: 1500 x = = 30 50 x y z 200 1 7500 = = = = y = = 150 1500 7500 1000 10000 50 50 1000 x = = 20 50 La muestra debe estar formada por 30 iños y jóvees, 150 adultos y 20 aciaos elegidos aleatoriamete etre sus respectivos colectivos. 3. DISTRIBUCIONES MUESTRALES Ua vez obteida la muestra de la població, y realizado el estudio sobre ella, llega la fase e que hay que obteer coclusioes sobre toda la població. Nosotros vamos a estimar la media de la població, o la proporció de idividuos de esa població que tiee ua determiada característica o la diferecia de medias 3 UNIDAD 3.- Iferecia Estadística I
Distribució de las medias muestrales Vamos a cosiderar ahora todas las muestras posibles de tamaño que se pueda extraer de ua població, y la variable aleatoria X es la que asiga a cada muestra su media. Esta distribució se llama distribució de las medias muestrales. Si llamamos µ y σ a la media y la desviació típica variable aleatoria de la població (respectivamete), y siedo X la variable aleatoria formada por las medias muestrales, etoces se verifica el siguiete Teorema Cetral del Límite: Para u suficietemete grade (se cosidera grade para 30 ), se tiee que la distribució muestral de σ medias X se aproxima a ua distribució ormal, es decir, X N( µ, ). Resumiedo, - La media de las medias muestrales, X, es la de la població, µ = µ σ - La desviació típica de las medias muestrales, X, es σ = Corolario: E el caso particular que sepamos que la població sigue ua distribució ormal, la distribució de medias muestrales tambié sigue ua distribució ormal, y e este caso idepedietemete del tamaño de la σ muestra, es decir, X = N( µ, ) E la práctica ocurre que la desviació típica de la població es descoocida. E estos casos se aproxima por la desviació típica de la muestra siempre que el tamaño de esta sea suficietemete grade, 100 Ejemplo: Ua població está formada por sólo cico elemetos, co valores 3, 5, 7, 9 y 11. Cosideramos todas las muestras posibles de tamaño 2 co reemplazamieto que pueda extraerse de esta població. Se pide calcular: a) La media de la població. b) La desviació típica de la població c) La media de la distribució muestral de medias. d) La desviació típica de la distribució muestral de medias, es decir, el error típico de las a) La media de la població es 3 + 5 + 7 + 9 + 11 35 µ = = = 7 5 5 b) La desviació típica de la població es: σ = ( 3 7) + ( 5 7) + ( 7 7) + ( 9 7) + ( 11 7) 2 2 2 2 2 5 = 8 = 2,8284 c) Costruyamos la distribució muestral de medias y, para ello, calculamos la media de todas las muestras posibles co reemplazamieto de tamaño 2 que so 25. Los resultados puede verse e la tabla siguiete: 4 UNIDAD 3.- Iferecia Estadística I
La distribució muestral de medias puede verse e la tabla que sigue. La media de la distribució muestral de medias (media de medias) es: d) La desviació típica de la distribució muestral de medias es: Ejemplo: Las estaturas de 1200 estudiates de u cetro de eseñaza superior se distribuye ormalmete co media 1 72 y desviació típica 0 09 m. Si se toma 100 muestras de 36 estudiates cada ua, se pide: a) La media y la desviació típica esperada de la distribució muestral de medias. b) E cuátas muestras cabría esperar ua media etre 1 68 y 1 73 m? c) E cuátas muestras es de esperar que la media sea meor que 1 69 m? a) La media y la desviació típica esperada de la distribució muestral de medias es: σ 0,09 µ = µ = 1,72 y σ = = = 0,015 36 5 UNIDAD 3.- Iferecia Estadística I
Por ser el tamaño muestral mayor que 30 aplicamos el teorema cetral del límite, que afirma que la σ distribució muestral de medias se aproxima a ua distribució ormal: X = N( µ, ) = N(1, 72, 0, 015) X 1,72 b) Nos está pidiedo P(1, 68 < X 1, 73), y para ello hemos de tipificar la variable haciedo Z =, 0,015 co lo cual 1,68 1,72 X 1,72 1,73 1,72 P(1, 68 < X 1, 73) = P( < ) = P( 2,67 < Z 0, 67) = 0,015 0,015 0,015 ( ) ( ) P Z 0, 67 P( Z 2, 67) = P Z 0, 67 + P( Z 2, 67) 1 = 0,7486 + 0,9962 1 = 0, 7448 El º de muestras esperado es aproximadamete 74 c) Nos está pidiedo P( X 1, 69), y tipificado igual que e el apartado aterior teemos que: 1,69 1,72 P( X 1, 69) = P( Z ) = P( Z 2) = 1 P( Z 2) = 1 0, 9772 = 0, 0228 0,015 Es decir, aproximadamete 2 muestras tiee la media meor que 1,69 Distribució de las proporcioes muestrales Cuado estudiamos e ua població ua determiada característica que sólo puede tomar dos valores: éxito y fracaso, la població objeto del estudio sigue ua distribució biomial Cada ua de las muestras que extraigamos de esa població tedrá u porcetaje de idividuos co esa misma característica. Vamos a estudiar ahora de todas las muestras posibles de tamaño, la proporció de sus idividuos que tiee ua determiada característica. Llamaremos p al valor de esa proporció e toda la població y llamaremos p a la proporció de idividuos co esa característica e cada ua de las muestras. La distribució asociada a la variable aleatoria que asocia a cada muestra su proporció es la distribució muestral de proporcioes. Teorema: a) La media de p es p, es decir, µ p = p b) La desviació típica de p p q es c) Si 30, p 5 y q 5 p q, es decir, p σ = dode q 1 = p, la distribució muestral de proporcioes p se aproxima a ua distribució ormal p q p N p, E la práctica ocurre que las proporcioes p y q de la població so descoocidas. E estos casos, se aproxima por las respectivas de ua muestra, p = µ, por ser p u estimador isesgado. p Ejemplo: Ua població está formada por los elemetos 1, 2, 4 y 6. a) Calcula la proporció p de cifras impares. b) Para cada ua de las muestras co reemplazamieto de tamaño dos, calcula la proporció de cifras impares. c) Calcula la media y la desviació típica de la distribució muestral de proporcioes. 6 UNIDAD 3.- Iferecia Estadística I
1 a) La proporció de cifras impares es: p = = 0, 25 4 b) La proporció de cifras impares de cada ua de las muestras puede verse e la tabla. Muestra 1,1 1,2 1,4 1,6 2,1 2,2 2,4 2,6 4,1 4,2 4,4 4,6 6,1 6,2 6,4 6,6 Proporció p 1 0.5 0.5 0.5 0.5 0 0 0 0.5 0 0 0 0.5 0 0 0 c) La media de las proporcioes ateriores es: 1+ 0, 5 + 0,5 + 0,5 + 0,5 + 0, 5 + 0,5 µ = = 0,25 = p p 16 Y la desviació típica es σ p 2 2 2 2 2 2 2 1 + 0,5 + 0,5 + 0,5 + 0, 5 + 0, 5 + 0, 5 2 = 0, 25 = 0,3062, que verifica que es igual a 16 ( ) p q (0, 25) (0,75) σ p = = = 0,3062, pues la població es fiita y las muestras se extrae co 2 reemplazamieto Ejemplo: Ua máquia fabrica piezas de precisió. E su producció habitual fabrica u 3% de piezas defectuosas. U cliete recibe ua caja de 500 piezas procedetes de la fábrica. a) Cuál es la probabilidad de que ecuetre más del 5% de piezas defectuosas e la caja? b) Cuál es la probabilidad de que ecuetre meos de u 1% de piezas defectuosas? La distribució muestral de proporcioes admite como media y desviació típica co los datos que teemos: p q 0, 03 0,97 µ p = p = 0,03 y σ p = = = 0, 0076 500 La distribució muestral de proporcioes se distribuye segú ua N (0, 03; 0, 0076) dado que el tamaño de las muestras es mayor que 30. Co esto respodemos a los apartados: a) ( 0,05 0,03 P p > 0, 05 ) = (tipificamos) P Z > = 1 P ( Z 2, 63) = 1 0,9957 = 0, 0043 0, 0076 b) ( 0, 01 ) (tipificamos) 0,01 0,03 P p = P Z = P( Z 2, 63 ) = P( Z > 2, 63 ) = 0, 0076 = 1 P Z 2, 63 = 1 0,9957 = 0, 0043 ( ) 4. ESTIMACIÓN DE PARÁMETROS. ESTIMACIÓN PUNTUAL Detro de la estadística iferecial está la estadística iductiva, que se basa e la estimació de parámetros poblacioales a partir de los correspodietes estadísticos muestrales. Esta estimació puede hacerse de dos formas: estimació putual y estimació por itervalos Por ejemplo, cuado decimos que la altura media de los adolescetes es de 1,75 m estamos haciedo ua estimació putual; e cambio, si decimos que la altura media de los adolescetes está etre 1,73 y 1,77 m estamos haciedo ua estimació por itervalos. Por tato, la estimació putual cosiste e estimar mediate u úico valor el parámetro poblacioal descoocido. E la estimació putual, el estadístico que utilizamos para la estimació se llama estimador putual. Los estimadores putuales puede se: 7 UNIDAD 3.- Iferecia Estadística I
- Estimador putual isesgado: Si la media de la distribució muestral de u estadístico es igual a su correspodiete parámetro poblacioal. So estimadores putuales isesgados la media muestral o la proporció muestral. - Estimador putual sesgado: Si la media de la distribució muestral de u estadístico o coicide co su correspodiete parámetro poblacioal. 8 UNIDAD 3.- Iferecia Estadística I