Unidad 7.. Definiciones. Muestreo aleatorio y estadístico. Estadísticos importantes. Técnica de muestreo. Transformación integral
Muestreo: selección de un subconjunto de una población ) Representativo de la población, sus estadísticos concuerdan exactamente o casi con los de la población ) Manejable a efectos prácticos, su tamaño debe garantizar adecuado procesamiento Muestreo según la selección de la muestra: Aleatorio: selección equiprobable de los elementos de la población o Aleatorio o de Juicio: la muestra es conformado al juicio experto del investigador Muestreo según el tratamiento a las observaciones: con reposición: cada miembro de la muestra puede ser contado más de una vez sin reposición: cada miembro de la muestra es considerado sólo una vez.
Distribuciones muestrales: se consideran todas la muestras de tamaño que puedan extraerse de una población, con o si reposición; entonces: cada muestra tendrá valores específicos para estadísticos particulares (media y desviación típica) Los valores variarán (mucho o poco) de una muestra a otra A partir de los valores de estos estadísticos, por muestra, se obtiene una distribución del estadístico, llamada distribución muestral. 3
Distribuciones muestrales de medias: Consideremos una población finita de tamaño p > Se extraen sin reposición todas las muestras posibles de tamaño Sea µ la media de una distribución muestral de medias y la desviación típica de la distribución, entonces: µ µ y Si la población es infinita, o si el muestreo se hace con reposición, entonces µ µ y p p 4
si el valor de es grande ( 30 la distribución muestral de las medias muestrales es aproximadamente normal con: µ y µ independientemente de la población, bajo la condición que media y varianza poblacionales sean finitas y p. Si la población es infinita, por el teorema del límite central la distribución muestral es asintóticamente normal; es decir que la exactitud de la aproximación aumenta a medida que lo hace. Si la población está distribuida normalmente, la distribución muestral de las medias también lo será, aun cuando sea pequeño ( 30). ota: a la desviación típica de un estadístico se le denomina error típico del estadístico. 5
EJEMPLO: población de cinco números: {, 3, 6, 8, } tamaño de la muestra ( ). Determinación de los estadísticos descriptivos de la población: i ( x ) i µ x i µ + 3 + 6 + 8 + 5 i 4 + ( 3) + + + 5 6 0,8 0,8 3,86 6
. Muestreo con reposición. Distribución muestral de las medias y media de la distribución muestra media muestra media muestra media muestra media muestra media,0 3,5 6 4,0 8 5,0 6,5 3,5 3 3 3,0 6 3 4,5 8 3 5,5 3 7,0 6 4,0 3 6 4,5 6 6 6,0 8 6 7,0 6 8,5 8 5,0 3 8 5,5 6 8 7,0 8 8 8,0 8 9,5 6,5 3 7,0 6 8,5 8 9,5,0 0,0,5 30,0 35,0 4,5 S 5,0 Sumatoria total 50,0 µ 50 5 n 6 ( ) i 35 5 5,4 5,4,3 0,8 Es verificable que para muestreo con reposición: 5, 4 7
Teoría de la decisión Distribución muestral de las medias,0,5 3,0 4,0 4,5 5,0 5,5 6,0 6,5 7,0 8,0 8,5 9,5,0 f 4 p(x) 0,04 0,08 0,04 0,08 0,08 0,08 0,08 0,04 0,08 0,6 0,04 0,08 0,08 0,04 0,8 distribución muestral de las medias 8 8 7 0,6 Probabilidad 0,4 0, 0,0 0,08 0,06 0,04 0,0 6 4 4 3 3 0,00,0,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 0,0,0,0 4 6 8 0 8
Teoría de la decisión. Muestreo sin reposición. Distribución muestral de las medias y media de la distribución muestra media muestra media muestra media muestra media 3,5 3 6 4,5 6 8 7,0 8 9,5 6 4,0 3 8 5,5 6 8,5 8 5,0 3 7,0 5,5 6,5 7,0 8,0 µ 60 0 6 p p 3,86 5 5,05 9
Teoría de la decisión Distribución muestral de las medias,5 4,0 4,5 5,0 5,5 6,5 7,0 8,5 9,5 f p(x) 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,5 distribución muestral de las medias 4 0,0 3 Probabilidad 0,5 0,0 0,05,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 0,0 Medias muestrales 4 6 8 0
Comparación de los resultados Muestreo con repos. sin repos. Población 6,000 6,000 6,000,34,03 3,86 5,400 4,05 0,800 µ Razone: () Qué tan representativas son las muestras? () Porqué las similitudes? Porqué las diferencias? (4) Realice el ejercicio con muestras de tamaño tres ( 3) con muestreo con y sin reposición. Compare los resultados y enuncie conclusiones válidas.
En una población grande se define la siguiente variable aleatoria: : cantidad de errores por cada 750 líneas de código fuente P(x) está distribuida uniformemente tal que p(x)0,5, para {,, 3, 4} 3 4 p(x) 0,5 0,5 0,5 0,5 n i n i µ x. p( ),5 x. p( x ) µ, 5, i x i i Muestras de tamaño dos () con reposición muestra media muestra media muestra media muestra media,0,5 3,0 4,5,5,0 3,5 4 3,0 3,0 3,5 3 3 3,0 4 3 3,5 4,5 4 3,0 3 4 3,5 4 4 4,0 i
,0,5,0,5 3,0 3,5 4,0 f 3 4 3 p(x) 0,06 0,3 0,9 0,5 0,9 0,3 0,06 µ 40 6,5 0,30 0,5 distribución de las medias muestrales 4 4 probabilidad 0,0 0,5 0,0 3 3 0,05 0,00 0,0,0,0 3,0 4,0 5,0 medias muestrales 3 4 3