Probabilidad y Estadística Unidad 4 Distribuciones muestrales de probabilidad Prof. Héctor Ulises Cobián L. ulises.cobian@itcolima.edu.mx elcampanariodelasmatematicas.wordpress.com April 14, 2016 1
Razones para el muestreo Las distribuciones de probabilidad se componen de parámetros que en muchos casos se desconocen en la práctica. Por ejemplo Un entrevistador está seguro que las respuestas a sus preguntas "en acuerdo/en desacuerdo" seguirán una distribución binomial pero se desconoce "p", la proporción de los que están de acuerdo en la población. Un agrónomo cree que la población por acre de una variedad de trigo está distribuida normalmente en forma aproximada, pero se desconoce la media y la desviación estándar de la población. En estos casos debemos apoyarnos de la muestra para encontrar estos parámetros. En el primer ejemplo, la proporción de los que están de "acuerdo" en la muestra del entrevistador da información acerca de la probabilidad "p", por tanto, es necesaria una "información confiable" acerca de la población, la muestra debe ser seleccionada de cirta forma. 2
Población, muestra, estadísticas y parámetros Población y muestra Es común que al comprar queso, probar una muestra. Lo mismo realiza un vulcanólogo cuando toma una muestra de los manantiales cerca de un volcán activo, determina cuáles son sus cambios químicos, pero supone al analizar una pequeña porción que todo su contenido es de esa forma. Probar o medir toda la "población" es innecesario, costoso e incluso destructivo. Para determinar las características de un todo, tenemos que muestrear sólo una porción. Estadísticas y parámetros Las distribuciones de probabilidad, como vimos, contienen ciertas características y formas que están dadas por la media, desviación estandar, varianza, mediana: sus medidas de dispersión. Cuando estas medidas describen características de una problación se llaman "parámetros" y cuando describen características de una muestra, se denominan "estadísticas". 3
Tipos de muestreo Existen dos métodos para seleccionar muestras: el muestreo "no aleatorio" o de "jucio" y el muestreo "aleatorio" o de "probabilidad". El muestreo de probabilidad es aquel en donde todos los elementos de la población tienen la mísma probabilidad de ser escogidos para la muestra. En el muestreo de juicio, se emplea el conocimiento y la opinión personal para identificar a los elementos de la población que deben incluirse en la muestra. Existen cuatro métodos de muestreo probabilístico Muestreo aleatorio simple Muestreo sistemático Muestreo estratificado Muestreo conglomerado 4
. La forma en que una muestra se selecciona recibe el nombre de plan muestral o diseño experimental y determina la cantidad de información de la muestra. Saber el plan muestral empleado en una situación particular permitirá medir la confiabilidad o bondad de la inferencia. 5
Definition (Muestreo aleatorio simple) El muestreo aleatorio simple es un plan muestral de uso común en el que cada muestra de tamaño n tiene la misma probabilidad de ser seleccionado. Por ejemplo, supongamos que se desea seleccionar una muestra de tamaño n = 2 de una población que contiene N = 4 objetos. Si los cuatro objetos están identificados por x 1, x 2, x 3, x 4, hay C2 4 pares distintos, o sea seis pares, que podrían seleccionarse. Si la muestra de n = 2 observaciones se selecciona de modo que cada una de estas seis muestras tenga la misma probabilidad de selección, dada por 1 6, entonces la muestra se denomina muestra aleatoria simple o únicamente muestra aleatoria. 6
Formas de seleccionar una muestra de tamaño 2 de entre 4 objetos Muestra observaciones en la muestra 1 x 1, x 2 2 x 1, x 3 3 x 1, x 4 4 x 2, x 3 5 x 2, x 4 6 x 3, x 4 7
Un muestreo aleatorio perfecto es difícil de obtener en la práctica. Si el tamaño N de la población es pequeño, se podría escribir cada uno de los N números en una ficha, mezclar las fichas y seleccionar una muestra de n fichas. Los números que se seleccionen corresponden a las n mediciones que aparecen en la muestra. Como este método no siempre es práctico, un método más sencillo y confiable utiliza números aleatorios, es decir, dígitos generados de modo que los valores de 0 a 9 se presentan al azar y con igual frecuencia. Estos números pueden ser generados por computadora o pueden incluso aparecer en una calculadora científica (depende el caso). Algunos números aleatorios pueden ser 15574 35026 98924 45045 36933 28630 03225 78812 50856 88292 26053 21121 8
Ejemplo Una base de datos de computadora en una empresa urbana contiene archivos para N = 1000 clientes. La empresa desea seleccionar n = 5 archivos para su revisión. Seleccione una muestra aleatoria simple de cinco archivos de esa base de datos. Solución: Primero debe marcar cada archivo con un número de 1 al 1000. A continuación genere una secuencia de 10 números aleatorios de tres dígitos. Si utilizamos los números aleatorios dichos anteriormente, podemos tomarnos los primeros tres dígitos de los primeros cinco números aleatorios. En general puede escoger cualquier método a juicio. 9
Definition (Estrato) Se le llama estrato a toda subpoblación de una población. Definition (Muestra aleatoria estratificada) Una muestra aleatoria estratificada comprende seleccionar una muestra aleatoria simple de cada un número dado de subpoblaciones o estratos. 10
Definition (Conglomerados) Cuando las unidades muestrales disponibles son grupos de elementos se les llama conglomerados. Por ejemplo, una familia es un conglomerado de personas que viven juntas. Una manzana o vecindario de una ciudad podrían ser una cómoda unidad muestral y podría ser considerada como un conglomerado para un plan determinado muestral. 11
Definition (Muestra aleatoria de conglomerados) Una muestra de conglomerados es una simple muestra aleatoria tomada de los conglomerados disponibles en la población. Cuando un conglomerado particular se incluye en la muestra, se toma un censo de cada uno de los elementos del conglomerado. A veces la población a ser muestreada está ordenada, por ejemplo una lista alfabetizada de personas con licencias de manejo, una lista de usuarios de la compañía de luz por direcciones de servicio o una lista de clientes por números de cuenta. En estas y otras situaciones, se escoge un elemento al azar de los primeros k elementos y, a continuación, cada k-ésimo elemento de ahí en adelante se incluye en la muestra. 12
Definition (Muestra aleatoria sistemática) Una muestra aleatoria sistemática 1 en k involucra la selección aleatoria de uno de los primeros k elementos de una población ordenada y luego la selección sistemática de cada k-ésimo elemento de ahí en adelante. 13
Base de la inferencia estadística: el muestreo aleatorio simple El muestreo sistemático, estratificado y el conglomerado intentan aproximarse al muestreo aleatorio simple. Todos son métodos desarrollados por su precisión, su economía y su factibilidad. Los principios del muestreo aleatorio simple son la base de la inferencia estadística, es decir, el proceso de hacer inferencias acerca de las poblaciones a partir de la información contenida en muestras. 14