Tema 5. Muestreo y distribuciones muestrales

Documentos relacionados
Tema 5. Muestreo y distribuciones muestrales

Tema 4: Probabilidad y Teoría de Muestras

INTERVALOS DE CONFIANZA. La estadística en cómic (L. Gonick y W. Smith)

Teorema Central del Límite (1)

Simulación I. Investigación Operativa, Grado en Estadística y Empresa, 2011/12

ANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada.

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos

Estadistica II Tema 1. Inferencia sobre una población. Curso 2009/10

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

LECTURA 01: LA DISTRIBUCIÓN NORMAL GENERAL. LA DISTRIBUCIÓN NORMAL ESTÁNDAR (PARTE I). TEMA 1: LA DISTRIBUCION NORMAL GENERAL.

Conceptos Básicos de Inferencia

Introducción a la Probabilidad

ESCUELA COMERCIAL CÁMARA DE COMERCIO EXTENSIÓN DE ESTUDIOS PROFESIONALES MAESTRÍA EN ADMINISTRACIÓN

VARIABLES ALEATORIAS DISCRETAS

ESTADISTICA APLICADA: PROGRAMA

TEMA 3: Contrastes de Hipótesis en el MRL

ESTADÍSTICA. Tema 4 Regresión lineal simple

RESUMEN DE ALGUNOS CONCEPTOS ESTADÍSTICOS ELEMENTALES Y NOTACIÓN EMPLEADA EN EL CURSO

Variable Aleatoria Continua. Principales Distribuciones

Indicaciones para el lector... xv Prólogo... xvii

Tema 5. Contraste de hipótesis (I)

Matemáticas 2.º Bachillerato. Intervalos de confianza. Contraste de hipótesis

2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...

ESTIMACIÓN PUNTUAL Julián de la Horra Departamento de Matemáticas U.A.M.

ESTADÍSTICA DESCRIPTIVA

CONTENIDO. Prólogo a la 3. a edición en español ampliada... Prólogo...


Medidas de dispersión

Conceptos básicos estadísticos

INFERENCIA ESTADISTICA

Pregunta 1. Pregunta 2. Pregunta 3. Pregunta 4. Pregunta 5. Pregunta 6. Pregunta 7. Comenzado el lunes, 25 de marzo de 2013, 17:24

Variables aleatorias

Probabilidad II Algunas distribuciones notables. Antonio Cuevas Departamento de Matemáticas Universidad Autónoma de Madrid

Otra característica poblacional de interés es la varianza de la población, 2, y su raíz cuadrada, la desviación estándar de la población,. La varianza

INTERPRETACIÓN DE LA REGRESIÓN. Interpretación de la regresión

Ejercicios T2 y T3.- DISTRIBUCIONES MUESTRALES Y ESTIMACIÓN PUNTUAL

CONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS

Fase 2. Estudio de mercado: ESTADÍSTICA

Probabilidad y Estadística

Tema 5: Introducción a la inferencia estadística

MÓDULO 1: GESTIÓN DE CARTERAS

JUNIO Opción A

2.- Tablas de frecuencias

Distribución Chi (o Ji) cuadrada (χ( 2 )

Métodos Estadísticos de la Ingeniería Tema 7: Momentos de Variables Aleatorias Grupo B

EJERCICIOS DE ESTADÍSTICA:

Muestreo probabilístico. Estimadores

478 Índice alfabético

CAPÍTULO I. INTRODUCCIÓN. Cuando se requiere obtener información de una población, y se desean obtener los mejores

1 Método de la bisección. 1.1 Teorema de Bolzano Teorema 1.1 (Bolzano) Contenido

Programa. Asignatura: Estadística Aplicada. año de la Carrera de Contador Público

Multicolinealidad. Universidad de Granada. RSG Incumplimiento de las hipótesis básicas en el modelo lineal uniecuacional múltiple 1 / 17

Intervalos para la diferencia de medias de dos poblaciones

UNIDAD 6. Estadística

UNIVERSIDAD AUTONOMA DE SANTO DOMINGO

Variables aleatorias unidimensionales

TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD

Facultad de Ciencias Sociales - Universidad de la República

Unidad Temática 5 Estimación de parámetros: medias, varianzas y proporciones

Tema 2. Descripción Conjunta de Varias Variables

Estimación no-paramétrica Máximo Camacho Alonso Universidad de Murcia

A qué nos referimos con medidas de dispersión?

Estadística y sus aplicaciones en Ciencias Sociales 7. El modelo de regresión simple. Facultad de Ciencias Sociales - UdelaR

Examen de Matemáticas Aplicadas a las CC. Sociales II (Septiembre 2009) Selectividad-Opción A Tiempo: 90 minutos

Variables aleatorias

INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 29 de Abril de 2016

Estadística Descriptiva. SESIÓN 11 Medidas de dispersión

Dispone de 1 hora para resolver las siguientes cuestiones planteadas.

Distribuciones de probabilidad

PONTIFICIA UNIVERSIDAD CATOLICA DEL ECUADOR FACULTAD DE INGENIERIA ESCUELA DE INGENIERIA DE SISTEMAS

ÍNDICE INTRODUCCIÓN... 21

1º CURSO BIOESTADÍSTICA

Transformaciones de variables

Técnicas Cuantitativas para el Management y los Negocios I

Técnicas de Inferencia Estadística II. Tema 3. Contrastes de bondad de ajuste

Programación entera: Ejemplos, resolución gráfica, relajaciones lineales. Investigación Operativa, Grado en Estadística y Empresa, 2011/12

Algebra lineal y conjuntos convexos

Contrastes de hipótesis paramétricos

6. ESTIMACIÓN DE PARÁMETROS

INFERENCIA ESTADÍSTICA. Metodología de Investigación. Tesifón Parrón

Máster en comunicaciones. Clase 2. Modelos predictores.

Prácticas de Ecología Curso 3 Práctica 1: Muestreo

b) dado que es en valor absoluto será el área entre -1,071 y 1,071 luego el resultado será F(1,071)-(1-F(1,071)=0,85-(1-0,85)=0,7

UNIVERSIDAD AUTONOMA DE SANTO DOMINGO

DISTRIBUCIÓN N BINOMIAL

Estadística para investigadores: todo lo que siempre quiso saber y nunca se atrevió a preguntar

Tema de la sesión: TEMA 4 Método Direct Costing

Pruebas de Acceso a las Universidades de Castilla y León

ESTADÍSTICA DESCRIPTIVA PARA EL TURISMO

6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE

MATERIA: MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES II INSTRUCCIONES Y CRITERIOS GENERALES DE CALIFICACIÓN

Pruebas de Bondad de Ajuste

CAPÍTULO 4 RECOPILACIÓN DE DATOS Y CÁLCULO DEL VPN. En el presente capítulo se presenta lo que es la recopilación de los datos que se tomarán

Distribuciones muestrales. Distribución muestral de Medias

Análisis de datos Categóricos

CDEE. Cuestiones 3er Ejercicio. 0 si x 1. k(x + 1) + x2 1. k(x + 1) x si x > 1

PROGRAMA ACADEMICO Ingeniería Industrial

Estimación puntual. Estadística II. Curso 2011/2012. Universidad de Salamanca

Validación de los métodos microbiológicos HERRAMIENTAS ESTADISTICAS. Bqca. QM Alicia I. Cuesta, Consultora Internacional de la FAO

Tema 2 - Introducción

Transcripción:

1 Tema 5. Muestreo y distribuciones muestrales En este tema: Muestreo y muestras aleatorias simples. Distribución de la media muestral: Esperanza y varianza. Distribución exacta en el caso normal. Distribución aproximada en el caso general (teorema central del ĺımite). Distribución de la varianza muestral: Esperanza. Distribución en el caso normal.

2 Muestreo Motivación En muchos casos se desea obtener información estadística sobre poblaciones numerosas: Situación laboral de las personas en edad de trabajar en España. Fiabilidad de un modelo de automóvil en un año. Precipitación anual en la Comunidad de Madrid. Puede ser imposible (por falta de recursos) obtener la información relativa a todos los individuos. Se estudia una muestra significativa de la población. Un subconjunto de la población que permita obtener información fiable sobre el total de dicha población.

Muestras aleatorias simples 3 Cómo seleccionar una muestra Tamaño reducido. Ausencia de sesgos. Conclusiones obtenidas de la muestra son válidas para la población. Facilidad en la definición de la muestra. Mejor alternativa: Muestras aleatorias simples Cada miembro de la población tiene la misma probabilidad de pertenecer a la muestra. La selección se realiza de manera independiente. La selección de un individuo concreto no afecta a la probabilidad de seleccionar cualquiera de los otros.

4 Procedimiento de inferencia Partiendo de la distribución de la variable aleatoria en la muestra Obtener información sobre distribución de la variable en la población Valores de interés: cálculo de estadísticos para la media, varianza, proporciones 15,00 DATOS POBLACIÓN 11,25! Muestreo 7,50 3,75 0 Parámetros población,! 10,0 9,5 DATOS MUESTRA 7,5 5,0 2,5 0 3,8 4,5 1,6 0,2 0,8 1,5 Inferencia! Parámetros muestra, l

5 Ejemplo de muestreo e inferencia Ejemplo Consideremos el ejemplo de la figura anterior: Población compuesta por 24 individuos. Variable aleatoria de interés: Tiempo para completar una consulta médica. Valores: Población 5,1 1,0 0,9 3,8 10,2 2,1 9,5 4,5 1,0 2,2 1,5 4,8 1,6 8,8 4,3 1,0 9,0 5,1 0,2 2,3 0,8 7,8 7,7 1,5 Promedio de la población: 4, 0

Ejemplo de muestreo e inferencia 6 Muestra 1 Muestra seleccionada en la figura, tamaño 7: Muestra 3,8 9,5 4,8 1,6 0,2 0,8 1,5 Estadístico de interés: promedio de la muestra 3, 1. Error (sesgo) relativo: (4, 0 3, 1)/4, 0 = 0, 225. Cambios en el muestreo Selecciones alternativas de los elementos de la muestra. Aumento del tamaño de la muestra.

7 Ejemplo de muestreo Cambios en el tamaño muestral Si a la muestra del ejemplo anterior le añadimos nuevos elementos, el promedio muestral cambia. Se aproxima al valor de la media poblacional 6,0 CAMBIO EN EL PROMEDIO CON EL TAMAÑO MUESTRAL 4,5 3,0 3,1 3,3 3,9 3,6 4,0 4,1 4,6 4,6 4,4 4,2 4,1 4,4 4,4 4,3 4,3 4,0 4,2 4,0 1,5 0 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Tamaño muestral

8 Selección de observaciones Ejemplo de muestreo Si seleccionamos las primeras 7 observaciones: 5,1 1,0 0,9 3,8 18,2 2,1 9,5. Promedio de la muestra: 5, 8. Cambios para diferentes selecciones Todas las selecciones posibles de 7 observaciones (346.104 posibilidades): 25000 DISTRIBUCION DE MEDIAS MUESTRALES TAMAÑO 7 20000 15000 10000 5000 0 1 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 3 3 3 3 4 4 4 4 4 4 4 5 5 5 5 5 5 5 6 6 6 6 6 6 6 7 7 7 7 7 7 7 8 8

Distribuciones en el muestreo 9 Distribución de la media muestral Para todas las muestras de tamaño 7 y 17 obtenemos: DISTRIBUCION DE MEDIAS MUESTRALES TAMAÑO 7 DISTRIBUCION DE MEDIAS MUESTRALES TAMAÑO 17 25000 60000 20000 45000 15000 30000 10000 15000 5000 0 1 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 3 3 3 3 4 4 4 4 4 4 4 5 5 5 5 5 5 5 6 6 6 6 6 6 6 7 7 7 7 7 7 7 8 8 0 1 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 3 3 3 3 4 4 4 4 4 4 4 5 5 5 5 5 5 5 6 6 6 6 6 6 6 7 7 7 7 7 7 7 8 8

Distribuciones en el muestreo Distribución de la varianza muestral Se obtienen resultados similares para otros estadísticos 10 Para la desviación típica de muestras de tamaño 7 obtenemos: 30000 DESVIACIONES TIPICAS MUESTRAS TAMAÑO 7 22500 15000 7500 0 0,5 0,7 0,9 1,1 1,2 1,4 1,6 1,8 1,9 2,1 2,3 2,5 2,6 2,8 3,0 3,2 3,3 3,5 3,7 3,9 4,0 4,2 4,4 4,6 4,7

11 Distribuciones en el muestreo Conclusiones Una muestra aleatoria simple de tamaño n de una v.a. X es un conjunto de v.a. independientes, todas con la misma distribución que X : {X i } n i=1 i.i.d. El valor del promedio muestral es una variable aleatoria (los estadísticos son variables aleatorias). Depende de la selección (aleatoria) de los individuos en la muestra: Distribución muestral del estadístico: distribución de probabilidad del valor de interés para todas las muestras del mismo tamaño. La distribución muestral cambia con el tamaño de la muestra. La variabilidad de los estadísticos muestrales disminuye con el tamaño de la muestra.

12 La distribución de la media muestral El problema de interés La media poblacional es un parámetro de gran interés en muchas situaciones prácticas. Por ejemplo, queremos conocer el promedio de: los ingresos familiares en España el año 2007. la proporción de préstamos morosos el último mes. el precio de compra de viviendas en la Comunidad de Madrid el pasado mes. A partir de una muestra (reducida) de valores queremos calcular: Una buena aproximación al valor correcto (inevitablemente con error). Y una estimación del error en la aproximación.

13 La distribución de la media muestral Ejemplo Información sobre el gasto familiar en España Disponemos de los datos siguientes (gasto anual por hogar, EPF) Gasto 32545,76 3140,24 25205,64 2474,28 10242,34 721,16 4855,80 7449,74 3466,50 4400,80 4740,00 10830,00 16240,88 9840,12 14534,96 14960,00 40000 GASTO ANUAL 30000 20000 10000 0

Algunas respuestas La distribución de la media muestral Muestra de tamaño n, {X i } n i=1, de una variable aleatoria X (gasto de hogares). Queremos estimar la media nacional (esperanza de X ) a partir de la muestra. Se define el estadístico media muestral como X = 1 n LA MEDIA MUESTRAL ES UNA VARIABLE ALEATORIA El valor esperado de la media muestral es la media de la población [ ] 1 n E X i = E[X ] n Estimamos la media de la población a partir de la media de la muestra. i=1 En nuestro ejemplo: 10353,01 euros n i=1 X i 14

15 La distribución de la media muestral Más datos de la distribución Media de una muestra en general diferente de la media de la población Podemos conocer la magnitud del error que estamos cometiendo? Depende de la distribución de la media muestral En particular, de su variabilidad (desviación respecto de la media) En cual de los casos siguientes tenemos menos error? 25000 MEDIAS MUESTRA TAMAÑO 7 - MEDIA = 4,0 60000 MEDIAS MUESTRA TAMAÑO 17 - MEDIA = 4,0 20000 45000 15000 30000 10000 5000 15000 0 1 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 3 3 3 3 4 4 4 4 4 4 4 5 5 5 5 5 5 5 6 6 6 6 6 6 6 7 7 7 7 7 7 7 8 8 0 1 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 3 3 3 3 4 4 4 4 4 4 4 5 5 5 5 5 5 5 6 6 6 6 6 6 6 7 7 7 7 7 7 7 8 8

Distribución de la media muestral 16 La variabilidad de la media muestral La varianza de la media muestral, X, (una medida del error) es [ ] Var[X ] def =. 1 n Var X i = 1 n n σ2 i=1 En el ejemplo anterior, Var[ x] = 76.458.643 y σ[ x] = 8.744 euros. El valor de la varianza decrece si n aumenta. Podemos reducir el error aumentando el tamaño de la muestra. La reducción en el error es lenta. Para reducir el error (medido por la desviación típica) a la mitad debemos aumentar el tamaño de la muestra 4 veces.

17 Distribución de la media muestral La distribución de la media muestral El valor de la varianza de la media muestral sólo nos dice si el error puede ser grande o pequeño. Para obtener una respuesta más precisa deberíamos conocer la distribución de la media muestral. Si la variable X tiene una distribución normal, entonces X = 1 n n X i N(E[X ], σ 2 /n) i=1 (por ser combinación lineal de v.a. indep. con dist. normal, ver Tema 4) Luego, X E[X ] σ2 /n N(0, 1)

Distribución de la media muestral 18 El teorema central del ĺımite Distribución de la media muestral si X no es normal Si cumple ciertas condiciones: Teorema central del ĺımite (ver Tema 3) Dada una muestra aleatoria simple {X i } n i=1 de tamaño n obtenida de una variable aleatoria X con media E[X ] y varianza σ 2 finitas, se cumple que 1 n n i=1 X i E[X ] N(0, 1) σ2 /n cuando n. La distribución de la media muestral se parece a una distribución normal para muestras grandes. Aplicación similar al caso anterior cuando se tienen muestras grandes.

La distribución de la varianza muestral 19 La varianza muestral En muchos casos es importante conocer el valor de la varianza de la población. Para aplicar el teorema central del ĺımite. Para estimar riesgos en inversiones (el riesgo depende de la varianza). Para estimar desigualdades en ingresos, rentas, etc. Se define el estadístico varianza muestral como X = 1 n 1 n (X i X ) 2 i=1 LA VARIANZA MUESTRAL ES UNA VARIABLE ALEATORIA Queremos relacionar su media y su varianza con las de la población. Y si es posible, identificar su distribución.

La distribución de la varianza muestral La esperanza de la varianza muestral Si X denota la media muestral, se tiene que [ ] 1 n E (X i X ) 2 n i=1 = n 1 n σ2 20 El valor esperado de esa v.a. no es la varianza de la población. OJO: la varianza de la media muestral tampoco es la varianza de la población. Por eso definimos la varianza muestral como S 2 = 1 n 1 dividiendo entre n 1 y no entre n. Con esta definición, tenemos E[S 2 ] = σ 2. n (X i X ) 2 i=1 El valor muestral de S 2 (s 2 ) se puede emplear como una aproximación de la varianza de la población.

La distribución de la varianza muestral Distribución de la varianza muestral Nos gustaría tener más información sobre la distr. de la varianza muestral. La varianza muestral es no negativa. La distribución de la varianza muestral es asimétrica a la derecha. Además, si la variable X tiene distribución normal (ver Tema 3) n 1 σ 2 S 2 = 1 n σ 2 (X i X ) 2 χ 2 n 1 distribución χ 2 (chi-cuadrado) con n 1 grados de libertad. DENSIDAD CHI CUADRADO i=1 21 Función de distribución en las tablas 2,5% 95% 2,5%!! "#"!$!! "#%&$