Curso de Estadística Aplicada a las Ciencias Sociales

Documentos relacionados
Curso de Estadística Aplicada a las Ciencias Sociales. Tema 11. Estimación de una media. Introducción. Introducción (2) Introducción

Unidad Temática 2: Unidad 5 Estadística Inferencial Temas 10 y 11

Teoría de muestras. Distribución de variables aleatorias en el muestreo. 1. Distribución de medias muestrales

TAMAÑO DE MUESTRA EN LA ESTIMACIÓN DE LA MEDIA DE UNA POBLACIÓN

Tema 4: Estimación por intervalo (Intervalos de Confianza)

INTERVALOS DE CONFIANZA. La estadística en cómic (L. Gonick y W. Smith)

Curso de Estadística Aplicada a las Ciencias Sociales. Tema 12. Contraste de hipótesis. Introducción. Introducción

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 8) TEMA Nº 8 ESTIMACIÓN

Estadística Inferencial. Sesión 2. Distribuciones muestrales

TEMA 2: Estimadores y distribuciones en el muestreo. Alfredo García Hiernaux. Grupos 69 y 73 Estadística I. Curso 2006/07

INTERVALOS DE CONFIANZA Julián de la Horra Departamento de Matemáticas U.A.M.

Teoría de la decisión

Distribuciones Muestrales e Intervalos de Confianza

Técnicas de Muestreo Métodos

Notas de clase Estadística R. Urbán R.

ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 11) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía

6. Inferencia con muestras grandes. Informática. Universidad Carlos III de Madrid

Teoría de la decisión

UNIVERSIDAD ALONSO DE OJEDA ESTADISTICA II

ESTIMACION INFERENCIA ESTADISTICA

Tema 5: Introducción a la inferencia estadística

Probabilidad y Estadística

Bioestadística: Inferencia Estadística. Análisis de Una Muestra

Estimaciones puntuales. Estadística II

Muestreo y. Distribuciones Muestrales

Tema 4 - Introducción

Cap 7 Intervalos de Confianza

Censo Nacional de Población, Hogares y Viviendas 2010 Censo del Bicentenario

Variables aleatorias 1. Problema 1

Problemas de Estimación de una y dos muestras

ESTADÍSTICA II UNIDAD I: ESTIMACIÓN DE PARÁMETROS 3RA PARTE (CLASE 20/09)

Estadística y sus aplicaciones en Ciencias Sociales 5. Estimación. Facultad de Ciencias Sociales, UdelaR

Tema 6: Introducción a la inferencia estadística Parte 1

COEFICIENTE DE ERROR TÍPICO

Intervalo para la media si se conoce la varianza

Tema 8. Poblaciones y muestras

TEMA 2: EL PROCESO DE MUESTREO

1 CÁLCULO DE PROBABILIDADES

Examen de Matemáticas Aplicadas a las CC. Sociales II (Modelo 2015) Selectividad-Opción A Tiempo: 90 minutos

CAPITULO VII Muestreo Aleatorio Simple

Muestreo e intervalos de confianza

SIGMA LA INFERENCIA ESTADÍSTICA Y LAS TIC (2ª PARTE). ESTIMACIÓN POR INTERVALOS DE CONFIANZA. Rosana Álvarez García (*) y Abel Martín (**)

Resumen teórico de los principales conceptos estadísticos

Tema 7 Intervalos de confianza Hugo S. Salinas

Tema 13: Distribuciones de probabilidad. Estadística

CAPITULO XII Muestreo Aleatorio Simple

Estadística Inferencial. Sesión 3. Estimación de parámetros y por intervalos

UNIVERSIDAD DE MANAGUA Al más alto nivel

PREFERENCIA ELECTORAL RUMBO AL 2009 ENCUESTA NACIONAL NOVIEMBRE 2010

La Estadística inferencial. Estadística inferencial. La Estadística inferencial. La Estadística inferencial. La Estadística inferencial

CAPITULO 8 MUESTRAS ALEATORIAS Y NUMEROS ALEATORIOS

Distribución Gaussiana o normal

Estadística I Tema 7: Estimación por intervalos

INTRODUCCIÓN AL ANÁLISIS DE DATOS FEBRERO Código asignatura: EXAMEN MODELO B DURACION: 2 HORAS

Estadística Inferencial

Probabilidad del suceso imposible

ALGUNAS CUESTIONES DESTACABLES EN INFERENCIA ESTADÍSTICA

UNIVERSIDAD TECNICA PARTICULAR DE LOJA ESTADISTICA Y PROBABILIDAD ENSAYO N 8

INFERENCIA ESTADÍSTICA MUESTRAL TEMA 2: ESTIMACIÓN POR INTERVALO

INFERENCIA DE LA PROPORCIÓN

Estructura de este tema. Tema 3 Contrastes de hipótesis. Ejemplo

Elementos de Probabilidad y Estadística. Primer Examen. Parte 2

ESTADÍSTICA Y PROBABILIDAD

Tema 8: Contrastes de hipótesis

Juan Carlos Colonia INFERENCIA ESTADÍSTICA

PROBLEMAS RESUELTOS SELECTIVIDAD ANDALUCÍA 2006 MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES TEMA 6: TEORÍA DE MUESTRAS

DISEÑO Y CÁLCULO DE TAMAÑO DE MUESTRA PARA SU APLICACIÓN A LOS ESTUDIOS DE INVESTIGACIÓN. FACILITADOR: JOSÉ CRISTO NOVA

Tema 4: Variables Aleatorias

Intervalos de confianza Muestras grandes. Estadística Cátedra Prof. Tamara Burdisso

ESTIMACIÓN PUNTUAL Julián de la Horra Departamento de Matemáticas U.A.M.

Estimación. Introducción. Sea X la variable aleatoria poblacional con distribución de probabilidad f θ donde. es el parámetro poblacional desconocido

Teorema Central del Límite (1)

TEMA 4: CONTROL POR VARIABLES Hoja de ejercicios (Entregar el 7 -problema de examen-)

Tema 7: Introducción a la probabilidad

APROBACIÓN PRESIDENCIAL Y CUARTO INFORME DE GOBIERNO ENCUESTA NACIONAL TRIMESTRAL, AGOSTO 2010

Estadística Inferencial. Sesión 4. Estimación por intervalos

Anota aquí tus respuestas para esta sección Distribución Z

1. Muestreo e Inferencia Estadística

PROBLEMAS RESUELTOS SELECTIVIDAD ANDALUCÍA 2008 MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES TEMA 6: TEORÍA DE MUESTRAS

MUESTREO E INFERENCIA ESTADÍSTICA

INVESTIGACION Y MERCADOS

PROBLEMAS DE DISTRIBUCIÓN NORMAL Y INTERVALOS DE CONFIANZA MATEMÁTICAS APLICADAS A LAS CC.SOCIALES II

Unidad 1 DISTRIBUCIONES MUESTRALES Objetivo particular El alumno identificará distribuciones discretas y continuas, obtendrá la probabilidad de

1. Lanzamos una moneda 400 veces. Halla la probabilidad de que el número de caras sea mayor que 200.

Ejercicio 1(12 puntos)

SOLUCIÓN EXAMEN IV Nombres: Apellidos: C.I.: Firma: Fecha: 19/11/2004

2. Distribuciones de Muestreo

Estadística Inferencial. Resúmen

PROBLEMAS RESUELTOS SELECTIVIDAD ANDALUCÍA 2007 MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES TEMA 6: TEORÍA DE MUESTRAS

ESTADÍSTICA. Tema 4 Intervalos de confianza

Tema 5.5: Contrastes de hipótesis

Curso: Inferencia Estadística (ICO 8306) Profesores: Esteban Calvo Ayudantes: José T. Medina ESTIMACIÓN POR INTERVALO

PROBLEMAS RESUELTOS SELECTIVIDAD ANDALUCÍA 2002 MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES TEMA 6: TEORÍA DE MUESTRAS

EJERCICIOS PROBABILIDAD (1) 2. Sean A y S dos sucesos de un espacio muestral tales que P(A)=0 4; P(A S)=0 5 y P(S/A)= 0 5 Calcular P(S) y P(A/ S )

ACTIVIDAD 3: Intervalos de Confianza para 1 población

BLOQUE 3 TEMA 11 ESTIMACIÓN DE PARÁMETROS. ERRORES DE ESTIMACIÓN

Fundación H.A. Barceló Facultad de Medicina. Licenciatura en Nutrición Bioestadística Primer año Módulo 10 Lección 3

CONFIABILIDAD DE LOS INSTRUMENTOS DE EVALUACIÓN Santiago Salas Ver

Inferencia Estadística. Estimación y Contrastes

INFERENCIA ESTADÍSTICA

Transcripción:

Curso de Estadística Aplicada a las Ciencias Sociales Tema 10. Estimación de una proporción Cap. 0 del manual Tema 10. Estimación de una proporción Introducción 1. Distribución en el muestreo de una proporción. Estimadores centrados 3. El error típico de la estimación 4. Intervalos de confianza 5. Estimaciones en poblaciones pequeñas 6. Determinación del tamaño muestral Resumen Ejercicios Tema 10, Estimación de una proporción

Introducción Hasta ahora: estadística descriptiva (para describir datos) Ahora: estadística inferencial Para inferir datos sobre una población de la cual no tenemos todos los datos, a partir de los datos de una muestra, que sí tenemos Tema 10, Estimación de una proporción 3 Introducción () En este tema: estimación de una proporción Cuál es la proporción de los elementos de una población que tiene una característica (votar a partido A, tener tal opinión, consumir tal producto, ir a la iglesia los domingos...) Tema 10, Estimación de una proporción 4

Introducción (3) Procedimiento: tomar una muestra aleatoria simple (lo vimos en el tema 8); Calcular la proporción que tiene la característica en la muestra (estimador) Calcular el valor del parámetro en la población, para lo que tenemos que tener una idea sobre la precisión del estimador Tema 10, Estimación de una proporción 5 Introducción (4) El mismo estimador puede tener niveles de precisión muy diferentes Ejemplo, estimador del 30% (0,30) calculado Encuestando a.000 personas de una población de varios millones (600 dicen votarán a partido A) Encuestando a 60 de 90 estudiantes (18 aficionados al teatro) Tema 10, Estimación de una proporción 6

1. Distribución en el muestreo de una proporción Cómo calcular cuánto se puede alejar el estimador del parámetro? Imaginamos situación ficticia Población muy grande (N) Una cierto número de personas, n 1 tiene una característica La proporción de personas que tienen la característica es pn 1 /N (la frecuencia relativa). Supongamos p0,4 La proporción de personas que no tienen la característica es q1-p. Sería en este caso q0,6 Tema 10, Estimación de una proporción 7 1. Distribución en el muestreo de una proporción En una urna (la urna A) ponemos una bola por cada persona Si tiene la característica: un 1. Si no la tiene: un 0 Número de personas con la característica es igual al sumatorio de los valores de las bolas x i n n 1 1+ ( N n1 ) 0 Media es igual a la proporción de personas que tienen la característica xi n1 x N N Tema 10, Estimación de una proporción 8 p 1

1. Distribución en el muestreo de una proporción Sacamos de la urna A una muestra de 10 bolas. Escribimos proporción en una papeleta: otra urna distinta (urna B) Devolvemos bolas a urna A y seguimos sacando muestras de 10 bolas, apuntando proporciones en papeletas en urna B Al final, urna B, llena de papeletas con resultados de muestreo Tema 10, Estimación de una proporción 9 1. Distribución en el muestreo de una proporción Qué tendríamos en urna B? Una variable aleatoria La mayor parte de los valores: en torno a p (0,4) Si las muestras han sido pequeñas (10, 15, 5): habrá algunas muestras con valores alejados de p Si muestras más grandes (más de 30 elementos): casi todas las muestras con poca variación de p Lo que es crucial: Distribución normal Tema 10, Estimación de una proporción 10

1. Distribución en el muestreo de una proporción 300 1.000 muestras de 10 elementos 50 00 15 51 01 150 100 11 111 50 0 40 4 11 0 0 0,1 0, 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 Tema 10, Estimación de una proporción 11 1. Distribución en el muestreo de una proporción 1.000 muestras de 100 elementos 00 180 160 140 10 100 80 60 40 0 0 161 153 144 14 108 86 69 51 37 6 16 11 0 6 4 1 0 0 0, 0,4 0,6 0,8 0,3 0,3 0,34 0,36 0,38 0,4 0,4 0,44 0,46 0,48 0,5 0,5 0,54 0,56 0,58 0,6 Tema 10, Estimación de una proporción 1

1. Distribución en el muestreo de una proporción 1.000 muestras de 1.000 elementos 300 50 43 38 00 150 166 155 100 76 68 50 0 3 0 0 0 1 5 4 1 0 0 0 0,3 0,33 0,34 0,35 0,36 0,37 0,38 0,39 0,4 0,41 0,4 0,43 0,44 0,45 0,46 0,47 0,48 0,49 Tema 10, Estimación de una proporción 13. Estimadores centrados La variable proporción muestral estimada (la variable cuyos valores están en la urna B) es una variable aleatoria, como las vistas en el tema 9 Media de la urna B media de la urna A Lógico: media urna B media valores urna A contados muchas veces Media de la urna B proporción en la urna A (recordar cuando 0,1, media proporción) Tema 10, Estimación de una proporción 14

3. El error típico En la vida real no tenemos la urna B, para calcular su media (y eso nos daría la mediaproporción de la población) Tenemos sólo un estimador (una papeleta de la urna B) Cuánto puede alejarse el estimador de su media (y por tanto, del parámetro)? La respuesta: la desviación típica de los valores de la urna B Error típico de la estimación: la desviación que en promedio podemos esperar entre un estimador y el parámetro en la población (que es la media de los estimadores) Tema 10, Estimación de una proporción 15 3. El error típico Intuitivamente: el error típico de la estimación será menor cuanto mayor sea la muestra Fórmula (aquí no demostramos). Si llamamos n al tamaño de la muestra: sx ET n Es decir, el error típico es siempre menor que la desviación típica en la población Y será menor cuanto mayor sea la muestra Pero no disminuye proporcionalmente, sino proporcionalmente a la raíz de n Tema 10, Estimación de una proporción 16

3. El error típico En una variable con valores 0,1 se puede demostrar que s x p(1 p) pq ((1 p) p) + ((0 p) (1 p)) ((1 + p p) p) + ((0 + p 0p)(1 p) ) p+ p s 3 x ( c p + p(1 p i x c p 3 ) f p) pq i p p Tema 10, Estimación de una proporción 17 3. El error típico El error típico será entonces ET pq n Ejemplo: población con proporción de 0,4, y extraemos muestras de 10 elementos 0,4(1 0,4) ET 10 El ET será 0,15 0,4 0,6 10 0,4 10 0,04 0,15 Tema 10, Estimación de una proporción 18

3. El error típico Pero entonces, si la fórmula del ET incluye p y q, y si precisamente hemos hecho muestra para calcular p y q círculo vicioso? No: podemos ver en tabla que n es mucho más importante que p y q para calcular ET Tema 10, Estimación de una proporción 19 3. El error típico Valores del ET según valores de n y p p n 10 50 100 500 1.000 3.000 5.000 0,01 0,031 0,014 0,010 0,004 0,003 0,00 0,001 0,05 0,069 0,031 0,0 0,010 0,007 0,004 0,003 0,1 0,095 0,04 0,030 0,013 0,009 0,005 0,004 0, 0,16 0,057 0,040 0,018 0,013 0,007 0,006 0,3 0,145 0,065 0,046 0,00 0,014 0,008 0,006 0,4 0,155 0,069 0,049 0,0 0,015 0,009 0,007 0,5 0,158 0,071 0,050 0,0 0,016 0,009 0,007 0,6 0,155 0,069 0,049 0,0 0,015 0,009 0,007 0,7 0,145 0,065 0,046 0,00 0,014 0,008 0,006 0,8 0,16 0,057 0,040 0,018 0,013 0,007 0,006 Tema 10, Estimación de una proporción 0

3. El error típico Para un mismo valor de p error varía mucho según tamaño de n Para un mismo tamaño de n error no varía mucho con cambios en p (más alto error cuanto mayor es p, hasta máximo en 0,5) (Por cierto): ET es bastante bajo incluso para muestras de sólo 1.000 elementos Tema 10, Estimación de una proporción 1 3. El error típico En resumen: podemos hacer estimación de ET con dos supuestos: Suponiendo el caso más desfavorable, que es pq0,5 Suponer, para calcular el ET, que p fuera igual a la estimación Tema 10, Estimación de una proporción

3. El error típico Ejemplo: muestra de 1.000 encuestados, 0,8 dicen que van a votar a partido A. Dos estimaciones de ET ET 0,8 0,7 1000 0,016 1000 0,000016 0,014 ET 0,5 0,5 1000 0,5 1000 0,0005 0,0158 Tema 10, Estimación de una proporción 3 4. Intervalos de confianza Dado un estimador, y un ET, podemos calcular en qué intervalo debe estar el parámetro en la población, con un cierto nivel de confianza Ejemplo: muestra de 1.000 personas, estimador de 0,0 ET 0, 0,8 1000 0,16 1000 0,00016 0,016 Tema 10, Estimación de una proporción 4

4. Intervalos de confianza La distribución de las variables aleatorias derivadas de un experimento aleatorio con más de 30 elementos es una distribución normal Propiedad de las distribuciones normales (tema 9) : 68,3% de los casos a menos de 1dt de la media 95,5% de los casos a menos de dt de la media 99,7% de los casos a menos de 3 dt de la media Tema 10, Estimación de una proporción 5 4. Intervalos de confianza Por esa razón, cuando tenemos una muestra, en la que hemos calculado una proporción y un ET (que es la desviación típica de las muestras) Podemos decir que la proporción media de todas las muestras (y, por tanto, la de la población) estará con un 68,3% de confianza (o de probabilidad) en el intervalo: estimador ± 1 ET 95,5% de confianza (o de probabilidad) en el intervalo: estimador ± ET 99,7% de confianza (o de probabilidad) en el intervalo: estimador ± 3 ET Tema 10, Estimación de una proporción 6

4. Intervalos de confianza El intervalo de confianza es un rango de valores que incluye el valor del parámetro en la población, con una determinada probabilidad En el ejemplo que poníamos (estimación es 0,0 y ET es 0,016) Podemos decir que el verdadero parámetro, con un 68,3% de confianza está en en el intervalo de 0,0 ± 0,016 (es decir, entre 0,1874 y 0,16) 95,5% de confianza está en el intervalo de 0,0 ± 0,05 (es decir, entre 0,1748 y 0,5) 99,7% de confianza está en el intervalo de 0,0 ± 0,0378 (es decir, entre 0,16 y 0,378) Tema 10, Estimación de una proporción 7 4. Intervalos de confianza Dicho de otra forma, el ET nos permite calcular el error muestral (la diferencia entre el estimador y el parámetro) Podemos decir que el error muestral será, con: 68,3% de confianza (o de probabilidad), menor o igual a 1ET 95,5% de confianza (o de probabilidad), menor o igual a ET 99,7% de confianza (o de probabilidad), menor o igual a 3 ET Tema 10, Estimación de una proporción 8

5. Estimación en poblaciones pequeñas Cuando tamaño población es pequeño comparado con tamaño de la muestra y muestreo sin reposición (60 alumnos de clase de 90): la fórmula del ET cambia La distribución de los errores de estimación sigue siendo aproximadamente normal El estimador sigue centrado (igual al parámetro) Tema 10, Estimación de una proporción 9 5. Estimación en poblaciones pequeñas Pero: la desviación típica de la distribución de los estimadores muestrales es menor que el caso de población infinita Fórmula: siendo la fracción de muestreo, f n/n ET pq x 1 n Tema 10, Estimación de una proporción 30 f

5. Estimación en poblaciones pequeñas Ejemplo. Si en población de 500 personas tomamos muestra de 100 (f 100/5000,) y obtenemos estimador de 0,3 ET 0,3 0,7 100 x 1 0, 0,0458 0,894 0,040 Correspondiente, los intervalos de confianza serán también más pequeños Tema 10, Estimación de una proporción 31 6. Determinación del tamaño muestral Hemos visto que a partir de n se pueden estimar ET, y el intervalo de confianza Pero podemos operar también al revés: a partir del intervalo de confianza que queremos, podemos calcular el ET, y a partir de él podemos calcular qué tamaño debe tener la muestra Tema 10, Estimación de una proporción 3

6. Determinación del tamaño muestral Ejemplo: queremos hacer encuesta con un intervalo no mayor de ± 0,04, con el 95,5% de confianza El intervalo con el 95,5% de confianza es el parámetro obtenido ± ET Por tanto, si el intervalo que admitimos es ± 0,04, el ET será 0,0 Tema 10, Estimación de una proporción 33 6. Determinación del tamaño muestral Para calcular el tamaño de la muestra, despejamos su valor en la fórmula del error muestral o error típico pq ET n pq ET n pq n ET Tema 10, Estimación de una proporción 34

6. Determinación del tamaño muestral Cuando no sabemos los valores de p y q de antemano (normalmente) (0,5)(0,5) n ET 0,5 ET Entonces, en el ejemplo puesto: n 0,5 0,0 0,5 0,0004 65 Tema 10, Estimación de una proporción 35 6. Determinación del tamaño muestral Otra manera de decir lo mismo Cuando buscamos un intervalo con una confianza del 95,5%: amplitud del intervaloet Por tanto: ETAmplitud intervalo/ Retomando la fórmula anterior: 0,5 0,5 n ET amplitud del intervalo 4 0,5 ( amplitud del intervalo) ( amplitud del intervalo) 1 0,5 ( amplitud del intervalo) 4 Tema 10, Estimación de una proporción 36

Resumen Distribución en el muestreo Media proporción Desviación típica error típico Fórmula del ET Intervalos de confianza Estimación en poblaciones pequeñas Cálculo de muestra a partir de objetivo de error y nivel de confianza Tema 10, Estimación de una proporción 37 Ejercicios recomendados Del manual: 0.4 0.5 b) y c) 0.6 De exámenes: Feb0, Jun0: 10 Feb03, Sep03: 1 Feb04: 11 Jul04: 10 Feb05, Jul05: 1 Ene07, Ene08, Jun08: 8 Tema 10, Estimación de una proporción 38