M. Wiper Estadística 1 / 15 Introducción a la inferencia estadística Michael Wiper Departamento de Estadística Universidad Carlos III de Madrid
M. Wiper Estadística 2 / 15 Objetivo Introducir la distribución en el muestreo y los conceptos básicos de la inferencia estadística.
M. Wiper Estadística 3 / 15 Idea de la inferencia estadística Estadística descriptiva: la edad media de una muestra de 36 personas multadas por exceso de velocidad es 25.
M. Wiper Estadística 3 / 15 Idea de la inferencia estadística Estadística descriptiva: la edad media de una muestra de 36 personas multadas por exceso de velocidad es 25. Modelo Probabilístico: la distribución de edades de la gente que conducen demasiado rápido es normal con media µ y varianza σ 2.
M. Wiper Estadística 3 / 15 Idea de la inferencia estadística Estadística descriptiva: la edad media de una muestra de 36 personas multadas por exceso de velocidad es 25. Modelo Probabilístico: la distribución de edades de la gente que conducen demasiado rápido es normal con media µ y varianza σ 2. Inferencia: la muestra proporciona evidencia para rechazar la hipótesis de que µ < 20.
M. Wiper Estadística 4 / 15 La distribución en el muestreo Distintas muestras tienen distintas medias. Antes de tomar la muestra, la media muestral es una variable. Como cualquiera variable, tiene su distribución de probabilidad.
M. Wiper Estadística 5 / 15 La distribución de la media Supongamos que la verdadera media y varianza de la población son µ y σ 2. Luego: donde n es el tamaño de la muestra. E[ X ] = µ V [ X ] = σ2 Entonces, la media muestral es un estimador insesgado de la media poblacional. Más grande que sea la muestra, menos probable es que la media muestral esté lejos de la media poblacional. Para muestras razonablemente grandes, se puede suponer que la distribución de la media es normal: ) X N (µ, σ2. n n
M. Wiper Estadística 6 / 15 Estimación puntual La media muestral X es un buen estimador de la media poblacional, µ.
M. Wiper Estadística 6 / 15 Estimación puntual La media muestral X es un buen estimador de la media poblacional, µ. Dada la muestra, x es una estimación razonable de la media poblacional, µ.
M. Wiper Estadística 6 / 15 Estimación puntual La media muestral X es un buen estimador de la media poblacional, µ. Dada la muestra, x es una estimación razonable de la media poblacional, µ. Una estimación razonable de la edad media de la gente que conducen demasiado rápido es 25. La proporción de éxitos en una muestra, ˆp es un buen estimador de la probabilidad de éxito. La cuasi-varianza muestral S 2 es un buen estimador de la varianza poblacional σ 2.
M. Wiper Estadística 7 / 15 Estimación por intervalos Además de una estimación puntual, es importante mostrar el grado de incertidumbre en la estimación. Una manera de hacerlo es a través de un intervalo. Queremos conseguir un intervalo que, con bastante seguridad contendrá el verdadero valor µ.
M. Wiper Estadística 7 / 15 Estimación por intervalos Además de una estimación puntual, es importante mostrar el grado de incertidumbre en la estimación. Una manera de hacerlo es a través de un intervalo. Queremos conseguir un intervalo que, con bastante seguridad contendrá el verdadero valor µ. Problema: Un intervalo muy ancho es muy impreciso y proporciona poca información. Estoy casi seguro que la edad media de los conductores rápidos es entre 16 y 100. Un intervalo muy estrecha puede facilmente no ser correcto. Estoy poco seguro que la edad media es entre 24,9 y 25,1 años
M. Wiper Estadística 8 / 15 Intervalos de conanza El enfoque estadístico es lo siguiente: Fijamos una nivel de conanza, por ejemplo 95 % o 99 %. Fijamos funciones L(X 1,..., X n ), U(X 1,..., X n ) tal que P(L < µ < U) = 95 % (o 99 %). Dados los datos de la muestra, el intervalo es (L(x 1,..., x n ), U(x 1,..., x n )). ¾Cómo interpretar esto? Si construimos muchos intervalos de esta manera, entonces 95 % de los intervalos que construimos contendrán la verdadera media µ. ½Un 95 % de las veces, hacemos bien!
M. Wiper Estadística 8 / 15 Intervalos de conanza El enfoque estadístico es lo siguiente: Fijamos una nivel de conanza, por ejemplo 95 % o 99 %. Fijamos funciones L(X 1,..., X n ), U(X 1,..., X n ) tal que P(L < µ < U) = 95 % (o 99 %). Dados los datos de la muestra, el intervalo es (L(x 1,..., x n ), U(x 1,..., x n )). ¾Cómo interpretar esto? Si construimos muchos intervalos de esta manera, entonces 95 % de los intervalos que construimos contendrán la verdadera media µ. ½Un 95 % de las veces, hacemos bien! ¾Cómo no interpretar esto? La probabilidad de que µ está dentro del intervalo que acabo de construir es igual a 95 %.
M. Wiper Estadística 9 / 15 Un intervalo de conanza para la media Ahora matemáticas para los interesados...
M. Wiper Estadística 9 / 15 Un intervalo de conanza para la media Ahora matemáticas para los interesados... P X N ) (µ, σ2 X µ σ/ N(0, 1) N ( P 1,96 < X ) µ σ/ < 1,96 = 0,95 n ( X 1,96σ/ n < µ < X + 1,96σ/ n) = 0,95 n
M. Wiper Estadística 9 / 15 Un intervalo de conanza para la media Ahora matemáticas para los interesados... P X N ) (µ, σ2 X µ σ/ N(0, 1) N ( P 1,96 < X ) µ σ/ < 1,96 = 0,95 n ( X 1,96σ/ n < µ < X + 1,96σ/ n) = 0,95 n... y la parte útil para los no interesados en matemáticas Dada una muestra, x 1,..., x n, un intervalo de 95 % de conanza para la media poblacional µ es x ± 1,96σ/ n
¾De dónde sale 1,96? M. Wiper Estadística 10 / 15
¾De dónde sale 1,96? M. Wiper Estadística 11 / 15
¾Qué sería el número con 90 % o 99 % de conanza? M. Wiper Estadística 12 / 15
M. Wiper Estadística 13 / 15 Ejemplo Supongamos que sabemos que la desviación típica de las edades de los conductores que corren demasiado es de 5 años. Luego un intervalo de 95 % de conanza para la verdadera edad media de conductores rápidos es 25 ± 1,96 5/ 36 = 25 ± 1,633 = (23,37, 26,63).
M. Wiper Estadística 13 / 15 Ejemplo Supongamos que sabemos que la desviación típica de las edades de los conductores que corren demasiado es de 5 años. Luego un intervalo de 95 % de conanza para la verdadera edad media de conductores rápidos es 25 ± 1,96 5/ 36 = 25 ± 1,633 = (23,37, 26,63). ¾Cómo sería un intervalo de 90 % de conanza?
M. Wiper Estadística 13 / 15 Ejemplo Supongamos que sabemos que la desviación típica de las edades de los conductores que corren demasiado es de 5 años. Luego un intervalo de 95 % de conanza para la verdadera edad media de conductores rápidos es 25 ± 1,96 5/ 36 = 25 ± 1,633 = (23,37, 26,63). ¾Cómo sería un intervalo de 90 % de conanza? ¾O de 99 %? 25 ± 1,645 5/ 36 = 25 ± 1,371 = (23,63, 26,37).
M. Wiper Estadística 13 / 15 Ejemplo Supongamos que sabemos que la desviación típica de las edades de los conductores que corren demasiado es de 5 años. Luego un intervalo de 95 % de conanza para la verdadera edad media de conductores rápidos es 25 ± 1,96 5/ 36 = 25 ± 1,633 = (23,37, 26,63). ¾Cómo sería un intervalo de 90 % de conanza? 25 ± 1,645 5/ 36 = 25 ± 1,371 = (23,63, 26,37). ¾O de 99 %? 25 ± 2,576 5/ 36 = (22,85, 27,15) Más conanza implica un intervalo más ancho, porque tenemos más conanza en que contenga la verdadera media. Menos conanza implica un intervalo menos ancho donde tenemos menos seguridad de que contenga la verdad.
M. Wiper Estadística 14 / 15 Cálculo con Excel Excel tiene una función para calcular automaticamente la parte para sumar y restar de la media para construir el intervalo. α = 1 nivel de conanza. Luego el intervalo es 25 ± 1,633 = (23,37, 26,63).
M. Wiper Estadística 15 / 15 Resumen y siguiente sesión En este clase, hemos introducido la estimación puntual y por intervalos. En la siguiente sesión, vemos más ejemplos y como estimar un intervalo de conanza para una proporción.