Sobre los intervalos de confianza y de predicción Javier Santibáñez 7 de abril de 2017

Documentos relacionados
Sobre los intervalos de confianza y de predicción

1.1 INTERVALOS DEL 95% DE CONFIANZA PARA LA MEDIA DE UNA POBLACIÓN NORMAL VARIANZA CONOCIDA

INFERENCIA ESTADÍSTICA CONCEPTOS BÁSICOS

) se obtiene un valor específico del estimador que recibe el nombre de estimación del parámetro poblacional θ y lo notaremos por = g ( x 1

Problemas de Estimación de Una y Dos Muestras. UCR ECCI CI-1352 Probabilidad y Esradística Prof. M.Sc. Kryscia Daviana Ramírez Benavides

Estimadores Puntuales: Propiedades de estimadores Sebastián Court

Estimación por Intervalos

IntroducciónalaInferencia Estadística

Desigualdad de Tchebyshev

INTRODUCCION Teoría de la Estimación

INFERENCIA ESTADÍSTICA Y ESTIMACIÓN

1. Distribución Normal.

Estimación de Parámetros. Estimación de Parámetros

Intervalos de Confianza basados en una sola muestra. Denotaremos al parámetro de interés con la letra θ y con θ un estimador para θ.

INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA DISTRIBUCIÓN EN EL MUESTREO

Distribuciones en el muestreo, EMV

13.1 INTERVALOS DEL 95% DE CONFIANZA PARA LA MEDIA DE UNA POBLACIÓN NORMAL VARIANZA CONOCIDA

Estimación de Parámetros

9.3. Contrastes de una proporción

MAS obtenidas de una población N, son por naturaleza propia impredecibles. No esperamos que dos muestras aleatorias de tamaño n, tomadas de la misma

- estimación de parámetros, - intervalos de confianza y

2 Algunos conceptos de convergencia de sucesiones de variables aleatorias

ESTIMACIÓN DE PARÁMETROS. INTERVALOS DE CONFIANZA PARA LA PROPORCIÓN POBLACIONAL.

Tema 14: Inferencia estadística

Estadística y sus aplicaciones en Ciencias Sociales Práctico 4 - Solución Curso ) Como se trata de muestreo sin reposición, se tiene C 5 3

Universidad Nacional del Litoral Facultad de Ingeniería y Ciencias Hídricas ESTADÍSTICA. Ingenierías RH-Amb-Ag TEORÍA

3.1. Muestreo aleatorio sin reposición Muestreo aleatorio con reposición (muestreo aleatorio simple)

Práctica 7 CONTRASTES DE HIPÓTESIS

TEORÍA DE LA ESTIMACIÓN

PROBLEMA DEL USO DE FERTILIZANTE EN GRANJAS DE PRODUCCIÓN DE TOMATES.

Probabilidad y Estadística 2003 Intervalos de Confianza y Test de Hipótesis paramétricos

6. DISTRIBUCIONES MUESTRALES

Intervalos de Confianza basados en una muestra. Instituto de Cálculo

Técnicas Cuantitativas II Muestra y Estadísticos Muestrales. TC II Muestra y Estadísticos Muestrales 1 / 20

Tema 4. Estimación de parámetros

Análisis estadístico de datos simulados Estimadores

INFERENCIA ESTADÍSTICA

UNIVERSIDAD DE ATACAMA

Explicación de la tarea 10 Felipe Guerra. Para la explicación de esta tarea veamos primeramente que es lo que nos están pidiendo.

Intervalos de Confianza

Formulas. Población infinita. Población finita

ANDALUCÍA / JUNIO 04. LOGSE / MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES / EXAMEN COMPLETO OPCIÓN A

UNIVERSIDAD TECNOLÓGICA DE PEREIRA FACULTAD DE INGENIERIA INDUSTRIAL

Estimación por intervalos

Intervalos de confianza Muestras grandes

Objetivos. 1. Inferencia Estadística. INFERENCIA ESTADÍSTICA Tema 3.1: Muestreo. M. Iniesta Universidad de Murcia

CAPÍTULO 6 DISTRIBUCIONES MUESTRALES

Análisis de resultados. Independencia de las muestras

( ) ( ) ( ) ( ) ( ) ( ) ( ( )) ( )

CAPÍTULO 8: INTERVALOS DE CONFIANZA PARA PROPORCIONES Y MEDIAS

INFERENCIA ESTADÍSTICA: ESTIMACIÓN DE PARÁMETROS. INTERVALOS DE CONFIANZA

TEMA 3: INFERENCIA ESTADISTICA

6. DISTRIBUCIONES MUESTRALES

Introducción a la Inferencia Estadística. Muestreo en poblaciones normales

ESTIMACIÓN. TEMA 5: Estimación puntual I. Propiedades de los estimadores. TEMA 6: Estimación puntual II. Métodos de estimación puntual

Tema 11. Soluciones a los ejercicios adicionales

Introducción a la Inferencia Estadística. Material Preparado por Olga Susana Filippini y Hugo Delfino

SELECTIVIDAD ANDALUCÍA MATEMÁTICAS CCSS SOBRANTES 2012 (MODELO 6)

8 DESIGUALDAD DE TCHEBYCHEFF LEY DE LOS GRANDES NÚMEROS

1. Intervalos de Conanza

Ley de Grandes Números y Teorema Central del

TEMA 6.- INTERVALOS DE CONFIANZA

4 - DESIGUALDAD DE CHEBYSHEV- LEY DE LOS GRANDES NUMEROS

MATEMÁTICAS 2ºBACHILLERATO CCSSII

Mirando las gráficas, justifica estas afirmaciones: Cuantos más dados intervienen, más se parece la distribución de sus promedios a la curva normal.

Mirando las gráficas, justifica estas afirmaciones: Cuantos más dados intervienen, más se parece la distribución de sus promedios a la curva normal.

Problemas de cálculo

En el tema anterior se estudió que muchas decisiones se toman a partir de resultados muestrales. Por ejemplo:

OPCIÓN A EJERCICIO 1_A

E.U.I.T.I. Bilbao. Asignatura: MÉTODOS ESTADÍSTICOS DE LA INGENIERÍA

Tema 8. Sesiones 15 y 16 Guía de clase 8. CONTRASTE DE HIPOTESIS

Número de personas que se forman en una fila en 1 hora Número de águilas que se obtienen al lanzar una moneda 5 veces.

El método de Monte Carlo

TEMA 5.-ESTIMACIÓN PUNTUAL.- (16/17) 5.1. Introducción a la Inferencia Estadística Método de los momentos

Prueba A = , = [ 7.853, 8.147]

PRUEBAS DE ACCESO A LA UNIVERSIDAD L.O.G.S.E

TEMA 5: Gráficos de Control por Atributos. 1. Gráfico de control para la fracción de unidades defectuosas

θˆ = h(x 1,X 2,...,X n ) θˆ es un estimador puntual de θ

R-SQUARED RESID. MEAN SQUARE (MSE) σˆ 2 ADJUSTED R-SQUARED STANDARD DEVIATION σ ˆ

1. Propiedades de los estimadores

Conceptos generales de inferencia estadística. Estimación de parámetros. Intervalos de confianza.

SESION 15 DISTRIBUCIONES DE MUESTREO

Ejercicios de intervalos de confianza en las PAAU

Clases 9-10: El proceso de Wiener y los paseos al azar: el teorema de Donsker *

8. INTERVALOS DE CONFIANZA

Determinación del tamaño de una muestra (para dos o más muestras)

UNIDAD 3.- INFERENCIA ESTADÍSTICA I

Estimación por intervalos

Bloque 3 Tema 12 PRUEBAS ESTADÍSTICAS PARA EL CONTRASTE DE HIPÓTESIS: PRUEBAS PARAMÉTRICAS

e i y i y i y i 0 1 x 1i 2 x 2i k x ki

SUMA DE VARIABLES ALEATORIAS

Estadística Teórica II

CAPÍTULO IV: CONSTRUCCIÓN DE LA TABLA DE MORTALIDAD. Es un hecho bien conocido que la probabilidad de que un individuo fallezca en un periodo

Capítulo 4 (Continuación) MÉTODOS ESTADÍSTICOS. Autor: José María García Palanco

Objetivo. 1. Intervalos y test (una sola muestra) Práctica 7: Intervalos de conanza y contrastes de hipótesis I. M. Iniesta Universidad de Murcia

2 FUNDAMENTOS DE PROBABILIDAD

Transcripción:

Sobre los itervalos de cofiaza y de predicció Javier Satibáñez 7 de abril de 2017 Itervalos de cofiaza Se costruye itervalos de cofiaza para los parámetros poblacioales. Supogamos que teemos ua muestra aleatoria X = {X 1,..., X } de ua població F x θ), co θ fijo pero descoocido. U itervalo de cofiaza 1001 α)% para θ está formado por dos estadistícos LX) y UX) tales que P LX) θ UX)) 1 α Por ejemplo, cosiderar ua muestra aleatoria X = {X 1,..., X } de ua població Nµ, σ 2 ), co µ y σ 2 descoocidos. De los cursos de iferecia estadística, se sabe que X µ ) S t 1 dode X = 1 i=1 X i y S 2 = 1) 1 i=1 Xi X ) 2. De lo aterior, se sigue que los estadísticos so tales que L X) = X t α/2) 1 S 2 / U X) = X + t α/2) 1 S 2 / P LX) µ UX)) = 1 α Ejemplo. Itervalo para la media de ua població ormal. Cosideremos ua realizació de ua muestra aleatoria de tamaño 15 de ua població N5, 1). set.seed1010) x <- rorm15, 5, 1); x ## [1] 5.131541 4.102090 6.351945 5.420075 4.711540 6.364561 6.938725 ## [8] 2.639017 4.405886 4.455447 4.804092 4.169927 3.564619 4.923929 ## [15] 5.725868 x <- meax); x ## [1] 4.913951 s <- varx); s ## [1] 1.283195 Calculamos los estadísticos LX) y UX) co α = 0.05 para esta muestra e particular. lx <- x - qt0.975, 14) * sqrts / 15); lx ## [1] 4.286637 1

ux <- x + qt0.975, 14) * sqrts / 15); ux ## [1] 5.541265 Los resultados so Lx) = 4.29 y Ux) = 5.54. Qué sigifica esto? Iterpretació de los itervalos de cofiaza Ua vez que se observa la muestra X = x, el euciado Lx) θ Ux) ya o es probabilista, puesto que todas las catidades so fijas. Segú la iterpretació frecuetista de la probabilidad, si repitieramos el experimeto que geeró los datos, u úmero grade de veces, el itervalo Lx), Ux)) cotedría a µ e el 95% de los casos. Ua vez que se observa los datos, el itervalo es fijo, por lo que de coocer el verdadero valor del parámetro, se podría decidir si está o o icluido e el itervalo. Si embargo o se cooce, por ello eso de la cofiaza e que el itervalo observado sea uo de los que cotiee al verdadero valor del parámetro. Ejemplo cotiuació) El euciado µ está etre 4.29 y 5.54 co ua cofiaza del 95%, es correcto. Si embargo, esto sigifica que cofiamos e que el itervalo 4.29, 5.54) sea uo de los que sí cotiee a µ. Como coocemos el verdadero valor de µ sabemos que el itervalo observado sí cotiee al parámetro. Co el siguiete código se simula 5000 muestras de la població N5, 1), co cada realizació se calcula Lx) y Ux) y se verifica si cotiee al parámetro µ. vx <- c); vs <- c) for i i 1:5000){ muestra <- rorm15, 5, 1) vx[i] <- meamuestra) vs[i] <- varmuestra) } vlxc <- vx - qt0.975, 14)*sqrtvs/15) vuxc <- vx + qt0.975, 14)*sqrtvs/15) auxc <- vlxc <= 5) & 5 <= vuxc) cobertura <- 100*sumauxc)/5000); cobertura ## [1] 94.62 El resultado es que e el 94.6 % de los casos el parámetro está coteido e el itervalo calculado, que es aproximadamete el 95% que se esperaba. A cotiuació se represeta graficamete 100 de los itervalos simulados se puede ver como sólo e 7 casos los el itervalo o cotiee a µ, que dista poco de los 5 que se esperaba. 2

3.5 4.0 4.5 5.0 5.5 6.0 6.5 Itervalos de predicció Se costruye itervalos de cofiaza para variables aleatorias. Supogamos que teemos ua muestra aleatoria X de ua població F x θ) y se quiere predecir el valor de ua ueva observació X ew a partir de la ifromació de la muestra observada. Formalmete X ew X por lo que toda la iformació sobre X ew se obtiee del hecho que viee de u població F x θ). Como θ es descoocido, es ecotrar dos estadísticos, fucioes de X cuya distribució o depeda de los parámetros descoocidos. U itervalo de cofiaza está formado por dos estadísticos L p X) y U p X) tales que P L p X) X ew U p X)) 1 α Ua vez observada la muestra, X = x, el euciado L p x) X ew U p x) aú es probabilista, puesto que X ew es ua variable aleatoria. Si embargo, o ecesariamete P L p x) X ew U p x)) 1 α Por lo que el itervalo observado L p x), U p x)) o es u itervalo de probabilidad 1 α para X ew. Como se asume que X ew es idepediete de X, se sigue que Etoces, X ew X N 0, σ 2 1 + 1 )). Por lo tato, los estadísticos X ew X ) t S 2 1 1 + 1 L p X) = X t α/2) 1 U p X) = X + t α/2) 1 S 2 S 2 1 + 1 ) 1 + 1 ) 3

so tales que P L p X) X ew U p X)) = 1 α Ejercicio de simulació Co la muestra del ejemplo aterior se calcula u itervalo de cofiaza para ua ueva observació como sigue: lx <- x - qt0.975, 14)*sqrts*1+1/15)); lx ## [1] 2.404696 ux <- x + qt0.975, 14)*sqrts*1+1/15)); ux ## [1] 7.423206 El itervalo que resulta es L p x) = 2.4 y Ux) = 7.42. Qué sigifica estos resultados? Iterpretació de los resultados Como se mecioó ateriormete, el itervalo o es de probabilidad para X ew. El euciado, ua ueva observació X ew estará etre 2.4 y 7.42 co probabilidad 0.95 es falso, porque como X ew N5, 1), tal probabilidad es 0.99. La iterpretació correcta es e térmios de la cofiaza. El euciado ua ueva observació X ew estará etre 2.4 y 7.42 co 95% de cofiaza es la iterpretació correcta. Qué sigifica la emph e predicció? la iterpretació es la siguiete, si repetimos el experimeto que geeró a x u úmero grade de veces, para cada repetició observamos X ew, y verificamos si x ew está coteida o o e el itervalo L p x), U p x)); se espera que e el 95% de las repeticioes el itervalo de predicció cubra a x ew. Por lo tato, los itervalos de predicció tambié so itervalos de cofiaza. Co el siguiete código se simula 5000 muestras de la població N5, 1), co cada realizació se calcula L p x) y U p x), se simuala 5000 uevas observacioes de la població y se verifica si cada realizació de L p x) y U p x) cotiee a la observació de X ew que correspde. vx <- c); vs <- c) for i i 1:5000){ muestra <- rorm15, 5, 1) vx[i] <- meamuestra) vs[i] <- varmuestra) } vlxp <- vx - qt0.975, 14)*sqrtvs*1+1/15)) vuxp <- vx + qt0.975, 14)*sqrtvs*1+1/15)) xew <- rorm5000, 5, 1) auxp <- vlxp <= xew) & xew <= vuxp) cobertura <- 100*sumauxp)/5000); cobertura ## [1] 95.1 El resultado es que e el 95.1 % de los casos el parámetro está coteido e el itervalo calculado, que es aproximadamete el 95% que se esperaba. A cotiuació se represeta graficamete 100 de los itervalos simulados se puede ver como sólo e 4 casos los el itervalo o cotiee a la ueva observació, que dista poco de los 5 que se esperaba. 4

2 3 4 5 6 7 8 Difecias etre predicció y cofiaza Lo primero que se debe otar es que los itervalos de predicció para ua ueva observació so más amplios que los itervalos de cofiaza para los parámetros descoocidos. Por qué? El tamaño del itervalo de cofiaza para el parámetro θ depede de la icertidumbre de la estimació que hacemos a partir de ua muestra. Mietras que el tamaño del itervalo de predicció para ua ueva observació tiee dos fuetes de icertidumbre, ua debida a la estimació de los parámetros descoocidos y la otra es propia de la aleatoriedad que supoemos, proque se debe recordar que esa ueva observació es ua variable aleatoria!. Cofiaza Predicció 2 3 4 5 6 7 8 2 3 4 5 6 7 8 Para eteder mejor la diferecia etre cada tipo de itervalo, cosideremos el caso extremo e que coocemos los verdaderos parámetros de la població. E tal caso, se elimia completamete la icertidumbre sobre µ, por lo que o tedría setido costuir u itervalo de cofiaza para este parámetro. Mietras que ua ueva observació aú es aleatoria, porque ese es uestro supuesto, etoces aú podríamos costruir u itervalo de predicció. 5