Tema 2 - Introducción 1 Tema 1. Introducción a la inferencia estadística Planteamientos y objetivos. Revisión de distribuciones multivariantes. Esperanza y varianza de sumas de v.a. independientes. Tema 2. Distribuciones en el muestreo Estadísticos. Concepto de distribución muestral. Distribución de estadísticos bajo normalidad.
Distribución temporal del temario 2 1 2 3 4 5 6 7 8 9 Tema 1 T T T P Tema 2 T T T P T T T P P Tema 3 T T T P T T T P P Tema 4 T T T P T T T P P Tema 5 T T T P T T T P P Tema 6 T T T P T T T P P Tema 7 T T T P T T T P P 7 7 7 7 6 6 6 6 6 58 T denota una hora de clase de teoría 0 0 0 7 0 0 0 6 6 19 P denota una hora de clase práctica
3 Tema 2 Distribuciones en el muestreo Los contenidos a desarrollar en este tema son los siguientes: Estadísticos. Media y cuasivarianza. Concepto de distribución muestral. Distribución muestral de la media y de la cuasivarianza en el caso normal. Lema de Fisher. Muestras grandes. Lecturas recomendadas: Secciones 7.3 y 7.4 del libro de Peña (2005) y las secciones 6.2 a 6.4 de Newbold (2001).
4 Definición 1. Una muestra aleatoria simple de tamaño n de una población X con función de distribución F X es un vector aleatorio (X 1, X 2,..., X n ) que cumple que: ( i) La distribución marginal de cada X i viene dada por F X. ( ii) X 1, X 2,..., X n son variables aleatorias independientes. Definición 2. Un estadístico es una función real de la muestra aleatoria (X 1, X 2,..., X n ). Observación 1: Por tanto, un estadístico es una variable aleatoria. Ejemplo 1. X = 1 n n i=1 X i y S 2 = 1 n 1 n i=1 (X i X) 2. Observación 2: Notemos que X x.
5 Ejemplo 2. Tomando una muestra de tamaño 5 queremos saber cuántos individuos de esta comunidad están de acuerdo con la nueva L.O.U.: En este ejemplo ideal, sabemos a priori que la respuesta es 10.
6 Ejemplo 2. Podemos utilizar el estadístico suma: S = n i=1 X i y el estadístico total, T = N n n i=1 X i donde n = 5 y N = 20.
Distribución muestral 7 Definición 3. Sea T un estadístico basado en la muestra aleatoria (X 1, X 2,..., X n ). La distribución de la variable aleatoria T (X 1, X 2,..., X n ) se denomina distribución muestral del estadístico. Ejemplo 2. Supongamos que hemos tomado una muestra aleatoria simple, por tanto, X i es una v.a. que se distribuye Bernoulli(p). Entonces: La distribución muestral del estadístico suma, S = 5 i=1 X i, es Binomial(n = 5,p). La distribución muestral del estadístico total, T = 4S, podemos obtenerla a partir de la de S: ( ) 5 Pr(T = t) = Pr(S = t/4) = p t/4 t/4 (1 p) 5 t/4, donde t toma valores en {0, 4, 8, 12, 16, 20}.
Distribución muestral - Ejemplo 8 Ejemplo 3. Supongamos que tomamos una muestra aleatoria del número de clientes que llegan a una caja en un supermercado en un período de cinco minutos. Denotamos por X el número de clientes. Existe evidencia para suponer que X se distribuye como una Poisson(λ). Cuál es la distribución del número de clientes a lo largo de una hora? Recordamos que la distribución Poisson es reproductiva, es decir, si X 1 P oisson(λ 1 ), X 2 P oisson(λ 2 ) y son independientes, entonces X 1 +X 2 P oisson(λ 1 + λ 2 ). Queremos saber la distribución de T = 20 i=1 X i. Si suponemos que las X i son independientes entonces T P oisson(20λ).
Distribución muestral - Ejemplo 9 Ejemplo 3. Podemos generalizar este ejemplo, suponiendo que X i el número de clientes que llega durante los i-ésimos cinco minutos se distribuye como una P oisson(λ i ) y que las variables X 1, X 2,..., X 20 son independientes. Cuál es la distribución del número de clientes a lo largo de una hora? T = 20 i=1 X i P oisson( 20 i=1 λ i). Otras distribuciones reproductivas son la normal N (µ, σ 2 ) y la Cauchy C(µ, θ) respecto de sus dos parámetros; la binomial B(n, p) y la gamma γ(a, b) respecto de sus primeros parámetros. Un caso particular de la distribución gamma es la χ 2 n = γ(n/2, 1/2).
Propiedades de X y de S 2 10 Proposición 1. Sea (X 1, X 2,..., X n ) una muestra aleatoria simple (M.A.S.) de una población X con esperanza E[X] = µ y varianza V(X) = σ 2. Entonces: ( i) E[ X] = µ. ( ii) V( X) = σ2 n. ( iii) E[S 2 ] = σ 2. Ejercicio: E[V X ]? Ejemplo 4. Si X sigue una distribución normal de media µ y varianza σ 2, X N (µ, σ 2 ), entonces sabemos que: X = 1 n n i=1 X i N (µ, σ2 n ).
Propiedades de X y de S 2 en poblaciones normales 11 Definición 4. Sean X 1, X 2,..., X k variables aleatorias independientes e idénticamente distribuidas N (0, 1). La distribución χ 2 con k grados de libertad es la distribución de la v.a. k i=1 X2 i. Proposición 2. Sea W una v.a. que sigue una distribución χ 2 k. Entonces: (i) E[W ] = k. (ii) V(W ) = 2k. Lema 1. Sean X 1, X 2,..., X n v.a. i.i.d. N (µ, σ 2 ). Entonces: (i) X N (µ, σ2 n ). Lema de Fisher (ii) (n 1) S 2 χ 2 σ n 1. 2 (iii) X y S 2 son independientes.
12 Ejemplo 5. Supongamos que los rendimientos de las acciones de la empresa SEGURA.SA siguen una distribución normal de media µ euros y varianza σ 2. Se toma una m.a.s. de 20 rendimientos y se tiene: 5,29 3,66 5,71 6,62 4,30 5,85 6,25 3,40 3,55 5,57 4,60 5,69 5,81 5,71 6,29 5,66 6,19 3,79 4,98 4,84 (a) Calcular los valores de los estadísticos X y S 2 en esa muestra. s 2 = 1 19 x = 1 20 (5,29 + 3,66 + + 4,84) = 5,188, ( (5,29 5,188) 2 + (3,66 5,188) 2 + + (4,84 5,188) 2) = 0,9929. µ = 5,188 y σ 2 = 0,9929? X = 5,188 y S 2 = 0,9929?
13 Ejemplo 5. (b) El VaR (value at risk) es una medida de la máxima pérdida esperada en una cartera, durante período de tiempo específico con una probabilidad dada, α. Una manera de calcular el VaR es suponiendo que los beneficios diarios de un valor se distribuyen de acuerdo a la distribución normal. Esta simplificación permitió un importante avance de la teoría de carteras, y es frecuentemente empleada en cálculos estadísticos financieros. La empresa SEGURA.SL considera como pérdidas todos los rendimientos inferiores a 5 euros por acción. Es decir, los beneficios siguen una distribución N (µ 5, σ 2 ). En ese caso, las pérdidas máximas esperadas para un nivel α son: V ar = µ 5 z α σ. Suponiendo conocida σ. Calcule la media y la varianza del siguiente estadístico Ṽ ar = X 5 z α σ.
14 Ejemplo 5. El supuesto de σ conocida es poco realista pero simplifica mucho los cálculos. (c) Calcule aproximaciones de la media y la varianza del siguiente estadístico V ar = X 5 z α S. Ayuda: Sea Y χ 2 k, entonces para k suficientemente grande se tiene que A 2Y N ( 2k 1, 1). E[ V ar] = E[ X 5 z α S.] = µ 5 z α E[S] µ 5 z α. V ( V ar) = Por qué? = V ( X) + z 2 αv (S) σ2 n + z2 α.
Propiedades de X en muestras grandes 15 Teorema 1. Sean X 1, X 2,..., X n variables aleatorias independientes e igualmente distribuidas con media µ y desviación típica σ, ambas finitas. Si n es suficientemente grande, entonces X µ σ/ n A N (0, 1). Teorema Central del Límite Ejemplo 6. Se desea conocer la intensión de voto de los accionistas de la empresa DEMOCRACIA.SL respecto a dedicar el 0,7 % de los dividendos en obras sociales. Denotemos por X la respuesta de un accionistas: X = 1 si es positiva y X = 0 si no lo es. Suponiendo que X sigue una distribución Bernoulli de parámetro p y tenemos una m.a.s. de tamaño n. Entonces, podemos aproximar X A N ( p, ) p(1 p). Excel n
16 Ejemplo 7. Se quiere saber cuál es el número medio de clientes que es atendido en una caja de supermercado. Sea X el número de clientes que es atendido en un intervalo de cinco minutos. Suponemos que X sigue una distribución P oisson(λ) y que tenemos una m.a.s. de tamaño n. Entonces: X A N ( λ, λ ). n Excel Ejemplo 8. El tiempo entre la llegada de dos clientes a una caja de supermercado se supone que sigue una distribución exponencial de media θ. Obtenemos una m.a.s. de tamaño n y queremos aproximar la distribución de X. ( ) X A 1 N θ, 1 θ 2. n
17 Ejemplo 9. Volviendo al Ejemplo 5(b), donde queríamos obtener la media, varianza y distribución del estadístico (σ conocida): Ṽ ar = X 5 z α σ. Si la muestra es suficientemente grande, podemos prescindir del supuesto de normalidad sobre los rendimientos. En este caso, obtenemos que: ) Ṽ ar A N (µ 5 z α σ, σ2. n Y si los rendimientos no son independientes? Y si σ no es conocida? Econometría II y Técnicas de predicción. Econometría III.
Recapitulación 18 Tema 2. Distribuciones en el muestreo Estadísticos. Concepto de distribución muestral. Conceptos clave en inferencia Distribución muestral de X y S 2 en el caso normal. Distribución muestral de X en muestras grandes Ejemplos de interés práctico
19 Tema 2. Distribuciones en el muestreo Estadísticos y distribución muestral. Ejemplos: X y S 2. Tema 3. Estimación puntual Criterios de comparación de estimadores: Insesgadez. Estimadores de mínima varianza. Error cuadrático medio. Consistencia.