RESUMEN DE ALGUNOS CONCEPTOS ESTADÍSTICOS ELEMENTALES Y NOTACIÓN EMPLEADA EN EL CURSO

Documentos relacionados
Capítulo 2. Medidas Estadísticas Básicas Medidas estadísticas poblacionales

INTERPRETACIÓN DE LA REGRESIÓN. Interpretación de la regresión

Variables aleatorias. Utilizando el resultado anterior, vemos que

Variables aleatorias

Estadística y sus aplicaciones en Ciencias Sociales 5. Estimación. Facultad de Ciencias Sociales, UdelaR

Tema 2: Introducción a la Inferencia Estadística

Resumen de Probabilidad

Muestreo e intervalos de confianza

Variables aleatorias. Descripción breve del tema. Objetivos. Descripción breve del tema. Tema 4

Tema 3 - Introducción. Tema 2. Distribuciones en el muestreo Estadísticos y distribución muestral. Ejemplos: X y S 2.

3. Variables aleatorias

Probabilidad y Estadística

ECONOMETRÍA II Prof.: Begoña Álvarez TEMA 1 INTRODUCCIÓN. Estimación por máxima verosimilitud y conceptos de teoría asintótica

Tema 6. Estimación puntual

DISTRIBUCIONES MULTIDIMENSIONALES DE PROBABILIDAD

Tema 4: Variables aleatorias multidimensionales

ECONOMETRÍA I. Tema 2: El Modelo de Regresión Lineal Simple. Patricia Moreno Juan Manuel Rodriguez Poo Alexandra Soberon Departamento de Economía

Fundamentos para la inferencia. Estadística Prof. Tamara Burdisso

Estadística. Grado en Biología. Universidad de Alcalá. Curso Capítulo 4: Variables Aleatorias. Fernando San Segundo. Actualizado:

Tema 6. Estimación puntual

Tema 4: Variables aleatorias multidimensionales

Técnicas de Muestreo Métodos

Requisitos Matemáticos. Clase 01. Profesor: Carlos R. Pitta. ICPM050, Econometría. Universidad Austral de Chile Escuela de Ingeniería Comercial

LA FUNCIÓN VARIABLE ALEATORIA (va.)

Ms. C. Marco Vinicio Rodríguez

Métodos Estadísticos de la Ingeniería Tema 7: Momentos de Variables Aleatorias Grupo B

Econometría II Grado en finanzas y contabilidad

Tema 4: Variables aleatorias.

Estadísticas Elemental Tema 3: Describir, Explorar, y Comparar Data

Curso de Probabilidad y Estadística

Momentos de Funciones de Vectores Aleatorios

Econometría I. Ejercicios de repaso de estadística

2. VARIABLE ALEATORIA. Estadística I Dr. Francisco Rabadán Pérez

TEMA 2: Estimadores y distribuciones en el muestreo. Alfredo García Hiernaux. Grupos 69 y 73 Estadística I. Curso 2006/07

ANÁLISIS DE FRECUENCIAS

INFERENCIA ESTADISTICA. Proferora: Lic. Gladis Mazza

Variables aleatorias. Tema Introducción Variable aleatoria. Contenido

ANÁLISIS DE REGRESIÓN

Econometría 1. Karoll GOMEZ Segundo semestre 2017

Tema 4: Variables Aleatorias

Tema 1: Estadística descriptiva. Probabilidad y Estadística (Ing. Informática). Tema 1: Estadística descriptiva 1

TEMA 2.- VARIABLES ALEATORIAS UNIDIMENSIONALES.- CURSO 17/18

Part VII. Estadística I. Mario Francisco. Introducción a la inferencia. Estimación puntual. Propiedades deseables de los estimadores

INTERVALOS DE CONFIANZA. La estadística en cómic (L. Gonick y W. Smith)

ECONOMETRÍA I. Tema 1: La naturaleza de la econometría y los datos econométricos


Tema 1: Distribuciones en el muestreo

Los estimadores mínimo cuadráticos bajo los supuestos clásicos

TEMA 5: Especificación y Predicción en el MRL

Universidad Técnica de Babahoyo INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA

TEMA 2: DISTRIBUCIONES BIDIMENSIONALES

Econometría 1. Karoll GOMEZ Segundo semestre 2017

Estadística I Tema 5: Introducción a la inferencia estadística

Curso Inferencia. Miguel Ángel Chong R. 10 de septiembre del 2013

Vectores Aleatorios. Vectores Aleatorios. Vectores Discretos. Vectores Aleatorios Continuos

1. Conceptos de Regresión y Correlación. 2. Variables aleatorias bidimensionales. 3. Ajuste de una recta a una nube de puntos

Tema 9: Estadística descriptiva

DISTRIBUCIONES DE PROBABILIDAD

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos

ESTADÍSTICA I Tema 2: Algunas ideas básicas sobre inferencia estadística. Muestreo aleatorio

Distribución conjunta de variables aleatorias

Tema 4. Regresión lineal simple

Tema 5. Muestreo y distribuciones muestrales

Estadística II Tema 4. Regresión lineal simple. Curso 2009/10

Introducción a la inferencia estadística

UNIVERSIDAD DE MANAGUA Al más alto nivel

Variables aleatorias bidimensionales discretas

Variables aleatorias

Regresión Simple. Leticia Gracia Medrano. 2 de agosto del 2012

TEMA 3.- VECTORES ALEATORIOS.- CURSO

Variables Aleatorias y Distribución de Probabilidades

Capítulo 5: Probabilidad e inferencia

Estadística y sus aplicaciones en Ciencias Sociales 7. El modelo de regresión simple. Facultad de Ciencias Sociales - UdelaR

Inferencia Estadística

CLASES DE ESTADÍSTICA II ESPERANZA ABSOLUTA

Tema 4: Variables aleatorias. Tema 4: Variables Aleatorias. Tema 4: Variables aleatorias. Objetivos del tema:

TEMA 2.- VARIABLES ALEATORIAS

Experimento de lanzar 3 monedas al aire. Denominando por (C) a Cara y (X) a Cruz, el espacio muestral será: Ω={CCC,CCX,CXC,XCC,CXX,XCX,XXC,XXX}

Econometría II. Hoja de Problemas 1

Práctica 3 Esperanza Condicional

Curso Inferencia. Miguel Ángel Chong R. 3 de septiembre del 2013

Distribuciones multivariadas

Fundamentos para la inferencia. Unidad 3 Parte II Estadísca Prof. Tamara Burdisso

Fundamentos para la inferencia. Unidad 3 Parte II Estadísca Prof. Tamara Burdisso

Estimación de Parámetros. Jhon Jairo Padilla A., PhD.

Estimación de Parámetros. Jhon Jairo Padilla A., PhD.

Teoría Estadística Elemental I Teoría (resumida) del 2 do Tema

ANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada.

Momentos de una variable

Estadís4ca y Métodos Numéricos Tema 2. Variable Aleatoria

Estimaciones puntuales. Estadística II

Comportamiento asintótico de estimadores

Variables aleatorias

Cálculo de Probabilidades II Preguntas Tema 2

Distribuciones de Probabilidad para Variables Aleatorias Discretas 1

T2. El modelo lineal simple

Modelos de probabilidad. Modelos de probabilidad. Modelos de probabilidad. Proceso de Bernoulli. Objetivos del tema:

Variables aleatorias

Transcripción:

RESUMEN DE ALGUNOS CONCEPTOS ESTADÍSTICOS ELEMENTALES Y NOTACIÓN EMPLEADA EN EL CURSO 1 rojo 1 2 3 4 5 6 Supongamos que tenemos dos dados, uno rojo y otro verde, cada uno de los cuales toma valores entre 1 y 6 con igual probabilidad. Definiremos la variable aleatoria x como la suma de los valores que toman los dos dados. 2

Ejemplo de distribución de probabilidades: x es la suma de dos dados v r 1 2 3 4 5 6 1 2 3 4 5 6 10 Por ejemplo, en el dado rojo puede aparecer 4 y en el verde un 6 3 Ejemplo de distribución de probabilidades: x es la suma de dos dados v r 1 2 3 4 5 6 1 2 3 4 5 7 6 Igualmente, si el dado rojo es 2 y el verde 5, la suma es 7 4

Ejemplo de distribución de probabilidades: x es la suma de dos dados v r 1 2 3 4 5 6 1 2 3 4 5 6 7 2 3 4 5 6 7 8 3 4 5 6 7 8 9 4 5 6 7 8 9 10 5 6 7 8 9 10 11 6 7 8 9 10 11 12 Esta tabla muestra todos los posibles resultados, que van de 2 a 12. 5 Ejemplo de distribución de probabilidades: x es la suma de dos dados v r 1 2 3 4 5 6 1 2 3 4 5 6 7 2 3 4 5 6 7 8 3 4 5 6 7 8 9 4 5 6 7 8 9 10 5 6 7 8 9 10 11 6 7 8 9 10 11 12 x f 2 3 4 5 4 6 7 8 9 10 11 12 La frecuencia f es el número de veces que se repite un resultado Por ejemplo, hay cuatro resultados que hacen x igual a 5 6

Ejemplo de distribución de probabilidades: x es la suma de dos dados v r 1 2 3 4 5 6 1 2 3 4 5 6 7 2 3 4 5 6 7 8 3 4 5 6 7 8 9 4 5 6 7 8 9 10 5 6 7 8 9 10 11 6 7 8 9 10 11 12 x f p 2 1 3 2 4 3 5 4 6 5 7 6 8 5 9 4 10 3 11 2 12 1 Finalmente, derivamos la probabilidad de obtener cada valor de x. 7 Ejemplo de distribución de probabilidades: x es la suma de dos dados v r 1 2 3 4 5 6 1 2 3 4 5 6 7 2 3 4 5 6 7 8 3 4 5 6 7 8 9 4 5 6 7 8 9 10 5 6 7 8 9 10 11 6 7 8 9 10 11 12 x f p 2 1 3 2 4 3 5 4 6 5 7 6 8 5 9 4 10 3 11 2 12 1 Hay 1/6 de probabilidad de obtener cada número del dado rojo y lo mismo para el dado verde. Por lo tanto, cada valor en la tabla ocurre con probabilidad 1/36. 8

Ejemplo de distribución de probabilidades: x es la suma de dos dados v r 1 2 3 4 5 6 1 2 3 4 5 6 7 2 3 4 5 6 7 8 3 4 5 6 7 8 9 4 5 6 7 8 9 10 5 6 7 8 9 10 11 6 7 8 9 10 11 12 x f p 2 1 1/36 3 2 2/36 4 3 3/36 5 4 4/36 6 5 5/36 7 6 6/36 8 5 5/36 9 4 4/36 10 3 3/36 11 2 2/36 12 1 1/36 Por lo tanto, para obtener las probabilidades asociadas a cada valor de x, se dividen las frecuencias por 36. 9 Ejemplo de distribución de probabilidades: x es la suma de dos dados probabilidad 1 2 3 4 5 6 5 4 3 2 / 36 36 36 36 36 36 36 36 36 36 1 / 36 2 3 4 5 6 7 8 9 10 11 12 x La distribución se muestra gráficamente. 10

VALOR ESPERADO DE UNA VARIABLE ALEATORIA DISCRETA La definición de E(x), el valor esperado de x: Notación alternativa para E(x): E(x) = µ x El valor esperado de una variable aleatoria, conocido también como la media poblacional, es la suma ponderada de los valores que toma la variable aleatoria, donde los pesos son las probabilidades ligadas a esos valores. 11 Valor esperado de una variable aleatoria x i p i x i p i x i p i x 1 p 1 x 1 p 1 2 1/36 x 2 p 2 x 2 p 2 3 2/36 x 3 p 3 x 3 p 3 4 3/36 x 4 p 4 x 4 p 4 5 4/36 x 5 p 5 x 5 p 5 6 5/36 x 6 p 6 x 6 p 6 7 6/36 x 7 p 7 x 7 p 7 8 5/36 x 8 p 8 x 8 p 8 9 4/36 x 9 p 9 x 9 p 9 10 3/36 x 10 p 10 x 10 p 10 11 2/36 x 11 p 11 x 11 p 11 12 1/36! x i p i = E(x) En el caso de la variable x, definida como la suma de los dados verde y rojo, se adjunta a cada posible valor su probabilidad. 12

Valor esperado de una variable aleatoria x i p i x i p i x i p i x i p i x 1 p 1 x 1 p 1 2 1/36 2/36 x 2 p 2 x 2 p 2 3 2/36 6/36 x 3 p 3 x 3 p 3 4 3/36 12/36 x 4 p 4 x 4 p 4 5 4/36 20/36 x 5 p 5 x 5 p 5 6 5/36 30/36 x 6 p 6 x 6 p 6 7 6/36 42/36 x 7 p 7 x 7 p 7 8 5/36 40/36 x 8 p 8 x 8 p 8 9 4/36 36/36 x 9 p 9 x 9 p 9 10 3/36 30/36 x 10 p 10 x 10 p 10 11 2/36 22/36 x 11 p 11 x 11 p 11 12 1/36 12/36! x i p i = E(x) 252/36 = 7 Por lo tanto, el valor esperado es 7. Este resultado era esperable si tenemos en cuenta que la distribución es simétrica en 7, como se vio en la transparencia del histograma 13 Valor esperado de una función de una variable aleatoria La definición de E[g(x)], no es más que : Ejemplo: 14

Valor esperado de una función de una variable aleatoria x i p i g(x i ) g(x i ) p i x i p i x i 2 x i2 p i x 1 p 1 g(x 1 ) g(x 1 ) p 1 2 1/36 4 0.11 x 2 p 2 g(x 2 ) g(x 2 ) p 2 3 2/36 9 0.50 x 3 p 3 g(x 3 ) g(x 3 ) p 3 4 3/36 16 1.33...... 5 4/36 25 2.78...... 6 5/36 36 5.00...... 7 6/36 49 8.17...... 8 5/36 64 8.89...... 9 4/36 81 9.00...... 10 3/36 100 8.83...... 11 2/36 121 6.72 x n p n g(x n ) g(x n ) p n 12 1/36 144 4.00 " " "! g(x i ) p i 54.83 En nuestro ejemplo valor esperado de x 2 es 54.83. Observar que no es igual a 7 elevado al cuadrado. Es decir, E(x 2 15 ) no es lo mismo que E(x) elevado al cuadrado Las reglas del valor esperado 1. E(x+y) = E(x) + E(y) 2. E(ax) = ae(x) 3. E(a) = a Donde, x e y son variables aleatorias y a es una constante. 16

Independencia de dos variables aleatorias Dos variables aleatorias x e y se dicen independientes si E[f(x)g(y)] = E[f(x)] E[g(y)] para cualquier f(x), g(y) Caso particular: si x e y son independientes, E(xy) = E(x) E(y). 17 LA VARIANZA POBLACIONAL DE UNA VARIABLE ALEATORIA DISCRETA La varianza poblacional de x : La varianza mide la dispersión de la distribución con respecto a la media de la población. 18

La varianza poblacional de una variable aleatoria discreta x i p i x i -µ (x i -µ) 2 (x i -µ) 2 p i 2 1/36-5 25 0.69 3 2/36-4 16 0.89 4 3/36-3 9 0.75 5 4/36-2 4 0.44 6 5/36-1 1 0.14 7 6/36 0 0 0.00 8 5/36 1 1 0.14 9 4/36 2 4 0.44 10 3/36 3 9 0.75 11 2/36 4 16 0.89 12 1/36 5 25 0.69 5.83 En nuestro ejemplo de los dados. 19 La varianza poblacional de una variable aleatoria discreta Varianza poblacional de x : notación pop.var(x) 20

La varianza poblacional de una variable aleatoria discreta Desviación típica de x" 21 2. VARIABLES ALEATORIAS CONTINUAS probabilidad 1 2 3 4 5 6 5 4 3 2 / 36 36 36 36 36 36 36 36 36 36 1 / 36 2 3 4 5 6 7 8 9 10 11 12 x Una variable aleatoria discreta sólo toma un conjunto finito de valores, con probabilidad positiva, como la suma del valor de dos dados. 22

Variables aleatorias continuas densidad de probabilidad 0.05 55 60 65 70 75 x Sin embargo, la mayoría de las variables aleatorias en econometría son continuas, como puede ser, por ejemplo, la temperatura en un cuarto, que puede tomar valores entre 55 y 75 grados Farenheit. 23 Variables aleatorias continuas densidad de probabilidad 0.05 55 60 65 70 75 x Observar que la probabilidad de que una variable continua tome un valor determinado es infinitamente pequeña (cero, en realidad). Por este motivo, la probabilidad de variables continuas se calcula para intervalos de valores de x. El área que corresponde a ese 24 intervalo es la probabilidad del mismo.

Variables aleatorias continuas densidad de probabilidad 0.05 0.05 55 56 60 65 70 75 x Por ejemplo, la probabilidad de que la temperatura este entre 55 y 56 F es 0.05. Estamos considerando que todas las temperaturas son igual de probables, por lo que el área de todo el rectángulo es 1. Es decir, como la base es de 20 grados, la probabilidad de cada grado es 0.05 (0.05*20=1) 25 Variables aleatorias continuas densidad de probabilidad 0.05 55 5758 60 65 70 75 x La probabilidad por unidad es el área del rectángulo definida por dicha unidad, es decir 0.05. 26

Variables aleatorias continuas densidad de probabilidad f(x) = 0.05 para 55 x 75 f(x) = 0 para x < 55 o x > 75 0.05 55 5758 60 65 70 75 x La probabilidad por intervalo unitario se llama densidad y es igual a la altura del intervalo unidad (dado que el área es base por altura) 27 Matemáticamente, la densidad se escribe como una función de la variable f(x). Variables aleatorias continuas f(x) f(x) = 0.05 si 55 x 75 f(x) = 0 si x < 55 y x > 75 0.05 55 5758 60 65 70 75 x El eje vertical se conoce como la densidad de probabilidad y la función de densidad, f(x), es la línea gruesa negra. 28

Variables aleatorias continuas densidad f(x) 0.05 f(x) = 0.05 para 55 < x < 75 f(x) = 0 para x < 55 o x > 75 5 0.05 0.25 55 60 65 70 75 x Supongamos que queremos calcular la probabilidad en el intervalo 65 y 70. Debemos calcular el área debajo de la densidad entre 65 y 70. 29 Cuál es la expresión de la esperanza y la varianza de una variable continua? Investígalo. 30

LOS COMPONENTES FIJOS Y ALEATORIOS DE UNA VARIABLE ALEATORIA Media poblacional de x: E(x) =µ x Lo que nos interesa ver aquí es cómo podemos escribir una variable aleatoria formada por dos componentes: una parte, la media, que sería el componente fijo y otra parte, que es lo que puede llamarse perturbación, que es el componente aleatorio puro. 31 Los componentes fijos y aleatorios de una variable aleatoria Media poblacional de x: E(x) =µ x Para la observación i, el componente aleatorio está dado por u i = x i - µ x El valor observado de la variable x para el individuo i, por ejemplo, su salario, será en general distinto al valor medio µ x. La diferencia no es la misma para todos los individuos, es decir, será aleatoria u i = x i - µ x. 32

Los componentes fijos y aleatorios de una variable aleatoria Media poblacional de x: E(x) =µ x Para la observación i, el componente aleatorio está dado por u i = x i - µ x Por tanto x podemos escribirla como la suma de dos componentes: x i = µ x + u i 33 Los componentes fijos y aleatorios de una variable aleatoria Media poblacional de x: E(x) =µ x Para la observación i, el componente aleatorio está dado por u i = x i - µ x Por tanto x, la podemos escribir como la suma de dos componentes : x i = µ x + u i Observar que el valor esperado de u i es cero: E(u i ) = E(x i - µ x ) = E(x i ) + E(-µ x ) =µ x - µ x = 0 34

3. ESTIMADORES Estimadores y estimaciones: Un estimador es una fórmula matemática. Una estimación es un número que se obtiene de aplicar el estimador a los datos de una muestra concreta. Salvo en casos artificialmente simples, como el de los dados, no conoceremos la distribución de probabilidad o la función de densidad de la variable objeto de estudio. En consecuencia, tampoco conoceremos la media o la varianza poblacionales. Se trata, entonces, de obtener estimaciones a partir de una muestra de n observaciones. 35 Estimadores Característica Poblacional Estimador Media: µ x Varianza : 36

Estimadores Los estimadores son variables aleatorias: veamos la media muestral como ejemplo: 37 Estimadores La media muestral puede descomponerse en una parte fija y otra estocástica 38

Estimadores De forma que no es más que la media de n valores fijos y n valores aleatorios. 39 Estimadores Donde! es la media de los términos aleatorios de la muestra. 40

Estimadores Densidad de x Densidad de x µ x x µ x x Estos gráficos describen la densidad de x y x. Como se observó, ambos tienen el mismo componente fijo, pero la distribución de la media muestral está más concentrada. 41 Estimadores Densidad de x Densidad de x µ x x µ x x La diferencia está en el componente aleatorio de ambas variables. El componente aleatorio de la media muestral es menor que el de la variable original dado que es la media de los componentes aleatorios de todas las variables, y estos tienden a cancelarse. 42

INSESGADEZ Y EFICIENCIA Insesgadez de x: Supongamos que queremos estimar la media poblacional µ x de una variable aleatoria x dado un conjunto de n observaciones. Un estimador a utilizar es la media muestral. Demostraremos que es insesgado. 43 Insesgadez y Eficiencia Insesgadez de x: Es decir, el valor esperado de la media muestral es igual al parámetro poblacional que estamos buscando µ x 44

Insesgadez y Eficiencia Insesgadez de x : Estimador General Z =! 1 x 1 +! 2 x 2 Sin embargo, la media muestral no es el único estimador insesgado de la media poblacional. Supongamos que tenemos únicamente dos observaciones y nos construimos un estimador general, Z 45 Insesgadez y Eficiencia Insesgadez de x: Estimador General Z =! 1 x 1 +! 2 x 2 El estimador general Z lo definimos como la suma ponderada de las dos observaciones que tenemos, donde los pesos son! 1 y! 2. Por ejemplo, en el caso de la media muestral los dos pesos son iguales a 1/n = 1/2 porque sólo tenemos dos observaciones. 46

Insesgadez y Eficiencia Insesgadez de x: Estimador General Z =! 1 x 1 +! 2 x 2 Cómo deben ser esos ponderadores para que el valor esperado del estimador sea igual a la media poblacional? 47 Insesgadez y Eficiencia Insesgadez de x: Estimador General Z =! 1 x 1 +! 2 x 2 48

Insesgadez y Eficiencia Insesgadez de x: Estimador General Z =! 1 x 1 +! 2 x 2 49 Insesgadez y Eficiencia Insesgadez de x: Estimador General Z =! 1 x 1 +! 2 x 2 Dado que las variables aleatorias son iid., su valor esperado es µ x. 50

Insesgadez y Eficiencia Insesgadez de x: Estimador General Z =! 1 x 1 +! 2 x 2 Por lo tanto, cualquier estimador Z será un estimador insesgado de µ si la suma de los pesos de las observaciones es 1. Observar que existen infinitas combinaciones de los ponderadores que hacen que su suma sea igual a 1. 51 densidad Insesgadez y Eficiencia estimator B estimador A µ x Cómo elegimos entre estimadores? Cuanto más preciso sea un estimador, es decir, cuanto menos incertidumbre nos transmita sobre el valor del parámetro, mejor será. La propiedad de eficiencia se refiere justamente a la precisión. 52

Insesgadez y Eficiencia densidad estimator B estimador A µ x De la densidad se observa que si bien los dos estimadores A y B son insesgados, el estimador B es más preciso, tiene menor varianza. 53 Insesgadez y Eficiencia Estimador General Z =! 1 x 1 +! 2 x 2 Analicemos la varianza poblacional del estimador general buscando definir los pesos que minimicen dicha varianza 54

Insesgadez y Eficiencia Estimador General Z =! 1 x 1 +! 2 x 2 Es decir, si tenemos dos observaciones, cada observación la debemos ponderar por un medio para obtener el estimador insesgado de menor varianza. Pero ponderar por un medio es justamente definir el estimador Z como la media muestral. 55 CONFLICTO ENTRE VARIANZA MÍNIMA E INSESGADEZ densidad estimador B estimador A " Supongamos que tenemos dos estimadores alternativos para estimar ", uno que es insesgado y el otro que es sesgado pero con varianza menor que el primero: cuál de los dos elegimos? 56

Conflicto entre varianza mínima e insesgadez pérdida error (negativa) error (positiva) Una forma para decidir entre uno y otro es definirse una función de pérdida y decidir en función de la pérdida mayor o menor: es decir, nos quedaremos con aquél que tenga menor pérdida. 57 Conflicto entre varianza mínima e insesgadez densidad " Una función muy utilizada es la que se conoce como el error cuadrático medio (mean squared error MSE), que se define como el valor esperado del cuadrado de las desviaciones del estimador y el parámetro poblacional. 58

Conflicto entre varianza mínima e insesgadez densidad sesgo " µ Z El error cuadrático medio puede escribirse como la suma del sesgo al cuadrado más la varianza: es decir, combina el conflicto entre varianza y sesgo en un solo indicador. Supongamos que el sesgo del estimador Bcon respecto a µ Z es el que aparece en el gráfico. 59 Conflicto entre varianza mínima e insesgadez densidad sesgo " µ Z Se puede demostrar que el MSE es igual a la suma de la varianza poblacional más el sesgo al cuadrado. 60

Conflicto entre varianza mínima e insesgadez densidad estimador B estimador A " Cómo elegiremos entre ambos estimadores? Buscando aquel que tenga menor MSE. 61 EFECTO DE UN AUMENTO DEL TAMAÑO MUESTRAL densidad de x 0.08 n # x 1 50 0.06 0.04 0.02 n = 1 50 100 150 200 La media muestral es un estimador de la media poblacional qué pasa cuando la muestra crece? 62

densidad de x Efecto de un aumento del tamaño muestral 0.08 n # x 1 50 0.06 0.04 0.02 n = 1 50 100 150 200 Supongamos que x tiene media poblacional 100 y desviación típica 50. Supongamos, además, que no conocemos esta media y que queremos estimarla 63 densidad de x Efecto de un aumento del tamaño muestral 0.08 n # x 1 50 0.06 0.04 0.02 n = 1 50 100 150 200 De las propiedades de la media muestral, sabemos que su media coincide con la media poblacional, que es insesgada y que su desviación típica será igual a la desviación típica poblacional dividida por la raíz cuadrada del número de observaciones

densidad de x Efecto de un aumento del tamaño muestral 0.08 n # x 1 50 0.06 0.04 0.02 n = 1 50 100 150 200 Por tanto, cuanto mayor sea n, menor será la varianza de la media muestral. 65 densidad de x Efecto de un aumento del tamaño muestral 0.08 0.06 n = 100 n # x 1 50 4 25 25 10 100 5 0.04 0.02 50 100 150 200 66

densidad de x Efecto de un aumento del tamaño muestral 0.8 0.6 0.4 n = 5000 n # x 1 50 4 25 25 10 100 5 1000 1.6 5000 0.7 0.2 50 100 150 200 En el límite, la desviación típica de la media muestral tiende a cero, por lo que la media muestral tenderá, en el límite, a la media poblacional: consistencia. 67 Efecto de un aumento del tamaño muestral Muestra Finita: x es un estimador insesgado de µ La insesgadez es un concepto de muestras finitas. El valor esperado de la media muestral es igual a su valor poblacional. Pero ojo! el valor real que toma la media muestral puede no coindicir con la media poblacional. 68

Efecto de un aumento del tamaño muestral Muestra Finita: x es un estimador insesgado de µ Muestra grande: la distribución de x colapsa en µ plim x = µ La consistencia es un concepto de muestras grandes. Un estimador consistente es más preciso a medida que el tamaño de la muestra aumenta. 69 EJEMPLO DE UN ESTIMADOR SESGADO PERO CONSISTENTE densidad de Z n = 20 "$ Z Es posible que un estimador sea sesgado en muestras pequeñas pero consistente. 70 7

Ejemplo de un estimador sesgado pero consistente densidad de Z n = 20 "$ Z Sea Z un estimador de la característica poblacional ". Mirando a la densidad de Z, se observa que sobreestima el valor del parámetro, es decir, tiene un sesgo positivo 71 7 Ejemplo de un estimador sesgado pero consistente n = 100 n = 20 "$ Z Para que el estimador sea consistente, deben pasar dos cosas cuando la muestra aumenta. El sesgo debe disminuir. 72 7

Ejemplo de un estimador sesgado pero consistente n = 1000 n = 100 n = 20 y la densidad debe colapsar en el parámetro. "$ Z 73 7 Ejemplo de un estimador sesgado pero consistente n = 100000 n = 1000 n = 100 "$ Z 74 7

RELACIONES ENTRE VARIABLES Cómo podemos inferir si existe una relación entre dos variables económicas a partir de los estadísticos covarianza y correlación? 75 COVARIANZA POBLACIONAL La covarianza poblacional: # XY =E((X-µ X ) (Y-µ Y )) La covarianza poblacional de dos variables aleatorias es el valor esperado del producto de sus desviaciones con respecto a la media 76

Covarianza Poblacional Si X sony indeptes, # XY = 0 77 COVARIANZA MUESTRAL Dada una muestra de n observaciones de dos variables, X, Y, la covarianza muestral no es más que la media del producto de sus desviaciones con respecto a la media muestral. 78

La covarianza muestral es un estimador sesgado de la covarianza poblacional 79 Reglas de la covarianza 1. Si Y = V + W, Cov(X, Y) = Cov(X, V) + Cov(X, W) 2. Si Y = az, donde a es constante, Cov(X, Y) = Cov(X, az) = acov(x, Z) Ejemplo: Cov(X, 3Z) = 3Cov(X, Z) 3. Si Y = a, donde a es constante, Cov(X, Y) = Cov(X, a) = 0 Ejemplo: Cov(X, 10) = 0 80

EXPRESIONES ALTERNATIVAS DE LA COVARIANZA POBLACIONAL D # XY =E((X-µ X ) (Y-µ Y ))=E(XY)- µ X µ Y MUESTRAL 81 RELACIÓN ENTRE LA VARIANZA Y LA COVARIANZA La varianza de una variable aleatoria no es más que la covarianza de dicha variable respecto a sí misma 82

Por tanto, las reglas de la varianza se pueden deducir a partir de las reglas de la covarianza 83 Regla 1: Si Y = V + W, Var(Y) = Var(V) + Var(W) + 2Cov(V, W) Prueba: Var(Y) = Cov(Y, Y) = Cov(Y, [V + W]) = Cov(Y, V) + Cov(Y, W) = Cov([V + W], V) + Cov([V + W], W) = Cov(V, V) + Cov(W, V) + Cov(V, W) + Cov(W, W) = Var(V) + Var(W) + 2Cov(V, W) 84

Regla 2: Si Y = bz, donde b es constante, Var(Y) = b 2 Var(Z) Prueba: Var(Y) = Cov(Y, Y) = Cov(Y, bz) = bcov(y, Z) = bcov(bz, Z) = b 2 Cov(Z, Z) = b 2 Var(Z) 85 Regla 3: Si Y = b, donde b es constante, Var(Y) = 0 Prueba: Var(Y) = Cov(Y, Y) = Cov(b, b) = 0 86

Regla 4: Si Y = V + b, donde b es constante, Var(Y) = Var(V) Prueba: Var(Y) = Var(V + b) = Var(V) + Var(b) + 2Cov(V, b) = Var(V) 0 V 0 V + b Sumar una constante sólo tiene un efecto de traslación: la varianza no cambiará y la media se verá desplazada por la constante de la traslación. 87 COEFICIENTE DE CORRELACIÓN Coef. Correlación Poblacional Coef. Correlación Muestral 88

Coeficiente de Correlación Por qué el coeficiente de correlación es mucho mejor que la covarianza como mediada de la asociación entre dos variables? Por que la covarianza depende de las unidades en las que las variables están medidas, mientras que el coeficiente de correlación no. 89