Overfit, cross validation y bootstrap

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Overfit, cross validation y bootstrap"

Transcripción

1 Universisad de San Andrés y CONICET

2 Cueestiones preliminares Sea z n una sucesion de variables aleatorias escalares. Consideremos la siguiente sucesion z n = n i=1 z i n Ley de grandes numeros (Kolmogorov): {z n } iid con E(z i ) = µ finita. Entonces z n p µ.

3 Funcion de distribucion acumulada (FDA): Y una variable aleatoria. F (y) = P r(y y) Funcion de distribucion acumulada empirica: Y 1, Y 2,..., Y n una muestra aleatoria iid de la poblacion Y, con fda F (y). F n (y) 1 n n 1 [Y i y] i=1

4 Teorema Fundamental de la Estadistica Para cualquier y dado (y = y 0 ) F n (y 0 ) 1 n n 1 [Y i y 0 ] i=1 es un promedio. Entonces por la LGN: F n (y 0 ) p E (1 [Y y 0 ]) = P (Y y 0 ) = F (y 0 ) Teorema Fundamental de la Estadistica (Glivenko-Cantelli): version fuerte y uniforme de F n (y) F (y).

5 Preludio

6 Preludio

7

8 Preludio Y = Xβ + u Recordar Omision de variables relevantes: sesgos, menor varianza. Inclusion de variables irrelevantes: evita sesgos, mas varianza. R 2 = SCE/SCT = 1 SCR/SCT no decreciente en K. n = K : SCE = 0, R 2 = 1 Complejidad: numero de variables? En un sentido generalizado, si.

9 Caso simple Preludio y = f(x, β) + u f(x, β) polinomio de grado finito pero desconocido. Supuestos clasicos para u. X = matriz n (p + 1), columnas (1, x, x 2,..., x p ) ˆβ = (X X) 1 X Y, Ŷ X ˆβ, e Y Ŷ ECM(Ŷ (x 0)) = E(Y (x 0 ) Ŷ (x 0)) 2 Y (x 0 ) = f(x 0, β) + u, Ŷ (x 0) = x 0 ˆβ ECM(Ŷ (x 0)) cuando p aumenta y n constante?

10 ] ECM(Ŷ ) = Sesgo2 (Ŷ [Y ) + V (x 0 ) Ŷ (x 0) ( ) 2 [ + V = E = E Cuando p aumenta... f(x 0, β) x 0 ˆβ ( f(x 0, β) x 0 ˆβ Sesgo: eventualmente cero. Varianza: no decreciente (Gauss Markov). R 2 no decreciente. ] f(x 0, β) + u x 0 ˆβ ] ) 2 + [ σ 2 + x 0 V ( ˆβ)x 0

11 Overfit: modelos complejo: reduce error de estimacion y sesgo pero aumenta la varianza del error de pronostico en un punto x 0 dado. SCE y R 2 no funciona como guia para elegir modelos para prediccion fuera de la muestra. Trade off sesgo-varianza: simple (algo sesgo, baja varianza) vs. complejo (bajo sesgo, alta varianza). Complejidad: numero de variables (mucho mas general de lo que parece). Necesitamos una forma de evaluar modelos de acuerdo a su performance fuera de la muestra.

12 Conceptos Preludio Perdida: L(Y, Ŷ ) Regresion: L(Y, Ŷ ) = (Y Ŷ )2 Clasificacion: L(Y, Ŷ ) = 1(Y Ŷ ) Error de prediccion esperado: Err = E[L(Y, Ŷ )]. Error de prediccion esperado en la muestra de test: Err T = E[L(Y, Ŷ ) T ] Error promedio en la muestra de entrenamiento: Problema: como elegir T? ˆ err = 1 n n L(Y i, Ŷi) i=1

13 K-fold cross validation 1 Partir los datos al azar en K partes. 2 Ajustar el modelo dejando afuera una de las particiones. 3 Computar el error de prediccion para los datos no utilizados. 4 Repetir para k = 1,..., K. La estimacion por cross-validation del error de prediccion es CV ( ˆf) = 1 ) (Y N L i Ŷ k(x i ) Ŷ k (x i ) es la prediccion hecha cuando la observacion no fue usada para estimar.

14 Cada observacion es usada en dos roles: entrenamiento y test. K = 1: no test data K = N: leave one out. Ir dejando de lado una obseracion por vez. Estima el modelo n veces con n 1 datos. K: estima el modelo K veces con n K datos.

15 Por qué funciona? Ley de los grandes numeros. CV ( ˆf) = 1 N = 1 K n i=1 K err ˆ j j=1 ( ) L Y i Ŷ k(x i ) Computamos err ˆ j para cada particion y luego promediamos. Para cualquier K finito, n implica que dentro de cada sumando hay infinita informacion. K = n la suma es infinita.

16 Eleccion de K K chico: maximiza datos para estimar, sensible a los valore particulares. K grande: maximiza datos para evaluar, modelo estimado menos precisamente. Regla: 5 o 10 (ver Kohavi (1995)

17 Cross validation para eleccion de modelos Supongamos que α parametriza la complejidad de un modelo. Ejemplo: α = grado de polinomio en nuestro caso inicial Cross validation para un modelo indizado por α: CV ( ˆf, α) = 1 ) (Y N L i Ŷ k(x i, α) Idea: computar CV ( ˆf, α) para una grilla de valores de α y minimizar. Ejemplo: error de CV para distintos grados de polinomio, elegir el que minimiza CV ( ˆf, α)

18 Ejemplo: polinomio en regresion del ejemplo de polinomios: roja K=10.

19 Ejemplo: eleccion de grado de un polinomio Vinos: Vinos malos. Potencias de volatile.acidity. Metodo de estimacion: logit. K=10-fold Cross validation.

20 Bootstrap Preludio Ejemplo: vinos malos en logits Y 1, Y 2,..., Y n iid Y (µ, σ 2 ), ambas finitas. Queremos estimar V (Ȳ ) = σ2 /n (varianza de la media muestral) Formula: ˆσ 2 /n con ˆσ 2 = 1 (Y i n Ȳ )2 i=1

21 Metodo alternativo sin formula : 1 De los n datos originales y 1, y 2,..., y n, tomar una muestra con reemplazo, de tamaño n. 2 Computar la media muestral con esta pseudomuestra 3 Repetir B veces. Al finalizar tendremos B estimaciones de la media. 4 Computar la varianza de las B medias.

22 En terminos generales Y i, i = 1,..., n y θ es una magnitud de interes. 1 Muestra de tamaño n con reemplazo de la mueestra original (muestra bootstrap). 2 Computar ˆθ j, j = 1,..., B. 3 Repetir B veces. 4 ˆV (ˆθ) B = 1 B B (ˆθ j ˆθ) 2 j=1

23 Ideas Por que?: en la mayoria de los casos NO hay una formula para la varianza. Mucho mas que la varianza: desvio estandar, mediana, coeficiente de Gini,... Regresion?

24 ln Y = βx + u X es una variable binaria. Recordar que β e β 1. Supongamos que realmente nos interesa e β 1. Podemos estimar β por MCO de ln Y en X y su varianza por boostrap: 1 Tomar una muestra de (X i, Y i )i = 1,..., n de tamaño n con reemplazo. 2 Estimar ˆβ j 3 Computar ˆθ j = e ˆβ j) 1, j = 1,..., B 4 Computar la varianza muestral de los ˆθ j

25 Por que funciona? Muestra de la muestra n es grande: es como si estuviesemos tomando una muestra de la poblacion. Teorema fundamental de la estadistica (estamos reemplazando F (y) por F n (y).

Regularizacion y eleccion de modelos

Regularizacion y eleccion de modelos Universisad de San Andrés y CONICET Trade off-sesgo varianza Preludio Y = X 1 β 1 + X 2 β 2 + u Trade off: modelos mas complejos tienden a ser menos sesgados pero con mayor varianza. Preferencia lexicografica

Más detalles

Reconocimiento de Patrones

Reconocimiento de Patrones Reconocimiento de Patrones Técnicas de validación (Clasificación Supervisada) Jesús Ariel Carrasco Ochoa Instituto Nacional de Astrofísica, Óptica y Electrónica Clasificación Supervisada Para qué evaluar

Más detalles

Los estimadores mínimo cuadráticos bajo los supuestos clásicos

Los estimadores mínimo cuadráticos bajo los supuestos clásicos Los estimadores mínimo cuadráticos bajo los supuestos clásicos Propiedades estadísticas e inferencia Mariana Marchionni marchionni.mariana@gmail.com Mariana Marchionni MCO bajo los supuestos clásicos 1

Más detalles

Estimación del modelo lineal con dos variables

Estimación del modelo lineal con dos variables Estimación del modelo lineal con dos variables el método de mínimos cuadrados ordinarios (MCO) Mariana Marchionni marchionni.mariana@gmail.com Mariana Marchionni Estimación del modelo lineal por MCO 1

Más detalles

Técnicas Multivariadas Avanzadas

Técnicas Multivariadas Avanzadas Métodos de remuestreo Universidad Nacional Agraria La Molina 2014-2 Error de entrenamiento y prueba Estimación del error de predicción Los métodos de remuestreo constituyen una herramienta importante e

Más detalles

Econometría Aplicada

Econometría Aplicada Econometría Aplicada Inferencia estadística, bondad de ajuste y predicción Víctor Medina Intervalos de confianza Intervalos de confianza Intervalos de confianza Intervalos de confianza La pregunta que

Más detalles

T2. El modelo lineal simple

T2. El modelo lineal simple T2. El modelo lineal simple Ana J. López y Rigoberto Pérez Dpto Economía Aplicada. Universidad de Oviedo Curso 2010-2011 Curso 2010-2011 1 / 40 Índice 1 Planteamiento e hipótesis básicas 2 Estimación de

Más detalles

Tests de Hipotesis en Base al Principio de Verosimilitud

Tests de Hipotesis en Base al Principio de Verosimilitud Tests de Hipotesis en Base al Principio de Verosimilitud Universidad de San Andres, Argentina Conceptos basicos Y f(y; θ), θ Θ R K. θ es un vector de K parametros. Θ es el espacio de parametros : conjunto

Más detalles

Modelos con variable dependiente limitada

Modelos con variable dependiente limitada Modelos con variable dependiente limitada Universidad Iberoamericana Diciembre 2014 Y es variable aleatoria, toma solo dos valores, uno o cero, asociada a la ocurrencia de un evento (1 ocurre, 0 si no).

Más detalles

Introduccion a los Modelos de Regresion

Introduccion a los Modelos de Regresion (wsosa@udesa.edu.ar) Universidad de San Andres Referencias Hayashi (2000) Capitulo 1, pp. 3-46. Cualquier texto basico de econometria (con matrices!!!) Introduccion Modelo lineal: y i = β 1 + β 2 x 2i

Más detalles

Tema1. Modelo Lineal General.

Tema1. Modelo Lineal General. Tema1. Modelo Lineal General. 1. Si X = (X 1, X 2, X 3, X 4 ) t tiene distribución normal con vector de medias µ = (2, 1, 1, 3) t y matriz de covarianzas 1 0 1 1 V = 0 2 1 1 1 1 3 0 1 1 0 2 Halla: a) La

Más detalles

Regresión Lineal Múltiple

Regresión Lineal Múltiple Unidad 4 Regresión Lineal Múltiple Javier Santibáñez (IIMAS, UNAM) Regresión Semestre 2017-2 1 / 35 Introducción La idea de la regresión lineal múltiple es modelar el valor esperado de la variable respuesta

Más detalles

Datos bivariantes: regresión

Datos bivariantes: regresión M. Wiper Estadística 1 / 14 Datos bivariantes: regresión Michael Wiper Departamento de Estadística Universidad Carlos III de Madrid M. Wiper Estadística 2 / 14 Objetivo Ilustrar como ajustar una recta

Más detalles

Taller I Econometría I

Taller I Econometría I Taller I Econometría I 1. Considere el modelo Y i β 1 + ɛ i, i 1,..., n donde ɛ i i.i.d. N (0, σ 2 ). a) Halle el estimador de β 1 por el método de mínimos cuadrados ordinarios. Para realizar el procedimiento

Más detalles

ESTADÍSTICA I Tema 2: Algunas ideas básicas sobre inferencia estadística. Muestreo aleatorio

ESTADÍSTICA I Tema 2: Algunas ideas básicas sobre inferencia estadística. Muestreo aleatorio ESTADÍSTICA I Tema 2: Algunas ideas básicas sobre inferencia estadística. Muestreo aleatorio Muestra aleatoria Conceptos probabiĺısticos básicos El problema de inferencia Estadísticos. Media y varianza

Más detalles

Técnicas Multivariadas Avanzadas

Técnicas Multivariadas Avanzadas Métodos basados en árboles Universidad Nacional Agraria La Molina 2014-2 Introducción Introducción Se describen métodos basados en árboles para regresión y clasicación. Estos métodos requieren estraticar

Más detalles

Experimentos de Monte Carlo. Walter Sosa-Escudero

Experimentos de Monte Carlo. Walter Sosa-Escudero Introduccion Test de Breusch-Pagan de heterocedasticidad: LM = 1 2 SCE g,z χ 2 (p 1) g = residuos al cuadrado, z, variables explicativas de la heterocedasticidad. Esta es una aseveracion asintotica. Que

Más detalles

Tema 5: Calibración de modelos. Modelado y simulación en Ingeniería Química. Manuel Rodríguez

Tema 5: Calibración de modelos. Modelado y simulación en Ingeniería Química. Manuel Rodríguez Tema 5: Calibración de modelos ÍNDICE Modelos de caja gris Calibración de modelos Estimación de parámetros Análisis de la estimación Regresión no lineal 1. Modelos de caja gris Son modelos de un sistema

Más detalles

Modelo de Regresión Lineal

Modelo de Regresión Lineal Modelo de Regresión Lineal Álvaro José Flórez 1 Escuela de Ingeniería Industrial y Estadística Facultad de Ingenierías Febrero - Junio 2012 Introducción Un ingeniero, empleado por un embotellador de gaseosas,

Más detalles

Estadística para la Economía y la Gestión IN 3401

Estadística para la Economía y la Gestión IN 3401 Estadística para la Economía y la Gestión IN 3401 3 de junio de 2010 1 Modelo de Regresión con 2 Variables Método de Mínimos Cuadrados Ordinarios Supuestos detrás del método MCO Errores estándar de los

Más detalles

Estadística Diplomado

Estadística Diplomado Diplomado HRB UNAM 1 / 25 1 Estimación Puntual Momentos Máxima Verosimiltud Propiedades 2 / 25 1 Estimación Puntual Momentos Máxima Verosimiltud Propiedades 2 Estimación por Intervalos Cantidades Pivotales

Más detalles

Econometria de Datos en Paneles

Econometria de Datos en Paneles Universidad de San Andres Agosto de 2011 Porque paneles? Ejemplo (Cronwell y Trumbull): Determinantes del crimen y = g(i), y = crimen, I = variables de justicia criminal. Corte transversal: (y i, I i )

Más detalles

Estadística aplicada al medio ambiente

Estadística aplicada al medio ambiente Estadística aplicada al medio ambiente III. Regresión lineal 3 o de CC. AA. Departamento de Matemáticas Universidad Autónoma de Madrid 2011/12 Planteamiento Modelo Estimación de parámetros Intervalos de

Más detalles

ANÁLISIS DE REGRESIÓN

ANÁLISIS DE REGRESIÓN ANÁLISIS DE REGRESIÓN INTRODUCCIÓN Francis Galtón DEFINICIÓN Análisis de Regresión Es una técnica estadística que se usa para investigar y modelar la relación entre variables. Respuesta Independiente Y

Más detalles

T3. El modelo lineal básico

T3. El modelo lineal básico T3. El modelo lineal básico Ana J. López y Rigoberto Pérez Dpto Economía Aplicada. Universidad de Oviedo Curso 2010-2011 Curso 2010-2011 1 / 41 Índice 1 Regresión lineal múltiple Planteamiento Hipótesis

Más detalles

Errores de especificación

Errores de especificación CAPíTULO 5 Errores de especificación Estrictamente hablando, un error de especificación es el incumplimiento de cualquiera de los supuestos básicos del modelo lineal general. En un sentido más laxo, esta

Más detalles

Soluciones Examen Final de Econometría Universidad Carlos III de Madrid 26 de Mayo de 2015

Soluciones Examen Final de Econometría Universidad Carlos III de Madrid 26 de Mayo de 2015 Soluciones Examen Final de Econometría Universidad Carlos III de Madrid 26 de Mayo de 2015 Conteste todas las preguntas en dos horas y media. Pregunta 1 (33 puntos: Un investigador está considerando las

Más detalles

Econometría II. Hoja de Problemas 1

Econometría II. Hoja de Problemas 1 Econometría II. Hoja de Problemas 1 Nota: En todos los contrastes tome como nivel de significación 0.05. 1. SeanZ 1,...,Z T variables aleatorias independientes, cada una de ellas con distribución de Bernouilli

Más detalles

Econometría 1. Karoll GOMEZ Segundo semestre 2017

Econometría 1. Karoll GOMEZ   Segundo semestre 2017 Econometría 1 Karoll GOMEZ kgomezp@unal.edu.co http://karollgomez.wordpress.com Segundo semestre 2017 II. El modelo de regresión lineal Esperanza condicional I Ejemplo: La distribución de los salarios

Más detalles

ECONOMETRÍA I. Tema 2: El Modelo de Regresión Lineal Simple. Patricia Moreno Juan Manuel Rodriguez Poo Alexandra Soberon Departamento de Economía

ECONOMETRÍA I. Tema 2: El Modelo de Regresión Lineal Simple. Patricia Moreno Juan Manuel Rodriguez Poo Alexandra Soberon Departamento de Economía ECONOMETRÍA I Tema 2: El Modelo de Regresión Lineal Simple Patricia Moreno Juan Manuel Rodriguez Poo Alexandra Soberon Departamento de Economía Alexandra Soberon (UC) ECONOMETRÍA I 1 / 42 Modelo de Regresión

Más detalles

Least Squared Methods for System Identification. 1. Modelamiento de datos - Least Squared Estimator

Least Squared Methods for System Identification. 1. Modelamiento de datos - Least Squared Estimator 16/4/2011 UNIVERSIDAD TECNICA FEDERICO SANTA MARIA DEPARTAMENTO DE ELECTRONICA ELO325 SoftComputing y Aplicaciones Least Squared Methods for System Identification Tomás Arredondo Vidal - 1. Modelamiento

Más detalles

Econometría 1. Karoll GOMEZ Segundo semestre 2017

Econometría 1. Karoll GOMEZ   Segundo semestre 2017 Econometría 1 Karoll GOMEZ kgomezp@unal.edu.co http://karollgomez.wordpress.com Segundo semestre 2017 II. El modelo de regresión lineal Esperanza condicional I Ejemplo: La distribución de los salarios

Más detalles

Modelo de Regresión Lineal Simple

Modelo de Regresión Lineal Simple 1. El Modelo Modelo de Regresión Lineal Simple El modelo de regresión lineal simple es un caso especial del múltple, donde se tiene una sola variable explicativa. y = β 0 + β 1 x + u (1.1) Donde u representa

Más detalles

Selección de distribuciones de probabilidad

Selección de distribuciones de probabilidad Selección de distribuciones de probabilidad Patricia Kisbye FaMAF 6 de mayo, 2010 Análisis estadístico de datos simulados Los sistemas reales tienen fuentes de aleatoriedad: Tipo de sistema Fabricación

Más detalles

Regresión múltiple. Demostraciones. Elisa Mª Molanes López

Regresión múltiple. Demostraciones. Elisa Mª Molanes López Regresión múltiple Demostraciones Elisa Mª Molanes López El modelo de regresión múltiple El modelo que se plantea en regresión múltiple es el siguiente: y i = β 0 + β 1 x 1i + β 2 x 2i +...+ β k x ki +

Más detalles

Regresión Simple. Leticia Gracia Medrano. 2 de agosto del 2012

Regresión Simple. Leticia Gracia Medrano. 2 de agosto del 2012 Regresión Simple Leticia Gracia Medrano. lety@sigma.iimas.unam.mx 2 de agosto del 2012 La ecuación de la recta Ecuación General de la recta Ax + By + C = 0 Cuando se conoce la ordenada al origen y su pendiente

Más detalles

Regresión lineal simple

Regresión lineal simple Regresión lineal simple Unidad 1 Javier Santibáñez IIMAS, UNAM jsantibanez@sigma.iimas.unam.mx Semestre 2018-2 Javier Santibáñez (IIMAS, UNAM) Regresión simple Semestre 2018-2 1 / 62 Contenido 1 Planteamiento

Más detalles

Formulario. Estadística Administrativa. Módulo 1. Introducción al análisis estadístico

Formulario. Estadística Administrativa. Módulo 1. Introducción al análisis estadístico Formulario. Estadística Administrativa Módulo 1. Introducción al análisis estadístico Histogramas El número de intervalos de clase, k, se elige de tal forma que el valor 2 k sea menor (pero el valor más

Más detalles

Fundamentos para la inferencia. Estadística Prof. Tamara Burdisso

Fundamentos para la inferencia. Estadística Prof. Tamara Burdisso Fundamentos para la inferencia Estadística 018 - Prof. Tamara Burdisso 1 Distribución muestral de la varianza muestral Hasta aquí nos ocupamos de hacer inferencia sobre la media y/o la proporción de una

Más detalles

Métodos Estadísticos Multivariados

Métodos Estadísticos Multivariados Métodos Estadísticos Multivariados Victor Muñiz ITESM Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre 2011 1 / 20 Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre

Más detalles

Estimación Máxima Verosimilitud

Estimación Máxima Verosimilitud Estimación Máxima Verosimilitud Microeconomía Cuantitativa R. Mora Departmento of Economía Universidad Carlos III de Madrid Outline Motivación 1 Motivación 2 3 4 5 Estrategias generales de estimación Hay

Más detalles

TEMA 3: PROPIEDADES DEL ESTIMADOR MCO

TEMA 3: PROPIEDADES DEL ESTIMADOR MCO TEMA 3: PROPIEDADES DEL ESTIMADOR MCO S. Álvarez, A. Beyaert, M. Camacho, M. González, A. Quesada Departamento de Métodos Cuantitativos para la Economía y la Empresa Econometría (3º GADE) Lo que estudiaremos

Más detalles

Selección de distribuciones de probabilidad

Selección de distribuciones de probabilidad Selección de distribuciones de probabilidad Georgina Flesia FaMAF 3 de mayo, 2012 Análisis estadístico de datos simulados Los sistemas reales tienen fuentes de aleatoriedad: Tipo de sistema Fabricación

Más detalles

CART s. Walter Sosa-Escudero. Universisad de San Andres y CONICET

CART s. Walter Sosa-Escudero. Universisad de San Andres y CONICET Universisad de San Andres y CONICET Motivacion Modelo flexible e interpretable para la relacion entre Y y X. Arboles: partir el espacio de atributos en rectangulos, y ajustar un modelo simple para Y dentro

Más detalles

tiene distribución t con n 1 grados de libertad. Si utilizamos dicha cantidad como pivote, entonces para el intervalo

tiene distribución t con n 1 grados de libertad. Si utilizamos dicha cantidad como pivote, entonces para el intervalo . Intervalos de confianza para muestras pequeñas.. Para µ. Si Y, Y,..., Y n representa una muestra aleatoria tomada de una población normal, con Ȳ la media de a muestra y S la varianza de la muestra, queremos

Más detalles

Cálculo de Probabilidades II Preguntas Tema 2

Cálculo de Probabilidades II Preguntas Tema 2 Cálculo de Probabilidades II Preguntas Tema 2 1. Demuestre que la suma de n v.a. Bernuolli(p) independientes tiene una distribución Binomial con parametros (n, p). 2. Se dice que una v.a tiene una distribución

Más detalles

TEMA 2: Propiedades de los estimadores MCO

TEMA 2: Propiedades de los estimadores MCO TEMA 2: Propiedades de los estimadores MCO Econometría I M. Angeles Carnero Departamento de Fundamentos del Análisis Económico Curso 2011-12 Econometría I (UA) Tema 2: Pdades de los estimadores MCO Curso

Más detalles

Tema 4. Regresión lineal simple

Tema 4. Regresión lineal simple Tema 4. Regresión lineal simple Contenidos El objeto del análisis de regresión La especificación de un modelo de regresión lineal simple Estimadores de mínimos cuadrados: construcción y propiedades Inferencias

Más detalles

Clasificación Supervisada

Clasificación Supervisada Clasificación Supervisada Ricardo Fraiman 26 de abril de 2010 Resumen Reglas de Clasificación Resumen Reglas de Clasificación Descripción del problema Muestra de entrenamiento (X 1, Y 1 ),..., (X n, Y

Más detalles

ECONOMETRÍA I. Tema 3: El Modelo de Regresión Lineal Múltiple: estimación

ECONOMETRÍA I. Tema 3: El Modelo de Regresión Lineal Múltiple: estimación ECONOMETRÍA I Tema 3: El Modelo de Regresión Lineal Múltiple: estimación Patricia Moreno Juan Manuel Rodriguez Poo Alexandra Soberon Departamento de Economía Alexandra Soberon (UC) ECONOMETRÍA I 1 / 45

Más detalles

Estadística para la Economía y la Gestión IN 3401 Clase 5

Estadística para la Economía y la Gestión IN 3401 Clase 5 Estadística para la Economía y la Gestión IN 3401 Clase 5 Problemas con los Datos 9 de junio de 2010 1 Multicolinealidad Multicolinealidad Exacta y Multicolinealidad Aproximada Detección de Multicolinealidad

Más detalles

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos Agro 6998 Conferencia Introducción a los modelos estadísticos mixtos Los modelos estadísticos permiten modelar la respuesta de un estudio experimental u observacional en función de factores (tratamientos,

Más detalles

Regresión Lineal Múltiple

Regresión Lineal Múltiple Unidad 3 Regresión Lineal Múltiple Javier Santibáñez (IIMAS, UNAM) Estadística II Semestre 2018-1 1 / 54 Introducción La idea de la regresión lineal múltiple es modelar el valor esperado de la variable

Más detalles

Multicolinealidad Introducción. Uno de los supuestos básicos del modelo lineal general. y = Xβ + u

Multicolinealidad Introducción. Uno de los supuestos básicos del modelo lineal general. y = Xβ + u CAPíTULO 6 Multicolinealidad 6.1. Introducción Uno de los supuestos básicos del modelo lineal general y = Xβ + u establece que las variables explicativas son linealmente independientes, es decir, la igualdad

Más detalles

Estimación por intervalos

Estimación por intervalos Capítulo 9 Estimación por intervalos 9.1. Introducción En este capítulo se desarrolla la estimación por intervalos donde el proceso de inferencia se realiza de la forma θ C, donde C = Cx) es un conjunto

Más detalles

ECONOMETRÍA II Prof.: Begoña Álvarez TEMA 1 INTRODUCCIÓN. Estimación por máxima verosimilitud y conceptos de teoría asintótica

ECONOMETRÍA II Prof.: Begoña Álvarez TEMA 1 INTRODUCCIÓN. Estimación por máxima verosimilitud y conceptos de teoría asintótica ECONOMETRÍA II Prof.: Begoña Álvarez 2007-2008 TEMA 1 INTRODUCCIÓN Estimación por máxima verosimilitud y conceptos de teoría asintótica 1. ESTIMACIÓN POR MÁXIMA VEROSIMILITUD (MAXIMUM LIKELIHOOD) La estimación

Más detalles

Estimación de Parámetros

Estimación de Parámetros Estimación de Parámetros Jhon Jairo Padilla A., PhD. Inferencia Estadística La inferencia estadística puede dividirse en dos áreas principales: p Estimación de Parámetros Prueba de Hipótesis Estimación

Más detalles

El problema de la endogeneidad Variables proxy Variables instrumentales STATA. Endogeneidad. Gabriel Montes-Rojas

El problema de la endogeneidad Variables proxy Variables instrumentales STATA. Endogeneidad. Gabriel Montes-Rojas Gabriel V. Montes-Rojas El problema de la endogeneidad Una variable es endógena si Cov(x j, error) = 0. Una variable es exógena si Cov(x j, error) = 0. Consideremos el modelo log(wage) = β 0 + β 1 educ

Más detalles

Bioestadística: Inferencia Estadística. Análisis de Una Muestra

Bioestadística: Inferencia Estadística. Análisis de Una Muestra Bioestadística: Inferencia Estadística. Análisis de Una Muestra M. González Departamento de Matemáticas. Universidad de Extremadura Estimación Puntual e Intervalos de Confianza Planteamiento del Problema

Más detalles

Modelos Lineales para Datos en Paneles. Walter Sosa Escudero. Banco Central de Chile

Modelos Lineales para Datos en Paneles. Walter Sosa Escudero. Banco Central de Chile Modelos Lineales para Datos en Paneles Walter Sosa Escudero. Banco Central de Chile. 2006. - 1 - Datos en paneles Una base de datos en panel contiene informacion para varios individuos (empresas, paises,

Más detalles

El Modelo de Regresión Lineal General Estimación

El Modelo de Regresión Lineal General Estimación Tema 5 El Modelo de Regresión Lineal General Estimación Pilar González y Susan Orbe Dpto Economía Aplicada III (Econometría y Estadística) Pilar González y Susan Orbe OCW 2013 Tema 5 MRLG: Estimación 1

Más detalles

EXAMEN DE ECONOMETRÍA

EXAMEN DE ECONOMETRÍA EXAMEN DE ECONOMETRÍA UNIVERSIDAD CARLOS III DE MADRID CURSO 2015-1 Responda todas las preguntas en 2 horas y media. Valores críticos al final del examen. 1 A partir de una muestra aleatoria de compra-venta

Más detalles

Estimación MCO, MCI en Modelos de Ecuaciones Simultáneas

Estimación MCO, MCI en Modelos de Ecuaciones Simultáneas Estimación MCO, MCI en Modelos de Ecuaciones Simultáneas Economía Aplicada III (UPV/EHU) OCW 2013 Contents 1 Estimación MCO de la Forma Estructural 2 3 4 Estimador MCO de la FE Consideremos la -ésima ecuación

Más detalles

Estimación. Diseño Estadístico y Herramientas para la Calidad. Estimación. Estimación. Inferencia Estadística

Estimación. Diseño Estadístico y Herramientas para la Calidad. Estimación. Estimación. Inferencia Estadística Diseño Estadístico y Herramientas para la Calidad Estimación Epositor: Dr. Juan José Flores Romero juanf@umich.m http://lsc.fie.umich.m/~juan M. en Calidad Total y Competitividad Estimación Inferencia

Más detalles

Distribución Empírica

Distribución Empírica 1 Distribución Empírica X 1,...,X n i.i.d. X i F, X i P I A (X j (ω)) = { 1 Xj (ω) A 0 X j (ω) / A F n (x,ω) = 1 n P n (A,ω) = 1 n n i=1 n i=1 I (,x] (X j (ω)) = #{X j(ω) x} n I A (X j (ω)) = #{X j(ω)

Más detalles

Análisis de Datos. Validación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Validación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Validación de clasificadores Profesor: Dr. Wilfrido Gómez Flores 1 Introducción La mayoría de los clasificadores que se han visto requieren de uno o más parámetros definidos libremente,

Más detalles

Estadística II Tema 4. Regresión lineal simple. Curso 2009/10

Estadística II Tema 4. Regresión lineal simple. Curso 2009/10 Estadística II Tema 4. Regresión lineal simple Curso 009/10 Tema 4. Regresión lineal simple Contenidos El objeto del análisis de regresión La especificación de un modelo de regresión lineal simple Estimadores

Más detalles

Ms. C. Marco Vinicio Rodríguez

Ms. C. Marco Vinicio Rodríguez Ms. C. Marco Vinicio Rodríguez mvrodriguezl@yahoo.com http://mvrurural.wordpress.com/ Uno de los objetivos de la estadística es saber acerca del comportamiento de parámetros poblacionales tales como:

Más detalles

Econometría Aplicada

Econometría Aplicada Econometría Aplicada y función de Verosimilitud Víctor Medina Los objetivos de esta parte del curso principalmente son: 1. Dar algunos ejemplos de decisiones económicas donde la variable dependiente es

Más detalles

Tema 8: Regresión y Correlación

Tema 8: Regresión y Correlación Tema 8: Regresión y Correlación Estadística. 4 o Curso. Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 8: Regresión y Correlación Curso 2008-2009 1 / 12 Índice

Más detalles

UNIVERSIDAD DE ATACAMA

UNIVERSIDAD DE ATACAMA UNIVERSIDAD DE ATACAMA FACULTAD DE INGENIERÍA / DEPARTAMENTO DE MATEMÁTICA ESTADÍSTICA Y PROBABILIDAD GUÍA DE TRABAJO 3 Profesor: Hugo S. Salinas. Primer Semestre 2010 1. Sea X 1,..., X n una muestra aleatoria

Más detalles

Vectores Autorregresivos (VAR)

Vectores Autorregresivos (VAR) Econometria de Series Temporales Vectores Autorregresivos (VAR) Walter Sosa Escudero Universidad de San Andr es y UNLP 1 Procesos estocasticos multivariados Y t =[Y 1t ;Y 2t ; ;Y Nt ] 0 ; t =1; 2;:::;T

Más detalles

Estadística III (P33) Exam, Tipo: A

Estadística III (P33) Exam, Tipo: A 21 de Enero de 2000 Responde a las siguientes preguntas sobre papel ordinario, de forma breve y concisa. Al entregar tu exámen, has de entregar también la Tarea 10, que no fue posible finalizar en periodo

Más detalles

Tema 10: Introducción a los problemas de Asociación y Correlación

Tema 10: Introducción a los problemas de Asociación y Correlación Tema 10: Introducción a los problemas de Asociación y Correlación Estadística 4 o Curso Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 10: Asociación y Correlación

Más detalles

Econometría Aplicada

Econometría Aplicada Econometría Aplicada Especificación y problemas con la data Víctor Medina Introducción Hasta el momento hemos considerado el modelo como dado y nos hemos preguntado cosas del estilo Dado el modelo y =

Más detalles

Contenido. vii. Prólogo... i Presentación... iii Grupo de trabajo...v. 1. Introducción y conceptos preliminares...1

Contenido. vii. Prólogo... i Presentación... iii Grupo de trabajo...v. 1. Introducción y conceptos preliminares...1 Contenido Prólogo... i Presentación... iii Grupo de trabajo...v 1. Introducción y conceptos preliminares...1 2. Tipos de modelos estadísticos lineales...19 Caso 2.1...20 Caso 2.2...26 Caso 2.3...30 3.

Más detalles

CALIFICACION: - P C: precio medio de los productos sustitutivos existentes en el mercado en euros.

CALIFICACION: - P C: precio medio de los productos sustitutivos existentes en el mercado en euros. 6 + 10 + 3 = 19 CALIFICACION: Ventasgdt Una empresa que produce una marca de detergente líquido desea contar con un modelo para planificar su producción, estimar las necesidades de materias primas y de

Más detalles

Técnicas de Inferencia Estadística II. Tema 3. Contrastes de bondad de ajuste

Técnicas de Inferencia Estadística II. Tema 3. Contrastes de bondad de ajuste Técnicas de Inferencia Estadística II Tema 3. Contrastes de bondad de ajuste M. Concepción Ausín Universidad Carlos III de Madrid Grado en Estadística y Empresa Curso 2010/11 Tema 3. Contrastes de bondad

Más detalles

TEMA 5: Especificación y Predicción en el MRL

TEMA 5: Especificación y Predicción en el MRL EMA 5: Especificación y Predicción en el MRL Econometría I M. Angeles Carnero Departamento de Fundamentos del Análisis Económico Curso 2011-12 Econometría I (UA) ema 5: Especificación y Predicción Curso

Más detalles

Regresión Lineal. Rodrigo A. Alfaro. Rodrigo A. Alfaro (BCCh) Regresión Lineal / 16

Regresión Lineal. Rodrigo A. Alfaro. Rodrigo A. Alfaro (BCCh) Regresión Lineal / 16 Regresión Lineal Rodrigo A. Alfaro 2009 Rodrigo A. Alfaro (BCCh) Regresión Lineal 2009 1 / 16 Contenidos 1 Regresiones Lineales Regresión Clásica Paquetes estadísticos 2 Estadísticos de Ajuste Global 3

Más detalles

PROPIEDADES DEL ESTIMADOR MCO

PROPIEDADES DEL ESTIMADOR MCO TEMA 3 PROPIEDADES DEL ESTIMADOR MCO S. Álvarez, A. Beyaert, M. Camacho, M. González, A. Quesada Departamento de Métodos Cuantitativos para la Economía y la Empresa Econometría (3º GADE) Lo que estudiaremos

Más detalles

Inferencia. Mauricio Olivares. 19 de junio de 2015 ITAM

Inferencia. Mauricio Olivares. 19 de junio de 2015 ITAM Inferencia Mauricio Olivares ITAM 19 de junio de 2015 Recuerda de nuestra clase anterior que m(x) = α + βx. Recuerda de nuestra clase anterior que m(x) = α + βx. Esta es una relación poblacional, no hay

Más detalles

Curso de nivelación Estadística y Matemática

Curso de nivelación Estadística y Matemática Modelo de Curso de nivelación Estadística y Matemática Pruebas de hipótesis, y Modelos ARIMA Programa Técnico en Riesgo, 2017 Agenda Modelo de 1 2 Asociación Medidas de asociación para variables intervalo

Más detalles

Tema 13: Regresión Logística p. 1/20 Tema 13: Regresión Logística Abdelmalik Moujahid, Iñaki Inza y Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del

Más detalles

Nombre y Apellidos:... EXAMEN ECONOMETRÍA II (Enero 2010)

Nombre y Apellidos:... EXAMEN ECONOMETRÍA II (Enero 2010) Nombre y Apellidos:... NIU:... Grupo:... EXAMEN ECONOMETRÍA II (Enero 2010) Lea cuidadosamente cada pregunta. Marque muy claramente la respuesta de cada pregunta en la hoja de respuestas. Observe que los

Más detalles

Heteroscdasticidad y MCG

Heteroscdasticidad y MCG May 24, 2009 Modelo lineal clasico: 1 Linealidad: Y = Xβ + u. 2 Exogeneidad: E(u) = 0 3 No Multicolinealidad: ρ(x) = K. 4 No heteroscedasticidad ni correlacion serial: V (u) = σ 2 I n. Teorema de Gauss/Markov

Más detalles

Folleto de Estadísticas. Teoría del 2do Parcial

Folleto de Estadísticas. Teoría del 2do Parcial Folleto de Estadísticas Teoría del 2do Parcial 2012 Variables aleatorias conjuntas continuas: Sean X y Y dos variables aleatorias continuas con ellas se asocia una función denominada función de densidad

Más detalles

Muestreo en Poblaciones Finitas

Muestreo en Poblaciones Finitas Información Adicional. Estimadores de Razón y Regresión 1/25 Muestreo en Poblaciones Finitas Información Adicional. Estimadores de Razón y Regresión José A. Mayor Gallego Departamento de Estadística e

Más detalles

Estructura de este tema. Tema 4 Regresión lineal simple. Ejemplo: consumo de vino y dolencias cardíacas. Frecuencias

Estructura de este tema. Tema 4 Regresión lineal simple. Ejemplo: consumo de vino y dolencias cardíacas. Frecuencias Estructura de este tema Tema 4 Regresión lineal simple José R. Berrendero Departamento de Matemáticas Universidad utónoma de Madrid Planteamiento del problema. Ejemplos Recta de regresión de mínimos cuadrados

Más detalles

Tema 3 - Introducción. Tema 2. Distribuciones en el muestreo Estadísticos y distribución muestral. Ejemplos: X y S 2.

Tema 3 - Introducción. Tema 2. Distribuciones en el muestreo Estadísticos y distribución muestral. Ejemplos: X y S 2. Tema 3 - Introducción 1 Tema 2. Distribuciones en el muestreo Estadísticos y distribución muestral. Ejemplos: X y S 2. Tema 3. Estimación puntual Criterios de comparación de estimadores: Insesgadez. Estimadores

Más detalles

Hoja de Problemas Tema 3 (Variables aleatorias multidimensionales)

Hoja de Problemas Tema 3 (Variables aleatorias multidimensionales) Depto. de Matemáticas Estadística (Ing. de Telecom.) Curso 2004-2005 Hoja de Problemas Tema 3 (Variables aleatorias multidimensionales) 1. Consideremos dos variables aleatorias independientes X 1 y X 2,

Más detalles

Regresión con errores autocorrelacionados

Regresión con errores autocorrelacionados Series de tiempo Gerardo Ortega Miguel Pluma Luis Osorio Johnatan García 09 de diciembre de 2013 Contenido 1 Introducción Idea intuitiva 2 Algoritmo 3 Propiedades de los estimadores 4 Estadístico de Durbin-Watson

Más detalles

Información sobre Gastos de Consumo Personal y Producto Interno Bruto ( ) en miles de millones de dólares de 1992.

Información sobre Gastos de Consumo Personal y Producto Interno Bruto ( ) en miles de millones de dólares de 1992. Universidad Nacional Autónoma de Nicaragua UNAN-Managua Curso de Análisis y Diseño de Modelos Econométricos Profesor: MSc. Julio Rito Vargas Avilés. Participantes: Docentes /FAREM-Carazo Encuentro No.4

Más detalles

Tests de Hipótesis. Estadística (M)

Tests de Hipótesis. Estadística (M) Tests de Hipótesis Estadística (M) Ejemplo Una empresa sabe por sus registros históricos que en cada uno de los años anteriores los empleados han faltado un promedio de 6.3 días. Este año la empresa introdujo

Más detalles

Estimación de la regresión

Estimación de la regresión 13 de mayo de 2009 Estudio de la dependencia entre dos variables En muchas situaciones interesa analizar la relación existente entre dos variables, X e Y. El análisis de regresión estudia de que forma

Más detalles

ESTIMACIÓN Estas transparencias contienen material adaptado del curso de PATTERN RECOGNITION AND MACHINE LEARNING de Heikki Huttunen y del libro Duda.

ESTIMACIÓN Estas transparencias contienen material adaptado del curso de PATTERN RECOGNITION AND MACHINE LEARNING de Heikki Huttunen y del libro Duda. ESTIMACIÓN Estas transparencias contienen material adaptado del curso de PATTERN RECOGNITION AND MACHINE LEARNING de Heikki Huttunen y del libro Duda. APRENDIZAJE AUTOMÁTICO, ESTIMACIÓN Y DETECCIÓN Introducción

Más detalles

Tema 2. Heterocedasticidad. 1 El modelo de regresión lineal con errores heterocedásticos

Tema 2. Heterocedasticidad. 1 El modelo de regresión lineal con errores heterocedásticos ema 2. Heterocedasticidad. El modelo de regresión lineal con errores heterocedásticos En este tema vamos a analizar el modelo de regresión lineal Y t = X tβ + u t, donde X t = (X t, X 2t,.., X kt y β =

Más detalles

Probabilidades y Estadística

Probabilidades y Estadística Probabilidades y Estadística Profesor: Fernando Lema Auxiliares: Víctor Carmi - Abelino Jiménez Universidad de Chile Indice General 1 Indice General 1 Advertencias y Recomendaciones Tener presente siempre

Más detalles