Análisis de datos Categóricos

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Análisis de datos Categóricos"

Transcripción

1 Introducción a los Modelos Lineales Generalizados Universidad Nacional Agraria La Molina

2 Introducción Modelos Lineales Generalizados Introducción Componentes Estimación En los capítulos anteriores se discutieron métodos para analizar tablas de dos vías. Sin embargo, muchos estudios incluyen más de dos variables explicativas algunas continuas y otras categóricas. En este capítulo se introduce la familia de Modelos Lineales Generalizados que incluye los modelos más importantes para una variable respuesta categórica y continua. Nelder y Wedderburn (1972) introducen la familia de GLM's (Generalized Linear Models). Otra buena referencia es Annette J. Dobson (2002) An introduction to Generalized Linear Models.

3 Introducción Componentes Estimación Componentes Un Modelo Lineal Generalizado (GLM) se especica a partir de tres componentes. Un componente aleatorio que identica la variable respuesta Y y su distribución de probabilidad. Un componente sistemático que identica las variables explicativas usadas en una función predictor lineal. Una función de enlace que conecta µ = E (Y ) con el componente sistemático. El componente aleatorio consiste de una variable respuesta Y con observaciones independientes (y 1,, y n ) a partir de una distribución que pertenece a una familia exponencial natural.

4 Componentes Modelos Lineales Generalizados Introducción Componentes Estimación Esta familia tiene distribución de probabilidad o densidad: f (y i ; θ i ) = a(θ i )b(y i ) exp{y i Q(θ i )} El término Q(θ) es llamado el parámetro natural. Sea x ij el valor del predictor j para el sujeto i, entonces: η i = p β j x ij = x T i β j=0 i = 1,, n Esta combinación lineal de variables explicativas es llamada el predictor lineal.

5 Componentes Modelos Lineales Generalizados Introducción Componentes Estimación La función de enlace g es monótona, diferenciable y conecta los componentes sistemático y aleatorio a través de: g(µ i ) = x T i β La función de enlace que transforma la media hacia el parámetro natural es llamado enlace canónico, es decir: g(µ i ) = Q(µ i ) = x T i β En resumen, un GLM es un modelo lineal para el valor esperado de una variable respuesta que tiene una distribución que pertenece a una familia exponencial natural.

6 Introducción Componentes Estimación Modelo logit binomial La función de probabilidad de la distribución de Bernoulli es: f (y; π) = π y (1 π) 1 y y pertenece a una familia exponencial natural. La función de enlace canónica es g(π) = log El modelo usando el enlace anterior: log π 1 π. π i 1 π i = x T i β i = 1,, n y es llamado modelo logit binomial.

7 Introducción Componentes Estimación La función de probabilidad para Y P (µ) es: f (y; µ) = e µ µ y y! que pertenece a una familia exponencial natural. La función de enlace canónica es g(µ) = log µ. El modelo usando el enlace anterior: log µ i = x T i β i = 1,, n y es llamado modelo loglineal de Poisson.

8 Modelo lineal normal Introducción Componentes Estimación La clase de GLM tambien incluye modelos para una variable respuesta continua. La distribución normal pertenece a una familia exponencial natural que incluye un parámetro de dispersión. El modelo más conocido es: µ i = x T i β i = 1,, n donde se considera la función de enlace identidad. Este modelo es llamado modelo de regresión lineal normal.

9 Introducción Componentes Estimación Tipo de análisis según el GLM Tabla 1: Tipo de análisis según GLM Componente Componente aleatorio Enlace sistemático Modelo Normal Identidad Mixto Regresión Normal Identidad Categórico ANVA Binomial logit Mixto Logístico Poisson log Mixto Loglineal Multinomial logit Mixto Respuesta multinomial

10 Devianza Modelos Lineales Generalizados Introducción Componentes Estimación La devianza de un GLM se dene por: D = 2 [L(û; y) L(y; y)] χ 2 N (p+1) y corresponde a la estadística de razón de verosimilitud para comparar un modelo propuesto con el modelo saturado. Los grados de libertad corresponden a la diferencia entre el número de parámetros en el modelo saturado y en el modelo propuesto La devianza es usada para analizar el grado de ajuste del modelo y también para poder establecer comparaciones con otros modelos.

11 Introducción Componentes Estimación Mínimos cuadrados reponderados iterativos Los estimadores se obtienen por un procedimiento llamado mínimos cuadrados ponderados iterativos: b (m) = (X T W (m 1) X) 1 X T W (m 1) z (m 1) La matriz W es diagonal cuyos elementos son: w ii = 1 Var(Y i ) ( µi η i ) 2 Los elementos de z son: ( ) ηi z i = η i + (y i µ i ) µ i

12 Modelo de regresión probit Tablas 2 2 Sea Y una variable respuesta binaria cuyos posibles resultados son 0 y 1 tal que: E (Y ) = Pr (Y = 1) = π (x) Normalmente existe una relación no lineal monótona entre π (x) y x. Las curvas en forma de S son típicas. La más importante corresponde al modelo de regresión logística: π (x) = exp {β 0 + β 1 x} 1 + exp {β 0 + β 1 x}

13 Modelo de regresión probit Tablas 2 2 Si x, entonces π(x) tiende a cero cuando β 1 < 0 y π(x) tiende a uno cuando β 1 > 0. A partir del modelo anterior el odds es: π(x) 1 π(x) = exp{β 0 + β 1 x} Luego, el logaritmo del odds tiene relacion lineal: log π(x) 1 π(x) = β 0 + β 1 x El modelo anterior es también llamado modelo logit.

14 Modelo de regresión probit Modelo de regresión probit Tablas 2 2 Una curva de regresión monótona por lo general tiene la forma de una función de distribución acumulada de una variable aleatoria continua. Lo anterior sugiere un modelo para una variable respuesta binaria de la forma: π (x) = F (x) para alguna función de distribución acumulada F. Sea Φ la función de distribución acumulada estándar de una familia de distribuciones.

15 Modelo de regresión probit Modelo de regresión probit Tablas 2 2 Se propone el modelo: π (x) = Φ(β 0 + β 1 x) Si Φ es estrictamente creciente entonces: Φ 1 (π (x)) = β 0 + β 1 x es decir, la función de enlace para el GLM es Φ 1. Si Φ es la función de distribución acumulada de la distribución normal estándar el model anterior es llamado modelo probit.

16 Ejemplo Modelos Lineales Generalizados Modelo de regresión probit Tablas 2 2 Ejemplo: Pulso Suponga que se desea determinar el efecto del peso (en libras) de un grupo de pacientes sobre su tasa de pulso en reposo. La variable respuesta es Y = 1 si la tasa de pulso es alta y Y = 0 si la tasa de pulso es baja. Se desea establecer dos modelos que permitan estimar la tasa de pulso alta en función al peso del paciente. Usar ambos modelos para estimar la probabilidad que tiene un paciente de 140 libras de tener una tasa de pulso alta.

17 Tablas 2 2 Modelos Lineales Generalizados Modelo de regresión probit Tablas 2 2 Suponga que para alguna función de enlace: g(π (x)) = β 0 + β 1 x Se describe el efecto de X por: β 1 = g(π (2)) g(π (1)) Para el enlace identidad: β 1 = π (2) π (1)

18 Tablas 2 2 Modelos Lineales Generalizados Modelo de regresión probit Tablas 2 2 Para el enlace log: β 1 = log π (2) log π (1) = log π (2) π (1) = log r Para el enlace logit: β 1 = logit π (2) logit π (1) = log π(2) 1 π(2) π(1) 1 π(1) = log θ

19 Ejemplo: Modelos Lineales Generalizados Modelo de regresión probit Tablas 2 2 Ejemplo: Osteoporosis En un estudio para conocer la prevalencia de la osteoporosis se incluyó a 1360 mujeres con edades entre 50 y 54 años. A cada una se le realizó una densitometría de columna y se completó un cuestionario de antecedentes. Los resultados obtenidos se muestran a continuación: Resultado Osteoporosis densiometría Si No Total Expuesto No expuesto Total

20 Sobredispersión Distribución binomial negativa En muchos casos la variable respuesta a modelar es el resultado de un proceso de conteo. La distribución de Poisson tiene media µ > 0. El logaritmo de la media es el parámetro natural de la distribución y corresponde al enlace canónico para su GLM. El modelo loglineal de Poisson con variable explicativa x es: log µ = β 0 + β 1 x La media satisface la siguiente relación exponencial: µ = exp{β 0 + β 1 x}

21 Ejemplo Modelos Lineales Generalizados Sobredispersión Distribución binomial negativa Ejemplo: Apareamiento del cangrejo Se presenta un estudio sobre el apareamiento del cangrejo de herradura. Cada cangrejo hembra tiene un cangrejo macho residente en su nido. El estudio investigó los factores que hacen que un cangrejo hembra tenga otros machos no residentes llamados satélites. Se busca un modelo que permita estimar el número de satélites en función al ancho del caparazón del cangrejo hembra.

22 Sobredispersión Modelos Lineales Generalizados Sobredispersión Distribución binomial negativa Cuando la varianza es mayor que la media se tiene el problema de la sobredispesión. Una causa para la sobredispersión es la heterogeneidad en los sujetos. La sobredispersión no representa un problema en una regresión ordinaria con distribución normal para Y debido a que la varianza es un parámetro separado. Para la distribución binomial y Poisson, sin embargo, la varianza es función de la media.

23 Sobredispersión Distribución binomial negativa Distribución binomial negativa La distribución binomial negativa tiene función de probabilidad: f (y; k; µ) = ( ) Γ (y + k) k k ( 1 k ) y Γ (k) Γ (y + 1) µ + k µ + k para y = 0, 1, 2, tal que E(Y ) = µ y Var(Y ) = µ + µ 2 /k. El término k 1 es llamado parámetro de dispersión. Cuando k 1 0 entonces Var(Y ) µ y la distribución binomial negativa converge a la distribución de Poisson.

24 Sobredispersión Distribución binomial negativa Distribución binomial negativa Usualmente k 1 es desconocido y su estimación ayuda a estudiar el grado de sobredispersión. Para k jo la función de probabilidad anterior puede expresarse en la forma de una familia exponencial natural. Un modelo con componente aleatorio con distribución binomial negativa es un GLM. Por simplicidad, estos modelos consideran que el parámetro k es el mismo para todas las observaciones.

25 Regresión de Poisson para tasas Sobredispersión Distribución binomial negativa Cuando los eventos de un determinado tipo se producen en una unidad de tiempo o espacio es preferible modelar la tasa en las que éstos ocurren. Por ejemplo, en un estudio de los homicidios ocurridos en un año para una muestra de ciudades se podria modelar el número de homicidios por año divididos por el tamaño de la población. El modelo podría describir como la tasa de homicidios depende de variables como la tasa de desempleo, la mediana del ingreso, el porcentaje de residentes que completan secundaria, etc.

Modelos lineales generalizados

Modelos lineales generalizados GoBack Modelos lineales Guillermo Ayala Gallego Universidad de Valencia 20 de enero de 2009 1 / 57 Verosimilitud de Ajuste de un GLM mediante Fisher Scoring Method s de un modelo lineal generalizado Identifica

Más detalles

1. Modelos para conteos

1. Modelos para conteos 1. Modelos para conteos En esta sección se modelarán conteos, que resultan de diversas situaciones, por ejemplo: el número de accidentes en una carretera, el número de caries que tiene una persona, el

Más detalles

Propiedades Una distribución pertenece a la familia exponencial si su función de densidad puede expresarse como:

Propiedades Una distribución pertenece a la familia exponencial si su función de densidad puede expresarse como: Familia Exponencial Propiedades Una distribución pertenece a la familia exponencial si su función de densidad puede expresarse como: f (y; θ) = s(y)t(θ)exp[a(y)b(θ)] = exp[a(y)b(θ)+c(θ)+d(y)] (1) con s(y)

Más detalles

MODELOS LINEALES GENERALIZADOS

MODELOS LINEALES GENERALIZADOS MODELOS LINEALES GENERALIZADOS Conceptos básicos Ignacio Méndez Gómez-Humarán imendez@cimat.mx Los Modelos Lineales Generalizados (GLM por sus siglas en inglés) son una familia de modelos estadísticos

Más detalles

Modelos Lineales Generalizados

Modelos Lineales Generalizados Modelos Lineales Generalizados 1 DefinicióndeunMLG Y1,Y2,...,Yn,conmediasµ1,µ2,...,µn,Yi, i=1,...,n,tienefdpmiembrodela familia exponencial a un parámetro, con las siguientes propiedades: 1.LadistribucióndecadaunodelosYi,paratodoi,estáenlaformacanónica,i.e.:

Más detalles

Análisis de datos Categóricos

Análisis de datos Categóricos Regresión logística Universidad Nacional Agraria La Molina 2014-2 Regresión logística simple Interpretación de parámetros Gracando las proporciones Inferencia Introducción Para una variable aleatoria respuesta

Más detalles

Guillermo Ayala Gallego Universidad de Valencia

Guillermo Ayala Gallego Universidad de Valencia GoBack Regresión logística Guillermo Ayala Gallego Universidad de Valencia 4 de febrero de 2009 1 / 22 Puede que sea el procedimiento estadístico más utilizado. Con aplicaciones frecuentes en Medicina

Más detalles

Estadística Computacional. M. González

Estadística Computacional. M. González Estadística Computacional M. González Facultad de Medicina. Universidad de Extremadura M. González (UEx) Estadística Computacional 1 / 23 Índice Modelos Lineales Generalizados Bioensayos: Modelos Dosis-Respuesta

Más detalles

Análisis de datos Categóricos

Análisis de datos Categóricos Introducción Universidad Nacional Agraria La Molina 2017-1 Variable cualitativa Variable respuesta cualitativa Variable respuesta y explicativa Variable de conteo y proporción Escalas de medición Una variable

Más detalles

Análisis de datos Categóricos

Análisis de datos Categóricos Regresión logística Universidad Nacional Agraria La Molina 2016-1 Regresión logística simple Interpretación de parámetros Inferencia Para una variable aleatoria respuesta Y y una variable explicativa X,

Más detalles

Análisis de datos categóricos

Análisis de datos categóricos Regresión multinomial Universidad Nacional Agraria La Molina 2017-1 Distribución multinomial Distribución multinomial Considere una variable aleatoria Y con J categorías cuyas probabilidades respectivas

Más detalles

Mathias Bourel. 2 de octubre de 2016

Mathias Bourel. 2 de octubre de 2016 Regresión Logística Mathias Bourel IMERL - Facultad de Ingeniería, Universidad de la República, Uruguay 2 de octubre de 2016 M.Bourel (IMERL, UdelaR) Regresión Logística 2 de octubre de 2016 1 / 28 Introducción

Más detalles

g(e (y)) = α + β 1 x β k x k

g(e (y)) = α + β 1 x β k x k Modelos lineales generalizados Especifica la función para E (y) = μ g(.) = Función liga o conectora Conecta los componentes aleatorio y sistemático g(e (y)) = α + β 1 x 1 + + β k x k Componente Aleatorio

Más detalles

Algunos Problemas y Soluciones en el Análisis de Experimentos Ajustados con MLG s.

Algunos Problemas y Soluciones en el Análisis de Experimentos Ajustados con MLG s. Algunos Problemas y Soluciones en el Análisis de Experimentos Ajustados con MLG s. Víctor Aguirre Torres Departamento de Estadística, ITAM. Seminario de Estadística, CIMAT. 5 de Nov 2007. Créditos Trabajo

Más detalles

Estadística. Tema 2. Variables Aleatorias Funciones de distribución y probabilidad Ejemplos distribuciones discretas y continuas

Estadística. Tema 2. Variables Aleatorias Funciones de distribución y probabilidad Ejemplos distribuciones discretas y continuas Estadística Tema 2 Variables Aleatorias 21 Funciones de distribución y probabilidad 22 Ejemplos distribuciones discretas y continuas 23 Distribuciones conjuntas y marginales 24 Ejemplos distribuciones

Más detalles

Análisis de datos Categóricos

Análisis de datos Categóricos Tablas de contingencia de dos vías Universidad Nacional Agraria La Molina 2017-1 Notación y estructura de probabilidad Independencia de variables categóricas Distribuciones de muestreo Tipos de estudios

Más detalles

Pérdida Esperada. Pérdida Esperada (PE): Valor esperado de pérdida por riesgo crediticio en un horizonte de tiempo determinado.

Pérdida Esperada. Pérdida Esperada (PE): Valor esperado de pérdida por riesgo crediticio en un horizonte de tiempo determinado. Pérdida Esperada Uno de los objetivos de este estudio es construir una función de pérdidas para el portafolio de la cartera de préstamos que ofrece la entidad G&T Continental, basados en el comportamiento

Más detalles

Estimación Bayesiana en el modelo lineal generalizado

Estimación Bayesiana en el modelo lineal generalizado Estimación Bayesiana en el modelo lineal generalizado Hernando Alvarado Quintero and Fabian Guillermo Rojas Rodríguez Universidad Nacional de Colombia halvaradoq@unal.edu.co and fgrojasro@unal.edu.co July

Más detalles

En el marco de las actividades y objetivos expresados en el protocolo de trabajo

En el marco de las actividades y objetivos expresados en el protocolo de trabajo Análisis estadístico de capturas de camarón y fauna con la red prototipo RS-INP-MEX en el Alto Golfo de California durante la temporada de camarón 010 / 011 En el marco de las actividades y objetivos expresados

Más detalles

viii CAPÍTULO 2 Métodos de muestreo CAPÍTULO 3 Análisis exploratorio de datos

viii CAPÍTULO 2 Métodos de muestreo CAPÍTULO 3 Análisis exploratorio de datos Contenido Acerca de los autores.............................. Prefacio.... xvii CAPÍTULO 1 Introducción... 1 Introducción.............................................. 1 1.1 Ideas de la estadística.........................................

Más detalles

Estadística Bayesiana

Estadística Bayesiana Universidad Nacional Agraria La Molina 2017-1 Teoría de la decisión Riesgo de Bayes La teoría de decisión es un área de suma importancia en estadística ya que muchos problemas del mundo real pueden tomar

Más detalles

Análisis de Datos Categóricos. Leticia Gracia Medrano

Análisis de Datos Categóricos. Leticia Gracia Medrano Análisis de Datos Categóricos Leticia Gracia Medrano ii Contents 1 Modelo Logístico 1 1.1 Estimación de parámetros.................... 1 1.2 Interpretación de los parámetros................. 2 1.3 Ejemplo..............................

Más detalles

Análisis de datos Categóricos

Análisis de datos Categóricos Inferencia para tablas de contingencia Universidad Nacional Agraria La Molina 2013-1 Odds ratio Diferencia de proporciones Riesgo relativo Ejemplo Odds ratio El odds ratio muestral es: El estimador modicado

Más detalles

Auxiliar 9. MNL y MLE. Daniel Olcay. 21 de octubre de 2014 IN4402. Daniel Olcay (IN4402) Auxiliar 9 21 de octubre de / 13

Auxiliar 9. MNL y MLE. Daniel Olcay. 21 de octubre de 2014 IN4402. Daniel Olcay (IN4402) Auxiliar 9 21 de octubre de / 13 Auxiliar 9 MNL y MLE Daniel Olcay IN4402 21 de octubre de 2014 Daniel Olcay (IN4402) Auxiliar 9 21 de octubre de 2014 1 / 13 Índice Modelos no lineales Probabilidad lineal Probit Logit Máxima verosimilitud

Más detalles

5 Estudios de simulación

5 Estudios de simulación 5 Estudios de simulación El modelado a través de MLG está disponible en muchos de los paquetes estadísticos más conocidos, como Stata, SAS, Limdep, S o R. De estos paquetes quizás sea Limdep (versión 7.0)

Más detalles

Economía Aplicada. Modelos con variables dependiente binarias. Departamento de Economía Universidad Carlos III de Madrid

Economía Aplicada. Modelos con variables dependiente binarias. Departamento de Economía Universidad Carlos III de Madrid Economía Aplicada Modelos con variables dependiente binarias Departamento de Economía Universidad Carlos III de Madrid Ver Stock y Watson (capítulo 11) 1 / 28 Modelos con variables dependiente binarias:

Más detalles

Introducción a la regresión ordinal

Introducción a la regresión ordinal Introducción a la regresión ordinal Jose Barrera jbarrera@mat.uab.cat 20 de mayo 2009 Jose Barrera (UAB) Introducción a la regresión ordinal 20 de mayo 2009 1 / 11 Introducción a la regresión ordinal 1

Más detalles

Estimadores de regresión logística para tratamiento de no respuesta en el caso de cocientes de variables dicotómicas

Estimadores de regresión logística para tratamiento de no respuesta en el caso de cocientes de variables dicotómicas Comunicaciones en Estadística Junio 2009, Vol. 2, No. 1 Estimadores de regresión logística para tratamiento de no respuesta en el caso de cocientes de variables dicotómicas Logistic Regression Estimators

Más detalles

Definición Una hipótesis es una afirmación acerca de un parámetro.

Definición Una hipótesis es una afirmación acerca de un parámetro. Capítulo 8 Prueba de hipótesis Existen dos áreas de interés en el proceso de inferencia estadística: la estimación puntual y las pruebas de hipótesis. En este capítulo se presentan algunos métodos para

Más detalles

El Bootstrap paramétrico y no parametrico y su aplicación en los modelos log-lineal Poisson

El Bootstrap paramétrico y no parametrico y su aplicación en los modelos log-lineal Poisson El Bootstrap paramétrico y no parametrico y su aplicación en los modelos log-lineal Poisson Antonio Bravo Quiroz * Universidad Ricardo Palma 23 de noviembre de 2017 Índice 1. Conceptos Preliminares 6 1.1.

Más detalles

Preparación de los datos de entrada

Preparación de los datos de entrada Preparación de los datos de entrada Clase nro. 6 CURSO 2010 Objetivo Modelado de las características estocásticas de los sistemas. Variables aleatorias con su distribución de probabilidad. Por ejemplo:

Más detalles

EL PRINCIPIO DE MÁXIMA VEROSIMILITUD (LIKELIHOOD)

EL PRINCIPIO DE MÁXIMA VEROSIMILITUD (LIKELIHOOD) EL PRINCIPIO DE MÁXIMA VEROSIMILITUD (LIKELIHOOD) Fortino Vela Peón fvela@correo.xoc.uam.mx FVela-0 Objetivo Introducir las ideas básicas del principio de máxima verosimilitud. Problema Considere el experimento

Más detalles

Estadística Bayesiana

Estadística Bayesiana Modelos uniparamétricos Universidad Nacional Agraria La Molina 2017-1 Modelos uniparamétricos Se tiene una secuencia de ensayos independientes de Bernoulli y 1,, y n. Sea y el número total de éxitos en

Más detalles

Econometría Aplicada

Econometría Aplicada Econometría Aplicada y función de Verosimilitud Víctor Medina Los objetivos de esta parte del curso principalmente son: 1. Dar algunos ejemplos de decisiones económicas donde la variable dependiente es

Más detalles

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos Agro 6998 Conferencia Introducción a los modelos estadísticos mixtos Los modelos estadísticos permiten modelar la respuesta de un estudio experimental u observacional en función de factores (tratamientos,

Más detalles

Estudio en bloques completos vía regresión Poisson en presencia de sobredispersión. Ana María Torres Blanco

Estudio en bloques completos vía regresión Poisson en presencia de sobredispersión. Ana María Torres Blanco Estudio en bloques completos vía regresión Poisson en presencia de sobredispersión Ana María Torres Blanco Universidad Nacional de Colombia Facultad Ciencias, Departamento de Estadística Bogotá, Colombia

Más detalles

Estadística para las Ciencias Agropecuarias

Estadística para las Ciencias Agropecuarias Estadística para las Ciencias Agropecuarias Séptima Edición Di Rienzo, Julio Alejandro Casanoves, Fernando Gonzalez, Laura Alicia Tablada, Elena Margot Díaz, María del Pilar Robledo, Carlos Walter Balzarini,

Más detalles

(x) = 1 si P (Y = 1 X = x) P (Y = 0 X = x) P (Y = 0 X = x) > P (Y = 1 X = x) P (X = x Y = 0)P (Y = 0) > P (X = x Y = 1)P (Y = 1)

(x) = 1 si P (Y = 1 X = x) P (Y = 0 X = x) P (Y = 0 X = x) > P (Y = 1 X = x) P (X = x Y = 0)P (Y = 0) > P (X = x Y = 1)P (Y = 1) 1 1. Conceptos generales de clasificación 2. Clasificador k-vecino más cercano 3. Clasificador Bayesiano óptimo 4. Análisis discriminante lineal (LDA) 5. Clasificadores lineales y el Modelo perceptrón

Más detalles

Regresión de Poisson. Microeconomía Cuantitativa. R. Mora. Departmento de Economía Universidad Carlos III de Madrid

Regresión de Poisson. Microeconomía Cuantitativa. R. Mora. Departmento de Economía Universidad Carlos III de Madrid en gretl Microeconomía Cuantitativa R. Mora Departmento de Economía Universidad Carlos III de Madrid Esquema Introducción en gretl 1 Introducción 2 3 4 en gretl en gretl Introducción en gretl Ejemplo 1

Más detalles

Econometría III Examen. 29 de Marzo de 2012

Econometría III Examen. 29 de Marzo de 2012 Econometría III Examen. 29 de Marzo de 2012 El examen consta de 20 preguntas de respuesta múltiple. El tiempo máximo es 1:10 minutos. nota: no se pueden hacer preguntas durante el examen a no ser que sean

Más detalles

Regresión ponderada y falta de ajuste

Regresión ponderada y falta de ajuste Capítulo 4 Regresión ponderada y falta de ajuste 4.1. Introducción En este capítulo se presentan la regresión ponderada y la prueba de falta de ajuste como un conjunto adicional de herramientas usadas

Más detalles

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS. Modelos Probit y Tobit aplicados al estudio de la oferta laboral de los trabajadores secundarios en el Perú

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS. Modelos Probit y Tobit aplicados al estudio de la oferta laboral de los trabajadores secundarios en el Perú UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS FACULTAD DE CIENCIAS MATEMÁTICAS E.A.P. DE. ESTADÍSTICA Modelos Probit y Tobit aplicados al estudio de la oferta laboral de los trabajadores secundarios en el Perú

Más detalles

Índice general. Pág. N. 1. Capítulo 1 ETAPAS DE UNA INVESTIGACIÓN. Diseño. Población. Muestra. Individuo (Observación, Caso, Sujeto) Variables

Índice general. Pág. N. 1. Capítulo 1 ETAPAS DE UNA INVESTIGACIÓN. Diseño. Población. Muestra. Individuo (Observación, Caso, Sujeto) Variables Pág. N. 1 Índice general Capítulo 1 ETAPAS DE UNA INVESTIGACIÓN 1.1 Diseño 1.2 Descriptiva 1.3 Inferencia Diseño Población Muestra Individuo (Observación, Caso, Sujeto) Variables Ejercicios de Población

Más detalles

ANÁLISIS DE REGRESIÓN

ANÁLISIS DE REGRESIÓN ANÁLISIS DE REGRESIÓN INTRODUCCIÓN Francis Galtón DEFINICIÓN Análisis de Regresión Es una técnica estadística que se usa para investigar y modelar la relación entre variables. Respuesta Independiente Y

Más detalles

MODELOS DE SIMULACIÓN ESTADÍSTICOS CLASE 4: DISTRIBUCIÓN t, CHI-CUADRADA y EXPONENCIAL PROFESOR: OSCAR SAAVEDRA ANDRÉS DURANGO.

MODELOS DE SIMULACIÓN ESTADÍSTICOS CLASE 4: DISTRIBUCIÓN t, CHI-CUADRADA y EXPONENCIAL PROFESOR: OSCAR SAAVEDRA ANDRÉS DURANGO. DISTRIBUCIÓN t Con frecuencia intentamos estimar la media de una población cuando se desconoce la varianza, en estos casos utilizamos la distribución de t de Student. Si el tamaño de la muestra es suficientemente

Más detalles

Tema 6: Introducción a la Inferencia Bayesiana

Tema 6: Introducción a la Inferencia Bayesiana Tema 6: Introducción a la Inferencia Bayesiana Conchi Ausín Departamento de Estadística Universidad Carlos III de Madrid concepcion.ausin@uc3m.es CESGA, Noviembre 2012 Contenidos 1. Elementos básicos de

Más detalles

Robusticidad de los Diseños D-óptimos a la Elección. de los Valores Locales para el Modelo Logístico

Robusticidad de los Diseños D-óptimos a la Elección. de los Valores Locales para el Modelo Logístico Robusticidad de los Diseños D-óptimos a la Elección de los Valores Locales para el Modelo Logístico David Felipe Sosa Palacio 1,a,Víctor Ignacio López Ríos 2,a a. Escuela de Estadística, Facultad de Ciencias,

Más detalles

Econometría Avanzada FLACSO 2014

Econometría Avanzada FLACSO 2014 Econometría Avanzada FLACSO 2014 Hemos cubierto: Mapa Planteamiento de una pregunta económica de interés Diferencias entre econometría y estadística Métodos: Lineales (MCO) revisión, variables instrumentales

Más detalles

Pruebas estadís,cas para evaluar relaciones

Pruebas estadís,cas para evaluar relaciones Pruebas estadís,cas para evaluar relaciones Asociación entre dos variables categóricas Hipótesis: frecuencias de ocurrencias en las categorías de una variable son independientes de los frecuencias en la

Más detalles

Estimación por intervalos

Estimación por intervalos Capítulo 9 Estimación por intervalos 9.1. Introducción En este capítulo se desarrolla la estimación por intervalos donde el proceso de inferencia se realiza de la forma θ C, donde C = Cx) es un conjunto

Más detalles

Cálculo de Probabilidades II Preguntas Tema 2

Cálculo de Probabilidades II Preguntas Tema 2 Cálculo de Probabilidades II Preguntas Tema 2 1. Demuestre que la suma de n v.a. Bernuolli(p) independientes tiene una distribución Binomial con parametros (n, p). 2. Se dice que una v.a tiene una distribución

Más detalles

Tema 3. Tema 3 La Distribución Normal y los Puntajes Estándar. Profa. María Fátima Dos Santos

Tema 3. Tema 3 La Distribución Normal y los Puntajes Estándar. Profa. María Fátima Dos Santos Tema 3 Tema 3 La Distribución Normal y los Puntajes Estándar Profa. María Fátima Dos Santos 1 TEMARIO Concepto de distribución. Algunas distribuciones. Distribución normal. Características Distribución

Más detalles

INDICE. Capitulo Uno.

INDICE. Capitulo Uno. INDICE Prefacio XIII Capitulo Uno. 1 Introducción 1.1. Estadística: La ciencia de los datos 2 1.2. Tipos de datos 5 1.3. El papel de la estadística 7 1.4. Resumen 8 Laboratorio de Computación. Introducción

Más detalles

EXAMEN DE ECONOMETRÍA

EXAMEN DE ECONOMETRÍA EXAMEN DE ECONOMETRÍA UNIVERSIDAD CARLOS III DE MADRID CURSO 2015-1 Responda todas las preguntas en 2 horas y media. Valores críticos al final del examen. 1 A partir de una muestra aleatoria de compra-venta

Más detalles

Cálculos de Regresión Logística en R, Caso de una covariable.

Cálculos de Regresión Logística en R, Caso de una covariable. Cálculos de Regresión Logística en R, Caso de una covariable. Carga de datos (Tabla 1.1, Hosmer-Lemeshow): CH=read.table( CHDAGE.txt,header = T) attach(ch) Gráfico de Dispersión: plot(age,chd,xlab= Edad,

Más detalles

Estimación Máxima Verosimilitud

Estimación Máxima Verosimilitud Estimación Máxima Verosimilitud Microeconomía Cuantitativa R. Mora Departmento of Economía Universidad Carlos III de Madrid Outline Motivación 1 Motivación 2 3 4 5 Estrategias generales de estimación Hay

Más detalles

Modelos de suavizado, aditivos y mixtos

Modelos de suavizado, aditivos y mixtos Carmen Armero 1 de junio de 2011 Introducción Introducción Modelos lineales, LM Modelos aditivos, AM Modelos lineales generalizados, GLM GAM I Un modelo lineal generalizado (GAM) es un modelo lineal generalizado

Más detalles

Regresión Lineal Múltiple

Regresión Lineal Múltiple Unidad 4 Regresión Lineal Múltiple Javier Santibáñez (IIMAS, UNAM) Regresión Semestre 2017-2 1 / 35 Introducción La idea de la regresión lineal múltiple es modelar el valor esperado de la variable respuesta

Más detalles

Modelos de elección discreta Aplicaciones en ordenador

Modelos de elección discreta Aplicaciones en ordenador Modelos de elección discreta Aplicaciones en ordenador Román Salmerón Gómez Para ilustrar cómo abordar el análisis de Modelos de elección discreta con el software econométrico Gretl resolveremos el siguiente

Más detalles

Práctica 10: Introducción a Modelos Lineales Generalizados.

Práctica 10: Introducción a Modelos Lineales Generalizados. Práctica : Introducción a Modelos Lineales Generalizados Esta última práctica está dedicada a estudiar brevememente algunos problemas que que se formalizan mediante un modelo similar al modelo lineal normal

Más detalles

Tema 4: Otros Métodos de Análisis de Datos Cuantitativos y Cualitativos

Tema 4: Otros Métodos de Análisis de Datos Cuantitativos y Cualitativos Tema 4: Otros Métodos de Análisis de Datos Cuantitativos y Cualitativos Metodología de la Investigación en Fisioterapia Miguel González Velasco Departamento de Matemáticas. Universidad de Extremadura M.

Más detalles

Page 1 of 5 Departamento: Dpto Matematica Nombre del curso: PROBABILIDAD Y ESTADÍSTICA Clave: 003872 Academia a la que pertenece: Probabilidad y Estadística Requisitos: Requisito de Probabilidad y Estad

Más detalles

UNIVERSIDAD DE ATACAMA

UNIVERSIDAD DE ATACAMA UNIVERSIDAD DE ATACAMA FACULTAD DE INGENIERÍA / DEPARTAMENTO DE MATEMÁTICA ESTADÍSTICA Y PROBABILIDAD GUÍA DE TRABAJO 3 Profesor: Hugo S. Salinas. Primer Semestre 2010 1. Sea X 1,..., X n una muestra aleatoria

Más detalles

FACULTAD DE CIENCIAS AGRARIAS Y FORESTALES PROSECRETARÍA DE POSGRADO CURSO DE POSGRADO

FACULTAD DE CIENCIAS AGRARIAS Y FORESTALES PROSECRETARÍA DE POSGRADO CURSO DE POSGRADO FACULTAD DE CIENCIAS AGRARIAS Y FORESTALES PROSECRETARÍA DE POSGRADO CURSO DE POSGRADO 1- Docente responsable Dra. María del Pilar Díaz Profesora Adjunta Estadística y Bioestadística Facultad de Cs. Médicas,

Más detalles

TEMA 5. Modelos para Datos de Conteo

TEMA 5. Modelos para Datos de Conteo TEMA 5. Modelos para Datos de Conteo Profesor: Pedro Albarrán Pérez Universidad de Alicante. Curso 2010/2011. Contenido 1 Datos de Conteo 2 Regresión de Poisson 3 Extensiones Datos de Conteo Variable de

Más detalles

DEPARTAMENTO: Matemáticas NOMBRE DEL CURSO: Probabilidad y Estadística CLAVE: 1016M ACADEMIA A LA QUE PERTENECE: Probabilidad y Estadística

DEPARTAMENTO: Matemáticas NOMBRE DEL CURSO: Probabilidad y Estadística CLAVE: 1016M ACADEMIA A LA QUE PERTENECE: Probabilidad y Estadística PROGRAMA DE CURSO Modelo 2009 DEPARTAMENTO: Matemáticas NOMBRE DEL CURSO: Probabilidad y Estadística CLAVE: 1016M ACADEMIA A LA QUE PERTENECE: Probabilidad y Estadística PROFESIONAL ASOCIADO Y LICENCIATURA

Más detalles

Tema 13: Regresión Logística p. 1/20 Tema 13: Regresión Logística Abdelmalik Moujahid, Iñaki Inza y Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del

Más detalles

PROGRAMA OFICIAL DE POSTGRADO EN ESTADÍSTICA E INVESTIGACIÓN OPERATIVA

PROGRAMA OFICIAL DE POSTGRADO EN ESTADÍSTICA E INVESTIGACIÓN OPERATIVA PROGRAMA OFICIAL DE POSTGRADO EN ESTADÍSTICA E INVESTIGACIÓN OPERATIVA DATOS IDENTIFICATIVOS DE LA MATERIA Código de la materia: P1061101 Nombre de la materia: Modelos de Regresión Número de créditos ECTS:

Más detalles

Una revisión de los modelos de conteo con excesos de ceros.

Una revisión de los modelos de conteo con excesos de ceros. UNIVERSIDAD DE LA REPÚBLICA Facultad de Ciencias Económicas y de Administración Licenciatura en Estadística Informe de Pasantía Una revisión de los modelos de conteo con excesos de ceros. Eloísa Martínez

Más detalles

MLLG - Modelos Lineales y Lineales Generalizados

MLLG - Modelos Lineales y Lineales Generalizados Unidad responsable: Unidad que imparte: Curso: Titulación: Créditos ECTS: 2016 200 - FME - Facultad de Matemáticas y Estadística 715 - EIO - Departamento de Estadística e Investigación Operativa 749 -

Más detalles

Transformaciones y esperanza

Transformaciones y esperanza Capítulo 3 Transformaciones y esperanza 3.1. Introducción Por lo general estamos en condiciones de modelar un fenómeno en términos de una variable aleatoria X cuya función de distribución acumulada es

Más detalles

Modelos de distribuciones discretas y continuas

Modelos de distribuciones discretas y continuas Ignacio Cascos Fernández Departamento de Estadística Universidad Carlos III de Madrid Modelos de distribuciones discretas y continuas Estadística I curso 2008 2009 1. Distribuciones discretas Aquellas

Más detalles

Representaciones gráficas de las distribuciones bidimensionales de frecuencias... 74

Representaciones gráficas de las distribuciones bidimensionales de frecuencias... 74 Índice 1. Introducción al R 15 1.1. Introducción............................. 15 1.2. El editor de objetos R....................... 18 1.3. Datos en R............................. 19 1.3.1. Vectores...........................

Más detalles

DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS

DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS ÍNDICE Introducción: Entrene su cerebro para la estadística... 1 La población y la muestra... 3 Estadísticas descriptivas e inferenciales... 4 Alcanzar el objetivo de estadísticas inferenciales: los pasos

Más detalles

Estudio de homogeneidad de la dispersión en diseño a una vía de clasificación para datos de proporciones y conteos

Estudio de homogeneidad de la dispersión en diseño a una vía de clasificación para datos de proporciones y conteos Revista Colombiana de Estadística Junio 2009, volumen 32, no. 1, pp. 59 a 78 Estudio de homogeneidad de la dispersión en diseño a una vía de clasificación para datos de proporciones y conteos Study of

Más detalles

Formulario. Estadística Administrativa. Módulo 1. Introducción al análisis estadístico

Formulario. Estadística Administrativa. Módulo 1. Introducción al análisis estadístico Formulario. Estadística Administrativa Módulo 1. Introducción al análisis estadístico Histogramas El número de intervalos de clase, k, se elige de tal forma que el valor 2 k sea menor (pero el valor más

Más detalles

Universidad Autónoma de Sinaloa

Universidad Autónoma de Sinaloa Séptima Edición del Diplomado en Estadística Mc. José V. Jiménez Ramírez Director de la Escuela de Ciencias Fisico-Matemáticas Tel. : 7 16 11 54 vidaljr@uas.uasnet.mx Dr. René Castro Montoya Coordinador

Más detalles

INDICE. Prólogo a la Segunda Edición

INDICE. Prólogo a la Segunda Edición INDICE Prólogo a la Segunda Edición XV Prefacio XVI Capitulo 1. Análisis de datos de Negocios 1 1.1. Definición de estadística de negocios 1 1.2. Estadística descriptiva r inferencia estadística 1 1.3.

Más detalles

Inferencia en tablas de contingencia

Inferencia en tablas de contingencia GoBack Inferencia en tablas de contingencia Guillermo Ayala Gallego Universidad de Valencia 15 de octubre de 2008 1 / 36 Distribución condicionada exacta Intervalo para los odds ratio Intervalo de la diferencia

Más detalles

Simulación. La mayoría de los procesos de simulación tiene la misma estructura básica:

Simulación. La mayoría de los procesos de simulación tiene la misma estructura básica: Simulación La mayoría de los procesos de simulación tiene la misma estructura básica: 1 Indentificar una variable de interés y escribir un programa para simular dichos valores Generar una muestra independiente

Más detalles

Relación de Problemas. Tema 5

Relación de Problemas. Tema 5 Relación de Problemas. Tema 5. Supongamos que tenemos una muestra aleatoria simple de tamaño n de una v.a. X que sigue una distribución geométrica con función de probabilidad P (X = k) = p( p) k Calcular

Más detalles

JUEGO DE BASKETBALL. Repaso de Distribuciones de Probabilidad Discretas y Continuas

JUEGO DE BASKETBALL. Repaso de Distribuciones de Probabilidad Discretas y Continuas JUEGO DE BASKETBALL Repaso de Distribuciones de Probabilidad Discretas y Continuas PREGUNTA #1 Qué es una variable aleatoria uniforme discreta? Cómo es su distribución? Qué es una variable aleatoria uniforme

Más detalles

Distribuciones Probabilísticas. Curso de Estadística TAE,2005 J.J. Gómez Cadenas

Distribuciones Probabilísticas. Curso de Estadística TAE,2005 J.J. Gómez Cadenas Distribuciones Probabilísticas Curso de Estadística TAE,005 J.J. Gómez Cadenas Distribución Binomial Considerar N observaciones independientes tales que: El resultado de cada experimento es acierto o fallo

Más detalles

Análisis de datos Categóricos

Análisis de datos Categóricos Pruebas Chi-cuadrado para tablas de dos vías Universidad Nacional Agraria La Molina 2017-1 Independencia y Homogeneidad Independencia y Homogeneidad Prueba de Pearson y G 2 Una prueba de independencia

Más detalles

478 Índice alfabético

478 Índice alfabético Índice alfabético Símbolos A, suceso contrario de A, 187 A B, diferencia de los sucesos A y B, 188 A/B, suceso A condicionado por el suceso B, 194 A B, intersección de los sucesos A y B, 188 A B, unión

Más detalles

Tema 6. Estimación puntual

Tema 6. Estimación puntual 1 Tema 6. Estimación puntual En este tema: Planteamiento del problema. Criterios de comparación de estimadores: Insesgadez. Estimadores de mínima varianza. Error cuadrático medio. Consistencia. Métodos

Más detalles

UNIVERSIDAD NACIONAL DE SAN AGUSTÍN FACULTAD DE CIENCIAS NATURALES Y FORMALES ESCUELA PROFESIONAL DE MATEMÁTICA

UNIVERSIDAD NACIONAL DE SAN AGUSTÍN FACULTAD DE CIENCIAS NATURALES Y FORMALES ESCUELA PROFESIONAL DE MATEMÁTICA UNIVERSIDAD NACIONAL DE SAN AGUSTÍN FACULTAD DE CIENCIAS NATURALES Y FORMALES ESCUELA PROFESIONAL DE MATEMÁTICA MODELOS LINEALES GENERALIZADOS Tesis presentada por: Bachiller Bisset Marilyn Gonzales Loayza.

Más detalles

Modelo Lineal Generalizado GAMMA. Distribución gamma: Otra parametrización mediante el parámetro de forma y la media:

Modelo Lineal Generalizado GAMMA. Distribución gamma: Otra parametrización mediante el parámetro de forma y la media: Modelo Lineal Generalizado GAMMA Distribución gamma: Otra parametrización mediante el parámetro de forma y la media: La distribución gamma es de tipo exponencial: 1 Supongamos que se dispone de r subpoblaciones

Más detalles

Tema1. Modelo Lineal General.

Tema1. Modelo Lineal General. Tema1. Modelo Lineal General. 1. Si X = (X 1, X 2, X 3, X 4 ) t tiene distribución normal con vector de medias µ = (2, 1, 1, 3) t y matriz de covarianzas 1 0 1 1 V = 0 2 1 1 1 1 3 0 1 1 0 2 Halla: a) La

Más detalles

Modelado y simulación en Ingeniería Química. Manuel Rodríguez

Modelado y simulación en Ingeniería Química. Manuel Rodríguez ÍNDICE Modelos de caja gris Calibración de modelos Estimación de parámetros Análisis de la estimación Regresión no lineal 1. Modelos de caja gris Son modelos de un sistema (o proceso), donde: Desarrollados

Más detalles

Folleto de Estadísticas. Teoría del 1er Parcial

Folleto de Estadísticas. Teoría del 1er Parcial Folleto de Estadísticas Teoría del 1er Parcial 2012 Población objetivo: Es un conjunto bien definido de elementos sobre los que se desea hacer algún tipo de investigación o medida. Unidades de investigación:

Más detalles

Lista de Ejercicios (Parte 1)

Lista de Ejercicios (Parte 1) ACT-11302 Cálculo Actuarial III ITAM Lista de Ejercicios (Parte 1) Prof.: Juan Carlos Martínez-Ovando 15 de agosto de 2016 P0 - Preliminar 1. Deriva las expresiones de las funciones de densidad (o masa

Más detalles

Modelos con variable dependiente limitada

Modelos con variable dependiente limitada Modelos con variable dependiente limitada Universidad Iberoamericana Diciembre 2014 Y es variable aleatoria, toma solo dos valores, uno o cero, asociada a la ocurrencia de un evento (1 ocurre, 0 si no).

Más detalles

Técnicas de Inferencia Estadística II. Tema 3. Contrastes de bondad de ajuste

Técnicas de Inferencia Estadística II. Tema 3. Contrastes de bondad de ajuste Técnicas de Inferencia Estadística II Tema 3. Contrastes de bondad de ajuste M. Concepción Ausín Universidad Carlos III de Madrid Grado en Estadística y Empresa Curso 2010/11 Tema 3. Contrastes de bondad

Más detalles

Regresión polinomial y factores

Regresión polinomial y factores Capítulo Regresión polinomial y factores.. Regresión polinomial Si una función media tiene un predictor X pueden usarse sus potencias enteras para aproximar E (Y X). El caso más simple es la regresión

Más detalles

Centro Universitario de Tonalá

Centro Universitario de Tonalá Presentación Este curso de estadística y evaluación de datos se encuentra diseñado para los estudiantes del Doctorado en Agua y Energía del Centro Universitario de Tonalá. Competencias genéricas de la

Más detalles