Modelos lineales generalizados

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Modelos lineales generalizados"

Transcripción

1 GoBack

2 Modelos lineales Guillermo Ayala Gallego Universidad de Valencia 20 de enero de / 57

3 Verosimilitud de

4 Ajuste de un GLM mediante Fisher Scoring Method

5 s de un modelo lineal generalizado Identifica la variable respuesta Y y su distribución de probabilidad. sistemática Especifica las variables explicativas (independientes, predictoras) utilizadas en la función predictora lineal. Función link Especifica la función de EY que la expresa como una combinación lineal de las variables predictoras. s de un modelo lineal generalizado sistemática Función link Modelos logit binomiales para Modelos loglineales Poisson para conteos Desviación Modelos lineales para GLM para conteos Verosimilitud de Inferencia para 2 / 57

6 La componente de un GLM consiste de una variable Y con observaciones independientes (y 1,...,y N ). Suponemos la distribución de Y en la familia exponencial natural. f(y i ;θ i ) = a(θ i )b(y i ) exp{y i Q(θ i )}. θ i varía para los distintos i dependiendo de los valores de las variables predictoras. Q(θ) recibe el nombre de parámetro natural. s de un modelo lineal generalizado sistemática Función link Modelos logit binomiales para Modelos loglineales Poisson para conteos Desviación Modelos lineales para GLM para conteos Verosimilitud de Inferencia para 3 / 57

7 sistemática La componente sistemática de un GLM es el vector (η 1,...,η N ) η i = j β j x ij, con i = 1,...,N, donde x ij es el valor del j-ésimo predictor en el i-ésimo individuo. La combinación lineal j β jx ij es el predictor lineal. Como es habitual, se suele considerar que uno de los predictores x ij vale uno para todos los i de modo que consideramos el término independiente. s de un modelo lineal generalizado sistemática Función link Modelos logit binomiales para Modelos loglineales Poisson para conteos Desviación Modelos lineales para GLM para conteos Verosimilitud de Inferencia para 4 / 57

8 Función link Mediante esta función relacionamos las componentes y sistemática. con i = 1,...,N g(µ i ) = j µ i = E(Y i ) η i = g(µ i ) β j x ij, con i = 1,...,N s de un modelo lineal generalizado sistemática Función link Modelos logit binomiales para Modelos loglineales Poisson para conteos Desviación Modelos lineales para GLM para conteos Verosimilitud de Inferencia para 5 / 57

9 Modelos logit binomiales para Tenemos respuesta binaria (éxito como 1 y fracaso como 0), esto es, Y Bin(1,π). f(y;π) = π y (1 π) 1 y = (1 π)[π/(1 π)] y = (1 π) exp ( y log ) π 1 π con y = 0, 1 El parámetro natural sería Q(p) = log p 1 p = logit(p) 6 / 57

10 Modelos loglineales Poisson para conteos La variable respuesta Y es un conteo (número de defectos, conteo en una tabla de contingencia) Asumimos Y Po(µ) donde EY = µ. con y = 0, 1,... El parámetro natural sería f(y;µ) = e µ µ y y! Q(µ) = log µ y la función link canónica η = log µ. = e µ 1 log µ ey y! 7 / 57

11 Desviación Los valores observados son y = (y 1,...,y N ) y el vector de medias µ = (µ 1,...,µ N ) Sea L(µ; y) la logverosimilitud. Sea L(ˆµ; y) el máximo de la logverosimilitud asumiendo el modelo. 8 / 57

12 Si utilizamos un parámetro distinto para cada observación entonces tendríamos el ajuste perfecto con ˆµ = y La logverosimilitud máxima L(y;y). El modelo con un parámetro por observación se llama un modelo saturado. No supone reducción alguna de los datos. s de un modelo lineal generalizado sistemática Función link Modelos logit binomiales para Modelos loglineales Poisson para conteos Desviación Modelos lineales para GLM para conteos Verosimilitud de Inferencia para 9 / 57

13 La desviación es [ ] 2 L(ˆµ;y) L(y;y) Es el test del cociente de verosimilitud para contrastar el modelo que asumimos frente a la alternativa del modelo saturado. Cuando los conteos de Poisson o bien el número de pruebas las distintas binomiales con N fijo tenemos que aproximadamente [ ] 2 L(ˆµ;y) L(y;y) χ 2 (N p) s de un modelo lineal generalizado sistemática Función link Modelos logit binomiales para Modelos loglineales Poisson para conteos Desviación Modelos lineales para GLM para conteos Verosimilitud de Inferencia para 10 / 57

14 Modelos lineales para s de un modelo lineal generalizado sistemática Función link Modelos logit binomiales para Modelos loglineales Poisson para conteos Desviación Modelos lineales para El modelo Un ejemplo GLM binomial y tablas 2 2 Probit y otras funciones link GLM para conteos Verosimilitud de Inferencia para 11 / 57

15 El modelo Y es una respuesta binaria. EY = P(Y = 1) y la denotamos por π(x) dependiente de x = (x 1,...,x p ). var(y ) = π(x)(1 π(x)). s de un modelo lineal generalizado sistemática Función link Modelos logit binomiales para Modelos loglineales Poisson para conteos Desviación Modelos lineales para El modelo Un ejemplo GLM binomial y tablas 2 2 Probit y otras funciones link GLM para conteos Verosimilitud de Inferencia para 12 / 57

16 Un ejemplo Enfermedad cardíaca Ronquido Si No Nunca Ocasionalmente Casi cada noche Cada noche notar/notar008.pdf. s de un modelo lineal generalizado sistemática Función link Modelos logit binomiales para Modelos loglineales Poisson para conteos Desviación Modelos lineales para El modelo Un ejemplo GLM binomial y tablas 2 2 Probit y otras funciones link GLM para conteos Verosimilitud de Inferencia para 13 / 57

17 GLM binomial y tablas 2 2 La variable predictora X es binaria. link[π(x)] = α + βx. El efecto de X viene descrito por β = link[π(1)] link[π(0)] s de un modelo lineal generalizado sistemática Función link Modelos logit binomiales para Modelos loglineales Poisson para conteos Desviación Modelos lineales para El modelo Un ejemplo GLM binomial y tablas 2 2 Probit y otras funciones link GLM para conteos Verosimilitud de Inferencia para 14 / 57

18 Con el link identidad: β = π(1) π(0) es la diferencia de proporciones. Con el link logarítmico: β = log π(1) log π(0) = log π(1) π(0) es el logaritmo del riesgo relativo. Con el link logit: β = logit(π(1)) logit(π(0)) = log es el logaritmo de los odds ratio. π(1)/(1 π(1)) π(0)/(1 π(0)) s de un modelo lineal generalizado sistemática Función link Modelos logit binomiales para Modelos loglineales Poisson para conteos Desviación Modelos lineales para El modelo Un ejemplo GLM binomial y tablas 2 2 Probit y otras funciones link GLM para conteos Verosimilitud de Inferencia para 15 / 57

19 Probit y otras funciones link Con un solo predictor parece natural el modelo π(x) = F(x) siendo F una función de distribución de probabilidad. Un caso particular: F(x) = Φ(x) siendo Φ(x) la función de distribución de la normal estándar entonces π(x) = Φ(α + βx) o equivalentemente Φ 1 (π(x)) = α + βx y tenemos un modelo probit. s de un modelo lineal generalizado sistemática Función link Modelos logit binomiales para Modelos loglineales Poisson para conteos Desviación Modelos lineales para El modelo Un ejemplo GLM binomial y tablas 2 2 Probit y otras funciones link GLM para conteos Verosimilitud de Inferencia para 16 / 57

20 GLM para conteos s de un modelo lineal generalizado sistemática Función link Modelos logit binomiales para Modelos loglineales Poisson para conteos Desviación Modelos lineales para GLM para conteos Modelo Poisson loglineal Ejemplo: cangrejos herradura Sobredispersión en GLM Poisson GLM binomiales negativos GLM Poisson e independencia en tablas de contingencia I J 17 / 57 Verosimilitud de

21 Modelo Poisson loglineal Asumimos Y con distribución de Poisson. El modelo loglineal con variable explicativa X es En este modelo log µ = α + βx. µ = exp(α + βx) = e α ( e β ) x s de un modelo lineal generalizado sistemática Función link Modelos logit binomiales para Modelos loglineales Poisson para conteos Desviación Modelos lineales para GLM para conteos Modelo Poisson loglineal Ejemplo: cangrejos herradura Sobredispersión en GLM Poisson GLM binomiales negativos GLM Poisson e independencia en tablas de contingencia I J 18 / 57 Verosimilitud de

22 Ejemplo: cangrejos herradura Cada animal hembra tiene un macho en su nido. Pero puede tener más, los satélites. La variable respuesta es el número de satélites. Las variables explicativas son: color, estado de la columna vertebral, peso y anchura del caparazón. En un primer análisis solo consideramos la anchura del caparazón. notar/notar015.pdf: una nota muy larga por cierto. s de un modelo lineal generalizado sistemática Función link Modelos logit binomiales para Modelos loglineales Poisson para conteos Desviación Modelos lineales para GLM para conteos Modelo Poisson loglineal Ejemplo: cangrejos herradura Sobredispersión en GLM Poisson GLM binomiales negativos GLM Poisson e independencia en tablas de contingencia I J 19 / 57 Verosimilitud de

23 Sobredispersión en GLM Poisson En una distribución de Poisson, la media y la varianza son iguales. Cuando trabajamos con conteos reales no suele ser cierta esta hipótesis. Con frecuencia la varianza es mayor que la media. A esto se le llama sobredispersión. Interpretación como mixturas de Poisson. No es un problema cuando Y tiene una distribución normal pues la normal tiene un parámetro que la modeliza. notar/notar023.pdf s de un modelo lineal generalizado sistemática Función link Modelos logit binomiales para Modelos loglineales Poisson para conteos Desviación Modelos lineales para GLM para conteos Modelo Poisson loglineal Ejemplo: cangrejos herradura Sobredispersión en GLM Poisson GLM binomiales negativos GLM Poisson e independencia en tablas de contingencia I J 20 / 57 Verosimilitud de

24 GLM binomiales negativos La densidad de la distribución binomial negativa es f(y;k,µ) = ( ) k ( Γ(y + k) k 1 Γ(k)Γ(y + 1) µ + k con y = 0, 1, 2,... donde k y µ son los parámetros. Se tiene que E(Y ) = µ, var(y ) = µ + µ 2 /k. k µ + k ) y s de un modelo lineal generalizado sistemática Función link Modelos logit binomiales para Modelos loglineales Poisson para conteos Desviación Modelos lineales para GLM para conteos Modelo Poisson loglineal Ejemplo: cangrejos herradura Sobredispersión en GLM Poisson GLM binomiales negativos GLM Poisson e independencia en tablas de contingencia I J 21 / 57 Verosimilitud de

25 El parámetro 1/k es un parámetro de dispersión. Si 1/k 0, entonces var(y ) µ y la distribución binomial negativa converge a una distribución de Poisson. Con k fijo esta densidad está en la familia exponencial natural y podríamos hablar de un GLM binomial negativo. notar/notar024.pdf s de un modelo lineal generalizado sistemática Función link Modelos logit binomiales para Modelos loglineales Poisson para conteos Desviación Modelos lineales para GLM para conteos Modelo Poisson loglineal Ejemplo: cangrejos herradura Sobredispersión en GLM Poisson GLM binomiales negativos GLM Poisson e independencia en tablas de contingencia I J 22 / 57 Verosimilitud de

26 GLM Poisson e independencia en tablas de contingencia I J Vamos a utilizar un modelo loglineal Poisson para modelizar conteos en tablas de contingencia. Suponemos que el conteo Y ij Po(µ ij ). Suponemos que µ ij = µα i β j siendo α i,β j 0 tales que i α i = 1 y j β j = 1. Si consideramos un log link tenemos log µ ij = log µ + log α i + log β j Se comprueba que si hay independencia tenemos que α i = π i+ y β j = π +j. 23 / 57

27 Verosimilitud de s de un modelo lineal generalizado sistemática Función link Modelos logit binomiales para Modelos loglineales Poisson para conteos Desviación Modelos lineales para GLM para conteos Verosimilitud de Familia de dispersión exponencial Media y varianza de la componente sistemática y la función link Ecuaciones de verosimilitud 24 / para 57un GLM

28 Familia de dispersión exponencial Tenemos (y 1,...,y N ) independientes. La variable y i tiene densidad en la familia de dispersión exponencial ([ ] ) f(y i ;θ i,φ) = exp y i θ i b(θ i ) /a(φ)+c(y i,φ) θ i es el parámetro natural. Si φ es conocido entonces la densidad anterior es de la familia exponencial natural. s de un modelo lineal generalizado sistemática Función link Modelos logit binomiales para Modelos loglineales Poisson para conteos Desviación Modelos lineales para GLM para conteos Verosimilitud de Familia de dispersión exponencial Media y varianza de la componente sistemática y la función link Ecuaciones de verosimilitud 25 / para 57un GLM

29 Normal Poisson Binomial f(y) 1 2πσ exp( (y µ)2 ) 2σ 2 µ y e µ /y! ( n y) ( µ n n )n y θ µ log µ log(µ/(n µ)) φ σ a(φ) φ φ φ θ b(θ) 2 exp(θ) n log(1 + e θ ) 2 c(y,φ) 1 2 [y2 ) n φ y 26 / 57

30 Media y varianza de la componente Se verifica: y µ i = E(Y i ) = b (θ i ). var(y i ) = b (θ i )a(φ). s de un modelo lineal generalizado sistemática Función link Modelos logit binomiales para Modelos loglineales Poisson para conteos Desviación Modelos lineales para GLM para conteos Verosimilitud de Familia de dispersión exponencial Media y varianza de la componente sistemática y la función link Ecuaciones de verosimilitud 27 / para 57un GLM

31 sistemática y la función link La componente sistemática viene dada por η i = j y en forma matricial β j x ij, i = 1,...,N. η = Xβ con η = (η 1,...,η p ) y β = (β 1,...,β p ) siendo X la matriz de modelo. s de un modelo lineal generalizado sistemática Función link Modelos logit binomiales para Modelos loglineales Poisson para conteos Desviación Modelos lineales para GLM para conteos Verosimilitud de Familia de dispersión exponencial Media y varianza de la componente sistemática y la función link Ecuaciones de verosimilitud 28 / para 57un GLM

32 Un GLM relaciona η i con µ i con la función link. η i = g(µ i ) = β j x ij, i = 1,...,N. j El parámetro natural θ i es θ i = g(µ i ) = β j x ij j s de un modelo lineal generalizado sistemática Función link Modelos logit binomiales para Modelos loglineales Poisson para conteos Desviación Modelos lineales para GLM para conteos Verosimilitud de Familia de dispersión exponencial Media y varianza de la componente sistemática y la función link Ecuaciones de verosimilitud 29 / para 57un GLM

33 Ecuaciones de verosimilitud para un GLM La logverosimilitud sería L(β) = i L i = i log f(y i ;θ i,φ) = i y i θ i b(θ i ) + a(φ) i c(y i,φ). Las ecuaciones de verosimilitud son N i=1 (y i µ i )x ij var(y i ) µ i η i = 0, j = 1,...,p. 30 / 57

34 Matriz de covarianza asintótica Puesto que E 2 L(β) β h β j = E L(β) β h I hj = E 2 L(β) β h β j = N i=1 N i=1 E L i(β) β h L(β) β j, E 2 L i (β) β h β j = L i (β) β j = N i=1 x ih x ij ( ) 2 µi var(y i ) η i 31 / 57

35 Matriz de covarianza asintótica Y la podemos expresar como I = X WX siendo con W = diag(w 1,...,w p ) w i = ( ) 2 1 µi var(y i ) η i 32 / 57

36 Matriz de covarianza asintótica estimada Estimamos W en ˆβ y tendremos Î = X ŴX siendo ĉov(ˆβ) = (X ŴX) 1 33 / 57

37 Modelo loglineal de Poisson Tenemos log µ = Xβ La componente sistemática se relaciona con la media como η i = log µ i de donde Además µ i η i = expη i = µ i vary i = µ i 34 / 57

38 Modelo loglineal de Poisson En este caso las ecuaciones de verosimilitud son (y i µ i )x ij = 0 para j = 1,...,p. i Estamos igualando los estadísticos suficientes i y ix ij a sus valores esperados i µ ix ij Además ( ) 2 1 µi w i = = µ i var(y i ) η i 35 / 57

39 Inferencia para s de un modelo lineal generalizado sistemática Función link Modelos logit binomiales para Modelos loglineales Poisson para conteos Desviación Modelos lineales para GLM para conteos Verosimilitud de Inferencia para Desviación y bondad de ajuste Desviación para modelos loglineales Poisson Desviación 36 para / 57 modelos loglineales

40 Desviación y bondad de ajuste Un GLM saturado es el modelo que tiene un parámetro distinto para cada observación. Nos proporciona un (completamente inútil) ajuste perfecto. Sea θ i la estimación de θ i en el modelo saturado que corresponde con µ i = y i para cualquier i. Consideremos un modelo (insaturado) y denotemos por ˆθ i y ˆµ i los estimadores máximo verosímiles. La desviación viene dada por 2[L(ˆµ;y) L(y;y)] = 2 [ ] y i θi b( θ i ) /a(φ) 2 i i [ ] y iˆθi b(ˆθ i ) /a(φ) 37 / 57

41 Si asumimos que a(φ) = φ ω i entonces 2[L(ˆµ;y) L(y;y)] = 2 ] ω i [y i ( θ i ˆθ i ) b( θ i ) + b(ˆθ i ) /φ = D(y; ˆµ)/φ. i D(y; ˆµ)/φ es la desviación escalada y D(y; ˆµ) es la desviación. 38 / 57

42 Desviación para modelos loglineales Poisson Tenemos ˆθ i = log ˆµ i, b(ˆθ i ) = exp ˆθ i = ˆµ i, θ i = log y i, b( θ) = y i, a(φ) = 1. La desviación es igual a D(y, ˆµ) = 2 i [y i log(y i /ˆµ i ) y i + ˆµ i ]. s de un modelo lineal generalizado sistemática Función link Modelos logit binomiales para Modelos loglineales Poisson para conteos Desviación Modelos lineales para GLM para conteos Verosimilitud de Inferencia para Desviación y bondad de ajuste Desviación para modelos loglineales Poisson Desviación 39 para / 57 modelos loglineales

43 Desviación para modelos loglineales Poisson Si el modelo incorpora un termino constante entonces una de las ecuaciones de verosimilitud es i y i = i ˆµ i y D(y, ˆµ) = 2 i y i log(y i /ˆµ i ). Por tanto, si hay término constante en el modelo D(y, ˆµ) = 2 i Observado log Observado Ajustado. s de un modelo lineal generalizado sistemática Función link Modelos logit binomiales para Modelos loglineales Poisson para conteos Desviación Modelos lineales para GLM para conteos Verosimilitud de Inferencia para Desviación y bondad de ajuste Desviación para modelos loglineales Poisson Desviación 40 para / 57 modelos loglineales

44 Desviación para modelos binomiales Denotamos y i la proporción muestral basada en una muestra n i. Tenemos ˆθ i = log[ˆπ i /(1 ˆπ i )] θ i = log[y i /(1 y i )] a(φ) = 1 n i φ = 1, ω i = n i. s de un modelo lineal generalizado sistemática Función link Modelos logit binomiales para Modelos loglineales Poisson para conteos Desviación Modelos lineales para GLM para conteos Verosimilitud de Inferencia para Desviación y bondad de ajuste Desviación para modelos loglineales Poisson Desviación 41 para / 57 modelos loglineales

45 La desviación viene dada por 2 i n i y i log n iy i n iˆπ i + 2 i (n i n i y i ) log n i n i y i n i n iˆπ i Si consideramos la tabla de contingencia en donde la fila i-ésima corresponde con el i-ésimo setting (todas las covariables o variables predictoras son comunes) y tenemos dos columnas correspondiendo con éxito y fracaso entonces la desviación tiene la (bonita) interpretación 2 i Observado log Observado Ajustado 42 / 57

46 Comparación de modelos utilizando la desviación En un modelo binomial o Poisson, φ = 1, y la desviación es D(y; ˆµ) = 2[L(ˆµ;y) L(y;y)]. Queremos comparar dos modelos M 0 frente a M 1. M 0 anidado en M 1 (posiblemente eliminando algunas variables). Se tiene 2[L(ˆµ 0 ;y) L(ˆµ 1 ;y)] = D(y; ˆµ 0 ) D(y; ˆµ 1 ) por lo que el estadístico del test del cociente de verosimilitudes es la diferencia de las desviaciones. 43 / 57

47 Comparación de modelos utilizando la desviación En concreto en modelos loglineales Poisson con término constante y en modelos logit binomiales se tiene D(y; ˆµ 0 ) D(y; ˆµ 1 ) = 2 i Observado log Ajustado 1 Ajustado 0 44 / 57

48 Residuos en un GLM Si definimos ] d i = 2ω i [y i ( θ i ˆθ i ) b( θ i ) + b(ˆθ i ) entonces el residuo de la desviación es di signo(y i ˆµ i ) El residuo de Pearson es e i = y i ˆµ i var(y i ) 1/2 45 / 57

49 Residuos en un GLM Pero con cov(y ˆµ) = cov(y )(I H) H = W 1 2 X(X WX) 1 X W 1 2 Sustituyendo W por Ŵ obtenemos Ĥ. Si ĥi es el elemento que ocupa la posición i-ésima en la diagonal principal entonces el residuo de Pearson estandarizado es r i = y i ˆµ i ( )1 var(y i )(1 ĥi) 2 notar/notar025.pdf. 46 / 57

50 Ajuste de un GLM mediante Newton-Raphson Sea el vector gradiente u = L(β) β y la matriz hessiana H = [ ] 2 L(β) β a β b a,b=1,...,p u (t) y H (t) denotan u y H evaluados en β (t). Actualizamos nuestra estimación β (t) β (t+1) = β (t) ( H (t) ) 1 u (t) hasta que no haya una variación apreciable en la estimación 47 / 57

51 Ajuste de un GLM mediante Fisher Scoring Method Es como el método Newton-Raphson en donde sustituimos la matriz hessiana que no es más que la información observada por la matriz de información de Fisher o valor esperado de dicha matriz, es decir, por [ ] I = E 2 L(β) β a β b a,b=1,...,p Actualizamos la estimación de los parámetros mediante β (t+1) = β (t) + ( I (t) ) 1 u (t) o bien I (t) β (t+1) = I (t) β (t) + u (t) 48 / 57

52 Ajuste de un GLM mediante Fisher Scoring Method Notemos que I = X WX y I (t) = X W (t) X donde W (t) es W evaluada en β (t). Cuando finalizamos el proceso iterativo tendremos la matriz I (t) cuya inversa es la matriz de covarianzas de los estimadores. Obtenemos pues dicha matriz como un subproducto. 49 / 57

53 ML como mínimos cuadrados reponderados iterativamente Si consideramos un modelo lineal general z = Xβ + ǫ donde ǫ tiene matriz de covarianzas V entonces la estimación mínimo cuadrática es (X V 1 X) 1 X V 1 z 50 / 57

54 ML como mínimos cuadrados reponderados iterativamente Se ve fácilmente que con I (t) β (t) + u (t) = X W (t) z (t) z (t) i = j x ij β (t) j + (y i µ (t) i ) η(t) i µ (t) i = η (t) i + (y i µ (t) i ) η(t) i µ (t) i 51 / 57

55 ML como mínimos cuadrados reponderados iterativamente El método de actualización del Fisher scoring method queda como (X W (t) X)β (t+1) = X W (t) z (t) que no son más que las ecuaciones normales en un modelo lineal general donde las respuestas son z (t) y la matriz de covarianzas del error es W (t). Notemos que z i se relaciona con y i mediante una aproximación lineal de la función link g. g(y i ) g(µ i ) + (y i µ i )g (µ i ) = η i + (y i µ i ) η i µ i = z i 52 / 57

56 ML como mínimos cuadrados reponderados iterativamente En cada iteración z es estimado mediante z (t) y son utilizados como respuestas mientras que la matriz de covarianzas es estimada con Ŵ (t). Obtenemos β (t+1) que nos da una nueva componente sistemática η (t+1) (utilizada para calcular Ŵ (t+1) ) y un nuevo vector respuesta z (t+1). Vemos que estamos aplicando iterativamente unos mínimos cuadrados ponderados donde en cada iteración cambia la matriz de pesos (la matriz de covarianza estimada). Por ello se habla de mínimos cuadrado iterativos reponderados o iterative reweighted least squares. 53 / 57

57 Cuasiverosimilitud Wedderburn(1974) Las ecuaciones de verosimilitud son N i=1 (y i µ i )x ij var(y i ) µ i η i = 0, j = 1,...,p. siendo v(µ i ) = var(y i ). Las ecuaciones de verosimilitud depende de la distribución de Y i solamente a través de su media y su varianza, µ i y v(µ i ). Dada una distribución tenemos determinada la relación entre media y varianza, esto es, v(µ i ). 54 / 57

58 Cuasiverosimilitud Wedderburn(1974) Wedderburn(1974) propuso asumir solamente una relación entre media y varianza en lugar de una distribución en la variable respuesta. Asumimos una función link y un predictor lineal. No asumimos una distribución para Y i. En lugar de ello, asumimos var(y i ) = v(µ i ) para alguna función varianza v. Las ecuaciones que permiten obtener los estimadores cuasiverosímiles son las mismas. Pero no son ecuaciones de verosimilitud sin asumir una distribución. 55 / 57

59 Cuasiverosimilitud Wedderburn(1974) Wedderburn propuso utilizar estos estimadores incluso aunque no asumamos que Y i están en la familia exponencial natural. La matriz de covarianzas asintótica es tiene la forma (X ŴX) 1 con w i = ( µi η i ) 2 1 var(y i ) 56 / 57

60 Sobredispersión en GLM Poisson y cuasiverosimilitud Una posibilidad es considerar v(µ i ) = φµ i, para alguna constante φ. En las ecuaciones que utilizamos para estimar (que no son de verosimilitud) se cancela φ. Los estimadores son los mismos que los máximo verosímiles. notar/notar036.pdf 57 / 57

Análisis de datos Categóricos

Análisis de datos Categóricos Introducción a los Modelos Lineales Generalizados Universidad Nacional Agraria La Molina 2016-1 Introducción Modelos Lineales Generalizados Introducción Componentes Estimación En los capítulos anteriores

Más detalles

Guillermo Ayala Gallego Universidad de Valencia

Guillermo Ayala Gallego Universidad de Valencia GoBack Regresión logística Guillermo Ayala Gallego Universidad de Valencia 4 de febrero de 2009 1 / 22 Puede que sea el procedimiento estadístico más utilizado. Con aplicaciones frecuentes en Medicina

Más detalles

Inferencia en tablas de contingencia

Inferencia en tablas de contingencia GoBack Inferencia en tablas de contingencia Guillermo Ayala Gallego Universidad de Valencia 15 de octubre de 2008 1 / 36 Distribución condicionada exacta Intervalo para los odds ratio Intervalo de la diferencia

Más detalles

Estimación Bayesiana en el modelo lineal generalizado

Estimación Bayesiana en el modelo lineal generalizado Estimación Bayesiana en el modelo lineal generalizado Hernando Alvarado Quintero and Fabian Guillermo Rojas Rodríguez Universidad Nacional de Colombia halvaradoq@unal.edu.co and fgrojasro@unal.edu.co July

Más detalles

1. Modelos para conteos

1. Modelos para conteos 1. Modelos para conteos En esta sección se modelarán conteos, que resultan de diversas situaciones, por ejemplo: el número de accidentes en una carretera, el número de caries que tiene una persona, el

Más detalles

Modelos Lineales Generalizados

Modelos Lineales Generalizados Modelos Lineales Generalizados 1 DefinicióndeunMLG Y1,Y2,...,Yn,conmediasµ1,µ2,...,µn,Yi, i=1,...,n,tienefdpmiembrodela familia exponencial a un parámetro, con las siguientes propiedades: 1.LadistribucióndecadaunodelosYi,paratodoi,estáenlaformacanónica,i.e.:

Más detalles

Tema 13: Regresión Logística p. 1/20 Tema 13: Regresión Logística Abdelmalik Moujahid, Iñaki Inza y Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del

Más detalles

Análisis de Datos Categóricos. Leticia Gracia Medrano

Análisis de Datos Categóricos. Leticia Gracia Medrano Análisis de Datos Categóricos Leticia Gracia Medrano ii Contents 1 Modelo Logístico 1 1.1 Estimación de parámetros.................... 1 1.2 Interpretación de los parámetros................. 2 1.3 Ejemplo..............................

Más detalles

Propiedades Una distribución pertenece a la familia exponencial si su función de densidad puede expresarse como:

Propiedades Una distribución pertenece a la familia exponencial si su función de densidad puede expresarse como: Familia Exponencial Propiedades Una distribución pertenece a la familia exponencial si su función de densidad puede expresarse como: f (y; θ) = s(y)t(θ)exp[a(y)b(θ)] = exp[a(y)b(θ)+c(θ)+d(y)] (1) con s(y)

Más detalles

El Bootstrap paramétrico y no parametrico y su aplicación en los modelos log-lineal Poisson

El Bootstrap paramétrico y no parametrico y su aplicación en los modelos log-lineal Poisson El Bootstrap paramétrico y no parametrico y su aplicación en los modelos log-lineal Poisson Antonio Bravo Quiroz * Universidad Ricardo Palma 23 de noviembre de 2017 Índice 1. Conceptos Preliminares 6 1.1.

Más detalles

Modelo Lineal Generalizado GAMMA. Distribución gamma: Otra parametrización mediante el parámetro de forma y la media:

Modelo Lineal Generalizado GAMMA. Distribución gamma: Otra parametrización mediante el parámetro de forma y la media: Modelo Lineal Generalizado GAMMA Distribución gamma: Otra parametrización mediante el parámetro de forma y la media: La distribución gamma es de tipo exponencial: 1 Supongamos que se dispone de r subpoblaciones

Más detalles

Regresión Lineal Múltiple

Regresión Lineal Múltiple Unidad 4 Regresión Lineal Múltiple Javier Santibáñez (IIMAS, UNAM) Regresión Semestre 2017-2 1 / 35 Introducción La idea de la regresión lineal múltiple es modelar el valor esperado de la variable respuesta

Más detalles

Análisis de datos Categóricos

Análisis de datos Categóricos Regresión logística Universidad Nacional Agraria La Molina 2014-2 Regresión logística simple Interpretación de parámetros Gracando las proporciones Inferencia Introducción Para una variable aleatoria respuesta

Más detalles

El objetivo es decribir cómo el uso de métodos anticonceptivos varía según la edad, el nivel de educación y el deseo de tener más hijos.

El objetivo es decribir cómo el uso de métodos anticonceptivos varía según la edad, el nivel de educación y el deseo de tener más hijos. Modelo Lineal Generalizado Introducción Comenzaremos con un ejemplo que nos servir para ilustrar el análisis de datos binarios. Nuestro interés se centra en relacionar una estructura estocástica en los

Más detalles

(x) = 1 si P (Y = 1 X = x) P (Y = 0 X = x) P (Y = 0 X = x) > P (Y = 1 X = x) P (X = x Y = 0)P (Y = 0) > P (X = x Y = 1)P (Y = 1)

(x) = 1 si P (Y = 1 X = x) P (Y = 0 X = x) P (Y = 0 X = x) > P (Y = 1 X = x) P (X = x Y = 0)P (Y = 0) > P (X = x Y = 1)P (Y = 1) 1 1. Conceptos generales de clasificación 2. Clasificador k-vecino más cercano 3. Clasificador Bayesiano óptimo 4. Análisis discriminante lineal (LDA) 5. Clasificadores lineales y el Modelo perceptrón

Más detalles

Econometría Aplicada

Econometría Aplicada Econometría Aplicada y función de Verosimilitud Víctor Medina Los objetivos de esta parte del curso principalmente son: 1. Dar algunos ejemplos de decisiones económicas donde la variable dependiente es

Más detalles

Tema 6: Introducción a la Inferencia Bayesiana

Tema 6: Introducción a la Inferencia Bayesiana Tema 6: Introducción a la Inferencia Bayesiana Conchi Ausín Departamento de Estadística Universidad Carlos III de Madrid concepcion.ausin@uc3m.es CESGA, Noviembre 2012 Contenidos 1. Elementos básicos de

Más detalles

Análisis de datos Categóricos

Análisis de datos Categóricos Introducción Universidad Nacional Agraria La Molina 2017-1 Variable cualitativa Variable respuesta cualitativa Variable respuesta y explicativa Variable de conteo y proporción Escalas de medición Una variable

Más detalles

Tema1. Modelo Lineal General.

Tema1. Modelo Lineal General. Tema1. Modelo Lineal General. 1. Si X = (X 1, X 2, X 3, X 4 ) t tiene distribución normal con vector de medias µ = (2, 1, 1, 3) t y matriz de covarianzas 1 0 1 1 V = 0 2 1 1 1 1 3 0 1 1 0 2 Halla: a) La

Más detalles

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS. Modelos Probit y Tobit aplicados al estudio de la oferta laboral de los trabajadores secundarios en el Perú

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS. Modelos Probit y Tobit aplicados al estudio de la oferta laboral de los trabajadores secundarios en el Perú UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS FACULTAD DE CIENCIAS MATEMÁTICAS E.A.P. DE. ESTADÍSTICA Modelos Probit y Tobit aplicados al estudio de la oferta laboral de los trabajadores secundarios en el Perú

Más detalles

Estimación Máxima Verosimilitud

Estimación Máxima Verosimilitud Estimación Máxima Verosimilitud Microeconomía Cuantitativa R. Mora Departmento of Economía Universidad Carlos III de Madrid Outline Motivación 1 Motivación 2 3 4 5 Estrategias generales de estimación Hay

Más detalles

Regresión múltiple. Demostraciones. Elisa Mª Molanes López

Regresión múltiple. Demostraciones. Elisa Mª Molanes López Regresión múltiple Demostraciones Elisa Mª Molanes López El modelo de regresión múltiple El modelo que se plantea en regresión múltiple es el siguiente: y i = β 0 + β 1 x 1i + β 2 x 2i +...+ β k x ki +

Más detalles

Métodos Estadísticos Multivariados

Métodos Estadísticos Multivariados Métodos Estadísticos Multivariados Victor Muñiz ITESM Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre 2011 1 / 20 Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre

Más detalles

Modelos de suavizado, aditivos y mixtos

Modelos de suavizado, aditivos y mixtos Carmen Armero 1 de junio de 2011 Introducción Introducción Modelos lineales, LM Modelos aditivos, AM Modelos lineales generalizados, GLM GAM I Un modelo lineal generalizado (GAM) es un modelo lineal generalizado

Más detalles

Modelo Lineal Generalizado

Modelo Lineal Generalizado Modelo Lineal Generalizado Introducción Comenzaremos con un ejemplo que nos servirá para ilustrar el análisis de datos binarios. Nuestro interés se centra en relacionar una estructura estocástica en los

Más detalles

Mathias Bourel. 2 de octubre de 2016

Mathias Bourel. 2 de octubre de 2016 Regresión Logística Mathias Bourel IMERL - Facultad de Ingeniería, Universidad de la República, Uruguay 2 de octubre de 2016 M.Bourel (IMERL, UdelaR) Regresión Logística 2 de octubre de 2016 1 / 28 Introducción

Más detalles

PONTIFICIA UNIVERSIDAD CATÓLICA DEL PERÚ ESCUELA DE GRADUADOS

PONTIFICIA UNIVERSIDAD CATÓLICA DEL PERÚ ESCUELA DE GRADUADOS PONTIFICIA UNIVERSIDAD CATÓLICA DEL PERÚ ESCUELA DE GRADUADOS TITULO DE LA TESIS ANÁLISIS DE VOTOS ELECTORALES USANDO MODELOS DE REGRESIÓN PARA DATOS DE CONTEO Tesis para optar el grado de Magíster en

Más detalles

EXÁMEN INFERENCIA ESTADÍSTICA I Diplomado en Estadística Convocatoria de Febrero 2006

EXÁMEN INFERENCIA ESTADÍSTICA I Diplomado en Estadística Convocatoria de Febrero 2006 EXÁMEN INFERENCIA ESTADÍSTICA I Diplomado en Estadística Convocatoria de Febrero 6 Problema ( ptos) Considera un experimento aleatorio con espacio muestral Ω. a) Definir una σ-álgebra A sobre Ω. b) Dar

Más detalles

Auxiliar 9. MNL y MLE. Daniel Olcay. 21 de octubre de 2014 IN4402. Daniel Olcay (IN4402) Auxiliar 9 21 de octubre de / 13

Auxiliar 9. MNL y MLE. Daniel Olcay. 21 de octubre de 2014 IN4402. Daniel Olcay (IN4402) Auxiliar 9 21 de octubre de / 13 Auxiliar 9 MNL y MLE Daniel Olcay IN4402 21 de octubre de 2014 Daniel Olcay (IN4402) Auxiliar 9 21 de octubre de 2014 1 / 13 Índice Modelos no lineales Probabilidad lineal Probit Logit Máxima verosimilitud

Más detalles

Otra medida alternativa para la distancia entre ˆπ y p muy usada es la deviance. Λ= máx ω. Si queremos testear. el cociente estaría dado por

Otra medida alternativa para la distancia entre ˆπ y p muy usada es la deviance. Λ= máx ω. Si queremos testear. el cociente estaría dado por M.L.G. Ana M. Bianco FCEyN 2010 96 Estadístico G 2 Otra medida alternativa para la distancia entre ˆπ y p muy usada es la deviance G 2, que es un estadístico basado en el cociente de verosimilitud. Si

Más detalles

Algunos Problemas y Soluciones en el Análisis de Experimentos Ajustados con MLG s.

Algunos Problemas y Soluciones en el Análisis de Experimentos Ajustados con MLG s. Algunos Problemas y Soluciones en el Análisis de Experimentos Ajustados con MLG s. Víctor Aguirre Torres Departamento de Estadística, ITAM. Seminario de Estadística, CIMAT. 5 de Nov 2007. Créditos Trabajo

Más detalles

Tema 6. Análisis Factorial.

Tema 6. Análisis Factorial. Tema 6 Análisis Factorial El modelo Sea Y = (Y,, Y p ) t un vector aleatorio con vector de medias µ y matriz de covarianzas Σ Supondremos que existe un número entero m < p, una matriz L de orden p m de

Más detalles

Estructura de este tema. Tema 4 Regresión lineal simple. Ejemplo: consumo de vino y dolencias cardíacas. Frecuencias

Estructura de este tema. Tema 4 Regresión lineal simple. Ejemplo: consumo de vino y dolencias cardíacas. Frecuencias Estructura de este tema Tema 4 Regresión lineal simple José R. Berrendero Departamento de Matemáticas Universidad utónoma de Madrid Planteamiento del problema. Ejemplos Recta de regresión de mínimos cuadrados

Más detalles

Estadística Diplomado

Estadística Diplomado Diplomado HRB UNAM 1 / 25 1 Estimación Puntual Momentos Máxima Verosimiltud Propiedades 2 / 25 1 Estimación Puntual Momentos Máxima Verosimiltud Propiedades 2 Estimación por Intervalos Cantidades Pivotales

Más detalles

Econometría Avanzada FLACSO 2014

Econometría Avanzada FLACSO 2014 Econometría Avanzada FLACSO 2014 Hemos cubierto: Mapa Planteamiento de una pregunta económica de interés Diferencias entre econometría y estadística Métodos: Lineales (MCO) revisión, variables instrumentales

Más detalles

Estudio en bloques completos vía regresión Poisson en presencia de sobredispersión. Ana María Torres Blanco

Estudio en bloques completos vía regresión Poisson en presencia de sobredispersión. Ana María Torres Blanco Estudio en bloques completos vía regresión Poisson en presencia de sobredispersión Ana María Torres Blanco Universidad Nacional de Colombia Facultad Ciencias, Departamento de Estadística Bogotá, Colombia

Más detalles

2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...

2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición... Contenidos 1 Introducción al paquete estadístico S-PLUS 19 1.1 Introducción a S-PLUS............................ 21 1.1.1 Cómo entrar, salir y consultar la ayuda en S-PLUS........ 21 1.2 Conjuntos de datos..............................

Más detalles

Introducción a la regresión ordinal

Introducción a la regresión ordinal Introducción a la regresión ordinal Jose Barrera jbarrera@mat.uab.cat 20 de mayo 2009 Jose Barrera (UAB) Introducción a la regresión ordinal 20 de mayo 2009 1 / 11 Introducción a la regresión ordinal 1

Más detalles

ECONOMETRÍA II Prof.: Begoña Álvarez TEMA 1 INTRODUCCIÓN. Estimación por máxima verosimilitud y conceptos de teoría asintótica

ECONOMETRÍA II Prof.: Begoña Álvarez TEMA 1 INTRODUCCIÓN. Estimación por máxima verosimilitud y conceptos de teoría asintótica ECONOMETRÍA II Prof.: Begoña Álvarez 2007-2008 TEMA 1 INTRODUCCIÓN Estimación por máxima verosimilitud y conceptos de teoría asintótica 1. ESTIMACIÓN POR MÁXIMA VEROSIMILITUD (MAXIMUM LIKELIHOOD) La estimación

Más detalles

TEMA 4 Regresión logística

TEMA 4 Regresión logística TEMA 4 Regresión logística José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Análisis de Datos - Grado en Biología Esquema del tema Variable respuesta dicotómica. Ejemplo. El

Más detalles

Análisis de datos Categóricos

Análisis de datos Categóricos Regresión logística Universidad Nacional Agraria La Molina 2016-1 Regresión logística simple Interpretación de parámetros Inferencia Para una variable aleatoria respuesta Y y una variable explicativa X,

Más detalles

MODELOS LINEALES GENERALIZADOS

MODELOS LINEALES GENERALIZADOS MODELOS LINEALES GENERALIZADOS Conceptos básicos Ignacio Méndez Gómez-Humarán imendez@cimat.mx Los Modelos Lineales Generalizados (GLM por sus siglas en inglés) son una familia de modelos estadísticos

Más detalles

Modelos para variables categóricas

Modelos para variables categóricas Gabriel V. Montes-Rojas Modelo logit multinomial Supongamos que la variable dependiente toma muchos valores, ej. y = 0, 1, 2..., J, aunque los valores de y no representan ningún orden en particular. Éste

Más detalles

Selección de distribuciones de probabilidad

Selección de distribuciones de probabilidad Selección de distribuciones de probabilidad Patricia Kisbye FaMAF 6 de mayo, 2010 Análisis estadístico de datos simulados Los sistemas reales tienen fuentes de aleatoriedad: Tipo de sistema Fabricación

Más detalles

Tema 13. Regresión Logística

Tema 13. Regresión Logística Tema 13. Regresión Logística Abdelmalik Moujahid, Iñaki Inza y Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del País Vasco Euskal Herriko Unibertsitatea

Más detalles

Estadística Computacional. M. González

Estadística Computacional. M. González Estadística Computacional M. González Facultad de Medicina. Universidad de Extremadura M. González (UEx) Estadística Computacional 1 / 23 Índice Modelos Lineales Generalizados Bioensayos: Modelos Dosis-Respuesta

Más detalles

Tema 10: Introducción a los problemas de Asociación y Correlación

Tema 10: Introducción a los problemas de Asociación y Correlación Tema 10: Introducción a los problemas de Asociación y Correlación Estadística 4 o Curso Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 10: Asociación y Correlación

Más detalles

Construcción y aplicación de modelos de

Construcción y aplicación de modelos de GoBack Construcción y aplicación de s de regresión logística Guillermo Ayala Gallego Universidad de Valencia 8 de marzo de 2009 1 / 15 selección del Un debe ser suficientemente complejo para que ajuste

Más detalles

Análisis de datos Categóricos

Análisis de datos Categóricos Inferencia para tablas de contingencia Universidad Nacional Agraria La Molina 2013-1 Odds ratio Diferencia de proporciones Riesgo relativo Ejemplo Odds ratio El odds ratio muestral es: El estimador modicado

Más detalles

Econometría III Examen. 29 de Marzo de 2012

Econometría III Examen. 29 de Marzo de 2012 Econometría III Examen. 29 de Marzo de 2012 El examen consta de 20 preguntas de respuesta múltiple. El tiempo máximo es 1:10 minutos. nota: no se pueden hacer preguntas durante el examen a no ser que sean

Más detalles

Capítulo 2. Medidas Estadísticas Básicas Medidas estadísticas poblacionales

Capítulo 2. Medidas Estadísticas Básicas Medidas estadísticas poblacionales Capítulo 2 Medidas Estadísticas Básicas 2.1. Medidas estadísticas poblacionales Sea X una variable aleatoria con función de probabilidad p(x) si es discreta, o función de densidad f(x) si es continua.

Más detalles

ESTADÍSTICA. Tema 4 Regresión lineal simple

ESTADÍSTICA. Tema 4 Regresión lineal simple ESTADÍSTICA Grado en CC. de la Alimentación Tema 4 Regresión lineal simple Estadística (Alimentación). Profesora: Amparo Baíllo Tema 4: Regresión lineal simple 1 Estructura de este tema Planteamiento del

Más detalles

Cálculos de Regresión Logística en R, Caso de una covariable.

Cálculos de Regresión Logística en R, Caso de una covariable. Cálculos de Regresión Logística en R, Caso de una covariable. Carga de datos (Tabla 1.1, Hosmer-Lemeshow): CH=read.table( CHDAGE.txt,header = T) attach(ch) Gráfico de Dispersión: plot(age,chd,xlab= Edad,

Más detalles

MODELOS DE REGRESIÓN CON DATOS DE CONTEO. APLICACIÓN A COMPETICIONES DEPORTIVAS

MODELOS DE REGRESIÓN CON DATOS DE CONTEO. APLICACIÓN A COMPETICIONES DEPORTIVAS FACULTAD DE MATEMÁTICAS DEPARTAMENTO DE ESTADÍSTICA E INVESTIGACIÓN OPERATIVA Trabajo Fin de Grado: MODELOS DE REGRESIÓN CON DATOS DE CONTEO. APLICACIÓN A COMPETICIONES DEPORTIVAS Pablo Atoche Calzada

Más detalles

viii CAPÍTULO 2 Métodos de muestreo CAPÍTULO 3 Análisis exploratorio de datos

viii CAPÍTULO 2 Métodos de muestreo CAPÍTULO 3 Análisis exploratorio de datos Contenido Acerca de los autores.............................. Prefacio.... xvii CAPÍTULO 1 Introducción... 1 Introducción.............................................. 1 1.1 Ideas de la estadística.........................................

Más detalles

1. Modelos Loglineales tablas de 2 entradas

1. Modelos Loglineales tablas de 2 entradas 1. Modelos Loglineales tablas de 2 entradas Los modelos loglineales para tablas de 2 2 describen las asociaciones entre dos variables discretas digamos X y Y. El modelo loglineal nos dice cuan grande es

Más detalles

Tema 3 Normalidad multivariante

Tema 3 Normalidad multivariante Aurea Grané Máster en Estadística Universidade Pedagógica Aurea Grané Máster en Estadística Universidade Pedagógica Tema 3 Normalidad multivariante 3 Normalidad multivariante Distribuciones de probabilidad

Más detalles

Análisis de Datos. Regresión logística. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Regresión logística. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Regresión logística Profesor: Dr. Wilfrido Gómez Flores 1 Regresión logística Supóngase que se tiene una variable binaria de salida Y, y se desea modelar la probabilidad condicional P(Y=1

Más detalles

Tema 4 - Introducción

Tema 4 - Introducción Tema 4 - Introducción 1 Tema 3. Estimación puntual Criterios de comparación de estimadores: Insesgadez. Estimadores de mínima varianza. Error cuadrático medio. Consistencia. Cómo obtener estimadores? Tema

Más detalles

Multicolinealidad Introducción. Uno de los supuestos básicos del modelo lineal general. y = Xβ + u

Multicolinealidad Introducción. Uno de los supuestos básicos del modelo lineal general. y = Xβ + u CAPíTULO 6 Multicolinealidad 6.1. Introducción Uno de los supuestos básicos del modelo lineal general y = Xβ + u establece que las variables explicativas son linealmente independientes, es decir, la igualdad

Más detalles

EL PRINCIPIO DE MÁXIMA VEROSIMILITUD (LIKELIHOOD)

EL PRINCIPIO DE MÁXIMA VEROSIMILITUD (LIKELIHOOD) EL PRINCIPIO DE MÁXIMA VEROSIMILITUD (LIKELIHOOD) Fortino Vela Peón fvela@correo.xoc.uam.mx FVela-0 Objetivo Introducir las ideas básicas del principio de máxima verosimilitud. Problema Considere el experimento

Más detalles

Estadística para la Economía y la Gestión IN 3401 Clase 5

Estadística para la Economía y la Gestión IN 3401 Clase 5 Estadística para la Economía y la Gestión IN 3401 Clase 5 Problemas con los Datos 9 de junio de 2010 1 Multicolinealidad Multicolinealidad Exacta y Multicolinealidad Aproximada Detección de Multicolinealidad

Más detalles

Cálculo de Probabilidades II Preguntas Tema 2

Cálculo de Probabilidades II Preguntas Tema 2 Cálculo de Probabilidades II Preguntas Tema 2 1. Demuestre que la suma de n v.a. Bernuolli(p) independientes tiene una distribución Binomial con parametros (n, p). 2. Se dice que una v.a tiene una distribución

Más detalles

TEMA 5. Modelos para Datos de Conteo

TEMA 5. Modelos para Datos de Conteo TEMA 5. Modelos para Datos de Conteo Profesor: Pedro Albarrán Pérez Universidad de Alicante. Curso 2010/2011. Contenido 1 Datos de Conteo 2 Regresión de Poisson 3 Extensiones Datos de Conteo Variable de

Más detalles

Modelos elección discreta y variable dependiente limitada

Modelos elección discreta y variable dependiente limitada Modelos elección discreta y variable dependiente limitada Profesor: Graciela Sanroman Facultad de Ciencias Económicas y Administración Año 2010 Modelos multinomiales Los modelos multinomiales son aquellos

Más detalles

Una revisión de los modelos de conteo con excesos de ceros.

Una revisión de los modelos de conteo con excesos de ceros. UNIVERSIDAD DE LA REPÚBLICA Facultad de Ciencias Económicas y de Administración Licenciatura en Estadística Informe de Pasantía Una revisión de los modelos de conteo con excesos de ceros. Eloísa Martínez

Más detalles

MODELO DE REGRESIÓN BINOMIAL NEGATIVA

MODELO DE REGRESIÓN BINOMIAL NEGATIVA FACULTAD DE MATEMÁTICAS DEPARTAMENTO DE ESTADÍSTICA E INVESTIGACIÓN OPERATIVA Trabajo Fin de Grado: MODELO DE REGRESIÓN BINOMIAL NEGATIVA Mario Alcaide Delgado - Grado en Matemáticas Junio 2015 Dirigido

Más detalles

Tema 6. Estimación puntual

Tema 6. Estimación puntual 1 Tema 6. Estimación puntual En este tema: Planteamiento del problema. Criterios de comparación de estimadores: Insesgadez. Estimadores de mínima varianza. Error cuadrático medio. Consistencia. Métodos

Más detalles

Comportamiento asintótico de estimadores

Comportamiento asintótico de estimadores Comportamiento asintótico de estimadores Seguimos con variable X con función de densidad/masa f (x; θ). Queremos estimar θ. Dada una muestra aleatoria, definimos un estimador T = h(x 1,..., X n ) Esperamos/deseamos

Más detalles

Estadística Bayesiana

Estadística Bayesiana Universidad Nacional Agraria La Molina 2017-1 Teoría de la decisión Riesgo de Bayes La teoría de decisión es un área de suma importancia en estadística ya que muchos problemas del mundo real pueden tomar

Más detalles

Regresión Lineal. Rodrigo A. Alfaro. Rodrigo A. Alfaro (BCCh) Regresión Lineal / 16

Regresión Lineal. Rodrigo A. Alfaro. Rodrigo A. Alfaro (BCCh) Regresión Lineal / 16 Regresión Lineal Rodrigo A. Alfaro 2009 Rodrigo A. Alfaro (BCCh) Regresión Lineal 2009 1 / 16 Contenidos 1 Regresiones Lineales Regresión Clásica Paquetes estadísticos 2 Estadísticos de Ajuste Global 3

Más detalles

Práctica 10: Introducción a Modelos Lineales Generalizados.

Práctica 10: Introducción a Modelos Lineales Generalizados. Práctica : Introducción a Modelos Lineales Generalizados Esta última práctica está dedicada a estudiar brevememente algunos problemas que que se formalizan mediante un modelo similar al modelo lineal normal

Más detalles

1. Estimación. f(y) = θ e y θ, y > 0 0, en otro punto

1. Estimación. f(y) = θ e y θ, y > 0 0, en otro punto 1. Estimación Definición: Un estimador es una regla que indica cómo calcular el valor de una estimación con base en las mediciones que contien una muestra. Definición: Si ˆθ es un estimador puntual de

Más detalles

T E S I S M A E S T R O E N C I E N C I A S MIGUEL ANGEL POLO VUELVAS

T E S I S M A E S T R O E N C I E N C I A S MIGUEL ANGEL POLO VUELVAS UNIVERSIDAD AUTÓNOMA METROPOLITANA UNIDAD IZTAPALAPA MAESTRÍA EN CIENCIAS (MATEMÁTICAS APLICADAS E INDUSTRIALES) ANÁLISIS DE MODELOS DE DATOS LONGITUDINALES T E S I S QUE PARA OBTENER EL GRADO DE: M A

Más detalles

Regresión Lineal Múltiple

Regresión Lineal Múltiple Unidad 3 Regresión Lineal Múltiple Javier Santibáñez (IIMAS, UNAM) Estadística II Semestre 2018-1 1 / 54 Introducción La idea de la regresión lineal múltiple es modelar el valor esperado de la variable

Más detalles

Estadística. Tema 2. Variables Aleatorias Funciones de distribución y probabilidad Ejemplos distribuciones discretas y continuas

Estadística. Tema 2. Variables Aleatorias Funciones de distribución y probabilidad Ejemplos distribuciones discretas y continuas Estadística Tema 2 Variables Aleatorias 21 Funciones de distribución y probabilidad 22 Ejemplos distribuciones discretas y continuas 23 Distribuciones conjuntas y marginales 24 Ejemplos distribuciones

Más detalles

MLG Ana M. Bianco FCEyN

MLG Ana M. Bianco FCEyN MLG Ana M. Bianco FCEyN 2008 44 Propiedades de los Estimadores de Máxima Verosimilitud Recordemos que si la variable aleatoria Y tiene función de densidad (f.d.)o probabilidad puntual (f.p.p.)f(y, θ),

Más detalles

Tema 4. Intervalos de confianza. Estadística Aplicada (Bioquímica). Profesora: Amparo Baíllo Tema 4: Intervalos de confianza 1

Tema 4. Intervalos de confianza. Estadística Aplicada (Bioquímica). Profesora: Amparo Baíllo Tema 4: Intervalos de confianza 1 Tema 4. Intervalos de confianza Estadística Aplicada (Bioquímica). Profesora: Amparo Baíllo Tema 4: Intervalos de confianza 1 Definición Sea X una v.a. con distribución de probabilidad dada por un modelo

Más detalles

Modelos de probabilidad. Modelos de probabilidad. Modelos de probabilidad. Proceso de Bernoulli. Objetivos del tema:

Modelos de probabilidad. Modelos de probabilidad. Modelos de probabilidad. Proceso de Bernoulli. Objetivos del tema: Modelos de probabilidad Modelos de probabilidad Distribución de Bernoulli Distribución Binomial Distribución de Poisson Distribución Exponencial Objetivos del tema: Al final del tema el alumno será capaz

Más detalles

Pérdida Esperada. Pérdida Esperada (PE): Valor esperado de pérdida por riesgo crediticio en un horizonte de tiempo determinado.

Pérdida Esperada. Pérdida Esperada (PE): Valor esperado de pérdida por riesgo crediticio en un horizonte de tiempo determinado. Pérdida Esperada Uno de los objetivos de este estudio es construir una función de pérdidas para el portafolio de la cartera de préstamos que ofrece la entidad G&T Continental, basados en el comportamiento

Más detalles

Predicción con modelos ARIMA

Predicción con modelos ARIMA Capítulo 7 Predicción con modelos ARIMA 7.1. INTRODUCCIÓN Información disponible: Observamos una realización y n = (y 1,...,y n ) de tamaño n de un proceso ARIMA(p, d, q). Objetivo: Predicción de valores

Más detalles

Tema 4: Otros Métodos de Análisis de Datos Cuantitativos y Cualitativos

Tema 4: Otros Métodos de Análisis de Datos Cuantitativos y Cualitativos Tema 4: Otros Métodos de Análisis de Datos Cuantitativos y Cualitativos Metodología de la Investigación en Fisioterapia Miguel González Velasco Departamento de Matemáticas. Universidad de Extremadura M.

Más detalles

ESTADÍSTICA APLICADA. Tema 4: Regresión lineal simple

ESTADÍSTICA APLICADA. Tema 4: Regresión lineal simple ESTDÍSTIC PLICD Grado en Nutrición Humana y Dietética Planteamiento del problema Tema 4: Regresión lineal simple Recta de regresión de mínimos cuadrados El modelo de regresión lineal simple IC y contrastes

Más detalles

Análisis de datos Categóricos

Análisis de datos Categóricos Tablas de contingencia de dos vías Universidad Nacional Agraria La Molina 2017-1 Notación y estructura de probabilidad Independencia de variables categóricas Distribuciones de muestreo Tipos de estudios

Más detalles

Clasificación y regresión logística

Clasificación y regresión logística Clasificación y regresión logística José R. Berrendero Universidad Autónoma de Madrid Contenidos Planteamiento del problema de clasificación supervisada Regla lineal de Fisher Regresión logística Optimalidad:

Más detalles

Estadística aplicada al medio ambiente

Estadística aplicada al medio ambiente Estadística aplicada al medio ambiente III. Regresión lineal 3 o de CC. AA. Departamento de Matemáticas Universidad Autónoma de Madrid 2011/12 Planteamiento Modelo Estimación de parámetros Intervalos de

Más detalles

Estimación de Máxima Verosimilitud Utilizando la Función optim en R

Estimación de Máxima Verosimilitud Utilizando la Función optim en R Estimación de Máxima Verosimilitud Utilizando la Función optim en R Juan F. Olivares-Pacheco * 15 de diciembre de 2006 Resumen En este trabajo se muestra el método de verosimilitud para la estimación de

Más detalles

Representaciones gráficas de las distribuciones bidimensionales de frecuencias... 74

Representaciones gráficas de las distribuciones bidimensionales de frecuencias... 74 Índice 1. Introducción al R 15 1.1. Introducción............................. 15 1.2. El editor de objetos R....................... 18 1.3. Datos en R............................. 19 1.3.1. Vectores...........................

Más detalles

Regresion lineal simple

Regresion lineal simple Unidad 2 Regresion lineal simple Javier Santibáñez (IIMAS, UNAM) Estadística II Semestre 2018-1 1 / 73 Planteamiento El modelo de regresión lineal simple relaciona la variable de interés Y, llamada dependiente,

Más detalles

Regresión lineal simple

Regresión lineal simple Regresión lineal simple Unidad 1 Javier Santibáñez IIMAS, UNAM jsantibanez@sigma.iimas.unam.mx Semestre 2018-2 Javier Santibáñez (IIMAS, UNAM) Regresión simple Semestre 2018-2 1 / 62 Contenido 1 Planteamiento

Más detalles

Descripción de tablas de contingencia

Descripción de tablas de contingencia GoBack Descripción de Guillermo Ayala Gallego Universidad de Valencia 15 de octubre de 2008 1 / 40 Un ejemplo Distribución conjunta y tabla de Distribución condicional Independencia y homogeneidad Tablas

Más detalles

Relación de Problemas. Tema 5

Relación de Problemas. Tema 5 Relación de Problemas. Tema 5. Supongamos que tenemos una muestra aleatoria simple de tamaño n de una v.a. X que sigue una distribución geométrica con función de probabilidad P (X = k) = p( p) k Calcular

Más detalles

Índice general. Pág. N. 1. Capítulo 1 ETAPAS DE UNA INVESTIGACIÓN. Diseño. Población. Muestra. Individuo (Observación, Caso, Sujeto) Variables

Índice general. Pág. N. 1. Capítulo 1 ETAPAS DE UNA INVESTIGACIÓN. Diseño. Población. Muestra. Individuo (Observación, Caso, Sujeto) Variables Pág. N. 1 Índice general Capítulo 1 ETAPAS DE UNA INVESTIGACIÓN 1.1 Diseño 1.2 Descriptiva 1.3 Inferencia Diseño Población Muestra Individuo (Observación, Caso, Sujeto) Variables Ejercicios de Población

Más detalles

Regresión lineal. Marcelo Rodríguez Ingeniero Estadístico - Magíster en Estadística

Regresión lineal. Marcelo Rodríguez Ingeniero Estadístico - Magíster en Estadística Regresión lineal Marcelo Rodríguez Ingeniero Estadístico - Magíster en Estadística Universidad Católica del Maule Facultad de Ciencias Básicas Pedagogía en Matemática Estadística I 01 de enero de 2012

Más detalles

MLG Ana M. Bianco FCEyN

MLG Ana M. Bianco FCEyN MLG Ana M. Bianco FCEyN 2008 81 Qué podemos hacer cuando la variable es continua o discreta con muchos valores posibles? El siguiente ejemplo corresponde al TP4 y se ha registrado la variable edad en forma

Más detalles

Tema 6: Modelos de probabilidad.

Tema 6: Modelos de probabilidad. Estadística 60 Tema 6: Modelos de probabilidad. 6.1 Modelos discretos. (a) Distribución uniforme discreta: La variable aleatoria X tiene una distribución uniforme discreta de parámetro n,que denoteramos

Más detalles

En el marco de las actividades y objetivos expresados en el protocolo de trabajo

En el marco de las actividades y objetivos expresados en el protocolo de trabajo Análisis estadístico de capturas de camarón y fauna con la red prototipo RS-INP-MEX en el Alto Golfo de California durante la temporada de camarón 010 / 011 En el marco de las actividades y objetivos expresados

Más detalles