MODELOS GENERALIZADOS LINEALES CON R

Tamaño: px
Comenzar la demostración a partir de la página:

Download "MODELOS GENERALIZADOS LINEALES CON R"

Transcripción

1 Luis M. Carrascal ( Depto. Biogeografía y Cambio Global Museo Nacional de Ciencias Naturales, CSIC Cómo realizarlos, buena praxis e interpretación de los resultados curso de la Sociedad de Amigos del Museo Nacional de Ciencias Naturales impartido en Febrero de

2 El predictor lineal incluye la suma lineal de los efectos de una o más variables explicativas (x j ). j representan los parámetros desconocidos que es necesario estimar. Estos valores son llevados a una nueva escala mediante una transformación adecuada. Esto es, i no representa a y i, sino a una transformación de los valores y mediante la función de vínculo. 2

3 La transformación utilizada viene definida por la función de vínculo. La función de vínculo relaciona la media de los valores y ( ) conel predictor lineal mediante: = g( ) Para volver a la escala original de medida (y), el valor ajustado es la función inversa de la transformación que define la función de vínculo. Para determinar el ajuste de un modelo, * el procedimiento evalúa el predictor lineal para cada valor de la variable dependiente (y), * y luego compara este valor predicho con la transformación de y 3

4 Mediante el uso de diferentes funciones de vínculo, podemos valorar la adecuación de nuestro modelo a los datos. Para ello utilizaremos el concepto y parámetro devianza. El modelo más apropiado será aquel que minimice la devianza residual. En los modelos Generales Lineales operamos con variables dependientes normales, y los modelos proporcionan residuos que siguen la distribución normal. Sin embargo, numerosos datos no presentan errores normales. * por sesgo y kurtosis * están acotados (caso de proporciones) * son conteos que no pueden manifestar valores negativos 4

5 Podemos distinguir las siguientes familias principales de errores: * errores Normales * errores Poisson (conteos de fenómenos raros) * errores Binomiales negativos (Poisson con mayor dispersión) * errores Binomiales (datos que miden respuestas si/no o proporciones) * errores Gamma (datos que muestran un CV constante) * errores Exponenciales (datos de supervivencia) Para estos errores se han definido las funciones de vínculo más adecuadas (por defecto; canónicas): ERRORES FUNCIÓN * Normales Identidad * Poisson, Binomiales negativos Log * Binomial Logit * Gamma Recíproca 5

6 CREACIÓN DEL MODELO GENERALIZADO (POISSON REGRESSION) En los modelos de regresión lineal clásicos (Gausianos): * definimos una función predictora g(x) = α+β 1 X β p X p * establecemos la relación lineal con la respuesta Y = g(x) + ε para p predictores siendo ε la variación residual En los modelos generalizados de Poisson: * establecemos el valor esperado de la respuesta Y por su parámetro media (μ) * que establece una relación logarítmica con la función predictora g(x) log(μ) = g(x) + ε o μ = e g(x) + ε' μ = e α+β 1X β p X p * esta estructura es muy importante para la interpretación de los coeficientes de regresión. 6

7 Definición de los modelos atendiendo a la distribución de errores Según qué tipo de variable respuesta tengamos definiremos la familia y la función de vínculo. Usaremos el comando glm en vez de lm de los modelos generales lineales. modelo <- glm(eqt, data=datos, family=poisson(link="log")) family = quasipoisson(link="logit") modelo <- glm.nb(eqt, data=datos, link=log) modelo <- glm(eqt, data=datos, family=binomial(link="logit")) family = quasibinomial(link="logit") family = binomial(link="cloglog") cloglog trabaja mejor con distribuciones extremadamente sesgadas 7

8 Interpretación de los resultados Primero valoramos la significación global del modelo, en lo que se conoce como un omnibus test. SI EL RESULTADO ES SIGNIFICATIVO, PODREMOS SEGUIR CON LOS RESULTADOS. Si no resulta significativo el análisis se terminó! Si en los modelos GzLM usados con poisson y binomial aplicamos la corrección por sobredispersión, el resultado de este omnibus test cambia. 8

9 A continuación valoramos las medidas de bondad de ajuste, basadas en devianza y valores de AIC. El coeficiente de sobredispersión es el valor Value/df. No lo utilizaremos si nuestra distribución canónica de la respuesta es la normal. En modelos con poisson y binomial debería dar un valor próximo a "uno" (1).Sies>1 hay sobredispersión;sies<1 se dice que hay sobreparametrización o infradispersión. Se aconseja corregir este desvío si Value/df >1, y no cuando es <1. en un modelo Gausiano nunca se corrige por sobredispersión, porque ésta ya se ha estimado en la definición de la gausiana a través del parámetro desviación típica (sd) que la describe. 9

10 VARIABILIDAD EXPLICADA POR EL MODELO (usando devianzas) La devianza es igual a la suma de los cuadrados de los residuos de devianza proporción de devianza explicada = (devianza residual nula devianza residual del modelo) (devianza residual nula) Para conocer la proporción de la variación en la variable respuesta que es explicada por el modelo (equivalente a una R 2 de un modelo General Lineal) tendremos que: 1) construir un nuevo modelo "nulo" sin predictoras (con sólo el intercepto). 2) obtener la Devianza de ese modelo nulo en su tabla de Goodness of Fit (Do) 3) calcular la siguiente expresión que denominaremos D 2 : D 2 =(Do Dmodelo)/Do Modelo nulo Nuestro modelo de interés D 2 =( )/ = = 21.6% 10

11 Por último, observamos los parámetros de las variables predictoras: coeficientes (B), errores estándard y significaciones (con las aproximaciones de Wald y de cocientes Likelihood). 11

12 INTERPRETACIÓN DE LOS COEFICIENTES DE REGRESIÓN Los modelos de regresión de Poisson son multiplicativos porque la función de vínculo es el logaritmo: familia = poisson vínculo = log En la regresión de Poisson log (Y) = a + b X o Y = exp(a + b X) log(y) cambia linealmente en función de las variables predictoras Y cambia linealmente en función del antilogaritmo de la función de las predictoras El coeficiente b en antilogaritmo, exp(b), mide el cambio en esa variable predictora que implica el cambio en una unidad en la variable respuesta Y. O dicho de otro modo, el coeficiente b es el cambio esperado en el log(y) cuando la variable predictora aumenta una unidad. En el caso de las predictoras categóricas (definidas por nº categorías del factor 1) el antilogaritmo del coeficiente, exp(b), es el término multiplicativo relativo a la "base" del factor. El antilogaritmo del intercepto, exp(a),esel valor basal en relación con el cual se estiman los cambios definidos por los coeficientes. 12

13 ejemplo con factores factor edu de 4 niveles factor res de 4 niveles 13

14 SOBREDISPERSIÓN DEL MODELO Medida para estimar la bondad de ajuste del modelo (ϕ). Mide la existencia de una mayor (o menor) variabilidad que la esperable en la variable respuesta considerando los supuestos acerca de su distribución canónica y la función de vínculo (que liga los valores transformados de la variable a las predicciones del modelo) ϕ debería valer 1. Si >1 sobredispersión se "inflan" las significaciones Si <1 infradispersión asociado a la sobreparametrización SOBREDISPERSIÓN!!! las estimas de significación están "infladas" Con estos valores (ϕ) recalculamos nuevas estimas de significación a través de la F. F = diferencias en Devianza / (dif. en g.l. x ϕ) aparecerán en los resultados en: Test of Model Effects 14

15 Diseños factoriales utilizando una Poisson Veámoslo prácticamente en R utilizando la distribución de Poisson. ## para importar datos de internet y ponerlos en uso ## abro una conexión con internet meconecto <- url(" ## cargo el archivo de la conexión load(meconecto) ## cierro la conexión y borro el objeto "meconecto" close(meconecto); rm(meconecto) ## con la siguiente línea de código veo las variables names(datos) ## creamos una función de asociaciones que llamo "eqt" eqt <- as.formula(abundancia ~ covariante + insolacion*tratamiento) 15

16 Diseños factoriales utilizando una Poisson Veámoslo prácticamente en R utilizando la distribución de Poisson. ## CARGAMOS PAQUETES ## library(lmtest) library(mass) library(car) library(mumin) library(phia) library(sandwich) library(robustbase) library(psych) library(fit.models) 16

17 Diseños factoriales utilizando una Poisson Veámoslo prácticamente en R utilizando la distribución de Poisson. ## establecemos los tipos de contrastes para las variables ## predictoras nominales (factores) ## antes cargamos la siguiente línea de código para obtener los ## mismos resultados que en STATISTICA o SPSS utilizando type III SS ## "factor" para los factores no ordenados ## "ordered" para factores con niveles ordenados ## options(contrasts=c(factor="contr.sum", ordered="contr.poly")) ## ahora creamos nuestro modelo tipo ANCOVA Generalizado Lineal modelo <- glm(eqt, data=datos, family=poisson(link="log")) ## los valores de la Devianza nula (modelo nulo: "respuesta ~ 1") ## y Devianza residual del modelo se encuentran en el modelo ## como modelo$null.deviance y modelo$deviance ## con ellos calculamos lo que explica el modelo: d2 <- round(100*(modelo$null.deviance-modelo$deviance)/modelo$null.deviance, 2) print(c("d2 de McFadden (%) =",d2), quote=false) [1] D2 de McFadden (%) =

18 Diseños factoriales utilizando una Poisson Veámoslo prácticamente en R utilizando la distribución de Poisson. ## estima de significación global del modelo de interés ## comparándolo con el modelo nulo ## sólo procederemos valorando los resultados de este modelo, ## SÍ Y SÓLO SÍ, este "omnibus test" ha sido significativo ## podemos utilizar estos dos test con resultados similares ## likelihood ratio test lrtest(modelo) Likelihood ratio test Model 1: abundancia ~ covariante + insolacion * tratamiento Model 2: abundancia ~ 1 #Df LogLik Df Chisq Pr(>Chisq) < 2.2e-16 *** --- Signif. codes: 0 *** ** 0.01 *

19 Diseños factoriales utilizando una Poisson Veámoslo prácticamente en R utilizando la distribución de Poisson. ## test de Wald waldtest(modelo) Wald test Model 1: abundancia ~ covariante + insolacion * tratamiento Model 2: abundancia ~ 1 Res.Df Df F Pr(>F) < 2.2e-16 *** --- Signif. codes: 0 *** ** 0.01 *

20 Diseños factoriales utilizando una Poisson Veámoslo prácticamente en R utilizando la distribución de Poisson. ## valores AICc del modelo de interés y el modelo nulo modelo.nulo <- glm(modelo$model[,1]~1, family=poisson(link="log")) AICc(modelo, modelo.nulo) veces.mejor <- exp(-0.5*(aicc(modelo)-aicc(modelo.nulo))) print(c("veces que MI MODELO es mejor que el modelo NULO =", veces.mejor), quote=false) df AICc modelo modelo.nulo [1] Veces que MI MODELO es mejor que el modelo NULO = e+48 Este resultado es consistente con el anterior, pero en coordenadas de teoría de la información. El modelo de interés de 6*10 48 veces mejor que el modelo nulo. Estos dos tests nos proporcionan que nuestro modelo es altamente significativo, con lo cual podemos continuar valorando sus resultados. Pero antes tenemos que comprobar si hemos cumplido los supuestos canónicos de los modelos a través de la exploración de sus residuos. 20

21 Diseños factoriales utilizando una Poisson Veámoslo prácticamente en R utilizando la distribución de Poisson. ## exploración de los residuos del modelo ## vemos unos gráficos generales que ya nos dan muchas pistas: ## normalidad, usando los residuos de devianza ## ( no en la escala original de la respuesta!!) ## homocedasticidad de los residuos a través de las predicciones ## del modelo (aplicando la transformación de la link function) ## existencia de datos influyentes y perdidos ## con la distancia de Cook y Leverage ## en una sola figura con cuatro paneles par(mfcol=c(1,1)) ## fija un sólo panel gráfico par(mfcol=c(2,2)) ## fija cuatro paneles con 2 columnas y 2 filas plot(modelo, c(1:2,4,6)) par(mfcol=c(1,2)) par(mfcol=c(1,1)) ## volvemos al modo gráfico de un solo panel 21

22 Diseños factoriales utilizando una Poisson homocedasticidad normalidad puntos influyentes y perdidos 22

23 Diseños factoriales utilizando una Poisson Veámoslo prácticamente en R utilizando la distribución de Poisson. ## test de Shapiro-Wilk de la normalidad de los residuos de devianza shapiro.test(residuals(modelo, type="deviance")) Shapiro-Wilk normality test data: residuals(modelo, type = "deviance") W = 0.976, p-value = ## el desvío de la normalidad no es muy grave ## hemos identificado que hay una leve violación de homocedasticidad ## y existen algunas observaciones con elevada distancia de Cook ## puntos influyentes y perdidos con dffits ## dffits con sus límites "críticos" ## niveles críticos 2*raiz((g.l. del modelo)/(número de datos)) plot(dffits(modelo)) abline(h=2*((length(modelo$residuals)-modelo$df.residual-1)/length(modelo$residuals))^0.5, col="red") abline(h=-2*((length(modelo$residuals)-modelo$df.residual-1)/length(modelo$residuals))^0.5, col="red") identify(dffits(modelo)) ## terminad dando clik en Finish del panel Plots 23

24 Diseños factoriales utilizando una Poisson 24

25 Diseños factoriales utilizando una Poisson Veámoslo prácticamente en R utilizando la distribución de Poisson. ## INDEPENDENCIA ENTRE LAS PREDICTORAS: VIF = 1 / (1 - R 2 ), ## de cada predictora por las restantes ## GVIF or VIF specifically indicate the magnitude of the inflation in the standard errors ## associated with a particular beta weight that is due to multicollinearity ## la raiz cuadrada de un valor VIF o GVIF es el número de veces que ## se inflan los errores standard de esa predictora ## vif(modelo) sqrt(vif(modelo)) > vif(modelo) covariante insolacion tratamiento insolacion:tratamiento > sqrt(vif(modelo)) covariante insolacion tratamiento insolacion:tratamiento

26 Diseños factoriales utilizando una Poisson Veámoslo prácticamente en R utilizando la distribución de Poisson. ## estima de la sobredispersión del modelo ## este valor canónico debería de ser igual a la unidad ## phi <- sum((residuals(modelo, type="pearson"))^2)/modelo$df.residual print(c("pearson overdispersion =", round(phi, 3)), quote=false) [1] Pearson overdispersion = Si este valor hubiese sido muy diferente de uno (e.g., > 2) recalcularíamos el modelo teniendo en cuenta ese valor de sobredispersión, aplicando la pseudofamilia quasipoisson. No corregiremos por sobredispersión si phi <1 modelo2 <- glm(eqt, data=datos, family=quasipoisson(link="log")) Y procederíamos con este nuevo modelo. 26

27 Diseños factoriales utilizando una Poisson Veámoslo prácticamente en R utilizando la distribución de Poisson. ## representación de los valores observados y predichos en la respuesta ## usando la escala original de medida (habiendo destransformado los datos ## desde la transformación incluida en la link function) plot(modelo$y~fitted(modelo), ylab="respuesta original") abline(lm(modelo$y~fitted(modelo)), col="red", lwd=2) 27

28 Diseños factoriales utilizando una Poisson Veámoslo prácticamente en R utilizando la distribución de Poisson. ## resultados del modelo y SIGNIFICACIONES de efectos parciales summary(modelo) Call: glm(formula = eqt, family = poisson(link = "log"), data = datos) Deviance Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error z value Pr(> z ) (Intercept) ** covariante e-05 *** insolacion e-12 *** tratamiento e-08 *** insolacion1:tratamiento Signif. codes: 0 *** ** 0.01 * (Dispersion parameter for poisson family taken to be 1) Null deviance: on 111 degrees of freedom Residual deviance: on 107 degrees of freedom AIC: Number of Fisher Scoring iterations: 5 28

29 Diseños factoriales utilizando una Poisson Veámoslo prácticamente en R utilizando la distribución de Poisson. ## estimas parciales, al estilo SS type-iii ## esto nos proporciona la significación de los efectos ## la Deviance nos vincula a las magnitudes de los efectos ## <none> indica la devianza residual sin quitar efectos ## los otros valores indican la devianza quitando ese efecto ## a más valor más magnitud del efecto ## dropterm(modelo, ~., test="chisq", sorted=false) Single term deletions Model: abundancia ~ covariante + insolacion * tratamiento Df Deviance AIC LRT Pr(Chi) <none> covariante e-05 *** insolacion < 2.2e-16 *** tratamiento e-10 *** insolacion:tratamiento Signif. codes: 0 *** ** 0.01 *

30 Diseños factoriales utilizando una Poisson Veámoslo prácticamente en R utilizando la distribución de Poisson. ## estimas parciales, al estilo SS type-iii ## esto nos proporciona la significación de los efectos ## ## otra manera con Likelihood Ratio test ## Anova(modelo, type=3, test="lr") Analysis of Deviance Table (Type III tests) Response: abundancia LR Chisq Df Pr(>Chisq) covariante e-05 *** insolacion < 2.2e-16 *** tratamiento e-10 *** insolacion:tratamiento Signif. codes: 0 *** ** 0.01 *

31 Diseños factoriales utilizando una Poisson Veámoslo prácticamente en R utilizando la distribución de Poisson. ## Vemos los valores medios de la respuesta (en su escala original) ## ojo!! los valores son los ajustados si tuviésemos covariantes ## se dan los errores estándard plot(interactionmeans(modelo), legend.margin=0.3) 31

32 Diseños factoriales utilizando una Poisson Veámoslo prácticamente en R utilizando la distribución de Poisson. ## EXAMEN DEL EFECTO DE LA VIOLACIÓN DEL SUPUESTO DE HOMOCEDASTICIDAD ## Recálculo de significaciones; realmente sin mucho interés porque ## se refiere a los coeficientes y no al efecto global de cada factor ## método Sandwich (que es type="hc0"): sólo para el cálculo de ## nuevos errores standard y las significaciones asociadas ## no cambian las estimas de los coeficientes ## coeftest(modelo, vcov=sandwich) z test of coefficients: Estimate Std. Error z value Pr(> z ) (Intercept) ** covariante *** insolacion e-13 *** tratamiento e-08 *** insolacion1:tratamiento Signif. codes: 0 *** ** 0.01 *

33 Diseños factoriales utilizando una Poisson Veámoslo prácticamente en R utilizando la distribución de Poisson. ## afrontemos ahora el efecto de puntos influyentes y/o perdidos ## RECÁLCULO DEL MODELO QUITANDO ALGUNOS PUNTOS ## mejor no hacemos esto modelo.sin_outliers <- glm(eqt, data=datos[c(-6, -33, -54, -55, -56),]), family=poisson(link="log")) ## ESTIMACIONES ROBUSTAS ## sin quitar datos del modelo; aproximación robusta más seria, ## que estima nuevos coeficientes y errores standard ## Mqle es el método Mallows-Hubber quasi-liquelihood. modelo.robusto <- glmrob(eqt, data=datos, family=poisson(link="log"), weights.on.x="hat", method="mqle", control=glmrobmqle.control(tcc=1.2, maxit=100)) ## summary(modelo.robusto) par(mfcol=c(1,1)) ## robustez de los datos individuales plot(modelo.robusto$w.r, ylab="robustez de las observaciones") identify(modelo.robusto$w.r) plot(modelo.robusto$w.x, leverage(modelo), xlab="peso de las observaciones") 33

34 Diseños factoriales utilizando una Poisson Veámoslo prácticamente en R utilizando la distribución de Poisson. > summary(modelo.robusto) Call: glmrob(formula = eqt, family = poisson(link = "log"), data = datos, method = "Mqle", weights.on.x = "hat", control = glmrobmqle.control(tcc = 1.2, maxit = 100)) Coefficients: Estimate Std. Error z value Pr(> z ) (Intercept) ** covariante e-05 *** insolacion e-10 *** tratamiento e-07 *** insolacion1:tratamiento Signif. codes: 0 *** ** 0.01 * Robustness weights w.r * w.x: Min. 1st Qu. Median Mean 3rd Qu. Max Number of observations: 112 Fitted by method Mqle (in 5 iterations) (Dispersion parameter for poisson family taken to be 1) 34

35 Diseños factoriales utilizando una Poisson 35

36 Diseños factoriales utilizando una Poisson 36

37 Diseños factoriales utilizando una Binomial Negativa Repetiremos todos los pasos previos, sólo que en esta ocasión nuestro modelos será: modelo <- glm.nb(eqt, data=datos, link=log) > summary(modelo) Call: glm.nb(formula = eqt, data = datos, link = log, init.theta = ) Deviance Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error z value Pr(> z ) (Intercept) * covariante *** insolacion e-11 *** tratamiento e-07 *** insolacion1:tratamiento Signif. codes: 0 *** ** 0.01 * (Dispersion parameter for Negative Binomial( ) family taken to be 1) Null deviance: on 111 degrees of freedom Residual deviance: on 107 degrees of freedom AIC: Number of Fisher Scoring iterations: 1 Theta: En esta ocasión el modelo estima un parámetro más Theta Std. Err.: 7.52 que mide la sobredispersión de un modelo Binomial Negativo este parámetro se relaciona con el "size" de la distribución NegBin 2 x log-likelihood: no deberíamos corregir por sobredispersión 37

38 Diseños factoriales utilizando una Binomial Repetiremos todos los pasos previos, sólo que en esta ocasión nuestro modelos será: modelo <- glm(eqt, data=datos, family=binomial(link="logit")) Si hay sobredispersión utilizaremos la pseudofamilia: family=quasibinomial(link="logit") Si no hay buenos ajustes o alta sobredispersión utilizaremos la función de vínculo: family = binomial(link ="cloglog") cloglog trabaja mejor con distribuciones extremadamente sesgadas por ejemplo: porporciones de un estado <0.1 o >0.9 38

39 Diseños factoriales utilizando una Binomial Si nuestra variable respuesta no es una binomial con estados [0 1] ó[si NO] entonces podremos construir un modelo definiendo esa variable respuesta "frecuencia". Hay dos modos: la respuesta es un valor "proporción" (acotado entre cero y uno) la respuesta es un valor combinado de dos vectores: valores SI, valores NO Para proporciones, tenemos que definir el denominador que genera la frecuencia en weights modelo <- glm(eqt, data=datos, family=binomial(link="logit"), weights=denominador) Para respuestas combinadas, tenemos que definir los dos vectores conteo SI, conteo NO en una nueva variable respuesta con el comando cbind cbind(valoressi, valoresno) ## ejemplo con los datos de trabajo eqt <- as.formula(cbind(presen8, ausen8) ~ covariante + insolacion * tratamiento) modelo <- glm(eqt, data=datos, family=binomial(link="logit") 39

40 MODELOS GENERALIZADOS USANDO UNA BINOMIAL Nuestro modelo ahora tendrá la forma: p: proporción de un "estado" respecto a toda la muestra (80 "ceros" y 20 "unos", N=100: p = 20/100 = 0.20) X: k variables predictoras logit ( p ) = log [ p / (1 p) ] = β 0 + β 1 X 1 + β 2 X 2 + β 3 X β k X k p / (1 p) = exp ( β 0 + β 1 X 1 + β 2 X 2 + β 3 X β k X k ) exp: antilogaritmo p = [ exp ( β 0 + β 1 X 1 + β 2 X 2 + β 3 X β k X k ) ] 1 + [ exp ( β 0 + β 1 X 1 + β 2 X 2 + β 3 X β k X k ) ] El modelo Generalizado Lineal Logit predice valores de probabilidad continua (p): entre 0 y 1. 40

41 RESIDUOS DE MODELOS GENERALIZADOS BINOMIALES La exploración de los residuos en esta ocasión es un tanto diferente, debido al estado binomial de la respuesta con dos valores discretos (e.g., 0 1, sí no). Con la "normalidad de los residuos" de devianza, en el mejor de los casos, tendríamos algo parecido a lo siguiente (con antisimetría en los dos lados del "bigote"): menor densidad de puntos mayor densidad de puntos cuanto más explique el modelo más cerca estarán los dos extremos 41

42 RESIDUOS DE MODELOS GENERALIZADOS BINOMIALES En el caso de la relación entre los residuos de devianza y las predicciones del modelo (predictor lineal al que se le aplica la transformación logit), esperaríamos encontrar algo como esto: menor densidad de puntos cuanto más explique el modelo más cerca estarán los dos extremos mayor densidad de puntos menor densidad de puntos 42

43 DIAGRAMAS ROC EN MODELOS GENERALIZADOS BINOMIALES El Modelo Generalizado Binomial produce probabilidades de ocurrencia p de uno de los estados de la variable respuesta (e.g., el valor 1 en 0 1, o sí en sí no). Estos valores de p, continuos entre 0 y 1, hay que convertirlos a "estados" 0 o 1, utilizando umbrales de corte. Estos valores umbrales nos permitirán convertir "probabilidades" en "estados". por ejemplo, si el umbral es p=0.5 si p<0.5 entonces es "cero" si p>0.5 entonces es "uno" Podemos utilizar como umbral de corte (cut off point) la proporción real observada. No obstante, en muchas ocasiones este es un valor incierto, y es conveniente preguntarse: cómo de bueno es nuestro modelo "clasificando las observaciones" independientemente de los valores umbral de corte? Para ello podemos contar con los diagramas ROC (Receiver operating characteristic): (excelente página) 43

44 DIAGRAMAS ROC EN MODELOS GENERALIZADOS BINOMIALES El área en el cuadrado morado suma "uno". De esa área, cuánto ocupa la superficie bajo la curva azul? (la proporción es el valor AUC) AUC 44

MODELOS GENERALIZADOS LINEALES CON SPSS

MODELOS GENERALIZADOS LINEALES CON SPSS MODELOS GENERALIZADOS LINEALES CON SPSS Luis M. Carrascal (www.lmcarrascal.eu) Depto. Biogeografía y Cambio Global Museo Nacional de Ciencias Naturales, CSIC Cómo realizarlos, buena praxis e interpretación

Más detalles

Datos binomiales 1.70 1.75 1.80 1.85. beetles$dosis

Datos binomiales 1.70 1.75 1.80 1.85. beetles$dosis Datos binomiales Modelos de dosis-respuesta Carga de datos y calculo de proporciones: beetles

Más detalles

Regresión lineal. Marcelo Rodríguez Ingeniero Estadístico - Magíster en Estadística

Regresión lineal. Marcelo Rodríguez Ingeniero Estadístico - Magíster en Estadística Regresión lineal Marcelo Rodríguez Ingeniero Estadístico - Magíster en Estadística Universidad Católica del Maule Facultad de Ciencias Básicas Pedagogía en Matemática Estadística I 01 de enero de 2012

Más detalles

Práctica 3: Regresión simple con R

Práctica 3: Regresión simple con R Estadística II Curso 2010/2011 Licenciatura en Matemáticas Práctica 3: Regresión simple con R 1. El fichero de datos Vamos a trabajar con el fichero salinity que se encuentra en el paquete boot. Para cargar

Más detalles

Estadística II Tema 4. Regresión lineal simple. Curso 2009/10

Estadística II Tema 4. Regresión lineal simple. Curso 2009/10 Estadística II Tema 4. Regresión lineal simple Curso 009/10 Tema 4. Regresión lineal simple Contenidos El objeto del análisis de regresión La especificación de un modelo de regresión lineal simple Estimadores

Más detalles

Análisis de datos Categóricos

Análisis de datos Categóricos Introducción a los Modelos Lineales Generalizados Universidad Nacional Agraria La Molina 2016-1 Introducción Modelos Lineales Generalizados Introducción Componentes Estimación En los capítulos anteriores

Más detalles

Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia

Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia Estudio de Caso: Estudio Morfología Coeficiente de Correlación Considere el archivo Estudio Morfología.sav.

Más detalles

Regresión Lineal. 15 de noviembre de Felipe Bravo Márquez

Regresión Lineal. 15 de noviembre de Felipe Bravo Márquez Felipe José Bravo Márquez 15 de noviembre de 2013 Introducción Un modelo de regresión se usa para modelar la relación de una variable dependiente y numérica con n variables independientes x 1, x 2,...,

Más detalles

Correlación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r)

Correlación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r) Correlación El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r) El coeficiente de correlación lineal de Pearson (r) permite medir el grado de asociación entre

Más detalles

TEMA 5. Modelos para Datos de Conteo

TEMA 5. Modelos para Datos de Conteo TEMA 5. Modelos para Datos de Conteo Profesor: Pedro Albarrán Pérez Universidad de Alicante. Curso 2010/2011. Contenido 1 Datos de Conteo 2 Regresión de Poisson 3 Extensiones Datos de Conteo Variable de

Más detalles

Curs de Modelització Estadística Bàsica amb Deducer. Anabel Blasco Ana Vázquez Anna Espinal Llorenç Badiella Oliver Valero

Curs de Modelització Estadística Bàsica amb Deducer. Anabel Blasco Ana Vázquez Anna Espinal Llorenç Badiella Oliver Valero Curs de Modelització Estadística Bàsica amb Deducer Anabel Blasco Ana Vázquez Anna Espinal Llorenç Badiella Oliver Valero 1. Model de Regressió Lineal 2. Model ANOVA 3. Model Lineal General 4. Model de

Más detalles

> y <- c(19, 57, 29, 63, 29, 49, 27, 53, 23, 47, 33, 66, 47, 55, 23, 50, + 24, 37, 42, 68, 43, 52, 30, 42) > ly <- length( y )

> y <- c(19, 57, 29, 63, 29, 49, 27, 53, 23, 47, 33, 66, 47, 55, 23, 50, + 24, 37, 42, 68, 43, 52, 30, 42) > ly <- length( y ) Preferencia por un nuevo Detergente: Para un estudio de mercado sobre las preferencias entre un nuevo detergente Xx y uno standard Mm se consideró una muestra de 1008 consumidores, a los que se preguntó

Más detalles

Teoría de la decisión

Teoría de la decisión 1.- Un problema estadístico típico es reflejar la relación entre dos variables, a partir de una serie de Observaciones: Por ejemplo: * peso adulto altura / peso adulto k*altura * relación de la circunferencia

Más detalles

Estas dos clases. ANOVA I - Conceptos generales - Supuestos - ANOVA de una vía - Transformación de datos - Test a Posteriori - ANOVA de dos vías

Estas dos clases. ANOVA I - Conceptos generales - Supuestos - ANOVA de una vía - Transformación de datos - Test a Posteriori - ANOVA de dos vías ANOVA I 19-8-2014 Estas dos clases ANOVA I - Conceptos generales - Supuestos - ANOVA de una vía - Transformación de datos - Test a Posteriori - ANOVA de dos vías ANOVA II - ANOVA factorial - ANCOVA (análisis

Más detalles

Tercera práctica de REGRESIÓN.

Tercera práctica de REGRESIÓN. Tercera práctica de REGRESIÓN. DATOS: fichero practica regresión 3.sf3 1. Objetivo: El objetivo de esta práctica es aplicar el modelo de regresión con más de una variable explicativa. Es decir regresión

Más detalles

3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS

3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS 1. INTRODUCCIÓN Este tema se centra en el estudio conjunto de dos variables. Dos variables cualitativas - Tabla de datos - Tabla de contingencia - Diagrama de barras - Tabla de diferencias entre frecuencias

Más detalles

REGRESIÓN LINEAL SIMPLE

REGRESIÓN LINEAL SIMPLE REGRESIÓN LINEAL SIMPLE 1. El problema de la regresión lineal simple. Método de mínimos cuadrados 3. Coeficiente de regresión 4. Coeficiente de correlación lineal 5. El contraste de regresión 6. Inferencias

Más detalles

Modelos de suavizado, aditivos y mixtos

Modelos de suavizado, aditivos y mixtos Carmen Armero 13 de junio de 11 Libreria mgcv Libreria mgcv mgcv es una librería de R diseñada para trabajar con modelos aditivos generalizados, incluyendo modelos mixtos aditivos generalizados, GAMM.

Más detalles

ANOVA. Análisis de regresión y modelo lineal

ANOVA. Análisis de regresión y modelo lineal . Análisis de regresión y modelo lineal [0011] DEFAD. Métodos de contraste de hipótesis y diseño de experimentos 2014 15. Análisis de regresión y modelo lineal 1 Comparaciones múltiples 2 3. Análisis de

Más detalles

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 7)

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 7) TEMA Nº 7 DISTRIBUCIONES CONTINUAS DE PROBABILIDAD OBJETIVOS DE APRENDIZAJE: Conocer las características de la distribución normal como distribución de probabilidad de una variable y la aproximación de

Más detalles

Economía Aplicada. Modelos con variables dependiente binarias. Departamento de Economía Universidad Carlos III de Madrid

Economía Aplicada. Modelos con variables dependiente binarias. Departamento de Economía Universidad Carlos III de Madrid Economía Aplicada Modelos con variables dependiente binarias Departamento de Economía Universidad Carlos III de Madrid Ver Stock y Watson (capítulo 11) 1 / 28 Modelos con variables dependiente binarias:

Más detalles

3 Ejemplos simples sobre regresión logística

3 Ejemplos simples sobre regresión logística 3 Ejemplos mples sobre regreón logística 1. Ejemplo 1 (ejemplo1.dat) tabla 2x2 Una variable explicativa binaria (Solución) 2. Ejemplo 2 (ejemplo2.dat) Una variable independiente continua (Solución) 3.

Más detalles

Intervalos de confianza con STATGRAPHICS

Intervalos de confianza con STATGRAPHICS Intervalos de confianza con STATGRAPHICS Ficheros empleados: TiempoaccesoWeb.sf3 ; TiempoBucle.sf3; 1. Ejemplo 1: Tiempo de acceso a una página Web Se desean construir intervalos de confianza para la media

Más detalles

2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...

2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición... Contenidos 1 Introducción al paquete estadístico S-PLUS 19 1.1 Introducción a S-PLUS............................ 21 1.1.1 Cómo entrar, salir y consultar la ayuda en S-PLUS........ 21 1.2 Conjuntos de datos..............................

Más detalles

Julio Deride Silva. 4 de junio de 2010

Julio Deride Silva. 4 de junio de 2010 Curvas ROC y Regresión Lineal Julio Deride Silva Área de Matemática Facultad de Ciencias Químicas y Farmcéuticas Universidad de Chile 4 de junio de 2010 Tabla de Contenidos Curvas ROC y Regresión Lineal

Más detalles

Media-Lab Prado. Modelos Lineales en para procesar encuestas de Satisfacción. Manuel Pérez Gómez 16/06/2016

Media-Lab Prado. Modelos Lineales en para procesar encuestas de Satisfacción. Manuel Pérez Gómez 16/06/2016 Media-Lab Prado Modelos Lineales en para procesar encuestas de Satisfacción Manuel Pérez Gómez 16/06/2016 Análisis de los Sectores. TPV Caja Compras Almacén Grupos Informes TPV Caja Compras Almacén Grupos

Más detalles

TEMA 4 Modelo de regresión múltiple

TEMA 4 Modelo de regresión múltiple TEMA 4 Modelo de regresión múltiple José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Análisis de Datos - Grado en Biología Estructura de este tema Modelo de regresión múltiple.

Más detalles

Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.

Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows. TEMA 13 REGRESIÓN LOGÍSTICA Es un tipo de análisis de regresión en el que la variable dependiente no es continua, sino dicotómica, mientras que las variables independientes pueden ser cuantitativas o cualitativas.

Más detalles

Odds = = e. UD1: El modelo de regresión logística 1. 1 e

Odds = = e. UD1: El modelo de regresión logística 1. 1 e RE2. Regresión logística binaria, multinomial, de Poisson y binomial negativa Curso 204/5 Solución resumida de la prueba de evaluación Unidad didáctica (D) La regresión logística puede utilizarse en cualquiera

Más detalles

La distribución de Poisson es de tipo exponencial con parámetro dispersión 1.

La distribución de Poisson es de tipo exponencial con parámetro dispersión 1. Reclaaciones y Edad (Pawitan). Una copañía aseguradora quiere conocer cóo depende el núero de reclaaciones de los clientes con cierta póliza, de su edad. El archivo reclaaciones.txt contiene los datos

Más detalles

PRÁCTICA 3. REGRESIÓN LINEAL SIMPLE CON SPSS Ajuste de un modelo de regresión lineal simple Porcentaje de variabilidad explicado

PRÁCTICA 3. REGRESIÓN LINEAL SIMPLE CON SPSS Ajuste de un modelo de regresión lineal simple Porcentaje de variabilidad explicado PÁCTICA 3. EGESIÓN LINEAL SIMPLE CON SPSS 3.1. Gráfico de dispersión 3.2. Ajuste de un modelo de regresión lineal simple 3.3. Porcentaje de variabilidad explicado 3.4 Es adecuado este modelo para ajustar

Más detalles

INDICE 1. Qué es la Estadística? 2.Descripción de Datos: Distribuciones de Frecuencia y Presentación Gráfica

INDICE 1. Qué es la Estadística? 2.Descripción de Datos: Distribuciones de Frecuencia y Presentación Gráfica INDICE 1. Qué es la Estadística? 1 Introducción 2 Qué significa estadística? 2 Por qué se estudia la estadística? 4 Tipos de estadística 5 Estadística descriptiva 5 Estadística inferencial 6 Tipos de variables

Más detalles

SPSS Aplicación práctica: Base de datos del HATCO

SPSS Aplicación práctica: Base de datos del HATCO Aplicación práctica: Base de datos del HATCO Datos: observaciones de variables obtenidos desde encuentas a clientes de un distribuidor industrial. Variables de interés en la aplicación: Percepciones de

Más detalles

Ejercicio Heterocedasticidad_2

Ejercicio Heterocedasticidad_2 Ejercicio heterocedasticidad 2. 1 Ejercicio Heterocedasticidad_2 Tengamos los siguientes datos de los beneficios (B i ) y ventas (V i ) de 20 empresas: obs B V 1 13,2 61 2 15 78 3 22,2 158 4 15,2 110 5

Más detalles

Regresión lineal SIMPLE MÚLTIPLE N A Z IRA C A L L E J A

Regresión lineal SIMPLE MÚLTIPLE N A Z IRA C A L L E J A Regresión lineal REGRESIÓN LINEAL SIMPLE REGRESIÓN LINEAL MÚLTIPLE N A Z IRA C A L L E J A Qué es la regresión? El análisis de regresión: Se utiliza para examinar el efecto de diferentes variables (VIs

Más detalles

Los modelos lineales (regresión, ANOVA, ANCOVA), se basan en los siguientes supuestos:

Los modelos lineales (regresión, ANOVA, ANCOVA), se basan en los siguientes supuestos: GLM-Introducción Los modelos lineales (regresión, ANOVA, ANCOVA), se basan en los siguientes supuestos: 1. Los errores se distribuyen normalmente. 2. La varianza es constante. 3. La variable dependiente

Más detalles

UNIVERSIDAD DE ANTIOQUIA FACULTAD NACIONAL DE SALUD PÚBLICA Héctor Abad Gómez ldbello@saludpublica.udea.edu.co Facultad Nacional de Salud Pública Héctor Abad Gómez www.leondariobello.com www.ciemonline.info/moodle

Más detalles

ANALISIS DE REGRESIÓN Y CORRELACIÓN LINEAL

ANALISIS DE REGRESIÓN Y CORRELACIÓN LINEAL ANALISIS DE REGRESIÓN Y CORRELACIÓN LINEAL Msc. Lácides Baleta Octubre 16 Página 1 de 11 REGRESIÓN Y CORRELACIÓN LINEAL Son dos herramientas para investigar la dependencia de una variable dependiente Y

Más detalles

15. Regresión lineal. Te recomiendo visitar su página de apuntes y vídeos:

15. Regresión lineal. Te recomiendo visitar su página de apuntes y vídeos: 15. Regresión lineal Este tema, prácticamente íntegro, está calacado de los excelentes apuntes y transparencias de Bioestadística del profesor F.J. Barón López de la Universidad de Málaga. Te recomiendo

Más detalles

Regresión de Poisson

Regresión de Poisson Regresión de Poisson -- Si la estructura de los errores es realmente de Poisson, entonces: devianza residual / grados de libertad residuales = 1 si el cociente es mayor que 1 estamos ante el fenómeno (incómodo)

Más detalles

Método de cuadrados mínimos

Método de cuadrados mínimos REGRESIÓN LINEAL Gran parte del pronóstico estadístico del tiempo está basado en el procedimiento conocido como regresión lineal. Regresión lineal simple (RLS) Describe la relación lineal entre dos variables,

Más detalles

Ciencia UANL Universidad Autónoma de Nuevo León ISSN (Versión impresa): MÉXICO

Ciencia UANL Universidad Autónoma de Nuevo León ISSN (Versión impresa): MÉXICO Ciencia UANL Universidad Autónoma de Nuevo León rciencia@mail.uanl.mx ISSN (Versión impresa): 1405-9177 MÉXICO 2008 Peter B. Mandeville TEMA 16: LA RAZÓN DE MOMIOS 2. REGRESIÓN LOGÍSTICA Ciencia UANL,

Más detalles

MODELO PARA EL TALLER DE REGRESION

MODELO PARA EL TALLER DE REGRESION MODELO PARA EL TALLER DE REGRESION PROBLEMA. Los datos siguientes muestran la matricula estudiantil en los primeros 5 anos de nuestra Universidad. Años (desde el 2000 al 2004) x 1 2 3 4 5 Matricula (miles

Más detalles

Unidad IV: Distribuciones muestrales

Unidad IV: Distribuciones muestrales Unidad IV: Distribuciones muestrales 4.1 Función de probabilidad En teoría de la probabilidad, una función de probabilidad (también denominada función de masa de probabilidad) es una función que asocia

Más detalles

Tema 3: Modelos lineales generalizados

Tema 3: Modelos lineales generalizados Tema 3: Modelos lineales generalizados Componentes de un modelo generalizado lineal (GLM) Un modelo lineal generalizado tiene tres componentes básicos: Componente aleatoria: Identifica la variable respuesta

Más detalles

INDICE 1. Introducción 2. Recopilación de Datos Caso de estudia A 3. Descripción y Resumen de Datos 4. Presentación de Datos

INDICE 1. Introducción 2. Recopilación de Datos Caso de estudia A 3. Descripción y Resumen de Datos 4. Presentación de Datos INDICE Prefacio VII 1. Introducción 1 1.1. Qué es la estadística moderna? 1 1.2. El crecimiento y desarrollo de la estadística moderna 1 1.3. Estudios enumerativos en comparación con estudios analíticos

Más detalles

Pronósticos, Series de Tiempo y Regresión. Capítulo 4: Regresión Lineal Múltiple

Pronósticos, Series de Tiempo y Regresión. Capítulo 4: Regresión Lineal Múltiple Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple Temas Modelo de regresión lineal múltiple Estimaciones de Mínimos Cuadrados Ordinarios (MCO); estimación puntual y predicción

Más detalles

INTERPRETACIÓN DE LA REGRESIÓN. Interpretación de la regresión

INTERPRETACIÓN DE LA REGRESIÓN. Interpretación de la regresión INTERPRETACIÓN DE LA REGRESIÓN Este gráfico muestra el salario por hora de 570 individuos. 1 Interpretación de la regresión. regresión Salario-Estudios Source SS df MS Number of obs = 570 ---------+------------------------------

Más detalles

INDICE Prefacio 1. Introducción 2. Distribuciones de frecuencia: tablas estadísticas y graficas

INDICE Prefacio 1. Introducción 2. Distribuciones de frecuencia: tablas estadísticas y graficas INDICE Prefacio XIII 1. Introducción 1.1. la imagen de la estadística 1 1.2. dos tipos de estadísticas 1.3. estadística descriptiva 2 1.4. estadística inferencial 1.5. naturaleza interdisciplinaria de

Más detalles

Estadís6ca y Métodos Numéricos Tema 6. Modelos de Regresión

Estadís6ca y Métodos Numéricos Tema 6. Modelos de Regresión Estadís6ca y Métodos Numéricos Tema 6. Modelos de Regresión Ángel Barón Caldera Ángel Cobo Ortega María Dolores Frías Domínguez Jesús Fernández Fernández Francisco Javier González Or@z Carmen María Sordo

Más detalles

Profesor: Hugo S. Salinas. Primer Semestre Tabla 1: Inteligencia y Rendimiento. X Y Figura 1: Inteligencia y Rendimiento.

Profesor: Hugo S. Salinas. Primer Semestre Tabla 1: Inteligencia y Rendimiento. X Y Figura 1: Inteligencia y Rendimiento. UNIVERSIDAD DE ATACAMA FACULTAD DE CIENCIAS JURÍDICAS / CARRERA DE TRABAJO SOCIAL TECNOLOGÍA INFORMÁTICA I (SPSS) ESTADÍSTICA DESCRIPTIVA CON MÁS DE UNA VARIABLE Profesor: Hugo S. Salinas. Primer Semestre

Más detalles

Curso: Economía Ambiental del Turismo. Aplicación del Método Costo de Viaje

Curso: Economía Ambiental del Turismo. Aplicación del Método Costo de Viaje Curso: Economía Ambiental del Turismo Aplicación del Método Costo de Viaje Estimación de Modelos Poisson para la estimación del Excedente del Consumidor a través del Método del Costo de Viaje: El caso

Más detalles

Regresión múltiple. Demostraciones. Elisa Mª Molanes López

Regresión múltiple. Demostraciones. Elisa Mª Molanes López Regresión múltiple Demostraciones Elisa Mª Molanes López El modelo de regresión múltiple El modelo que se plantea en regresión múltiple es el siguiente: y i = β 0 + β 1 x 1i + β 2 x 2i +...+ β k x ki +

Más detalles

Tema 10: Introducción a los problemas de Asociación y Correlación

Tema 10: Introducción a los problemas de Asociación y Correlación Tema 10: Introducción a los problemas de Asociación y Correlación Estadística 4 o Curso Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 10: Asociación y Correlación

Más detalles

Estadís5ca. María Dolores Frías Domínguez Jesús Fernández Fernández Carmen María Sordo. Tema 2. Modelos de regresión

Estadís5ca. María Dolores Frías Domínguez Jesús Fernández Fernández Carmen María Sordo. Tema 2. Modelos de regresión Estadís5ca Tema 2. Modelos de regresión María Dolores Frías Domínguez Jesús Fernández Fernández Carmen María Sordo Departamento de Matemá.ca Aplicada y Ciencias de la Computación Este tema se publica bajo

Más detalles

TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD

TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD Contrastes de hipótesis paramétricos para una y varias muestras: contrastes sobre la media, varianza y una proporción. Contrastes sobre la diferencia

Más detalles

EXAMEN ECONOMETRÍA I GRUPO 53 - DADE 8 de septiembre de 2005 Prof. Rafael de Arce

EXAMEN ECONOMETRÍA I GRUPO 53 - DADE 8 de septiembre de 2005 Prof. Rafael de Arce EXAMEN ECONOMETRÍA I GRUPO 53 - DADE 8 de septiembre de 005 Prof. Rafael de Arce NOMBRE: DNI: PARTE I.- TEST 1. La hipótesis de rango pleno en el MBRL supone: Que las variables explicativas no tengan ninguna

Más detalles

Tema 3: Análisis de datos bivariantes

Tema 3: Análisis de datos bivariantes Tema 3: Análisis de datos bivariantes 1 Contenidos 3.1 Tablas de doble entrada. Datos bivariantes. Estructura de la tabla de doble entrada. Distribuciones de frecuencias marginales. Distribución conjunta

Más detalles

Repaso de estadística básica. Juan D. Barón Santiago de Chile, 8 de abril de 2013

Repaso de estadística básica. Juan D. Barón Santiago de Chile, 8 de abril de 2013 Repaso de estadística básica Juan D. Barón Santiago de Chile, 8 de abril de 2013 1 I. CONCEPTOS ESTADÍSTICOS BÁSICOS 2 Las decisiones se toman bajo incertidumbre Las decisiones se basan en información

Más detalles

Introducción a la regresión ordinal

Introducción a la regresión ordinal Introducción a la regresión ordinal Jose Barrera jbarrera@mat.uab.cat 20 de mayo 2009 Jose Barrera (UAB) Introducción a la regresión ordinal 20 de mayo 2009 1 / 11 Introducción a la regresión ordinal 1

Más detalles

ESTADÍSTICA. Tema 4 Regresión lineal simple

ESTADÍSTICA. Tema 4 Regresión lineal simple ESTADÍSTICA Grado en CC. de la Alimentación Tema 4 Regresión lineal simple Estadística (Alimentación). Profesora: Amparo Baíllo Tema 4: Regresión lineal simple 1 Estructura de este tema Planteamiento del

Más detalles

viii CAPÍTULO 2 Métodos de muestreo CAPÍTULO 3 Análisis exploratorio de datos

viii CAPÍTULO 2 Métodos de muestreo CAPÍTULO 3 Análisis exploratorio de datos Contenido Acerca de los autores.............................. Prefacio.... xvii CAPÍTULO 1 Introducción... 1 Introducción.............................................. 1 1.1 Ideas de la estadística.........................................

Más detalles

ÍNDICE CAPÍTULO 1. INTRODUCCIÓN

ÍNDICE CAPÍTULO 1. INTRODUCCIÓN ÍNDICE CAPÍTULO 1. INTRODUCCIÓN 1.1. OBJETO DE LA ESTADÍSTICA... 17 1.2. POBLACIONES... 18 1.3. VARIABLES ALEATORIAS... 19 1.3.1. Concepto... 19 1.3.2. Variables discretas y variables continuas... 20 1.3.3.

Más detalles

El modelo de azar proporcional: la regresión de Cox

El modelo de azar proporcional: la regresión de Cox El modelo de azar proporcional: la regresión de Cox Alfonso Luis Palmer Pol y Jose Maria Losilla Vidal El Análisis de la Supervivencia (Palmer, 1988) engloba una variedad de técnicas estadísticas que permiten

Más detalles

Introducción a la Estadística Aplicada en la Química

Introducción a la Estadística Aplicada en la Química Detalle de los Cursos de Postgrado y Especialización en Estadística propuestos para 2015 1/5 Introducción a la Estadística Aplicada en la Química FECHAS: 20/04 al 24/04 de 2015 HORARIO: Diario de 10:00

Más detalles

T4. Modelos con variables cualitativas

T4. Modelos con variables cualitativas T4. Modelos con variables cualitativas Ana J. López y Rigoberto Pérez Dpto Economía Aplicada. Universidad de Oviedo Curso 2010-2011 Ana J. López y Rigoberto Pérez (Dpto EconomíaT4. Aplicada. Modelos Universidad

Más detalles

Estimación del Probit Ordinal y del Logit Multinomial

Estimación del Probit Ordinal y del Logit Multinomial Estimación del Probit Ordinal y del Logit Multinomial Microeconomía Cuantitativa R. Mora Departmento de Economía Universidad Carlos III de Madrid Esquema Introducción 1 Introducción 2 3 Introducción El

Más detalles

Econometría III Examen. 29 de Marzo de 2012

Econometría III Examen. 29 de Marzo de 2012 Econometría III Examen. 29 de Marzo de 2012 El examen consta de 20 preguntas de respuesta múltiple. El tiempo máximo es 1:10 minutos. nota: no se pueden hacer preguntas durante el examen a no ser que sean

Más detalles

INFERENCIA CON RECUENTOS

INFERENCIA CON RECUENTOS . INFERENCIA CON RECUENTOS PEDRO M. VALERO MORA Inferencia con Recuentos-Pedro M. Valero Mora 2009 1 Parte 1 Análisis con 1 variable 1.1. De dónde vienen las frecuencias?. 1.1. De dónde vienen las frecuencias?

Más detalles

ÍNDICE INTRODUCCIÓN... 21

ÍNDICE INTRODUCCIÓN... 21 INTRODUCCIÓN... 21 CAPÍTULO 1. ORGANIZACIÓN DE LOS DATOS Y REPRESENTACIONES GRÁFICAS... 23 1. ORGANIZACIÓN DE LOS DATOS... 23 1.1. La distribución de frecuencias... 24 1.2. Agrupación en intervalos...

Más detalles

ECONOMETRÍA II PRÁCTICAS DE ORDENADOR. Práctica 3

ECONOMETRÍA II PRÁCTICAS DE ORDENADOR. Práctica 3 ECONOMETRÍA II PRÁCTICAS DE ORDENADOR Práctica 3 Considere la ecuación de inversión RINV t = β 1 +β 2 RPIB t +β 3 r t +u t donde RINV es la inversión real privada, RPIB es el PIB real y r es el tipo de

Más detalles

CM0244. Suficientable

CM0244. Suficientable IDENTIFICACIÓN NOMBRE ESCUELA ESCUELA DE CIENCIAS NOMBRE DEPARTAMENTO Ciencias Matemáticas ÁREA DE CONOCIMIENTO MATEMATICAS, ESTADISTICA Y AFINES NOMBRE ASIGNATURA EN ESPAÑOL ESTADÍSTICA GENERAL NOMBRE

Más detalles

Estadística Clase 2. Maestría en Finanzas Universidad del CEMA. Profesor: Alberto Landro Asistente: Julián R. Siri

Estadística Clase 2. Maestría en Finanzas Universidad del CEMA. Profesor: Alberto Landro Asistente: Julián R. Siri Estadística 010 Clase Maestría en Finanzas Universidad del CEMA Profesor: Alberto Landro Asistente: Julián R. Siri Clase 1. La distribución de Bernoulli. La distribución binomial 3. La distribución de

Más detalles

T2. El modelo lineal simple

T2. El modelo lineal simple T2. El modelo lineal simple Ana J. López y Rigoberto Pérez Dpto Economía Aplicada. Universidad de Oviedo Curso 2010-2011 Curso 2010-2011 1 / 40 Índice 1 Planteamiento e hipótesis básicas 2 Estimación de

Más detalles

Multiple Linear Regression

Multiple Linear Regression Multiple Linear Regression Aniel Nieves-González Aniel Nieves-González () LSP 1 / 16 Considere el ejemplo en cual queremos modelar las ventas en una cadena de tiendas por departamento. La v.a. dependiente

Más detalles

Prueba de Hipótesis. Para dos muestras

Prueba de Hipótesis. Para dos muestras Prueba de Hipótesis Para dos muestras Muestras grandes (n mayor a 30) Utilizar tabla Z Ho: μ1 = μ2 H1: μ1 μ2 Localizar en valor de Zt en la tabla Z Error estándar de la diferencia de medias Prueba de

Más detalles

Estadística. Convocatoria ordinaria

Estadística. Convocatoria ordinaria Estadística. Convocatoria ordinaria Nombre Número de Examen Titulación... Grupo... Este examen puntúa sobre 20 puntos Problema 1. En un grupo de familias, un 10% ha cambiado de coche y también ha cambiado

Más detalles

ANÁLISIS DE FRECUENCIAS

ANÁLISIS DE FRECUENCIAS ANÁLISIS DE FRECUENCIAS EXPRESIONES PARA EL CÁLCULO DE LOS EVENTOS PARA EL PERÍODO DE RETORNO T Y DE LOS RESPECTIVOS ERRORES ESTÁNDAR DE ESTIMACIÓN REQUERIDOS PARA LA DETERMINACIÓN DE LOS INTERVALOS DE

Más detalles

ESTADISTICA II. INGENIERIA INFORMATICA, 3 ER Curso Septiembre Primera Parte

ESTADISTICA II. INGENIERIA INFORMATICA, 3 ER Curso Septiembre Primera Parte ESTADISTICA II INGENIERIA INFORMATICA, 3 ER Curso 13 - Septiembre - 2.004 Primera Parte Apellidos y Nombre:... D.N.I. :... Nota : En la realización de este examen sólo esta permitido utilizar calculadoras

Más detalles

Grupo 4: BUENAS PRÁCTICAS ESTADÍSTICAS

Grupo 4: BUENAS PRÁCTICAS ESTADÍSTICAS Red ibérica de evaluación de eficacia y efectos secundarios de tratamientos para el control de plagas en el olivar (RIESPO) 2ª Reunión, Madrid 10-11/06/2010 Grupo 4: BUENAS PRÁCTICAS ESTADÍSTICAS ESTADÍSTICA

Más detalles

Ajustes de datos: transformación de datos. Capítulo 9 de McCune y Grace 2002

Ajustes de datos: transformación de datos. Capítulo 9 de McCune y Grace 2002 Ajustes de datos: transformación de datos. Capítulo 9 de McCune y Grace 2002 Razones estadísticas para transformar datos Mejorar las suposiciones de algunas técnicas estadísticas: normalidad, linealidad,

Más detalles

ANALISIS DE LA ESTATURA

ANALISIS DE LA ESTATURA ANALISIS DE LA ESTATURA OBJETIVO El objetivo de este trabajo es realizar un estudio de la de distintos individuos. DATOS Se realizan los distintos análisis de regresión simple, así como el análisis de

Más detalles

Modelos de suavizado, aditivos y mixtos

Modelos de suavizado, aditivos y mixtos Carmen Armero 1 de junio de 2011 Introducción Introducción Modelos lineales, LM Modelos aditivos, AM Modelos lineales generalizados, GLM GAM I Un modelo lineal generalizado (GAM) es un modelo lineal generalizado

Más detalles

Regresión: implica la obtención de una ecuación mediante la que podamos estimar el valor medio de una variable.

Regresión: implica la obtención de una ecuación mediante la que podamos estimar el valor medio de una variable. 1 DEFINICIONES PREVIAS Regresión: implica la obtención de una ecuación mediante la que podamos estimar el valor medio de una variable. Correlación: es la cuantificación del grado de relación existente

Más detalles

Universidade de Vigo. Linealidad. El comportamiento esperado de la variable dependiente

Universidade de Vigo. Linealidad. El comportamiento esperado de la variable dependiente Linealidad El comportamiento esperado de la variable dependiente El concepto de linealidad Indica que el valor esperado de la variable dependiente depende linealmente de las variables independientes El

Más detalles

Por ejemplo, si se desea discriminar entre créditos que se devuelven o que presentan

Por ejemplo, si se desea discriminar entre créditos que se devuelven o que presentan Regresión Logística Introducción El problema de clasificación en dos grupos puede abordarse introduciendo una variable ficticia binaria para representar la pertenencia de una observación a uno de los dos

Más detalles

PROGRAMA DE ESTADÍSTICA DESCRIPTIVA

PROGRAMA DE ESTADÍSTICA DESCRIPTIVA PROGRAMA DE ESTADÍSTICA DESCRIPTIVA CONCEPTOS BÁSICOS DE ESTADÍSTICA Definición de Estadística Origen del concepto. Evolución histórica de la Estadística Estadística Descriptiva y Estadística Inferencial

Más detalles

TEMA V ANÁLISIS DE REGRESIÓN LOGÍSTICA

TEMA V ANÁLISIS DE REGRESIÓN LOGÍSTICA TEMA V ANÁLISIS DE REGRESIÓN LOGÍSTICA LECTURA OBLIGATORIA Regresión Logística. En Rial, A. y Varela, J. (2008). Estadística Práctica para la Investigación en Ciencias de la Salud. Coruña: Netbiblo. Páginas

Más detalles

Séptima Entrega. New Workfile Daily (5 days week) 1:1:1991 a 2:16:1998. File Import Read Text Lotus Excel

Séptima Entrega. New Workfile Daily (5 days week) 1:1:1991 a 2:16:1998. File Import Read Text Lotus Excel Prácticas de la asignatura Series Temporales Séptima Entrega 1 Modelos de heterocedasticidad condicional A partir de la decada de los 80, muchos investigadores se han dedicado al estudio de modelos no

Más detalles

EL PRINCIPIO DE MÁXIMA VEROSIMILITUD (LIKELIHOOD)

EL PRINCIPIO DE MÁXIMA VEROSIMILITUD (LIKELIHOOD) EL PRINCIPIO DE MÁXIMA VEROSIMILITUD (LIKELIHOOD) Fortino Vela Peón fvela@correo.xoc.uam.mx FVela-0 Objetivo Introducir las ideas básicas del principio de máxima verosimilitud. Problema Considere el experimento

Más detalles

Bachillerato Internacional. Matemáticas Nivel Medio. Programa para el curso 1º ( )

Bachillerato Internacional. Matemáticas Nivel Medio. Programa para el curso 1º ( ) 1 Bachillerato Internacional. Matemáticas Nivel Medio. Programa para el curso 1º (2015-2016) Tema 1: NÚMEROS REALES Conjuntos numéricos. Números naturales. Números enteros. Números racionales. Números

Más detalles

Análisis de Regresión

Análisis de Regresión Análisis de Regresión Diplomado en Lean Six Sigma Objetivo 1.Identificar problemas que incluyan una Y continua y una X continua 2. Entender la diferencia entre regresión lineal y no lineal 3. Ajustar modelos

Más detalles

Coeficiente de Correlación

Coeficiente de Correlación Coeficiente de Correlación Al efectuar un análisis de regresión simple (de dos variables) necesitamos hacer las siguientes suposiciones. Que las dos variables son mensurables Que la relación entre las

Más detalles

CURSO: ANALISIS ESTADISTICO DE RIESGOS

CURSO: ANALISIS ESTADISTICO DE RIESGOS MANAGEMENT CONSULTORES CURSO: ANALISIS ESTADISTICO DE RIESGOS Cnel. R.L. Falcón 1435 C1406GNC 35 Buenos Aires, Argentina Tel.: 054-11-15-5468-3369 Fax: 054-11-4433-4202 Mail: acaminos@mgmconsultores.com.ar

Más detalles

Modelos lineales generalizados

Modelos lineales generalizados GoBack Modelos lineales Guillermo Ayala Gallego Universidad de Valencia 20 de enero de 2009 1 / 57 Verosimilitud de Ajuste de un GLM mediante Fisher Scoring Method s de un modelo lineal generalizado Identifica

Más detalles

Modelos para variables categóricas

Modelos para variables categóricas Gabriel V. Montes-Rojas Modelo logit multinomial Supongamos que la variable dependiente toma muchos valores, ej. y = 0, 1, 2..., J, aunque los valores de y no representan ningún orden en particular. Éste

Más detalles

Repaso Estadística Descriptiva

Repaso Estadística Descriptiva Grado en Fisioterapia, 2010/11 Cátedra de Bioestadística Universidad de Extremadura 13 de octubre de 2010 Índice Descriptiva de una variable 1 Descriptiva de una variable 2 Índice Descriptiva de una variable

Más detalles

Taller Metodológico: CONCEPTOS Y FUNDAMENTOS BÁSICOS EN ANÁLISIS ESTADÍSTICO DESCRIPTIVO. Juan León Jara Almonte GRADE

Taller Metodológico: CONCEPTOS Y FUNDAMENTOS BÁSICOS EN ANÁLISIS ESTADÍSTICO DESCRIPTIVO. Juan León Jara Almonte GRADE Taller Metodológico: CONCEPTOS Y FUNDAMENTOS BÁSICOS EN ANÁLISIS ESTADÍSTICO DESCRIPTIVO Juan León Jara Almonte GRADE Por qué hacer análisis descriptivo? Qué hacer con estos datos? ESTADISTICA DESCRIPTIVA

Más detalles

478 Índice alfabético

478 Índice alfabético Índice alfabético Símbolos A, suceso contrario de A, 187 A B, diferencia de los sucesos A y B, 188 A/B, suceso A condicionado por el suceso B, 194 A B, intersección de los sucesos A y B, 188 A B, unión

Más detalles

TODO ECONOMETRIA. Bondad del ajuste Contraste de hipótesis

TODO ECONOMETRIA. Bondad del ajuste Contraste de hipótesis TODO ECONOMETRIA Bondad del ajuste Contraste de hipótesis Índice Bondad del ajuste: Coeficiente de determinación, R R ajustado Contraste de hipótesis Contrastes de hipótesis de significación individual:

Más detalles