MODELOS GENERALIZADOS LINEALES CON R
|
|
- María Dolores Espinoza Rivas
- hace 6 años
- Vistas:
Transcripción
1 Luis M. Carrascal ( Depto. Biogeografía y Cambio Global Museo Nacional de Ciencias Naturales, CSIC Cómo realizarlos, buena praxis e interpretación de los resultados curso de la Sociedad de Amigos del Museo Nacional de Ciencias Naturales impartido en Febrero de
2 El predictor lineal incluye la suma lineal de los efectos de una o más variables explicativas (x j ). j representan los parámetros desconocidos que es necesario estimar. Estos valores son llevados a una nueva escala mediante una transformación adecuada. Esto es, i no representa a y i, sino a una transformación de los valores y mediante la función de vínculo. 2
3 La transformación utilizada viene definida por la función de vínculo. La función de vínculo relaciona la media de los valores y ( ) conel predictor lineal mediante: = g( ) Para volver a la escala original de medida (y), el valor ajustado es la función inversa de la transformación que define la función de vínculo. Para determinar el ajuste de un modelo, * el procedimiento evalúa el predictor lineal para cada valor de la variable dependiente (y), * y luego compara este valor predicho con la transformación de y 3
4 Mediante el uso de diferentes funciones de vínculo, podemos valorar la adecuación de nuestro modelo a los datos. Para ello utilizaremos el concepto y parámetro devianza. El modelo más apropiado será aquel que minimice la devianza residual. En los modelos Generales Lineales operamos con variables dependientes normales, y los modelos proporcionan residuos que siguen la distribución normal. Sin embargo, numerosos datos no presentan errores normales. * por sesgo y kurtosis * están acotados (caso de proporciones) * son conteos que no pueden manifestar valores negativos 4
5 Podemos distinguir las siguientes familias principales de errores: * errores Normales * errores Poisson (conteos de fenómenos raros) * errores Binomiales negativos (Poisson con mayor dispersión) * errores Binomiales (datos que miden respuestas si/no o proporciones) * errores Gamma (datos que muestran un CV constante) * errores Exponenciales (datos de supervivencia) Para estos errores se han definido las funciones de vínculo más adecuadas (por defecto; canónicas): ERRORES FUNCIÓN * Normales Identidad * Poisson, Binomiales negativos Log * Binomial Logit * Gamma Recíproca 5
6 CREACIÓN DEL MODELO GENERALIZADO (POISSON REGRESSION) En los modelos de regresión lineal clásicos (Gausianos): * definimos una función predictora g(x) = α+β 1 X β p X p * establecemos la relación lineal con la respuesta Y = g(x) + ε para p predictores siendo ε la variación residual En los modelos generalizados de Poisson: * establecemos el valor esperado de la respuesta Y por su parámetro media (μ) * que establece una relación logarítmica con la función predictora g(x) log(μ) = g(x) + ε o μ = e g(x) + ε' μ = e α+β 1X β p X p * esta estructura es muy importante para la interpretación de los coeficientes de regresión. 6
7 Definición de los modelos atendiendo a la distribución de errores Según qué tipo de variable respuesta tengamos definiremos la familia y la función de vínculo. Usaremos el comando glm en vez de lm de los modelos generales lineales. modelo <- glm(eqt, data=datos, family=poisson(link="log")) family = quasipoisson(link="logit") modelo <- glm.nb(eqt, data=datos, link=log) modelo <- glm(eqt, data=datos, family=binomial(link="logit")) family = quasibinomial(link="logit") family = binomial(link="cloglog") cloglog trabaja mejor con distribuciones extremadamente sesgadas 7
8 Interpretación de los resultados Primero valoramos la significación global del modelo, en lo que se conoce como un omnibus test. SI EL RESULTADO ES SIGNIFICATIVO, PODREMOS SEGUIR CON LOS RESULTADOS. Si no resulta significativo el análisis se terminó! Si en los modelos GzLM usados con poisson y binomial aplicamos la corrección por sobredispersión, el resultado de este omnibus test cambia. 8
9 A continuación valoramos las medidas de bondad de ajuste, basadas en devianza y valores de AIC. El coeficiente de sobredispersión es el valor Value/df. No lo utilizaremos si nuestra distribución canónica de la respuesta es la normal. En modelos con poisson y binomial debería dar un valor próximo a "uno" (1).Sies>1 hay sobredispersión;sies<1 se dice que hay sobreparametrización o infradispersión. Se aconseja corregir este desvío si Value/df >1, y no cuando es <1. en un modelo Gausiano nunca se corrige por sobredispersión, porque ésta ya se ha estimado en la definición de la gausiana a través del parámetro desviación típica (sd) que la describe. 9
10 VARIABILIDAD EXPLICADA POR EL MODELO (usando devianzas) La devianza es igual a la suma de los cuadrados de los residuos de devianza proporción de devianza explicada = (devianza residual nula devianza residual del modelo) (devianza residual nula) Para conocer la proporción de la variación en la variable respuesta que es explicada por el modelo (equivalente a una R 2 de un modelo General Lineal) tendremos que: 1) construir un nuevo modelo "nulo" sin predictoras (con sólo el intercepto). 2) obtener la Devianza de ese modelo nulo en su tabla de Goodness of Fit (Do) 3) calcular la siguiente expresión que denominaremos D 2 : D 2 =(Do Dmodelo)/Do Modelo nulo Nuestro modelo de interés D 2 =( )/ = = 21.6% 10
11 Por último, observamos los parámetros de las variables predictoras: coeficientes (B), errores estándard y significaciones (con las aproximaciones de Wald y de cocientes Likelihood). 11
12 INTERPRETACIÓN DE LOS COEFICIENTES DE REGRESIÓN Los modelos de regresión de Poisson son multiplicativos porque la función de vínculo es el logaritmo: familia = poisson vínculo = log En la regresión de Poisson log (Y) = a + b X o Y = exp(a + b X) log(y) cambia linealmente en función de las variables predictoras Y cambia linealmente en función del antilogaritmo de la función de las predictoras El coeficiente b en antilogaritmo, exp(b), mide el cambio en esa variable predictora que implica el cambio en una unidad en la variable respuesta Y. O dicho de otro modo, el coeficiente b es el cambio esperado en el log(y) cuando la variable predictora aumenta una unidad. En el caso de las predictoras categóricas (definidas por nº categorías del factor 1) el antilogaritmo del coeficiente, exp(b), es el término multiplicativo relativo a la "base" del factor. El antilogaritmo del intercepto, exp(a),esel valor basal en relación con el cual se estiman los cambios definidos por los coeficientes. 12
13 ejemplo con factores factor edu de 4 niveles factor res de 4 niveles 13
14 SOBREDISPERSIÓN DEL MODELO Medida para estimar la bondad de ajuste del modelo (ϕ). Mide la existencia de una mayor (o menor) variabilidad que la esperable en la variable respuesta considerando los supuestos acerca de su distribución canónica y la función de vínculo (que liga los valores transformados de la variable a las predicciones del modelo) ϕ debería valer 1. Si >1 sobredispersión se "inflan" las significaciones Si <1 infradispersión asociado a la sobreparametrización SOBREDISPERSIÓN!!! las estimas de significación están "infladas" Con estos valores (ϕ) recalculamos nuevas estimas de significación a través de la F. F = diferencias en Devianza / (dif. en g.l. x ϕ) aparecerán en los resultados en: Test of Model Effects 14
15 Diseños factoriales utilizando una Poisson Veámoslo prácticamente en R utilizando la distribución de Poisson. ## para importar datos de internet y ponerlos en uso ## abro una conexión con internet meconecto <- url(" ## cargo el archivo de la conexión load(meconecto) ## cierro la conexión y borro el objeto "meconecto" close(meconecto); rm(meconecto) ## con la siguiente línea de código veo las variables names(datos) ## creamos una función de asociaciones que llamo "eqt" eqt <- as.formula(abundancia ~ covariante + insolacion*tratamiento) 15
16 Diseños factoriales utilizando una Poisson Veámoslo prácticamente en R utilizando la distribución de Poisson. ## CARGAMOS PAQUETES ## library(lmtest) library(mass) library(car) library(mumin) library(phia) library(sandwich) library(robustbase) library(psych) library(fit.models) 16
17 Diseños factoriales utilizando una Poisson Veámoslo prácticamente en R utilizando la distribución de Poisson. ## establecemos los tipos de contrastes para las variables ## predictoras nominales (factores) ## antes cargamos la siguiente línea de código para obtener los ## mismos resultados que en STATISTICA o SPSS utilizando type III SS ## "factor" para los factores no ordenados ## "ordered" para factores con niveles ordenados ## options(contrasts=c(factor="contr.sum", ordered="contr.poly")) ## ahora creamos nuestro modelo tipo ANCOVA Generalizado Lineal modelo <- glm(eqt, data=datos, family=poisson(link="log")) ## los valores de la Devianza nula (modelo nulo: "respuesta ~ 1") ## y Devianza residual del modelo se encuentran en el modelo ## como modelo$null.deviance y modelo$deviance ## con ellos calculamos lo que explica el modelo: d2 <- round(100*(modelo$null.deviance-modelo$deviance)/modelo$null.deviance, 2) print(c("d2 de McFadden (%) =",d2), quote=false) [1] D2 de McFadden (%) =
18 Diseños factoriales utilizando una Poisson Veámoslo prácticamente en R utilizando la distribución de Poisson. ## estima de significación global del modelo de interés ## comparándolo con el modelo nulo ## sólo procederemos valorando los resultados de este modelo, ## SÍ Y SÓLO SÍ, este "omnibus test" ha sido significativo ## podemos utilizar estos dos test con resultados similares ## likelihood ratio test lrtest(modelo) Likelihood ratio test Model 1: abundancia ~ covariante + insolacion * tratamiento Model 2: abundancia ~ 1 #Df LogLik Df Chisq Pr(>Chisq) < 2.2e-16 *** --- Signif. codes: 0 *** ** 0.01 *
19 Diseños factoriales utilizando una Poisson Veámoslo prácticamente en R utilizando la distribución de Poisson. ## test de Wald waldtest(modelo) Wald test Model 1: abundancia ~ covariante + insolacion * tratamiento Model 2: abundancia ~ 1 Res.Df Df F Pr(>F) < 2.2e-16 *** --- Signif. codes: 0 *** ** 0.01 *
20 Diseños factoriales utilizando una Poisson Veámoslo prácticamente en R utilizando la distribución de Poisson. ## valores AICc del modelo de interés y el modelo nulo modelo.nulo <- glm(modelo$model[,1]~1, family=poisson(link="log")) AICc(modelo, modelo.nulo) veces.mejor <- exp(-0.5*(aicc(modelo)-aicc(modelo.nulo))) print(c("veces que MI MODELO es mejor que el modelo NULO =", veces.mejor), quote=false) df AICc modelo modelo.nulo [1] Veces que MI MODELO es mejor que el modelo NULO = e+48 Este resultado es consistente con el anterior, pero en coordenadas de teoría de la información. El modelo de interés de 6*10 48 veces mejor que el modelo nulo. Estos dos tests nos proporcionan que nuestro modelo es altamente significativo, con lo cual podemos continuar valorando sus resultados. Pero antes tenemos que comprobar si hemos cumplido los supuestos canónicos de los modelos a través de la exploración de sus residuos. 20
21 Diseños factoriales utilizando una Poisson Veámoslo prácticamente en R utilizando la distribución de Poisson. ## exploración de los residuos del modelo ## vemos unos gráficos generales que ya nos dan muchas pistas: ## normalidad, usando los residuos de devianza ## ( no en la escala original de la respuesta!!) ## homocedasticidad de los residuos a través de las predicciones ## del modelo (aplicando la transformación de la link function) ## existencia de datos influyentes y perdidos ## con la distancia de Cook y Leverage ## en una sola figura con cuatro paneles par(mfcol=c(1,1)) ## fija un sólo panel gráfico par(mfcol=c(2,2)) ## fija cuatro paneles con 2 columnas y 2 filas plot(modelo, c(1:2,4,6)) par(mfcol=c(1,2)) par(mfcol=c(1,1)) ## volvemos al modo gráfico de un solo panel 21
22 Diseños factoriales utilizando una Poisson homocedasticidad normalidad puntos influyentes y perdidos 22
23 Diseños factoriales utilizando una Poisson Veámoslo prácticamente en R utilizando la distribución de Poisson. ## test de Shapiro-Wilk de la normalidad de los residuos de devianza shapiro.test(residuals(modelo, type="deviance")) Shapiro-Wilk normality test data: residuals(modelo, type = "deviance") W = 0.976, p-value = ## el desvío de la normalidad no es muy grave ## hemos identificado que hay una leve violación de homocedasticidad ## y existen algunas observaciones con elevada distancia de Cook ## puntos influyentes y perdidos con dffits ## dffits con sus límites "críticos" ## niveles críticos 2*raiz((g.l. del modelo)/(número de datos)) plot(dffits(modelo)) abline(h=2*((length(modelo$residuals)-modelo$df.residual-1)/length(modelo$residuals))^0.5, col="red") abline(h=-2*((length(modelo$residuals)-modelo$df.residual-1)/length(modelo$residuals))^0.5, col="red") identify(dffits(modelo)) ## terminad dando clik en Finish del panel Plots 23
24 Diseños factoriales utilizando una Poisson 24
25 Diseños factoriales utilizando una Poisson Veámoslo prácticamente en R utilizando la distribución de Poisson. ## INDEPENDENCIA ENTRE LAS PREDICTORAS: VIF = 1 / (1 - R 2 ), ## de cada predictora por las restantes ## GVIF or VIF specifically indicate the magnitude of the inflation in the standard errors ## associated with a particular beta weight that is due to multicollinearity ## la raiz cuadrada de un valor VIF o GVIF es el número de veces que ## se inflan los errores standard de esa predictora ## vif(modelo) sqrt(vif(modelo)) > vif(modelo) covariante insolacion tratamiento insolacion:tratamiento > sqrt(vif(modelo)) covariante insolacion tratamiento insolacion:tratamiento
26 Diseños factoriales utilizando una Poisson Veámoslo prácticamente en R utilizando la distribución de Poisson. ## estima de la sobredispersión del modelo ## este valor canónico debería de ser igual a la unidad ## phi <- sum((residuals(modelo, type="pearson"))^2)/modelo$df.residual print(c("pearson overdispersion =", round(phi, 3)), quote=false) [1] Pearson overdispersion = Si este valor hubiese sido muy diferente de uno (e.g., > 2) recalcularíamos el modelo teniendo en cuenta ese valor de sobredispersión, aplicando la pseudofamilia quasipoisson. No corregiremos por sobredispersión si phi <1 modelo2 <- glm(eqt, data=datos, family=quasipoisson(link="log")) Y procederíamos con este nuevo modelo. 26
27 Diseños factoriales utilizando una Poisson Veámoslo prácticamente en R utilizando la distribución de Poisson. ## representación de los valores observados y predichos en la respuesta ## usando la escala original de medida (habiendo destransformado los datos ## desde la transformación incluida en la link function) plot(modelo$y~fitted(modelo), ylab="respuesta original") abline(lm(modelo$y~fitted(modelo)), col="red", lwd=2) 27
28 Diseños factoriales utilizando una Poisson Veámoslo prácticamente en R utilizando la distribución de Poisson. ## resultados del modelo y SIGNIFICACIONES de efectos parciales summary(modelo) Call: glm(formula = eqt, family = poisson(link = "log"), data = datos) Deviance Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error z value Pr(> z ) (Intercept) ** covariante e-05 *** insolacion e-12 *** tratamiento e-08 *** insolacion1:tratamiento Signif. codes: 0 *** ** 0.01 * (Dispersion parameter for poisson family taken to be 1) Null deviance: on 111 degrees of freedom Residual deviance: on 107 degrees of freedom AIC: Number of Fisher Scoring iterations: 5 28
29 Diseños factoriales utilizando una Poisson Veámoslo prácticamente en R utilizando la distribución de Poisson. ## estimas parciales, al estilo SS type-iii ## esto nos proporciona la significación de los efectos ## la Deviance nos vincula a las magnitudes de los efectos ## <none> indica la devianza residual sin quitar efectos ## los otros valores indican la devianza quitando ese efecto ## a más valor más magnitud del efecto ## dropterm(modelo, ~., test="chisq", sorted=false) Single term deletions Model: abundancia ~ covariante + insolacion * tratamiento Df Deviance AIC LRT Pr(Chi) <none> covariante e-05 *** insolacion < 2.2e-16 *** tratamiento e-10 *** insolacion:tratamiento Signif. codes: 0 *** ** 0.01 *
30 Diseños factoriales utilizando una Poisson Veámoslo prácticamente en R utilizando la distribución de Poisson. ## estimas parciales, al estilo SS type-iii ## esto nos proporciona la significación de los efectos ## ## otra manera con Likelihood Ratio test ## Anova(modelo, type=3, test="lr") Analysis of Deviance Table (Type III tests) Response: abundancia LR Chisq Df Pr(>Chisq) covariante e-05 *** insolacion < 2.2e-16 *** tratamiento e-10 *** insolacion:tratamiento Signif. codes: 0 *** ** 0.01 *
31 Diseños factoriales utilizando una Poisson Veámoslo prácticamente en R utilizando la distribución de Poisson. ## Vemos los valores medios de la respuesta (en su escala original) ## ojo!! los valores son los ajustados si tuviésemos covariantes ## se dan los errores estándard plot(interactionmeans(modelo), legend.margin=0.3) 31
32 Diseños factoriales utilizando una Poisson Veámoslo prácticamente en R utilizando la distribución de Poisson. ## EXAMEN DEL EFECTO DE LA VIOLACIÓN DEL SUPUESTO DE HOMOCEDASTICIDAD ## Recálculo de significaciones; realmente sin mucho interés porque ## se refiere a los coeficientes y no al efecto global de cada factor ## método Sandwich (que es type="hc0"): sólo para el cálculo de ## nuevos errores standard y las significaciones asociadas ## no cambian las estimas de los coeficientes ## coeftest(modelo, vcov=sandwich) z test of coefficients: Estimate Std. Error z value Pr(> z ) (Intercept) ** covariante *** insolacion e-13 *** tratamiento e-08 *** insolacion1:tratamiento Signif. codes: 0 *** ** 0.01 *
33 Diseños factoriales utilizando una Poisson Veámoslo prácticamente en R utilizando la distribución de Poisson. ## afrontemos ahora el efecto de puntos influyentes y/o perdidos ## RECÁLCULO DEL MODELO QUITANDO ALGUNOS PUNTOS ## mejor no hacemos esto modelo.sin_outliers <- glm(eqt, data=datos[c(-6, -33, -54, -55, -56),]), family=poisson(link="log")) ## ESTIMACIONES ROBUSTAS ## sin quitar datos del modelo; aproximación robusta más seria, ## que estima nuevos coeficientes y errores standard ## Mqle es el método Mallows-Hubber quasi-liquelihood. modelo.robusto <- glmrob(eqt, data=datos, family=poisson(link="log"), weights.on.x="hat", method="mqle", control=glmrobmqle.control(tcc=1.2, maxit=100)) ## summary(modelo.robusto) par(mfcol=c(1,1)) ## robustez de los datos individuales plot(modelo.robusto$w.r, ylab="robustez de las observaciones") identify(modelo.robusto$w.r) plot(modelo.robusto$w.x, leverage(modelo), xlab="peso de las observaciones") 33
34 Diseños factoriales utilizando una Poisson Veámoslo prácticamente en R utilizando la distribución de Poisson. > summary(modelo.robusto) Call: glmrob(formula = eqt, family = poisson(link = "log"), data = datos, method = "Mqle", weights.on.x = "hat", control = glmrobmqle.control(tcc = 1.2, maxit = 100)) Coefficients: Estimate Std. Error z value Pr(> z ) (Intercept) ** covariante e-05 *** insolacion e-10 *** tratamiento e-07 *** insolacion1:tratamiento Signif. codes: 0 *** ** 0.01 * Robustness weights w.r * w.x: Min. 1st Qu. Median Mean 3rd Qu. Max Number of observations: 112 Fitted by method Mqle (in 5 iterations) (Dispersion parameter for poisson family taken to be 1) 34
35 Diseños factoriales utilizando una Poisson 35
36 Diseños factoriales utilizando una Poisson 36
37 Diseños factoriales utilizando una Binomial Negativa Repetiremos todos los pasos previos, sólo que en esta ocasión nuestro modelos será: modelo <- glm.nb(eqt, data=datos, link=log) > summary(modelo) Call: glm.nb(formula = eqt, data = datos, link = log, init.theta = ) Deviance Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error z value Pr(> z ) (Intercept) * covariante *** insolacion e-11 *** tratamiento e-07 *** insolacion1:tratamiento Signif. codes: 0 *** ** 0.01 * (Dispersion parameter for Negative Binomial( ) family taken to be 1) Null deviance: on 111 degrees of freedom Residual deviance: on 107 degrees of freedom AIC: Number of Fisher Scoring iterations: 1 Theta: En esta ocasión el modelo estima un parámetro más Theta Std. Err.: 7.52 que mide la sobredispersión de un modelo Binomial Negativo este parámetro se relaciona con el "size" de la distribución NegBin 2 x log-likelihood: no deberíamos corregir por sobredispersión 37
38 Diseños factoriales utilizando una Binomial Repetiremos todos los pasos previos, sólo que en esta ocasión nuestro modelos será: modelo <- glm(eqt, data=datos, family=binomial(link="logit")) Si hay sobredispersión utilizaremos la pseudofamilia: family=quasibinomial(link="logit") Si no hay buenos ajustes o alta sobredispersión utilizaremos la función de vínculo: family = binomial(link ="cloglog") cloglog trabaja mejor con distribuciones extremadamente sesgadas por ejemplo: porporciones de un estado <0.1 o >0.9 38
39 Diseños factoriales utilizando una Binomial Si nuestra variable respuesta no es una binomial con estados [0 1] ó[si NO] entonces podremos construir un modelo definiendo esa variable respuesta "frecuencia". Hay dos modos: la respuesta es un valor "proporción" (acotado entre cero y uno) la respuesta es un valor combinado de dos vectores: valores SI, valores NO Para proporciones, tenemos que definir el denominador que genera la frecuencia en weights modelo <- glm(eqt, data=datos, family=binomial(link="logit"), weights=denominador) Para respuestas combinadas, tenemos que definir los dos vectores conteo SI, conteo NO en una nueva variable respuesta con el comando cbind cbind(valoressi, valoresno) ## ejemplo con los datos de trabajo eqt <- as.formula(cbind(presen8, ausen8) ~ covariante + insolacion * tratamiento) modelo <- glm(eqt, data=datos, family=binomial(link="logit") 39
40 MODELOS GENERALIZADOS USANDO UNA BINOMIAL Nuestro modelo ahora tendrá la forma: p: proporción de un "estado" respecto a toda la muestra (80 "ceros" y 20 "unos", N=100: p = 20/100 = 0.20) X: k variables predictoras logit ( p ) = log [ p / (1 p) ] = β 0 + β 1 X 1 + β 2 X 2 + β 3 X β k X k p / (1 p) = exp ( β 0 + β 1 X 1 + β 2 X 2 + β 3 X β k X k ) exp: antilogaritmo p = [ exp ( β 0 + β 1 X 1 + β 2 X 2 + β 3 X β k X k ) ] 1 + [ exp ( β 0 + β 1 X 1 + β 2 X 2 + β 3 X β k X k ) ] El modelo Generalizado Lineal Logit predice valores de probabilidad continua (p): entre 0 y 1. 40
41 RESIDUOS DE MODELOS GENERALIZADOS BINOMIALES La exploración de los residuos en esta ocasión es un tanto diferente, debido al estado binomial de la respuesta con dos valores discretos (e.g., 0 1, sí no). Con la "normalidad de los residuos" de devianza, en el mejor de los casos, tendríamos algo parecido a lo siguiente (con antisimetría en los dos lados del "bigote"): menor densidad de puntos mayor densidad de puntos cuanto más explique el modelo más cerca estarán los dos extremos 41
42 RESIDUOS DE MODELOS GENERALIZADOS BINOMIALES En el caso de la relación entre los residuos de devianza y las predicciones del modelo (predictor lineal al que se le aplica la transformación logit), esperaríamos encontrar algo como esto: menor densidad de puntos cuanto más explique el modelo más cerca estarán los dos extremos mayor densidad de puntos menor densidad de puntos 42
43 DIAGRAMAS ROC EN MODELOS GENERALIZADOS BINOMIALES El Modelo Generalizado Binomial produce probabilidades de ocurrencia p de uno de los estados de la variable respuesta (e.g., el valor 1 en 0 1, o sí en sí no). Estos valores de p, continuos entre 0 y 1, hay que convertirlos a "estados" 0 o 1, utilizando umbrales de corte. Estos valores umbrales nos permitirán convertir "probabilidades" en "estados". por ejemplo, si el umbral es p=0.5 si p<0.5 entonces es "cero" si p>0.5 entonces es "uno" Podemos utilizar como umbral de corte (cut off point) la proporción real observada. No obstante, en muchas ocasiones este es un valor incierto, y es conveniente preguntarse: cómo de bueno es nuestro modelo "clasificando las observaciones" independientemente de los valores umbral de corte? Para ello podemos contar con los diagramas ROC (Receiver operating characteristic): (excelente página) 43
44 DIAGRAMAS ROC EN MODELOS GENERALIZADOS BINOMIALES El área en el cuadrado morado suma "uno". De esa área, cuánto ocupa la superficie bajo la curva azul? (la proporción es el valor AUC) AUC 44
MODELOS GENERALIZADOS LINEALES CON SPSS
MODELOS GENERALIZADOS LINEALES CON SPSS Luis M. Carrascal (www.lmcarrascal.eu) Depto. Biogeografía y Cambio Global Museo Nacional de Ciencias Naturales, CSIC Cómo realizarlos, buena praxis e interpretación
Más detallesDatos binomiales 1.70 1.75 1.80 1.85. beetles$dosis
Datos binomiales Modelos de dosis-respuesta Carga de datos y calculo de proporciones: beetles
Más detallesRegresión lineal. Marcelo Rodríguez Ingeniero Estadístico - Magíster en Estadística
Regresión lineal Marcelo Rodríguez Ingeniero Estadístico - Magíster en Estadística Universidad Católica del Maule Facultad de Ciencias Básicas Pedagogía en Matemática Estadística I 01 de enero de 2012
Más detallesPráctica 3: Regresión simple con R
Estadística II Curso 2010/2011 Licenciatura en Matemáticas Práctica 3: Regresión simple con R 1. El fichero de datos Vamos a trabajar con el fichero salinity que se encuentra en el paquete boot. Para cargar
Más detallesEstadística II Tema 4. Regresión lineal simple. Curso 2009/10
Estadística II Tema 4. Regresión lineal simple Curso 009/10 Tema 4. Regresión lineal simple Contenidos El objeto del análisis de regresión La especificación de un modelo de regresión lineal simple Estimadores
Más detallesAnálisis de datos Categóricos
Introducción a los Modelos Lineales Generalizados Universidad Nacional Agraria La Molina 2016-1 Introducción Modelos Lineales Generalizados Introducción Componentes Estimación En los capítulos anteriores
Más detallesUniversidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia
Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia Estudio de Caso: Estudio Morfología Coeficiente de Correlación Considere el archivo Estudio Morfología.sav.
Más detallesRegresión Lineal. 15 de noviembre de Felipe Bravo Márquez
Felipe José Bravo Márquez 15 de noviembre de 2013 Introducción Un modelo de regresión se usa para modelar la relación de una variable dependiente y numérica con n variables independientes x 1, x 2,...,
Más detallesCorrelación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r)
Correlación El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r) El coeficiente de correlación lineal de Pearson (r) permite medir el grado de asociación entre
Más detallesTEMA 5. Modelos para Datos de Conteo
TEMA 5. Modelos para Datos de Conteo Profesor: Pedro Albarrán Pérez Universidad de Alicante. Curso 2010/2011. Contenido 1 Datos de Conteo 2 Regresión de Poisson 3 Extensiones Datos de Conteo Variable de
Más detallesCurs de Modelització Estadística Bàsica amb Deducer. Anabel Blasco Ana Vázquez Anna Espinal Llorenç Badiella Oliver Valero
Curs de Modelització Estadística Bàsica amb Deducer Anabel Blasco Ana Vázquez Anna Espinal Llorenç Badiella Oliver Valero 1. Model de Regressió Lineal 2. Model ANOVA 3. Model Lineal General 4. Model de
Más detalles> y <- c(19, 57, 29, 63, 29, 49, 27, 53, 23, 47, 33, 66, 47, 55, 23, 50, + 24, 37, 42, 68, 43, 52, 30, 42) > ly <- length( y )
Preferencia por un nuevo Detergente: Para un estudio de mercado sobre las preferencias entre un nuevo detergente Xx y uno standard Mm se consideró una muestra de 1008 consumidores, a los que se preguntó
Más detallesTeoría de la decisión
1.- Un problema estadístico típico es reflejar la relación entre dos variables, a partir de una serie de Observaciones: Por ejemplo: * peso adulto altura / peso adulto k*altura * relación de la circunferencia
Más detallesEstas dos clases. ANOVA I - Conceptos generales - Supuestos - ANOVA de una vía - Transformación de datos - Test a Posteriori - ANOVA de dos vías
ANOVA I 19-8-2014 Estas dos clases ANOVA I - Conceptos generales - Supuestos - ANOVA de una vía - Transformación de datos - Test a Posteriori - ANOVA de dos vías ANOVA II - ANOVA factorial - ANCOVA (análisis
Más detallesTercera práctica de REGRESIÓN.
Tercera práctica de REGRESIÓN. DATOS: fichero practica regresión 3.sf3 1. Objetivo: El objetivo de esta práctica es aplicar el modelo de regresión con más de una variable explicativa. Es decir regresión
Más detalles3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS
1. INTRODUCCIÓN Este tema se centra en el estudio conjunto de dos variables. Dos variables cualitativas - Tabla de datos - Tabla de contingencia - Diagrama de barras - Tabla de diferencias entre frecuencias
Más detallesREGRESIÓN LINEAL SIMPLE
REGRESIÓN LINEAL SIMPLE 1. El problema de la regresión lineal simple. Método de mínimos cuadrados 3. Coeficiente de regresión 4. Coeficiente de correlación lineal 5. El contraste de regresión 6. Inferencias
Más detallesModelos de suavizado, aditivos y mixtos
Carmen Armero 13 de junio de 11 Libreria mgcv Libreria mgcv mgcv es una librería de R diseñada para trabajar con modelos aditivos generalizados, incluyendo modelos mixtos aditivos generalizados, GAMM.
Más detallesANOVA. Análisis de regresión y modelo lineal
. Análisis de regresión y modelo lineal [0011] DEFAD. Métodos de contraste de hipótesis y diseño de experimentos 2014 15. Análisis de regresión y modelo lineal 1 Comparaciones múltiples 2 3. Análisis de
Más detallesINTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 7)
TEMA Nº 7 DISTRIBUCIONES CONTINUAS DE PROBABILIDAD OBJETIVOS DE APRENDIZAJE: Conocer las características de la distribución normal como distribución de probabilidad de una variable y la aproximación de
Más detallesEconomía Aplicada. Modelos con variables dependiente binarias. Departamento de Economía Universidad Carlos III de Madrid
Economía Aplicada Modelos con variables dependiente binarias Departamento de Economía Universidad Carlos III de Madrid Ver Stock y Watson (capítulo 11) 1 / 28 Modelos con variables dependiente binarias:
Más detalles3 Ejemplos simples sobre regresión logística
3 Ejemplos mples sobre regreón logística 1. Ejemplo 1 (ejemplo1.dat) tabla 2x2 Una variable explicativa binaria (Solución) 2. Ejemplo 2 (ejemplo2.dat) Una variable independiente continua (Solución) 3.
Más detallesIntervalos de confianza con STATGRAPHICS
Intervalos de confianza con STATGRAPHICS Ficheros empleados: TiempoaccesoWeb.sf3 ; TiempoBucle.sf3; 1. Ejemplo 1: Tiempo de acceso a una página Web Se desean construir intervalos de confianza para la media
Más detalles2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...
Contenidos 1 Introducción al paquete estadístico S-PLUS 19 1.1 Introducción a S-PLUS............................ 21 1.1.1 Cómo entrar, salir y consultar la ayuda en S-PLUS........ 21 1.2 Conjuntos de datos..............................
Más detallesJulio Deride Silva. 4 de junio de 2010
Curvas ROC y Regresión Lineal Julio Deride Silva Área de Matemática Facultad de Ciencias Químicas y Farmcéuticas Universidad de Chile 4 de junio de 2010 Tabla de Contenidos Curvas ROC y Regresión Lineal
Más detallesMedia-Lab Prado. Modelos Lineales en para procesar encuestas de Satisfacción. Manuel Pérez Gómez 16/06/2016
Media-Lab Prado Modelos Lineales en para procesar encuestas de Satisfacción Manuel Pérez Gómez 16/06/2016 Análisis de los Sectores. TPV Caja Compras Almacén Grupos Informes TPV Caja Compras Almacén Grupos
Más detallesTEMA 4 Modelo de regresión múltiple
TEMA 4 Modelo de regresión múltiple José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Análisis de Datos - Grado en Biología Estructura de este tema Modelo de regresión múltiple.
Más detallesDepartamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.
TEMA 13 REGRESIÓN LOGÍSTICA Es un tipo de análisis de regresión en el que la variable dependiente no es continua, sino dicotómica, mientras que las variables independientes pueden ser cuantitativas o cualitativas.
Más detallesOdds = = e. UD1: El modelo de regresión logística 1. 1 e
RE2. Regresión logística binaria, multinomial, de Poisson y binomial negativa Curso 204/5 Solución resumida de la prueba de evaluación Unidad didáctica (D) La regresión logística puede utilizarse en cualquiera
Más detallesLa distribución de Poisson es de tipo exponencial con parámetro dispersión 1.
Reclaaciones y Edad (Pawitan). Una copañía aseguradora quiere conocer cóo depende el núero de reclaaciones de los clientes con cierta póliza, de su edad. El archivo reclaaciones.txt contiene los datos
Más detallesPRÁCTICA 3. REGRESIÓN LINEAL SIMPLE CON SPSS Ajuste de un modelo de regresión lineal simple Porcentaje de variabilidad explicado
PÁCTICA 3. EGESIÓN LINEAL SIMPLE CON SPSS 3.1. Gráfico de dispersión 3.2. Ajuste de un modelo de regresión lineal simple 3.3. Porcentaje de variabilidad explicado 3.4 Es adecuado este modelo para ajustar
Más detallesINDICE 1. Qué es la Estadística? 2.Descripción de Datos: Distribuciones de Frecuencia y Presentación Gráfica
INDICE 1. Qué es la Estadística? 1 Introducción 2 Qué significa estadística? 2 Por qué se estudia la estadística? 4 Tipos de estadística 5 Estadística descriptiva 5 Estadística inferencial 6 Tipos de variables
Más detallesSPSS Aplicación práctica: Base de datos del HATCO
Aplicación práctica: Base de datos del HATCO Datos: observaciones de variables obtenidos desde encuentas a clientes de un distribuidor industrial. Variables de interés en la aplicación: Percepciones de
Más detallesEjercicio Heterocedasticidad_2
Ejercicio heterocedasticidad 2. 1 Ejercicio Heterocedasticidad_2 Tengamos los siguientes datos de los beneficios (B i ) y ventas (V i ) de 20 empresas: obs B V 1 13,2 61 2 15 78 3 22,2 158 4 15,2 110 5
Más detallesRegresión lineal SIMPLE MÚLTIPLE N A Z IRA C A L L E J A
Regresión lineal REGRESIÓN LINEAL SIMPLE REGRESIÓN LINEAL MÚLTIPLE N A Z IRA C A L L E J A Qué es la regresión? El análisis de regresión: Se utiliza para examinar el efecto de diferentes variables (VIs
Más detallesLos modelos lineales (regresión, ANOVA, ANCOVA), se basan en los siguientes supuestos:
GLM-Introducción Los modelos lineales (regresión, ANOVA, ANCOVA), se basan en los siguientes supuestos: 1. Los errores se distribuyen normalmente. 2. La varianza es constante. 3. La variable dependiente
Más detallesUNIVERSIDAD DE ANTIOQUIA FACULTAD NACIONAL DE SALUD PÚBLICA Héctor Abad Gómez ldbello@saludpublica.udea.edu.co Facultad Nacional de Salud Pública Héctor Abad Gómez www.leondariobello.com www.ciemonline.info/moodle
Más detallesANALISIS DE REGRESIÓN Y CORRELACIÓN LINEAL
ANALISIS DE REGRESIÓN Y CORRELACIÓN LINEAL Msc. Lácides Baleta Octubre 16 Página 1 de 11 REGRESIÓN Y CORRELACIÓN LINEAL Son dos herramientas para investigar la dependencia de una variable dependiente Y
Más detalles15. Regresión lineal. Te recomiendo visitar su página de apuntes y vídeos:
15. Regresión lineal Este tema, prácticamente íntegro, está calacado de los excelentes apuntes y transparencias de Bioestadística del profesor F.J. Barón López de la Universidad de Málaga. Te recomiendo
Más detallesRegresión de Poisson
Regresión de Poisson -- Si la estructura de los errores es realmente de Poisson, entonces: devianza residual / grados de libertad residuales = 1 si el cociente es mayor que 1 estamos ante el fenómeno (incómodo)
Más detallesMétodo de cuadrados mínimos
REGRESIÓN LINEAL Gran parte del pronóstico estadístico del tiempo está basado en el procedimiento conocido como regresión lineal. Regresión lineal simple (RLS) Describe la relación lineal entre dos variables,
Más detallesCiencia UANL Universidad Autónoma de Nuevo León ISSN (Versión impresa): MÉXICO
Ciencia UANL Universidad Autónoma de Nuevo León rciencia@mail.uanl.mx ISSN (Versión impresa): 1405-9177 MÉXICO 2008 Peter B. Mandeville TEMA 16: LA RAZÓN DE MOMIOS 2. REGRESIÓN LOGÍSTICA Ciencia UANL,
Más detallesMODELO PARA EL TALLER DE REGRESION
MODELO PARA EL TALLER DE REGRESION PROBLEMA. Los datos siguientes muestran la matricula estudiantil en los primeros 5 anos de nuestra Universidad. Años (desde el 2000 al 2004) x 1 2 3 4 5 Matricula (miles
Más detallesUnidad IV: Distribuciones muestrales
Unidad IV: Distribuciones muestrales 4.1 Función de probabilidad En teoría de la probabilidad, una función de probabilidad (también denominada función de masa de probabilidad) es una función que asocia
Más detallesTema 3: Modelos lineales generalizados
Tema 3: Modelos lineales generalizados Componentes de un modelo generalizado lineal (GLM) Un modelo lineal generalizado tiene tres componentes básicos: Componente aleatoria: Identifica la variable respuesta
Más detallesINDICE 1. Introducción 2. Recopilación de Datos Caso de estudia A 3. Descripción y Resumen de Datos 4. Presentación de Datos
INDICE Prefacio VII 1. Introducción 1 1.1. Qué es la estadística moderna? 1 1.2. El crecimiento y desarrollo de la estadística moderna 1 1.3. Estudios enumerativos en comparación con estudios analíticos
Más detallesPronósticos, Series de Tiempo y Regresión. Capítulo 4: Regresión Lineal Múltiple
Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple Temas Modelo de regresión lineal múltiple Estimaciones de Mínimos Cuadrados Ordinarios (MCO); estimación puntual y predicción
Más detallesINTERPRETACIÓN DE LA REGRESIÓN. Interpretación de la regresión
INTERPRETACIÓN DE LA REGRESIÓN Este gráfico muestra el salario por hora de 570 individuos. 1 Interpretación de la regresión. regresión Salario-Estudios Source SS df MS Number of obs = 570 ---------+------------------------------
Más detallesINDICE Prefacio 1. Introducción 2. Distribuciones de frecuencia: tablas estadísticas y graficas
INDICE Prefacio XIII 1. Introducción 1.1. la imagen de la estadística 1 1.2. dos tipos de estadísticas 1.3. estadística descriptiva 2 1.4. estadística inferencial 1.5. naturaleza interdisciplinaria de
Más detallesEstadís6ca y Métodos Numéricos Tema 6. Modelos de Regresión
Estadís6ca y Métodos Numéricos Tema 6. Modelos de Regresión Ángel Barón Caldera Ángel Cobo Ortega María Dolores Frías Domínguez Jesús Fernández Fernández Francisco Javier González Or@z Carmen María Sordo
Más detallesProfesor: Hugo S. Salinas. Primer Semestre Tabla 1: Inteligencia y Rendimiento. X Y Figura 1: Inteligencia y Rendimiento.
UNIVERSIDAD DE ATACAMA FACULTAD DE CIENCIAS JURÍDICAS / CARRERA DE TRABAJO SOCIAL TECNOLOGÍA INFORMÁTICA I (SPSS) ESTADÍSTICA DESCRIPTIVA CON MÁS DE UNA VARIABLE Profesor: Hugo S. Salinas. Primer Semestre
Más detallesCurso: Economía Ambiental del Turismo. Aplicación del Método Costo de Viaje
Curso: Economía Ambiental del Turismo Aplicación del Método Costo de Viaje Estimación de Modelos Poisson para la estimación del Excedente del Consumidor a través del Método del Costo de Viaje: El caso
Más detallesRegresión múltiple. Demostraciones. Elisa Mª Molanes López
Regresión múltiple Demostraciones Elisa Mª Molanes López El modelo de regresión múltiple El modelo que se plantea en regresión múltiple es el siguiente: y i = β 0 + β 1 x 1i + β 2 x 2i +...+ β k x ki +
Más detallesTema 10: Introducción a los problemas de Asociación y Correlación
Tema 10: Introducción a los problemas de Asociación y Correlación Estadística 4 o Curso Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 10: Asociación y Correlación
Más detallesEstadís5ca. María Dolores Frías Domínguez Jesús Fernández Fernández Carmen María Sordo. Tema 2. Modelos de regresión
Estadís5ca Tema 2. Modelos de regresión María Dolores Frías Domínguez Jesús Fernández Fernández Carmen María Sordo Departamento de Matemá.ca Aplicada y Ciencias de la Computación Este tema se publica bajo
Más detallesTÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD
TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD Contrastes de hipótesis paramétricos para una y varias muestras: contrastes sobre la media, varianza y una proporción. Contrastes sobre la diferencia
Más detallesEXAMEN ECONOMETRÍA I GRUPO 53 - DADE 8 de septiembre de 2005 Prof. Rafael de Arce
EXAMEN ECONOMETRÍA I GRUPO 53 - DADE 8 de septiembre de 005 Prof. Rafael de Arce NOMBRE: DNI: PARTE I.- TEST 1. La hipótesis de rango pleno en el MBRL supone: Que las variables explicativas no tengan ninguna
Más detallesTema 3: Análisis de datos bivariantes
Tema 3: Análisis de datos bivariantes 1 Contenidos 3.1 Tablas de doble entrada. Datos bivariantes. Estructura de la tabla de doble entrada. Distribuciones de frecuencias marginales. Distribución conjunta
Más detallesRepaso de estadística básica. Juan D. Barón Santiago de Chile, 8 de abril de 2013
Repaso de estadística básica Juan D. Barón Santiago de Chile, 8 de abril de 2013 1 I. CONCEPTOS ESTADÍSTICOS BÁSICOS 2 Las decisiones se toman bajo incertidumbre Las decisiones se basan en información
Más detallesIntroducción a la regresión ordinal
Introducción a la regresión ordinal Jose Barrera jbarrera@mat.uab.cat 20 de mayo 2009 Jose Barrera (UAB) Introducción a la regresión ordinal 20 de mayo 2009 1 / 11 Introducción a la regresión ordinal 1
Más detallesESTADÍSTICA. Tema 4 Regresión lineal simple
ESTADÍSTICA Grado en CC. de la Alimentación Tema 4 Regresión lineal simple Estadística (Alimentación). Profesora: Amparo Baíllo Tema 4: Regresión lineal simple 1 Estructura de este tema Planteamiento del
Más detallesviii CAPÍTULO 2 Métodos de muestreo CAPÍTULO 3 Análisis exploratorio de datos
Contenido Acerca de los autores.............................. Prefacio.... xvii CAPÍTULO 1 Introducción... 1 Introducción.............................................. 1 1.1 Ideas de la estadística.........................................
Más detallesÍNDICE CAPÍTULO 1. INTRODUCCIÓN
ÍNDICE CAPÍTULO 1. INTRODUCCIÓN 1.1. OBJETO DE LA ESTADÍSTICA... 17 1.2. POBLACIONES... 18 1.3. VARIABLES ALEATORIAS... 19 1.3.1. Concepto... 19 1.3.2. Variables discretas y variables continuas... 20 1.3.3.
Más detallesEl modelo de azar proporcional: la regresión de Cox
El modelo de azar proporcional: la regresión de Cox Alfonso Luis Palmer Pol y Jose Maria Losilla Vidal El Análisis de la Supervivencia (Palmer, 1988) engloba una variedad de técnicas estadísticas que permiten
Más detallesIntroducción a la Estadística Aplicada en la Química
Detalle de los Cursos de Postgrado y Especialización en Estadística propuestos para 2015 1/5 Introducción a la Estadística Aplicada en la Química FECHAS: 20/04 al 24/04 de 2015 HORARIO: Diario de 10:00
Más detallesT4. Modelos con variables cualitativas
T4. Modelos con variables cualitativas Ana J. López y Rigoberto Pérez Dpto Economía Aplicada. Universidad de Oviedo Curso 2010-2011 Ana J. López y Rigoberto Pérez (Dpto EconomíaT4. Aplicada. Modelos Universidad
Más detallesEstimación del Probit Ordinal y del Logit Multinomial
Estimación del Probit Ordinal y del Logit Multinomial Microeconomía Cuantitativa R. Mora Departmento de Economía Universidad Carlos III de Madrid Esquema Introducción 1 Introducción 2 3 Introducción El
Más detallesEconometría III Examen. 29 de Marzo de 2012
Econometría III Examen. 29 de Marzo de 2012 El examen consta de 20 preguntas de respuesta múltiple. El tiempo máximo es 1:10 minutos. nota: no se pueden hacer preguntas durante el examen a no ser que sean
Más detallesINFERENCIA CON RECUENTOS
. INFERENCIA CON RECUENTOS PEDRO M. VALERO MORA Inferencia con Recuentos-Pedro M. Valero Mora 2009 1 Parte 1 Análisis con 1 variable 1.1. De dónde vienen las frecuencias?. 1.1. De dónde vienen las frecuencias?
Más detallesÍNDICE INTRODUCCIÓN... 21
INTRODUCCIÓN... 21 CAPÍTULO 1. ORGANIZACIÓN DE LOS DATOS Y REPRESENTACIONES GRÁFICAS... 23 1. ORGANIZACIÓN DE LOS DATOS... 23 1.1. La distribución de frecuencias... 24 1.2. Agrupación en intervalos...
Más detallesECONOMETRÍA II PRÁCTICAS DE ORDENADOR. Práctica 3
ECONOMETRÍA II PRÁCTICAS DE ORDENADOR Práctica 3 Considere la ecuación de inversión RINV t = β 1 +β 2 RPIB t +β 3 r t +u t donde RINV es la inversión real privada, RPIB es el PIB real y r es el tipo de
Más detallesCM0244. Suficientable
IDENTIFICACIÓN NOMBRE ESCUELA ESCUELA DE CIENCIAS NOMBRE DEPARTAMENTO Ciencias Matemáticas ÁREA DE CONOCIMIENTO MATEMATICAS, ESTADISTICA Y AFINES NOMBRE ASIGNATURA EN ESPAÑOL ESTADÍSTICA GENERAL NOMBRE
Más detallesEstadística Clase 2. Maestría en Finanzas Universidad del CEMA. Profesor: Alberto Landro Asistente: Julián R. Siri
Estadística 010 Clase Maestría en Finanzas Universidad del CEMA Profesor: Alberto Landro Asistente: Julián R. Siri Clase 1. La distribución de Bernoulli. La distribución binomial 3. La distribución de
Más detallesT2. El modelo lineal simple
T2. El modelo lineal simple Ana J. López y Rigoberto Pérez Dpto Economía Aplicada. Universidad de Oviedo Curso 2010-2011 Curso 2010-2011 1 / 40 Índice 1 Planteamiento e hipótesis básicas 2 Estimación de
Más detallesMultiple Linear Regression
Multiple Linear Regression Aniel Nieves-González Aniel Nieves-González () LSP 1 / 16 Considere el ejemplo en cual queremos modelar las ventas en una cadena de tiendas por departamento. La v.a. dependiente
Más detallesPrueba de Hipótesis. Para dos muestras
Prueba de Hipótesis Para dos muestras Muestras grandes (n mayor a 30) Utilizar tabla Z Ho: μ1 = μ2 H1: μ1 μ2 Localizar en valor de Zt en la tabla Z Error estándar de la diferencia de medias Prueba de
Más detallesEstadística. Convocatoria ordinaria
Estadística. Convocatoria ordinaria Nombre Número de Examen Titulación... Grupo... Este examen puntúa sobre 20 puntos Problema 1. En un grupo de familias, un 10% ha cambiado de coche y también ha cambiado
Más detallesANÁLISIS DE FRECUENCIAS
ANÁLISIS DE FRECUENCIAS EXPRESIONES PARA EL CÁLCULO DE LOS EVENTOS PARA EL PERÍODO DE RETORNO T Y DE LOS RESPECTIVOS ERRORES ESTÁNDAR DE ESTIMACIÓN REQUERIDOS PARA LA DETERMINACIÓN DE LOS INTERVALOS DE
Más detallesESTADISTICA II. INGENIERIA INFORMATICA, 3 ER Curso Septiembre Primera Parte
ESTADISTICA II INGENIERIA INFORMATICA, 3 ER Curso 13 - Septiembre - 2.004 Primera Parte Apellidos y Nombre:... D.N.I. :... Nota : En la realización de este examen sólo esta permitido utilizar calculadoras
Más detallesGrupo 4: BUENAS PRÁCTICAS ESTADÍSTICAS
Red ibérica de evaluación de eficacia y efectos secundarios de tratamientos para el control de plagas en el olivar (RIESPO) 2ª Reunión, Madrid 10-11/06/2010 Grupo 4: BUENAS PRÁCTICAS ESTADÍSTICAS ESTADÍSTICA
Más detallesAjustes de datos: transformación de datos. Capítulo 9 de McCune y Grace 2002
Ajustes de datos: transformación de datos. Capítulo 9 de McCune y Grace 2002 Razones estadísticas para transformar datos Mejorar las suposiciones de algunas técnicas estadísticas: normalidad, linealidad,
Más detallesANALISIS DE LA ESTATURA
ANALISIS DE LA ESTATURA OBJETIVO El objetivo de este trabajo es realizar un estudio de la de distintos individuos. DATOS Se realizan los distintos análisis de regresión simple, así como el análisis de
Más detallesModelos de suavizado, aditivos y mixtos
Carmen Armero 1 de junio de 2011 Introducción Introducción Modelos lineales, LM Modelos aditivos, AM Modelos lineales generalizados, GLM GAM I Un modelo lineal generalizado (GAM) es un modelo lineal generalizado
Más detallesRegresión: implica la obtención de una ecuación mediante la que podamos estimar el valor medio de una variable.
1 DEFINICIONES PREVIAS Regresión: implica la obtención de una ecuación mediante la que podamos estimar el valor medio de una variable. Correlación: es la cuantificación del grado de relación existente
Más detallesUniversidade de Vigo. Linealidad. El comportamiento esperado de la variable dependiente
Linealidad El comportamiento esperado de la variable dependiente El concepto de linealidad Indica que el valor esperado de la variable dependiente depende linealmente de las variables independientes El
Más detallesPor ejemplo, si se desea discriminar entre créditos que se devuelven o que presentan
Regresión Logística Introducción El problema de clasificación en dos grupos puede abordarse introduciendo una variable ficticia binaria para representar la pertenencia de una observación a uno de los dos
Más detallesPROGRAMA DE ESTADÍSTICA DESCRIPTIVA
PROGRAMA DE ESTADÍSTICA DESCRIPTIVA CONCEPTOS BÁSICOS DE ESTADÍSTICA Definición de Estadística Origen del concepto. Evolución histórica de la Estadística Estadística Descriptiva y Estadística Inferencial
Más detallesTEMA V ANÁLISIS DE REGRESIÓN LOGÍSTICA
TEMA V ANÁLISIS DE REGRESIÓN LOGÍSTICA LECTURA OBLIGATORIA Regresión Logística. En Rial, A. y Varela, J. (2008). Estadística Práctica para la Investigación en Ciencias de la Salud. Coruña: Netbiblo. Páginas
Más detallesSéptima Entrega. New Workfile Daily (5 days week) 1:1:1991 a 2:16:1998. File Import Read Text Lotus Excel
Prácticas de la asignatura Series Temporales Séptima Entrega 1 Modelos de heterocedasticidad condicional A partir de la decada de los 80, muchos investigadores se han dedicado al estudio de modelos no
Más detallesEL PRINCIPIO DE MÁXIMA VEROSIMILITUD (LIKELIHOOD)
EL PRINCIPIO DE MÁXIMA VEROSIMILITUD (LIKELIHOOD) Fortino Vela Peón fvela@correo.xoc.uam.mx FVela-0 Objetivo Introducir las ideas básicas del principio de máxima verosimilitud. Problema Considere el experimento
Más detallesBachillerato Internacional. Matemáticas Nivel Medio. Programa para el curso 1º ( )
1 Bachillerato Internacional. Matemáticas Nivel Medio. Programa para el curso 1º (2015-2016) Tema 1: NÚMEROS REALES Conjuntos numéricos. Números naturales. Números enteros. Números racionales. Números
Más detallesAnálisis de Regresión
Análisis de Regresión Diplomado en Lean Six Sigma Objetivo 1.Identificar problemas que incluyan una Y continua y una X continua 2. Entender la diferencia entre regresión lineal y no lineal 3. Ajustar modelos
Más detallesCoeficiente de Correlación
Coeficiente de Correlación Al efectuar un análisis de regresión simple (de dos variables) necesitamos hacer las siguientes suposiciones. Que las dos variables son mensurables Que la relación entre las
Más detallesCURSO: ANALISIS ESTADISTICO DE RIESGOS
MANAGEMENT CONSULTORES CURSO: ANALISIS ESTADISTICO DE RIESGOS Cnel. R.L. Falcón 1435 C1406GNC 35 Buenos Aires, Argentina Tel.: 054-11-15-5468-3369 Fax: 054-11-4433-4202 Mail: acaminos@mgmconsultores.com.ar
Más detallesModelos lineales generalizados
GoBack Modelos lineales Guillermo Ayala Gallego Universidad de Valencia 20 de enero de 2009 1 / 57 Verosimilitud de Ajuste de un GLM mediante Fisher Scoring Method s de un modelo lineal generalizado Identifica
Más detallesModelos para variables categóricas
Gabriel V. Montes-Rojas Modelo logit multinomial Supongamos que la variable dependiente toma muchos valores, ej. y = 0, 1, 2..., J, aunque los valores de y no representan ningún orden en particular. Éste
Más detallesRepaso Estadística Descriptiva
Grado en Fisioterapia, 2010/11 Cátedra de Bioestadística Universidad de Extremadura 13 de octubre de 2010 Índice Descriptiva de una variable 1 Descriptiva de una variable 2 Índice Descriptiva de una variable
Más detallesTaller Metodológico: CONCEPTOS Y FUNDAMENTOS BÁSICOS EN ANÁLISIS ESTADÍSTICO DESCRIPTIVO. Juan León Jara Almonte GRADE
Taller Metodológico: CONCEPTOS Y FUNDAMENTOS BÁSICOS EN ANÁLISIS ESTADÍSTICO DESCRIPTIVO Juan León Jara Almonte GRADE Por qué hacer análisis descriptivo? Qué hacer con estos datos? ESTADISTICA DESCRIPTIVA
Más detalles478 Índice alfabético
Índice alfabético Símbolos A, suceso contrario de A, 187 A B, diferencia de los sucesos A y B, 188 A/B, suceso A condicionado por el suceso B, 194 A B, intersección de los sucesos A y B, 188 A B, unión
Más detallesTODO ECONOMETRIA. Bondad del ajuste Contraste de hipótesis
TODO ECONOMETRIA Bondad del ajuste Contraste de hipótesis Índice Bondad del ajuste: Coeficiente de determinación, R R ajustado Contraste de hipótesis Contrastes de hipótesis de significación individual:
Más detalles