Regresión Polinomial y Regresión Logística
|
|
- María Jesús Alcaraz Navarro
- hace 8 años
- Vistas:
Transcripción
1 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 1 Regresión Polinomial y Regresión Logística M.L. Gámiz Pérez Departamento Estadística e Inv. Operativa Universidad de Granada 30 de octubre de 2013
2 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 2 Contenido Regresión Polinomial Introducción y ejemplos Aproximaciones alternativas Regresión Logística Introducción Estimación de los parámetros del modelo Evaluación del modelo Contraste de regresión Estudio de la bondad del ajuste Tests de significación de los coeficientes Capacidad predictiva del modelo Regresión Logística Múltiple Análisis de residuos Regresión Logística Multinomial
3 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 3 Introducción Polinomio de segundo orden: Y = β 0 + β 1 X + β 2 X 2 + ɛ (1) Y = β 0 + β 1 X 1 + β 2 X 2 + β 11 X1 2 + β 22X2 2 + β 12X 1 X 2 + ɛ (2) Se usan cuando la respuesta es curvilínea Y = f (X ) para f compleja desarrollo en serie de Taylor
4 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 4 Introducción Polinomio de segundo orden: Y = β 0 + β 1 X + β 2 X 2 + ɛ (1) Y = β 0 + β 1 X 1 + β 2 X 2 + β 11 X1 2 + β 22X2 2 + β 12X 1 X 2 + ɛ (2) Se usan cuando la respuesta es curvilínea Y = f (X ) para f compleja desarrollo en serie de Taylor Modelo de orden k en 1 variable Y = β 0 + β 1 X β k X k + ɛ Si X j = X j, para j = 1,..., k: Modelo de regresión lineal múltiple
5 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 5 Introducción Polinomio de segundo orden: Y = β 0 + β 1 X + β 2 X 2 + ɛ (1) Y = β 0 + β 1 X 1 + β 2 X 2 + β 11 X1 2 + β 22X2 2 + β 12X 1 X 2 + ɛ (2) Se usan cuando la respuesta es curvilínea Y = f (X ) para f compleja desarrollo en serie de Taylor Modelo de orden k en 1 variable Y = β 0 + β 1 X β k X k + ɛ Si X j = X j, para j = 1,..., k: Modelo de regresión lineal múltiple Orden del modelo: Principio de PARSIMONIA
6 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 6 Principios básicos Interpretación: β0 : Promedio de Y cuando X = 0 β 1 : Parámetro de efecto lineal β 2 : Parámetro de efecto cuadrático, etc...
7 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 7 Principios básicos Interpretación: β0 : Promedio de Y cuando X = 0 β 1 : Parámetro de efecto lineal β 2 : Parámetro de efecto cuadrático, etc... Estrategia para la construcción del modelo: Métodos de selección de variables (adelante/atrás). Se debe restringir a polinomios de orden 1 o 2.
8 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 8 Principios básicos Interpretación: β0 : Promedio de Y cuando X = 0 β 1 : Parámetro de efecto lineal β 2 : Parámetro de efecto cuadrático, etc... Estrategia para la construcción del modelo: Métodos de selección de variables (adelante/atrás). Se debe restringir a polinomios de orden 1 o 2. Extrapolación!!
9 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 9 Principios básicos Interpretación: β0 : Promedio de Y cuando X = 0 β 1 : Parámetro de efecto lineal β 2 : Parámetro de efecto cuadrático, etc... Estrategia para la construcción del modelo: Métodos de selección de variables (adelante/atrás). Se debe restringir a polinomios de orden 1 o 2. Extrapolación!! Mal acondicionamiento: A medida que aumenta el orden del polinomio la matriz X X se vuelve mal acondicionada.
10 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 10 Principios básicos Interpretación: β0 : Promedio de Y cuando X = 0 β 1 : Parámetro de efecto lineal β 2 : Parámetro de efecto cuadrático, etc... Estrategia para la construcción del modelo: Métodos de selección de variables (adelante/atrás). Se debe restringir a polinomios de orden 1 o 2. Extrapolación!! Mal acondicionamiento: A medida que aumenta el orden del polinomio la matriz X X se vuelve mal acondicionada. Multicolinealidad!!
11 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 11 Principios básicos Interpretación: β0 : Promedio de Y cuando X = 0 β 1 : Parámetro de efecto lineal β 2 : Parámetro de efecto cuadrático, etc... Estrategia para la construcción del modelo: Métodos de selección de variables (adelante/atrás). Se debe restringir a polinomios de orden 1 o 2. Extrapolación!! Mal acondicionamiento: A medida que aumenta el orden del polinomio la matriz X X se vuelve mal acondicionada. Multicolinealidad!! Jerarquía: Y = β 0 + β 1 X + β 2 X 2 + β 3 X 3 + ɛ Y = β 0 + β 1 X + β 3 X 3 + ɛ SI NO
12 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 12 Extensiones Análisis de regresión usando funciones base... Regresion trigonométrica Y = d β j X j + j=0 λ [γ k cos(kx ) + δ k sin(kx )] + ɛ k=1 con d = 2 y λ a determinar.
13 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 13 Extensiones Análisis de regresión usando funciones base... Regresion trigonométrica Y = d β j X j + j=0 λ [γ k cos(kx ) + δ k sin(kx )] + ɛ k=1 con d = 2 y λ a determinar. Regresión por splines Modelo lineal con un nodo (x 0 ) Y = β 0 + β 1a X + β 1b (X x 0 ) + + ɛ con (X x 0 ) + = { 1 si X > x0 0 en otro caso
14 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 14 El modelo de regresión con respuesta binaria Se pretende caracterizar la relación entre una variable respuesta Y y un conjunto de variables independientes X 1, X 2,..., X p Y = f (X 1, X 2,..., X p )
15 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 15 El modelo de regresión con respuesta binaria Se pretende caracterizar la relación entre una variable respuesta Y y un conjunto de variables independientes X 1, X 2,..., X p Y = f (X 1, X 2,..., X p ) Hipótesis del modelo de regresión lineal: Normalidad y varianza constante
16 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 16 El modelo de regresión con respuesta binaria Se pretende caracterizar la relación entre una variable respuesta Y y un conjunto de variables independientes X 1, X 2,..., X p Y = f (X 1, X 2,..., X p ) Hipótesis del modelo de regresión lineal: Normalidad y varianza constante Estrategias: mínimos cuadrados ponderados transformación de los datos
17 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 17 El modelo de regresión con respuesta binaria Se pretende caracterizar la relación entre una variable respuesta Y y un conjunto de variables independientes X 1, X 2,..., X p Y = f (X 1, X 2,..., X p ) Hipótesis del modelo de regresión lineal: Normalidad y varianza constante Estrategias: mínimos cuadrados ponderados transformación de los datos Modelo Lineal Generalizado: La variable respuesta pertenece a la familia exponencial: Normal, Poisson, Binomial, Exponencial, Gamma, etc.
18 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 18 El modelo de regresión con respuesta binaria simple La variable respuesta representa la ocurrencia o no de un suceso, por ejemplo: que un estudiante apruebe o no un examen; que un transplante de corazón sea aceptado o no; que una empresa llegue a estar en problemas financieros o no; que un paciente de un hospital sobreviva o no antes de que le den de alta; que un cliente devuelva un crédito bancario o no.
19 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 19 El modelo de regresión con respuesta binaria simple La variable respuesta representa la ocurrencia o no de un suceso, por ejemplo: que un estudiante apruebe o no un examen; que un transplante de corazón sea aceptado o no; que una empresa llegue a estar en problemas financieros o no; que un paciente de un hospital sobreviva o no antes de que le den de alta; que un cliente devuelva un crédito bancario o no. Se considera la siguiente codificación de Y : { 1, el suceso tiene lugar Y = 0, el suceso no tiene lugar
20 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 20 El modelo de regresión con respuesta binaria simple La variable respuesta representa la ocurrencia o no de un suceso, por ejemplo: que un estudiante apruebe o no un examen; que un transplante de corazón sea aceptado o no; que una empresa llegue a estar en problemas financieros o no; que un paciente de un hospital sobreviva o no antes de que le den de alta; que un cliente devuelva un crédito bancario o no. Se considera la siguiente codificación de Y : { 1, el suceso tiene lugar Y = 0, el suceso no tiene lugar Se considera un solo regresor o variable explicativa X Hipótesis: P(Y = 1 X = x) es monótona (creciente o decreciente) en x.
21 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 21 El modelo lineal no es aplicable Supongamos el siguiente modelo Y = β 0 + β 1 X + ɛ, donde ɛ representa el error, con ɛ N(0, σ): E(Y X = x) = β 0 + β 1 x
22 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 22 El modelo lineal no es aplicable Supongamos el siguiente modelo Y = β 0 + β 1 X + ɛ, donde ɛ representa el error, con ɛ N(0, σ): E(Y X = x) = β 0 + β 1 x Si Y es binaria, entonces para un individuo i: Y i = 1 ó Y i = 0 y... { 1 β0 β ɛ i = 1 X i, si Y i = 1 β 0 β 1 X i, si Y i = 0, Además... Var(ɛ i ) = Var(Y i ) = E(Y i E(Y i )) 2 = (1 E(Y i ))E(Y i ).
23 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 23 Ejemplo Notación: E(Y i X i ) = π(x i ) = π i Queremos evaluar la probabilidad de desarrollar una enfermedad cardiaca en un determinado intervalo de tiempo π i, para un sujeto con un determinado nivel de colesterol X i. Es lógico esperar πi 1 a medida que X i, y πi 0 a medida que X i 0. Con datos binarios, E(Y X = x) [0, 1].
24 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 24 Ejemplo Notación: E(Y i X i ) = π(x i ) = π i Queremos evaluar la probabilidad de desarrollar una enfermedad cardiaca en un determinado intervalo de tiempo π i, para un sujeto con un determinado nivel de colesterol X i. Es lógico esperar πi 1 a medida que X i, y πi 0 a medida que X i 0. Con datos binarios, E(Y X = x) [0, 1]. El cambio en E(Y x) por unidad de cambio en x se va haciendo progresivamente menor a medida que la media condicional se aproxima a 0 y 1.
25 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 25 Ejemplo Notación: E(Y i X i ) = π(x i ) = π i Queremos evaluar la probabilidad de desarrollar una enfermedad cardiaca en un determinado intervalo de tiempo π i, para un sujeto con un determinado nivel de colesterol X i. Es lógico esperar πi 1 a medida que X i, y πi 0 a medida que X i 0. Con datos binarios, E(Y X = x) [0, 1]. El cambio en E(Y x) por unidad de cambio en x se va haciendo progresivamente menor a medida que la media condicional se aproxima a 0 y 1. Se podría esperar una curva como en la figura siguiente...
26 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 26 Función Logística
27 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 27 Función de distribución logística π(x) = exp(β 0 + β 1 x) 1 + exp(β 0 + β 1 x) Propiedades: Flexibilidad; Interpretación práctica; Transformación logit: g(x) = ln π(x) 1 π(x) = β 0 + β 1 x
28 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 28 Función de distribución logística π(x) = exp(β 0 + β 1 x) 1 + exp(β 0 + β 1 x) Propiedades: Flexibilidad; Interpretación práctica; Transformación logit: g(x) = ln π(x) 1 π(x) = β 0 + β 1 x Otras funciones: Modelo Probit
29 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 29 Modelo de regresión logística binario Y {X =x} Binomial (1, π(x)) π(x) = exp(β 0 + β 1 x) 1 + exp(β 0 + β 1 x)
30 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 30 Modelo de regresión logística binario Y {X =x} Binomial (1, π(x)) π(x) = exp(β 0 + β 1 x) 1 + exp(β 0 + β 1 x) Es un método predictivo y explicativo: Finalidades:
31 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 31 Modelo de regresión logística binario Y {X =x} Binomial (1, π(x)) π(x) = exp(β 0 + β 1 x) 1 + exp(β 0 + β 1 x) Es un método predictivo y explicativo: Finalidades: 1. Cuantificar la importancia de la relación existente entre la variable X y la variable Y.
32 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 32 Modelo de regresión logística binario Y {X =x} Binomial (1, π(x)) π(x) = exp(β 0 + β 1 x) 1 + exp(β 0 + β 1 x) Es un método predictivo y explicativo: Finalidades: 1. Cuantificar la importancia de la relación existente entre la variable X y la variable Y. 2. Clasificar individuos dentro de las categorías (presente/ausente) de la variable Y en función de la probabilidad que tengan de pertenecer a cada una de ellas en presencia de determinada información (X ).
33 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 33 Interpretación de los coeficientes: odds (ventaja) Definición: O(x) = π(x) 1 π(x)
34 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 34 Interpretación de los coeficientes: odds (ventaja) Definición: O(x) = π(x) 1 π(x) Interpretación: Cuánto más probable es que ocurra un suceso frente a que no ocurra Ejemplo: Si π(x) = 0,75 se tiene un odds de 3 : 1. Modelo log-lineal... g(x) = ln π(x) 1 π(x) = β 0 + β 1 x
35 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 35 Interpretación de los coeficientes: odds ratio (OR) Sean X 1 y X 2 dos perfiles de la variable X y sean π j = π(x j ), j = 1, 2; El logaritmo de la razón de los odds ln Es decir... [ π1 1 π 1 π 2 1 π 2 ] = ln [ π1 (1 π 2 ) π 2 (1 π 1 ) ln(or) = β 1 (X 1 X 2 ). ] = β 1 (X 1 X 2 ).
36 Caso particular: X 1 = X se tiene que ln(or) = β 1 y equivalentemente OR = e β 1. Interpretación del signo: OR > 1 OR < 1 OR = 1 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 36 Interpretación de los coeficientes: odds ratio (OR) Sean X 1 y X 2 dos perfiles de la variable X y sean π j = π(x j ), j = 1, 2; El logaritmo de la razón de los odds ln Es decir... [ π1 1 π 1 π 2 1 π 2 ] = ln [ π1 (1 π 2 ) π 2 (1 π 1 ) ln(or) = β 1 (X 1 X 2 ). ] = β 1 (X 1 X 2 ).
37 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 37 El método de máxima-verosimilitud Datos: {(X i, Y i ); i = 1,..., n} Contribución del dato (X i, Y i ): L i = π(x i ) Y i [1 π(x i )] 1 Y i
38 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 38 El método de máxima-verosimilitud Datos: {(X i, Y i ); i = 1,..., n} Contribución del dato (X i, Y i ): L i = π(x i ) Y i [1 π(x i )] 1 Y i Función de verosimilitud: L(β 0, β 1 ) = n i=1 L i Log-verosimilitud: l(β 0, β 1 ) = n i=1 {Y i ln(π(x i )) + (1 Y i ) ln(1 π(x i ))}
39 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 39 El método de máxima-verosimilitud Datos: {(X i, Y i ); i = 1,..., n} Contribución del dato (X i, Y i ): L i = π(x i ) Y i [1 π(x i )] 1 Y i Función de verosimilitud: L(β 0, β 1 ) = n i=1 L i Log-verosimilitud: l(β 0, β 1 ) = n i=1 {Y i ln(π(x i )) + (1 Y i ) ln(1 π(x i ))} Diferenciando con respecto a β 0 y β 1 n i=1 [Y i π(x i )] = 0 n i=1 X i[y i π(x i )] = 0
40 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 40 El método de máxima-verosimilitud Datos: {(X i, Y i ); i = 1,..., n} Contribución del dato (X i, Y i ): L i = π(x i ) Y i [1 π(x i )] 1 Y i Función de verosimilitud: L(β 0, β 1 ) = n i=1 L i Log-verosimilitud: l(β 0, β 1 ) = n i=1 {Y i ln(π(x i )) + (1 Y i ) ln(1 π(x i ))} Diferenciando con respecto a β 0 y β 1 n i=1 [Y i π(x i )] = 0 n i=1 X i[y i π(x i )] = 0 Si no hay una separación completa existe solución. Métodos numéricos: Newton-Raphson (veremos en el caso múltiple). Solución inicial: Análisis Discriminante (Normalidad de las variables explicativas)
41 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 41 Ejemplo: Hosmer y Lemeshow (1989), pg. 2 Se pretende estudiar la influencia de la edad (X = Edad) en la presencia/ausencia de evidencia de enfermedad coronaria (Y = CHD). Se seleccionaron 100 sujetos para participar en el estudio. La tabla siguiente representa la información referente a los primeros individuos ID GrupoEdad Edad CHD
42 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 42 Diagrama de dispersión { 1, enfermedad está presente Y = 0, otro caso
43 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 43 E(Y x) por grupos de edad
44 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 44 Resultado del ajuste Modelo: ln P(CHD=1 Edad) P(CHD=0 Edad) = β 0 + β 1 Edad Coeficientes estimados (SPSS): Coeficiente estimado Error estándar Edad β1 = 0,111 0,024 Constante β0 = 5,309 1,134 Log-verosimilitud = 53,6765
45 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 45 Resultado del ajuste Modelo: ln P(CHD=1 Edad) P(CHD=0 Edad) = β 0 + β 1 Edad Coeficientes estimados (SPSS): Coeficiente estimado Error estándar Edad β1 = 0,111 0,024 Constante β0 = 5,309 1,134 Log-verosimilitud = 53,6765 Probabilidad estimada de presentar la enfermedad en función de la Edad: π(edad) = Interpretación... exp( 5, ,111Edad) 1 + exp( 5, ,111Edad)
46 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 46 Contraste de regresión Después de ajustar el modelo evaluamos la significación de la(s) variable(s) involucrada(s). No estudiamos aún la bondad de ajuste (términos absolutos): representan los valores ajustados a los valores observados? Comparamos un modelo sin la covariable (modelo nulo) frente a modelo con la covariable (términos relativos)
47 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 47 Contraste de regresión Después de ajustar el modelo evaluamos la significación de la(s) variable(s) involucrada(s). No estudiamos aún la bondad de ajuste (términos absolutos): representan los valores ajustados a los valores observados? Comparamos un modelo sin la covariable (modelo nulo) frente a modelo con la covariable (términos relativos) Regresion lineal: Coeficientes Estadístico Modelo nulo β 0 = Y ; β 1 = 0 Var(Y ) Modelo lineal β0 ; β 1 0 (Yi Ŷi) 2 Medida de diferencia V.E. Regresión logística: la medida se basa en el log de la función de verosimilitud
48 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 48 El test de razón de verosimilitudes Contraste de regresión: Es mejor el modelo nulo? H 0 : β 1 = 0 H 1 : β 1 0 Se basa en el estadístico (Hosmer y Lemeshow, 1989) [ ] función de verosimilitud del modelo sin X G = 2 ln función de verosimilitud del modelo con X
49 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 49 El test de razón de verosimilitudes Contraste de regresión: Es mejor el modelo nulo? H 0 : β 1 = 0 H 1 : β 1 0 Se basa en el estadístico (Hosmer y Lemeshow, 1989) [ ] función de verosimilitud del modelo sin X G = 2 ln función de verosimilitud del modelo con X En el modelo univariante comparamos con el modelo nulo [ ( n1 ) n1 ( n0 ) n0 ] G = 2 ln n n n i=1 πy i i (1 π i ) (1 Y i ) Bajo H 0, G χ 2 (1). Ejemplo...
50 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 50 El coeficiente R 2 en regresión logística Alternativas al coeficiente de determinación usado en regresión lineal (Maddala-Magee) R 2 = 1 {L(0)/L( β 0, β 1 )} 2/n No es una verdadera medida de la bondad de ajuste: sólo compara 2 modelos L(0) = p n 1 1 (1 p 1) n n 1, F. de verosimilitud del modelo nulo (sólo β 0 ); con p 1 = n 1 /n = Y i /n. L( β 0, β 1 ), F. de verosimilitud evaluada en el estimador. L 1, entonces R 2 0 R 2 1 (p p 1 1 (1 p 1) 1 p 1 ) 2 Coeficiente corregido:r 2 = R 2 /max(r 2 ) (Nagelkerke)
51 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 51 El test de Hosmer-Lemeshow Pasos: 1. Calcular π 1 = π(x 1 ),..., π n = π(x n ), a partir del modelo ajustado (suponemos que no hay valores repetidos de la variable X ). 2. Ordenar los n valores de menor a mayor. 3. Agrupar los valores calculados siguiendo uno de los dos criterios siguientes: (a) Dividir la secuencia ordenada en cuartiles, deciles u otra clasificación similar. (b) Formar el primer grupo con todos los individuos para los que π i es menor que 0.1; en el segundo grupo considerar los individuos cuyo π i esté entre 0.1 y 0.2, etc. Sean n 1, n 2,..., n 10 las frecuencias respectivas.
52 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación Sumar los valores de π i dentro de cada grupo. Estos sumatorios serán los valores esperados, que denotamos E 1, E 2,..., E Contar en cada grupo el número de sujetos para los cuales Y = 1, estos serán los valores observados, que denotamos O 1, O 2,..., O 10.
53 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación Sumar los valores de π i dentro de cada grupo. Estos sumatorios serán los valores esperados, que denotamos E 1, E 2,..., E Contar en cada grupo el número de sujetos para los cuales Y = 1, estos serán los valores observados, que denotamos O 1, O 2,..., O 10. Estadístico de Hosmer-Lemeshow χ 2 = 10 i=1 (O i E i ) 2 E i + 10 i=1 donde E i = n i E i y O i = n i O i. Este estadístico sigue una distribución χ 2 (8). (O i E E i i )2,
54 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 54 Tests individuales Nos planteamos... Test de Wald H 0 : β j = 0 H 1 : β j 0, j = 0, 1
55 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 55 Tests individuales Nos planteamos... Test de Wald Estadístico de Wald: H 0 : β j = 0 H 1 : β j 0, j = 0, 1 con se βj = Var( β j ). W = β j se βj,
56 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 56 Tests individuales Nos planteamos... Test de Wald Estadístico de Wald: con se βj = H 0 : β j = 0 H 1 : β j 0, j = 0, 1 Var( β j ). W = Sea H = ( 2 l(β 0,β 1 ) β u β j )0 u,j 1 β j se βj, La matriz de covarianzas Σ( β 0, β 1 ) = (H( β 0, β 1 )) 1
57 Tests individuales Nos planteamos... Test de Wald Estadístico de Wald: con se βj = H 0 : β j = 0 H 1 : β j 0, j = 0, 1 Var( β j ). W = Sea H = ( 2 l(β 0,β 1 ) β u β j )0 u,j 1 β j se βj, La matriz de covarianzas Σ( β 0, β 1 ) = (H( β 0, β 1 )) 1 W tiene distribución Normal estándar. MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 57
58 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 58 Prueba Score Contraste: H 0 : β j = 0 H 1 : β j 0
59 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 59 Prueba Score Contraste: H 0 : β j = 0 H 1 : β j 0 Requiere menos esfuerzo computacional que los anteriores Estimador ST = n i=1 X i(y i Y ) Y (1 Y ). n i=1 (X i X ) 2 ST tiene distribución Normal estándar Ejemplo...
60 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 60 Estudio de la capacidad predictiva del modelo Objetivo: Establecer si el modelo logístico estimado clasifica correctamente a los sujetos de acuerdo con los valores de la variable respuesta.
61 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 61 Estudio de la capacidad predictiva del modelo Objetivo: Establecer si el modelo logístico estimado clasifica correctamente a los sujetos de acuerdo con los valores de la variable respuesta. Clasificacion = { π i > 0,5 Ŷi = 1 π i 0,5 Ŷi = 0 Y Ŷ VP FN 0 FP VN
62 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 62 Estudio de la capacidad predictiva del modelo Objetivo: Establecer si el modelo logístico estimado clasifica correctamente a los sujetos de acuerdo con los valores de la variable respuesta. Clasificacion = CP = (VP + VN)/n { π i > 0,5 Ŷi = 1 π i 0,5 Ŷi = 0 Y Ŷ VP FN 0 FP VN Sensibilidad = VP/(VP + FN) Especifidad = VN/(VN + FP)
63 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 63 Modelo de regresión logística múltiple P(Y = 1) = exp(β 0 + β 1 X β p X p ) 1 + exp(β 0 + β 1 X β p X p )
64 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 64 Modelo de regresión logística múltiple P(Y = 1) = exp(β 0 + β 1 X β p X p ) 1 + exp(β 0 + β 1 X β p X p ) F. de verosimilitud: n L(β) = {Y i ln π i + (1 Y i ) ln(1 π i )}, i=1 con π i = π(x i1, X i2,..., X ip ).
65 Modelo de regresión logística múltiple P(Y = 1) = exp(β 0 + β 1 X β p X p ) 1 + exp(β 0 + β 1 X β p X p ) F. de verosimilitud: n L(β) = {Y i ln π i + (1 Y i ) ln(1 π i )}, i=1 con π i = π(x i1, X i2,..., X ip ). Ecuaciones de verosimilitud, para j = 1,..., p l(β) n = (Y i π i ) = 0 β 0 l(β) β j = i=1 n (Y i π i )X ij = 0; i=1 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 65
66 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 66 Forma matricial: X (Y π) = 0, donde 1 X 11 X 1p 1 X 21 X 2p X =... ; Y = 1 X n1. X np Y 1 Y 2. Y n ; π = π 1 π 2. π n
67 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 67 Forma matricial: X (Y π) = 0, donde 1 X 11 X 1p 1 X 21 X 2p X =... ; Y = 1 X n1. X np Y 1 Y 2. Y n ; π = Buscamos solución del siguiente sistema de ecuaciones: U( β) = X (Y π) = 0 π 1 π 2. π n
68 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 68 Forma matricial: X (Y π) = 0, donde 1 X 11 X 1p 1 X 21 X 2p X =... ; Y = 1 X n1. X np Y 1 Y 2. Y n ; π = Buscamos solución del siguiente sistema de ecuaciones: U( β) = X (Y π) = 0 π 1 π 2. π n Desarrollo de Taylor β = β (0) H 1 (β (0) )U(β (0) ) donde U( ) es ( la funcion score, el vector de derivadas parciales de l; H( ) = 2 l( ) β j β u )1 u,j p, es la matriz hessiana
69 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 69 Método de Newton-Raphson El estimador se obtiene de modo iterativo, en el paso k del algoritmo β (k) = β (k 1) + ( X W (k 1) X ) 1 X ( Y π (k 1) ) W (k 1) = diag ( π (k 1) (1 π (k 1) ) ) n n π (k 1) son probabilidades estimadas en el paso anterior β(k 1) es el vector de coeficientes obtenido en el paso anterior.
70 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 70 Método de Newton-Raphson El estimador se obtiene de modo iterativo, en el paso k del algoritmo β (k) = β (k 1) + ( X W (k 1) X ) 1 X ( Y π (k 1) ) W (k 1) = diag ( π (k 1) (1 π (k 1) ) ) n n π (k 1) son probabilidades estimadas en el paso anterior β(k 1) es el vector de coeficientes obtenido en el paso anterior. Se necesita un valor inicial para empezar el proceso iterativo. Matriz de información de Fisher: Î(k 1) = X W (k 1) X
71 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 71 Interpretación de los coeficientes β 0 = logit de presentar el suceso de interés cuando todas las covariables toman valor 0. Sean X 1 y X 2 dos perfiles distintos: O(X 1 ) O(X 2 ) = exp [ p i=1 β i (X 1 i X 2 i ) Cuánto más peligro tiene un sujeto del perfil 1 de presentar la característica de interés frente a un individuo del perfil 2. ]
72 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 72 Interpretación de los coeficientes β 0 = logit de presentar el suceso de interés cuando todas las covariables toman valor 0. Sean X 1 y X 2 dos perfiles distintos: O(X 1 ) O(X 2 ) = exp [ p i=1 β i (X 1 i X 2 i ) Cuánto más peligro tiene un sujeto del perfil 1 de presentar la característica de interés frente a un individuo del perfil 2. Caso particular: Xj 1 = Xj y el resto igual, O(X 1 )/O(X 2 ) = exp(β j ) β j = cambio en logit cuando X j aumenta en una unidad y el resto de variables se mantienen iguales. A veces el cambio en 1 unidad no tiene interés práctico (edad) ]
73 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 73 Contrastes de significación del modelo (A) Desviación del modelo: Contraste de regresión H 0 : β 1 = β 2 = = β p = 0 H 1 : β j 0, Estadístico de contraste: G χ 2 (p).
74 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 74 Contrastes de significación del modelo (A) Desviación del modelo: Contraste de regresión H 0 : β 1 = β 2 = = β p = 0 H 1 : β j 0, Estadístico de contraste: G χ 2 (p). (B) Contrastes individuales: H 0 : β j = 0 H 1 : β j 0, j = 1,..., p. Estadístico de contraste (Wald): W j = β j N(0, 1) se( β j ) Intervalo de confianza al nivel 100 (1 α) %: β j ± Z 1 α/2 se( β j )
75 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 75 (C) Pruebas de hipótesis de subconjuntos de parámetros Sea β = (β(1), β (2) ), con dim(β (1) ) = r < p. Contraste: H 0 : β (1) = 0 H 1 : β (1) 0, Estadístico de contraste: G = 2[l(modelo bajoh 0 ) l(modelo bajoh 1 )] χ 2 (p r)
76 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 76 Selección de variables (Silva y Barroso, 2004) Adelante: 1. Se inicia con un modelo vacio (solo β 0 ) 2. Se ajusta un modelo y se calcula el p-valor de incluir cada variable por separado 3. Se selecciona el modelo con la variable más significativa 4. Se ajusta un modelo con la(s) variable(s) seleccionada(s) y se calcula el p-valor de añadir cada variable no seleccionada por separado 5. Se selecciona el modelo con la más significativa 6. Se repite 4-5 hasta que no queden variables significativas para incluir.
77 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 77 Atrás: 1. Se inicia con un modelo con TODAS las variables candidatas 2. Se eliminan, una a una, cada variable y se calcula la pérdida de ajuste al eliminar 3. Se selecciona para eliminar la menos significativa 4. Se repite 2-3 hasta que todas las variables incluidas sean significativas y no pueda eliminarse ninguna sin que se pierda ajuste.
78 Atrás: 1. Se inicia con un modelo con TODAS las variables candidatas 2. Se eliminan, una a una, cada variable y se calcula la pérdida de ajuste al eliminar 3. Se selecciona para eliminar la menos significativa 4. Se repite 2-3 hasta que todas las variables incluidas sean significativas y no pueda eliminarse ninguna sin que se pierda ajuste. Stepwise: a) Se combinan los métodos adelante y atrás. b) Puede empezarse por el modelo vacío o por el completo, pero en cada paso se exploran las variables incluidas, por si deben salir y las no seleccionadas, por si deben entrar c) No todos los métodos llegan a la misma solución necesariamente MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 78
79 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 79 Consideraciones importantes en regresión logística múltiple Multicolinealidad Consiste en: dos o más variables linealmente correlacionadas; Efecto: Incremento exagerado en los errores estándar y en los coeficientes estimados. Modelo poco creible Posibles estrategias: Examinar la matriz de correlaciones; Formular modelos con las variables correlacionadas y estudiar el coeficiente R 2 Si R 2 > 0,9!!
80 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 80 Confusión e interacción Variable confusora: Covariable que está asociada a la variable respuesta y a un factor de riesgo Interacción: La asociación entre el factor de riesgo y la respuesta depende de la covariable (efecto modificador). Ejemplo: Y = (1, si enfermedad coronaria; 0, en otro caso); X = edad; F =sexo (0=m, 1=m); logit lineal en la covariable X para los individuos con factor F = 1 con pendiente distinta de los individuos con factor F = 0 Modelo: logit = β 0 + β 1X + β 2F + δx F Importante: Determinar la evidencia o no de interacción en el modelo. H 0 : δ = 0
81 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 81 Confusión e interacción Variable confusora: Covariable que está asociada a la variable respuesta y a un factor de riesgo Interacción: La asociación entre el factor de riesgo y la respuesta depende de la covariable (efecto modificador). Ejemplo: Y = (1, si enfermedad coronaria; 0, en otro caso); X = edad; F =sexo (0=m, 1=m); logit lineal en la covariable X para los individuos con factor F = 1 con pendiente distinta de los individuos con factor F = 0 Modelo: logit = β 0 + β 1X + β 2F + δx F Importante: Determinar la evidencia o no de interacción en el modelo. H 0 : δ = 0 Variables categóricas Se introducen como variables dummy Se aceptan o se rechazan en bloque.
82 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 82 Análisis de residuos Residuo. Medida que expresa la diferencia entre las respuestas observadas y predichas por el modelo. Alertan de que no se cumpla el supuesto de linealidad entre el modelo logit de la probabilidad de Y = 1 y la(s) variable(s) independiente(s); 2. la presencia de algunas observaciones extremas que perturbe la calidad del ajuste; o 3. que una función distinta de la logística describiese más adecuadamente el conjunto de observaciones. Tipos: Residuos de Pearson Residuos deviance
83 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 83 Datos agrupados Consideramos perfiles de covariables que definen grupos de individuos m j = número total de individuos con mismo perfil de covariables. Hay J combinaciones distintas: X 1,..., X J Ỹ j = número de individuos con perfil j que presentan el suceso Y = 1 π j = π(x j ) = valor de probabilidad estimado según el modelo logístico para el perfil j-ésimo. Las aproximaciones normales asintóticas se sustentan en la aproximación normal de la variable binomial Ỹ, por esto m j debe ser grande.
84 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 84 Residuos de Pearson Residuos: Se definen... r j = Ỹ j m j π j
85 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 85 Residuos de Pearson Residuos: Se definen... r j = Ỹ j m j π j Residuos estandarizados o residuos de Pearson: r ej = Ỹ j m j π j mj π j (1 π j ) Si rej > 2 dato a examinar! Si J no es grande (mj suficientemente grande para cada j), r ej son NORMALES. Si mj = 1, r j solo toma 2 valores y no puede esperarse Normalidad.
86 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 86 Residuos de Pearson Residuos: Se definen... r j = Ỹ j m j π j Residuos estandarizados o residuos de Pearson: r ej = Ỹ j m j π j mj π j (1 π j ) Si rej > 2 dato a examinar! Si J no es grande (mj suficientemente grande para cada j), r ej son NORMALES. Si mj = 1, r j solo toma 2 valores y no puede esperarse Normalidad. Estadístico resumen: X 2 = J j=1 r ej 2 χ2 (J (p + 1)) (J n problema!).
87 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 87 Residuos deviance Definición: ( ) ( )] d j = sign(ỹ j m j π j ) Ỹj m j Ỹ j 2 [Ỹ j ln + (m j Ỹ j ) ln m j π j m j (1 π j ) Mide la discrepancia entre la j-ésima componente del logaritmo de la función de verosimilitud del modelo ajustado y la correspondiente componente del logaritmo de la función de verosimilitud que resultaría si cada punto fuese ajustado exactamente.
88 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 88 Datos no agrupados (m j = 1) di = {2[ ln(1 π i )]} 1/2, si Y i = 0; y di = {2[ ln( π i )]} 1/2 si Y i = 1.
89 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 89 Datos no agrupados (m j = 1) di = {2[ ln(1 π i )]} 1/2, si Y i = 0; y di = {2[ ln( π i )]} 1/2 si Y i = 1. Estadístico resumen: D = J j=1 d 2 j es χ 2 si J << n.
90 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 90 Influencia o leverage Qué efecto tiene eliminar todos aquellos sujetos que tienen un determinado perfil de covariables en los coeficientes estimados y las medidas de resumen global, X 2 y D? Se define... β j = β β ( j) Pregibon (1981) aproxima... donde h j son los leverages, β j = r 2 ej h j 1 h j H = V 1/2 X(X VX) 1 X V 1/2 X J p es la matriz de diseño, V = diag(v j ) J J = diag(m j π(x j )[1 π(x j )])
91 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 91 Otros diagnósticos Objetivo: determinar perfiles de covariables para los que el modelo proporciona un ajuste pobre...
92 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 92 Otros diagnósticos Objetivo: determinar perfiles de covariables para los que el modelo proporciona un ajuste pobre... Procedimiento: Examinar cambios debidos a la eliminación de los m j sujetos en... Chi-cuadrado de Pearson: X 2 j Deviance: D j = d 2 j 1 h j = r 2 ej Considerar las representaciones gráficas Detectar perfiles con gran influencia en el modelo: ( π j, β j ) Detectar perfiles que no son bien ajustados por el modelo: ( π j, X 2 j ) y ( π j, D j )
93 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 93 Otros diagnósticos Hosmer y Lemeshow (1989) aconsejan estos gráficos por encima de ( π j, r j ) o ( π j, d j ) porque: 1. Cuando J n la mayoría de los residuos positivos corresponden a perfiles en los que Ỹ j = m j, por ejemplo m j = 1, y los residuos negativos se corresponden con aquellos con Ỹ j = 0. Por lo que el signo no es informativo. 2. Grandes residuos se corresponden con puntos que no están bien reflejados en el modelo. Si consideramos los residuos al cuadrado se enfatiza aún más la falta de ajuste. 3. La forma de los gráficos ayuda a determinar qué perfiles se corresponden con Ỹ j = 0 y cuáles tienen Ỹ j = m j
94 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 94 Regresión Logística Multinomial
95 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 95 Regresión Logística Multinomial La variable respueste tiene r categorías
96 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 96 Regresión Logística Multinomial La variable respueste tiene r categorías Se elige una como referencia y se enfrentan a ella las r restantes a través de Prob(Y = k) Prob(Y = 0) ; k = 1,..., r
97 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 97 Regresión Logística Multinomial La variable respueste tiene r categorías Se elige una como referencia y se enfrentan a ella las r restantes a través de Prob(Y = k) Prob(Y = 0) ; k = 1,..., r Modelo ln Prob(Y = k) Prob(Y = 0) = β 0k + β 1k X β pk X p
98 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 98 Regresión Logística Multinomial La variable respueste tiene r categorías Se elige una como referencia y se enfrentan a ella las r restantes a través de Prob(Y = k) Prob(Y = 0) ; k = 1,..., r Modelo ln Prob(Y = k) Prob(Y = 0) = β 0k + β 1k X β pk X p Tenemos un total de r (p + 1) parémetros a estimar Se estima mediante el método de máxima-verosimilitud Métodos númericos implementados en software estadístico (SPSS)
99 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 99 Bibliografía I Hosmer,D.W. y Lemeshow, S. (1989). Applied Logistic Regression, Wiley Kleinbaum, D.G. (1994). Logistic Regression. A Self-Learning Text. Springer. Montgomery, D.C., Peck, E.A. y Vining, G.G. (2002). Introducción al análisis de regresión lineal, CECSA Pérez López, C. (2001). Técnicas Estadísticas con SPSS (Versión 10), Pearson Alhambra Ryan, T. (1997). Modern Regression Methods, Wiley Silva, L.C. y Barroso, I. (2004). Regresión Logística, La Muralla
Fundamentos de Biología Aplicada I Estadística Curso 2011-2012 Práctica 6: Regresión Logística I
Fundamentos de Biología Aplicada I Estadística Curso 2011-2012 Índice 1. Objetivos de la práctica 2 2. Estimación de un modelo de regresión logística con SPSS 2 2.1. Ajuste de un modelo de regresión logística.............................
Más detallesCómo obtener un Modelo de Regresión Logística Binaria con SPSS
Universitat de de Barcelona. Institut de de Ciències de de l Educació Cómo obtener un Modelo de Regresión Logística Binaria con SPSS Vanesa Berlanga-Silvente y Ruth Vilà-Baños Fecha de presentación:
Más detallesREGRESION simple. Correlación Lineal:
REGRESION simple Correlación Lineal: Dadas dos variable numéricas continuas X e Y, decimos que están correlacionadas si entre ambas variables hay cierta relación, de modo que puede predecirse (aproximadamente)
Más detallesAnálisis de Regresión Múltiple con Información Cualitativa: Variables Binarias o Ficticias
Análisis de Regresión Múltiple con Información Cualitativa: Variables Binarias o Ficticias Carlos Velasco 1 1 Departamento de Economía Universidad Carlos III de Madrid Econometría I Máster en Economía
Más detalles8.1. Introducción... 1. 8.2. Dependencia/independencia estadística... 2. 8.3. Representación gráfica: diagrama de dispersión... 3. 8.4. Regresión...
Tema 8 Análisis de dos variables: dependencia estadística y regresión Contenido 8.1. Introducción............................. 1 8.2. Dependencia/independencia estadística.............. 2 8.3. Representación
Más detallesCovarianza y coeficiente de correlación
Covarianza y coeficiente de correlación Cuando analizábamos las variables unidimensionales considerábamos, entre otras medidas importantes, la media y la varianza. Ahora hemos visto que estas medidas también
Más detallesTEMA 4: Variables binarias
TEMA 4: Variables binarias Econometría I M. Angeles Carnero Departamento de Fundamentos del Análisis Económico Curso 2011-12 Econometría I (UA) Tema 4: Variables binarias Curso 2011-12 1 / 51 Variables
Más detallesEl modelo Ordinal y el modelo Multinomial
El modelo Ordinal y el modelo Multinomial Microeconomía Cuantitativa R. Mora Departmento de Economía Universidad Carlos III de Madrid Esquema Motivación 1 Motivación 2 3 Motivación Consideramos las siguientes
Más detallesANÁLISIS DE DATOS NO NUMERICOS
ANÁLISIS DE DATOS NO NUMERICOS ESCALAS DE MEDIDA CATEGORICAS Jorge Galbiati Riesco Los datos categóricos son datos que provienen de resultados de experimentos en que sus resultados se miden en escalas
Más detallesESTIMACIÓN. puntual y por intervalo
ESTIMACIÓN puntual y por intervalo ( ) Podemos conocer el comportamiento del ser humano? Podemos usar la información contenida en la muestra para tratar de adivinar algún aspecto de la población bajo estudio
Más detallesModelos de regresión: lineal simple y regresión logística
14 Modelos de regresión: lineal simple y regresión logística Irene Moral Peláez 14.1. Introducción Cuando se quiere evaluar la relación entre una variable que suscita especial interés (variable dependiente
Más detallesMetodología. del ajuste estacional. Tablero de Indicadores Económicos
Metodología del ajuste estacional Tablero de Indicadores Económicos Metodología del ajuste estacional Componentes de una serie de tiempo Las series de tiempo están constituidas por varios componentes que,
Más detallesESTADÍSTICA APLICADA A LA INVESTIGACIÓN EN SALUD Medidas de Tendencia Central y Dispersión
Descargado desde www.medwave.cl el 13 Junio 2011 por iriabeth villanueva Medwave. Año XI, No. 3, Marzo 2011. ESTADÍSTICA APLICADA A LA INVESTIGACIÓN EN SALUD Medidas de Tendencia Central y Dispersión Autor:
Más detallesCORRELACIÓN Y PREDICIÓN
CORRELACIÓN Y PREDICIÓN 1. Introducción 2. Curvas de regresión 3. Concepto de correlación 4. Regresión lineal 5. Regresión múltiple INTRODUCCIÓN: Muy a menudo se encuentra en la práctica que existe una
Más detallesASOCIACIÓN LINEAL ENTRE VARIABLES CUANTITATIVAS: la correlación de Pearson
ASOCIACIÓN LINEAL ENTRE VARIABLES CUANTITATIVAS: la correlación de Pearson 3datos 2011 Análisis BIVARIADO de variables cuantitativas OBJETIVO DETERMINAR 1º) si existe alguna relación entre las variables;
Más detallesPuede considerarse un caso especial de l análisis de regresión en donde la variable dependiente es dicotómica («Sí» [1] o «No» [0])
Regresión logística Puede considerarse un caso especial de l análisis de regresión en donde la variable dependiente es dicotómica («Sí» [1] o «No» [0]) Se trata de calcular la probabilidad en la que una
Más detallesCómo hacer una Regresión Logística con SPSS paso a paso. (I)
DOCUWEB FABIS Dot. Núm 070202 Cómo hacer una Regresión Logística con SPSS paso a paso. (I) Aguayo Canela, Mariano. Servicio de Medicina Interna. Hospital Universitario Virgen Macarena. Sevilla Resumen
Más detallesLos valores de las respuesta son las puntuaciones que, de cada individuo, o cluster, obtenemos semanalmente durante cinco semanas consecutivas:
Sobre los modelos lineales mixtos Ejemplo: Recuperación de infarto. Para estudiar las diferencias entre dos procedimientos diferentes de recuperación de pacientes de un infarto, se consideraron dos grupos
Más detallesAplicación de los modelos de credit scoring para instituciones microfinacieras.
Econ. Reynaldo Uscamaita Huillca Aplicación de los modelos de credit scoring para instituciones microfinacieras. OBJETIVO Proporcionar al ejecutivo del sistema financiero un modelo solido que permita tomar
Más detallesOtras medidas descriptivas usuales
Tema 7 Otras medidas descriptivas usuales Contenido 7.1. Introducción............................. 1 7.2. Medidas robustas.......................... 2 7.2.1. Media recortada....................... 2 7.2.2.
Más detallesCapítulo X. Regresión Logística
Capítulo Regresión Logística Conceptos y definiciones Es un modelo clásico de regresión lineal simple o múltiple, pero donde la variale dependiente es inaria o dicotómica. 3 5 4 ÉITO FRACASO Es decir,
Más detallesTema 4 Técnicas de reducción de la dimensión
Tema 4 Técnicas de reducción de la dimensión José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid En qué dirección es conveniente proyectar? 2 1 0 1 2 1 0 1 2 Componentes principales
Más detallesEduardo Kido 26-Mayo-2004 ANÁLISIS DE DATOS
ANÁLISIS DE DATOS Hoy día vamos a hablar de algunas medidas de resumen de datos: cómo resumir cuando tenemos una serie de datos numéricos, generalmente en variables intervalares. Cuando nosotros tenemos
Más detalles1 Ejemplo de análisis descriptivo de un conjunto de datos
1 Ejemplo de análisis descriptivo de un conjunto de datos 1.1 Introducción En este ejemplo se analiza un conjunto de datos utilizando herramientas de estadística descriptiva. El objetivo es repasar algunos
Más detallesAnálisis de componentes principales
Capítulo 2 Análisis de componentes principales 2.1. INTRODUCCIÓN El Análisis de componentes principales trata de describir las características principales de un conjunto de datos multivariantes, en los
Más detallesModelos de elección binaria
Modelos de elección binaria Prof.: Begoña Álvarez García Econometría II 2007-2008 Estamos interesados en la ocurrencia o no-ocurrencia de un cierto evento (ej: participación en el mercado laboral; inversión
Más detallesMatemáticas 2º BTO Aplicadas a las Ciencias Sociales
Matemáticas 2º BTO Aplicadas a las Ciencias Sociales CONVOCATORIA EXTRAORDINARIA DE JUNIO 2014 MÍNIMOS: No son contenidos mínimos los señalados como de ampliación. I. PROBABILIDAD Y ESTADÍSTICA UNIDAD
Más detallesANÁLISIS DISCRIMINANTE
ANÁLISIS DISCRIMINANTE ANÁLISIS DISCRIMINANTE 1. Introducción 2. Etapas 3. Caso práctico Análisis de dependencias introducción varias relaciones una relación 1 variable dependiente > 1 variable dependiente
Más detallesIngeniería del Software I Clase de Testing Funcional 2do. Cuatrimestre de 2007
Enunciado Se desea efectuar el testing funcional de un programa que ejecuta transferencias entre cuentas bancarias. El programa recibe como parámetros la cuenta de origen, la de cuenta de destino y el
Más detallesTema 3: El modelo de regresión lineal múltiple
Econometría 1 curso 2009-2010 Tema 3: El modelo de regresión lineal múltiple Genaro Sucarrat (Departamento de Economía, UC3M) http://www.eco.uc3m.es/sucarrat/ Recordamos: El modelo de regresión lineal
Más detallesTema 5. Análisis de regresión (segunda parte) Estadística II, 2010/11
Tema 5 Análisis de regresión (segunda parte) Estadística II, 2010/11 Contenidos 5.1: Diagnóstico: Análisis de los residuos 5.2: La descomposición ANOVA (ANalysis Of VAriance) 5.3: Relaciones no lineales
Más detallesDIPLOMADO EN RELACIONES LABORALES Estadística Asistida por Ordenador Curso 2008-2009
Índice general 6. Regresión Múltiple 3 6.1. Descomposición de la variabilidad y contrastes de hipótesis................. 4 6.2. Coeficiente de determinación.................................. 5 6.3. Hipótesis
Más detallesUNIVERSIDAD CARLOS III DE MADRID MASTER EN CALIDAD TOTAL MANUAL DE SPSS
UNIVERSIDAD CARLOS III DE MADRID MASTER EN CALIDAD TOTAL MANUAL DE SPSS I. INTRODUCCIÓN Y MANEJO DE DATOS MANUAL DE SPSS 1 MASTER CALIDAD TOTAL 1/ INTRODUCCIÓN Las aplicaciones de la Estadística en la
Más detallesRELACIONES DE RECURRENCIA
Unidad 3 RELACIONES DE RECURRENCIA 60 Capítulo 5 RECURSIÓN Objetivo general Conocer en forma introductoria los conceptos propios de la recurrencia en relación con matemática discreta. Objetivos específicos
Más detallesGUIÓN TEMA 4. VARIABLES BINARIAS 4.1. Variables binarias
ECONOMETRIA I. Departamento de Fundamentos del Análisis Económico Universidad de Alicante. Curso 2011/12 GUIÓN TEMA 4. VARIABLES BINARIAS 4.1. Variables binarias Bibliografía apartados : Greene, 8.2 A.F.Gallastegui:
Más detallesProgramación Genética
Programación Genética Programación Genética consiste en la evolución automática de programas usando ideas basadas en la selección natural (Darwin). No sólo se ha utilizado para generar programas, sino
Más detallesPruebas de. Hipótesis
Pruebas de ipótesis Pruebas de ipótesis Otra manera de hacer inferencia es haciendo una afirmación acerca del valor que el parámetro de la población bajo estudio puede tomar. Esta afirmación puede estar
Más detallesProfr. Efraín Soto Apolinar. Función Inversa
Función Inversa Una función es una relación entre dos variables, de manera que para cada valor de la variable independiente eiste a lo más un único valor asignado a la variable independiente por la función.
Más detallesMónica López Ratón BIOSTATECH, Advice, Training & Innovation in Biostatistics, S.L. Octubre 2012. monica.lopez.raton@usc.es
Mónica López Ratón BIOSTATECH, Advice, Training & Innovation in Biostatistics, S.L. Octubre 01 monica.lopez.raton@usc.es Tablas de contingencia y tests asociados Índice 1. Datos categóricos. Tablas de
Más detallesTema 3. Espacios vectoriales
Tema 3. Espacios vectoriales Estructura del tema. Definición y propiedades. Ejemplos. Dependencia e independencia lineal. Conceptos de base y dimensión. Coordenadas Subespacios vectoriales. 0.1. Definición
Más detallesDecisión: Indican puntos en que se toman decisiones: sí o no, o se verifica una actividad del flujo grama.
Diagrama de Flujo La presentación gráfica de un sistema es una forma ampliamente utilizada como herramienta de análisis, ya que permite identificar aspectos relevantes de una manera rápida y simple. El
Más detalles1.4.- D E S I G U A L D A D E S
1.4.- D E S I G U A L D A D E S OBJETIVO: Que el alumno conozca y maneje las reglas empleadas en la resolución de desigualdades y las use para determinar el conjunto solución de una desigualdad dada y
Más detallesEstudio de casos y controles sobre factores de riesgo en el cáncer colorrectal
Estudio de casos y controles sobre factores de riesgo en el cáncer colorrectal Objetivos del estudio Estimar el riesgo de padecer cáncer colorrectal asociado a una serie de variables Población Casos Controles
Más detallesANÁLISIS DE VARIANZA EMPLEANDO EXCEL y WINSTATS
ANÁLISIS DE VARIANZA EMPLEANDO EXCEL y WINSTATS 1) INTRODUCCIÓN El análisis de varianza es una técnica que se puede utilizar para decidir si las medias de dos o más poblaciones son iguales. La prueba se
Más detallesMaterial del curso Análisis de datos procedentes de investigaciones mediante programas informáticos Manuel Miguel Ramos Álvarez
Curso de Análisis de investigaciones con programas Informáticos 1 UNIVERSIDAD DE JAÉN Material del curso Análisis de datos procedentes de investigaciones mediante programas informáticos Manuel Miguel Ramos
Más detallesIntroducción a la Econometría
Introducción a la Econometría Curso 2009/2010 Seriedeproblemas1 1.- Considere la siguiente distribución de probabilidad: Llueve (X=0) No llueve (X=1) Total Tiempo de viaje largo (Y=0) 0.15 0.07 0.22 Tiempo
Más detallesREPASO CONCEPTOS BÁSICOS DE ESTADÍSTICA. DISTRIBUCIÓN NORMAL.
REPASO COCEPTOS BÁSICOS DE ESTADÍSTICA. DISTRIBUCIÓ ORMAL. Éste es un breve repaso de conceptos básicos de estadística que se han visto en cursos anteriores y que son imprescindibles antes de acometer
Más detallesAplicaciones de Estadística Descriptiva
Aplicaciones de Estadística Descriptiva Contenidos de la presentación Funciones estadísticas en Excel. Gráficos. El módulo de análisis de datos y las tablas dinámicas de Excel. Información Intentaremos
Más detallesIBM SPSS Regression 20
IBM SPSS Regression 20 Nota: Antes de utilizar esta información y el producto que admite, lea la información general en Avisos el p. 46. Esta edición se aplica a IBM SPSS Statistics 20 y a todas las versiones
Más detallesEl Análisis de la Regresión a través de SPSS
El Análisis de la Regresión a través de SPSS M. D olores M artínez M iranda Profesora del D pto. E stadística e I.O. U niversidad de G ranada Referencias bibliográficas. Hair, J.F., Anderson, R.E., Tatham,
Más detallesTEMA 2. FILOSOFÍA DE LOS GRÁFICOS DE CONTROL. Principios básicos de los gráficos de control. Análisis de patrones.
TEMA 2. FILOSOFÍA DE LOS GRÁFICOS DE CONTROL. Principios básicos de los gráficos de control. Análisis de patrones. La herramienta que nos indica si el proceso está o no controlado o Estado de Control son
Más detallesConceptos Fundamentales. Curso de Estadística TAE, 2005 J.J. Gómez-Cadenas
Conceptos Fundamentales Curso de Estadística TAE, 2005 J.J. Gómez-Cadenas Análisis de datos en física de partículas Experimento en física de partículas: Observación de n sucesos de un cierto tipo (colisiones
Más detalles1.1. Introducción y conceptos básicos
Tema 1 Variables estadísticas Contenido 1.1. Introducción y conceptos básicos.................. 1 1.2. Tipos de variables estadísticas................... 2 1.3. Distribuciones de frecuencias....................
Más detallesEstas visiones de la información, denominadas vistas, se pueden identificar de varias formas.
El primer paso en el diseño de una base de datos es la producción del esquema conceptual. Normalmente, se construyen varios esquemas conceptuales, cada uno para representar las distintas visiones que los
Más detallesESTADÍSTICA APLICADA A LA INVESTIGACIÓN EN SALUD Construcción de una Base de Datos
Descargado desde www.medwave.cl el 13 Junio 2011 por iriabeth villanueva Medwave. Año XI, No. 2, Febrero 2011. ESTADÍSTICA APLICADA A LA INVESTIGACIÓN EN SALUD Construcción de una Base de Datos Autor:
Más detallesIndicaciones específicas para los análisis estadísticos.
Tutorial básico de PSPP: Vídeo 1: Describe la interfaz del programa, explicando en qué consiste la vista de datos y la vista de variables. Vídeo 2: Muestra cómo crear una base de datos, comenzando por
Más detalles2 Teoría de colas o líneas de espera
2 Teoría de colas o líneas de espera El tráfico en redes se puede modelar con la ayuda de la teoría de colas, es por ello ue es importante estudiarlas y comprenderlas. Existen varias definiciones sobre
Más detallesTEMA 4: Introducción al Control Estadístico de Procesos
TEMA 4: Introducción al Control Estadístico de Procesos 1 Introducción 2 Base estadística del diagrama de control 3 Muestreo y agrupación de datos 4 Análisis de patrones en diagramas de control 1. Introducción
Más detallesANÁLISIS DE BALANCES CON EL NUEVO PGC DE 2008
ANÁLISIS DE BALANCES CON EL NUEVO PGC DE 2008 Índice: 1.- ANÁLISIS DE BALANCES. GENERALIDADES...2 2.- EL FONDO DE MANIOBRA...2 3.- ANÁLISIS FINANCIERO DEL BALANCE...3 4.- ANÁLISIS ECONÓMICO DEL BALANCE...6
Más detalles(.$263*7.5"4+%#,"8..9$ $.$ - -. 7.# "4< $ 8 $ 7 "% @
!"#$%!& ' ($ 2 ))!"#$%& '$()!& *($$+%( & * $!" "!,"($"$ -(.$!- ""& +%./$$&,-,$,". - %#,"0# $!01 "23(.4 $4$"" ($" $ -.#!/ ". " " ($ "$%$(.$2.3!- - *.5.+%$!"$,"$ (.$263*7.5"4+%#,"8..9$ $.$ - $,"768$"%$,"$%$!":7#;
Más detallesSemana de dieta (X) 1 2 3 4 5 Peso en Kg (Y) 88.5 87 84 82.5 79
. Una persona se somete a una dieta de adelgazamiento durante cinco semanas. A continuación se detalla su peso al término de cada una de esas semanas: Semana de dieta X) 2 3 4 Peso en Kg Y) 88. 87 84 82.
Más detallesPruebas de Acceso a las Universidades de Castilla y León
Pruebas de Acceso a las Universidades de Castilla y León MATEMÁTICA APLICADA A LA CIENCIA OCIALE EJERCICIO Nº páginas 2 Tablas OPTATIVIDAD: EL ALUMNO DEBERÁ ECOGER UNA DE LA DO OPCIONE Y DEARROLLAR LA
Más detallesMedidas de tendencia central o de posición: situación de los valores alrededor
Tema 10: Medidas de posición y dispersión Una vez agrupados los datos en distribuciones de frecuencias, se calculan unos valores que sintetizan la información. Estudiaremos dos grandes secciones: Medidas
Más detallesIntroducción a la Econometría (LE y LADE, mañana) Prof. Magdalena Cladera ANÁLISIS DE REGRESIÓN CON EXCEL Y SPSS
Introducción a la Econometría (LE y LADE, mañana) Prof. Magdalena Cladera ANÁLISIS DE REGRESIÓN CON EXCEL Y SPSS ESTIMACIÓN DE UN MODELO DE REGRESIÓN LINEAL CON EXCEL La Herramienta para análisis Regresión
Más detallesSe podría entender como una matriz de filas y columnas. Cada combinación de fila y columna se denomina celda. Por ejemplo la celda A1, B33, Z68.
Departamento de Economía Aplicada: UDI de Estadística. Universidad Autónoma de Madrid Notas sobre el manejo de Excel para el análisis descriptivo y exploratorio de datos. (Descriptiva) 1 1 Introducción
Más detallesMétodos Iterativos para Resolver Sistemas Lineales
Métodos Iterativos para Resolver Sistemas Lineales Departamento de Matemáticas, CCIR/ITESM 17 de julio de 2009 Índice 3.1. Introducción............................................... 1 3.2. Objetivos................................................
Más detallesGrado en Finanzas y Contabilidad
Econometría Grado en Finanzas y Contabilidad Apuntes basados en el libro Introduction to Econometrics: A modern Approach de Wooldridge 5.2 Estimadores de Variables Instrumentales La endogeneidad aparece
Más detallesFacultad de Ciencias
Facultad de Ciencias Trabajo Fin de Grado Grado en Estadística Métodos de predicción de fuga con grandes volúmenes de datos Autor: D. Raquel García Fernández Tutor/es: D. Eusebio Arenal Gutiérrez Página
Más detalles6 ANÁLISIS DE INDEPENDENCIA O ASOCIACIÓN ENTRE DOS ATRIBUTOS
6 ANÁLISIS DE INDEPENDENCIA O ASOCIACIÓN ENTRE DOS ATRIBUTOS Esquema del capítulo Objetivos 6.1. 6.. 6.3. 6.4. ANÁLISIS DE INDEPENDENCIA O ASOCIACIÓN ENTRE DOS ATRIBUTOS COEFICIENTES DE CONTINGENCIA LA
Más detallesAlvaro J. Riascos Villegas Universidad de los Andes y Quantil. Marzo 14 de 2012
Contenido Motivación Métodos computacionales Integración de Montecarlo Muestreo de Gibbs Rejection Muestreo Importante Metropolis - Hasting Markov Chain Montecarlo Method Complemento ejemplos libro: Bayesian
Más detalles1.6.- CLASIFICACION Y OPERACIONES DE FUNCIONES
1.6.- CLASIFICACION Y OPERACIONES DE FUNCIONES OBJETIVO.- Conocer y manejar las operaciones definidas entre funciones así como conocer la clasificación de éstas y sus características. 1.6.1.- Operaciones
Más detalles1 Introducción al SPSS
Breve guión para las prácticas con SPSS 1 Introducción al SPSS El programa SPSS está organizado en dos bloques: el editor de datos y el visor de resultados. En la barra de menú (arriba de la pantalla)
Más detallesANÁLISIS DESCRIPTIVO CON SPSS
ESCUELA SUPERIOR DE INFORMÁTICA Prácticas de Estadística ANÁLISIS DESCRIPTIVO CON SPSS 1.- INTRODUCCIÓN Existen dos procedimientos básicos que permiten describir las propiedades de las distribuciones:
Más detallesMODELO PREDICTIVO DE RIESGO DE MOROSIDAD PARA CRÉDITOS BANCARIOS USANDO DATOS SIMULADOS
INVESTIGACIÓN MODELO PREDICTIVO DE RIESGO DE MOROSIDAD PARA CRÉDITOS BANCARIOS USANDO DATOS SIMULADOS CLAUDIO ALFREDO LÓPEZ MIRANDA Un problema grave en las instituciones de crédito son los préstamos no
Más detallesESTUDIO COMPARATIVO DE MODELOS FLEXIBLES DE DISCRIMINACIÓN DE LA CIRROSIS EN PACIENTES CON AFECTACIÓN HEPÁTICA
VI Congreso Galego de Estatística e Investigación de Operacións Vigo 5-7 de Novembro de 2003 ESTUDIO COMPARATIVO DE MODELOS FLEXIBLES DE DISCRIMINACIÓN DE LA CIRROSIS EN PACIENTES CON AFECTACIÓN HEPÁTICA
Más detallesCAPÍTULO III. FUNCIONES
CAPÍTULO III LÍMITES DE FUNCIONES SECCIONES A Definición de límite y propiedades básicas B Infinitésimos Infinitésimos equivalentes C Límites infinitos Asíntotas D Ejercicios propuestos 85 A DEFINICIÓN
Más detallesANÁLISIS DE ENCUESTAS
ANÁLISIS DE ENCUESTAS TÉCNICAS MULTIVARIANTES 1. Introducción 2. Clasificación de las técnicas 3. Etapas de análisis 4. Supuestos básicos 5. Valores perdidos y anómalos introducción Definición. i ió -
Más detallesFundamentos de Investigación de Operaciones Investigación de Operaciones 1
Fundamentos de Investigación de Operaciones Investigación de Operaciones 1 1 de agosto de 2003 1. Introducción Cualquier modelo de una situación es una simplificación de la situación real. Por lo tanto,
Más detalles8. Estimación puntual
8. Estimación puntual Estadística Ingeniería Informática Curso 2009-2010 Estadística (Aurora Torrente) 8. Estimación puntual Curso 2009-2010 1 / 30 Contenidos 1 Introducción 2 Construcción de estimadores
Más detallesPuede dar pérdida un Casino?
Puede dar pérdida un Casino? por Ernesto Mordecki En esta nota calculamos la probabilidad de que pierda la banca en la ruleta, en un período dado de tiempo. uestro enfoque consiste en determinar cuantas
Más detallesIBM SPSS Regression 19
IBM SPSS Regression 19 Note: Before using this information and the product it supports, read the general information under Notices el p. 47. This document contains proprietary information of SPSS Inc,
Más detallesAnálisis Estadístico de Datos Climáticos
Análisis Estadístico de Datos Climáticos Análisis de agrupamiento (o clusters) (Wilks, Cap. 14) Facultad de Ciencias Facultad de Ingeniería 2013 Objetivo Idear una clasificación o esquema de agrupación
Más detalles1. Dominio, simetría, puntos de corte y periodicidad
Estudio y representación de funciones 1. Dominio, simetría, puntos de corte y periodicidad 1.1. Dominio Al conjunto de valores de x para los cuales está definida la función se le denomina dominio. Se suele
Más detallesLecturas previas Cuando llegue a su primera sesión de laboratorio debe haber estudiado el contenido de la lectura que aparece a continuación.
Laboratorio 1 Medición e incertidumbre La descripción de los fenómenos naturales comienza con la observación; el siguiente paso consiste en asignar a cada cantidad observada un número, es decir en medir
Más detallesREGRESIÓN LINEAL MÚLTIPLE
REGRESIÓN LINEAL MÚLTIPLE.- Planteamiento general....- Métodos para la selección de variables... 5 3.- Correlaciones parciales y semiparciales... 8 4.- Multicolinealidad en las variables explicativas...
Más detallesCurso Práctico de Bioestadística Con Herramientas De Excel
Curso Práctico de Bioestadística Con Herramientas De Excel Fabrizio Marcillo Morla MBA barcillo@gmail.com (593-9) 4194239 Fabrizio Marcillo Morla Guayaquil, 1966. BSc. Acuicultura. (ESPOL 1991). Magister
Más detallesMatrices equivalentes. El método de Gauss
Matrices equivalentes. El método de Gauss Dada una matriz A cualquiera decimos que B es equivalente a A si podemos transformar A en B mediante una combinación de las siguientes operaciones: Multiplicar
Más detallesUNIDAD 4: MEDIDAS DE TENDENCIA CENTRAL
UNIDAD 4: MEDIDAS DE TENDENCIA CENTRAL Objetivo terminal: Calcular e interpretar medidas de tendencia central para un conjunto de datos estadísticos. Objetivos específicos: 1. Mencionar las características
Más detallesTEMA 5 Variables ficticias
TEMA 5 Variables ficticias Cómo describir información cualitativa Muchas veces en el modelo de regresión aparecen factores cualitativos (sexo, raza, estado civil,.). En estos casos la información relevante
Más detalles1. Ecuaciones no lineales
1. Ecuaciones no lineales 1.1 Ejercicios resueltos Ejercicio 1.1 Dada la ecuación xe x 1 = 0, se pide: a) Estudiar gráficamente sus raíces reales y acotarlas. b) Aplicar el método de la bisección y acotar
Más detallesHay diferencias en la media del HOMA entre los diabéticos y los no diabéticos? Resumen del procesamiento de los casos
Test de hipótesis t de Student Hay diferencias en la media del HOMA entre los diabéticos y los no diabéticos? Resumen del procesamiento de los casos HOMA Casos Válidos Perdidos Total N Porcentaje N Porcentaje
Más detallesAnálisis y cuantificación del Riesgo
Análisis y cuantificación del Riesgo 1 Qué es el análisis del Riesgo? 2. Métodos M de Análisis de riesgos 3. Método M de Montecarlo 4. Modelo de Análisis de Riesgos 5. Qué pasos de deben seguir para el
Más detallesGráficas de caja. El borde derecho de la caja es el tercer cuartil, Q 3, que es la mediana de los valores que están por encima de la mediana.
LECCIÓN CONDENSADA 2.1 Gráficas de caja En esta lección crearás e interpretarás las gráficas de caja para conjuntos de datos usarás el rango intercuartil (IQR) para identificar valores extremos potenciales
Más detallesCORRELACIONES CON SPSS
ESCUEL SUPERIOR DE INFORMÁTIC Prácticas de Estadística CORRELCIONES CON SPSS 1.- INTRODUCCIÓN El concepto de relación o correlación entre dos variables se refiere al grado de parecido o variación conjunta
Más detallesÍNDICE 1. INTRODUCCIÓN... 4 2. PARTICIPANTES... 5. 2.1. Participantes por sector... 5. 2.2. Participantes por edad... 6
INFORME DE RESULTADOS DEL ESTUDIO DE SATISFACCIÓN DE USUARIOS UNIVERSIDAD DE ALMERÍA 2012 SERVICIO DE PLANIFICACIÓN, EVALUACIÓN Y CALIDAD CALIDAD DE LOS SERVICIOS ENERO 2013 ÍNDICE 1. INTRODUCCIÓN...
Más detallesAula Banca Privada. La importancia de la diversificación
Aula Banca Privada La importancia de la diversificación La importancia de la diversificación La diversificación de carteras es el principio básico de la operativa en mercados financieros, según el cual
Más detallesProcesamiento de información para la investigación utilizando el programado Excel recopilados. Los participantes rán en
Procesamiento de información para la investigación utilizando el programado Excel recopilados. Los participantes rán en Julio E. Rodríguez Torres el Joel uso O. Lucena de Excel. Quiles Centro para la Excelencia
Más detallesMétodos generales de generación de variables aleatorias
Tema Métodos generales de generación de variables aleatorias.1. Generación de variables discretas A lo largo de esta sección, consideraremos una variable aleatoria X cuya función puntual es probabilidad
Más detallesESTADÍSTICA DESCRIPTIVA CON SPSS
ESTADÍSTICA DESCRIPTIVA CON SPSS (2602) Estadística Económica Joaquín Alegre y Magdalena Cladera SPSS es una aplicación para el análisis estadístico. En este material se presentan los procedimientos básicos
Más detallesMETODOS ESTADISTICOS.
AREA DE ESTADISTICA E INVESTIGACION DE OPERACIONES PROGRAMA: METODOS ESTADISTICOS. PROYECTO: SERVICIO DE CONSULTORIA ESTADISTICA. SERVICIO DE CONSULTORIA ESTADISTICA. Diseño con propósitos de un posterior
Más detalles