Regresión Polinomial y Regresión Logística

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Regresión Polinomial y Regresión Logística"

Transcripción

1 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 1 Regresión Polinomial y Regresión Logística M.L. Gámiz Pérez Departamento Estadística e Inv. Operativa Universidad de Granada 30 de octubre de 2013

2 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 2 Contenido Regresión Polinomial Introducción y ejemplos Aproximaciones alternativas Regresión Logística Introducción Estimación de los parámetros del modelo Evaluación del modelo Contraste de regresión Estudio de la bondad del ajuste Tests de significación de los coeficientes Capacidad predictiva del modelo Regresión Logística Múltiple Análisis de residuos Regresión Logística Multinomial

3 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 3 Introducción Polinomio de segundo orden: Y = β 0 + β 1 X + β 2 X 2 + ɛ (1) Y = β 0 + β 1 X 1 + β 2 X 2 + β 11 X1 2 + β 22X2 2 + β 12X 1 X 2 + ɛ (2) Se usan cuando la respuesta es curvilínea Y = f (X ) para f compleja desarrollo en serie de Taylor

4 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 4 Introducción Polinomio de segundo orden: Y = β 0 + β 1 X + β 2 X 2 + ɛ (1) Y = β 0 + β 1 X 1 + β 2 X 2 + β 11 X1 2 + β 22X2 2 + β 12X 1 X 2 + ɛ (2) Se usan cuando la respuesta es curvilínea Y = f (X ) para f compleja desarrollo en serie de Taylor Modelo de orden k en 1 variable Y = β 0 + β 1 X β k X k + ɛ Si X j = X j, para j = 1,..., k: Modelo de regresión lineal múltiple

5 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 5 Introducción Polinomio de segundo orden: Y = β 0 + β 1 X + β 2 X 2 + ɛ (1) Y = β 0 + β 1 X 1 + β 2 X 2 + β 11 X1 2 + β 22X2 2 + β 12X 1 X 2 + ɛ (2) Se usan cuando la respuesta es curvilínea Y = f (X ) para f compleja desarrollo en serie de Taylor Modelo de orden k en 1 variable Y = β 0 + β 1 X β k X k + ɛ Si X j = X j, para j = 1,..., k: Modelo de regresión lineal múltiple Orden del modelo: Principio de PARSIMONIA

6 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 6 Principios básicos Interpretación: β0 : Promedio de Y cuando X = 0 β 1 : Parámetro de efecto lineal β 2 : Parámetro de efecto cuadrático, etc...

7 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 7 Principios básicos Interpretación: β0 : Promedio de Y cuando X = 0 β 1 : Parámetro de efecto lineal β 2 : Parámetro de efecto cuadrático, etc... Estrategia para la construcción del modelo: Métodos de selección de variables (adelante/atrás). Se debe restringir a polinomios de orden 1 o 2.

8 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 8 Principios básicos Interpretación: β0 : Promedio de Y cuando X = 0 β 1 : Parámetro de efecto lineal β 2 : Parámetro de efecto cuadrático, etc... Estrategia para la construcción del modelo: Métodos de selección de variables (adelante/atrás). Se debe restringir a polinomios de orden 1 o 2. Extrapolación!!

9 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 9 Principios básicos Interpretación: β0 : Promedio de Y cuando X = 0 β 1 : Parámetro de efecto lineal β 2 : Parámetro de efecto cuadrático, etc... Estrategia para la construcción del modelo: Métodos de selección de variables (adelante/atrás). Se debe restringir a polinomios de orden 1 o 2. Extrapolación!! Mal acondicionamiento: A medida que aumenta el orden del polinomio la matriz X X se vuelve mal acondicionada.

10 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 10 Principios básicos Interpretación: β0 : Promedio de Y cuando X = 0 β 1 : Parámetro de efecto lineal β 2 : Parámetro de efecto cuadrático, etc... Estrategia para la construcción del modelo: Métodos de selección de variables (adelante/atrás). Se debe restringir a polinomios de orden 1 o 2. Extrapolación!! Mal acondicionamiento: A medida que aumenta el orden del polinomio la matriz X X se vuelve mal acondicionada. Multicolinealidad!!

11 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 11 Principios básicos Interpretación: β0 : Promedio de Y cuando X = 0 β 1 : Parámetro de efecto lineal β 2 : Parámetro de efecto cuadrático, etc... Estrategia para la construcción del modelo: Métodos de selección de variables (adelante/atrás). Se debe restringir a polinomios de orden 1 o 2. Extrapolación!! Mal acondicionamiento: A medida que aumenta el orden del polinomio la matriz X X se vuelve mal acondicionada. Multicolinealidad!! Jerarquía: Y = β 0 + β 1 X + β 2 X 2 + β 3 X 3 + ɛ Y = β 0 + β 1 X + β 3 X 3 + ɛ SI NO

12 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 12 Extensiones Análisis de regresión usando funciones base... Regresion trigonométrica Y = d β j X j + j=0 λ [γ k cos(kx ) + δ k sin(kx )] + ɛ k=1 con d = 2 y λ a determinar.

13 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 13 Extensiones Análisis de regresión usando funciones base... Regresion trigonométrica Y = d β j X j + j=0 λ [γ k cos(kx ) + δ k sin(kx )] + ɛ k=1 con d = 2 y λ a determinar. Regresión por splines Modelo lineal con un nodo (x 0 ) Y = β 0 + β 1a X + β 1b (X x 0 ) + + ɛ con (X x 0 ) + = { 1 si X > x0 0 en otro caso

14 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 14 El modelo de regresión con respuesta binaria Se pretende caracterizar la relación entre una variable respuesta Y y un conjunto de variables independientes X 1, X 2,..., X p Y = f (X 1, X 2,..., X p )

15 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 15 El modelo de regresión con respuesta binaria Se pretende caracterizar la relación entre una variable respuesta Y y un conjunto de variables independientes X 1, X 2,..., X p Y = f (X 1, X 2,..., X p ) Hipótesis del modelo de regresión lineal: Normalidad y varianza constante

16 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 16 El modelo de regresión con respuesta binaria Se pretende caracterizar la relación entre una variable respuesta Y y un conjunto de variables independientes X 1, X 2,..., X p Y = f (X 1, X 2,..., X p ) Hipótesis del modelo de regresión lineal: Normalidad y varianza constante Estrategias: mínimos cuadrados ponderados transformación de los datos

17 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 17 El modelo de regresión con respuesta binaria Se pretende caracterizar la relación entre una variable respuesta Y y un conjunto de variables independientes X 1, X 2,..., X p Y = f (X 1, X 2,..., X p ) Hipótesis del modelo de regresión lineal: Normalidad y varianza constante Estrategias: mínimos cuadrados ponderados transformación de los datos Modelo Lineal Generalizado: La variable respuesta pertenece a la familia exponencial: Normal, Poisson, Binomial, Exponencial, Gamma, etc.

18 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 18 El modelo de regresión con respuesta binaria simple La variable respuesta representa la ocurrencia o no de un suceso, por ejemplo: que un estudiante apruebe o no un examen; que un transplante de corazón sea aceptado o no; que una empresa llegue a estar en problemas financieros o no; que un paciente de un hospital sobreviva o no antes de que le den de alta; que un cliente devuelva un crédito bancario o no.

19 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 19 El modelo de regresión con respuesta binaria simple La variable respuesta representa la ocurrencia o no de un suceso, por ejemplo: que un estudiante apruebe o no un examen; que un transplante de corazón sea aceptado o no; que una empresa llegue a estar en problemas financieros o no; que un paciente de un hospital sobreviva o no antes de que le den de alta; que un cliente devuelva un crédito bancario o no. Se considera la siguiente codificación de Y : { 1, el suceso tiene lugar Y = 0, el suceso no tiene lugar

20 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 20 El modelo de regresión con respuesta binaria simple La variable respuesta representa la ocurrencia o no de un suceso, por ejemplo: que un estudiante apruebe o no un examen; que un transplante de corazón sea aceptado o no; que una empresa llegue a estar en problemas financieros o no; que un paciente de un hospital sobreviva o no antes de que le den de alta; que un cliente devuelva un crédito bancario o no. Se considera la siguiente codificación de Y : { 1, el suceso tiene lugar Y = 0, el suceso no tiene lugar Se considera un solo regresor o variable explicativa X Hipótesis: P(Y = 1 X = x) es monótona (creciente o decreciente) en x.

21 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 21 El modelo lineal no es aplicable Supongamos el siguiente modelo Y = β 0 + β 1 X + ɛ, donde ɛ representa el error, con ɛ N(0, σ): E(Y X = x) = β 0 + β 1 x

22 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 22 El modelo lineal no es aplicable Supongamos el siguiente modelo Y = β 0 + β 1 X + ɛ, donde ɛ representa el error, con ɛ N(0, σ): E(Y X = x) = β 0 + β 1 x Si Y es binaria, entonces para un individuo i: Y i = 1 ó Y i = 0 y... { 1 β0 β ɛ i = 1 X i, si Y i = 1 β 0 β 1 X i, si Y i = 0, Además... Var(ɛ i ) = Var(Y i ) = E(Y i E(Y i )) 2 = (1 E(Y i ))E(Y i ).

23 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 23 Ejemplo Notación: E(Y i X i ) = π(x i ) = π i Queremos evaluar la probabilidad de desarrollar una enfermedad cardiaca en un determinado intervalo de tiempo π i, para un sujeto con un determinado nivel de colesterol X i. Es lógico esperar πi 1 a medida que X i, y πi 0 a medida que X i 0. Con datos binarios, E(Y X = x) [0, 1].

24 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 24 Ejemplo Notación: E(Y i X i ) = π(x i ) = π i Queremos evaluar la probabilidad de desarrollar una enfermedad cardiaca en un determinado intervalo de tiempo π i, para un sujeto con un determinado nivel de colesterol X i. Es lógico esperar πi 1 a medida que X i, y πi 0 a medida que X i 0. Con datos binarios, E(Y X = x) [0, 1]. El cambio en E(Y x) por unidad de cambio en x se va haciendo progresivamente menor a medida que la media condicional se aproxima a 0 y 1.

25 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 25 Ejemplo Notación: E(Y i X i ) = π(x i ) = π i Queremos evaluar la probabilidad de desarrollar una enfermedad cardiaca en un determinado intervalo de tiempo π i, para un sujeto con un determinado nivel de colesterol X i. Es lógico esperar πi 1 a medida que X i, y πi 0 a medida que X i 0. Con datos binarios, E(Y X = x) [0, 1]. El cambio en E(Y x) por unidad de cambio en x se va haciendo progresivamente menor a medida que la media condicional se aproxima a 0 y 1. Se podría esperar una curva como en la figura siguiente...

26 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 26 Función Logística

27 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 27 Función de distribución logística π(x) = exp(β 0 + β 1 x) 1 + exp(β 0 + β 1 x) Propiedades: Flexibilidad; Interpretación práctica; Transformación logit: g(x) = ln π(x) 1 π(x) = β 0 + β 1 x

28 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 28 Función de distribución logística π(x) = exp(β 0 + β 1 x) 1 + exp(β 0 + β 1 x) Propiedades: Flexibilidad; Interpretación práctica; Transformación logit: g(x) = ln π(x) 1 π(x) = β 0 + β 1 x Otras funciones: Modelo Probit

29 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 29 Modelo de regresión logística binario Y {X =x} Binomial (1, π(x)) π(x) = exp(β 0 + β 1 x) 1 + exp(β 0 + β 1 x)

30 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 30 Modelo de regresión logística binario Y {X =x} Binomial (1, π(x)) π(x) = exp(β 0 + β 1 x) 1 + exp(β 0 + β 1 x) Es un método predictivo y explicativo: Finalidades:

31 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 31 Modelo de regresión logística binario Y {X =x} Binomial (1, π(x)) π(x) = exp(β 0 + β 1 x) 1 + exp(β 0 + β 1 x) Es un método predictivo y explicativo: Finalidades: 1. Cuantificar la importancia de la relación existente entre la variable X y la variable Y.

32 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 32 Modelo de regresión logística binario Y {X =x} Binomial (1, π(x)) π(x) = exp(β 0 + β 1 x) 1 + exp(β 0 + β 1 x) Es un método predictivo y explicativo: Finalidades: 1. Cuantificar la importancia de la relación existente entre la variable X y la variable Y. 2. Clasificar individuos dentro de las categorías (presente/ausente) de la variable Y en función de la probabilidad que tengan de pertenecer a cada una de ellas en presencia de determinada información (X ).

33 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 33 Interpretación de los coeficientes: odds (ventaja) Definición: O(x) = π(x) 1 π(x)

34 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 34 Interpretación de los coeficientes: odds (ventaja) Definición: O(x) = π(x) 1 π(x) Interpretación: Cuánto más probable es que ocurra un suceso frente a que no ocurra Ejemplo: Si π(x) = 0,75 se tiene un odds de 3 : 1. Modelo log-lineal... g(x) = ln π(x) 1 π(x) = β 0 + β 1 x

35 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 35 Interpretación de los coeficientes: odds ratio (OR) Sean X 1 y X 2 dos perfiles de la variable X y sean π j = π(x j ), j = 1, 2; El logaritmo de la razón de los odds ln Es decir... [ π1 1 π 1 π 2 1 π 2 ] = ln [ π1 (1 π 2 ) π 2 (1 π 1 ) ln(or) = β 1 (X 1 X 2 ). ] = β 1 (X 1 X 2 ).

36 Caso particular: X 1 = X se tiene que ln(or) = β 1 y equivalentemente OR = e β 1. Interpretación del signo: OR > 1 OR < 1 OR = 1 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 36 Interpretación de los coeficientes: odds ratio (OR) Sean X 1 y X 2 dos perfiles de la variable X y sean π j = π(x j ), j = 1, 2; El logaritmo de la razón de los odds ln Es decir... [ π1 1 π 1 π 2 1 π 2 ] = ln [ π1 (1 π 2 ) π 2 (1 π 1 ) ln(or) = β 1 (X 1 X 2 ). ] = β 1 (X 1 X 2 ).

37 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 37 El método de máxima-verosimilitud Datos: {(X i, Y i ); i = 1,..., n} Contribución del dato (X i, Y i ): L i = π(x i ) Y i [1 π(x i )] 1 Y i

38 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 38 El método de máxima-verosimilitud Datos: {(X i, Y i ); i = 1,..., n} Contribución del dato (X i, Y i ): L i = π(x i ) Y i [1 π(x i )] 1 Y i Función de verosimilitud: L(β 0, β 1 ) = n i=1 L i Log-verosimilitud: l(β 0, β 1 ) = n i=1 {Y i ln(π(x i )) + (1 Y i ) ln(1 π(x i ))}

39 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 39 El método de máxima-verosimilitud Datos: {(X i, Y i ); i = 1,..., n} Contribución del dato (X i, Y i ): L i = π(x i ) Y i [1 π(x i )] 1 Y i Función de verosimilitud: L(β 0, β 1 ) = n i=1 L i Log-verosimilitud: l(β 0, β 1 ) = n i=1 {Y i ln(π(x i )) + (1 Y i ) ln(1 π(x i ))} Diferenciando con respecto a β 0 y β 1 n i=1 [Y i π(x i )] = 0 n i=1 X i[y i π(x i )] = 0

40 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 40 El método de máxima-verosimilitud Datos: {(X i, Y i ); i = 1,..., n} Contribución del dato (X i, Y i ): L i = π(x i ) Y i [1 π(x i )] 1 Y i Función de verosimilitud: L(β 0, β 1 ) = n i=1 L i Log-verosimilitud: l(β 0, β 1 ) = n i=1 {Y i ln(π(x i )) + (1 Y i ) ln(1 π(x i ))} Diferenciando con respecto a β 0 y β 1 n i=1 [Y i π(x i )] = 0 n i=1 X i[y i π(x i )] = 0 Si no hay una separación completa existe solución. Métodos numéricos: Newton-Raphson (veremos en el caso múltiple). Solución inicial: Análisis Discriminante (Normalidad de las variables explicativas)

41 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 41 Ejemplo: Hosmer y Lemeshow (1989), pg. 2 Se pretende estudiar la influencia de la edad (X = Edad) en la presencia/ausencia de evidencia de enfermedad coronaria (Y = CHD). Se seleccionaron 100 sujetos para participar en el estudio. La tabla siguiente representa la información referente a los primeros individuos ID GrupoEdad Edad CHD

42 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 42 Diagrama de dispersión { 1, enfermedad está presente Y = 0, otro caso

43 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 43 E(Y x) por grupos de edad

44 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 44 Resultado del ajuste Modelo: ln P(CHD=1 Edad) P(CHD=0 Edad) = β 0 + β 1 Edad Coeficientes estimados (SPSS): Coeficiente estimado Error estándar Edad β1 = 0,111 0,024 Constante β0 = 5,309 1,134 Log-verosimilitud = 53,6765

45 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 45 Resultado del ajuste Modelo: ln P(CHD=1 Edad) P(CHD=0 Edad) = β 0 + β 1 Edad Coeficientes estimados (SPSS): Coeficiente estimado Error estándar Edad β1 = 0,111 0,024 Constante β0 = 5,309 1,134 Log-verosimilitud = 53,6765 Probabilidad estimada de presentar la enfermedad en función de la Edad: π(edad) = Interpretación... exp( 5, ,111Edad) 1 + exp( 5, ,111Edad)

46 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 46 Contraste de regresión Después de ajustar el modelo evaluamos la significación de la(s) variable(s) involucrada(s). No estudiamos aún la bondad de ajuste (términos absolutos): representan los valores ajustados a los valores observados? Comparamos un modelo sin la covariable (modelo nulo) frente a modelo con la covariable (términos relativos)

47 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 47 Contraste de regresión Después de ajustar el modelo evaluamos la significación de la(s) variable(s) involucrada(s). No estudiamos aún la bondad de ajuste (términos absolutos): representan los valores ajustados a los valores observados? Comparamos un modelo sin la covariable (modelo nulo) frente a modelo con la covariable (términos relativos) Regresion lineal: Coeficientes Estadístico Modelo nulo β 0 = Y ; β 1 = 0 Var(Y ) Modelo lineal β0 ; β 1 0 (Yi Ŷi) 2 Medida de diferencia V.E. Regresión logística: la medida se basa en el log de la función de verosimilitud

48 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 48 El test de razón de verosimilitudes Contraste de regresión: Es mejor el modelo nulo? H 0 : β 1 = 0 H 1 : β 1 0 Se basa en el estadístico (Hosmer y Lemeshow, 1989) [ ] función de verosimilitud del modelo sin X G = 2 ln función de verosimilitud del modelo con X

49 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 49 El test de razón de verosimilitudes Contraste de regresión: Es mejor el modelo nulo? H 0 : β 1 = 0 H 1 : β 1 0 Se basa en el estadístico (Hosmer y Lemeshow, 1989) [ ] función de verosimilitud del modelo sin X G = 2 ln función de verosimilitud del modelo con X En el modelo univariante comparamos con el modelo nulo [ ( n1 ) n1 ( n0 ) n0 ] G = 2 ln n n n i=1 πy i i (1 π i ) (1 Y i ) Bajo H 0, G χ 2 (1). Ejemplo...

50 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 50 El coeficiente R 2 en regresión logística Alternativas al coeficiente de determinación usado en regresión lineal (Maddala-Magee) R 2 = 1 {L(0)/L( β 0, β 1 )} 2/n No es una verdadera medida de la bondad de ajuste: sólo compara 2 modelos L(0) = p n 1 1 (1 p 1) n n 1, F. de verosimilitud del modelo nulo (sólo β 0 ); con p 1 = n 1 /n = Y i /n. L( β 0, β 1 ), F. de verosimilitud evaluada en el estimador. L 1, entonces R 2 0 R 2 1 (p p 1 1 (1 p 1) 1 p 1 ) 2 Coeficiente corregido:r 2 = R 2 /max(r 2 ) (Nagelkerke)

51 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 51 El test de Hosmer-Lemeshow Pasos: 1. Calcular π 1 = π(x 1 ),..., π n = π(x n ), a partir del modelo ajustado (suponemos que no hay valores repetidos de la variable X ). 2. Ordenar los n valores de menor a mayor. 3. Agrupar los valores calculados siguiendo uno de los dos criterios siguientes: (a) Dividir la secuencia ordenada en cuartiles, deciles u otra clasificación similar. (b) Formar el primer grupo con todos los individuos para los que π i es menor que 0.1; en el segundo grupo considerar los individuos cuyo π i esté entre 0.1 y 0.2, etc. Sean n 1, n 2,..., n 10 las frecuencias respectivas.

52 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación Sumar los valores de π i dentro de cada grupo. Estos sumatorios serán los valores esperados, que denotamos E 1, E 2,..., E Contar en cada grupo el número de sujetos para los cuales Y = 1, estos serán los valores observados, que denotamos O 1, O 2,..., O 10.

53 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación Sumar los valores de π i dentro de cada grupo. Estos sumatorios serán los valores esperados, que denotamos E 1, E 2,..., E Contar en cada grupo el número de sujetos para los cuales Y = 1, estos serán los valores observados, que denotamos O 1, O 2,..., O 10. Estadístico de Hosmer-Lemeshow χ 2 = 10 i=1 (O i E i ) 2 E i + 10 i=1 donde E i = n i E i y O i = n i O i. Este estadístico sigue una distribución χ 2 (8). (O i E E i i )2,

54 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 54 Tests individuales Nos planteamos... Test de Wald H 0 : β j = 0 H 1 : β j 0, j = 0, 1

55 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 55 Tests individuales Nos planteamos... Test de Wald Estadístico de Wald: H 0 : β j = 0 H 1 : β j 0, j = 0, 1 con se βj = Var( β j ). W = β j se βj,

56 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 56 Tests individuales Nos planteamos... Test de Wald Estadístico de Wald: con se βj = H 0 : β j = 0 H 1 : β j 0, j = 0, 1 Var( β j ). W = Sea H = ( 2 l(β 0,β 1 ) β u β j )0 u,j 1 β j se βj, La matriz de covarianzas Σ( β 0, β 1 ) = (H( β 0, β 1 )) 1

57 Tests individuales Nos planteamos... Test de Wald Estadístico de Wald: con se βj = H 0 : β j = 0 H 1 : β j 0, j = 0, 1 Var( β j ). W = Sea H = ( 2 l(β 0,β 1 ) β u β j )0 u,j 1 β j se βj, La matriz de covarianzas Σ( β 0, β 1 ) = (H( β 0, β 1 )) 1 W tiene distribución Normal estándar. MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 57

58 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 58 Prueba Score Contraste: H 0 : β j = 0 H 1 : β j 0

59 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 59 Prueba Score Contraste: H 0 : β j = 0 H 1 : β j 0 Requiere menos esfuerzo computacional que los anteriores Estimador ST = n i=1 X i(y i Y ) Y (1 Y ). n i=1 (X i X ) 2 ST tiene distribución Normal estándar Ejemplo...

60 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 60 Estudio de la capacidad predictiva del modelo Objetivo: Establecer si el modelo logístico estimado clasifica correctamente a los sujetos de acuerdo con los valores de la variable respuesta.

61 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 61 Estudio de la capacidad predictiva del modelo Objetivo: Establecer si el modelo logístico estimado clasifica correctamente a los sujetos de acuerdo con los valores de la variable respuesta. Clasificacion = { π i > 0,5 Ŷi = 1 π i 0,5 Ŷi = 0 Y Ŷ VP FN 0 FP VN

62 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 62 Estudio de la capacidad predictiva del modelo Objetivo: Establecer si el modelo logístico estimado clasifica correctamente a los sujetos de acuerdo con los valores de la variable respuesta. Clasificacion = CP = (VP + VN)/n { π i > 0,5 Ŷi = 1 π i 0,5 Ŷi = 0 Y Ŷ VP FN 0 FP VN Sensibilidad = VP/(VP + FN) Especifidad = VN/(VN + FP)

63 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 63 Modelo de regresión logística múltiple P(Y = 1) = exp(β 0 + β 1 X β p X p ) 1 + exp(β 0 + β 1 X β p X p )

64 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 64 Modelo de regresión logística múltiple P(Y = 1) = exp(β 0 + β 1 X β p X p ) 1 + exp(β 0 + β 1 X β p X p ) F. de verosimilitud: n L(β) = {Y i ln π i + (1 Y i ) ln(1 π i )}, i=1 con π i = π(x i1, X i2,..., X ip ).

65 Modelo de regresión logística múltiple P(Y = 1) = exp(β 0 + β 1 X β p X p ) 1 + exp(β 0 + β 1 X β p X p ) F. de verosimilitud: n L(β) = {Y i ln π i + (1 Y i ) ln(1 π i )}, i=1 con π i = π(x i1, X i2,..., X ip ). Ecuaciones de verosimilitud, para j = 1,..., p l(β) n = (Y i π i ) = 0 β 0 l(β) β j = i=1 n (Y i π i )X ij = 0; i=1 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 65

66 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 66 Forma matricial: X (Y π) = 0, donde 1 X 11 X 1p 1 X 21 X 2p X =... ; Y = 1 X n1. X np Y 1 Y 2. Y n ; π = π 1 π 2. π n

67 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 67 Forma matricial: X (Y π) = 0, donde 1 X 11 X 1p 1 X 21 X 2p X =... ; Y = 1 X n1. X np Y 1 Y 2. Y n ; π = Buscamos solución del siguiente sistema de ecuaciones: U( β) = X (Y π) = 0 π 1 π 2. π n

68 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 68 Forma matricial: X (Y π) = 0, donde 1 X 11 X 1p 1 X 21 X 2p X =... ; Y = 1 X n1. X np Y 1 Y 2. Y n ; π = Buscamos solución del siguiente sistema de ecuaciones: U( β) = X (Y π) = 0 π 1 π 2. π n Desarrollo de Taylor β = β (0) H 1 (β (0) )U(β (0) ) donde U( ) es ( la funcion score, el vector de derivadas parciales de l; H( ) = 2 l( ) β j β u )1 u,j p, es la matriz hessiana

69 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 69 Método de Newton-Raphson El estimador se obtiene de modo iterativo, en el paso k del algoritmo β (k) = β (k 1) + ( X W (k 1) X ) 1 X ( Y π (k 1) ) W (k 1) = diag ( π (k 1) (1 π (k 1) ) ) n n π (k 1) son probabilidades estimadas en el paso anterior β(k 1) es el vector de coeficientes obtenido en el paso anterior.

70 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 70 Método de Newton-Raphson El estimador se obtiene de modo iterativo, en el paso k del algoritmo β (k) = β (k 1) + ( X W (k 1) X ) 1 X ( Y π (k 1) ) W (k 1) = diag ( π (k 1) (1 π (k 1) ) ) n n π (k 1) son probabilidades estimadas en el paso anterior β(k 1) es el vector de coeficientes obtenido en el paso anterior. Se necesita un valor inicial para empezar el proceso iterativo. Matriz de información de Fisher: Î(k 1) = X W (k 1) X

71 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 71 Interpretación de los coeficientes β 0 = logit de presentar el suceso de interés cuando todas las covariables toman valor 0. Sean X 1 y X 2 dos perfiles distintos: O(X 1 ) O(X 2 ) = exp [ p i=1 β i (X 1 i X 2 i ) Cuánto más peligro tiene un sujeto del perfil 1 de presentar la característica de interés frente a un individuo del perfil 2. ]

72 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 72 Interpretación de los coeficientes β 0 = logit de presentar el suceso de interés cuando todas las covariables toman valor 0. Sean X 1 y X 2 dos perfiles distintos: O(X 1 ) O(X 2 ) = exp [ p i=1 β i (X 1 i X 2 i ) Cuánto más peligro tiene un sujeto del perfil 1 de presentar la característica de interés frente a un individuo del perfil 2. Caso particular: Xj 1 = Xj y el resto igual, O(X 1 )/O(X 2 ) = exp(β j ) β j = cambio en logit cuando X j aumenta en una unidad y el resto de variables se mantienen iguales. A veces el cambio en 1 unidad no tiene interés práctico (edad) ]

73 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 73 Contrastes de significación del modelo (A) Desviación del modelo: Contraste de regresión H 0 : β 1 = β 2 = = β p = 0 H 1 : β j 0, Estadístico de contraste: G χ 2 (p).

74 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 74 Contrastes de significación del modelo (A) Desviación del modelo: Contraste de regresión H 0 : β 1 = β 2 = = β p = 0 H 1 : β j 0, Estadístico de contraste: G χ 2 (p). (B) Contrastes individuales: H 0 : β j = 0 H 1 : β j 0, j = 1,..., p. Estadístico de contraste (Wald): W j = β j N(0, 1) se( β j ) Intervalo de confianza al nivel 100 (1 α) %: β j ± Z 1 α/2 se( β j )

75 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 75 (C) Pruebas de hipótesis de subconjuntos de parámetros Sea β = (β(1), β (2) ), con dim(β (1) ) = r < p. Contraste: H 0 : β (1) = 0 H 1 : β (1) 0, Estadístico de contraste: G = 2[l(modelo bajoh 0 ) l(modelo bajoh 1 )] χ 2 (p r)

76 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 76 Selección de variables (Silva y Barroso, 2004) Adelante: 1. Se inicia con un modelo vacio (solo β 0 ) 2. Se ajusta un modelo y se calcula el p-valor de incluir cada variable por separado 3. Se selecciona el modelo con la variable más significativa 4. Se ajusta un modelo con la(s) variable(s) seleccionada(s) y se calcula el p-valor de añadir cada variable no seleccionada por separado 5. Se selecciona el modelo con la más significativa 6. Se repite 4-5 hasta que no queden variables significativas para incluir.

77 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 77 Atrás: 1. Se inicia con un modelo con TODAS las variables candidatas 2. Se eliminan, una a una, cada variable y se calcula la pérdida de ajuste al eliminar 3. Se selecciona para eliminar la menos significativa 4. Se repite 2-3 hasta que todas las variables incluidas sean significativas y no pueda eliminarse ninguna sin que se pierda ajuste.

78 Atrás: 1. Se inicia con un modelo con TODAS las variables candidatas 2. Se eliminan, una a una, cada variable y se calcula la pérdida de ajuste al eliminar 3. Se selecciona para eliminar la menos significativa 4. Se repite 2-3 hasta que todas las variables incluidas sean significativas y no pueda eliminarse ninguna sin que se pierda ajuste. Stepwise: a) Se combinan los métodos adelante y atrás. b) Puede empezarse por el modelo vacío o por el completo, pero en cada paso se exploran las variables incluidas, por si deben salir y las no seleccionadas, por si deben entrar c) No todos los métodos llegan a la misma solución necesariamente MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 78

79 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 79 Consideraciones importantes en regresión logística múltiple Multicolinealidad Consiste en: dos o más variables linealmente correlacionadas; Efecto: Incremento exagerado en los errores estándar y en los coeficientes estimados. Modelo poco creible Posibles estrategias: Examinar la matriz de correlaciones; Formular modelos con las variables correlacionadas y estudiar el coeficiente R 2 Si R 2 > 0,9!!

80 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 80 Confusión e interacción Variable confusora: Covariable que está asociada a la variable respuesta y a un factor de riesgo Interacción: La asociación entre el factor de riesgo y la respuesta depende de la covariable (efecto modificador). Ejemplo: Y = (1, si enfermedad coronaria; 0, en otro caso); X = edad; F =sexo (0=m, 1=m); logit lineal en la covariable X para los individuos con factor F = 1 con pendiente distinta de los individuos con factor F = 0 Modelo: logit = β 0 + β 1X + β 2F + δx F Importante: Determinar la evidencia o no de interacción en el modelo. H 0 : δ = 0

81 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 81 Confusión e interacción Variable confusora: Covariable que está asociada a la variable respuesta y a un factor de riesgo Interacción: La asociación entre el factor de riesgo y la respuesta depende de la covariable (efecto modificador). Ejemplo: Y = (1, si enfermedad coronaria; 0, en otro caso); X = edad; F =sexo (0=m, 1=m); logit lineal en la covariable X para los individuos con factor F = 1 con pendiente distinta de los individuos con factor F = 0 Modelo: logit = β 0 + β 1X + β 2F + δx F Importante: Determinar la evidencia o no de interacción en el modelo. H 0 : δ = 0 Variables categóricas Se introducen como variables dummy Se aceptan o se rechazan en bloque.

82 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 82 Análisis de residuos Residuo. Medida que expresa la diferencia entre las respuestas observadas y predichas por el modelo. Alertan de que no se cumpla el supuesto de linealidad entre el modelo logit de la probabilidad de Y = 1 y la(s) variable(s) independiente(s); 2. la presencia de algunas observaciones extremas que perturbe la calidad del ajuste; o 3. que una función distinta de la logística describiese más adecuadamente el conjunto de observaciones. Tipos: Residuos de Pearson Residuos deviance

83 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 83 Datos agrupados Consideramos perfiles de covariables que definen grupos de individuos m j = número total de individuos con mismo perfil de covariables. Hay J combinaciones distintas: X 1,..., X J Ỹ j = número de individuos con perfil j que presentan el suceso Y = 1 π j = π(x j ) = valor de probabilidad estimado según el modelo logístico para el perfil j-ésimo. Las aproximaciones normales asintóticas se sustentan en la aproximación normal de la variable binomial Ỹ, por esto m j debe ser grande.

84 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 84 Residuos de Pearson Residuos: Se definen... r j = Ỹ j m j π j

85 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 85 Residuos de Pearson Residuos: Se definen... r j = Ỹ j m j π j Residuos estandarizados o residuos de Pearson: r ej = Ỹ j m j π j mj π j (1 π j ) Si rej > 2 dato a examinar! Si J no es grande (mj suficientemente grande para cada j), r ej son NORMALES. Si mj = 1, r j solo toma 2 valores y no puede esperarse Normalidad.

86 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 86 Residuos de Pearson Residuos: Se definen... r j = Ỹ j m j π j Residuos estandarizados o residuos de Pearson: r ej = Ỹ j m j π j mj π j (1 π j ) Si rej > 2 dato a examinar! Si J no es grande (mj suficientemente grande para cada j), r ej son NORMALES. Si mj = 1, r j solo toma 2 valores y no puede esperarse Normalidad. Estadístico resumen: X 2 = J j=1 r ej 2 χ2 (J (p + 1)) (J n problema!).

87 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 87 Residuos deviance Definición: ( ) ( )] d j = sign(ỹ j m j π j ) Ỹj m j Ỹ j 2 [Ỹ j ln + (m j Ỹ j ) ln m j π j m j (1 π j ) Mide la discrepancia entre la j-ésima componente del logaritmo de la función de verosimilitud del modelo ajustado y la correspondiente componente del logaritmo de la función de verosimilitud que resultaría si cada punto fuese ajustado exactamente.

88 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 88 Datos no agrupados (m j = 1) di = {2[ ln(1 π i )]} 1/2, si Y i = 0; y di = {2[ ln( π i )]} 1/2 si Y i = 1.

89 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 89 Datos no agrupados (m j = 1) di = {2[ ln(1 π i )]} 1/2, si Y i = 0; y di = {2[ ln( π i )]} 1/2 si Y i = 1. Estadístico resumen: D = J j=1 d 2 j es χ 2 si J << n.

90 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 90 Influencia o leverage Qué efecto tiene eliminar todos aquellos sujetos que tienen un determinado perfil de covariables en los coeficientes estimados y las medidas de resumen global, X 2 y D? Se define... β j = β β ( j) Pregibon (1981) aproxima... donde h j son los leverages, β j = r 2 ej h j 1 h j H = V 1/2 X(X VX) 1 X V 1/2 X J p es la matriz de diseño, V = diag(v j ) J J = diag(m j π(x j )[1 π(x j )])

91 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 91 Otros diagnósticos Objetivo: determinar perfiles de covariables para los que el modelo proporciona un ajuste pobre...

92 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 92 Otros diagnósticos Objetivo: determinar perfiles de covariables para los que el modelo proporciona un ajuste pobre... Procedimiento: Examinar cambios debidos a la eliminación de los m j sujetos en... Chi-cuadrado de Pearson: X 2 j Deviance: D j = d 2 j 1 h j = r 2 ej Considerar las representaciones gráficas Detectar perfiles con gran influencia en el modelo: ( π j, β j ) Detectar perfiles que no son bien ajustados por el modelo: ( π j, X 2 j ) y ( π j, D j )

93 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 93 Otros diagnósticos Hosmer y Lemeshow (1989) aconsejan estos gráficos por encima de ( π j, r j ) o ( π j, d j ) porque: 1. Cuando J n la mayoría de los residuos positivos corresponden a perfiles en los que Ỹ j = m j, por ejemplo m j = 1, y los residuos negativos se corresponden con aquellos con Ỹ j = 0. Por lo que el signo no es informativo. 2. Grandes residuos se corresponden con puntos que no están bien reflejados en el modelo. Si consideramos los residuos al cuadrado se enfatiza aún más la falta de ajuste. 3. La forma de los gráficos ayuda a determinar qué perfiles se corresponden con Ỹ j = 0 y cuáles tienen Ỹ j = m j

94 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 94 Regresión Logística Multinomial

95 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 95 Regresión Logística Multinomial La variable respueste tiene r categorías

96 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 96 Regresión Logística Multinomial La variable respueste tiene r categorías Se elige una como referencia y se enfrentan a ella las r restantes a través de Prob(Y = k) Prob(Y = 0) ; k = 1,..., r

97 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 97 Regresión Logística Multinomial La variable respueste tiene r categorías Se elige una como referencia y se enfrentan a ella las r restantes a través de Prob(Y = k) Prob(Y = 0) ; k = 1,..., r Modelo ln Prob(Y = k) Prob(Y = 0) = β 0k + β 1k X β pk X p

98 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 98 Regresión Logística Multinomial La variable respueste tiene r categorías Se elige una como referencia y se enfrentan a ella las r restantes a través de Prob(Y = k) Prob(Y = 0) ; k = 1,..., r Modelo ln Prob(Y = k) Prob(Y = 0) = β 0k + β 1k X β pk X p Tenemos un total de r (p + 1) parémetros a estimar Se estima mediante el método de máxima-verosimilitud Métodos númericos implementados en software estadístico (SPSS)

99 MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 99 Bibliografía I Hosmer,D.W. y Lemeshow, S. (1989). Applied Logistic Regression, Wiley Kleinbaum, D.G. (1994). Logistic Regression. A Self-Learning Text. Springer. Montgomery, D.C., Peck, E.A. y Vining, G.G. (2002). Introducción al análisis de regresión lineal, CECSA Pérez López, C. (2001). Técnicas Estadísticas con SPSS (Versión 10), Pearson Alhambra Ryan, T. (1997). Modern Regression Methods, Wiley Silva, L.C. y Barroso, I. (2004). Regresión Logística, La Muralla

Fundamentos de Biología Aplicada I Estadística Curso 2011-2012 Práctica 6: Regresión Logística I

Fundamentos de Biología Aplicada I Estadística Curso 2011-2012 Práctica 6: Regresión Logística I Fundamentos de Biología Aplicada I Estadística Curso 2011-2012 Índice 1. Objetivos de la práctica 2 2. Estimación de un modelo de regresión logística con SPSS 2 2.1. Ajuste de un modelo de regresión logística.............................

Más detalles

Cómo obtener un Modelo de Regresión Logística Binaria con SPSS

Cómo obtener un Modelo de Regresión Logística Binaria con SPSS Universitat de de Barcelona. Institut de de Ciències de de l Educació Cómo obtener un Modelo de Regresión Logística Binaria con SPSS Vanesa Berlanga-Silvente y Ruth Vilà-Baños Fecha de presentación:

Más detalles

REGRESION simple. Correlación Lineal:

REGRESION simple. Correlación Lineal: REGRESION simple Correlación Lineal: Dadas dos variable numéricas continuas X e Y, decimos que están correlacionadas si entre ambas variables hay cierta relación, de modo que puede predecirse (aproximadamente)

Más detalles

Análisis de Regresión Múltiple con Información Cualitativa: Variables Binarias o Ficticias

Análisis de Regresión Múltiple con Información Cualitativa: Variables Binarias o Ficticias Análisis de Regresión Múltiple con Información Cualitativa: Variables Binarias o Ficticias Carlos Velasco 1 1 Departamento de Economía Universidad Carlos III de Madrid Econometría I Máster en Economía

Más detalles

8.1. Introducción... 1. 8.2. Dependencia/independencia estadística... 2. 8.3. Representación gráfica: diagrama de dispersión... 3. 8.4. Regresión...

8.1. Introducción... 1. 8.2. Dependencia/independencia estadística... 2. 8.3. Representación gráfica: diagrama de dispersión... 3. 8.4. Regresión... Tema 8 Análisis de dos variables: dependencia estadística y regresión Contenido 8.1. Introducción............................. 1 8.2. Dependencia/independencia estadística.............. 2 8.3. Representación

Más detalles

Covarianza y coeficiente de correlación

Covarianza y coeficiente de correlación Covarianza y coeficiente de correlación Cuando analizábamos las variables unidimensionales considerábamos, entre otras medidas importantes, la media y la varianza. Ahora hemos visto que estas medidas también

Más detalles

TEMA 4: Variables binarias

TEMA 4: Variables binarias TEMA 4: Variables binarias Econometría I M. Angeles Carnero Departamento de Fundamentos del Análisis Económico Curso 2011-12 Econometría I (UA) Tema 4: Variables binarias Curso 2011-12 1 / 51 Variables

Más detalles

El modelo Ordinal y el modelo Multinomial

El modelo Ordinal y el modelo Multinomial El modelo Ordinal y el modelo Multinomial Microeconomía Cuantitativa R. Mora Departmento de Economía Universidad Carlos III de Madrid Esquema Motivación 1 Motivación 2 3 Motivación Consideramos las siguientes

Más detalles

ANÁLISIS DE DATOS NO NUMERICOS

ANÁLISIS DE DATOS NO NUMERICOS ANÁLISIS DE DATOS NO NUMERICOS ESCALAS DE MEDIDA CATEGORICAS Jorge Galbiati Riesco Los datos categóricos son datos que provienen de resultados de experimentos en que sus resultados se miden en escalas

Más detalles

ESTIMACIÓN. puntual y por intervalo

ESTIMACIÓN. puntual y por intervalo ESTIMACIÓN puntual y por intervalo ( ) Podemos conocer el comportamiento del ser humano? Podemos usar la información contenida en la muestra para tratar de adivinar algún aspecto de la población bajo estudio

Más detalles

Modelos de regresión: lineal simple y regresión logística

Modelos de regresión: lineal simple y regresión logística 14 Modelos de regresión: lineal simple y regresión logística Irene Moral Peláez 14.1. Introducción Cuando se quiere evaluar la relación entre una variable que suscita especial interés (variable dependiente

Más detalles

Metodología. del ajuste estacional. Tablero de Indicadores Económicos

Metodología. del ajuste estacional. Tablero de Indicadores Económicos Metodología del ajuste estacional Tablero de Indicadores Económicos Metodología del ajuste estacional Componentes de una serie de tiempo Las series de tiempo están constituidas por varios componentes que,

Más detalles

ESTADÍSTICA APLICADA A LA INVESTIGACIÓN EN SALUD Medidas de Tendencia Central y Dispersión

ESTADÍSTICA APLICADA A LA INVESTIGACIÓN EN SALUD Medidas de Tendencia Central y Dispersión Descargado desde www.medwave.cl el 13 Junio 2011 por iriabeth villanueva Medwave. Año XI, No. 3, Marzo 2011. ESTADÍSTICA APLICADA A LA INVESTIGACIÓN EN SALUD Medidas de Tendencia Central y Dispersión Autor:

Más detalles

CORRELACIÓN Y PREDICIÓN

CORRELACIÓN Y PREDICIÓN CORRELACIÓN Y PREDICIÓN 1. Introducción 2. Curvas de regresión 3. Concepto de correlación 4. Regresión lineal 5. Regresión múltiple INTRODUCCIÓN: Muy a menudo se encuentra en la práctica que existe una

Más detalles

ASOCIACIÓN LINEAL ENTRE VARIABLES CUANTITATIVAS: la correlación de Pearson

ASOCIACIÓN LINEAL ENTRE VARIABLES CUANTITATIVAS: la correlación de Pearson ASOCIACIÓN LINEAL ENTRE VARIABLES CUANTITATIVAS: la correlación de Pearson 3datos 2011 Análisis BIVARIADO de variables cuantitativas OBJETIVO DETERMINAR 1º) si existe alguna relación entre las variables;

Más detalles

Puede considerarse un caso especial de l análisis de regresión en donde la variable dependiente es dicotómica («Sí» [1] o «No» [0])

Puede considerarse un caso especial de l análisis de regresión en donde la variable dependiente es dicotómica («Sí» [1] o «No» [0]) Regresión logística Puede considerarse un caso especial de l análisis de regresión en donde la variable dependiente es dicotómica («Sí» [1] o «No» [0]) Se trata de calcular la probabilidad en la que una

Más detalles

Cómo hacer una Regresión Logística con SPSS paso a paso. (I)

Cómo hacer una Regresión Logística con SPSS paso a paso. (I) DOCUWEB FABIS Dot. Núm 070202 Cómo hacer una Regresión Logística con SPSS paso a paso. (I) Aguayo Canela, Mariano. Servicio de Medicina Interna. Hospital Universitario Virgen Macarena. Sevilla Resumen

Más detalles

Los valores de las respuesta son las puntuaciones que, de cada individuo, o cluster, obtenemos semanalmente durante cinco semanas consecutivas:

Los valores de las respuesta son las puntuaciones que, de cada individuo, o cluster, obtenemos semanalmente durante cinco semanas consecutivas: Sobre los modelos lineales mixtos Ejemplo: Recuperación de infarto. Para estudiar las diferencias entre dos procedimientos diferentes de recuperación de pacientes de un infarto, se consideraron dos grupos

Más detalles

Aplicación de los modelos de credit scoring para instituciones microfinacieras.

Aplicación de los modelos de credit scoring para instituciones microfinacieras. Econ. Reynaldo Uscamaita Huillca Aplicación de los modelos de credit scoring para instituciones microfinacieras. OBJETIVO Proporcionar al ejecutivo del sistema financiero un modelo solido que permita tomar

Más detalles

Otras medidas descriptivas usuales

Otras medidas descriptivas usuales Tema 7 Otras medidas descriptivas usuales Contenido 7.1. Introducción............................. 1 7.2. Medidas robustas.......................... 2 7.2.1. Media recortada....................... 2 7.2.2.

Más detalles

Capítulo X. Regresión Logística

Capítulo X. Regresión Logística Capítulo Regresión Logística Conceptos y definiciones Es un modelo clásico de regresión lineal simple o múltiple, pero donde la variale dependiente es inaria o dicotómica. 3 5 4 ÉITO FRACASO Es decir,

Más detalles

Tema 4 Técnicas de reducción de la dimensión

Tema 4 Técnicas de reducción de la dimensión Tema 4 Técnicas de reducción de la dimensión José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid En qué dirección es conveniente proyectar? 2 1 0 1 2 1 0 1 2 Componentes principales

Más detalles

Eduardo Kido 26-Mayo-2004 ANÁLISIS DE DATOS

Eduardo Kido 26-Mayo-2004 ANÁLISIS DE DATOS ANÁLISIS DE DATOS Hoy día vamos a hablar de algunas medidas de resumen de datos: cómo resumir cuando tenemos una serie de datos numéricos, generalmente en variables intervalares. Cuando nosotros tenemos

Más detalles

1 Ejemplo de análisis descriptivo de un conjunto de datos

1 Ejemplo de análisis descriptivo de un conjunto de datos 1 Ejemplo de análisis descriptivo de un conjunto de datos 1.1 Introducción En este ejemplo se analiza un conjunto de datos utilizando herramientas de estadística descriptiva. El objetivo es repasar algunos

Más detalles

Análisis de componentes principales

Análisis de componentes principales Capítulo 2 Análisis de componentes principales 2.1. INTRODUCCIÓN El Análisis de componentes principales trata de describir las características principales de un conjunto de datos multivariantes, en los

Más detalles

Modelos de elección binaria

Modelos de elección binaria Modelos de elección binaria Prof.: Begoña Álvarez García Econometría II 2007-2008 Estamos interesados en la ocurrencia o no-ocurrencia de un cierto evento (ej: participación en el mercado laboral; inversión

Más detalles

Matemáticas 2º BTO Aplicadas a las Ciencias Sociales

Matemáticas 2º BTO Aplicadas a las Ciencias Sociales Matemáticas 2º BTO Aplicadas a las Ciencias Sociales CONVOCATORIA EXTRAORDINARIA DE JUNIO 2014 MÍNIMOS: No son contenidos mínimos los señalados como de ampliación. I. PROBABILIDAD Y ESTADÍSTICA UNIDAD

Más detalles

ANÁLISIS DISCRIMINANTE

ANÁLISIS DISCRIMINANTE ANÁLISIS DISCRIMINANTE ANÁLISIS DISCRIMINANTE 1. Introducción 2. Etapas 3. Caso práctico Análisis de dependencias introducción varias relaciones una relación 1 variable dependiente > 1 variable dependiente

Más detalles

Ingeniería del Software I Clase de Testing Funcional 2do. Cuatrimestre de 2007

Ingeniería del Software I Clase de Testing Funcional 2do. Cuatrimestre de 2007 Enunciado Se desea efectuar el testing funcional de un programa que ejecuta transferencias entre cuentas bancarias. El programa recibe como parámetros la cuenta de origen, la de cuenta de destino y el

Más detalles

Tema 3: El modelo de regresión lineal múltiple

Tema 3: El modelo de regresión lineal múltiple Econometría 1 curso 2009-2010 Tema 3: El modelo de regresión lineal múltiple Genaro Sucarrat (Departamento de Economía, UC3M) http://www.eco.uc3m.es/sucarrat/ Recordamos: El modelo de regresión lineal

Más detalles

Tema 5. Análisis de regresión (segunda parte) Estadística II, 2010/11

Tema 5. Análisis de regresión (segunda parte) Estadística II, 2010/11 Tema 5 Análisis de regresión (segunda parte) Estadística II, 2010/11 Contenidos 5.1: Diagnóstico: Análisis de los residuos 5.2: La descomposición ANOVA (ANalysis Of VAriance) 5.3: Relaciones no lineales

Más detalles

DIPLOMADO EN RELACIONES LABORALES Estadística Asistida por Ordenador Curso 2008-2009

DIPLOMADO EN RELACIONES LABORALES Estadística Asistida por Ordenador Curso 2008-2009 Índice general 6. Regresión Múltiple 3 6.1. Descomposición de la variabilidad y contrastes de hipótesis................. 4 6.2. Coeficiente de determinación.................................. 5 6.3. Hipótesis

Más detalles

UNIVERSIDAD CARLOS III DE MADRID MASTER EN CALIDAD TOTAL MANUAL DE SPSS

UNIVERSIDAD CARLOS III DE MADRID MASTER EN CALIDAD TOTAL MANUAL DE SPSS UNIVERSIDAD CARLOS III DE MADRID MASTER EN CALIDAD TOTAL MANUAL DE SPSS I. INTRODUCCIÓN Y MANEJO DE DATOS MANUAL DE SPSS 1 MASTER CALIDAD TOTAL 1/ INTRODUCCIÓN Las aplicaciones de la Estadística en la

Más detalles

RELACIONES DE RECURRENCIA

RELACIONES DE RECURRENCIA Unidad 3 RELACIONES DE RECURRENCIA 60 Capítulo 5 RECURSIÓN Objetivo general Conocer en forma introductoria los conceptos propios de la recurrencia en relación con matemática discreta. Objetivos específicos

Más detalles

GUIÓN TEMA 4. VARIABLES BINARIAS 4.1. Variables binarias

GUIÓN TEMA 4. VARIABLES BINARIAS 4.1. Variables binarias ECONOMETRIA I. Departamento de Fundamentos del Análisis Económico Universidad de Alicante. Curso 2011/12 GUIÓN TEMA 4. VARIABLES BINARIAS 4.1. Variables binarias Bibliografía apartados : Greene, 8.2 A.F.Gallastegui:

Más detalles

Programación Genética

Programación Genética Programación Genética Programación Genética consiste en la evolución automática de programas usando ideas basadas en la selección natural (Darwin). No sólo se ha utilizado para generar programas, sino

Más detalles

Pruebas de. Hipótesis

Pruebas de. Hipótesis Pruebas de ipótesis Pruebas de ipótesis Otra manera de hacer inferencia es haciendo una afirmación acerca del valor que el parámetro de la población bajo estudio puede tomar. Esta afirmación puede estar

Más detalles

Profr. Efraín Soto Apolinar. Función Inversa

Profr. Efraín Soto Apolinar. Función Inversa Función Inversa Una función es una relación entre dos variables, de manera que para cada valor de la variable independiente eiste a lo más un único valor asignado a la variable independiente por la función.

Más detalles

Mónica López Ratón BIOSTATECH, Advice, Training & Innovation in Biostatistics, S.L. Octubre 2012. monica.lopez.raton@usc.es

Mónica López Ratón BIOSTATECH, Advice, Training & Innovation in Biostatistics, S.L. Octubre 2012. monica.lopez.raton@usc.es Mónica López Ratón BIOSTATECH, Advice, Training & Innovation in Biostatistics, S.L. Octubre 01 monica.lopez.raton@usc.es Tablas de contingencia y tests asociados Índice 1. Datos categóricos. Tablas de

Más detalles

Tema 3. Espacios vectoriales

Tema 3. Espacios vectoriales Tema 3. Espacios vectoriales Estructura del tema. Definición y propiedades. Ejemplos. Dependencia e independencia lineal. Conceptos de base y dimensión. Coordenadas Subespacios vectoriales. 0.1. Definición

Más detalles

Decisión: Indican puntos en que se toman decisiones: sí o no, o se verifica una actividad del flujo grama.

Decisión: Indican puntos en que se toman decisiones: sí o no, o se verifica una actividad del flujo grama. Diagrama de Flujo La presentación gráfica de un sistema es una forma ampliamente utilizada como herramienta de análisis, ya que permite identificar aspectos relevantes de una manera rápida y simple. El

Más detalles

1.4.- D E S I G U A L D A D E S

1.4.- D E S I G U A L D A D E S 1.4.- D E S I G U A L D A D E S OBJETIVO: Que el alumno conozca y maneje las reglas empleadas en la resolución de desigualdades y las use para determinar el conjunto solución de una desigualdad dada y

Más detalles

Estudio de casos y controles sobre factores de riesgo en el cáncer colorrectal

Estudio de casos y controles sobre factores de riesgo en el cáncer colorrectal Estudio de casos y controles sobre factores de riesgo en el cáncer colorrectal Objetivos del estudio Estimar el riesgo de padecer cáncer colorrectal asociado a una serie de variables Población Casos Controles

Más detalles

ANÁLISIS DE VARIANZA EMPLEANDO EXCEL y WINSTATS

ANÁLISIS DE VARIANZA EMPLEANDO EXCEL y WINSTATS ANÁLISIS DE VARIANZA EMPLEANDO EXCEL y WINSTATS 1) INTRODUCCIÓN El análisis de varianza es una técnica que se puede utilizar para decidir si las medias de dos o más poblaciones son iguales. La prueba se

Más detalles

Material del curso Análisis de datos procedentes de investigaciones mediante programas informáticos Manuel Miguel Ramos Álvarez

Material del curso Análisis de datos procedentes de investigaciones mediante programas informáticos Manuel Miguel Ramos Álvarez Curso de Análisis de investigaciones con programas Informáticos 1 UNIVERSIDAD DE JAÉN Material del curso Análisis de datos procedentes de investigaciones mediante programas informáticos Manuel Miguel Ramos

Más detalles

Introducción a la Econometría

Introducción a la Econometría Introducción a la Econometría Curso 2009/2010 Seriedeproblemas1 1.- Considere la siguiente distribución de probabilidad: Llueve (X=0) No llueve (X=1) Total Tiempo de viaje largo (Y=0) 0.15 0.07 0.22 Tiempo

Más detalles

REPASO CONCEPTOS BÁSICOS DE ESTADÍSTICA. DISTRIBUCIÓN NORMAL.

REPASO CONCEPTOS BÁSICOS DE ESTADÍSTICA. DISTRIBUCIÓN NORMAL. REPASO COCEPTOS BÁSICOS DE ESTADÍSTICA. DISTRIBUCIÓ ORMAL. Éste es un breve repaso de conceptos básicos de estadística que se han visto en cursos anteriores y que son imprescindibles antes de acometer

Más detalles

Aplicaciones de Estadística Descriptiva

Aplicaciones de Estadística Descriptiva Aplicaciones de Estadística Descriptiva Contenidos de la presentación Funciones estadísticas en Excel. Gráficos. El módulo de análisis de datos y las tablas dinámicas de Excel. Información Intentaremos

Más detalles

IBM SPSS Regression 20

IBM SPSS Regression 20 IBM SPSS Regression 20 Nota: Antes de utilizar esta información y el producto que admite, lea la información general en Avisos el p. 46. Esta edición se aplica a IBM SPSS Statistics 20 y a todas las versiones

Más detalles

El Análisis de la Regresión a través de SPSS

El Análisis de la Regresión a través de SPSS El Análisis de la Regresión a través de SPSS M. D olores M artínez M iranda Profesora del D pto. E stadística e I.O. U niversidad de G ranada Referencias bibliográficas. Hair, J.F., Anderson, R.E., Tatham,

Más detalles

TEMA 2. FILOSOFÍA DE LOS GRÁFICOS DE CONTROL. Principios básicos de los gráficos de control. Análisis de patrones.

TEMA 2. FILOSOFÍA DE LOS GRÁFICOS DE CONTROL. Principios básicos de los gráficos de control. Análisis de patrones. TEMA 2. FILOSOFÍA DE LOS GRÁFICOS DE CONTROL. Principios básicos de los gráficos de control. Análisis de patrones. La herramienta que nos indica si el proceso está o no controlado o Estado de Control son

Más detalles

Conceptos Fundamentales. Curso de Estadística TAE, 2005 J.J. Gómez-Cadenas

Conceptos Fundamentales. Curso de Estadística TAE, 2005 J.J. Gómez-Cadenas Conceptos Fundamentales Curso de Estadística TAE, 2005 J.J. Gómez-Cadenas Análisis de datos en física de partículas Experimento en física de partículas: Observación de n sucesos de un cierto tipo (colisiones

Más detalles

1.1. Introducción y conceptos básicos

1.1. Introducción y conceptos básicos Tema 1 Variables estadísticas Contenido 1.1. Introducción y conceptos básicos.................. 1 1.2. Tipos de variables estadísticas................... 2 1.3. Distribuciones de frecuencias....................

Más detalles

Estas visiones de la información, denominadas vistas, se pueden identificar de varias formas.

Estas visiones de la información, denominadas vistas, se pueden identificar de varias formas. El primer paso en el diseño de una base de datos es la producción del esquema conceptual. Normalmente, se construyen varios esquemas conceptuales, cada uno para representar las distintas visiones que los

Más detalles

ESTADÍSTICA APLICADA A LA INVESTIGACIÓN EN SALUD Construcción de una Base de Datos

ESTADÍSTICA APLICADA A LA INVESTIGACIÓN EN SALUD Construcción de una Base de Datos Descargado desde www.medwave.cl el 13 Junio 2011 por iriabeth villanueva Medwave. Año XI, No. 2, Febrero 2011. ESTADÍSTICA APLICADA A LA INVESTIGACIÓN EN SALUD Construcción de una Base de Datos Autor:

Más detalles

Indicaciones específicas para los análisis estadísticos.

Indicaciones específicas para los análisis estadísticos. Tutorial básico de PSPP: Vídeo 1: Describe la interfaz del programa, explicando en qué consiste la vista de datos y la vista de variables. Vídeo 2: Muestra cómo crear una base de datos, comenzando por

Más detalles

2 Teoría de colas o líneas de espera

2 Teoría de colas o líneas de espera 2 Teoría de colas o líneas de espera El tráfico en redes se puede modelar con la ayuda de la teoría de colas, es por ello ue es importante estudiarlas y comprenderlas. Existen varias definiciones sobre

Más detalles

TEMA 4: Introducción al Control Estadístico de Procesos

TEMA 4: Introducción al Control Estadístico de Procesos TEMA 4: Introducción al Control Estadístico de Procesos 1 Introducción 2 Base estadística del diagrama de control 3 Muestreo y agrupación de datos 4 Análisis de patrones en diagramas de control 1. Introducción

Más detalles

ANÁLISIS DE BALANCES CON EL NUEVO PGC DE 2008

ANÁLISIS DE BALANCES CON EL NUEVO PGC DE 2008 ANÁLISIS DE BALANCES CON EL NUEVO PGC DE 2008 Índice: 1.- ANÁLISIS DE BALANCES. GENERALIDADES...2 2.- EL FONDO DE MANIOBRA...2 3.- ANÁLISIS FINANCIERO DEL BALANCE...3 4.- ANÁLISIS ECONÓMICO DEL BALANCE...6

Más detalles

(.$263*7.5"4+%#,"8..9$ $.$ - -. 7.# "4< $ 8 $ 7 "% @

(.$263*7.54+%#,8..9$ $.$ - -. 7.# 4< $ 8 $ 7 % @ !"#$%!& ' ($ 2 ))!"#$%& '$()!& *($$+%( & * $!" "!,"($"$ -(.$!- ""& +%./$$&,-,$,". - %#,"0# $!01 "23(.4 $4$"" ($" $ -.#!/ ". " " ($ "$%$(.$2.3!- - *.5.+%$!"$,"$ (.$263*7.5"4+%#,"8..9$ $.$ - $,"768$"%$,"$%$!":7#;

Más detalles

Semana de dieta (X) 1 2 3 4 5 Peso en Kg (Y) 88.5 87 84 82.5 79

Semana de dieta (X) 1 2 3 4 5 Peso en Kg (Y) 88.5 87 84 82.5 79 . Una persona se somete a una dieta de adelgazamiento durante cinco semanas. A continuación se detalla su peso al término de cada una de esas semanas: Semana de dieta X) 2 3 4 Peso en Kg Y) 88. 87 84 82.

Más detalles

Pruebas de Acceso a las Universidades de Castilla y León

Pruebas de Acceso a las Universidades de Castilla y León Pruebas de Acceso a las Universidades de Castilla y León MATEMÁTICA APLICADA A LA CIENCIA OCIALE EJERCICIO Nº páginas 2 Tablas OPTATIVIDAD: EL ALUMNO DEBERÁ ECOGER UNA DE LA DO OPCIONE Y DEARROLLAR LA

Más detalles

Medidas de tendencia central o de posición: situación de los valores alrededor

Medidas de tendencia central o de posición: situación de los valores alrededor Tema 10: Medidas de posición y dispersión Una vez agrupados los datos en distribuciones de frecuencias, se calculan unos valores que sintetizan la información. Estudiaremos dos grandes secciones: Medidas

Más detalles

Introducción a la Econometría (LE y LADE, mañana) Prof. Magdalena Cladera ANÁLISIS DE REGRESIÓN CON EXCEL Y SPSS

Introducción a la Econometría (LE y LADE, mañana) Prof. Magdalena Cladera ANÁLISIS DE REGRESIÓN CON EXCEL Y SPSS Introducción a la Econometría (LE y LADE, mañana) Prof. Magdalena Cladera ANÁLISIS DE REGRESIÓN CON EXCEL Y SPSS ESTIMACIÓN DE UN MODELO DE REGRESIÓN LINEAL CON EXCEL La Herramienta para análisis Regresión

Más detalles

Se podría entender como una matriz de filas y columnas. Cada combinación de fila y columna se denomina celda. Por ejemplo la celda A1, B33, Z68.

Se podría entender como una matriz de filas y columnas. Cada combinación de fila y columna se denomina celda. Por ejemplo la celda A1, B33, Z68. Departamento de Economía Aplicada: UDI de Estadística. Universidad Autónoma de Madrid Notas sobre el manejo de Excel para el análisis descriptivo y exploratorio de datos. (Descriptiva) 1 1 Introducción

Más detalles

Métodos Iterativos para Resolver Sistemas Lineales

Métodos Iterativos para Resolver Sistemas Lineales Métodos Iterativos para Resolver Sistemas Lineales Departamento de Matemáticas, CCIR/ITESM 17 de julio de 2009 Índice 3.1. Introducción............................................... 1 3.2. Objetivos................................................

Más detalles

Grado en Finanzas y Contabilidad

Grado en Finanzas y Contabilidad Econometría Grado en Finanzas y Contabilidad Apuntes basados en el libro Introduction to Econometrics: A modern Approach de Wooldridge 5.2 Estimadores de Variables Instrumentales La endogeneidad aparece

Más detalles

Facultad de Ciencias

Facultad de Ciencias Facultad de Ciencias Trabajo Fin de Grado Grado en Estadística Métodos de predicción de fuga con grandes volúmenes de datos Autor: D. Raquel García Fernández Tutor/es: D. Eusebio Arenal Gutiérrez Página

Más detalles

6 ANÁLISIS DE INDEPENDENCIA O ASOCIACIÓN ENTRE DOS ATRIBUTOS

6 ANÁLISIS DE INDEPENDENCIA O ASOCIACIÓN ENTRE DOS ATRIBUTOS 6 ANÁLISIS DE INDEPENDENCIA O ASOCIACIÓN ENTRE DOS ATRIBUTOS Esquema del capítulo Objetivos 6.1. 6.. 6.3. 6.4. ANÁLISIS DE INDEPENDENCIA O ASOCIACIÓN ENTRE DOS ATRIBUTOS COEFICIENTES DE CONTINGENCIA LA

Más detalles

Alvaro J. Riascos Villegas Universidad de los Andes y Quantil. Marzo 14 de 2012

Alvaro J. Riascos Villegas Universidad de los Andes y Quantil. Marzo 14 de 2012 Contenido Motivación Métodos computacionales Integración de Montecarlo Muestreo de Gibbs Rejection Muestreo Importante Metropolis - Hasting Markov Chain Montecarlo Method Complemento ejemplos libro: Bayesian

Más detalles

1.6.- CLASIFICACION Y OPERACIONES DE FUNCIONES

1.6.- CLASIFICACION Y OPERACIONES DE FUNCIONES 1.6.- CLASIFICACION Y OPERACIONES DE FUNCIONES OBJETIVO.- Conocer y manejar las operaciones definidas entre funciones así como conocer la clasificación de éstas y sus características. 1.6.1.- Operaciones

Más detalles

1 Introducción al SPSS

1 Introducción al SPSS Breve guión para las prácticas con SPSS 1 Introducción al SPSS El programa SPSS está organizado en dos bloques: el editor de datos y el visor de resultados. En la barra de menú (arriba de la pantalla)

Más detalles

ANÁLISIS DESCRIPTIVO CON SPSS

ANÁLISIS DESCRIPTIVO CON SPSS ESCUELA SUPERIOR DE INFORMÁTICA Prácticas de Estadística ANÁLISIS DESCRIPTIVO CON SPSS 1.- INTRODUCCIÓN Existen dos procedimientos básicos que permiten describir las propiedades de las distribuciones:

Más detalles

MODELO PREDICTIVO DE RIESGO DE MOROSIDAD PARA CRÉDITOS BANCARIOS USANDO DATOS SIMULADOS

MODELO PREDICTIVO DE RIESGO DE MOROSIDAD PARA CRÉDITOS BANCARIOS USANDO DATOS SIMULADOS INVESTIGACIÓN MODELO PREDICTIVO DE RIESGO DE MOROSIDAD PARA CRÉDITOS BANCARIOS USANDO DATOS SIMULADOS CLAUDIO ALFREDO LÓPEZ MIRANDA Un problema grave en las instituciones de crédito son los préstamos no

Más detalles

ESTUDIO COMPARATIVO DE MODELOS FLEXIBLES DE DISCRIMINACIÓN DE LA CIRROSIS EN PACIENTES CON AFECTACIÓN HEPÁTICA

ESTUDIO COMPARATIVO DE MODELOS FLEXIBLES DE DISCRIMINACIÓN DE LA CIRROSIS EN PACIENTES CON AFECTACIÓN HEPÁTICA VI Congreso Galego de Estatística e Investigación de Operacións Vigo 5-7 de Novembro de 2003 ESTUDIO COMPARATIVO DE MODELOS FLEXIBLES DE DISCRIMINACIÓN DE LA CIRROSIS EN PACIENTES CON AFECTACIÓN HEPÁTICA

Más detalles

CAPÍTULO III. FUNCIONES

CAPÍTULO III. FUNCIONES CAPÍTULO III LÍMITES DE FUNCIONES SECCIONES A Definición de límite y propiedades básicas B Infinitésimos Infinitésimos equivalentes C Límites infinitos Asíntotas D Ejercicios propuestos 85 A DEFINICIÓN

Más detalles

ANÁLISIS DE ENCUESTAS

ANÁLISIS DE ENCUESTAS ANÁLISIS DE ENCUESTAS TÉCNICAS MULTIVARIANTES 1. Introducción 2. Clasificación de las técnicas 3. Etapas de análisis 4. Supuestos básicos 5. Valores perdidos y anómalos introducción Definición. i ió -

Más detalles

Fundamentos de Investigación de Operaciones Investigación de Operaciones 1

Fundamentos de Investigación de Operaciones Investigación de Operaciones 1 Fundamentos de Investigación de Operaciones Investigación de Operaciones 1 1 de agosto de 2003 1. Introducción Cualquier modelo de una situación es una simplificación de la situación real. Por lo tanto,

Más detalles

8. Estimación puntual

8. Estimación puntual 8. Estimación puntual Estadística Ingeniería Informática Curso 2009-2010 Estadística (Aurora Torrente) 8. Estimación puntual Curso 2009-2010 1 / 30 Contenidos 1 Introducción 2 Construcción de estimadores

Más detalles

Puede dar pérdida un Casino?

Puede dar pérdida un Casino? Puede dar pérdida un Casino? por Ernesto Mordecki En esta nota calculamos la probabilidad de que pierda la banca en la ruleta, en un período dado de tiempo. uestro enfoque consiste en determinar cuantas

Más detalles

IBM SPSS Regression 19

IBM SPSS Regression 19 IBM SPSS Regression 19 Note: Before using this information and the product it supports, read the general information under Notices el p. 47. This document contains proprietary information of SPSS Inc,

Más detalles

Análisis Estadístico de Datos Climáticos

Análisis Estadístico de Datos Climáticos Análisis Estadístico de Datos Climáticos Análisis de agrupamiento (o clusters) (Wilks, Cap. 14) Facultad de Ciencias Facultad de Ingeniería 2013 Objetivo Idear una clasificación o esquema de agrupación

Más detalles

1. Dominio, simetría, puntos de corte y periodicidad

1. Dominio, simetría, puntos de corte y periodicidad Estudio y representación de funciones 1. Dominio, simetría, puntos de corte y periodicidad 1.1. Dominio Al conjunto de valores de x para los cuales está definida la función se le denomina dominio. Se suele

Más detalles

Lecturas previas Cuando llegue a su primera sesión de laboratorio debe haber estudiado el contenido de la lectura que aparece a continuación.

Lecturas previas Cuando llegue a su primera sesión de laboratorio debe haber estudiado el contenido de la lectura que aparece a continuación. Laboratorio 1 Medición e incertidumbre La descripción de los fenómenos naturales comienza con la observación; el siguiente paso consiste en asignar a cada cantidad observada un número, es decir en medir

Más detalles

REGRESIÓN LINEAL MÚLTIPLE

REGRESIÓN LINEAL MÚLTIPLE REGRESIÓN LINEAL MÚLTIPLE.- Planteamiento general....- Métodos para la selección de variables... 5 3.- Correlaciones parciales y semiparciales... 8 4.- Multicolinealidad en las variables explicativas...

Más detalles

Curso Práctico de Bioestadística Con Herramientas De Excel

Curso Práctico de Bioestadística Con Herramientas De Excel Curso Práctico de Bioestadística Con Herramientas De Excel Fabrizio Marcillo Morla MBA barcillo@gmail.com (593-9) 4194239 Fabrizio Marcillo Morla Guayaquil, 1966. BSc. Acuicultura. (ESPOL 1991). Magister

Más detalles

Matrices equivalentes. El método de Gauss

Matrices equivalentes. El método de Gauss Matrices equivalentes. El método de Gauss Dada una matriz A cualquiera decimos que B es equivalente a A si podemos transformar A en B mediante una combinación de las siguientes operaciones: Multiplicar

Más detalles

UNIDAD 4: MEDIDAS DE TENDENCIA CENTRAL

UNIDAD 4: MEDIDAS DE TENDENCIA CENTRAL UNIDAD 4: MEDIDAS DE TENDENCIA CENTRAL Objetivo terminal: Calcular e interpretar medidas de tendencia central para un conjunto de datos estadísticos. Objetivos específicos: 1. Mencionar las características

Más detalles

TEMA 5 Variables ficticias

TEMA 5 Variables ficticias TEMA 5 Variables ficticias Cómo describir información cualitativa Muchas veces en el modelo de regresión aparecen factores cualitativos (sexo, raza, estado civil,.). En estos casos la información relevante

Más detalles

1. Ecuaciones no lineales

1. Ecuaciones no lineales 1. Ecuaciones no lineales 1.1 Ejercicios resueltos Ejercicio 1.1 Dada la ecuación xe x 1 = 0, se pide: a) Estudiar gráficamente sus raíces reales y acotarlas. b) Aplicar el método de la bisección y acotar

Más detalles

Hay diferencias en la media del HOMA entre los diabéticos y los no diabéticos? Resumen del procesamiento de los casos

Hay diferencias en la media del HOMA entre los diabéticos y los no diabéticos? Resumen del procesamiento de los casos Test de hipótesis t de Student Hay diferencias en la media del HOMA entre los diabéticos y los no diabéticos? Resumen del procesamiento de los casos HOMA Casos Válidos Perdidos Total N Porcentaje N Porcentaje

Más detalles

Análisis y cuantificación del Riesgo

Análisis y cuantificación del Riesgo Análisis y cuantificación del Riesgo 1 Qué es el análisis del Riesgo? 2. Métodos M de Análisis de riesgos 3. Método M de Montecarlo 4. Modelo de Análisis de Riesgos 5. Qué pasos de deben seguir para el

Más detalles

Gráficas de caja. El borde derecho de la caja es el tercer cuartil, Q 3, que es la mediana de los valores que están por encima de la mediana.

Gráficas de caja. El borde derecho de la caja es el tercer cuartil, Q 3, que es la mediana de los valores que están por encima de la mediana. LECCIÓN CONDENSADA 2.1 Gráficas de caja En esta lección crearás e interpretarás las gráficas de caja para conjuntos de datos usarás el rango intercuartil (IQR) para identificar valores extremos potenciales

Más detalles

CORRELACIONES CON SPSS

CORRELACIONES CON SPSS ESCUEL SUPERIOR DE INFORMÁTIC Prácticas de Estadística CORRELCIONES CON SPSS 1.- INTRODUCCIÓN El concepto de relación o correlación entre dos variables se refiere al grado de parecido o variación conjunta

Más detalles

ÍNDICE 1. INTRODUCCIÓN... 4 2. PARTICIPANTES... 5. 2.1. Participantes por sector... 5. 2.2. Participantes por edad... 6

ÍNDICE 1. INTRODUCCIÓN... 4 2. PARTICIPANTES... 5. 2.1. Participantes por sector... 5. 2.2. Participantes por edad... 6 INFORME DE RESULTADOS DEL ESTUDIO DE SATISFACCIÓN DE USUARIOS UNIVERSIDAD DE ALMERÍA 2012 SERVICIO DE PLANIFICACIÓN, EVALUACIÓN Y CALIDAD CALIDAD DE LOS SERVICIOS ENERO 2013 ÍNDICE 1. INTRODUCCIÓN...

Más detalles

Aula Banca Privada. La importancia de la diversificación

Aula Banca Privada. La importancia de la diversificación Aula Banca Privada La importancia de la diversificación La importancia de la diversificación La diversificación de carteras es el principio básico de la operativa en mercados financieros, según el cual

Más detalles

Procesamiento de información para la investigación utilizando el programado Excel recopilados. Los participantes rán en

Procesamiento de información para la investigación utilizando el programado Excel recopilados. Los participantes rán en Procesamiento de información para la investigación utilizando el programado Excel recopilados. Los participantes rán en Julio E. Rodríguez Torres el Joel uso O. Lucena de Excel. Quiles Centro para la Excelencia

Más detalles

Métodos generales de generación de variables aleatorias

Métodos generales de generación de variables aleatorias Tema Métodos generales de generación de variables aleatorias.1. Generación de variables discretas A lo largo de esta sección, consideraremos una variable aleatoria X cuya función puntual es probabilidad

Más detalles

ESTADÍSTICA DESCRIPTIVA CON SPSS

ESTADÍSTICA DESCRIPTIVA CON SPSS ESTADÍSTICA DESCRIPTIVA CON SPSS (2602) Estadística Económica Joaquín Alegre y Magdalena Cladera SPSS es una aplicación para el análisis estadístico. En este material se presentan los procedimientos básicos

Más detalles

METODOS ESTADISTICOS.

METODOS ESTADISTICOS. AREA DE ESTADISTICA E INVESTIGACION DE OPERACIONES PROGRAMA: METODOS ESTADISTICOS. PROYECTO: SERVICIO DE CONSULTORIA ESTADISTICA. SERVICIO DE CONSULTORIA ESTADISTICA. Diseño con propósitos de un posterior

Más detalles