Tema 13. Regresión Logística
|
|
|
- José Luis Ortíz Ávila
- hace 9 años
- Vistas:
Transcripción
1 Tema 13. Regresión Logística Abdelmalik Moujahid, Iñaki Inza y Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del País Vasco Euskal Herriko Unibertsitatea 1 Introducción En este tema vamos a introducir las ideas fundamentales subyacentes a un paradigma denominado regresión logística. La regresión logística se ha convertido en un paradigma muy usado en Ciencias de la Salud para construir modelos predictores. La razón fundamental de esta popularización es debido al hecho de que los parámetros en los que se basa tienen una interpretación en términos de riesgo. Este tema se ha estructurada de la manera siguiente: En la Sección 2 se introduce el modelo de regresión logística. La Seccíón 3 muestra como estimar los parámetros de los que depende el modelo a partir de sus estimaciones máximo verosímiles. La sección 4 es una interpretación del modelo logístico en términos de riesgo, asi se introducen conceptos tales como risk ratio, odds ratio, formulación logit y risk odds ratio. En las Secciones 5 y 6 se introducen respectivamente el test de la razón de verosimilitud y el test de Wald ambas herramientas útiles para el proceso de modelización. 2 El Modelo Logístico Antes de introducir el modelo de regresión logística, vamos a considerar el modelo lineal de la regresión, el cual consiste en aprender una función real lineal que asigna a cada instancia un valor real. Es la principal diferencia respecto a la clasificación; el valor a predecir es real. Si denotamos por C a la variable a predecir, y por X 1,..., X n a las n variables predictoras, el paradigma de regresión lineal se expresa de la manera siguiente: g β (x) = β 0 + β 1 X β n X n = β 0 + n β ix i = β T x donde g β (x) es la función lineal y β T es el vector de los parámetros (llamado también vector de pesos). Ahora, dado un conjunto de datos de entrenamiento, la pregunta es cómo aprender el vector de los parámetros β de manera que la función g(x) aproxime la salida C? Una manera razonable para realizar este aprendizaje, considerando una muestra de tamaño N, sería definir una función que mide, para cada valor de β, cómo está de cerca g(x (i) ) de c (i). Esta función se llama función de coste y viene dada por, J(β) = 1 2 N [g(x (i) ) c (i) ] 2 Esta función es simplemente la función de coste de mínimos cuadrados que da lugar a un modelo de regresión de mínimos cuadrados ordinarios. 1
2 Finalmente, el problema de aprendizaje se reduce a un problema de optimización ya que el objetivo es encontrar β que minimiza J(β). Como se ha señaldo anteriormente, el probelma de clasificación es similar al problema de regresión con la diferencia de que los valores de la variable clase que se quiere predecir sólo pueden tomar un número finito de valores discretos. Para simplificar el análisis, consideramos que la varibale clase es binaria y denotamosla por C. Podriamos abordar el problema de clasificación ignorando el hecho de que la variable clase es discreta y usar un algoritmo de regresión lineal para predecir C dada x. Sin embargo, aúnque esto es posible matemáticamente, nos conduce a resultados absurdos. Por ello, vamos a cambiar nuestra hipotesis sobre la función g β (x), y consideramos la siguiente función: 1 f β (x) = 1 + e (β 0+ = 1 n β ix i ) 1 + e βt x la cual esta acotada entre 0 y 1, y por tanto, puede ser interpreta en términos de probabilidad. Por otra parte esta función verifica las siguientes propiedades: lím x = 0 lím x + = 1 f(0) = 1 2 f (x) = f(x)(1 f(x)) Esta función es conocida como función logística o función sigmoide. Entonces, asumiendo que la varible clase C es binaria, el paradigma de regresión logística se expresa de la manera siguiente: P (C = 1 x; β) = f β (x) P (C = 0 x; β) = 1 f β (x) donde β T es el vector de los parámetros, que deben ser estimados a partir de los datos, a fijar para tener determinado un modelo concreto de regresión logística. 3 Estimación Máximo Verosímil de los Parámetros La estimación del vector de los parámetros β T de un modelo de regresión logística se efectúa por medio del método de estimación por máxima verosimilitud. Según dicho método se obtienen los estimadores máximo verosímiles como funciones de la muestra que hacen que se maximice la función de verosimilitud asociada a la nuestra. Denotando por L ( (x (1), c (1) ),..., (x (N), c (N) ), β 0, β 1,..., β n ) a la función de verosimilitud asociada a una muestra de tamaño N, para un modelo de regresión logística con una función densidad de probabilidad dada por, se tiene que: P (C x; β) = f β (x) C.(1 f β (x)) 1 C L(x, C; β) = N f β (x (j) ) c(j).(1 f β (x (j) )) 1 c(j) j=1 2
3 Por otra parte, teniendo en cuenta que ln(z) es una función creciente estrictamente, y por tanto maximizar la función L se reduce a maximizar su función logaritmo lnl. Desarrollando el logaritmo natural de la función de verosimilitud obtenemos: lnl(x, C; β) = l β (x, C) = N c (j) lnf β (x (j) ) + j=1 N ( ) 1 c (j) ln ( 1 f β (x (j)) En algúnos casos, es posible encontrar análiticamente los estimadores máximo verosímiles β. Pero más a menudo, es necesario recurrir a los métodos numéricos para encontrar los β. A continuación, se presenta brevemente uno de los métodos más utilizados, el método de Newton-Raphson. Es un método iterativo que genera una secuencia de valores β 0, β 1,... que, bajo condiciones ideales, converge hacia el estimador máximo verosímil β. El método de Newton consiste en lo siguiente: dada una función real, f, encontrar β tal que f(β) = 0. β R es un número real. Este método implementa la siguiente regla de adaptación: β := β f(β) f (β). La generalización de este método al caso multiparámetros ( β = ( β 1,..., β n )) se conoce como el método de de Newton-Raphson. Aplicado a nuestro modelo de regresión logística viene dado por: j=1 β := β H 1 β l β (x, C). donde l β (x, C) es la función log-verosimil, H ij = 2 l β β i β j es la matriz Hessiana i, j = 1,..., n, donde n el número del los parámetros. β es el vector gradiente de valores βi l β = l β β i. i = 1,..., n. Considerando un ejemplo de entrenamiento, (x (j), c (j) ), el gradiente de l β (x, C) viene dado por: l β c (j) = ( β i f β (x (j) ) (1 c(j) ) 1 f β (x (j) ) ) f β(x (j) ) β i Desarrollando la derivada de la función logística (f (x) = f(x)(1 f(x))), tenemos: l β c (j) = [ β i f β (x (j) ) (1 c(j) ) 1 f β (x (j) ) ][f β(x (j) ).(1 f β (x (j) ))] (βt x) β i l β = (c (j) f β (x (j) )).x i β i De lo anterior, y adoptando una notación matricial, tenemos β l β = (C f β (x))x, de allí la matriz Hessiana viene dada por: H = β βl β = x T β f β(x) = x T [f β (x)(1 f β (x))]x H = x T W x donde W es matriz diagonal con elementos f β (x (j) )(1 f β (x (j) )) j = 1,..., N. 3
4 Finalmente, la regla de adaptación de Newton-Raphson viene dada por: β := β + (x T W x) 1 (C f β (x))x. 4 Interpretación del modelo logístico en términos de riesgo Por ejemplo usando los datos proporcionados por Kleinbaum (1994) donde C representa la variable aletoria Enfermedad Coronaria con posibles valores (1 si, 0 no), X 1 Nivel de Colesterol (1 alto, 0 bajo), X 2 Edad Continua, y X 3 el resultado del Electrocardiograma (1 anormal, 0 normal), supongamos que obtenemos el modelo de regresión logística -obtenido a partir de N = 609 casos siguiente: β 0 = 3,911 β 1 = 0,652 β 2 = 0,029 β 3 = 0,342 Si quisieramos comparar el riesgo para dos patrones: x = (1, 40, 0) y x = (0, 40, 0) podríamos comenzar calculando la probabilidad de que C = 1 para cada uno de ellos: 1 P (C = 1 x) = P (C = 1 X 1 = 1, X 2 = 40, X 3 = 0) = = 0, e ( 3, ,652(1) + 0,029(40) + 0,342(0)) P (C = 1 x 1 ) = P (C = 1 X 1 = 0, X 2 = 40, X 3 = 0) = = 0, e ( 3, ,652(0) + 0,029(40) + 0,342(0)) para posteriormente utilizar el denominado risk ratio (RR) de X 1 = 1 frente a X 1 = 0 definido de la siguiente manera: RR(x, x ) = P (C = 1 x) P (C = 1 x ) = P (C = 1 X 1 = 1, X 2 = 40, X 3 = 0) P (C = 1 X 1 = 0, X 2 = 40, X 3 = 0) = 0,109 0,060 = 1,82 Es decir, para una persona con 40 años y electrocardiograma normal, el riesgo se multiplica casi por dos al pasar de un nivel de Colesterol bajo(0) a uno alto (1). Otro concepto de interés es el de odds ratio (OR) de un determinado patrón x el cual se denota por OR(x) y se define como el cociente entre la probabilidad de que el patrón pertenezca a la clase 1 entre la probabilidad de que el patrón pertenezca a la clase 0. Es decir: OR(x) = P (C = 1 x) 1 P (C = 1 x) Para trabajar con OR(x) de manera ágil, es conveniente expresar el modelo de regresión logística en la manera logit. Para ello se efectúa una transformación del modelo, de la manera siguiente: [ ] P (C = 1 x) logit (P (C = 1 x)) = ln OR(x) = ln 1 P (C = 1 x) 4
5 Sustituyendo en la fórmula anterior las expresiones correspondientes al modelo logístico obtenemos: logit (P (C = 1 x)) = β 0 + β i x i Tal y como se ha comentado anteriormente, el odds ratio (OR) de un individuo con patrón x se define como el cociente entre la probabilidad de que C = 1 dado dicho patrón x y la probabilidad de que C = 0 dado x. Así un odds ratio de 1 3 para un patrón x se interpreta diciendo que para dicho patrón la probabilidad de que se dé C = 1 es una tercera parte de la probabilidad de que C = 0. P (C = 1 x) Además se tiene que ln OR(x)) = ln 1 P (C = 1 x) = β 0 + β i x i y por tanto si x = (0, 0,..., 0) entonces ln OR(0)) = β 0. Siguiendo con el ejemplo anterior relativo a la enfermedad coronaria, si calculásemos el logit para x = (1, 40, 0) y para x = (0, 40, 0) obtenemos: Así como: y restando ambos logit se obtiene: logit P (C = 1 x)) = β β β β 3 logit P (C = 1 x )) = β β β β 3 logit P (C = 1 x)) logit P (C = 1 x )) = β 1 Veamos cómo expresar de manera genérica la constatación anterior. Teorema 1: En un modelo de regresión logística, el coeficiente β i (i = 1,..., n) representa el cambio en el logit resultante al aumentar una unidad en la i-ésima variable X i (i = 1,..., n). Demostración: Sean x = (x 1,..., x i,..., x n ) y x = (x 1,..., x i,..., x n) dos patrones verificando x j = x j para todo j i y x i = x i + 1. Calculando el cambio en el logit obtenemos: ( ) logit (x ) logit (x) = β 0 + β i x i β 0 + β i x i = β i x i β i x i = = β i (x i + 1 x i ) = β i Otro concepto que resulta de interés es el de risk odds ratio (ROR) de x frente a x, el cual mide el riesgo del odds ratio de x frente al odds ratio de x (OR(x)), es decir: ( ) ( β 0 + β i x ) i ROR(x, x) = OR(x ) OR(x) = e β i (x i x i ) ( ) = e β 0 + β i x i e 5
6 Obviamente ROR(x, x) se puede expresar de manera alternativa como: n ROR(x, x) = e β i(x i xi) = e β 1(x 1 x 1)... e β n(x n x n ) 5 Test de la Razón de Verosimilitud El test de la razón de verosimilitud se basa en comparar el producto entre 2 y el logaritmo neperiano de un cociente entre verosimilitudes con el percentil correspondiente de una distribución chi-cuadrado. Dicho test de la razón de verosimilitud tiene como objetivo el comparar dos modelos de regresión logística, el denominado modelo completo (full model) frente al que se conoce como modelo reducido (reduced model). Este segundo modelo puede verse como un submodelo del modelo completo. La hipótesis nula testada en el test de la razón de verosimilitud establece que los parámetros correspondientes a las variables que forman parte del modelo completo, pero no del modelo reducido, valen cero. Para ver la manera en la que funciona el test de la razón de verosimilitud vamos a considerar los siguientes tres modelos de regresión logística expresados en su formulación logit: Modelo 1: logit P 1 (C = 1 x) = α + β 1 x 1 + β 2 x 2 Modelo 2: logit P 2 (C = 1 x) = α + β 1 x 1 + β 2 x 2 + β 3 x 3 Modelo 3: logit P 3 (C = 1 x) = α + β 1 x 1 + β 2 x 2 + β 3 x 3 + β 4 x 1 x 3 + β 5 x 2 x 3 Tal y como puede verse, el Modelo 2 es una extensión del Modelo 1, de igual manera que el Modelo 3 constituye una extensión del Modelo 2. En caso de querer comparar el Modelo 2 frente al Modelo 1, este último jugará el papel de modelo reducido, mientras que el Modelo 2 será el modelo completo. De manera análoga, si quisiésemos comparar el Modelo 3 frente al Modelo 2, dicho Modelo 2 sería el modelo reducido, mientras que el Modelo 3 se interpretará como modelo completo. Vamos a denotar por L 1, y L 3 los valores de máxima verosimilitud obtenidos respectivamente por el Modelo 1, Modelo 2 y Modelo 3 en relación con un conjunto de N casos previamente determinado. Debido a que cuanto más parámetros tiene un modelo mejor se va ajustando a los datos, y esta es la situación existente con los tres modelos anteriores debido a sus características jerárquicas, se tiene que: L 1 L 3 Pero por otra parte, al ser el logaritmo una función creciente, se obtiene que: y por tanto ln L 1 ln ln L 3 2ln L 3 2ln 2ln L 1 siendo esta la relación existente entre los denominados log likehood statistics, a partir de los cuales se va a construir el test de la razón de verosimilitud. El test de la razón de verosimilitud (LR) tiene en cuenta la resta entre dos log likehood statistics, o lo que es lo mismo, el logaritmo neperiano del cociente entre dos verosimilitudes. Siguiendo con el ejemplo introducido anteriormente y tratando de comparar el Modelo 2 frente al Modelo 1, el test de la razón de verosimilitud plantea como hipótesis 6
7 nula el que β 3 = 0, es decir, que el parámetro de la componente que forma parte del Modelo 2 pero no del Modelo 1 es cero. Por tanto se tiene: H 0 : β 3 = 0 H 1 : β 3 0 La manera en la que funciona el test de razón de verosimilitud es la siguiente: Si la variable X 3 efectúa una gran contribución a la modelización y hace que el Modelo 2 se ajuste mucho mejor a los datos que el Modelo 1, se tendrá que será mucho mayor que L 1, y por tanto L 1 0. Tomando logaritmos neperianos, ln L 1, y de ahí que 2ln L 1 +. Por tanto cuanto mayor sea el valor de LR = 2ln L 1 más en contra estaremos de la hipótesis nula H 0 : β 3 = 0. Por otra parte, si la contribución de X 3 es escasa, se tendría que L 1 1 y por tanto ln L 1 0 y finalmente LR= 2ln L 1 0. Se demuestra teóricamente que LR = 2ln L 1 sigue bajo la hipótesis nula H L 0 una 2 distribución de probabilidad χ 2 r cuando N, número de casos en la base de datos, es suficientemente grande. El número de grados de libertad de la distribución chicuadrado, r, es igual al número de parámetros que en el modelo completo deben igualarse a cero para que dicho modelo completo coincida con el modelo reducido. Nótese que LR verifica 0 LR < +. 6 El test de Wald El test de Wald constituye otra manera de llevar a cabo test de hipótesis acerca de parámetros sin necesidad de usar el test de la razón de verosimilitud. Sin embargo el test de Wald tan sólo puede ser usado para testar un único parámetro, como por ejemplo ocurre al testar el Modelo 2 frente al Modelo 1. Si tratásemos de testar el Modelo 3 frente al Modelo 2, el test de Wald no sería de aplicación. Ŝ βj Para llevar a cabo el test de Wald hay que tener en cuenta el denominado estadístico de Wald para la variable en cuestión, en este caso denotada por X j. Para dicha β j j-ésima variable dicho estadístico de Wald es, siendo β j y Ŝ Ŝβ j las estimaciones βj máximo verosímiles de β j y de su correspondiente desviación estándard. Se verifica que β ( ) 2 j βj N (0, 1) o lo que es equivalente, χ 2 1. Esta distribución del estadístico de Wald sirve para aceptar o rechazar la hipótesis nula establecida sobre el j-ésimo parámetro, H 0 : β j = 0 H A : β j 0 Ŝ βj 7
8 Referencias 1. A. Albert, J.A. Anderson (1984). On the Existence of Maximun Likelihood Estimates in Logistic Models. Biometrika, 71, R. Christensen (1997). Log-linear Models and Logistic Regression, Springer 3. D.W. Hosmer, S. Lemeshov (1989) Applied Logistic Regression, Wiley 4. D.G. Kleinbaum (1994) Logistic Regression, Springer 5. S. Menard (2000). Coefficients of Determination for Multiple Logistic Regression Analysis. The American Statistician, 51, 1,
D conjunto de N patrones etiquetados, cada uno de los cuales está caracterizado por n variables predictoras X 1,..., X n y la variable clase C.
Tema 10. Árboles de Clasificación Pedro Larrañaga, Iñaki Inza, Abdelmalik Moujahid Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del País Vasco Euskal Herriko Unibertsitatea
Introducción al modelo de regresión logística
Introducción al modelo de regresión logística JOSÉ R BERRENDERO DEPARTAMENTO DE MATEMÁTICAS UNIVERSIDAD AUTÓNOMA DE MADRID INTRODUCCIÓN Y MOTIVACIÓN El modelo de regresión logística se utiliza para investigar
Guillermo Ayala Gallego Universidad de Valencia
GoBack Regresión logística Guillermo Ayala Gallego Universidad de Valencia 4 de febrero de 2009 1 / 22 Puede que sea el procedimiento estadístico más utilizado. Con aplicaciones frecuentes en Medicina
Auxiliar 9. MNL y MLE. Daniel Olcay. 21 de octubre de 2014 IN4402. Daniel Olcay (IN4402) Auxiliar 9 21 de octubre de / 13
Auxiliar 9 MNL y MLE Daniel Olcay IN4402 21 de octubre de 2014 Daniel Olcay (IN4402) Auxiliar 9 21 de octubre de 2014 1 / 13 Índice Modelos no lineales Probabilidad lineal Probit Logit Máxima verosimilitud
Tema 12. Selección de Variables
Tema 12. Selección de Variables Pedro Larrañaga, Iñaki Inza, Abdelmalik Moujahid Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del País Vasco Euskal Herriko Unibertsitatea
Análisis de Datos. Regresión logística. Profesor: Dr. Wilfrido Gómez Flores
Análisis de Datos Regresión logística Profesor: Dr. Wilfrido Gómez Flores 1 Regresión logística Supóngase que se tiene una variable binaria de salida Y, y se desea modelar la probabilidad condicional P(Y=1
Regresión múltiple. Demostraciones. Elisa Mª Molanes López
Regresión múltiple Demostraciones Elisa Mª Molanes López El modelo de regresión múltiple El modelo que se plantea en regresión múltiple es el siguiente: y i = β 0 + β 1 x 1i + β 2 x 2i +...+ β k x ki +
Tema 9. Inducción de Reglas
Tema 9. Inducción de Reglas Abdelmalik Moujahid, Iñaki Inza, Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del País Vasco Euskal Herriko Unibertsitatea
Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.
TEMA 13 REGRESIÓN LOGÍSTICA Es un tipo de análisis de regresión en el que la variable dependiente no es continua, sino dicotómica, mientras que las variables independientes pueden ser cuantitativas o cualitativas.
Análisis de datos Categóricos
Introducción a los Modelos Lineales Generalizados Universidad Nacional Agraria La Molina 2016-1 Introducción Modelos Lineales Generalizados Introducción Componentes Estimación En los capítulos anteriores
Estimación MC3E, MVIC en Modelos de Ecuaciones Simultáneas
Estimación MC3E, MVIC en Modelos de Ecuaciones Simultáneas Economía Aplicada III (UPV/EHU) OCW 2013 Contenidos 1 Información Completa 2 3 Información Completa Un método de información completa considera
Definición Una hipótesis es una afirmación acerca de un parámetro.
Capítulo 8 Prueba de hipótesis Existen dos áreas de interés en el proceso de inferencia estadística: la estimación puntual y las pruebas de hipótesis. En este capítulo se presentan algunos métodos para
Economía Aplicada. Modelos con variables dependiente binarias. Departamento de Economía Universidad Carlos III de Madrid
Economía Aplicada Modelos con variables dependiente binarias Departamento de Economía Universidad Carlos III de Madrid Ver Stock y Watson (capítulo 11) 1 / 28 Modelos con variables dependiente binarias:
Derivada de la función compuesta. Regla de la cadena
Derivada de la función compuesta. Regla de la cadena Cuando en las matemáticas de bachillerato se introduce el concepto de derivada, su significado y su interpretación geométrica, se pasa al cálculo de
ECONOMETRÍA II Prof.: Begoña Álvarez TEMA 1 INTRODUCCIÓN. Estimación por máxima verosimilitud y conceptos de teoría asintótica
ECONOMETRÍA II Prof.: Begoña Álvarez 2007-2008 TEMA 1 INTRODUCCIÓN Estimación por máxima verosimilitud y conceptos de teoría asintótica 1. ESTIMACIÓN POR MÁXIMA VEROSIMILITUD (MAXIMUM LIKELIHOOD) La estimación
Mathias Bourel. 2 de octubre de 2016
Regresión Logística Mathias Bourel IMERL - Facultad de Ingeniería, Universidad de la República, Uruguay 2 de octubre de 2016 M.Bourel (IMERL, UdelaR) Regresión Logística 2 de octubre de 2016 1 / 28 Introducción
Tema 2.- Formas Cuadráticas.
Álgebra. 004 005. Ingenieros Industriales. Departamento de Matemática Aplicada II. Universidad de Sevilla. Tema.- Formas Cuadráticas. Definición y representación matricial. Clasificación de las formas
TEMA V ANÁLISIS DE REGRESIÓN LOGÍSTICA
TEMA V ANÁLISIS DE REGRESIÓN LOGÍSTICA LECTURA OBLIGATORIA Regresión Logística. En Rial, A. y Varela, J. (2008). Estadística Práctica para la Investigación en Ciencias de la Salud. Coruña: Netbiblo. Páginas
Métodos Estadísticos Multivariados
Métodos Estadísticos Multivariados Victor Muñiz ITESM Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre 2011 1 / 20 Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre
x (0) si f (x) = 2s 1, s > 1 d) f 3. Analizar la existencia de derivadas laterales y de derivada en a = 0, para las siguientes funciones:
FACULTAD DE CIENCIAS EXACTAS Y NATURALES UNIVERSIDAD DE BUENOS AIRES COMPLEMENTOS DE ANÁLISIS MAESTRíA EN ESTADíSTICA MATEMÁTICA SEGUNDO CUATRIMESTRE 2007 PRÁCTICA 7 1. Usando sólo la definición de derivada,
T2. El modelo lineal simple
T2. El modelo lineal simple Ana J. López y Rigoberto Pérez Dpto Economía Aplicada. Universidad de Oviedo Curso 2010-2011 Curso 2010-2011 1 / 40 Índice 1 Planteamiento e hipótesis básicas 2 Estimación de
Odds = = e. UD1: El modelo de regresión logística 1. 1 e
RE2. Regresión logística binaria, multinomial, de Poisson y binomial negativa Curso 204/5 Solución resumida de la prueba de evaluación Unidad didáctica (D) La regresión logística puede utilizarse en cualquiera
Estimación MC2E, MVIL en Modelos de Ecuaciones Simultáneas
Estimación MC2E, MVIL en Modelos de Ecuaciones Simultáneas Economía Aplicada III (UPV/EHU) OCW 2013 Contents 1 Mínimos Cuadrados en 2 Etapas 2 Mínimos Cuadrados en 2 Etapas El método de Mínimos Cuadrados
Modelos elección discreta y variable dependiente limitada
Modelos elección discreta y variable dependiente limitada Profesor: Graciela Sanroman Facultad de Ciencias Económicas y Administración Año 2010 Modelos multinomiales Los modelos multinomiales son aquellos
CONTRASTE DE HIPÓTESIS
CONTRASTE DE HIPÓTESIS Antonio Morillas A. Morillas: Contraste de hipótesis 1 CONTRASTE DE HIPÓTESIS 1. Introducción 2. Conceptos básicos 3. Región crítica óptima i. Teorema de Neyman-Pearson ii. Región
CONTRASTE DE HIPÓTESIS
CONTRASTE DE HIPÓTESIS Antonio Morillas A. Morillas: Contraste de hipótesis 1 CONTRASTE DE HIPÓTESIS 1. Introducción 2. Conceptos básicos 3. Región crítica óptima i. Teorema de Neyman-Pearson ii. Región
Modelos de suavizado, aditivos y mixtos
Carmen Armero 1 de junio de 2011 Introducción Introducción Modelos lineales, LM Modelos aditivos, AM Modelos lineales generalizados, GLM GAM I Un modelo lineal generalizado (GAM) es un modelo lineal generalizado
1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA
MODELO DE REGRESIÓN LOGÍSTICA Introducción A grandes rasgos, el objetivo de la regresión logística se puede describir de la siguiente forma: Supongamos que los individuos de una población pueden clasificarse
METODOS ESTADÍSTICOS
METODOS ESTADÍSTICOS Introducción. Uno de los objetivos de la asignatura de Hidrología, es mostrar a los alumnos, las herramientas de cálculo utilizadas en Hidrología Aplicada para diseño de Obras Hidráulicas.
Maxima Verosimilitud [Escribir el subtítulo del documento] Valores que hacen mas verosímil la información
Maxima Verosimilitud [Escribir el subtítulo del documento] Valores que hacen mas verosímil la información Theodoro Perez Brito 24/05/2009 1. Principio de la máxima Verosimilitud: Supongamos que la distribución
ANALISIS FACTORIAL. Jorge Galbiati R.
ANALISIS FACTORIAL Jorge Galbiati R El análisis factorial es un modelo matamático que pretende explicar la correlación entre un conjunto grande de variables observadas y un pequeño conjunto de factores
Econometría Aplicada
Econometría Aplicada y función de Verosimilitud Víctor Medina Los objetivos de esta parte del curso principalmente son: 1. Dar algunos ejemplos de decisiones económicas donde la variable dependiente es
El modelo de azar proporcional: la regresión de Cox
El modelo de azar proporcional: la regresión de Cox Alfonso Luis Palmer Pol y Jose Maria Losilla Vidal El Análisis de la Supervivencia (Palmer, 1988) engloba una variedad de técnicas estadísticas que permiten
Caso 105. Tamaño de muestra y potencia de una prueba. Diseño de experimentos. Jesús López Fidalgo
Caso 105. Tamaño de muestra y potencia de una prueba. Diseño de experimentos. Jesús López Fidalgo Caso Práctico El objetivo de este ejercicio es analizar diferentes tipos de pruebas estadísticas en las
MÉTODOS AVANZADOS EN APRENDIZAJE ARTIFICIAL: TEORÍA Y APLICACIONES A PROBLEMAS DE PREDICCIÓN
MÉTODOS AVANZADOS EN APRENDIZAJE ARTIFICIAL: TEORÍA Y APLICACIONES A PROBLEMAS DE PREDICCIÓN Manuel Sánchez-Montañés Luis Lago Ana González Escuela Politécnica Superior Universidad Autónoma de Madrid Teoría
Tema 2. Fundamentos Teóricos de la. programación dinámica Teorema de Optimalidad de Mitten
Tema 2 Fundamentos Teóricos de la Programación Dinámica 2.1. Teorema de Optimalidad de Mitten El objetivo básico en la programación dinámica consiste en descomponer un problema de optimización en k variables
Diagonalización de matrices
7 Diagonalización de matrices 7.1. Matrices diagonalizables Existen diversos procesos en los que el estado en cada uno de sus pasos se puede representar por un determinado vector y en los que, además,
4. Complementos sobre Problemas de Contorno para S.D.O. Lineales. 4. Complementos sobre Problemas de Contorno
para S.D.O. Lineales 4.1. Problemas de contorno para s.d.o. lineales. Teorema de alternativa 4.1. Problemas de contorno. Teorema de alternativa Fijemos A C 0 ([α, β]; L(R N )) y b C 0 ([α, β]; R N ), dos
Una forma fácil de recordar esta suma (regla de Sarrus): Primero vamos a estudiar algunas propiedades de los determinantes.
Una forma fácil de recordar esta suma (regla de Sarrus): Ejemplos: Tarea: realizar al menos tres ejercicios de cálculo de determinantes de matrices de 2x2 y otros tres de 3x3. PARA DETERMINANTES DE MATRICES
Álgebra Lineal. Tema 6. Transformaciones lineales y matrices
Álgebra Lineal Tema 6. Transformaciones lineales y matrices Grado en Ingeniería Informática Doble Grado en Ingeniería Informática y Administración de Empresas AUTORES: J. S ALAS, A. T ORRENTE Y E.J.S.
Tema 4 Funciones convexas y optimización convexa
Tema 4 Funciones convexas y optimización convexa José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Contenidos del tema 4 Repaso de algunos resultados sobre optimización de funciones.
Capítulo VI. Diferenciabilidad de funciones de varias variables
Capítulo VI Diferenciabilidad de funciones de varias variables La definición de diferenciabilidad para funciones el cociente no tiene sentido, puesto que no está definido, porque el cociente entre el vector
Derivación de funciones de varias variables.
Derivación de funciones de varias variables. En este apartado se presentan los conceptos básicos que aparecen en la derivación de funciones de varias variables. La idea es establecer un método para estudiar
TEMA 3: Contrastes de Hipótesis en el MRL
TEMA 3: Contrastes de Hipótesis en el MRL Econometría I M. Angeles Carnero Departamento de Fundamentos del Análisis Económico Curso 2011-12 Econometría I (UA) Tema 3: Contrastes de Hipótesis Curso 2011-12
EL PRINCIPIO DE MÁXIMA VEROSIMILITUD (LIKELIHOOD)
EL PRINCIPIO DE MÁXIMA VEROSIMILITUD (LIKELIHOOD) Fortino Vela Peón [email protected] FVela-0 Objetivo Introducir las ideas básicas del principio de máxima verosimilitud. Problema Considere el experimento
Regresión lineal. Marcelo Rodríguez Ingeniero Estadístico - Magíster en Estadística
Regresión lineal Marcelo Rodríguez Ingeniero Estadístico - Magíster en Estadística Universidad Católica del Maule Facultad de Ciencias Básicas Pedagogía en Matemática Estadística I 01 de enero de 2012
Introducción a la regresión ordinal
Introducción a la regresión ordinal Jose Barrera [email protected] 20 de mayo 2009 Jose Barrera (UAB) Introducción a la regresión ordinal 20 de mayo 2009 1 / 11 Introducción a la regresión ordinal 1
ESTADÍSTICA I Tema 2: Algunas ideas básicas sobre inferencia estadística. Muestreo aleatorio
ESTADÍSTICA I Tema 2: Algunas ideas básicas sobre inferencia estadística. Muestreo aleatorio Muestra aleatoria Conceptos probabiĺısticos básicos El problema de inferencia Estadísticos. Media y varianza
Departamento de Matemáticas
MA5 Clase : Series de números reales Definición de Serie Elaborado por los profesores Edgar Cabello y Marcos González Definicion Dada una sucesión de escalares (a n ), definimos su sucesión de sumas parciales
DERIVADAS PARCIALES Y APLICACIONES
CAPITULO IV CALCULO II 4.1 DEFINICIÓN DERIVADAS PARCIALES Y APLICACIONES En cálculo una derivada parcial de una función de diversas variables es su derivada respecto a una de esas variables con las otras
Tema 8: Árboles de Clasificación
Tema 8: Árboles de Clasificación p. 1/11 Tema 8: Árboles de Clasificación Abdelmalik Moujahid, Iñaki Inza, Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad
Tema 6. Variables aleatorias continuas
Tema 6. Variables aleatorias continuas Resumen del tema 6.1. Definición de variable aleatoria continua Identificación de una variable aleatoria continua X: es preciso conocer su función de densidad, f(x),
TEMA 2: DISTRIBUCIONES BIDIMENSIONALES
TEMA : DISTRIBUCIONES BIDIMENSIONALES 1.- DISTRIBUCIONES BIDIMENSIONALES Cuando estudiamos un solo carácter estadístico, los datos que obtenemos forman una variable estadística unidimensional. También
1. El Teorema de Rolle Generalizado.
Proyecto III: Los Teoremas de Rolle y del valor Medio Objetivos: Profundizar el estudio de algunos teoremas del cálculo diferencial 1 El Teorema de Rolle Generalizado La formulación más común del Teorema
Tema 1. Espacios Vectoriales. Sistemas de ecuaciones.
Tema 1. Espacios Vectoriales. Sistemas de ecuaciones. Álgebra Lineal Escuela Politécnica Superior Universidad de Málaga Emilio Muñoz-Velasco (Basado en los apuntes de Jesús Medina e Inmaculada Fortes)
Modelos para variables categóricas
Gabriel V. Montes-Rojas Modelo logit multinomial Supongamos que la variable dependiente toma muchos valores, ej. y = 0, 1, 2..., J, aunque los valores de y no representan ningún orden en particular. Éste
Polinomio de Taylor. Extremos.
CAPÍTULO 6 Polinomio de Taylor. Extremos. En este capítulo trabajamos con el polinomio de Taylor de una función de varias variables y su aplicación al estudio de los extremos de funciones de más de una
El Movimiento Browniano en la modelización del par EUR/USD
MÁSTER UNIVERSITARIO EN DIRECCIÓN FINANCIERA Y FISCAL TESINA FIN DE MÁSTER El Movimiento Browniano en la modelización del par EUR/USD Autor: José Vicente González Cervera Directores: Dr. Juan Carlos Cortés
Estimación por intervalos
Capítulo 9 Estimación por intervalos 9.1. Introducción En este capítulo se desarrolla la estimación por intervalos donde el proceso de inferencia se realiza de la forma θ C, donde C = Cx) es un conjunto
Prácticas Tema 5. Ampliaciones del Modelo lineal básico
Prácticas Tema 5. Ampliaciones del Modelo lineal básico Ana J. López y Rigoberto Pérez Dpto. Economía Aplicada, Universidad de Oviedo PRÁCTICA 5.1. Se ha examinado la evolución reciente de las ventas de
Derivada y diferencial
Derivada y diferencial Una cuestión, que aparece en cualquier disciplina científica, es la necesidad de obtener información sobre el cambio o la variación de determinadas cantidades con respecto al tiempo
Métodos Numéricos Cap 5: Interpolación y Aproximación polinomial
1/12 Aproximación funcional e Interpolación Representación mediante funciones analíticas sencillas de: Información discreta. (Resultante de muestreos). Funciones complicadas. Siendo y k = f(x k ) una cierta
peso edad grasas Regresión lineal simple Los datos
Regresión lineal simple Los datos Los datos del fichero EdadPesoGrasas.txt corresponden a tres variables medidas en 25 individuos: edad, peso y cantidad de grasas en sangre. Para leer el fichero de datos
Modelo de Análisis de la Covarianza. Introducción al modelo de Medidas Repetidas
Modelo de Análisis de la Covariza. Introducción al modelo de Medidas Repetidas Modelo de Análisis de la Covariza Introducción El diseño por bloques se considera para eliminar el efecto de los factores
Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores
Análisis de Datos Introducción al aprendizaje supervisado Profesor: Dr. Wilfrido Gómez Flores 1 Conceptos básicos Reconocimiento de patrones (RP): clasificar objetos en un número de categorías o clases.
Tema 15: Combinación de clasificadores
Tema 15: Combinación de clasificadores p. 1/21 Tema 15: Combinación de clasificadores Abdelmalik Moujahid, Iñaki Inza, Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial
Preparación de los datos de entrada
Preparación de los datos de entrada Clase nro. 6 CURSO 2010 Objetivo Modelado de las características estocásticas de los sistemas. Variables aleatorias con su distribución de probabilidad. Por ejemplo:
INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 29 de Abril de 2016
ANEXO ESTADÍSTICO 1 : COEFICIENTES DE VARIACIÓN Y ERROR ASOCIADO AL ESTIMADOR ENCUESTA NACIONAL DE EMPLEO (ENE) INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 9 de Abril de 016 1 Este anexo estadístico es una
Tema 4: Teorema de la función inversa e impĺıcita
Tema 4: Teorema de la función inversa e impĺıcita Teorema de la función inversa para varias variables Sea A R n un conjunto abierto, f : A R n y ā A Si f es de clase C 1 en A y det(df(ā)) 0, entonces existe
ESTIMACIÓN PUNTUAL Julián de la Horra Departamento de Matemáticas U.A.M.
1 Introducción ESTIMACIÓN PUNTUAL Julián de la Horra Departamento de Matemáticas U.A.M. En este capítulo, vamos a abordar la Estimación Puntual, que es uno de los tres grandes conjuntos de técnicas que
Espacios Vectoriales Euclídeos. Métodos de los mínimos cuadrados
Capítulo 5 Espacios Vectoriales Euclídeos. Métodos de los mínimos cuadrados En este tema iniciamos el estudio de los conceptos geométricos de distancia y perpendicularidad en K n. Empezaremos con las definiciones
Parte 3. Vectores y valores propios
Parte 3. Vectores y valores propios Gustavo Montero Escuela Universitaria Politécnica Universidad de Las Palmas de Gran Canaria Curso 2004-2005 1 Introducción a los valores y vectores propios 2 3 4 5 Valores
Una matriz es un arreglo rectangular de números. Los números en el arreglo se llaman elementos de la matriz. ) ( + ( ) ( )
MATRICES Una matriz es un arreglo rectangular de números. Los números en el arreglo se llaman elementos de la matriz. Ejemplo 1. Algunos ejemplos de matrices ( + ( ) ( + ( ) El tamaño o el orden de una
Preliminares Métodos de Ajuste de Curvas AJUSTE DE CURVAS AJUSTE DE CURVAS
Contenido 1 Preliminares Definiciones 2 Definiciones Contenido 1 Preliminares Definiciones 2 Definiciones Definiciones En ciencias e ingeniería es frecuente que un experimento produzca un conjunto de datos
EXAMEN DE ESTADÍSTICA II Junio de 2002 SOLUCIÓN (tiempo:100 minutos)
EXAMEN DE ESTADÍSTICA II Junio de 2002 SOLUCIÓN (tiempo:100 minutos) PROBLEMA 1 Se quiere comparar la cantidad de energía necesaria para realizar 3 ejercicios o actividades: andar, correr y montar en bici.
Los estimadores mínimo cuadráticos bajo los supuestos clásicos
Los estimadores mínimo cuadráticos bajo los supuestos clásicos Propiedades estadísticas e inferencia Mariana Marchionni [email protected] Mariana Marchionni MCO bajo los supuestos clásicos 1
La interpolación polinomial en el análisis de métodos iterativos
Notas La interpolación polinomial en el análisis de métodos iterativos Resumen La solución de ecuaciones no lineales es de extrema importancia en la ingeniería y ciencias. Los métodos que se estudian para
Tema 1. Espacios Vectoriales. Sistemas de ecuaciones.
Tema 1. Espacios Vectoriales. Sistemas de ecuaciones. Álgebra Lineal Escuela Politécnica Superior Universidad de Málaga Emilio Muñoz-Velasco (Basado en los apuntes de Jesús Medina e Inmaculada Fortes)
4.2 Producto escalar.
Producto escalar. 147 Este resultado tiene su recíproco, es decir, cualquier matriz cuadrada A define la forma bilineal b(x, y) =x T Ay Si b es simétrica, la matriz A es simétrica. Si b es definida positiva,
Tema 9: Contraste de hipótesis.
Estadística 84 Tema 9: Contraste de hipótesis. 9.1 Introducción. El objetivo de este tema es proporcionar métodos que permiten decidir si una hipótesis estadística debe o no ser rechazada, en base a los
Lección 3: Aproximación de funciones. por polinomios. Fórmula de Taylor para
Lección 3: Aproximación de funciones por polinomios. Fórmula de Taylor para funciones escalares 3.1 Introducción Cuando es difícil trabajar con una función complicada, tratamos a veces de hallar una función
Tema 3 Optimización lineal. Algoritmo del simplex
Tema 3 Optimización lineal. Algoritmo del simplex José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Contenidos del tema 3 Teorema fundamental de la programación lineal. Algoritmo
La reordenación aleatoria de un conjunto finito
La reordenación aleatoria de un conjunto finito Pérez Cadenas J. I. 0.06.2003 Resumen Al desordenar y, a continuación, reordenar aleatoriamente un conjunto finito es posible que algunos de sus elementos
Capítulo V. Valores y vectores propios. Diagonalización de operadores lineales.
Capítulo V Valores y vectores propios. Diagonalización de operadores lineales. Hemos visto que la aplicaciones lineales de en están definidas a través de una expresión de la forma ; pero esta fórmula puede
Modelos lineales generalizados
GoBack Modelos lineales Guillermo Ayala Gallego Universidad de Valencia 20 de enero de 2009 1 / 57 Verosimilitud de Ajuste de un GLM mediante Fisher Scoring Method s de un modelo lineal generalizado Identifica
Tema 2. Heterocedasticidad. 1 El modelo de regresión lineal con errores heterocedásticos
ema 2. Heterocedasticidad. El modelo de regresión lineal con errores heterocedásticos En este tema vamos a analizar el modelo de regresión lineal Y t = X tβ + u t, donde X t = (X t, X 2t,.., X kt y β =
TEMA VI: EL MODELO DE REGRESIÓN LINEAL MÚLTIPLE
ESADÍSICA II EMA VI: EL MODELO DE REGRESIÓN LINEAL MÚLIPLE VI.1.- Introducción. VI..- Hipótesis básicas del modelo de regresión lineal múltiple. VI.3.- El estimador mínimo cuadrático ordinario del modelo
TEMA 1: MATRICES Y DETERMINANTES
TEMA 1: MATRICES Y DETERMINANTES 1 Matrices Definición 11 Una matriz es un arreglo rectangular de números reales de la forma a 11 a 12 a 1m a 21 a 22 a 2m A = a n1 a n2 a nm Las líneas horizontales (verticales)
Estadística II Tema 4. Regresión lineal simple. Curso 2009/10
Estadística II Tema 4. Regresión lineal simple Curso 009/10 Tema 4. Regresión lineal simple Contenidos El objeto del análisis de regresión La especificación de un modelo de regresión lineal simple Estimadores
INTERVALOS DE CONFIANZA. La estadística en cómic (L. Gonick y W. Smith)
INTERVALOS DE CONFIANZA La estadística en cómic (L. Gonick y W. Smith) EJEMPLO: Será elegido el senador Astuto? 2 tamaño muestral Estimador de p variable aleatoria poblacional? proporción de personas que
Análisis Multivariante de Datos
Análisis Multivariante de Datos Curso 2016-2017 Por qué es importante realizar inferencia sobre los parámetros de la normal? La estimación máximo-verosímil (MV) de la distribución Normal son la media y
Sistemas de ecuaciones lineales
Tema 1 Sistemas de ecuaciones lineales 11 Definiciones Sea K un cuerpo Una ECUACIÓN LINEAL CON COEFICIENTES EN K es una expresión del tipo a 1 x 1 + + a n x n = b, en la que n es un número natural y a
