Métodos Estadísticos Multivariados

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Métodos Estadísticos Multivariados"

Transcripción

1 Métodos Estadísticos Multivariados Victor Muñiz ITESM Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre / 19

2 Partial Least Squares Regression Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre / 19

3 Introducción Consideremos el modelo de regresión lineal múltiple con X de N p y Y de N K. La solución está dada por Y = XB + E (1) ˆB = (X T X) 1 X T Y (2) Algunos problemas que pueden encontrarse en X T X: Es singular debido a que p > N, por ejemplo, en imágenes. Es singular debido a colinearidad entre las variables. Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre / 19

4 Introducción Una solución es eliminar variables redundantes o reducir su efecto mediante regularización (por ejemplo, LASSO). Los métodos de encogimiento (shrinkage methods) proporcionan una solución a este problema. En estos métodos la dimensión del problema se reduce sustituyendo las variables originales por un conjunto reducido de componentes obtenidas mediante combinaciones lineales de las originales, luego, la regresión se realiza en estas nuevas componentes obtenidas. Ejemplos: Ridge Regression (RR), Principal Component Regression (PCR) (PCR) y Partial Least Squares Regression (PLS). PCR y PLS utilizan un número pequeño de combinaciones lineales Z m, m = 1,... M de las variables originales, que son usadas como las variables para realizar la regresión. Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre / 19

5 PCR Consideremos la descomposición SVD de X centrada: X = UΛV T (3) con U y V ortogonales de N p y p p respectívamente. Λ diagonal de p p que contiene los valores propios (no negativos y en forma descendente) de X. Las columnas de entrada se forman mediante z m = Xv m. Luego se realiza la regresión de y en z 1, z 2,..., z M para algún M p. Se obtienen una secuencia de modelos de regresión ŷ 0... ŷ M. Como las z s son ortogonales, la regresión es la suma de regresiones univariadas: donde ˆθ m = z m, y / z m, z m. ŷ = ȳ + M ˆθ m z m (4) m=1 Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre / 19

6 PLS Al igual que PCR, construye un conjunto de combinaciones lineales de las variables de entrada, pero además de usar X, usa también y para construirlas. Algoritmo PLS: Standardize each xj to have mean zero and variance one. Set ŷ (0) = 1ȳ and x (0) j = x j, j = 1,... p. for m = 1, 2..., p z m = p j=1 ˆϕ m,jx (m 1) j, where ˆϕ m,j = x (m 1) j, y. ˆθm = z m, y / z m, z m ŷ (m) = ŷ (m 1) + ˆθ mz m Orthogonalize each x (m 1) j with respect to z m Output the sequence of fitted vectors {ŷ (m) } p 1. Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre / 19

7 Análisis de PCR y PLS (Frank y Friedman, 1993) PLS y PCR tratan de obtener los coeficientes de regresión lejos de las soluciones dadas por mínimos cuadrados ordinarios (OLS) hacia direcciones de mayor dispersión en el espacio de los predictores. Análisis: construir un espacio m dimensional del espacio p dimensional original para realizar la regresión, con la restricción: β = M β k α k m=1 con {α k } M 1 expandiendo el subespacio y α 2 = 1. Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre / 19

8 Análisis de PCR y PLS (Frank y Friedman, 1993) Para OLS: Para PCR: α OLS = máx α corr2 (y, Xα) (5) s. a. α 2 = 1 α m (PCR) = máx var(xα) (6) α s. a. α 2 = 1 v T l Sα = 0, l = 1,..., m 1 Para PLS: α m (PLS) = máx α corr2 (y, Xα)var(Xα) (7) s. a. α 2 = 1 ˆϕ T l Sα = 0, l = 1,..., m 1 Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre / 19

9 Análisis de PCR y PLS (Frank y Friedman, 1993) El criterio OLS (5) es invariante a la escala de la combinación lineal Xα y proporciona estimadores insesgados. Los criterios asociados a PCR y PLS incluyen la escala de Xα mediante su varianza muestral, por lo tanto producen estimaciones sesgadas. El efecto de este sesgo es empujar la solución lejos de la solución OLS hacia direcciones donde los datos proyectados (predictores) tengan amplia dispersión, es decir, hacia valores mayores de var(xα). El grado de este sesgo está controlado por M, la dimensión del subespacio restringido construido. En PLS además, depende en forma conjunta de la estructura de covarianza de X y la solución de OLS, que a su vez depende de los valores de las variables de respuesta. Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre / 19

10 Análisis de PCR y PLS (Frank y Friedman, 1993) Una conclusión de Frank y Friedman es que la propiedad común de PCR y PLS sirve principalmente para reducir la varianza de sus estimaciones. En PLS los aspectos de varianza tienden a dominar y PLS se comporta muy parecido a PCR. Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre / 19

11 Análisis de PCR y PLS (Frank y Friedman, 1993) Un ejemplo (en R para verlo en clase...) Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre / 19

12 PLS multirespuesta las variables de respuesta Y y los predictores X son agrupados en bloques (Wold, 1984) y son tratados de manera común en forma más o menos simétrica. Una matriz de rango R puede escribirse como una suma de R matrices de rango 1 y a su vez, cada una de estas matrices de rango 1 pueden escribirse como el producto de dos vectores: un vector de scores y un vector de loadings. X = φ 1 p T φ R p T R = ΦP T Partiendo de SVD: X = ΦP T + E (8) donde Φ = UΛ es la matriz de scores, P = V es la matriz de loadings y E es la matriz de residuales. Para Y: Y = ΩQ T + F (9) Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre / 19

13 PLS multirespuesta Puede mostrarse que PLS busca pesos (φ, ω) tales que (Frank y Friedman, 1993): cov(φ, ω) = máx cov(xg, Yh) (10) g 2 = h 2 =1 Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre / 19

14 PLS multirespuesta Algoritmo PLS-C2A Center and standardize X and Y m = 1 X m = X, Y m = Y Compute the first pair of singular vectors of X T m Y m: g m and h m. φm = X mg m ωm = Y mh m Regress X m on φ m, Y m on ω m obtaining rank-one approximations of the data matrices: ˆX m(φ m) = φ mp T m Ŷ m(ω m) = ω mq T m where p T m = (φt m φm) 1 X mφ m and q T m = (ωt m ωm) 1 Y mω m are the regression coefficients. Substract the rank-one approximations to obtain remainder matrices: X m+1 = ˆX m ˆX m(φ m) Y m+1 = Ŷ m Ŷ m(ω m) IF X T m+1 Y m+1 = 0 EXIT ELSE m = m + 1, Go to step 4 Después de cada iteración se actualizan Φ, Ω, G, H, P y Q Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre / 19

15 PLS multirespuesta Del algoritmo obtenemos: Direcciones (o variables latentes) {φm, ω m } M 1 Matrices residuales {X m, Y m } M 1 mediante una deflación de X y Y. Vectores de coeficientes (saliences) {g m, h m } M 1 : g m cov(x m, ω m ), h m cov(y m, φ m ) (11) es decir, g m mide la importancia de X m en relación a la variable latente para Y m y h m mide la importancia de Y m en relación a la variable latente para X m. Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre / 19

16 Predicción PLS puede verse como un problema de regresión ordinal con predictores (ortogonales) Φ. Es decir, predecimos mediante (los scores de) X. Relación entre los scores φ y ω: Ω = ΦD + O (12) donde D es una matriz diagonal de coeficientes: d mm = ω T mφ m /φ T mφ m. O es la matriz de residuales. Entonces, podemos escribir Y = ΦDQ T + OQ T + F (13) = ΦJ T + F donde J T = DQ T es la matriz de coeficientes de regresión y F = OQ T + F es la matriz de residuales. Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre / 19

17 Predicción Para la regresión, (13) se redefine en términos de los predictores originales X utilizando la siguiente relación (R. Manne, 1987): Φ = XG ( P T G ) 1 donde P es la matriz de loadings de X. Utilizando esta relación y sustituyendo en (13) obtenemos: Y = XB + F (14) donde B = G ( P T G ) 1 Φ T Y (15) Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre / 19

18 Ejemplo: Imágenes funcionales del cerebro Esquema Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre / 19

19 Ejemplo: Imágenes funcionales del cerebro Estudio PET rcbf para comparar decodificación y reconocimiento de rostros: 10 sujetos 10 tareas para realizar face matching y encoding matching. Lo veremos en clase Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre / 19

Santiago, Abril 2009

Santiago, Abril 2009 cvalle@inf.utfsm.cl Departamento de Informática - Universidad Técnica Federico Santa María Santiago, Abril 2009 1 / 51 Temario 1 2 3 4 5 6 7 Métodos que generan entradas alternativas 8 y extensiones 2

Más detalles

Métodos Estadísticos Multivariados

Métodos Estadísticos Multivariados Métodos Estadísticos Multivariados Victor Muñiz ITESM Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre 2011 1 / 20 Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre

Más detalles

Métodos Estadísticos Multivariados

Métodos Estadísticos Multivariados Métodos Estadísticos Multivariados Victor Muñiz ITESM Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre 2011 1 / 34 Álgebra matricial y vectores aleatorios Una matriz es un arreglo

Más detalles

Análisis en Componentes Principales

Análisis en Componentes Principales This is page i Printer: Opaque this Análisis en Componentes Principales Dr. Oldemar Rodríguez Rojas 29 de mayo de 2008 ii This is page iii Printer: Opaque this Contents. Análisis en Componentes Principales

Más detalles

MODELADO CALIBRACIÓN MULTIVARIADA

MODELADO CALIBRACIÓN MULTIVARIADA MODELADO CALIBRACIÓN MULTIVARIADA Calibración multivariada un método multivariado implica que: existe una dependencia múltiple de la variable x (independiente) y múltiples variables y (dependiente) el

Más detalles

Estadística para la Economía y la Gestión IN 3401 Clase 5

Estadística para la Economía y la Gestión IN 3401 Clase 5 Estadística para la Economía y la Gestión IN 3401 Clase 5 Problemas con los Datos 9 de junio de 2010 1 Multicolinealidad Multicolinealidad Exacta y Multicolinealidad Aproximada Detección de Multicolinealidad

Más detalles

Eigenvalores y eigenvectores

Eigenvalores y eigenvectores Eigenvalores y eigenvectores Los dos problemas principales del álgebra lineal son: resolver sistemas lineales de la forma Ax = b y resolver el problema de eigenvalores. En general, una matriz actúa sobre

Más detalles

Tema1. Modelo Lineal General.

Tema1. Modelo Lineal General. Tema1. Modelo Lineal General. 1. Si X = (X 1, X 2, X 3, X 4 ) t tiene distribución normal con vector de medias µ = (2, 1, 1, 3) t y matriz de covarianzas 1 0 1 1 V = 0 2 1 1 1 1 3 0 1 1 0 2 Halla: a) La

Más detalles

Matemáticas para la Empresa

Matemáticas para la Empresa Matemáticas para la Empresa 1 o L. A. D. E. Curso 2008/09 Relación 1. Espacios Vectoriales 1. a) En IR 2 se consideran las operaciones habituales: (x, y) + (x, y ) = (x + x, y + y ) λ(x, y) = (λx, λy)

Más detalles

Multicolinealidad Introducción. Uno de los supuestos básicos del modelo lineal general. y = Xβ + u

Multicolinealidad Introducción. Uno de los supuestos básicos del modelo lineal general. y = Xβ + u CAPíTULO 6 Multicolinealidad 6.1. Introducción Uno de los supuestos básicos del modelo lineal general y = Xβ + u establece que las variables explicativas son linealmente independientes, es decir, la igualdad

Más detalles

MODELADO CALIBRACIÓN MULTIVARIADA

MODELADO CALIBRACIÓN MULTIVARIADA MODELADO CALIBRACIÓN MULTIVARIADA Calibración multivariada aproximaciones multivariadas para crear una curva de calibración: regresión clásica u ordinaria (classical/ordinary least squares, CLS) regresión

Más detalles

Relación 1. Espacios vectoriales

Relación 1. Espacios vectoriales MATEMÁTICAS PARA LA EMPRESA Curso 2007/08 Relación 1. Espacios vectoriales 1. (a) En IR 2 se consideran las operaciones habituales: (x, y) + (x, y ) = (x + x, y + y ) λ(x, y) = (λx, λy) Demuestra que IR

Más detalles

ANÁLISIS DE REGRESIÓN

ANÁLISIS DE REGRESIÓN ANÁLISIS DE REGRESIÓN INTRODUCCIÓN Francis Galtón DEFINICIÓN Análisis de Regresión Es una técnica estadística que se usa para investigar y modelar la relación entre variables. Respuesta Independiente Y

Más detalles

Regresión Lineal Múltiple

Regresión Lineal Múltiple Unidad 4 Regresión Lineal Múltiple Javier Santibáñez (IIMAS, UNAM) Regresión Semestre 2017-2 1 / 35 Introducción La idea de la regresión lineal múltiple es modelar el valor esperado de la variable respuesta

Más detalles

Regresión Lineal Múltiple

Regresión Lineal Múltiple Universidad Nacional Agraria La Molina 2011-2 Efectos de Diagnósticos de Dos predictores X 1 y X 2 son exactamente colineales si existe una relación lineal tal que C 1 X 1 + C 2 X 2 = C 0 para algunas

Más detalles

COMPONENTES PRINCIPALES

COMPONENTES PRINCIPALES COMPONENTES PRINCIPALES Jorge Galbiati R. El método de Componentes Principales tiene por objeto reducir la dimensionalidad de un problema de múltiples variables, aplicando una sucesión de transformaciones

Más detalles

Tema 2 Datos multivariantes

Tema 2 Datos multivariantes Aurea Grané Máster en Estadística Universidade Pedagógica 1 Aurea Grané Máster en Estadística Universidade Pedagógica 2 Tema 2 Datos multivariantes 1 Matrices de datos 2 Datos multivariantes 2 Medias,

Más detalles

Regresión múltiple. Demostraciones. Elisa Mª Molanes López

Regresión múltiple. Demostraciones. Elisa Mª Molanes López Regresión múltiple Demostraciones Elisa Mª Molanes López El modelo de regresión múltiple El modelo que se plantea en regresión múltiple es el siguiente: y i = β 0 + β 1 x 1i + β 2 x 2i +...+ β k x ki +

Más detalles

Estadística III (P33) Exam, Tipo: A

Estadística III (P33) Exam, Tipo: A 21 de Enero de 2000 Responde a las siguientes preguntas sobre papel ordinario, de forma breve y concisa. Al entregar tu exámen, has de entregar también la Tarea 10, que no fue posible finalizar en periodo

Más detalles

EXAMEN DE ESTADÍSTICA II Junio de 2002 SOLUCIÓN (tiempo:100 minutos)

EXAMEN DE ESTADÍSTICA II Junio de 2002 SOLUCIÓN (tiempo:100 minutos) EXAMEN DE ESTADÍSTICA II Junio de 2002 SOLUCIÓN (tiempo:100 minutos) PROBLEMA 1 Se quiere comparar la cantidad de energía necesaria para realizar 3 ejercicios o actividades: andar, correr y montar en bici.

Más detalles

Capítulo 2. Medidas Estadísticas Básicas Medidas estadísticas poblacionales

Capítulo 2. Medidas Estadísticas Básicas Medidas estadísticas poblacionales Capítulo 2 Medidas Estadísticas Básicas 2.1. Medidas estadísticas poblacionales Sea X una variable aleatoria con función de probabilidad p(x) si es discreta, o función de densidad f(x) si es continua.

Más detalles

A = [a 1 a 2 a 3. El sistema Ax = c tiene infinitas soluciones N. Existe un único vector x tal que T (x) = c X. T es suprayectiva

A = [a 1 a 2 a 3. El sistema Ax = c tiene infinitas soluciones N. Existe un único vector x tal que T (x) = c X. T es suprayectiva Asignatura: ÁLGEBRA LINEAL Fecha: 6 de Julio de Fecha publicación notas: 6 de Julio de Fecha revisión examen: de Julio de Duración del examen: horas y media APELLIDOS Y NOMBRE: DNI: Titulación:. ( punto:,

Más detalles

Regresión con errores autocorrelacionados

Regresión con errores autocorrelacionados Series de tiempo Gerardo Ortega Miguel Pluma Luis Osorio Johnatan García 09 de diciembre de 2013 Contenido 1 Introducción Idea intuitiva 2 Algoritmo 3 Propiedades de los estimadores 4 Estadístico de Durbin-Watson

Más detalles

Gustavo Rodríguez Gómez. Agosto Dicembre 2011

Gustavo Rodríguez Gómez. Agosto Dicembre 2011 Computación Científica Gustavo Rodríguez Gómez INAOE Agosto Dicembre 2011 1 / 44 Capítulo III Descomposición de Matrices 2 / 44 1 Descomposición de Matrices Notación Matrices Operaciones con Matrices 2

Más detalles

Estadística II Tema 4. Regresión lineal simple. Curso 2009/10

Estadística II Tema 4. Regresión lineal simple. Curso 2009/10 Estadística II Tema 4. Regresión lineal simple Curso 009/10 Tema 4. Regresión lineal simple Contenidos El objeto del análisis de regresión La especificación de un modelo de regresión lineal simple Estimadores

Más detalles

2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...

2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición... Contenidos 1 Introducción al paquete estadístico S-PLUS 19 1.1 Introducción a S-PLUS............................ 21 1.1.1 Cómo entrar, salir y consultar la ayuda en S-PLUS........ 21 1.2 Conjuntos de datos..............................

Más detalles

Métodos de Subespacios. Una aproximación intuitiva

Métodos de Subespacios. Una aproximación intuitiva IX Congreso de Ingeniería de Organización Gijón, 8 y 9 de septiembre de 2005 Métodos de Subespacios. Una aproximación intuitiva Segismundo S. Izquierdo Millán 1, Javier Pajares Gutiérrez 1, Cesáreo Hernández

Más detalles

Bioestadística. Curso Práctica: La recta de regresión

Bioestadística. Curso Práctica: La recta de regresión Bioestadística. Curso 2012-2013 Carmen M a Cadarso, M a del Carmen Carollo, Xosé Luis Otero, Beatriz Pateiro Índice 1. Introducción 2 2. El diagrama de dispersión 2 3. Covarianza 4 4. Coeciente de correlación

Más detalles

Estadística II Ejercicios Tema 5

Estadística II Ejercicios Tema 5 Estadística II Ejercicios Tema 5 1. Considera los cuatro conjuntos de datos dados en las transparencias del Tema 5 (sección 5.1) (a) Comprueba que los cuatro conjuntos de datos dan lugar a la misma recta

Más detalles

SOBRE INVERSAS GENERALIZADAS Y SU APLICACIÓN EN LA REGRESIÓN 0.- INTRODUCCIÓN. Sobre Matrices Inversas Generalizadas

SOBRE INVERSAS GENERALIZADAS Y SU APLICACIÓN EN LA REGRESIÓN 0.- INTRODUCCIÓN. Sobre Matrices Inversas Generalizadas SOBRE INVERSAS GENERALIZADAS Y SU APLICACIÓN EN LA REGRESIÓN José Carlos de Miguel Domínguez Agustín Ramos Calvo Dpto. de Métodos Cuantitativos para la Economía y la Empresa Fac. de C.C.E.E. Santiago de

Más detalles

Tema 3. El modelo lineal general multivariante

Tema 3. El modelo lineal general multivariante Máster en Técnicas Estadísticas Análisis Multivariante. Año 2008 2009. Profesor: César Sánchez Sellero. Tema 3. El modelo lineal general multivariante 3.1. Presentación del modelo. En este tema vamos a

Más detalles

Estimación MC2E, MVIL en Modelos de Ecuaciones Simultáneas

Estimación MC2E, MVIL en Modelos de Ecuaciones Simultáneas Estimación MC2E, MVIL en Modelos de Ecuaciones Simultáneas Economía Aplicada III (UPV/EHU) OCW 2013 Contents 1 Mínimos Cuadrados en 2 Etapas 2 Mínimos Cuadrados en 2 Etapas El método de Mínimos Cuadrados

Más detalles

David R. González Barreto Universidad de Puerto Rico

David R. González Barreto Universidad de Puerto Rico Diccionario de Términos Multivariados David R. González Barreto Universidad de Puerto Rico Pagina 2 MVDA (Multivariate Data Analysis) Principal Component Analysis (PCA) Hotelling T 2 técnicas gráficas

Más detalles

Espacios Euclídeos. Natalia Boal María Luisa Sein-Echaluce Universidad de Zaragoza

Espacios Euclídeos. Natalia Boal María Luisa Sein-Echaluce Universidad de Zaragoza Espacios Euclídeos Natalia Boal María Luisa Sein-Echaluce Universidad de Zaragoza A lo largo de todo el capítulo consideraremos que V un espacio vectorial real de dimensión finita. 1 Producto escalar Definición.

Más detalles

Modelos de regresión multinivel

Modelos de regresión multinivel Luis Guillermo Díaz Leonardo Trujillo Julio 2011 Estructura de datos multinivel Los investigadores de las ciencias sociales y naturales, se enfrentan al problema de modelar estructuras de datos complejas,

Más detalles

Errores de especificación

Errores de especificación CAPíTULO 5 Errores de especificación Estrictamente hablando, un error de especificación es el incumplimiento de cualquiera de los supuestos básicos del modelo lineal general. En un sentido más laxo, esta

Más detalles

Clase 7 Herramientas de Álgebra Lineal

Clase 7 Herramientas de Álgebra Lineal Clase 7 Herramientas de Álgebra Lineal 1 Formas cuadráticas La descomposición en valores singulares 3 Normas de matrices 4 Ejercicios Dada una matriz M R n n, la función escalar x T Mx, donde x R n, es

Más detalles

Econometría 1. Karoll GOMEZ Segundo semestre 2017

Econometría 1. Karoll GOMEZ   Segundo semestre 2017 Econometría 1 Karoll GOMEZ kgomezp@unal.edu.co http://karollgomez.wordpress.com Segundo semestre 2017 II. El modelo de regresión lineal Esperanza condicional I Ejemplo: La distribución de los salarios

Más detalles

Edgar Acuna/ ESMA 6665 Lecc La SVD y Componentes Principales

Edgar Acuna/ ESMA 6665 Lecc La SVD y Componentes Principales Edgar Acuna/ ESMA 6665 Lecc 7 75 6.2 La SVD y Componentes Principales El objetivo de componentes principales es hacer una reducción de la información disponible. Es decir, la información contenida en p

Más detalles

Análisis en Componentes Principales

Análisis en Componentes Principales This is page i Printer: Opaque this Análisis en Componentes Principales Dr. Oldemar Rodríguez Rojas 24 de mayo de 2009 ii This is page iii Printer: Opaque this Contents. Análisis en Componentes Principales

Más detalles

Econometría 1. Karoll GOMEZ Segundo semestre 2017

Econometría 1. Karoll GOMEZ   Segundo semestre 2017 Econometría 1 Karoll GOMEZ kgomezp@unal.edu.co http://karollgomez.wordpress.com Segundo semestre 2017 II. El modelo de regresión lineal Esperanza condicional I Ejemplo: La distribución de los salarios

Más detalles

EJERCICIO T2 NOMBRE: Correctas Incorrectas En Blanco Puntos

EJERCICIO T2 NOMBRE: Correctas Incorrectas En Blanco Puntos ECONOMETRÍA EJERCICIO T APELLIDOS: NOMBRE: FIRMA: GRUPO: DNI: Pregunta A B C En Blanco Pregunta A B C En Blanco Pregunta 3 A B C En Blanco Pregunta 4 A B C En Blanco Pregunta 5 A B C En Blanco Pregunta

Más detalles

EJERCICIO T1 NOMBRE: Correctas Incorrectas En Blanco Puntos

EJERCICIO T1 NOMBRE: Correctas Incorrectas En Blanco Puntos ECONOMETRÍA EJERCICIO T1 APELLIDOS: NOMBRE: FIRMA: GRUPO: DNI: Pregunta 1 A B C En Blanco Pregunta A B C En Blanco Pregunta 3 A B C En Blanco Pregunta 4 A B C En Blanco Pregunta 5 A B C En Blanco Pregunta

Más detalles

APÉNDICE A. Algebra matricial

APÉNDICE A. Algebra matricial APÉNDICE A Algebra matricial El estudio de la econometría requiere cierta familiaridad con el álgebra matricial. La teoría de matrices simplifica la descripción, desarrollo y aplicación de los métodos

Más detalles

Capítulo 6 Multicolinealidad Luis Quintana Romero. Econometría Aplicada Utilizando R

Capítulo 6 Multicolinealidad Luis Quintana Romero. Econometría Aplicada Utilizando R Capítulo 6 Multicolinealidad Luis Quintana Romero Objetivo Identificar la multicolinealidad en un modelo econométrico, así como las pruebas de detección de la multicolinealidad y correcciones. Introducción

Más detalles

Part I. Descripción estadística de dos variables. Estadística I. Mario Francisco. Variable. bidimensional. Distribuciones de frecuencias

Part I. Descripción estadística de dos variables. Estadística I. Mario Francisco. Variable. bidimensional. Distribuciones de frecuencias Part I Descripción de dos variables Introducción Si para un mismo individuo observamos simultáneamente k obtendremos como resultado una variable k-dimensional. Nos ocuparemos del estudio de las variables

Más detalles

Regresión Lineal. El modelo de regresión caracteriza la relación entre una variable respuesta que depende de k variables independientes o regresoras.

Regresión Lineal. El modelo de regresión caracteriza la relación entre una variable respuesta que depende de k variables independientes o regresoras. Regresión Lineal Los factores envueltos en la experimentación pueden ser de tipo cuantitativos o cualitativos Un factor cuantitativo es aquel que sus niveles pueden ser asociados con puntos dentro de una

Más detalles

MÍNIMOS CUADRADOS GENERALIZADOS

MÍNIMOS CUADRADOS GENERALIZADOS Métodos Estadísticos para Economía y Gestión (IN540-2) Otoño 2008 - Semestre I, Parte II Universidad de Chile Departamento de Ingeniería Industrial Profesor: Mattia Makovec (mmakovec@dii.uchile.cl) Auxiliar:

Más detalles

Contenido. vii. Prólogo... i Presentación... iii Grupo de trabajo...v. 1. Introducción y conceptos preliminares...1

Contenido. vii. Prólogo... i Presentación... iii Grupo de trabajo...v. 1. Introducción y conceptos preliminares...1 Contenido Prólogo... i Presentación... iii Grupo de trabajo...v 1. Introducción y conceptos preliminares...1 2. Tipos de modelos estadísticos lineales...19 Caso 2.1...20 Caso 2.2...26 Caso 2.3...30 3.

Más detalles

Distribuciones multivariadas

Distribuciones multivariadas Distribuciones multivariadas Si X 1,X 2,...,X p son variables aleatorias discretas, definiremos la función de probabilidad conjunta de X como p(x) =p(x 1,x 2,...,x k )=P (X 1 = x 1,X 2 = x 2,...,X p =

Más detalles

Tema 3 Optimización lineal. Algoritmo del simplex

Tema 3 Optimización lineal. Algoritmo del simplex Tema 3 Optimización lineal. Algoritmo del simplex José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Contenidos del tema 3 Teorema fundamental de la programación lineal. Algoritmo

Más detalles

Estimación de una función de gasto en alimentos

Estimación de una función de gasto en alimentos Base de datos http://www.principlesofeconometrics.com/poe4/poe4stata.htm Definición de variables http://www.principlesofeconometrics.com/poe4/data/def/food.def food.def food_exp income Obs: 40 food_exp

Más detalles

Least Squared Methods for System Identification. 1. Modelamiento de datos - Least Squared Estimator

Least Squared Methods for System Identification. 1. Modelamiento de datos - Least Squared Estimator 16/4/2011 UNIVERSIDAD TECNICA FEDERICO SANTA MARIA DEPARTAMENTO DE ELECTRONICA ELO325 SoftComputing y Aplicaciones Least Squared Methods for System Identification Tomás Arredondo Vidal - 1. Modelamiento

Más detalles

ANÁLISIS DE LAS SERIES DE TIEMPO - NIVEL II

ANÁLISIS DE LAS SERIES DE TIEMPO - NIVEL II ANÁLISIS DE LAS SERIES DE TIEMPO - NIVEL II Introducción: Este curso está orientado a formar una base en el análisis de las series temporales que brindará las bases para desenvolverse con gran calidad

Más detalles

Aplicaciones bilineales y formas cuadráticas (Curso )

Aplicaciones bilineales y formas cuadráticas (Curso ) ÁLGEBRA Práctica 8 Aplicaciones bilineales y formas cuadráticas (Curso 2008 2009) 1. Comprobar si las siguientes aplicaciones son o no bilineales y en las que resulten serlo, dar la matriz que las representa

Más detalles

Información sobre Gastos de Consumo Personal y Producto Interno Bruto ( ) en miles de millones de dólares de 1992.

Información sobre Gastos de Consumo Personal y Producto Interno Bruto ( ) en miles de millones de dólares de 1992. Universidad Nacional Autónoma de Nicaragua UNAN-Managua Curso de Análisis y Diseño de Modelos Econométricos Profesor: MSc. Julio Rito Vargas Avilés. Participantes: Docentes /FAREM-Carazo Encuentro No.4

Más detalles

4.5 Algoritmo RLS (Recursive Least Squares)

4.5 Algoritmo RLS (Recursive Least Squares) 4.5 Algoritmo RLS (Recursive Least Squares) Método de mínimos cuadrados (LS) Ecuaciones normales Pseudoinversa Variantes del LS Algoritmo RLS (Recursive Least Squares) Introducción Cálculo recursivo de

Más detalles

Tema 6. Análisis Factorial.

Tema 6. Análisis Factorial. Tema 6 Análisis Factorial El modelo Sea Y = (Y,, Y p ) t un vector aleatorio con vector de medias µ y matriz de covarianzas Σ Supondremos que existe un número entero m < p, una matriz L de orden p m de

Más detalles

Soluciones Hoja Problemas Espacio Vectorial 05-06

Soluciones Hoja Problemas Espacio Vectorial 05-06 Soluciones Hoja Problemas Espacio Vectorial -6.- Se considera R con la suma habitual y con el producto por un escalar que se indica en los casos siguientes. Prueba que en ninguno de ellos, (R,, ) es espacio

Más detalles

Tema 1. Espacios Vectoriales. Sistemas de ecuaciones.

Tema 1. Espacios Vectoriales. Sistemas de ecuaciones. Tema 1. Espacios Vectoriales. Sistemas de ecuaciones. Álgebra Lineal Escuela Politécnica Superior Universidad de Málaga Emilio Muñoz-Velasco (Basado en los apuntes de Jesús Medina e Inmaculada Fortes)

Más detalles

El problema de la endogeneidad Variables proxy Variables instrumentales STATA. Endogeneidad. Gabriel Montes-Rojas

El problema de la endogeneidad Variables proxy Variables instrumentales STATA. Endogeneidad. Gabriel Montes-Rojas Gabriel V. Montes-Rojas El problema de la endogeneidad Una variable es endógena si Cov(x j, error) = 0. Una variable es exógena si Cov(x j, error) = 0. Consideremos el modelo log(wage) = β 0 + β 1 educ

Más detalles

Introducción a la Física Cuántica Espacios de Hilbert y notación de Dirac. Víctor Romero Rochín

Introducción a la Física Cuántica Espacios de Hilbert y notación de Dirac. Víctor Romero Rochín Introducción a la Física Cuántica 25 Espacios de Hilbert y notación de Dirac Víctor Romero Rochín En estas notas revisaremos el concepto de espacios de Hilbert usando la notación de Dirac Dentro de este

Más detalles

ALN - Curso 2007 Gradiente Conjugado

ALN - Curso 2007 Gradiente Conjugado ALN - Curso 27 Gradiente Conjugado Cecilia González Pérez Junio 27 Métodos Iterativos Pueden ser: Métodos estacionarios Métodos no estacionarios Métodos no estacionarios hacen uso de información, evaluada

Más detalles

REORGANIZACIÓN DE LA INFORMACIÓN EN MATRICES

REORGANIZACIÓN DE LA INFORMACIÓN EN MATRICES REORGANIZACIÓN DE LA INFORMACIÓN EN MATRICES 29 de marzo de 2006 1. Matrices de rango uno Una matriz genérica de rango uno se puede escribir en la forma a 1 a 1 b 1... a 1 b m [ ]. b1... b m =.., a n a

Más detalles

Tema 4. Regresión lineal simple

Tema 4. Regresión lineal simple Tema 4. Regresión lineal simple Contenidos El objeto del análisis de regresión La especificación de un modelo de regresión lineal simple Estimadores de mínimos cuadrados: construcción y propiedades Inferencias

Más detalles

Álgebra lineal Prof: Leonid Fridman

Álgebra lineal Prof: Leonid Fridman Álgebra lineal Prof: Leonid Fridman Vectores y subespacios lineales Vector: Un vector en Rn es una n-tupla de números reales Espacio lineal: Un conjunto no vacío L de elementos x, y, z, que satisface las

Más detalles

Selección del número de factores latentes apropiados en PLSR con capacidad predictiva

Selección del número de factores latentes apropiados en PLSR con capacidad predictiva XXVI Simposio Internacional de Estadística 2016 Sincelejo, Sucre, Colombia, 8 al 12 de Agosto de 2016 Selección del número de factores latentes apropiados en PLSR con capacidad predictiva Selecting the

Más detalles

TEMA 4 Modelo de regresión múltiple

TEMA 4 Modelo de regresión múltiple TEMA 4 Modelo de regresión múltiple José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Análisis de Datos - Grado en Biología Estructura de este tema Modelo de regresión múltiple.

Más detalles

El método de la potencia para el cálculo del autovalor dominante de una matriz se basa en el siguiente teorema.

El método de la potencia para el cálculo del autovalor dominante de una matriz se basa en el siguiente teorema. Práctica 8 Cálculo de autovalores 8.1. Método de la potencia El método de la potencia para el cálculo del autovalor dominante de una matriz se basa en el siguiente teorema. Teorema 8.1.1 (M. de la potencia]

Más detalles

TEMA 5: Especificación y Predicción en el MRL

TEMA 5: Especificación y Predicción en el MRL EMA 5: Especificación y Predicción en el MRL Econometría I M. Angeles Carnero Departamento de Fundamentos del Análisis Económico Curso 2011-12 Econometría I (UA) ema 5: Especificación y Predicción Curso

Más detalles

TÉCNICA SUPERIOR DE INGENIERÍA INFORMÁTICA

TÉCNICA SUPERIOR DE INGENIERÍA INFORMÁTICA ESCUELA ESTUDIOS DE TÉCNICA SUPERIOR DE INGENIERÍA INFORMÁTICA DEPARTAMENTO DE INGENIERÍA INFORMÁTICA MATEMÁTICA APLICADA I ÁLGERA LINEAL OLETINES DE PROLEMAS Curso 8-9 Sistemas de ecuaciones lineales.

Más detalles

Concepto de Ajuste de Curvas (Diferencia con Interpolación)

Concepto de Ajuste de Curvas (Diferencia con Interpolación) Ajuste de Curvas Contenido Concepto de Ajuste de Curvas (Diferencia con Interpolación) Estimación de Parámetros Lineales por Mínimos Cuadrados Ajuste Polinomial Estimación de Parámetros No Lineales por

Más detalles

Procesos Gaussianos Multi-Output

Procesos Gaussianos Multi-Output Procesos Gaussianos Multi-Output Gabriel Parra V. Estudiante Magíster DIM gparra@dim.uchile.cl 13 de Octubre de 2016 Overview 1 Procesos Gaussianos Escalares 2 Procesos Gaussianos Multivariados El problema

Más detalles

regresión pls y pca como solución al problema de multicolinealidad en

regresión pls y pca como solución al problema de multicolinealidad en Revista de Matemática: Teoría y Aplicaciones 2011 18(1) : 9 20 cimpa ucr issn: 1409-2433 regresión pls y pca como solución al problema de multicolinealidad en regresión múltiple José Carlos Vega Vilca

Más detalles

Tema 4. Análisis multivariante de la varianza

Tema 4. Análisis multivariante de la varianza Máster en Técnicas Estadísticas Análisis Multivariante Año 2008 2009 Profesor: César Sánchez Sellero Tema 4 Análisis multivariante de la varianza 4 Presentación del modelo Se trata de comparar las medias

Más detalles

ANÁLISIS DE COMPONENTES PRINCIPALES

ANÁLISIS DE COMPONENTES PRINCIPALES ANÁLISIS DE COMPONENTES PRINCIPALES INTRODUCCIÓN El objetivo principal de la mayoría de las técnicas numéricas de análisis multivariado, es reducir la dimensión de nuestros datos. Por supuesto, si esta

Más detalles

OCW-V.Muto El problema de mínimos cuadrados. Cap. XIX CAPITULO XIX. EL PROBLEMA DE LOS MINIMOS CUADRADOS: PRELIMINARES

OCW-V.Muto El problema de mínimos cuadrados. Cap. XIX CAPITULO XIX. EL PROBLEMA DE LOS MINIMOS CUADRADOS: PRELIMINARES CAPITULO XIX. EL PROBLEMA DE LOS MINIMOS CUADRADOS: PRELIMINARES. SISTEMAS LINEALES DE ECUACIONES SOBREDETERMINADOS La discusión de los problemas algebráicos de la parte anterior se había centrado exclusivamente

Más detalles

peso edad grasas Regresión lineal simple Los datos

peso edad grasas Regresión lineal simple Los datos Regresión lineal simple Los datos Los datos del fichero EdadPesoGrasas.txt corresponden a tres variables medidas en 25 individuos: edad, peso y cantidad de grasas en sangre. Para leer el fichero de datos

Más detalles

Repaso de álgebra de matrices y probabilidad. Javier Santibáñez (IIMAS, UNAM) Regresión Semestre / 58

Repaso de álgebra de matrices y probabilidad. Javier Santibáñez (IIMAS, UNAM) Regresión Semestre / 58 Repaso de álgebra de matrices y probabilidad Javier Santibáñez (IIMAS, UNAM) Regresión Semestre 2017-2 1 / 58 Preliminares Definición (matriz) Una matriz de dimensión m n es un arreglo rectangular de números

Más detalles

ÁLGEBRA Algunas soluciones a la Práctica 8

ÁLGEBRA Algunas soluciones a la Práctica 8 ÁLGEBRA Algunas soluciones a la Práctica 8 Aplicaciones bilineales y formas cuadráticas (Curso 24 25 1. Comprobar si las siguientes aplicaciones son o no bilineales y en las que resulten serlo, dar la

Más detalles

Tema 1. Espacios Vectoriales. Sistemas de ecuaciones.

Tema 1. Espacios Vectoriales. Sistemas de ecuaciones. Tema 1. Espacios Vectoriales. Sistemas de ecuaciones. Álgebra Lineal Escuela Politécnica Superior Universidad de Málaga Emilio Muñoz-Velasco (Basado en los apuntes de Jesús Medina e Inmaculada Fortes)

Más detalles

CLASIFICACIÓN AFÍN DE CÓNICAS

CLASIFICACIÓN AFÍN DE CÓNICAS Álgebra lineal y Geometría I Gloria Serrano Sotelo Departamento de MATEMÁTICAS CLASIFICACIÓN AFÍN DE CÓNICAS Sea E un R-espacio vectorial de dimensión. Sean E = e 1, e un plano vectorial de E y e 0 un

Más detalles

Muestreo en Poblaciones Finitas

Muestreo en Poblaciones Finitas Información Adicional. Estimadores de Razón y Regresión 1/25 Muestreo en Poblaciones Finitas Información Adicional. Estimadores de Razón y Regresión José A. Mayor Gallego Departamento de Estadística e

Más detalles

Benemérita Universidad Autónoma de Puebla

Benemérita Universidad Autónoma de Puebla Benemérita Universidad Autónoma de Puebla FACULTAD DE CIENCIAS FÍSICO MATEMÁTICAS LICENCIATURA EN MATEMÁTICAS ESTIMACIÓN DE PARÁMETROS Y OPERADORES TESIS QUE PARA OBTENER EL TÍTULO DE LICENCIADO EN MATEMÁTICAS

Más detalles

Un modelo para representar una relación aproximadamente

Un modelo para representar una relación aproximadamente Regresión Se han visto algunos ejemplos donde parece que haya una relación aproximadamente lineal entre dos variables. Supongamos que queremos estimar la relación entre las dos variables. Cómo ajustamos

Más detalles

ANÁLISIS DE COMPONENTES PRINCIPALES

ANÁLISIS DE COMPONENTES PRINCIPALES ANÁLISIS DE COMPONENTES PRINCIPALES INTRODUCCIÓN El objetivo principal de la mayoría de las técnicas numéricas de análisis multivariado, es reducir la dimensión de nuestros datos. Por supuesto, si esta

Más detalles

Álgebra Lineal - Grado de Estadística. Examen final 27 de junio de 2014 APELLIDOS, NOMBRE:

Álgebra Lineal - Grado de Estadística. Examen final 27 de junio de 2014 APELLIDOS, NOMBRE: Álgebra Lineal - Grado de Estadística Examen final 7 de junio de 4 APELLIDOS, NOMBRE: DNI: irma Primer parcial Ejercicio Consideremos matrices A m m, B, C n n, Pruebe que bajo la hipótesis de que las inversas

Más detalles

Soluciones Examen Final de Econometría Universidad Carlos III de Madrid 26 de Mayo de 2015

Soluciones Examen Final de Econometría Universidad Carlos III de Madrid 26 de Mayo de 2015 Soluciones Examen Final de Econometría Universidad Carlos III de Madrid 26 de Mayo de 2015 Conteste todas las preguntas en dos horas y media. Pregunta 1 (33 puntos: Un investigador está considerando las

Más detalles

Guía. Álgebra III. Examen parcial III. Forma canónica de Jordan. Producto interno.

Guía. Álgebra III. Examen parcial III. Forma canónica de Jordan. Producto interno. Guía. Álgebra III. Examen parcial III. Forma canónica de Jordan. Producto interno. Teoremas con demostraciones que se pueden incluir en el examen: 1. Fórmula para f(j m (λ)), donde J m (λ) es el bloque

Más detalles

Estadística II. Laura M. Castro Souto

Estadística II. Laura M. Castro Souto Estadística II Laura M. Castro Souto Segundo Cuatrimestre Curso 2000/2001 Modelos de Regresión Diferencias con el Diseño de Experimentos Los modelos de regresión estudian relaciones numéricas entre variables

Más detalles

Mínimos Cuadrados Generalizados

Mínimos Cuadrados Generalizados Mínimos Cuadrados Generalizados Román Salmerón Gómez Los dos últimos temas de la asignatura han estado enfocados en estudiar por separado la relajación de las hipótesis de que las perturbaciones estén

Más detalles

Relación 3 de problemas

Relación 3 de problemas ESTADÍSTICA II Curso 2016/2017 Grado en Matemáticas Relación 3 de problemas 1. La Comunidad de Madrid evalúa anualmente a los alumnos de sexto de primaria de todos los colegios sobre varias materias. Con

Más detalles

Ajuste por mínimos cuadrados

Ajuste por mínimos cuadrados Mathieu Departamento de Matemática Aplicada y Estadística Universidad Politécnica de Cartagena Cartagena, Enero 2010 Guión 1 Planteamiento 2 Criterio de mínimos cuadrados 3 Casos concretos: regresión lineal

Más detalles

GEOESTADÍSTICA APLICADA

GEOESTADÍSTICA APLICADA UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO GEOESTADÍSTICA APLICADA Tema: Análisis Exploratorio de Datos Instructores: Dr. Martín A. Díaz Viera (mdiazv@imp.mx) Dr. Ricardo Casar González (rcasar@imp.mx) 2009

Más detalles

El problema de Maxwell Una formulación contemporánea

El problema de Maxwell Una formulación contemporánea El problema de Maxwell Una formulación contemporánea Mariano Vázquez de septiembre de 22 Índice. El problema estructural.. Direcciones principales de acción y reacción............ 3 2. El problema de Maxwell

Más detalles

Linear Regression and the Least-squares problem

Linear Regression and the Least-squares problem Linear Regression and the Least-squares problem Aniel Nieves-González Abril 2013 Aniel Nieves-González () Linear Regression and the LSP Abril 2013 1 / 25 Variables cuantitativas y relaciones entre estas

Más detalles

Estadística III Repaso de Algebra Lineal

Estadística III Repaso de Algebra Lineal Repaso de Algebra Lineal Vectores Un vector columna de dimensión n 1 es una serie de números dispuestos como sigue: x 1 x 2 x =. x n Un vector fila de dimensión 1 p es una serie de números dispuestos como

Más detalles

Álgebra Lineal - Grado de Estadística. Examen final 26 de junio de 2013 APELLIDOS, NOMBRE:

Álgebra Lineal - Grado de Estadística. Examen final 26 de junio de 2013 APELLIDOS, NOMBRE: Álgebra Lineal - Grado de Estadística Examen final de junio de APELLIDOS, NOMBRE: DNI: Firma Primer parcial Ejercicio ( Sea A una matriz simétrica definida positiva de orden n y v R n Pruebe que la matriz

Más detalles

Linear Regression and the Least-squares problem

Linear Regression and the Least-squares problem Linear Regression and the Least-squares problem Aniel Nieves-González Aniel Nieves-González () Linear Regression and the LSP 1 / 25 Variables cuantitativas y relaciones entre estas (Repaso) Recuerde que

Más detalles