Mínimos Cuadrados Generalizados

Mínimos Cuadrados Generalizados Román Salmerón Gómez Los dos últimos temas de la asignatura han estado enfocados en estudiar por separado la relajación de las hipótesis de que las perturbaciones estén incorrelacionadas y tengan varianza constante. Aunque ambos problemas no suelen suceder conjuntamente en este documento se analiza el caso más general presentando el estimador por Mínimos Cuadrados Generalizados MCG como corrector de dichos problemas de forma simultánea. Los problemas que surgen en esta situación derivan del hecho de que la matriz de varianzas y covarianzas de las perturbaciones no es un escalar por la matriz identidad es decir la varianza puede no ser constante y las covarianzas ser distintas de cero. Se examinan también las consecuencias que ésto tiene sobre las propiedades de los estimadores MCO de los coeficientes del modelo y sobre el estimador de la varianza de las perturbaciones. También se evaluan las implicaciones que esta nueva situación tiene sobre la utilización de las expresiones habituales para realizar los contrastes de hipótesis que se han considerado hasta ahora. Este punto es muy importante para que el alumno entienda que los resultados que se obtienen al estimar por MCO están siempre condicionados al cumplimiento de las hipótesis del modelo.. Hipótesis del Modelo. Matriz de varianzas y covarianzas no escalar El modelo lineal uniecuacional múltiple con n observaciones y k regresores responde a siguiente expresión matricial y n X n k β k + u n donde E[u] 0 n y u E[u u t ] σ 2 I n n esto es la matriz de varianzas-covarianzas de la perturbación aleatoria es escalar o equivalentemente las perturbaciones son esféricas. Las condiciones anteriores sobre la perturbación aleatoria implican que la misma está centrada E[u t ] 0 t es homocedástica E[u 2 t ] σ 2 t e incorrelada E[u i u j ] 0 i j. Luego para un análisis correcto del modelo además de la estimación y validación del mismo se deben de comprobar como ciertas dichas hipótesis. Ahora bien y si dichas hipótesis no se verifican? En tal caso el estimador por mínimos cuadrados ordinarios deja de ser óptimo en el sentido de mínima varianza y existe un estimador alternativo superior. Planteamos el problema de analizar el modelo bajo las hipótesis E[u] 0 n y E[uu t ] Σ n n donde σ 2 σ 2... σ n σ 2 σ2 2... σ 2n Σ....... σ n σ n2... σn 2 Adviértase que la matriz anterior implica que E[u 2 t ] σ 2 t σ 2 t heteroscedasticidad y que E[u i u j ] σ ij 0 i j autocorrelación. Además por cuestiones de notación se suele considerar que Σ σ 2 Ω y hablaremos de un modelo con matriz de varianzas-covarianzas no escalar o con perturbaciones no esféricas.

2. Propiedades del estimador MCO con perturbaciones no esféricas Puesto que en el método de estimación por mínimos cuadrados ordinarios no influye la matriz de varianzascovarianzas de la perturbación aleatoria es claro que el estimador por mínimos cuadrados ordinarios del modelo con perturbaciones no esféricas será: β MCO X t X X t y. 2 Dicho estimador sigue siendo lineal e insesgado ya que las condiciones que conducen a verificar dichas propiedades en el modelo con perturbaciones esféricas no se han modificado las demostraciones son idénticas a tal caso. Sin embargo ya no se tiene asegurado que la varianza sea mínima ya que en este caso se obtiene la siguiente expresión: βmco X t X X t E[u u t ]X X t X σ 2 X t X X t ΩX X t X distinta a la del modelo con perturbaciones esféricas: σ 2 X t X. 3. Estimación por Mínimos Cuadrados Generalizados. Propiedades En el apartado anterior hemos comprobado que en un modelo con perturbaciones no esféricas el estimador por mínimos cuadrados ordinarios es lineal e insesgado pero no tenemos asegurado que sea óptimo en el sentido de varianza mínima. Para resolver este problema surgen los mínimos cuadrados generalizados. Dicho método consiste en transformar un modelo con perturbaciones no esféricas en otro con perturbaciones esféricas de forma que al aplicarle a este último el método de mínimos cuadrados ordinarios se obtenga un estimador lineal insesgado y óptimo. En dicha transformación es fundamental el teorema de Aitken el cual afirma que al ser Ω una matriz simétrica definida positiva entonces existe una matriz regular T tal que T t T Ω en tal caso se verifica que Ω T T t de donde se deduce que T ΩT t I n n. Partiendo del modelo con perturbaciones no esféricas y premultiplicando el mismo por una matriz no estocástica P se obtiene: P y P Xβ + P u y X β + u donde y P y X P X y u P u. Si se estudian las propiedades de la perturbación aleatoria del modelo transformado obtendremos que: E[u ] E[P u] P E[u] 0 n E[u u t ] E[P uu t P t ] P E[uu t ]P t σ 2 P ΩP t. De la expresiones anteriores se deduce que si P ΩP t I n n entonces el modelo transformado es un modelo con perturbaciones esféricas. Adviértase que en la transformación realizada no se han modificado las cantidades constantes del modelo que se desean estimar. Existe P tal que P ΩP t I n n? En efecto usando el teorema de Aitken sin más que elegir P T tenemos asegurado que se verifica tal hecho. Por tanto el modelo transformado es un modelo lineal múltiple con perturbaciones esféricas por lo que al aplicarle mínimos cuadrados ordinarios se obtiene un estimador lineal insesgado y óptimo: β MCO X t X X t y. 2

Dicha estimación recibe el nombre de estimador por Mínimos Cuadrados Generalizados MCG. Sin más que deshacer el cambio: β MCG X t P t P X X t P t P y βmcg X t Ω X X t Ω y 3 σ 2 X t X σ 2 X t P t P X σ 2 X t Ω X donde la matriz de varianzas-covarianzas es mínima. Los estimadores obtenidos hasta el momento se pueden resumir en la siguiente tabla: Modelo con perturbaciones esféricas β MCO X t X X t y lineal insesgado y óptimo βmco σ 2 X t X Modelo con perturbaciones no esféricas β MCO X t X X t y lineal e insesgado no óptimo βmco σ 2 X t X X t ΩX X t X β MCG X t Ω X X t Ω y lineal insesgado y óptimo βmcg σ 2 X t Ω X 3.. Estimador de la varianza de la perturbación aleatoria En la estimación de un modelo se tiene como objetivo las cantidades constantes del mismo por lo que faltaría estimar la varianza de la perturbación aleatoria. A partir del modelo transformado es evidente que un estimador insesgado de la varianza de la perturbación aleatoria es: σ 2 MCO et e n k donde e y ŷ y X βmcg P y P X β MCG P y X β MCG P e. En tal caso e t e e t P t P e e t Ω e por lo que: donde e y X β MCG. σ 2 MCG et Ω e n k 4. Estimación por intervalo y contraste de hipótesis Partiendo del modelo transformado la estimación por intervalo y los contrastes de hipótesis se realizan igual que en el modelo lineal múltiple con perturbaciones esféricas sin más que deshacer el cambio anteriormente planteado. En tal caso obtendremos las siguientes expresiones: β MCG N β σ 2 X t Ω X 3

n k σ MCG 2 σ 2 χ 2 n k ] [ t R R β MCG r X t Ω X R t σ 2 MCG a partir de las cuales se puede realizar inferencia en el modelo. R β MCG r F qn k 5. Los estimadores minimo cuadráticos generalizados factibles Como se pone de manifiesto en las expresiones anteriores para el cálculo de β MCG se requiere conocer la matriz Ω. Como en la práctica dicha matriz es desconocida habrá que estimarla obteniéndose así el estimador por mínimos cuadrados generalizados factibles MCGF: β MCGF X t Ω X X t Ω y donde Ω es una estimación de Ω. En los temas dedicados a heteroscedasticidad y autocorrelación se han estudiado las formas más comunes de la matriz Ω en cada caso y por tanto cómo estimarla. 6. Reflexión Al comparar las expresiones 2 y 3 junto a sus correspondientes matrices de varianzas-covarianzas observamos que coinciden cuando Ω I n n.... En consecuencia no hay ninguna razón por la que deba imponerse como matriz de covarianzas del estimador MCO una expresión restringida como es σ 2 X t X sino que más bien bedería utilizarse σ 2 X t X X t ΩX X t X y permitir así que en las circunstancias apropiadas cuando no hay heteroscedasticidad ni autocorrelación dicha matriz se reduzca numéricamente a σ 2 X t X. Por tanto la expresión σ 2 X t X X t ΩX X t X es realmente la matriz de covarianzas del estimador MCO. Como ya hemos mencionado no se trata de discutir si en un modelo de regresión existe heteroscedasticidad y/o autocorrelación sino que más bien dando como un hecho el que ambos problemas están siempre presentes en todo trabajo econométrico entonces la cuestión reside en analizar en qué medida aparecen en cada aplicacion empírica... Novales 988. Econometría página 64. 7. Ejemplos. Dado el modelo Y t β 0 + β X t con las observaciones Y t X t 3 5 Se sabe que la matriz de varianzas-covarianzas de las perturbaciones es σ 2 Ω donde Ω es igual a: 0 6 0 2 Ω 0 6 0 8 0 6 0 2 0 6 0 9 4

a Son estocásticamente independientes u u 2 y u 3? b Estimase β y σ 2 por MCO así como la matriz de varianzas covarianzas del estimador MCO. c Estimase β y σ 2 por MCG así como la matriz de varianzas covarianzas del estimador MCG. Una vez más la matriz Ω indica que hay heteroscedasticidad elementos de la diagonal principal no constante y autocorrelación elementos de fuera de la diagonal principal no nulos luego la perturbación aleatoria para distintos instantes de tiempo no puede ser independiente. En este caso las estimaciones obtenidas por MCO no serán óptimas al contrario que las obtenidas por MCG. A continuación con el objeto de comparar dichas estimaciones calcularemos las estimaciones de β σ 2 y β por ambos métodos. En el caso de los MCO se obtiene: β MCO donde se ha tenido en cuenta que: Mientras que en el de los MCG: β MCO X t X X t 3 9 y 9 83 0 375 0 375 0 25 σ MCO 2 et e n k 37 5 3 2 37 5 90 340 σ MCO 2 X t X 37 5 83 0 375 0 375 0 25 e y ŷ y X β MCO 2 5 30 47 5 90 340 3 75 8 75 54 6875 4 0625 4 0625 4 6875 3 5 2 5 5 2 5 β MCG X t Ω X X t Ω y 7568 5 5405 5 5405 28 2432 4929 0 2929 48 0 2929 0 6486 0929 24 899 β MCG σ MCG 2 et Ω e n k 32 4286 3 2 σ 2 MCG X t Ω X 32 4286 donde se ha tenido en cuenta que: 32 4286 4929 0 2929 0 2929 0 0929 e y ŷ y X β MCG 3 5 3 75 8 75. 48 6486 24 899 7857 8 243 468 75 20 57 20 57 40 786 7857 8 243 5

y 0000 26 4286 0 0000 8 574 42 857 2 429 Ω 2 4324 2 8378 4 2 8378 5 88 3 2432 4 3 2432 2 973. En ambos casos se ha usado que X 3 5 Por tanto la estimación por MCO será: mientras que por MCG: y n 3 k 2. Ŷ t 3 75 + 8 75 X t σ 2 37 5. 7 4 2 6 Ŷ t 7857 + 8 243 X t σ 2 32 4286. 2 65 6 34 2. En un modelo lineal dado por la expresión Y t β 0 + β X t + u t del que se dispone de los siguientes datos: X Y 2 5-4 - 7 8 Además se verifica que E[u] 0 y E[uu t ] σ 2 Ω siendo 3 Ω 5 3 Se pide: a Comente qué supuestos básicos del modelo lineal general no se verifica que en este caso. b Estime el modelo anterior usando el modelo que considere oportuno. Puesto que los elementos de la diagonal principal de Ω no son constantes y los restantes no nulos es claro que la perturbación aleatoria del modelo presentará los problemas de heteroscedasticidad y autocorrelación. Por tanto habrá que aplicar el método de los mínimos cuadrados generalizados para resolver dichos problemas: β X t Ω X X t Ω y 0000 6667 6667 7 0556 946 0 67 4 2 0 67 0 07 7 74 5 0 7588 4 7 5 6

donde se ha usado que 2 X 4 y 7 5 8 Ω 0 3889 0 0556 0 0 0556 0 2222 0 0556 0 0 0556 0 3889. Luego la estimación por MCG será Ŷt 2 74 + 0 7588 X t. 7