UNIVERSIDAD AUTÓNOMA CHAPINGO DIVISIÓN DE CIENCIAS FORESTALES

Tamaño: px
Comenzar la demostración a partir de la página:

Download "UNIVERSIDAD AUTÓNOMA CHAPINGO DIVISIÓN DE CIENCIAS FORESTALES"

Transcripción

1 UNIVERSIDAD AUTÓNOMA CHAPINGO DIVISIÓN DE CIENCIAS FORESTALES EL PROGRAMA ESTADÍSTICO R Y UNA APLICACIÓN EN ECONOMETRÍA y TESIS PROFESIONAL Como requsto parcal para obtener el título de: LICENCIADO EN ESTADÍSTICA Presenta: JESÚS GERMÁN GALDÁMEZ OVANDO Chapngo, Texcoco, Estado de Méxco. Abrl de 2013 PRESENTA:

2 La Presente tess profesonal ttulada El programa estadístco R y una aplcacón en econometría, fue realzada por Jesús Germán Galdámez Ovando, bajo la dreccón del Dr. José Artemo Cadena Meneses, ha sdo revsada y aprobada por el Honorable Jurado Examnador sendo aceptada como requsto parcal para obtener el título de: LICENCIADO EN ESTADÍSTICA

3 DEDICATORIA A ms padres Lorenzo y Josefa por su valoso apoyo ncondconal que me han brndado a lo largo de m vda, por darme mpulso para conclur ms estudos profesonales. A la memora de ms abuelos: Julo Galdámez ( ) y Reyna Pérez ( ), grandes personas que me alentaron y me enseñaron a ser un hombre de buenos prncpos, a nunca desstr ante los problemas. A ms hermanos y hermanas: José Martn, Edlberto, Anta, Marsol y Paty por el carño y apoyo que sempre me han brndado, porque juntos segumos forjado una famla unda. A una gran persona que por largos 6 años me ha acompañado en momentos de trunfos y de fracasos, por el ánmo que me trasmte para que este trabajo sea posble, a esa mujer que apreco por su carsma, Edth.

4 AGRADECIMIENTOS A la Unversdad Autónoma Chapngo (UACH), por haberme brndado el apoyo por 7 años y conclur ms estudos A la Dvsón de Cencas Forestales en el Departamento de Estadístca, Matemátca y Computo por darme la oportundad de conclur la Carrera de Lcencado en Estadístca. A los profesores de la Dvsón de Cencas Forestales que gracas a su formacón y empeño me enseñaron grandes valores y étca profesonal. Al jurado examnador: Dr. José Artemo Cadena Meneses Dr. Gerardo Terrazas González LIC. Margarto Sorano Montero M. C. Alejandro Corona Ambrz M.C. Ángel Leyva Ovalle Por las observacones hechas para conclur esta Tess Profesonal. A m famla que sempre me ha brndado su apoyo en cada momento de m vda. A ms amgos y compañeros de Lcencatura, que junto hemos compartmos grandes momentos.

5 ÍNDICE GENERAL ÍNDICES DE CUADROS... v ÍNDICES DE FIGURAS... v RESUMEN... v SUMMARY... v I. INTRODUCCIÓN OBJETIVOS Objetvos generales Objetvos partculares... 2 II. ANÁLISIS DE REGRESIÓN LINEAL Modelos Econométrcos Funcón de Produccón (Martínez, 1974) Funcón de consumo Funcón de demanda Modelos de produccón para el análss Econométrco Modelos de Regresón Termno Lneal Funcón de regresón Lneal Lneal Logarítmca Exponencal (Cantatore, 1980) Funcón de regresón lneal Naturaleza del Análss de Regresón Notacón matemátca Estmacón de los parámetros por el método matrcal Estmacón de los coefcentes de Regresón por el Método de Mínmos Cuadrados

6 Estmadores de Mínmos cuadrados Propedades de los Estmadores de Mínmo Cuadrados Supuestos del Método del Mínmos Cuadrados Propedad de varanza mínma de los Estmadores de Mínmos Cuadrados Coefcente de determnacón r Meddas de Dependenca Lneal El problema de Estmacón Análss de los Resduales Perturbacón estocástca o error Supuestos de normaldad de Mínmos Cuadrados Supuesto de Normaldad: Modelo Clásco de regresón Lneal Normal Multcolnealdad Factor de nflacón de varanza Análss de multcolnealdad con egenvalores Autocorrelacón Heteroscedastcdad Prueba de Breusch- Pagan Prueba de Heteroscedastcdad de Whte III. ANÁLISIS DE SERIE DE TIEMPO Introduccón Característcas de las seres de tempo Procesos estocástcos Funcón de Autocovaranza y Autocorrelacones Estmacón de la meda, autocovaranza y las autocorrelacones... 46

7 Operador retardo y dferencacón de una sere Procesos de Rudo Blanco Camnata aleatora Ejemplos de Seres de Tempo IV. Modelos cláscos de seres de tempo Modelos autoregresvos AR(p) Modelos de promedos móvles Modelos mxtos (ARMA) Predccón de procesos estaconaros Estmacón Estmacón Prelmnar Máxma Verosmltud Proceso no Estaconaro: ARIMA Análss de resduales de los modelos: Bondad de ajuste Modelos SARIMA IV. METODOLOGÍAS PARA UN ANÁLISIS ECONOMÉTRICO V. RESULTADOS Y DISCUSIÓN VI. CONCLUSIONES Objetvos generales Objetvos partculares VII. RECOMENDACIONES VIII. BIBLIOGRAFÍA IX. ANEXOS

8 ÍNDICES DE CUADROS Cuadro 2. 1 Estmacón de la tasa promedo de produccón a través del tempo Cuadro 3. 1 Valores de la funcón de autocorrelacón para h= Cuadro 3. 2 Resumen teórca de ACF y PACF de un proceso estaconaro Cuadro 3. 3 Parámetros estmados con el algortmo de Yule-Walker Cuadro 3. 4 Valores de la covaranza de la sere dferencada LakeHuron para h= Cuadro 3. 5 Valores de la covaranza de la sere dferencada Dow Jones para h= Cuadro 3. 6 El mejor modelo ARMA(1,1) para los datos de la tasa de desempleo con la funcón auto.arma() Cuadro 3. 7 Parámetros estmados con el modelo ARIMA(1,1,0) de los datos "LakeHuron" Cuadro 4. 1 Matrz de correlacón smple Cuadro 4. 2 Estmacón de los parámetros del modelo Cuadro 4. 3 Estmacón de los parámetros del modelo Cuadro 4. 4 Estmacón de los parámetros del modelo Cuadro 4. 5 Estmacón de los parámetros del modelo Cuadro 4. 6 Matrz de correlacón de las varables de estudos Cuadro 4. 7 Matrz de correlacón parcal nversa Cuadro 4. 8 Coefcentes de Regresón múltple Cuadro 4. 9 Estmacón de los parámetros del modelo Cuadro Análss de Varanza (ANOVA) para el modelo de produccón Cuadro Prueba de Normaldad con el estadístco Shapro-Wlks Cuadro Matrz de correlacón y Factor de Inflacón de la Varanza Cuadro Cálculo de los índces de condcón Cuadro Análss de multcolnealdad a partr de egen valor y egen vector Cuadro Prueba de Autocorrelacón con el estadístco de Durbn-watson Cuadro Prueba de homoscedastcdad con el estadístco Breusch-Pagan Cuadro Correccón de Heteroscedastcdad medante método de Error Estándar Robusto de Whte, EVews Cuadro El mejor modelo para los datos Lake Huron con el valor mínmo del AIC Cuadro Prueba de Normaldad y de Autocorrelacón de los resduales Cuadro Estadístcos para evaluar la capacdad predctva de un proceso ARIMA(p,d,q) Cuadro Valores de las autocorrelacones para los datos dferencados a dstanca Cuadro Análss de raíz untara medante el método de Dckey-Fuller y Phllps-Perron v

9 Cuadro Identfcacón del orden del modelo medante la Funcón de Autocorrelacón Extendda Cuadro Resultado del ajuste automátco con la funcón auto.arma() Cuadro Evaluacón de los modelos ARIMA (0,1,1) de acuerdo al Error Cuadrado Medo Cuadro Pronóstco de la produccón de maíz en Méxco a partr del 2010 a Cuadro Prueba de normaldad y autocorrelacón a los resduos delo modelo ARIMA(0,1,1) Cuadro Valores de las Aautocorrelacones muestral y Parcal Cuadro Resultados de modelos SARIMA obtendo a partr de ensayados Cuadro Resultado obtendo a partr de un modelo Cuadro Pronóstcos e ntervalos para el consumo de electrcdad en logatrmo abr/2012- dc/ ÍNDICES DE FIGURAS Fgura 2. 1 Gráfco de funcones exponencal... 8 Fgura 2. 2 Estmacón de la Produccón de maíz (PMG) con el método de MCO con las varables CA y PT Fgura 2. 3 Estmacón de la Produccón de maíz (PMG) con el método de MCO con las varables REN, IMP Fgura 2. 4 Produccón promedo anual de maíz en grano Fgura 2. 5 Análss de Regresón con el método de MCO Fgura 2. 6 Gráfco de los resduos por el método de Mínmos Cuadrados Ordnaros Fgura 2. 7 Prueba de Normaldad para los resduos de los modelos 1 y Fgura 2. 8 Prueba de Normaldad para los resduos de los modelos 3, 4 y Fgura 3. 1 Funcón de autocorrelacón muestral de los datos de Vscosdad Fgura 3. 2 Prmera dferencacón de los datos ma22.s Fgura 3. 3 Segunda dferencacón a los datos ma22.s Fgura 3. 4 Transformacón de los datos DEATHS medante el logartmo Fgura 3. 5 Dferencacón a dstanca 12 a los datos log(deaths) para elmnar el componente estaconal Fgura 3. 6 Dferencacón a dstanca 1 a los datos para elmnar el componente de tendenca Fgura 3. 7 Smulacón de una Camnata Aleatora y con la línea de tendenca sobre el tempo Fgura 3. 8 Sere de tempo sobre la lluva anual, Ángeles Calforna Fgura 3. 9 Seres de tempo de la venta de automóvles en Méxco mensual Fgura Sere de tempo sobre el nvel del lago Huron Fgura Sere de tempo sobre la produccón de maíz en Méxco ( ) v

10 Fgura Sere de datos con comportamento cíclco del consumo doméstco de electrcdad.. 59 Fgura Funcón de Autocorrelacón de un proceso con una Fgura Funcón de Auto-Correlacón de un proceso con una Fgura Regón de estaconaredad del modelo AR(2) Fgura Funcón de Autocorrelacón para dferentes valores de Fgura Funcón de Autocorrelacón Parcal para dferentes valores de Ph Fgura Funcón de autocorrelacón de un proceso MA(1) para dferentes valores de Fgura Funcón de autocorrelacón Parcal de un proceso MA(1) para dstntos valores de Fgura Funcón de autocorrelacón de un proceso MA(2) para dstntos valores de y. 78 Fgura Datos de la Tasa de desempleo a partr de 1909 a Fgura Funcón de Autocorrelacón y Autocorrelacón Parcal para datos de tasa de de desempleo Fgura Funcón de autocorrelacón Muestral y Parcal para los datos "LakeHuron" Fgura Prmera dferencacón de los datos "LakeHuron" Fgura Funcón de autocorrelacón a los datos dferencados Fgura Prmera dferencacón a los datos del Lago Huron Fgura Datos de produccón de maíz en Méxco dferencado a dstanca uno para un modelo ARIMA(0,1,1) Fgura Dagnostco del modelo medante gráfcos de los resduales Fgura 4. 1 Comparacón de los valores reales con los valores ajustados por el método de MCO 126 Fgura 4. 2 Prueba de normaldad medante hstogramas y Q-Q Plot Fgura 4. 3 Modelo ajustado con la correccón de heteroscedastcdad con la prueba de Whte Fgura 4. 4 Análss de los resduos del modelo ARIMA medante gráfcos Fgura 4. 5 Análss de estaconaredad de los datos a través de las ACF Fgura 4. 6 Comportamento estaconaro de los datos de produccón de maíz Fgura 4. 7 Pronóstco de la produccón de maíz en Méxco ( ) Fgura 4. 8 Prueba de Normaldad para los resduos del modelo ARIMA(0,1,1) medante gráfcos Fgura 4. 9 Sere transformada medante logartmo para homogenzar la varanza de los cclos Fgura Sere dferencada a dstanca 12 para elmnar el componente de estaconaldad, Fgura Sere dferencada a dstanca 12 y 1 para elmnar el componente de estaconaldad y de tendenca Fgura Correlograma de las ACF y PACF para la sere dferencada Fgura Prueba de autocorrelacón de los resduales medante los correlogramas Fgura Gráfco del modelo ajustado y pronóstco para abr/2012-dc/ v

11 RESUMEN En este trabajo de nvestgacón bblográfca se presentan los temas para un análss de econométrco, en donde se enuncan los prncpos de un análss de regresón lneal y seres de tempo unvarado. En el prmer apartado se realza un Análss Exploratoro de Datos (AED), que es un conjunto de técncas estadístcas para conocer las varables que mejor puedan estmar la varable de nterés, en este caso el mejor modelo que se ajuste a los datos de produccón de maíz en Méxco. Estas técncas (lnealdad, normaldad, multcolnealdad, homoscedastcdad) están basadas en los supuestos de Mínmos Cuadrados Ordnaros (MCO). El análss de las varables económcas comenza con la especfcacón del modelo en forma matemátca, estmar los parámetros del modelo y fnalmente realzar pruebas del modelo; en un ntento de juzgar s consttuye una descrpcón sufcente real de la economía sometda a estudo o s hay que estmar especfcacones dferentes (Johnston, 1987). Los datos que ncden en la produccón de maíz para el análss econométrco son: Superfce sembrada, Superfce Cosechada, Produccón, Consumo aparente, Importacones en mles de toneladas, Valor de la Produccón en mles de pesos; además del Rendmento, Preco Medo Rural y Poblacón total. Estos datos se recoplaron en dferentes fuentes: Insttuto de Naconal de Estadístca y Geografía (INEGI), Servco de Informacón Agroalmentara y Pesquera (SIAP), Sstema de Informacón Agroalmentara de Consulta (SIACON-SIAP), Sstema de Informacón Estadístca de la Organzacón de la Nacones Undas para la Agrcultura y la Almentacón (FAOSTAT), Sstema Naconal de Informacón e Integracón de Mercados (SNIIM), ver Anexo 9.1. En el apartado de análss de seres de tempo unvarado se enunca los prncpos para modelar datos hstórcos, en donde se hace un análss ndvdual para cada varable y de esta manera conocer la transformacón algebraca adecuada para que una sere sea estaconara. Esta es la condcón que debe de cumplr los datos para hacer un mejor pronóstco, para saber s la sere es estaconara se recurre a pruebas estadístcas más comunes como podría ser medante las gráfcas, correlogramas a partr de los coefcentes de autocorrelacón muestral y Parcal (ACF, PACF) y prueba de raíz untara (Dckey-Fuller). Después de estas pruebas se decde cuál es el mejor modelo Autorregresvo Integrado de Promedo Móvl (ARIMA) para el pronóstco a años futuros. Para llevar a cabo un mejor pronóstco de acuerdo al mejor modelo, se hace uso del software Estadístco R versón y otros programas auxlar (SAS, SPSS, EVews 7). R es un Software para el análss estadístco y gráfco, orentado al v

12 análss de los mercados fnanceros, además se dstrbuye bajo la lcenca GNU GPL (Lcenca Públca General). El Software Estadístco R está dsponble para los sstemas operatvos Wndows, Macntosh, Unx y GNU/Lnux en y con una ampla coleccón de lbrerías que se encuentra en CRAN (Comprehensve R Archve Network); como los que se usan en este trabajo agrcolae, car, lmtest, TSA, tseres, forecast, urca y otros (Verzan, 2005). Palabras Claves: Regresón lneal, Mínmos Cuadrados Ordnaros, seres de tempo, pronóstcos, raíz untara, CRAN. SUMMARY In ths research lterature are the topcs for econometrc analyss, where sets out the prncples of lnear regresson analyss and unvarate tme seres. In the frst secton we Exploratory Data Analyss (EDA), whch s a set of statstcal technques to dentfy varables that can best estmate the varable of nterest, n ths case the best model that fts the producton of maze n Mexco. These technques (lnearty, normalty, multcollnearty, homoscedastcty) are based on assumptons of Ordnary Least Squares (OLS). The analyss of economc varables begns wth the specfcaton of the model n mathematcal form, estmate model parameters and fnally testng the model, n an attempt to judge whether t s a suffcent descrpton of the real economy under study or whether to estmate dfferent specfcatons. The data that affect the producton of corn for the econometrc analyss are: Area planted, area harvested, producton, apparent consumpton, mports thousands of tons, Value of Producton n thousands of pesos n addton to performance, prce and Rural Populaton total. These data were collected from several sources: Natonal Insttute of Statstcs and Geography (INEGI), Informaton Servce Agrfood and Fsheres (SIAP), Agr-Food Informaton System Consultaton (SIACON-SIAP), Statstcal Informaton System of the Organzaton of Unted Natons Food and Agrculture Organzaton (FAOSTAT), Natonal Informaton System and Market Integraton (SNIIM), see Annex 6.1. In the secton on tme seres analyss unvarate model sets out the prncples for hstorcal data, where s an ndvdual analyss for each varable and thus know the proper algebrac transformaton so that a seres s statonary. Ths s the condton that the data must meet to make a better prognoss, as to whether the seres s statonary statstcal tests are used most commonly as mght be usng graphs and correlograms from the sample autocorrelaton coeffcent (ACF) and unt root test v

13 (Dckey-Fuller). After these tests you decde what s the best model autoregressve movng ntegrated average (ARIMA) to forecast future years. To carry out a better prognoss accordng to the best model, makes use of statstcal software R verson , and other auxlary programs (SAS, SPSS, EVews 7). It s a software for statstcal analyss and graphc-orented analyss of fnancal markets also dstrbuted under the GNU GPL (General Publc Lcense). The R Statstcal Software s avalable for Wndows operatng systems, Macntosh, Unx and GNU / Lnux n and a wde collecton of lbrares found n CRAN (Comprehensve R Archve Network) as used n ths work agrcolae, car, lmtest, TSA, tseres, forecast, urca and others (Verzan, 2005). Key Words: regresson analyss, Ordnary Least Squares, tme seres, forescat, unt root, CRAN. x

14 I. INTRODUCCIÓN La econometría consste en hallar un modelo apropado que permta pronostcar datos a futuros, en donde se utlza herramentas de la teoría económca, las matemátcas y la nferenca estadístca para el análss de los fenómenos económcos. En el trabajo de modelacón econométrca es de suma mportanca la dsponbldad y caldad de los datos, porque consttuyen los nsumos báscos para contrastar teorías económcas y técncas de estmacón. Se menconará la naturaleza de los modelos y tambén se destaca su enorme utldad centífca en el análss económco. La econometría es una amalgama de teoría económca, economía matemátca, estadístca económca y estadístca matemátca. La teoría económca formula hpótess de naturaleza cualtatva, postula una relacón negatva o nversa entre el preco y la demanda de un ben. En la economía matemátca expresa la teoría económca en forma de ecuacones: Keynes postula una relacón postva entre el consumo e ngreso, es aquí donde el economsta matemátco sugere la sguente funcón para la teoría de consumo (Lora, 2007) Donde Y : Gasto de consumo, X : Consumo,, : Parámetros La funcón de consumo es de nterés lmtado para el econometrsta, sn embargo la estadístca económca centra su atencón en la recoleccón, procesamento y presentacón de cfras económcas. Cabe menconar que la pedra angular en la econometría es el análss de regresón. Un modelo de regresón lneal es aquella en donde se tene a la varable dependente (y), que es expresada como una funcón lneal de una o más varables, llamadas explcatvas(x). Además exsten relacones causales entre las varables dependentes y explcatvas, con una dreccón: de las varables explcatvas haca la varable dependente (Gujarat, 2003). Por la crecente complejdad del mundo contemporáneo se requere de nstrumentos que den clardad, orden y estructura a la comprensón de los fenómenos económcos. La modelacón económca pretende dentfcar, cuantfcar y sstematzar tendencas y hechos económcos que responde a regulardades en el tempo. El econometrsta consdera que aun cuando exstan errores en la medcón, en la captacón de las relacones y estructura económcas, la econometría es un nstrumento útl e ndspensable para obtener un conocmento 1

15 más precso y estructurado de la realdad que ayude a la toma de decsones económcas. Desde el punto de vsta estadístco para la tomas de decsones es mportante hacer predccones basadas en estmacones econométrcas que permta conocer el futuro con la nformacón que se tene hoy. En las predccones no se puede omtr los eventos mpredecbles (conflctos socales, polítcos y ambentales) ya que se reconoce que habrá errores en la predccón dado que exsten varables estocástcas, esto permtrá obtener un mejor modelo de la realdad económca. En el presente trabajo se hará uso de datos transversales para el análss de la produccón naconal de maíz en grano, en Méxco. Se pretende hacer una estmacón de la produccón de maíz en mles de toneladas con datos de 1980 a 2009 (INEGI, anuaro estadístco). Las varables a consderar para hacer un análss econométrco son produccón de maíz en grano (PMG), consumo aparente (CA), poblacón total (PT), rendmento (REN), superfce sembrada (SUP) e mportacón (IMP), ver Anexo 9.2. Una de las herramentas para este análss de regresón es la estmacón de la produccón por el Método de Mínmos Cuadrados Ordnaros (MCO). Ya que este método ofrece algunas propedades estadístcas muy atractvas por lo cual ha sdo consderado el método de regresón más efcaz (Gujarat, 2003) Objetvos generales 1.1. OBJETIVOS Presentar los conceptos báscos para el análss de regresón lneal (unvarado y múltple) y la metodología de Box-Jenkns (ARIMA) con datos de seres de tempo unvarado, el cual nos permta llevar a cabo un análss econométrco. El uso del software R como herramenta para obtener resultados confables en el ajuste de los modelos estadístcos Objetvos partculares a) Elaborar un materal que enunce los prncpales temas de esta dscplna (Econometría), junto con sus teoremas y demostracones correspondentes, con el afán de presentar un tutoral dedcado a profesores y estudantes que se nteresan en la econometría y despertar en ellos el nterés por la programacón hacendo uso del software R. b) Hacer una análss econométrco de la produccón de maíz en grano, medante el ajuste de un modelo estadístco que permta estmar la produccón a partr de los años 1980 a 2009 tomando en cuenta varables 2

16 que ncden drectamente como es el consumo aparente (CA), la poblacón total (PT), el rendmento (REN), la superfce sembrada (SUP), la mportacón (IMP) (ver Anexo 9.2). Pronostcar la produccón para los años futuros medante un modelo autorregresvo ntegrado de promedo móvl ARIMA(p,d,q). II. ANÁLISIS DE REGRESIÓN LINEAL 2.1 Modelos Econométrcos Funcón de Produccón (Martínez, 1974). Estas funcones son de gran utldad para las empresas de produccón agrícola, en donde se tenen nsumos varables, uno o más nsumos fjos ( ) para producr undades de un certo producto. La funcón de produccón de la empresa establece que la cantdad (esperada) de su producto, E(Y), puede expresarse como una funcón de las cantdades de sus nsumos varables, Entonces x,x,x,x,... x. ( ) p La cual se supone que es una funcón contnua, con dervadas parcales de prmer y segundo orden. a. Funcón de produccón polnomal (Martínez, 1983) Son las funcones más comúnmente empleadas, su estructura matemátca es la de un polnomo de grado gual o menor que 3. Para el caso de un polnomo de segundo grado, para p nsumo. Para p=1 se tene Para p=

17 Una funcón polnómca de segundo grado es más apropada para representar funcones de produccón que sean estrctamente crecentes o decrecentes en las cantdades de nsumos. En la nvestgacón agrícola, los modelos son útles y práctcos para predecr el rendmento, el efecto de algunos fertlzantes o nsectcdas, establecer los nveles de nutrmento que optmzan la respuesta o rendmento de los cultvos, tanto en terrenos físcos como económcos (Lugo, 1998). b. Funcón de produccón Cobb-Douglas (Lugo, 1998) En esta funcón de produccón sólo se consderan dos nsumos, el trabajo captal, y el producto ( ), que se hace gual al valor agregado. y el.2.4 Donde A,, son constantes postvas (parámetros) Martínez Garza (1974) lo presenta de la sguente manera Donde α, β1, β2,... βp son parámetros desconocdos del modelo, susttuyendo en cada una de las cantdades de nsumo en el lado derecho de, por,, se obtene: t β β... β X X X X 1 2 p β1 β2 β3 βp α 1 * 2 * 3... a una varacón proporconal en las cantdades de nsumo s p 1 El producto varía en la msma proporcón p α β 1 β 2...β p 1 El producto aumenta pero en menor proporcón α β 1 β 2...β p 1 El producto aumenta a una mayor proporcón Funcón de consumo. La representacón más smple del modelo keynesano, ésta es la únca relacón de comportamento nvolucrado (Barro, 2001). Funcón consumo

18 = Funcón ngreso Donde Y t = ngreso dsponble, Ct = consumo y I t sstema de ecuacones smultanea. = nversón. Es claro que se tene un Funcón de demanda. La demanda agregada es smplemente la cantdad total de gasto en benes y servcos medda a los precos correntes, PNB nomnal (Gordon, 1981). El análss de la demanda es el deseo de darle contendo empírco al modelo clásco de determnacón de los precos, la aplcacón de la regresón lneal a fenómenos económcos agregados. Para hacer un análss estadístco confable es ndspensable contar con nformacón acerca de precos y cantdades, que puedan obtenerse de nsttucones ofcales que proporconen nformacón estadístca y artículos especalzados. La recoleccón de datos sobre precos y cantdades de productos agrícola básco, ha sdo mucho más fácl que productos manufacturados. El método más efcente para determnar la demanda propuesto por Fox (1958) es: Cantdad de demanda del ben, Preco del ben Ingreso dsponble Podrá ser otro factor que refleja los cambos en la demanda Error o perturbacón estocástca En otro caso, cuando no se ha tratado como varable dependente, la únca varable dependente es ; entonces de la ecuacón 2.8 transfrendo a al lado zquerdo se obtene la sguente ecuacón. Donde,, y.2.9 5

19 Así que de la ecuacón 2.9 se tene una ecuacón de regresón múltple y el valor de los parámetros, se pueden estmar medante el método de regresón de mínmos cuadrados. A este modelo se le conoce como flexbldad preco de demanda, es de gran utldad para el caso de un mercado que opera medante ajustes en el preco Modelos de produccón para el análss Econométrco. Consderando un modelo lneal de la forma 1.1, se construyen funcones lneales a partr de varables que ncden drectamente en la produccón de Maíz en Méxco, para esto se consderan las sguentes varables: : Produccón Naconal de maíz en grano en mles de tonelada. : Consumo aparente en mles de toneladas. : Poblacón total en mles de personas. : Rendmento de maíz tonelada/hectárea. : Superfce sembrada mles de hectáreas. : Importacón de maíz en mles de tonelada. Modelo 1: Modelo 2: Modelo 3: Modelo 4: Modelo 5: En este trabajo se hará uso del modelo de regresón y para la estmacón de los parámetros se empleará el método de Mínmos Cuadrados Ordnaros. Medante el cual se pretende estmar el valor promedo de la produccón de maíz en grano conocendo los datos de produccón naconal, consumo aparente, poblacón total, rendmento por hectárea, superfce sembrada e mportacón (ver Anexo 9.2). Los modelos propuestos se construyen de acuerdo al grado de asocacón que tenen las varables, para esto se analza la matrz de correlacón parcal, matrz de covaranza y Coefcentes de correlacón múltple. Se analzaran las varables que estarán mplíctas en el modelo, que mejor predga la produccón. Una funcón con varas varables es un modelo regresón múltple, el 6

20 grado de asocacón entre las varables se mde con el coefcente de regresón múltple (Peña, 2002). Este grado de asocacón entre pares de varables se estudará más adelante, tambén el grado de asocacón entre una varable y las demás Modelos de Regresón Termno Lneal Algunos ejemplo de lnealdad en los parámetros o en las varables (Gujarat, 2003) Es lneal en los parámetros, mas no en la varable ( ) No es lneal respecto a los parámetros, pero s es lneal en las varables explcatva ( ) En este caso es lneal en ambos, tanto en los parámetros, como en las varables explcatvas ( ). ( ) Para el caso de la funcón de produccón de Cobb-Douglas (2.4), no es una funcón lneal en las varables, pero s es lneal en los parámetros. Para una funcón de segundo orden o cuadrátca, funcón respuesta, (Martínez G., 1987) no es lneal en las varables, pero s en los parámetros ( ). Es claro que se pueden clasfcar las funcones en cuadrátcas, exponencal, cúbcas y logarítmcas, estas podrían ser lneales en los parámetros ( ) pero no en las varables ( ) o de lo contraro no lneales en los parámetros ( ) y lneales en las varables ( ). 7

21 y y Funcón exponencal de la forma de. con valor de los parámetros y. Funcón Logístca de la forma para dferentes valores #functon exponencal wn.graph(wdth=10, heght=10,pontsze=8); par(mfrow=c(2,1)) x<-0:50;y<-3*(1-exp(-0.1*x));plot(x,y,type="l",,man="funcón Exponencal",col="blue") #funcon logstca x<-seq(-5,5,.1); y<exp(.1+.4*x)/(1+exp(.1+.4*x);plot(x,y,type="l",ylm=c(0,1),man="funcón Logístca para a=0.1, b=0.4 y b=0.6",col="red");y2<exp(.1+.6*x)/(1+exp(.1+.6*x)); lnes(x,y2,lty=2,col="blue"); y3<exp(.1+1.6*x)/(1+exp(.1+1.6*x));lnes(x,y3,lty=4,col="green") Funcón Exponencal x Funcón Logístca para a=0.1, b=0.4 y b= x Fgura 2. 1 Gráfco de funcones exponencal 8

22 Funcón de regresón Lneal Como ya se menconó en la ntroduccón, el análss de regresón trata del estudo de la dependenca de la varable dependente ( ) respecto a una o más varables explcatvas ( ). Uno de los prncpales objetvos del análss de regresón consste en hacer predccones (Johnson, 1987), éstas en promedo, exhben una aproxmacón razonable. Para un estadístco a menudo se desea determnar la ecuacón de la curva de mejor ajuste, a fn de expresar la relacón entre los valores de las dos varables. Algunas ecuacones de predccón podrían ser: Lneal Se consdera como ejemplo, s se está nteresado en estmar la produccón de maíz en grano (PMG) promedo,, conocendo el consumo aparente(ca) (2.10). Medante el dagrama de dspersón y la recta de regresón, muestra que el promedo de la produccón de maíz en grano aumenta conforme ncrementa el consumo; es decr que la relacón entre las varables es lneal (Fgura 2.2). Es claro que exsten otras varables que ncden en la estmacón, es por eso que se le agrega el térmno de perturbacón. Con base a la poblacón total en el país (PT) (2.11), medante la gráfca se observa que exste una relacón lneal entre las varables; es decr que conforme aumenta la poblacón tambén aumente la produccón de maíz. Antes de empezar a trabajar con el programa R, asegurarse que estén cargadas todas las paqueterías. Posterormente cargar los datos medante las sguentes funcones. getwd()#esta funcón permte saber cuál es la dreccón que R te reconoce setwd("c:/users/pavlon/documents/german/tesis")#la dreccón de donde estas mportando los datos datos<- read.table(fle="produccon_maz.txt", header=t)#el archvo "produccon_maz.txt" está stuado en la dreccón que mencone anterormente. attach(datos)# Para asegurarse que los datos son correctos par(mfcol=c(1,2)); modelo1<-lm(pmg~ca) plot(ca,pmg,xlab="consumo aparente(mles de ton)",ylab="produccón de maíz en grano(mles de ton)", man="relacón entre produccón y consumo",cex.man=.8) ablne(modelo1,col="red"); modelo2<-lm(pmg~pt) plot(pt,pmg,xlab="total de habtantes(mles)",ylab="produccón de maíz en grano(mles de ton)", man="relacón entre produccón y total habtantes",cex.man=.8) ablne(modelo2,col="blue") 9

23 produccón de maíz en grano(mles de ton) produccón de maíz en grano(mles de ton) relacón entre produccón y consumo relacón entre produccón y total habtantes consumo aparente(mles de ton) 7e+04 8e+04 9e+04 1e+05 total de habtantes(mles) Fgura 2. 2 Estmacón de la Produccón de maíz (PMG) con el método de MCO con las varables CA y PT En otro caso para estmar la produccón de maíz en grano a partr del rendmento de maíz por hectárea (2.12), se observa que exste una relacón lneal drecta. Ya que medante una recta de regresón se observa que los puntos no se alejan de la recta, con esto se puede decr que hay un buen ajuste. Exsten otras pruebas como el coefcente de determnacón ajustado, que para este caso es cercano a la undad. De gual manera en relacón a la Importacón de maíz se puede aprecar en la gráfca (Fgura. 2. 4) que exste una relacón lneal, ya que la mportacón ncde en la produccón. par(mfcol=c(1,2)) ; modelo3<-lm(pmg~ren) plot(ren,pmg,xlab="rendmento por ha (mles ton)",ylab="produccón de maíz en grano(mles de ton)", man="relacón entre produccón y rendmento",cex.man=.8) ablne(modelo3,col="green"); modelo4<-lm(pmg~imp) plot(imp,pmg,xlab="importacón de maíz(mles ton)",ylab="produccón de maíz en grano(mles de ton)", man="relacón entre produccón e mportacón",cex.man=.8) ablne(modelo4,col="red") 10

24 produccón de maíz en grano(mles de ton) produccón de maíz en grano(mles de ton) relacón entre produccón y rendmento relacón entre produccón e mportacón rendmento por ha (mles ton) Importacón de maíz(mles ton) Fgura 2. 3 Estmacón de la Produccón de maíz (PMG) con el método de MCO con las varables REN, IMP. Otro ejemplo es que tambén la produccón es lneal con respecto al tempo. La tasa de crecmento de cada año en cuanto a la produccón de maíz en grano, se puede calcular por varos métodos: el Geométrco, el exponencal y el lneal; este últmo es que se demostrará en seguda. Para obtener la tasa promedo de produccón de maíz se utlza una regresón lneal de la forma 2.17 Para Tenendo una produccón de maíz en grano a partr de los años 1980 hasta el Medante una gráfca en relacón al tempo se observa que la produccón ha do en aumento, con una produccón mínma de mles de tonelada regstrada en el año de 1982 y una produccón máxma de mles de toneladas regstrado en el año 2008 (Fgura 2.4). Obtenendo la estmacón de los parámetros medante software R. tasa<-lm(pmg~an) summary(tasa) produc<-as.matrx(cbnd(pmg,ftted(tasa))) 11

25 dat<-ts(produc,start=c(1980,1),frequency=1) plot(dat,plot.type="sngle",type="o",xlab="años",ylab="mles de toneladas",lty=1:2,man=" Produccón promedo anual",cex.man=.9,col=2:4) legend(1980,24000,c("producón real","produccón promedo"),lty=1:2,cex=.9,col=2:4) cof<-as.matrx(coef(tasa)) tasa_crecmento<-cof[2]/mean(pmg) Cuadro 2. 1 Estmacón de la tasa promedo de produccón a través del tempo Coeffcents: Estmate Std.Error t value Pr(> t ) (Intercept) *** Año *** De los datos obtendos se obtene la tasa promedo anual medante un cocente, que es el valor estmado de la pendente de la regresón entre la meda de la varable dependente (produccón). De esto se concluye que la tasa de crecmento promedo anual en cuanto a la produccón de maíz es del 2.45%. Sn embargo para tener una mejor nocón en qué año hubo un défct en cuanto a la produccón se puede recurrr a calcular la tasa de crecmento de produccón de maíz de cada año agrícola, que está dado por la sguente formula (Anexo 9.6) Donde, [( ) ] 12

26 mles de toneladas Produccón promedo anual Producón real produccón promedo años Fgura 2. 4 Produccón promedo anual de maíz en grano. Tambén es posble estmar la tasa natural de desempleo, partendo de algún perodo en el que se pensa que el mercado de trabajo ha estado en equlbro y en el que tanto la tasa de desempleo agregado como la tasa de los grupos que aparecen en la ecuacón alcanzan sus nveles naturales. La ecuacón para la tasa natural u es: Donde Es la tasa natural de desempleo global La tasa natural de desempleo de los grupos que componen la poblacón actva (edad, raza, sexo, hombre, mujer, etc.) Ponderacones, fraccón de la poblacón cvl actva que entra dentro del grupo específco (jóvenes negros) La tasa natural de desempleo global,, es la meda ponderada de las tasas naturales de desempleo correspondente a los subgrupos de la poblacón actva (Dornbusch, 1991) Logarítmca 13

27 La funcón de produccón de Cobb- Douglas, es ejemplo de una funcón logarítmca (Cramer, 1973). Donde Producto, los nsumos: trabajo ( ) y captal ( ), y las constantes postvas,. Para poder ajustar el modelo es necesaro obtener los logartmos para A, las varables,, y añadendo el termno de perturbacón, obtenendo así la sguente ecuacón De esta manera, los parámetros mínmos cuadrados., se pueden estmar medante el método de Exponencal (Cantatore, 1980) Las fórmulas de tpo exponencal, puede ajustarse fáclmente reducéndolas a la forma logarítmca, como en el caso de la funcón (2.18) Cobb-Douglas. En ocasones la recta o una curva pueden no resultar apropadas para descrbr una tendenca por lo que a veces es necesaro utlzar una curva exponencal del tpo Ello ocurre cuando la tendenca es de naturaleza geométrca, es decr, cuando los valores de Y tenden a formar una progresón geométrca. S los valores de Y forman una progresón de este tpo cuando los valores de X se dsponen geométrcamente la fórmula es: S la funcón es de la forma (2.21), entonces obtenendo el logartmo natural para ambos lados de la ecuacón, se obtene: Así como ésta curva y otras curvas exponencales son de gran mportanca desde el punto de vsta de tendenca, una de las más conocdas es la de Gompertz, su formulas es: 14

28 Y a b c x En las relacones estadístcas entre varables se tratan esencalmente con varables aleatoras o estocástcas (varables que tenen dstrbucón de probabldad). Martínez Garza (1974) mencona que es dfícl de predecr en forma exacta el rendmento de certo cultvo, ya que en estas, están nvolucrados los errores de medcón y factores que no se pueden controlar (temperatura, enfermedad, suelo. etc.). En algunos modelos económcos, tal como el gasto de consumo sobre el ngreso real se representa con una regresón smple, pero habrán otros modelos que se representaran con una ecuacón de regresón múltple (más de una varable explcatva, x ). Como referenca a la ecuacón (2.1), en donde Y es la varable dependente y las X ( x 1, x2, x3, x4,... xp ) son las varables ndependentes (explcatvas, predctoras, regresoras, exógenas, covarantes), en las funcones o modelos econométrcos la smbología a utlzar para denotar corte transversal será x y para denotar seres de tempo será xt (subíndce o t según sea el caso) Funcón de regresón lneal Los puntos en la sguente gráfca son los valores de la varable dependente (Y), grafcados en funcón de los valores X. S se unen esos valores se obtene una recta, llamada recta de regresón en este caso es una recta, pero puede ser una curva, llamándole curva de regresón. 1. par(mfcol=c(1,2)); modelo1<-lm(pmg~ca) plot(ca,pmg,xlab="consumo aparente(mles de ton)",ylab="produccón de maíz en grano(mles de ton)", man="gráfco de dspercón",cex.man=.8,col="blue") ablne(modelo1,col="red") plot(ca,ftted(modelo1),xlab="consumo aparente(mles de ton)",ylab="produccón de maíz en grano(mles de ton)", man="funcón de regresón ajustado",cex.man=.8,col="blue") ablne(modelo1,col="red") 1 Los datos que utlzaron para elaborar las gráfcas se encuentran en el Anexo

29 produccón de maíz en grano(mles de ton) produccón de maíz en grano(mles de ton) grafco de dspercón Funcón de regresón ajustado consumo aparente(mles de ton) consumo aparente(mles de ton) Desde el punto de vsta geométrco, una curva de regresón poblaconal es smplemente el lugar geométrco de las medas condconales de la varable dependente para los valores fjos de la (s) varable (s) explcatva (s). Es claro que E Y X es una funcón de X, donde X es un conjunto de cada meda condconal Fgura 2. 5 Análss de Regresón con el método de MCO valores dado. De manera smbólca es una funcón lneal de xj, entonces ( ) Donde β,β,β,... β son parámetros no conocdos pero fjos llamados k coefcentes de regresón o nterseccón respectvamente. y coefcente de la pendente, En la práctca no se puede estudar toda la poblacón, es por eso que en la teoría la Funcón de Regresón Poblaconal (FRP) es sólo una expresón matemátca. Para hacer un análss de la poblacón, es necesaro tomar una muestra para poder hacer una estmacón de la FRP. Para estmar los parámetros de la funcón (2.24) es mportante llevar a cabo la técnca estadístca conocda como Análss de regresón, Sn embargo exsten otras varables que afectan a la produccón es por ello que se le agrega el térmno de perturbacón o error ( ). El termno de 16

30 debe de cumplr con varos supuestos que posterormente se abordarán, uno de los supuestos que se debe de cumplr es que ; por el momento 2.3. Análss de Regresón Naturaleza del Análss de Regresón El método de regresón es una herramenta fundamental de la econometría. El térmno de regresón fue ntroducdo por Francs Galton, posterormente confrmado por Kart Pearson. En unos de sus artículos Galton planteó a pesar de una tendenca en la que los padres de estatura alta tenían hjos altos y los padres de estatura baja tenían hjos bajos, la estatura promedo de los nños nacdos de padres de una estatura dada tendían a moverse o regresar haca la estatura promedo de la poblacón total (Galton F, ). Karl Pearson reunó más de ml regstros de estatura de membros de grupos famlares, encontrando que la estatura promedo de los hjos de padres de estatura alta era menor y la estatura promedo de los hjos de padres de estatura baja era mayor; generándose un fenómeno medante el cual los hjos altos e hjos bajos regresaban por gual haca la estatura promedo de todos los hombres. Surgendo así, las Ley de la regresón unversal. De esta manera demostró que los hjos altos e hjos bajos regresaban por gual haca la estatura promedo de todos los hombres (Gujarat D., 2003). En térmnos generales el análss de regresón estuda la relacón de la varable dependente, respecto a una o más ndependente ( ); esto es con el objetvo de estmar y/o predecr el valor promedo poblaconal de la varable dependente en térmno de los valores conocdos o fjos (datos muéstrales). Está claro ver que el valor observado y el valor esperado dervado del modelo, puede que no concdan. Por ejemplo, de un conjunto de datos de un fenómeno, habrá ocasones en que el valor observado y su valor esperado dferan en el msmo sentdo o en un sentdo opuesto. Martínez Garza (1974) consdera que las dferencas entre el valor observado y el valor esperado son de carácter aleatoro. En el presente trabajo se plantea estmar la produccón naconal de maíz en grano a través de los cuatro modelos de regresón lneal con una varable, que posterormente se pretende construr un modelo de regresón múltple tomando en cuenta las demás varables con datos de 1980 a Tambén el pronóstco a 17

31 años futuros con un modelo ARIMA con datos hstórcos de la produccón de maíz en grano para los años de 1960 a Notacón matemátca Una funcón de regresón puede representarse de la sguente manera (Martínez garza, 1974) E(Y) f(x, x, x, x,...x ) En donde 1 2 E(Y) Valor esperado de Y. 3 4 p x, x, x, x,... Varables que nfluyen drectamente sobre Y xp f(x1, x2, x3, x4,...x p) Notacón funconal estándar. El valor esperado de la varable respuesta, E(Y), está en funcón de la varable(s) explcada (s), x 1, x 2, x 3, x 4,... x p. Consderando una varable aleatora Y (respuesta, varable endógena) defndo de la sguente manera: Y 0 X 0 1X1 2 X p X 1 p1 Esta ecuacón ndca que la varable aleatora Y se genera como combnacón lneal de las varables explcatvas X, salvo una perturbacón aleatora Sendo: 0, 1, p 1 Parámetro fjos desconocdos X 0,. X X p 1 valores son fjados por el expermentador Es una varable aleatora no observable Varables explcatvas no estocástcas (regresores), cuyos Estmacón de los parámetros por el método matrcal 18

32 La regresón múltple es una técnca estadístca que permte analzar la relacón entre una varable dependente ( ) y un conjunto de varables ndependente ( ). Donde la notacón matrcal se expresa como (Shayler, 1982): Donde ; ; [ ] [ ] [ ] [ ] La estmacón de los parámetros por el método de mínmos cuadrados es, esto es posble s exste la matrz ya que los regresores son lnealmente ndependentes; es decr que nnguna columna de es combnacón lneal de las demás columnas. Las dferencas entre el valor observado y el valor ajustado correspondente es el resdual, en notacón matrcal se expresa de la sguente manera Estmacón de los coefcentes de Regresón por el Método de Mínmos Cuadrados. El método de mínmos cuadrados se le atrbuye al matemátco alemán Carl Fredrch Gauss, bajo certos supuestos, este método tene algunas propedades estadístcas que lo han convertdo en algunos de los más efcaces y populares del análss de regresón (Gujarat, 2003). Partendo de la funcón de regresón muestral (2.24) y el termno de perturbacón estocástca ( ), que es la que estma la funcón de regresón, se demuestra que los resduos ( ) es smplemente la dferenca entre los valores observados ( Y ) y los estmados de Y ( Yˆ ). Esta defncón se puede observar en la sguente gráfca Con la defncón (2.26) y para un conjunto de datos (n=30) se obtene los sguentes resduales ajustados. Para 19

33 produccón de maíz en grano (mles ton) modelo4<-lm(pmg~imp) plot(imp,pmg,xlab="mportacón de maíz(mles ton)",ylab="produccón de maíz en grano (mles ton)",col.lab="blue",man="los resduos es la dferenca entre los valores observados y los estmados",cex.man=.8,col="blue") ablne(modelo4,col="red"); ponts(imp,ftted(modelo4),pch=18, col="red") segments(imp,pmg,imp,ftted(modelo4),col="blue") Los resduos es la dferenca entre los valores observados y los estmados mportacón de maíz(mles ton) Fgura 2. 6 Gráfco de los resduos por el método de Mínmos Cuadrados Ordnaros Entonces la suma algebraca de las pueden ser tan pequeñas e ncluso cero, a pesar de que pueden estar dspersos alrededor de la FRM. Entonces lo que se busca es mnmzar la suma de los errores Fgura.2.7. Resduos de un análss de regresón 20

34 n n ṷ Y βˆ 0βˆ 1 x Para obtener los estmadores (parámetros) por el método de mínmos cuadrados se parte de la suma de cuadrados de los errores, n 1 u 2. Para obtener dcha expresón se eleva al cuadrado por ambos lados la ecuacón (2.27). De ahí, que la suma de cuadrados de los errores está en funcón de los estmadores 0 n n 2 u Y βˆ 0 βˆ x f βˆ, βˆ u n 1 2 βˆ y βˆ Una condcón necesara para que ocurra el mínmo f βˆ, dervadas parcales: f/ β0 y f/ β1 La dervada parcal con respecto a β 0 : sean gual a cero. 0 βˆ1, es que las f β 0 n 0 β 0 n 2 Y βˆ 0βˆ 1x Y βˆ 0βˆ 1 ( 2) 0 x Pasando la constante (-2) al lado derecho de la ecuacón (2.29) (desaparece) y posterormente efectuando la sumatora e gualando a cero: n 1 n Y βˆ βˆ n x La dervada parcal con respecto a β 1 : f β 1 n 0 β 1 n 2 Y βˆ 0βˆ 1x ( 2) Y βˆ 0βˆ 1 ( ) 0 x x Pasando la constante (-2) al lado derecho de la ecuacón (2.31) (desaparece), realzando el producto de y posterormente efectuando la sumatora e x gualando a cero: n 0 n n n 2 2 Y βˆ 0 βˆ 1 0 Y βˆ 0 -βˆ 1 0 x x x x x 0 0 x

35 22 De la ecuacón (2.30) y (2.31) la n 1 Y y n 1 x Y se deja en térmnos de los parámetros ( 0 βˆ, 1 βˆ ) y de la varable x, de esta manera se genera un sstema de ecuacones smultaneas. n n x βˆ nβˆ Y n n n x x x βˆ βˆ Y De la ecuacón (2.32), s 0 βˆ es una constante, entonces n n Estmadores de Mínmos cuadrados Del sstema de ecuacones (2.33) y (2.34), se despeja 0 βˆ. Así que de (2.33): X βˆ Y βˆ Y βˆ βˆ Y βˆ x x n n n n n n n 2.35 Y de (2.37) despejando a 0 βˆ : n n n n n n x x x x x x βˆ Y βˆ βˆ Y βˆ Multplcando al denomnador por n n se obtene lo sguente n X βˆ Y βˆ n n βˆ Y βˆ m x x x x x n n n n

36 Ahora para poder obtener a βˆ 1 se guala a (2.35) y (2.36) n n 2 Y x βˆ 1x 0 0 Y βˆ 1 X. Hacendo algunos procedmentos algebracos se n X llega a que βˆ 1 n Y 0 m x 0 x 2 nxy n X La ecuacón (2.37) tambén puede expresarse como: 2 βˆ 1 n x X Y Y 0 x y 1 n n 2 2 x X x 0 n 1 Los estmadores obtendos prevamente se conocen como estmadores de mínmos cuadrados. En donde X y Y son medas muestrales de x y Y respectvamente, además se defne a x X Y Y y representan desvacones con respecto a los valores medos Propedades de los Estmadores de Mínmo Cuadrados x y el cual Una vez obtendo los estmadores de mínmos cuadrados de la nformacón muestral, la recta de regresón: 1. Pasa a través de las medas muestral de X y Y, este supuesto parte del estmador βˆ 0, ecuacón (2.35). Y βˆ X Y ˆ βˆ X ˆ m m m m Nota: n X(Y 2 βˆ1 X) Y x 2 n XY βˆ1 n X Y x βˆ1 x 2 x βˆ1 1 m 1 m m m m 2 x 2 βˆ1 n X m 2 2 βˆ 1 Y x n XY βˆ1 n X Y x n XY x m 1 m 1 23

37 2. El valor promedo de Y estmado ( Ŷ ) es gual al valor promedo de Y real ( Y ). Partendo de Ŷ βˆ βˆ y con la ecuacón de (2.35), se llega a 1 n la sguente ecuacón: Ŷ 0 1 x Y βˆ 1 Xβˆ 1x Ŷ Y βˆ 1x X dvdendo entre n, se tene: n n n Ŷ Y βˆ 1 x n n 1 X Ŷ Y 1 y sumando ambos lados y n 3. El supuesto de que la sumatora de los resduos ( u 0) es gual a cero, 1 de la ecuacón βˆ βˆ y con la defncón de la ecuacón (2.35) ṷ 0 1 Y x se llega a lo sguente: ṷ Y βˆ 1 X βˆ 1 ṷ Y βˆ 1 Y X x Y x 3 n ṷ 1 n 1 Y n Y βˆ n x X n, entonces se concluye que u 0 1 n 1 4. Los resduos no están correlaconados con x y Y, es decr: ṷ Ŷ 0 n y 0 1 ṷ x Supuestos del Método del Mínmos Cuadrados 1. El modelo de regresón es lneal en los parámetros Y β 0 β 1 x u Los valores de X son fjos en muestreo repetdo, es decr que X se supone no estocástco. Lo que sgnfca que el análss de regresón, está condconado a los valores dados de los regresores ( X ). 2. Dado el valor X, el valor esperado del térmno aleatoro de perturbacón u, es cero. E 0 u x n x 1 3 Asumendo que X0 24

38 cov( 3. La dstanca por encma y por debajo de los valores medos son lasu, lo que ndca el supuesto, es que los valores postvos de u se cancelan con los valores negatvos de u ; de tal manera que el efecto de promedo o de su meda sobre Y son cero (gráfco 2.6). 4. Homoscedastcdad. Dado el valor de X, las varanzas de u es la msma para todas las observacones. 2 varu x Eu E( u) / x 2 var u x E( u / x) 2μ E( x u / x) E( u / x) var 2 2 u x E( u / x) u x var Posterormente se tratará con más detalle los métodos para hacer las pruebas de homoscedastcdad. 5. No exste autocorrelacón entre las perturbacones. Dados dos valores cualquera de X, x y x j, la correlacón entre u y u j cualquera es cero. u u x x E( ) / E( ) u, j/, j) E j j / u x u u σ 2 x j dferentes. u u = E( / )( / x x j j) 0 donde, j son dos observacones 6. La varanza entre u y x es cero o u E( / x) 0 cov( u, x ) E( ) E( ) u u x x E ( E( )) Puesto que E(u ) 0 u u x u x E( x ) E( )E( x ) E(x ) Es no estocástco u E( x ) 0 Se debe de consderar que el número de observacones (n) sea mayor que el número de varables explcatvas (k). 25

39 Propedad de varanza mínma de los Estmadores de Mínmos Cuadrados Se busca una medda de confabldad o precsón de los estmadores βˆ 1y βˆ 2 y para medr esta precsón está el error estándar (ee). 2 σ v ar( βˆ 0) ee(βˆ ) n 0 1 ; v ar(βˆ ) σ n 0 n n x 1 x 1 n x 2 x 1 2 n x 1 ee ( βˆ 0) n n 2 x 1 σ S 2 se desconoce, entonces es posble utlzar el estmador por MCO σˆ 2 n ṷ 2 1 n 2, el cálculo de σˆ 2 será fácl de obtenerlo ya que se tene un conocmento prevo de ṷ 2 y el grado de lbertad (n-2) que se utlza, es el número de restrccones lneales (los parámetros a estmar: β β,β... ). Entonces de forma general es σˆ 2 n ṷ 2 0, 1 2 βk 1. Otras de las propedades es que cov(βˆ n k 0,βˆ ) X var(βˆ 1 1 ) X n σ 2 2 x 1 De acuerdo al teorema de Gauss- Harkov, los estmadores de mínmos cuadrados son los mejores estmadores lneales nsesgados (MELI), ya que estos presentan mínma varanza; tambén conocdos como estmadores efcentes Coefcente de determnacón r Ahora consderando la bondad de ajuste de la recta de regresón ajustada a un conjunto de datos. El coefcente de determnacón r 2 (caso de dos varables) o R 2 (regresón múltple) es una medda que ndca que tan ben se ajusta le recta de regresón muestral a los datos. Además es una medda numérca que ndca que la varacón de Y es explcada por la varacón de X. Cuando r 2 0 se tene que la varacón de Y no es explcada por la varacón de X, sn embargo cuando r 2 1 el 100% de la varacón de Y esta explcada por X. 26

40 Y de un análss de regresón SCR r 2, r 2 se puede obtener de manera más SCT senclla, más adelante se abordara el tema del análss de regresón. Tambén del coefcente de determnacón (r 2 ) puede calcularse el coefcente de correlacón muestral (r ), r r Meddas de Dependenca Lneal. Un objetvo fundamental de la descrpcón de los datos múltples es comprender la estructura de dependencas entre varables. Esta dependenca puede ser entre pares de varables, entre una varable y todas las demás, entre pares de varables pero elmnando el efecto de las varables. La dependenca lneal entre dos varables se estuda medante el coefcente de correlacón lneal o smple. Este coefcente para las varables, es: Y tene las propedades sguentes: S exste una relacón lneal exacta entre las varables,, entonces 3. es nvarante ante transformacones lneales de las varables. La dependenca por pares entre varables se mde por la matrz de correlacón. Llamaremos matrz de correlacón, R, a la matrz cuadrada y smétrca que tene unos en la dagonal prncpal y fuera de ella los coefcentes de correlacón lneal entre pares de varables (Peña, 2002). 27

41 [ ] Ya se estudó el grado de asocacón entre pares de varables, tambén se puede estudar el grado de asocacón entre una varable y las demás. Exsten varables que sean muy dependentes de las demás y convene medr su grado de dependenca. Se denota como las varables de nterés y varable explcatva o respuesta como ; consderando su mejor predctor lneal a partr de las restantes varables, este predctor lneal tene la forma ( ) y se comprueba que cuando las varables explcatvas toman un valor gual a su meda la varable respuesta es tambén gual a su meda. Los coefcentes, se determnan de manera que la ecuacón proporcone, en promedo, la mejor predccón posble de los valores de. Llamando resduos a los errores de predccón,, es nmedato, sumando para los datos, que la suma de los resduos para todos los puntos muéstrales es cero. La ecuacón obtenda con estos coefcentes se conoce como ecuacón de regresón múltple entre la varable. Partendo de que el promedo de los resduos al cuadrado con la ecuacón de regresón múltple para explcar es: Es una medda de la dspersón de la regresón para ver la varable, una medda adconal de la dependenca se construye partendo de la dentdad y elevando al cuadrado y sumando para todos los puntos se obtene la descomposcón básca del análss de varanza:. Donde la varabldad total o ncal de los datos, se expresa como la suma de la varabldad explcada por regresón y de la resdual. De esto se deduce el coefcente de determnacón o coefcente de determnacón múltple al cuadrado es una medda descrptva de la capacdad predctva del modelo, que el cocente entre la varabldad explcada por la regresón y la varabldad total. 28

42 ; De otra manera De acuerdo a lo anteror se puede calcular el coefcente de correlacón múltple entre cualquer varable y las restantes s se conoce sus varanzas y la varanza resdual de una regresón de esta varable sobre las demás (Peña, 2002). A partr de la matrz de correlacón se puede calcular los coefcentes de Regresón múltples de las varables. 1) Tomar el elemento dagonal de la matrz, que es la varanza de la varable. 2) Invertr la matrz y tomar el elemento dagonal de la matrz que se llamará. Este térmno es, la varanza resdual de una regresón entre la varable y el resto. 3) Calcular, la correlacón múltple como Esta expresón permte obtener nmedatamente todos los coefcentes de correlacón múltple de la matrz y Entonces de la defncón anteror, las varables que pueden predecr mejor el modelo de produccón, consderando un modelo regresón múltple se puede llevar a cabo medante el coefcente de regresón múltple El problema de Estmacón Una de las tareas consste en estmar las funcones de regresón por el método de Mínmos Cuadrados Ordnaros (MCO), que bajo certos supuestos posee algunas propedades estadístcas muy atractvas que lo han convertdo en uno de los más efcaces y populares del análss de regresón. En todo modelo de regresón se deben de probar hpótess para evaluar la valdez estadístca de los resultados, una de las pruebas consste en evaluar estadístcamente que tan sgnfcatvo son los parámetros del modelo. De esta manera puede dentfcarse s las varables ndependentes ( ) aportan nformacón relevante al modelo de regresón. Para el caso de un modelo lneal smple, se evalúan los parámetros medante la prueba de sgnfcanca ndvdual. Esta se contraste la hpótess nula vs, la regla de decsón es s se rechaza la hpótess nulas y se dce que los 29

43 parámetros del modelo son sgnfcatvo al nvel y que la varable es estadístcamente relevantes. En la prueba de sgnfcanca global se usa el Análss de Varanza (ANOVA), en donde se contrasta la hpótess nula vs. La regla de decsón es que s se rechaza con un valor crtco al nvel de sgnfcanca, g.de l. en el numerador y g.l. en el denomnador. Al rechazar, se afrma que al menos alguna contrbuye de manera sgnfcatva al modelo. De tal manera que el modelo puede ser el adecuado, después de revsar su ajuste y revsar la aportacón de cada una de las varables al modelo. Para probar la hpótess se utlza la dstrbucón probablístca, medante la tabla de análss de varanza (Flores, 1998). Además s los coefcentes de determnacón R-cuadrada múltple y ajustada se acercan a la undad, ndca que la línea de regresón se ajusta a los datos, obtenendo así una buena estmacón del modelo. Además se debe de cumplr otros supuestos tal como sea lo menor posble (Gujarat, 2003). Los supuestos que se debe de probar son. 1. El valor medo de los errores es gual a cero: 2. Que la varanza de los errores es la msma para todas las observacones (homoscedastcdad), 3. No exste autocorrelacón entre las perturbacones (errores), ( ) donde la dstrbucón de es ndependente de la dstrbucón de sendo que 4. El error está dstrbudo ndependentemente de la varable explcatva 5. Además de que los errores están normalmente dstrbudos ) 2.5. Análss de los Resduales Perturbacón estocástca o error El térmno perturbacón estocástca,, es un susttuto para todas aquellas varables que son omtdas del modelo, pero que afectan a. Los errores ( ) se deben a factores que no se pueden controlar en un expermento o por que los datos recoplados presentan ncongruenca. Desde el punto de vsta estadístco, es posble consderar que las dferencas entre el valor observado ( ) y el valor esperado ( ) son de carácter aleatoro. S en el análss de datos es el valor observado y es el valor esperado de dados los valores de ; 30

44 entonces se expresa la desvacón de sguente manera (Gujarat, 2003): alrededor de su valor esperado de la S la concordanca es buena, el error ( ) deberá ser pequeño, y de hecho en repetcones sucesvas el valor esperado de,, deberá ser cero. La desvacón (2.41) es una varable aleatora no observable que toma valores postvos o negatvos, conocdo como perturbacón estocástca o error estocástco. S se supone que es lneal en, entonces hacendo algunos arreglos algebracos la funcón queda de la sguente manera (Martínez G. y Castllo M, 1987): Con la defncón de la funcón (2.42) se puede demostrar que el valor esperado de es tan pequeño e ncluso cero,.tomando el valor esperado por ambos lados y se obtene: E Y / x EEY / x Eu / x E / E E / E / E / 0 Y x u / x De esta manera queda demostrado que E / 0 u x Así, el supuesto de que la recta de regresón pasa a través de las medas condconales de Y, mplca que los valores de la meda condconal u son cero. Más adelante con el método de mínmos cuadrados se corroborará los supuestos del error (u ) Supuestos de normaldad de Mínmos Cuadrados. 2 Medante el método de mínmos cuadrados se estman los parámetros de β, β,,estos parámetros estmados ( βˆ 1, βˆ 2, Y u x x Y x 1 2 σ 2 σˆ ) satsfacen varas propedades estadístcas como nsesgamento y varanza mínma. S a las suposcones del modelo clásco de regresón lneal se le añade la suposcón de normaldad para, se obtene lo que se conoce como Modelo Clásco de Regresón Lneal Norman (MCRLN) (Gujarat, 2003). En una regresón lneal normal se supone que cada esta normalmente dstrbuda con: 31

45 Meda: Varanza: [ ] Covaranza: ( ) {[ ][ ( )]} ( ) Estos supuestos pueden expresarse de la sguente manera, esto sgnfca que los resduos, se dstrbuyen bajo una dstrbucón normal con meda cero y varanza sgma cuadrada. En la sguente seccón se menconan las pruebas de normaldad para los resduos que arrojan los modelos, como la prueba de Shapro-Wlk, gráfcos de cuantles e hstogramas Supuesto de Normaldad: Modelo Clásco de regresón Lneal Normal. Uno de los supuestos del modelo de regresón lneal se debe de comprobar es que los errores se dstrbuyen normalmente, es decr ). A contnuacón se presentan los hstogramas de los resduos de cada uno de los modelos planteados en la seccón 2.1.4, para saber s los resduos sgue una dstrbucón normal; es decr una dstrbucón con la meda cas nulos y una mínma varanza. (Anexo 9.3). Medante los gráfcos 2.7 y 2.8 se observa que los resduos de cada uno de los modelos presentan una normaldad estándar ya que en la gráfca se muestra una línea recta de 45, se sabe que esto no es sufcente para comprobar la normaldad de los datos. Medante el gráfco Q-Q Plot que representan los cuantles empírcos obtendos de la muestra frente al cuantl correspondente de la dstrbucón normal. S el gráfco obtendo muestra una relacón cercana a una línea recta entonces este sugere que los datos provenen de una dstrbucón normal (Montgomery, 2005). modelo1<-lm(pmg~ca)# modelo de regresón; summary(modelo1)# un análss completo de la regresón modelo2<-lm(pmg~pt) # modelo de regresón; summary(modelo2)#un análss completo de la regresón modelo3<-lm(pmg~ren); summary(modelo3) modelo4<-lm(pmg~imp); summary(modelo4) modelo5<-lm(pmg~ca+ren+imp); summary(modelo5) lbrary(agrcolae)#nstalar la lbrería "agrcolae" par(mfcol=c(2,2)) hstograma1<-hst(resduals(modelo1), man=paste("prueba de Normaldad 1"),col="volet") normal.freq(hstograma1,col="red", lty=5,lwd=2) qqnorm(resduals(modelo1)); qqlne(resduals(modelo1),col="red") hstograma2<-hst(resduals(modelo2),man=paste("prueba de Normaldad 2"),col="green") normal.freq(hstograma2,col="blue", lty=5,lwd=2) qqnorm(resduals(modelo2)); qqlne(resduals(modelo2),col="blue") 32

46 Sample Quantles Sample Quantles Frequency Frequency Prueba de Normaldad 1 Prueba de Normaldad resduals(modelo1) resduals(modelo2) Normal Q-Q Plot Normal Q-Q Plot Theoretcal Quantles Theoretcal Quantles Fgura 2. 7 Prueba de Normaldad para los resduos de los modelos 1 y 2. Es por ello que se recurre a otras pruebas (Shapro-Wlk, Kolmogorrov-Smrnov). Es mportante el comprobar que los errores de un modelo de regresón es normal, sn embargo con sólo comprobar que y se puede estar seguro que los estmadores son MELI. Para hacer la prueba de normaldad se han empleado los estadístcos de Shapro-Wlk y Kolmogorrov-Smrnov, el prmero es para muestras menores de 50 (. Dado que las es una varable aleatora no observable que toma valores postvos o negatvos, conocdo como perturbacón estocástca o error estocástco. par(mfcol=c(2,3)) hstograma3<-hst(resduals(modelo3),man=paste("prueba de Normaldad 3"),col="orange") normal.freq(hstograma3,col="red", lty=5,lwd=2) qqnorm(resduals(modelo3)); qqlne(resduals(modelo3),col="red") hstograma4<-hst(resduals(modelo4),man=paste("prueba de Normaldad 4"),col="blue") normal.freq(hstograma4,col="black", lty=5,lwd=2) 33

47 Sample Quantles Sample Quantles Sample Quantles Frequency Frequency Frequency qqnorm(resduals(modelo4)); qqlne(resduals(modelo4),col="black") hstograma5<-hst(resduals(modelo5),man=paste("prueba de Normaldad 5"),col="sky blue") normal.freq(hstograma5,col="brown", lty=5,lwd=2) qqnorm(resduals(modelo5)); qqlne(resduals(modelo5),col="brown") Prueba de Normaldad 3 Prueba de Normaldad 4 Prueba de Normaldad resduals(modelo3) resduals(modelo4) resduals(modelo5) Normal Q-Q Plot Normal Q-Q Plot Normal Q-Q Plot Theoretcal Quantles Theoretcal Quantles Theoretcal Quantles Fgura 2. 8 Prueba de Normaldad para los resduos de los modelos 3, 4 y 5. Medante el estadístco Shapro Wlks las hpótess a contrastar es: { } { } El estadístco esta dado por la sguente fórmula: [ ] Ordenar los datos de menor a mayor: 34

48 { } { } 2. En el Anexo 9.5 se buscan los valores correspondente a la fla, para donde 3. Calcular el numerador y el denomnador de : [ ] y, donde se consderan los valores ordenados. Una vez calculado estadístco, se puede contrastar las hpótess en donde se rechaza la hpótess nula sí. Es decr, una con una y rechazar la hpótess de normaldad o de lo contraro aceptar que los datos sguen una dstrbucón normal. Para obtener el valor del estadístco se usa el parámetro, para lo cual se emplean los valores del Anexo 9.5. Para el valor crítco del estadístco se emplea la tabla del Anexo Multcolnealdad Factor de nflacón de varanza La multcolneldad está presente en todos los datos, cuando no hay una relacón lneal entre los regresores se dce que son ortogonales, y se puede hacer con toda facldad nferenca estadístca; sn embargo en la mayor parte de las aplcacones de regresón, los regresores no son ortogonales. El problema no radca en la no ortogonaldad, el caso es cuando se tene una relacón lneal cas perfecta es aquí en donde exste el problemas de multcolnealdad (Montgomery, 2005). La multcolnealdad afecta a los coefcentes de regresón de mínmos cuadrados. ; ; [ ] [ ] [ ] es un vector de de las observacones, es una matrz de de los nveles de las varables regresoras, es un vector de de los coefcentes de regresón. Estmador por el método de Mínmos Cuadrados, de esto la matrz en forma correlacón y su nversa se denota por. Se puede demostrar que los elementos dagonales de la matrz son., en donde es el coefcente de determnacón 35

49 múltple de la regresón de respecto a las demás varables regresoras. Una forma de dagnostcar una fuerte multcolnealdad es medante el factor de nflacón de la varanza, s es cas ortogonal a los regresores restante, es cas pequeño y es cercano a la undad, mentras que s es cas lnealmente dependente en algún subconjunto de las regresoras restante, es cas lneal y es grande. El factor VIF por cada térmno del modelo mde el efecto combnado que tenen las dependencas entre los regresoras sobre la varanzas, entonces s hay uno más VIF grandes es posble la presenca de multcolnealdad. En la práctca, para llevar a cabo la prueba de multcolnealdad con el Factor de Inflacón de la Varanza, en donde se tene la matrz C cuyo elemento dagonal son los factores de nflac n de la varanza. Montgomery (2005) explca que s cualquera de los VIF es mayor de 10 ndca que hay presenca de multcolnealdad, esto mplca que los coefcentes asocados a la regresón están sobreestmados; es decr que la varanza de de cada uno de los estmadores son grandes y por lo consguente el ntervalo de confanza tambén lo es. Sn embargo, asumendo que exste presenca de multcolnealdad con valores VIF mayores a 10. Estos valores solo nos dce que hay presenca de multcolnealdad mas no se sabe cuál es el grado, es por ello que se recurre a la sguente prueba para analzar el grado de colnealdad Análss de multcolnealdad con egenvalores Las raíces característcas, egenvalores o valores propos de ( ) pueden ser usados para medr el grado de multcolnealdad en los datos, s uno o mas egenvalores es pequeño mplca de que hay dependenca cas lneal entre las columnas de. La condcón para detectar dependenca lneal severa entre las varables es que el número de condcón exceda de 1000, s está entre 100 y 1000 mplca colnealdad moderada (Montgomery,2005 ) Es una medda de la dspersón en el espectro de engenvalores de, la cantdad de índces de condcón que son grandes ( es una medda de la cantdad de dependenca cas lneal de. para

50 Es claro que el máxmo índce de condcón es el número de condcón defndo por la ecuacón Una vez que se obtenen el vector de los egen valor y egen vector de la matrz, se procede a calcular los índces de condcón dados por la formula (2.45). S el valor de algunos de los índces de condcón es mayor a 100 se puede conclur que hay una fuerte dependenca lneal entre las varables explcatvas. Y s este índce está por debajo de 100, el grado de asocacón entre los regresores no es muy fuerte, de esta manera se puede hacer nferenca confable. Cabe menconar que se puede comprobar que entre más pequeños sea el índce de condcón es mayor, esto mplca una mayor dependenca entre las varables Autocorrelacón El térmno de autocorrelacón se defne como la correlacón entre membros de seres de observacones ordenadas en el tempo (datos de seres de tempo) o en el espaco (datos de corte transversal). El modelo clásco de regresón lneal supone que no exste tal autocorrelacón en las perturbacones (Gujarat, 2003). ( ) Es decr que los errores de una observacón cualquera no nfluyen en los errores de cualquer otra observacón. Sn embargo, s tal dependenca exste, se tene auto correlacón. ( ) El supuesto de no autocorrelacón no puede observarse drectamente, una de las formas para saber s las no estén correlaconados es a través de gráfcos Q-Q Plot. Se observa que en cada uno de los modelos las no están correlaconadas y además tenden a ser una normal estándar. Una de la prueba más conocda para detectar correlacón seral es la de Durbn-Watson, este estadístco está defndo por: Esta prueba presenta límtes superor e nferor tales que s el valor calculado cae fuera de estos valores crítcos, pude tomarse una decsón con respecto a la presenca de correlacón postva o negatva. De la ecuacón (2.45) se puede expandr: 37

51 ( ) Donde Entonces con el coefcente de autocorrelacón muestral de prmer orden puede expresarse como., se establece la sguente regla de decsón { Hpótess a contrastar: Lo que se pretende en este análss de correlacón es que el estadístco Durbn- Watson se acerque a 2, esto mplca que el valor de se aproxme a cero; de este valor depende que se acepte o se rechace la hpótess nula. S estadístcamente se acepta la hpótess nula, asumendo que no exste autocorrelacón; de acuerdo a la regla establecda (Gujarat, 2003) se dce que nnguna perturbacón de algún regresor están correlaconados con el error de otra (supuesto 5) Heteroscedastcdad La propedad de los estmadores de Mínmos Cuadrados Ordnaros (MCO) de los coefcentes de regresón depende de las propedades del térmno de perturbacón del modelo. Uno de los supuestos mportantes del modelo de regresón lneal es que las perturbacones son homoscedástcas; es decr, tenen la msma varanza Entre los supuestos asumdos, se postula que los errores tene una esperanza gual a cero, una varanza constante y son ndependentes entre sí. Pero s en un análss de regresón medante el método de MCO exstera heteroscedastcdad los estmadores ( dejan de ser MELI. 38

52 Consderando un modelo de regresón lneal de dos varables y el estmador de MCO es: Entonces la varanza está dado por Y bajo el supuesto de homoscedastcdad (varanza constante), entonces, es decr Consderando explíctamente la heteroscedastcdad y usando la varanza dada en 2.48 y suponendo que es conocda, esto mplca que el ntervalo de confanza basado en este estmador será consderablemente grande. Además es probable que las pruebas y proporconen resultados mprecsos en sentdo que la es demasado grande y un coefcente estadístcamente no sgnfcatvo (el valor es no sgnfcatvo al nvel de sgnfcanca del 5%). En presenca de heteroscedastcdad, el método para generar el mejor estmador lneal nsesgado (MELI) es el de Mínmos Cuadrados Generalzados (MCG) (Gujarat, 2003). Para la deteccón de heteroscedastcdad se emplea dos métodos: la prueba Breusch- Pagan y prueba de Whte Prueba de Breusch- Pagan Consdérese el modelo de regresón con varables 2.52 Y que la varanza del error se descrbe como Es decr que está en funcón de las varables, las varables pueden ser las varables. Entonces para saber que es homoscedastca se prueba la hpótess de que, es decr. En la prueba de Breusch- Pagan se construyen las varables, en done 39

53 estmador de Máxma Verosmltud. Se construye un modelo de regresón con las en funcón de las varables y el termno de resduos Se construye el estadístco de prueba grados de lbertad. que sgue una dstrbucón j-cuadrada con Se presentan el juego de hpótess para la deteccón de heteroscedastcdad Entonces s en una aplcacón calculado excede al valor crtco de con un nvel de sgnfcanca, se puede rechazar la hpótess de homoscedastcdad; de lo contraro se acepta (Gujarat, 2003). S medante esta prueba resulta que los resduos son heteroscedastcos, esto mplca que los estmadores dejan de ser MELI. Entonces se propone meddas correctvas, como el método de Errores estándar robustos de Whte (Gujarat, 2003) para resolver el problema de heteroscedastcdad. En este trabajo se hace uso del software EVews 7 para realzar esta prueba, ya que el programa R no tene funcones que me permta hacer esta medda correctva Prueba de Heteroscedastcdad de Whte. Del modelo de regresón 2.14 se obtene los resduos y se crea una modelo de regresón auxlar, para este caso el modelo auxlar esta dado por la sguente ecuacón (ver defncón Gujarat, 2003) Es decr, con los resduos al cuadrado del modelo estmado por el método de MCO, se hace la regresón sobre las regresoras orgnales, las regresoras al cuadrado y los productos cruzados. De esta regresón se obtene múltple, el cual multplcado por el tamaño de nuestra ( ) sgue una dstrbucón J-cuadrada con grados de lbertad gual al número de regresora (ncluyendo la constante) 40

54 Entonces s el valor J-Cuadrado obtendo excede al valor J-cuadrado crítco al nvel de sgnfcanca, bajo la hpótess nula de que hay heteroscedatcdad se acepta; de los contraro se rechaza. Medante la prueba correctva de heteroscedastcdad de Whte, los errores estándar son más grandes que por el método de Mínmos Cuadrados Ordnaros, esto mplca que entre más grandes son los errores menor será el valor de ; sn embargo no se perde la sgnfcanca de las regresoras mplíctas en el modelo por el método de MCO y Error Estándar Robusto de Whte. III. ANÁLISIS DE SERIE DE TIEMPO 3.1. Introduccón Las empresas y goberno, tenen que hacer planes para el futuro. Hoy en día dversas nsttucones requeren conocer el comportamento futuro de fenómenos con el fn de planfcar sus recursos. Se tene un tpo de nferenca estadístca que se hace acerca del futuro de algunas varables o conjuntos de varables basándose en sucesos pasados. Una de las técncas más mportantes para hacer nferencas sobre el futuro con base en lo ocurrdo en el pasado, es el análss de sere de tempo. Se llama sere de tempo a un conjunto de observacones recopladas a través del tempo y son en nnumerable las aplcacones, en dferentes aéreas del conocmento. Algunos ejemplos son: 1. En los negocos, las ventas mensuales, ventas trmestrales. 2. En fnanzas el preco y tasa de nflacón. 3. En meteorología, la temperatura y precptacón anual, la velocdad del vento. 4. En la agrcultura, se regstran anualmente la produccón agrícola y ganadera o las exportacones de algún producto. 5. En ecología, la abundanca de alguna espece anmal, el nvel de agua de algún lago o ro. La lsta de dscplnas en las que se estuda seres de tempo es ampla, esta es una muestra muy pequeña de la multtud de seres que se encuentran en los campos de la ngenería, la cenca, las socología, la medcna, la agrcultura, la economía y la ecología. Uno de los propóstos de este apartado es dar a conocer algunas técncas de ajuste de modelos de seres de tempo, la estmacón de los parámetros del modelo elegdo, comprobar la bondad de ajuste del modelo, y 41

55 usarlo para predecr o pronostcar valores a futuros a partr de nuestra sere orgnal. Para obtener los resultados se usó el software R, que es un programa estadístco orentado a objetos del lenguaje S. Es un software de acceso lbre que se puede bajar de la pagna web junto con las lbrerías como TSA, tseres, leaps, locft, akma, quadprog, zoo, forecast y urca que se harán uso en este apartado. Para conocer más a fondo como nstalar el programa y un curso ntroductoros, se puede consultar al tutoral de Manzanera (2011) Característcas de las seres de tempo El objetvo es explcar el valor que toma, en un momento determnado del tempo, un fenómeno que muestra dependenca temporal, un procedmento que consste en recoger nformacón sobre su evolucón a lo largo del tempo y explotar el patrón de regulardad que muestran los datos. Para construr un modelo de seres de tempo, lo únco que se necesta es la nformacón muestral de la varable a utlzar. Sí se desea explcar el comportamento de una varable temporal en un modelo de sere de tempo, puede plantarse como: Una sere de tempo se defne como una secuenca ordenada de números aleatoros con respecto al tempo, la mayoría de los datos económcos se recoplan en puntos dscretos del tempo. Una sere de tempo es una realzacón de las varables aleatoras de un proceso estocástco referdas a un conjunto de índce T Procesos estocástcos Se denomna proceso estocástco a la sucesón nfnta de varables aleatoras ordenadas { }, referda a un conjunto de índce T, el cual puede ser dscreto con una dstrbucón común. Un aspecto mportante es que el proceso debe estar referdo al msmo espaco de probabldad ( ) (Brockwell, 2002).Otra defncón, es la realzacón muestral de un proceso estocástco el cual puede escrbrse como (Pfaff, 2008): { }

56 En donde para cada, es una varable aleatora en el espaco muestral. Uno de los objetvos del análss de seres de tempo se refere a la dentfcacón del proceso que genera los datos. Regularmente un proceso estaconaro (estaconaredad débl) se defne como: [ ] a [ ] b Un proceso estocástco es estaconaro en sentdo débl, s su meda y su varanza son constantes en el tempo, s el valor de la covaranza entre dos perodos de tempo y no del tempo en el cual se ha calculado la covaranza (Gujarat, 2003). Debdo a que sólo los dos prmeros momentos teórcos del proceso estocástco tenen que ser defndos: son constantes y fntos en el tempo. Este concepto tambén se conoce como estaconaro de segundo orden o de covaranza estaconara. A parte de estaconaredad débl, exste el concepto de estaconaro estrcto. Una sere de tempo, se dce que es estrctamente estaconara s para cualquer coleccón fnta de varables aleatoras sobre el proceso se cumple: { } { }. 3.3 Donde la { } es la funcón de dstrbucón conjunta. La defncón anteror nos dce, s selecconamos T varables aleatoras y estas las desplazamos j undades de tempo, la dstrbucón conjunta de las varables aleatoras no camba. Por lo tanto s un proceso es estrctamente estaconaro con un segundo momento fnto, entonces debe de ser varanza estaconara lo contraro no es necesaramente certo. Meda y Varanza Funcón de Autocovaranza y Autocorrelacones Para un proceso estaconaro { }, donde promedo y la varanza se defne como la funcón ; el cual son constantes. Funcón de Covaranza 43

57 La covaranza el cual es una funcón solo s la dferenca del tempo, entonces la covaranza entre y se escrbe como:. 3.4 Funcón de autocorrelacón La funcón de autocorrelacón entre y se escrbe de la sguente manera Donde denotamos a, así que es la Funcón de Autocovaranza (FACV) a dstanca y es la Funcón de Autocorrelacón (ACF). Funcón de autocorrelacón parcal Se defne como la auto-correlacón entre y, el cual se quere saber la relacón entre y después de elmnar la dependenca lneal con otras varables,,., y.la Correlacón parcal se defne como Usualmente, en sere de tempo se refere a la autocorrelacón parcal Consderando el modelo de regresón (3.7), donde la varable dependente de un proceso estaconaro es regresada en rezagos de las varables y, es decr Donde denota la parametro de regresón y es el termno de error con meda cero y no correlaconada con, para. Multplcando esperanza, se consgue lo sguente Entonces de las correlacones (We, 2006) en ambos lados de la ecuacón anteror y tomando la Para, se tene el sguente sstema de ecuacones 44

58 En la forma matrcal ( ) ( ) ( ) Para obtener el valor de se aplca la regla de Cramers, entonces Entonces la autocorrelacón entre y se obtene de los coefcentes de la regresón de sobre las varables rezagadas y. 45

59 Estmacón de la meda, autocovaranza y las autocorrelacones Meda y Varanza muestral El estmador para la meda de un proceso estaconaro es la meda muestral, dado que las observacones en las sere de tempo son Y la varanza muestral es Funcón de auto-covaranza muestral De gual manera la estmacón de la funcón de autocovaranza, de tempo se desarrolla de la sguente manera, de una sere Funcón de autocorrelacón Muestral La estmacón de la funcón de autocorrelacón de Autocorrelacón Muestral (ACF Muestral), es la Funcón de Donde es la es la meda muestral de la sere. S grafcamos contra, a esto es llamado correlograma. S para un proceso estaconaro Gausano, Bartlett (1946) demostró que los rezagos y grande; se aproxmaba a una dstrbucón normal con meda y varanza; donde la varanza de la autocorrelacón muestral es de la forma Y el error estándar es La Funcón de Autocorrelacón (ACF) es de gran utldad para dentfcar el orden de un modelo, en la práctca la ACF muestral,, no necesaramente es gual a 46

60 ACF cero después del retardo. Se espera que llegue a ser tan pequeña en valor absoluto después del rezago. Para una sere de datos de observacones, el lmte esta dado por, donde es el valor aproxmado del desvacón estándar del ACF para cualquer retardo suponendo ndependenca (Montgomery, 2008). Medante el programa estadístco R se tenen funcones para obtener los datos de la Funcón de la Autocovaranza, la Funcón de Autocorrelacón y la Funcón de Autocorrelacón Parcal; FACV, ACF y PACF respectvamente. acf(x, lag.max = NULL, type = c("correlaton", "covarance", "partal") Retomando los datos de la Vscosdad de una sustanca químca (Montgomery, 2008), medante la funcón acf se obtene el gráfco de ACF. react<-read.table(fle="reactvo.txt", header=t);attach(react) wn.graph(wdth=8,heght=4,pontsze=8) ACF<-acf(reactvo,col="blue",man="Funcón de Autocorrelacón Muestral") Cuadro 3. 1 Valores de la funcón de autocorrelacón para h=20 Funcón de Autocorrelacón Muestral Lag Fgura 3. 1 Funcón de autocorrelacón muestral de los datos de Vscosdad Funcón de autocorrelacón parcal muestral La Funcón de Auto-correlacón Parcal muestral se obtene las correlacones estmadas ( ). Para no calcular la determnante con rezagos, Durbn(1960) propone el método recursvo, con y 47

61 Entonces para demostrar bajo la hpótess de que el proceso es rudo blanco, la varanza de se defne como ( ) Y el límte de para probar la hpótess del proceso de rudo blanco, es Operador retardo y dferencacón de una sere Una manera de remover la tendenca de una sere de datos es dferencando. Se aplca el operador dferenca a la sere de datos orgnales y se obtene una nueva sere Donde es el operador dferenca. Otra manera de escrbr el operador dferenca es en térmnos del operador retardo, este defne como Entonces, donde La dferencacón se puede llevar a cabo sucesvamente hasta remover el componente de tendenca. Entonces aplcando dos veces la dferencacón a la sere de datos En general.3.15 lbrary(tsa); lbrary(leaps); lbrary(locft);lbrary(tseres);data(ma22.s) layout(matrx(c(1,1,2,2),2,2,byrow=true)) plot(ma22.s,ylab="datos Smulados",type='o',man="Datos Smulados",col="red") 48

62 Segunda Dferencacón Prmera Dferencacón plot(dff(ma22.s),ylab='prmera Dferencacón',type='o',col="green", man="datos Smulados") ablne(h=0,lty=3) El componente estaconal que se presenta en la sere de datos ma22.s se puede remover aplcando la dferencacón. En la prmera dferencacón se observa que la sere aun no es estaconara el cual es mportante consderar una segunda dferencacón (Fgura 3.2). Datos Smulados Tme Fgura 3. 2 Prmera dferencacón de los datos ma22.s Datos Smulados En esta segunda dferencacón se puede observar que los datos son estaconaros, cumple con el crtero de la meda y la varanza constante en el tempo (Fgura 3.3). plot(dff(ma22.s,dfference=2),ylab='segunda Dferencacón',type='o',col="blue",man="Datos Smulados") ablne(h=0,lty=3) Tme 49

63 Segunda Dferencacón Tme Datos Smulados Fgura 3. 3 Segunda dferencacón a los datos ma22.s Usualmente en la práctca, una o dos dferencacones se requere para remover el componente de tendenca en los datos. Estaconal, o tendenca y estaconal, son los componentes que se presentan en muchas sere de tempo (Montgomery, 2008). S usa el operador dferencacón para remover el componente estaconal, entonces el operador dferenca estaconal se defne para rezagos: Por ejemplo, s tenemos datos mensuales que presentan estaconaldad, entonces usaríamos para, y el operador dferenca estaconal se expresa de la sguente manera Tme En otros casos, cuando los cclos de la sere no tenen la msma magntud; cuando esto ocurre, el prmer paso antes de volver la sere estaconara es una transformacón de Box-Cox(1964). Esto se realza con la fnaldad de estandarzar la varabldad del proceso. La expresón general de estas transformacones esta dado por: { La transformacón con logartmos es quzás la más común para establzar la varanza de un conjunto de datos lo cual corresponde a un valor de. S se 50

64 Log(deaths) tene una sere de tempo cuyo cclo no es homogéneo, lo más recomendable en prmer lugar, transformar los datos con logartmos y posteror aplcar las dferencacones para lograr la estaconaredad de la sere. Consderando los datos mensuales de muertes por accdentes a partr de 1973 a1978 (Brockwell, 2002), antes de aplcar una dferencacón; prmero se transforma en logartmo para establzar la varanza. deaths<-read.table(fle="deaths.txt", header=t);attach(deaths) sere_muerte<-ts(as.matrx(cbnd(deaths)),start=c(1973,12),frequency=12) plot(log(sere_muerte),xlab="meses",ylab="log(deaths)",type="o",col="blue ",man="logartmo a los datos mensuales de muertes por accdentes") Logartmo a los datos mensuales de muertes por accdentes Meses Fgura 3. 4 Transformacón de los datos DEATHS medante el logartmo Cuando se presentan a ambos, componente estaconal y de tendenca, se puede usar la dferencacón una después de otra para elmnar estos efectos. Prmero, para remover el componente estaconal usamos el operador dferenca estaconal y después dferencamos a uno o más tempo usando el operador de dferencacón regular para remover el componente de tendenca. Algunos autores recomendan recurrr a alguna transformacón de la sere de tempo antes de ser estaconara, el más común es la de logartmos; con la 51

65 Dferenca a dstanca fnaldad de establzar la varanza (Fgura 3.4). S la sere de tempo tene perodo de cclo 12 (datos mensuales) con una tendenca lneal, entonces hay que dferencar a dstanca 12; esto con la fnaldad de elmnar el componente estaconal (Fgura 3.5). plot(dff(log(sere_muerte),12),xlab="meses",ylab="dferenca a dstanca 12",type="o",col="red",man="Dferencacón a dstanca 12") Dferencacón a dstanca Meses Fgura 3. 5 Dferencacón a dstanca 12 a los datos log(deaths) para elmnar el componente estaconal. Posterormente para elmnar el componente de tendenca, dferencar a uno o más tempo. Para el este ejemplo, se dferenca a dstanca 1 para elmnar el componente de tendenca (Fgura 3.6), en la gráfca se observa que la sere de datos es estaconara. plot(dff(dff(log(sere_muerte),12)),xlab="meses",ylab="dferenca dstanca 1",type="o",col="blue",man="Dferencacón a dstanca 1") ablne(h=0,lty=3) a 52

66 Dferenca a dstanca Dferencacón a dstanca Meses Fgura 3. 6 Dferencacón a dstanca 1 a los datos componente de tendenca. para elmnar el Procesos de Rudo Blanco Sea { } es un proceso de rudo blanco s este es una secuenca de varables aleatoras no correlaconadas de una dstrbucón fja, con meda cero y varanza constante. Es decr, a) que usualmente es cero b) c) para toda. Por defncón, nmedatamente el proceso de rudo blanco { } es estaconaro s: La funcón de autocovaranza (We, 2006) { La funcón de autocorrelacón { 3.19 La funcón de autocorrelacón parcal {

67 S a la defncón anteror se le agrega la condcón, de que la varable se dstrbuye normal; entonces la condcón c) de no correlacón mplca ndependenca. Esto sgnfca, que las tres condcones se puede sntetzarse de la sguente manera { } S la ecuacón c) se cumple, se supone una fuerte ndependenca; entonces se dce que el proceso es un rudo blanco ndependente. Se tene en cuenta que una dstrbucón normal de varables aleatoras, no correlaconadas es equvalente a ndependenca (Ruppert, 2011) Camnata aleatora Es muy común seres de tempo no estaconara, tal es el caso de una camnata aleatora. Las accones o las tasas de cambos sguen una camnata aleatora, estas pueden ser sn varacones o con varacones (está presente una constante) (Gujarat, 2003) La sere dferencada está representado por De otra forma se representa.3.22 Donde el parámetro juega dferentes papeles cuando y. Cuando, el proceso orgnal es estaconaro, se recalca que está relaconada con la meda del proceso; es decr,. Cuando, es llamada el térmno de tendenca determnístca, esta se puede omtr del modelo; a menos que realmente se neceste (We, 2006). Entonces cuando se tene, (Random Walk)., el modelo se le conoce como Camnata Aleatora De otra forma 54

68 Este modelo ha sdo amplamente utlzado para descrbr el comportamento de la sere de un stock de captal. Consderando una modfcacón a la ecuacón anteror con una constante dferente de cero. De otra forma Por lo tanto, está claro que contene una tendenca determnstca con pendente o dervada cuando. En un proceso con usualmente se le llama camnata aleatora con dervada. Dado que es el nvel medo de la sere en el tempo En esta ecuacón el térmno está nfluencado por la perturbacón estocástca en el tempo a través del térmno y por el componente determnsta a través de la pendente, entonces se tene un modelo con una sola tendenca estocástca. Un modelo de camnata aleatora es un ejemplo de lo que se conoce como proceso de raíz untara, ya que s la ecuacón tene una constante con el valor de uno S la constante, se tene a lo que se le conoce como problema de raíz untara, es decr, se tene una stuacón de no estaconaredad. Por lo tanto, los térmnos de no estaconaredad, camnata aleatora y raíz untara son snónmos (Gujarat, 2003). lbrary(tsa); data(rwalk); model1=lm(rwalk~tme(rwalk)) plot(rwalk,type='o',ylab='random walk',xlab='tempo',man='smulacón de una camnata aleatora') ablne(model1) 55

69 Pulgadas Random Walk Smulacón de una Camnata Aleatora Tempo Fgura 3. 7 Smulacón de una Camnata Aleatora y con la línea de tendenca sobre el tempo Ejemplos de Seres de Tempo a. Cantdad de Lluva anual regstrada en Los Ángeles Calforna de Se muestra el gráfco de seres de tempo de la cantdad de lluva anual regstrado, en los Ángeles Calforna durante más de 100 años (Cryer, 2008). lbrary(tsa)# esta lbrería contene los datos de lluva anual data(laran) wn.graph(wdth=10, heght=4,pontsze=8); data(laran); plot(laran,ylab="pulgadas",xlab="años",type="o",col="red",man="lluva Anual, Los Ángeles Calforna") Lluva Anual, Los Angeles Calforna Años Fgura 3. 8 Sere de tempo sobre la lluva anual, Ángeles Calforna. 56

70 venta de automóvles 3e+04 5e+04 7e+04 9e+04 En la Fgura 3.8 muestra una consderable varacón en la cantdad de lluva en los últmos años, para el año de 1884 se presentó una mayor precptacón en Los Ángeles; mentras que para el año de 1953 fue la precptacón más baja, consderándose como el año más seco (Cryer, 2008). b. Venta de automóvles al públco mensual. El sguente ejemplo se refere a las undades de automóvles venddos en Méxco mensual a partr de 2000 a 2012, nformacón del Banco de Informacón Económca (INEGI) de la Asocacón Mexcana de la Industra Automotrz (AMIA). En la sere hstórca de la venta de automóvles se observa un patrón cíclco en cada año. autos1<-read.table(fle="autos.txt", header=t);attach(autos1) sere_autos<-ts(as.matrx(cbnd(autos)),start=c(2000,1),frequency=12) wn.graph(wdth=10, heght=4,pontsze=8) plot(sere_autos,xlab="meses",ylab="venta de automóvles",type="o",col="blue",man="venta al públco de automóvles en Mexco en ",pch=16) Venta al públco de automóvles en Mexco en Meses Fgura 3. 9 Seres de tempo de la venta de automóvles en Méxco mensual. c. Nvel del lago Huron de 1875 a 1972 (Brockwell, 2002). Se presenta el gráfco de seres de tempo sobre el nvel del lago Huron en pe, al parecer el nvel del lago Huron tende a dsmnur con forme el tempo. El nvel máxmo se regstra en el año de 1876 con pes y el nvel mínmo se regstró en 1964 con 5.96 pes, los datos sguen una tendenca lneal descendente con forme el tempo. setwd("c:/users/german/desktop/tesis")#el drectoro en donde se encuentra el archvo dat<- read.table(fle="lakehuron.txt",header=t);attach(dat) 57

71 mles de toneladas Nvel del lago en pe LakeHuron<-ts(LAKE,start=c(1875,1),frequency=1)#comvertr los datos a seres de tempo wn.graph(wdth=10,heght=4,pontsze=8) plot(lakehuron,type="o",col="blue",xlab="años",ylab="nvel del lago en pe", man="nvel del lago Huron ") Nvel del lago Huron años Fgura Sere de tempo sobre el nvel del lago Huron. d. Produccón de maíz en Méxco para los años 1960 a 2009 (INEGI). En la fgura 3.11 se presenta la produccón anual de maíz de los años 1960 a Se observa en la sere que la produccón va ascendendo en el tempo, se regstra una produccón mínma de 5420 ml toneladas en el año de 1960 y la produccón máxma de ml toneladas para el año (Anexo 9.8). dat1<- read.table(fle="prod.maz.txt", header=t) attach(dat1);lbrary(tsa);prod.maz<-ts(maz,start=c(1960,1),frequency=1) wn.graph(wdth=10, heght=4,pontsze=8) plot(prod.maz,type="o",ylab="mles de toneladas",xlab="años de produccón",man="produccón de maíz a nvel naconal",col="blue") produccón de maíz a nvel naconal años de produccón Fgura Sere de tempo sobre la produccón de maíz en Méxco ( ). 58

72 Consumo de electrcdad e. Consumo doméstco de electrcdad mensual para Méxco para los años de 2000 a 2012 (INEGI, 2012). Se regstra el consumo doméstco de electrcdad en Méxco para los años de 2000 a 2012, en esta sere se tene el componente estaconal y de tendenca; ya que los datos son cíclcos y conforme avanza en el tempo el consumo aumenta. elect<-read.table(fle="electrcdad.txt",header=t);attach(elect) sere_electrcdad<ts(as.matrx(cbnd(electrcdad)),start=c(2000,12),frequency=12) plot(sere_electrcdad,xlab="meses",ylab="consumo de electrcdad",type="o",col="blue",man="consumo doméstco de electrcdad en Mexco en ",pch=20) consumo doméstco de electrcdad en Mexco en Meses Fgura Sere de datos con comportamento cíclco del consumo doméstco de electrcdad IV. Modelos cláscos de seres de tempo Modelos autoregresvos AR(p) Los modelos más comunes en sere de tempo son los modelos autorregresvos. Estos modelos se caracterzan por tener una forma funconal donde el valor de una varable a tempo depende de los valores pasados de la msma varable a tempo. Es decr, s { } es un proceso estaconaro, el valor que toma la varable depende de y. Modelos autorregresvo de orden p, Un proceso estaconaro { }, sgue un modelo manera: s se expresa de la sguente 59

73 .3.25 Donde es estaconaro, son constantes ( ). Se asume que es rudo blanco con meda cero y varanza, es decr. La meda de es cero, s fuera dferente de cero, se reemplaza por. Se re-escrbe Donde Usando el operador B, el modelo puede re-escrbrse como ( ) De esta manera, autoregresvo. se le denomna polnomo La expresón más general de un modelo es 3.27, el cual es un proceso con meda dferente de cero. Sn embargo se asume meda cero, ya que al mponer esta condcón, no se perde generaldad en el estudo de cualquer modelo. Causaldad del proceso Se puede demostrar que el proceso es causal s las solucones de del polnomo, tene por módulo para. ( ) Para todo y elemento del conjunto de los números complejos. La defncón establece que toda solucón del polnomo auto-regresvo debe ser dferente de cero y debe tener módulo mayor a uno. La regón determnada por tal que, se le denomna crculo untaro. El prmer orden de un proceso autorregresvo, 60

74 Un proceso estocástco { } sgue un proceso, donde el valor actual del perodo { } es explcado por el anteror, una constante, y un error (Pfaff, 2008) Donde es un proceso rudo blanco con meda 0 y varanza, En este apartado, sólo se consdera de caso de covaranza estaconara. Alternatvamente, aplcando el operador de rezago B, a la ecuacón 3.29 se escrbe como Una expresón del modelo como proceso lneal, con susttucones recursvas de en la ecuacón 3.30 obtenemos (Shumway, 2008): [ ] [ ] Reptendo este proceso un número nfnto de veces ( ) e mponendo que ; es decr, el modelo es estaconaro s y solo s. Entonces podemos representar el proceso como un proceso lneal: As, la expresón 3.32 se puede expresar de la sguente manera.3.33 Donde y 61

75 Debemos notar que las susttucones recursvas se expresó al modelo como proceso lneal donde y dado que debemos asegurar que la sere. Entonces, la restrccón es que el modelo es estaconaro s y solo s (Brockwell, 2002). Lo anteror es el concepto de causaldad, el cual se puede representar como un proceso lneal y estaconaro. Entonces el polnomo autorregresvo es, gualando a cero, resulta y despejando a tenemos. S la condcón es que, entonces ; así que el proceso es estaconaro y es la únca solucón estaconara al proceso estocástco dado por la ecuacón. Funcón de autocorrelacón (ACF) Entonces del proceso lneal expresado para un proceso la funcón de auto-covaranza., podemos encontrar Para el proceso (Shumway, 2011) defndo en la ecuacón 3.29, es estaconaro con meda Y la funcón de auto-covaranza se defne como [( ) ( )] [ ].3.35 Recalcando que (ACF) para un proceso, entonces para la Funcón de Auto-correlacón se defne de la sguente manera

76 ACF ACF La condcón es que, entonces la Funcón de Auto-Correlacón converge a cero de manera decrecente o de manera alternante con los valores que tomen. Dependendo del valor de, la ACF puede mostrar dferentes formas; s, la ACF es decrecente y la ACF es alternante. y1<-arma.sm(n=100,lst(ar=0.8),nnov=rnorm(100)) y2<-arma.sm(n=100,lst(ar=-0.8),nnov=rnorm(100)) op<-par(no.readonly=true) layout(matrx(c(1,1,2,2),2,2,byrow=true)) plot.ts(y,ylab=' ', type="o",col="blue") acf(y1,man='funcón de Autocorrelacón AR(1):ph=0.8',ylab='ACF',xlab="h",ylm=c(-0.5,1),c.col= "black",col="blue") acf(y2,man='funcón de Autocorrelacón AR(1):ph=- 0.8',ylab='ACF',xlab="h",ylm=c(-1,1),c.col= "black",col="blue") par(op) En la Fgura 3.13 se observa que la Funcón de Auto-correlacón convergen a cero conforme se ncremente. Dependendo del valor de, la convergenca haca cero puede ser más o menos rápdo; a mayor valor de, menos rápdo convergerá a cero los valores de ACF. Funcón de Autocorrelacón AR(1):ph= h Fgura Funcón Funcón de Autocorrelacón de Autocorrelacón de un proceso AR(1):ph=-0.8 con una Unversdad Autónoma Chapngo, Dvsón de Cencas hforestales 63

77 ACF h Funcón de Autocorrelacón AR(1):ph= h Fgura Funcón de Auto-Correlacón de un proceso con una Las propedades fundamentales del proceso son los sguentes: Modelo Funcón de Auto-covaranza Funcón de Auto-Correlacón Condcón de Estaconaredad Funcón de Auto-Correlacón Parcal La funcón de autocorrelacón parcal (PACF) para un proceso la sguente manera (We, 2006), se defne de { Entonces, el PACF puede ser postvo o negatvo para el rezago dependendo el valor de. El segundo orden de un proceso autorregresvo, El modelo se expresa de la sguente manera Donde es rudo blanco, es decr, el modelo con el operador B se expresa de la sguente manera 64

78 Con Entonces, aplcando el operador 2008) en ambos lados, se obtene (Montgomery, Donde Entonces, de la ecuacón anteror el, operador gualando a uno, se obtene pasándolo al lado derecho e Y en térmnos de los parámetros y O de otra forma ( ) entonces de la ecuacón anteror, se obtene los sguentes valores, para toda 65

79 De esta manera, debe de notarse que satsface el segundo orden de la ecuacón lneal y que puede ser expresado como una solucón en térmnos de dos raíces, y. Causaldad del proceso Entonces el modelo la sguente relacón. es causal o estaconaro, s los coefcentes satsfacen Para demostrar lo anteror, es necesaro resolver la ecuacón del polnomo auotregresvo garantzando que la solucón sea un proceso causal; es decr. Entonces, la ecuacón a resolver es: Es decr,.3.38 El cual se debe de garantzar que, Entonces las raíces obtendas son Y la condcón es que, mplca que para. Se tene la sguente condcón necesara para que el modelo sea estaconaro, s las raíces son reales o complejas 66

80 { Para las raíces real, se necesta que, esto mplca que O equvalente { Para la raíces compleja, se necesta que y. En termno de los valores de los parámetros, la condcón de estaconaredad para el modelo esta dado por la regón trangular (Fgura 3.15) { Funcón auto-correlacón Fgura Regón de estaconaredad del modelo AR(2) Para el cálculo de la funcón de Auto-Covaranza y Auto-Correlacón para un modelo autorregresvo de orden 2,, se emplea el método de Yule-Walker. La funcón de autocovaranza está dado por la sguente ecuacón 67

81 { Así que para Y para, para 3.40 De la ecuacón 3.40, que es llamado ecuacón de Yule-Walker para y, se puede obtener la funcón de autocorrelacón (ACF)., para.3.41 De la ecuacón 3.41, se resuelve para obtener las autocorrelacones As que para manera la funcón de autocorrelacón se expresa de la sguente, Dependendo de los valores de y la funcón de auto-correlacón puede adqurr dferentes formas, como se muestra en la Fgura seres<-rnorm(1000) y4.st<-flter(seres,flter=c(0.8,0.5),method='recursve' ) y5.st<-flter(seres,flter=c(-0.8,0.5),method='recursve' ) y6.st<-flter(seres,flter=c(0.8,-0.5),method='recursve' ) y7.st<-flter(seres,flter=c(-0.8,-0.5),method='recursve' ) wn.graph(wdth=8, heght=5,pontsze=10) par(mfcol=c(2,2)) acf(y4.st, lag.ma=15,xlab="h",ma="modelo AR(2) con ph1=0.8, ph2=0.5") acf(y5.st, lag.ma=15,xlab="h",ma="modelo AR(2) con ph1=-0.8, ph2=0.5") acf(y6.st, lag.ma=15,xlab="h",ma="modelo AR(2) con ph1=0.8, ph2=-0.5") acf(y7.st, lag.ma=15,xlab="h",ma="modelo AR(2) con ph1=-0.8, ph2=- 0.5") 68

82 ACF ACF ACF ACF modelo AR(2) con ph1=0.8, ph2=0.5 modelo AR(2) con ph1=0.8, ph2= h h modelo AR(2) con ph1=-0.8, ph2=0.5 modelo AR(2) con ph1=-0.8, ph2= h h Fgura Funcón de Autocorrelacón para dferentes valores de En la gráfca se observa las dferentes formas de la Funcón de Auto-Correlacón, para valores negatvos y postvos de y. Como se podrá observar, la dentfcacón de un modelo autoregresvo de orden 2 es un poco complcado usando la Funcón de Auto-Correlacón (ACF). Funcón de Auto-Correlacón Parcal (PACF) Partendo para, entonces tenemos 69

83 Montgomery (2008) presenta un demostracón más detallado, ya que la últma columna del numerador es una combnacón lneal de las prmeras dos columnas; de gual manera se puede demostrar que para. Medante correlogramas se muestra la Funcón autocorrelacón Parcal (PACF) de un proceso autorregresvo,, para dferentes valores de. par(mfcol=c(2,2)) pacf(y4.st, lag.ma=15,xlab="h",ma="modelo AR(2) con ph1=0.8, ph2=0.5") pacf(y5.st, lag.ma=15,xlab="h",ma="modelo AR(2) con ph1=-0.8, ph2=0.5") pacf(y6.st, lag.ma=15,xlab="h",ma="modelo AR(2) con ph1=0.8, ph2=- 0.5") pacf(y7.st, lag.ma=15,xlab="h",ma="modelo AR(2) con ph1=-0.8, ph2=- 0.5") 70

84 Partal ACF Partal ACF Partal ACF Partal ACF modelo AR(2) con ph1=0.8, ph2=0.5 modelo AR(2) con ph1=0.8, ph2= h h modelo AR(2) con ph1=-0.8, ph2=0.5 modelo AR(2) con ph1=-0.8, ph2= h h Fgura Funcón de Autocorrelacón Parcal para dferentes valores de Ph Modelos de promedos móvles Defncón del proceso El proceso de promedo móvl se abreva como MA(q), donde el parámetro q se refere al últmo rezago del proceso Donde { } es un proceso de rudo blanco con las propedades ya defndas, es decr Con el operador rezago B, el proceso puede escrbrse como: Donde ( ) y se denomna polnomo del promedo móvl. De gual manera que un proceso AR(p), el proceso AM(p) tene su polnomo de raíz característca

85 Dado que el modelo es un proceso lneal, podemos caracterzar la representacón como, para y para. Entonces Funcón de auto-covaranza Entonces, la funcón de auto-covaranza se defne 3.47 Y varando tenemos ( ) Y para para Funcón de autocorrelacón Para obtener la funcón de autocorrelacón aplcando la defncón de la funcón de autocovaranza, obtenemos 3.49 Y para para 72

86 Funcón de auto-covaranza muestral S { } es rudo blanco, entonces el valor esperado de un proceso MA(q) se defne como (Montgomery, 2008): ( ) El momento de segundo orden esta dado como: [ ] [ ] Asumendo que { } no está correlaconada con nnguna otra, entonces smplfcarse como: puede ( ) Funcón de autocorrelacón muestral La varanza de de esta dado por la ecuacón 3.50, y la auto-covaranza por la ecuacón 3.51a para retardos. Entonces la funcón de autocorrelacón para un proceso MA(q) es ( ) Es decr, en la practca un proceso MA(q) puede ser detectado a las prmeras q autocorrelacón (ACF) sgnfcantes o medante autocorrelacón parcal (PACF). Para una sere de datos de T observacones, el límte está dado por, donde es el valor aproxmado de la desvacón estándar del ACF para cualquer retardo suponendo ndependenca. Para un tamaño de muestra T, una banda del 95% de sgnfcanca puede ser calculado como: ( ) Donde se refere j-orden de la autocorrelacón. Se puede examnar la condcón de establdad para un proceso MA( ) fnto. 73

87 Se denota los coefcentes para un proceso fnto como en lugar de, para el caso de un proceso MA(q). Se puede demostrar que un proceso fnto tene covaranza estaconara s la secuencas de los coefcentes al cuadrado, ó en valor absoluto Proceso de Promedo Móvl de orden uno, MA(1) El modelo MA(1), está dado por, { } La auto-covaranza se expresa como: { La Funcón de Autocorrelacón se defne como { Para la valdez del modelo la condcón es que y por lo tanto es la condcón de nvertbldad. Por ejemplo para un modelo MA(1), las formas de las Funcones de Autocorrelacones camban de acuerdo a los dferentes valores de. Además las Funcones de Autocorrelacón (ACF y PACF) a smple vsta se observa que la meda y la varanza se mantenen estables. y<-arma.sm(n=100,lst(ma=0.8),nnov=rnorm(100))# para theta=0.8 y1<-arma.sm(n=100,lst(ma=-0.8),nnov=rnorm(100))#para theta=-0.8 par(mfcol=c(2,1)) acf(y,lag.max=15,xlab="h",man='modelo MA(1) con theta=0.8',ylab='acf',ylm=c(-1,1)) acf(y1,lag.max=15,xlab="h",man='modelo MA(1) con theta=- 0.8',ylab='ACF',ylm=c(-1,1)) 74

88 ACF ACF modelo MA(1) con theta= h modelo MA(1) con theta= h Fgura Funcón de autocorrelacón de un proceso MA(1) para dferentes valores de Entonces, se observa en la Fgura 3.18 que dado una Funcón de Autocorrelacón ( ) del modelo MA(1) para sobresale de la banda, el cual esto nos permte dentfcar el orden del modelo. De gual manera para el modelo MA(1) las Funcones de Autocorrelacón Parcal (PACF), sus formas camban de acuerdo a los valores de. par(mfcol=c(2,1)) pacf(y,lag.max=15,xlab="h",man='modelo MA(1) con theta=0.8',ylab='pacf') pacf(y1,lag.max=15,xlab="h",man='modelo MA(1) con theta=- 0.8',ylab='PACF') 75

89 PACF PACF modelo MA(1) con theta= h modelo MA(1) con theta= h Fgura Funcón de autocorrelacón Parcal de un proceso MA(1) para dstntos valores de Proceso de Promedo Móvl de orden dos, MA(2) Para un proceso de Promeda Móvl de orden 2, MA(2), que está dado por la ecuacón Entonces, es causal y estaconaros s, donde { }

90 Las funcones de Autocovaranza Las Funcones de Autocorrelacón Dependendo de los valores de los parámetros y, la gráfca de la funcón de autocorrelacón puede adqurr dferentes formas. Las sguentes fguras muestran la varabldad de la funcón de autocorrelacón para dferentes valores de los parámetros. par(mfcol=c(2,2)) ma1<-arma.sm(n=100,lst(ma=c(0.8,0.5)),nnov=rnorm(100)) ma2<-arma.sm(n=100,lst(ma=c(-0.8,0.5)),nnov=rnorm(100)) ma3<-arma.sm(n=100,lst(ma=c(0.8,-0.5)),nnov=rnorm(100)) ma4<-arma.sm(n=100,lst(ma=c(-0.8,-0.5)),nnov=rnorm(100)) acf(ma1,xlab="h",ylab="acf",man="modelo AM(2) con theta1=0.8, theta2=0.5") acf(ma2,xlab="h",ylab="acf",ylm=c(-1,1),man="modelo AM(2) con theta1=- 0.8, theta2=0.5") acf(ma3,xlab="h",ylab="acf",ylm=c(-1,1),man="modelo AM(2) con theta1=0.8, theta2=-0.5") acf(ma4,xlab="h",ylab="acf",ylm=c(-1,1),man="modelo AM(2) con theta1=- 0.8, theta2=-0.5") En la Fgura 3.20 se muestran el comportamento de la Funcón de Autocorrelacón para, se observa que para los valores de sobresalen de la banda y para las ACF son cero; además se observa que están dentro del límte. 77

91 ACF ACF ACF ACF modelo AM(2) con theta1=0.8, theta2=0.5 modelo AM(2) con theta1=0.8, theta2= h h modelo AM(2) con theta1=-0.8, theta2=0.5 modelo AM(2) con theta1=-0.8, theta2= h h Fgura Funcón de autocorrelacón de un proceso MA(2) para dstntos valores de y De gual manera las Funcones de autocorrelacón Parcal (PACF) se puede demostrar, que para valores dstntos de theta camban su forma. Para el gráfco de la PACF en el programa R se utlza la funcón pacf() Modelos mxtos (ARMA) Los sguentes puntos deben de tenerse en cuenta para un proceso ARMA(p,q) (Cowpertwat, 2009) a) El proceso es estaconaro cuando es menor o gual a la undad en valor absoluto. b) El proceso es nvertble cuando es menor o gual la undad en valor absoluto. c) El modelo AR(p) en el caso especal es ARMA(p,0) 78

92 d) El modelo MA(q) en el caso especal es ARMA(0,q) e) Cuando se ajusta los datos, un modelo ARMA a menudo tendrá los parámetros más efcentes que un sólo modelo AR o MA. Defncón del proceso En este apartado los dos proceso de seres de tempo AR(p) y MA(q) se unen para formar un modelo mxto, Autoregresvo de promeda móvl ARMA(p,q). Una sere { } es un proceso autoregresvo de orden p, AR(p), s (Pfaff, 2008) Una sere { } es un proceso de promedo móvl de orden q, MA(q), 3.56 Donde es rudo blanco y, son los parámetros del proceso AR (p) y MA(q) respectvamente. Entonces sgue un proceso ARMA de orden (p,q) y se defne como; Donde { } es un rudo blanco y { } es estaconara es decr que la raíz del polnomo característco se stúe fuera del círculo untaro. Tambén la ecuacón 3.57 puede ser representada en térmnos del operador dstanca B y redefndo como un polnomo (Montgomery, 2008): Donde y es el polnomo de orden y respectvamente, el cual se expresa de la sguente manera (Chatfeld, 2006) Entonces con el operador rezago, la ecuacón 3.58 puede transformarse a:

93 Proceso estaconaro Un proceso es estaconaro s el proceso exste y tene únca solucón, s y solo s:, para todo Además es causal s exste la constante tal que y bajo estas condcones el modelo (Montgomery, 2008), para toda se puede representar como proceso nfnto de Donde, y el coefcente de puede ser encontrado de: {, y La nvertbldad del proceso La nvertbldad de un modelo se relacona con los componentes de un proceso y se puede comprobar a través de las raíces del polnomo:, para todo.3.61 Entonces es nvertble s exste la constante tal que y bajo estas condcones el modelo se puede representar como proceso nfnto de (Montgomery, 2008), para toda Done, y el coefcente puede ser encontrado de {, En la práctca es dfícl detectar el orden de un proceso AR(p) o MA(q) medante las Funcones de Autocorrelacón (ACF, PACF). Cuadro 3. 2 Resumen teórca de ACF y PACF de un proceso estaconaro Modelo ACF PACF Decrece de forma exponencal y/o snodal prmeros coefcentes no nulos y el resto ceros prmeros coefcentes no nulos Decrece de forma exponencal 80

94 y el resto ceros Decrece de forma exponencal y/o snodal desde y/o snodal Decrece de forma exponencal y/o snodal desde Es por eso que se recurre a una segunda herramenta para determnar el orden apropado de un modelo ARMA(p,q) comparado con las Funcones de Autocorrelacón (ACF, PACF), específcamente se trata del crtero de nformacón Akake (1981), Schwarz (1978), Hannan and Qunn (1979) el cual se defne como (KIRCHGÄSSNER, 2007).. Donde es la varanza estmada del proceso ARMA(p,q) y (p,q) es el orden de los retrasos que mnmza el crtero de nformacón selecconado. Modelo Proceso Donde { }, y ; donde el proceso es rudo blanco, nvertble y estaconaro. Aplcando el operador B, el modelo puede escrbrse como: Pare encontrar la funcón de autocovaranza del modelo, usamos de nuevo el proceso lneal Entonces se establece que Para 81

95 unemploy rate [ ] Para { } De manera general, la funcón de covaranza se defne de la sguente manera La Funcón de Autocorrelacón se expresa de la sguente manera Retomando los datos de tasa de desempleo (unemploy rate) de la lbrería urca (Pfaff, 2008) se puede estmar un modelo ARMA(1,1). lbrary(urca) ; data(npext) y <-ts(na.omt(npext$unemploy),start=1909,end=1988,frequency=1) plot(y,ylab="unemploy rate",xlab="tme",type="o",col="blue") tme Fgura Datos de la Tasa de desempleo a partr de 1909 a

96 Partal ACF ACF Y las Funcones de autocorrelacón (ACF, PACF) se pueden obtener de las sguentes funcones del programa R layout(matrx(c(1,1,2,2),2,2,byrow=true)) acf(y,man="autocorrelacón");pacf(y,man="autocorrelacón Parcal") Autocorrelacón Lag Autocorrelacón Parcal Lag Fgura Funcón de Autocorrelacón y Autocorrelacón Parcal para datos de tasa de de desempleo. Para selecconar entre los modelos alternatvos, habtualmente se utlzan los crteros de nformacón como es el Akake (1974) y Bayesana, AIC y BIC respectvamente Predccón de procesos estaconaros Se quere predecr los estmadores de, para, de una sere estaconara con meda y funcón de autocovaranza, en térmnos de los valores { } (Brockwell, 2002). El objetvo prncpal es: 83

97 Encontrar el mejor predctor lneal El Error Cuadrado Medo (MSE), es el crtero que defne al mejor predctor lneal. El mejor predctor lneal se denota como El error cuadrado medo (MSE) El objetvo es encontrar los valores { }, tales sea mínmo. Por lo tanto, se tene al menos un valor de { } que mnmza y satsface la ecuacón Dervando para cada uno de los valores { tene: }e gualando a cero, se [ ] Así, de manera sucesva hasta dervar con respecto a [ ] Las dervadas anterores se gualan a cero dando orgen al sstema de ecuacones 84

98 Donde [ ] [ ] [ ] S exste, entonces se puede resolver para y el mejor predctor lneal esta dado por ( ) Desarrollando la ecuacón anteror se obtene el mejor predctor lneal (Flores, 2008) A partr del predctor línea, se obtene el Error Cuadrado Medo [ ] [ ] [ ] [ ] [ ] En resumen el Error Cuadrado Medo se defne como 85

99 [ ] Estmacón Se consderan cuatros técncas para la estmacón prelmnar de los parámetros, y de las observacones del proceso causal, defndo por con. El procedmento de Yule-Walker y Burg se aplca para encontrar modelos autorregresvos puros. Los algortmos de Innovacon y Hannan-Rssanen se aplca para encontrar modelos de promedo móvl y para la estmacón prelmnar de los parámetros. Para modelo mxtos (p>0 y q>0) el algortmo de Hannan- Rssanen puede ser más extoso para encontrar modelos causales Estmacón Prelmnar Estmacón de Yule-Walker Consderando el proceso causal, de la propedad El método de Yule-Walker consste en encontrar los valores de tales que las ecuacones cumplan con las autocovaranzas, multplcando ambos lados la ecuacón 3.70 por para y tomando valor esperado, se obtene las ecuacones de Yule-Walker (Brockwell, 2002): Donde [ ] [ ] S en 3.71 se reemplaza las covaranzas por las covaranzas muestrales, se obtene:

100 S, entonces es no sngular para Entonces la ecuacón de Yule-Walker muestral se escrbe como:.3.75 [ ] Donde ( ) Con ya defndo, se puede demostrar que para. Entonces el modelo ajustado es causal, con.. Entonces, para muestras grandes el estmador de Yule-Walker de los coefcentes de de un proceso se defne como 3.77 Entonces el método de Yule-Walker para un proceso como:, en general se defne Donde, y [ ] Orden de seleccón Para grande, la regón de confanza para los coefcentes está dado por denota el cuantl ( ) de la dstrbucón normal estándar y es la elemento de la dagonal de la matrz de covaranza En la práctca no conocemos el orden del modelo, suponendo que el modelo es el adecuado, resta encontrar el orden del modelo, es decr el valor de. Las técncas para encontrar el orden del modelo pueden ser medante ntervalos de confanza para los componentes del modelo, mnmzando el AICC 87

101 ACF PACF y las Funcones de Autocorrelacón muestral (ACF, PACF), tal que para. Consderando los datos del nvel del Lago Huron de la seccón 3.2.7, con la gráfca de los datos a partr de 1875 a 1972 ({ }. Antes de encontrar un modelo autorregresvo, es mportante remover todo componente de tendenca. En la grafca de la seccón 3.2.7, ACF y PACF de la Fgura 3.23 se muestra un patrón de no estaconaredad. dat<-read.table(fle="lakehuron.txt", header=t);attach(dat) LakeHuron<-ts(LAKE,start=c(1875,1),frequency=1) par(mfcol=c(1,2)) acf(lakehuron,xlab="h",ylab="acf",man="funcón de Autocorrelacón") pacf(lakehuron, xlab="h",ylab="pacf",man="funcón de Autocorrelacón Parcal") Funcón de Autocorrelacón Funcón de Autocorrelacón Parcal h h Fgura Funcón de autocorrelacón Muestral y Parcal para los datos "LakeHuron". En la PACF sugere encontrar un modelo AR(2) por la meda corregda, esto mplca que prmero dferencamos la sere orgnal a dstanca 1. Posterormente, de la sere restarle la meda de la sere orgnal y a partr de esta sere estmamos el modelo AR(2). 88

102 ACF PACF Dferencacón a dstanca plot(dff(lakehuron),type="o",col="blue",xlab="años",ylab="dferencacón a dstanca 1", man="nvel del lago Huron ") Nvel del lago Huron años Fgura Prmera dferencacón de los datos "LakeHuron" Consderando las Funcones de Autocorrelacón (ACF y PACF), observa que el mejor modelo que se ajusta los datos es un. Funcón de Autocorrelacón Funcón de Autocorrelacón Parcal h h Fgura Funcón de autocorrelacón a los datos dferencados 89

103 La PACF de la Fgura 3.25 sugere que se ajuste un modelo, ya que para la segunda autocorrelacón sobresalen de los límtes, es decr estadístcamente es dferente de cero. Retomando el ejemplo de Brockwell(2002), para los datos de Lago Huron realzar estmacón prelmnar con modelo AR(2). El programa R obtene la estmacón prelmnar de Yule-Walker con la funcón: ar.yw(x, ac = TRUE, order.max = NULL, na.acton = na.fal, demean = TRUE, seres,...) ar(x, ac = TRUE, order.max = NULL,method=c("yule-walker", "burg", "ols", "mle", "yw"),na.acton, seres,...). Entonces utlzando la estmacón prelmnar de Yule-Walker a los datos LakeHuron, se obtene el valor de los parámetros ar.yw(lakehuron,order=2,ac=t) Cuadro 3. 3 Parámetros estmados con el algortmo de Yule-Walker Call: ar.yw.default(x = LakeHuron, ac = T, order.max = 2) Coeffcents: Order selected 2 sgma^2 estmated as Así, el modelo AR(2) en funcón de la sere orgnal es, Para obtener el ntervalo de confanza, tambén se debe de encontrar las autocovaranzas muestral para las varables { }. Wt<-dff(LakeHuron,1,1) covaranza<-acf(wt,type="covarance",lag=10) Cuadro 3. 4 Valores de la covaranza de la sere dferencada LakeHuron para h= El ntervalo de confanza al 95% para los coefcentes estmados son: 90

104 Algortmo de Burg El algortmo de Burg estma la Funcón de Autocorrelacón parcal { } mnmzando la suma la suma de cuadrados de los predctores un paso adelante y un paso atrás con respecto a los coefcentes. Dada las observacones { entonces se defne como: } de una sere de tempo con meda cero, El estmador de usando el algortmo de Burg,, se encuentra mnmzando la sguente expresón: [ ] Dado los valores numércos correspondentes para, y, el cual pueden sustturse en las ecuacones 3.79 y 3.80 y con se mnmza [ ] Con respecto para obtener la estmador de Burg y los valores correspondentes de, y. El proceso puede contnuar hasta obtener el estmador y los correspondentes valores mínmos,. La estmacón de los coefcentes,, en el mejor predctor lneal

105 Son encontrado susttuyendo los estmadores de,, por con las ecuacones recursvas. Entonces para el cálculo de los estmadores de y se descrbe en seguda: ( ) [( ) ] [ ] Para muestras grandes, la dstrbucón de los coefcentes estmados por el algortmo de Burg, es la msma que los estmadores de Yule-Walker. ar.burg(x, ac = TRUE, order.max = NULL,na.acton = na.fal, demean = TRUE, seres,var.method = 1,...) Como ejemplo, ctamos los datos Dow Jones (Brockwell,2002), el cual se hace una estmacón prelmnar medante el algortmo de Burg. Antes de proceder a la estmacón, hay que transformar la sere orgnal. Dt<-dff(dowj,1,1)#es la manera de dferencar los datos yt<- Dt-mean(Dt) covaranza<-acf(dt,type="covarance",lag=10) ar.burg(yt,order=1,ac=t) ar.yw(yt,order=1,ac=t) Entonces la estmacón del modelo AR(1) en funcón de la sere orgnal es Estmacón del modelo AR(1) por el algortmo de Burg, Estmacón del modelo AR(1) por el algortmode Yule-Walker, 92

106 Para obtener el ntervalo de confanza, tambén se debe de encontrar las autocovaranzas muestral para las varables { }. Cuadro 3. 5 Valores de la covaranza de la sere dferencada Dow Jones para h= El ntervalo de confanza al 95% para los coefcentes estmados con algortmo de Burg es: Como el ntervalo de confanza no contene al cero, entonces se concluye que con de sgnfcanca. De gual manera se puede obtener el ntervalo de confanza para los estmadores por el algortmo de Yule-Walker. Algortmo de nnovacón Se puede ajustar un modelo autoregresvo de orden de los datos { } aplcando el algortmo de Durbn-Levnson a las autocovaranzas muéstrales, tambén se puede para modelos de promedo móvl,.3.82 De orden por medo del algortmo de nnovacón, la estmacón del vector de coefcentes y la varanza de rudo blanco se especfca en la sguente defncón: El modelo ajustado por nnovacón se defne como:, Donde y son obtendas del algortmo de nnovacón S { } sgue un proceso nvertble, 93

107 Con, y para ; entonces los estmadores de nnovacón para cada entero postvo, se tene, que converge a una dstrbucón normal multvarada con meda cero y matrz de covaranza [ ], donde El resultado anteror nos permte construr el ntervalo de confanza para los coefcentes de estmado por nnovacón de un proceso La seleccón del orden de un proceso En la bblografía de Brockwell (2002) mencona tres técncas útles para la seleccón apropado del orden del modelo, una de ellas es: Medante la funcón autocorrelacón, para es cero, medante la fórmula Bartlett s la autocorrelacón muestral,, se aproxma a una dstrbucón normal con meda y varanza [ ]. Entonces se puede usar la gráfca, para obtener la estmacón prelmnar del orden como el valor más pequeño de, tal que sea sgnfcatvamente dferente de cero para toda. Una aproxmacón más sstemátca para la seleccón del orden del modelo de promedo móvl, es encontrar los valores de y tal que mnmce el estadístco AICC La regón de confanza para los coefcentes del vector y para componentes ndvduales se puede encontrar medante el ntervalo de confanza al 95%, para ( ) Algortmo de nnovacón para proceso, es decr cuando y. Entonces asumendo casualdad se asegura que, donde los coefcentes de satsface 94

108 Defnendo y para, para estmar se usa los estmadores de nnovacón. Entonces reemplazando por en la ecuacón anteror y resolvendo el sstema de ecuacones para y Entonces para resolver el sstema de ecuacones, prmero encontramos últmas ecuacones: de las [ ] [ ] [ ] Resolvendo para, se puede determnar la estmacón de de Y fnalmente la varanza del rudo blanco, es estmado por ( ) Donde es el predctor a un paso de calculado de los vectores de coefcentes estmados y y se defne el cuadrado medo del error del algortmo de nnovacón. La seleccón del orden de un proceso Para modelos con y, el ACF y PACF muestral es dfícl poder dentfcar el orden y tenen menos valor para la seleccón del orden. Una aproxmacón asntótca, mas vable es mnmzar el estadístco AICC 95

109 Algortmo de Hannan-Rssanen La defncón de la ecuacón para un modelo causal tene la forma de un modelo de regresón lneal con el vector de coefcentes. Se sugere el uso de la regresón lneal smple por mínmos cuadrados para la obtencón de los parámetros prelmnar estmado, cuando. Es posble aplcar la regresón de mínmos cuadrados para estmar y, reemplazando las varable no observables por los valores estmados. Los parámetros y son estmados por la regresón en,. El algortmo de Hannan-Rssanen comenza con el ajuste del modelo autorregresvo por el algortmo de Yule-Walker, en seguda se descrbe el procedmento 1. Se estma el modelo un (con usando la estmacón prelmnar de Yule-Walker. S es el vector de coefcentes estmados, los resduales estmados son calculados de la ecuacón 2. Una vez estmado los resduales, podemos calcular el vector de parámetros el cual es estmado por la regresón lneal de mínmos cuadrados de en,, mnmzando la suma de cuadrados con respecto ( ) Entonces el estmador de Hannan-Rssanen se defne como donde y es la matrz de orden [ ] 96

110 S, contene solamente las últmas columnas. Entonces el estmador de la varanza del rudo blanco por el método de Hannan-Rssanen se defne como ( ) 3. Un tercer paso se produce usando los parámetros estmados, obtendos en el paso 2. S { Ahora para { { S es la estmacón de varables encontrado por la regresón de sobre las, es decr que mnmza ( ) Entonces el estmador mejorado de es, el nuevo estmador tene la msma efcenca que un estmador de máxma verosmltud Máxma Verosmltud s se supone que { } sgue una dstrbucón normal con meda cero y funcón de autocovaranza. Dado que, donde y ( ). Entonces y se asume que es no sngular, as que la funcón de máxma verosmltud se defne como 97

111 y { }.3.83 puede expresarse en térmnos de los errores de predccón a un solo paso y su varanza, ; ambos se puede calcular de la forma recursva a partr del logartmo de nnovacones. S denota los coefcentes obtendos cuando al algortmo de nnovacón se le aplca la funcón de autocovaranza y s es una matrz nferor de. Entonces tenemos la dentdad Así, los componentes de no están correlaconadas, por defncón de, la matrz de covaranza es la dagonal { } De la defncón de, se concluye que Entonces de las gualdades anteror se puede comprobar que ( ) ( ) , Entonces, de la defncón de 3.83 y empleando la defncón 3.84 y 3.85 la funcón de versmltud se reduce a { } S es expresado en térmnos de un número fnto de parámetros desconocdos, (tal es el caso de un proceso ARMA(p,q)), entonces los estmadores de Máxma Verosmltud de los parámetros son valores que maxmzan la funcón L para una sere de datos. La verosmltud para un un proceso ARMA(p,q) puede ser calculado por nnovacón, evaluando un paso adelante del predctor y el error cuadrado medo. 98

112 { ( ) Donde y son determnado por el algortmo de nnovacón y. De esta manera, la funcón de verosmltudd para un proceso ARMA(p,q) es: { } Una dferenca parcal de con respecto a, notar que y que son ndependentes de ; entonces podemos encontrar que los estmadores de máxma verosmltud y satsfacen la sguente ecuacón: Donde ( ) y son los valores de que mnmza ( ) Seleccón del orden Mnmzar el valor de AICC es un mejor crtero para la seleccón del orden de y Para elegr el orden del modelo ARMA en cada uno de los programas tenen sus funcones, en el caso del programa ITSM (Brockwell,2002) cuenta la funcón Autoft el cual nos arroja el mejor modelo con el menor AICC. En el programa R cuenta con la lbrería forecast lbrary(forecast) y TSA lbrary(tsa) el cual tenen las funcones eacf(objet) y auto.arma(objet,max.p=5,max.q=5,start.p=1,start.q=1,c="ac") que nos permte encontrar el mejor modelo ARIMA, medante teracones se obtene el mínmo AIC (Mandonald, 2003). Una vez que el modelo ha sdo determnado, se estma por el método de Máxma Verosmltud; y para ello se usa las funcones: 99

113 ar.mle(x, ac = TRUE, order.max = NULL, na.acton = na.fal, demean = TRUE, seres,...) arma(x, order = c(0, 0, 0),seasonal = lst(order = c(0, 0, 0), perod = NA),method = c("css-ml", "ML", "CSS")) Por ejemplo, con la funcón auto.arma() de la lbrería forecast, se obtene el mejor modelo de acuerdo al crtero de nformacón AICC; el cual resulta que el mejor modelo para ajustar los datos de la tasa de desempleo (unemploy rate) es un modelo ARMA(1,1). lbrary(forecast) ARMA11<-auto.arma(y); ARMA11 Cuadro 3. 6 El mejor modelo ARMA(1,1) para los datos de la tasa de desempleo con la funcón auto.arma(). El mejor modelo ARMA para los datos unemploy rate Seres: y ARIMA(1,0,1) wth non-zero mean ar1 ma1 Intercept Coeffcents: s.e sgma^2 estmated as : log lkelhood = AIC = AICc = BIC = Otra manera de dentfcar el orden de un modelo es medante el ACF y PACF muestral, estas son herramentas efcaces para dentfcar un modelo AR(p) o un MA(p). Sn embargo, para un modelo mxto ARMA es dfícl dentfcar el orden a partr de las Funcones de Autocorrelacón. Muchas herramentas gráfcas se han propuestos para dentfcar el orden de un modelo ARMA, el que se propone es el método de la Autocorrelacón Extendda (EACF) (Cryer, 2008) al parecer tene buenas propedades para muestras de tamaño moderadamente grande. En R se emplea la funcón eacf(), como se podrá observar, se tene una matrz de 8X14=112 correlacones estmadas; sn embargo no sempre nos mostrará un orden claro del modelo ARMA Proceso no Estaconaro: ARIMA El enfoque Box-Jenkns (1970) se utlza para modelar seres de tempo, este enfoque consste en tres etapas: dentfcacón, valoracón, dagnóstco y control (Box, 2008). Como prmer paso se observa s la sere es estaconal, s se duda que la sere cumpla con esta condcón entonces se tene que transformar 100

114 adecuadamente la sere antes de contnuar. Estas transformacones pueden ser la elmnacón de una tendenca determnsta o tomar las prmeras dferencas con respecto al tempo. Además de la nestabldad de la varanza conforme avanza el tempo se puede resolver con la aplcacón de logartmo a la sere. El sguente paso es la estmacón de un modelo prelmnar, empleando el prncpo de Máxma Verosmltud se hace la dscrmnacón de los dferentes modelos medante el cálculo del crtero de nformacón. Se ha dscutdo la mportanca de los modelos para sere de datos estaconaros, generalzando se ncorporan sere de datos no estaconaros; es decr un proceso. Este proceso se reduce a un proceso cuando dferencamos un número fnto de veces. Defncón de un proceso S es un entero no negatvo, entonces la sere de tempo { } es un modelo (Autoregresvo ntegrado de Promedo Móvl)(Cryer, 2008), s es un proceso estaconaro (causal). Esto sgnfca { } satsface una ecuacón de dferencacón de la forma Donde, y son los polnomos de grado y respectvamente; ademas para. Entonces el proceso { } es estaconaro s y solo s, en este caso se reduce a un proceso. A menudo se consdera la prmera y segunda dferencacón, respectvamente. Consderando un proceso ARIMA(p,1,q). y Entonces se tene:.3.87 En térmnos de la observacón. Reescrbendo la ecuacón anteror 101

115 Note que la ecuacón anteror parece un ARMA(p+1,q). S el modelo es lo msmo que un modelo, un modelo es lo msmo que un modelo o un modelo. Smlarmente un modelo, y es lo msmo (Ruppert, 2011). Modelo s { } es un proceso para alguna, el cual se defne de la sguente manera Lo anteror se puede escrbr de otra forma, De otra forma El cual se sgue consderando para el modelo la condcón de estaconaredad, s. Brockwell (2002) defne al modelo como Donde Esto sgnfca que para predecr el proceso { }, prmero predecmos el proceso y luego sumar la observacón ncal. Retomando los datos del Lago Hurón del ejemplo c. y aplcando la prmera dferencacón para ajustar un modelo ARIMA(1,1,0). Con el programa R, para dferencar y ajustar un modelo ARIMA se usan las funcones dff() y arma(), respectvamente. En la Fgura.3.26 se observa la suavzacón de los datos el cual mplca que la sere es estaconara, sn embargo tambén se puede comprobar la estaconaredad medante los correlogramas con las funcones acf() y pacf(). 102

116 Prmera dferencacon Nvel del lago en pe Nvel del lago Huron años Dferencacón a dstanca uno(d=1) años Fgura Prmera dferencacón a los datos del Lago Huron Las nstruccones sguentes nos permte obtener el gráfco de la sere dferencada y los parámetros del modelo ARIMA(1,1,0):,, y. dat<-read.table(fle="lakehuron.txt", header=t);attach(dat) LakeHuron<-ts(LAKE,start=c(1875,1),frequency=1) layout(matrx(c(1,1,2,2),2,2,byrow=true)) plot(lakehuron,type="o",col="blue", xlab="años",ylab="nvel del lago en pe", man="nvel del lago Huron ") plot(dff(lakehuron),type="o",col="blue", xlab="años",ylab="prmera dferencacon", man="proceso ARI(1,1)") ar1<-arma(lakehuron,order=c(1,1,0), method="ml")#estmacón por el método de máxma verosmltud ar3<-arma(dff(lakehuron),order=c(1,0,0), method="ml")#estmacón por el método de máxma verosmltud 103

117 dferencacon a Cuadro 3. 7 Parámetros estmados con el modelo ARIMA(1,1,0) de los datos "LakeHuron" Seres: LakeHuron, ARIMA(1,1,0) Call: arma(x = LakeHuron, order = c(1, 1, 0), method = "ML") ar1 s.e. Coeffcents: sgma^2 estmated as : log lkelhood = AIC = AICc = BIC = Modelo Este modelo satsface numerosas seres de tempo, en la economía y negocos. Para la sere de tempo produccón de maíz en Méxco se tene que dferencar a dstanca uno para que sea estaconara y obtener el mejor modelo, en este caso el mejor modelo para hacer un buen pronóstco de acuerdo al menor AIC es un modelo ARIMA(0,1,1). Medante la funcón auto.arma() del programa R se obtuvo el mejor modelo ARIMA. En Fgura.3.27 se muestra los datos dferencados a dstanca 1. dat1<- read.table(fle="prod.maz.txt", header=t) attach(dat1);lbrary(tsa);prod.maz<-ts(maz,start=c(1960,1),frequency=1) wn.graph(wdth=10, heght=4,pontsze=8) prod.maz.d<-dff(prod.maz) #se dferenca a dstanca 1 plot(prod.maz.d,type="o",ylab="dferencacon a 1",xlab="años de produccon",man="datos de Produccón de maíz dferencada a dstanca 1",cex.man=.8, col="blue") Datos de Produccón de maíz dferencada a dstanca años de produccon Fgura Datos de produccón de maíz en Méxco dferencado a dstanca uno para un modelo ARIMA(0,1,1). 104

118 Técncas de dentfcacón de un proceso Lo que se pretende es encontrar los valores de y, para un modelo dada una sere de datos. Para que el procedmento sea sgnfcatvo, la realzacón del proceso debe de ser estaconaro. S los datos no son estaconaro (componente de tendenca y estaconal), entonces es necesaro hacer una transformacón para producr una nueva sere que sea más compatble con la hpótess de estaconaredad. El análss del gráfco de la sere puede revelar una fuerte dependenca de varabldad en el nvel de la sere, para esto es recomendable hacer una transformacón (Box-Cox). Medante el gráfco, los componentes de tendenca y estaconaldad de la sere puede detectarse. Elmnar estos componentes, es necesaro aplcar dferencacón cuantas veces sea necesaro para que la sere sea estaconara. Tambén medante las funcones de autocorrelacón (ACF,PACF) puede mostrar un patrón de no estaconaredad. S tenemos una sere de datos { } con meda cero (o corregda por la meda), el problema es encontrar un modelo apropado para representar la sere { }. En la mayoría de los casos no se conoce el valor de y se necesta de técncas que se aproxma a los valores. Para elegr los valores de, hay que mnmzar el crtero de nformacón AICC defndo como: Para la seleccón del modelo, medante el programa R se usa la funcón auto.arma(). Con esta funcón se obtene el mejor modelo de acurdo al mínmo valor de AICC, AIC y BIC. Además, se debe de examnar los coefcentes estmados y su error estándar, ya que algunos pueden ser estadístcamente cero y esto mplca un nuevo ajuste. Medante el programa R, una vez elegdo el valor de para el modelo con el mínmo AICC. La estmacón por el método de máxma verosmltud se usa la funcón: arma(x, order = c(0, 0, 0),seasonal = lst(order = c(0, 0, 0), perod = NA),xreg = NULL,method = c("css-ml", "ML", "CSS")) arma0(x, order = c(0, 0, 0),seasonal = lst(order = c(0, 0, 0), xreg = NULL, method = c("ml", "CSS")) 105

119 Raíz Untara en modelos de sere de tempo El estadístco para probar que la sere es estaconara está basada en la nferenca estadístca, el cual fueron propuesto por prmera vez en 1979 por Dckey y Fuller (Lora, 2007). El problema de raíz untara en una sere de tempo, surge cuando el polnomo autorregresvo o de promedo móvl de un modelo ARMA tene raíz untara o está cerca del círculo untaro. S un modelo autorregresvo tene raíz untara cercana de 1, entonces se sugere que los datos deben de ser dferencado antes de ajustar un modelo ARMA. Mentras que en un polnomo de promedo móvl con una raíz untara cercano a 1, ndca que los datos están sobre dferencados. Raíz untara para un polnomo autorregresvo El grado de dferencacón en una sere { }, está determnado por la aplcacón del operador de dferenca repetdamente hasta que la gráfca de la funcón de autocorrelacón muestral de la sere dferencada, ACF { }, decae rápdamente. La prueba de Dckey-Fuller (1979) nos permte saber s se tene que dferencar o no la sere (Brockwell, 2002). La sere de datos dferencada puede ser modelado bajo un proceso, y entonces el resultado de un modelo para los datos orgnales tene un polnomo autorregresvo con raíz en el círculo untaro. Consderando que { } sgue un proceso con meda Donde, y Para grande, el estmador de máxma versmltud de es aproxmadamente. Entonces la prueba de hpótess de raíz untara para este modelo autorregresvo se defne como Para construr el estadístco de prueba, el modelo se escrbe como

120 Donde y. Entonces 3.91 es un modelo de regresón lneal, con la varable dependente y la ndependente. De esto, es el estmador de MCO de y su Error Estándar muestral está dado por: ( ) ( ) Donde ( ) y es la meda muestral de { } El proceso es estaconaro s se rechaza untara e mplca dferencar. de lo contraro la sere tene raíz S es el estmador de mínmos cuadrados de y bajo el supuesto de raíz untara, el estadístco de Dckey-Fuller (1979) para grande está dado por la razón del parámetro estmado y su Error Estándar está dado por: El argumento de Dckey-Fuller de rechazar la hpótess nula de raíz untara s al nvel de sgnfcanca del 0.01, al 0.05 s o al 0.1 s. Entonces la regla de decsón es: Para saber s una sere de datos es estaconara o no, una de las herramentas son las funcones de Autocorrelacón (ACF y PACF). Sn embargo exsten otros métodos, tal es el caso del estadístco Dckey-Fulle y Phllps-Perron. Estas pruebas se pueden llevar a cabo con el programa R medante las funcones adf.test() y pp.test() de la lbrería tseres y TSA respectvamente. La prueba de raíz untara se lustra con los datos del Lago Huron (Brockwell, 2002), el cual se utlzan los programas ITSM 2000 y R en la obtencón del estmador. Con la fnaldad de saber s la sere es de orden uno, es o no estaconara, se utlza el método de Dckey-Fuller para raíces untaras. ar0<-arma(lakehuron,order=c(1,0,0), method="ml")#estmacon por el metodo de maxma verosmltud para un AR(1) ar1<-arma(lakehuron,order=c(1,1,0), method="ml")#ari(1,1) ar2<-arma(lakehuron,order=c(1,2,0), method="ml")#ari(1,2) 107

121 ar3<-arma(lakehuron,order=c(1,3,0), method="ml")#ari(1,3) adf.test(dff(lakehuron,dfference=2))#prueba de Dckey-Fuller para la segunda dferencacón adf.test(dff(lakehuron,dfference=2))# prueba de Phllps Perron Cuadro 3. 8 Prueba de Raíz Untara con el método de Dckey Fuller Software utlzado R ITSM 2000 Autoregresvo orden Dferencacón AR(1) AR(1) AR(1) AR(1) El valor de se obtene a partr de dferencar a dstanca 2 los datos del Lago Huron, con un nvel de sgnfcanca del 5% y del 10% se rechaza la hpótess nula de raíz untara con el modelo autoregresvo de orden uno. Entonces medante este método se prueba que la sere es estaconara con la transformacón de los datos (dferencacón). Con el programa R se realza la pruebas de raíz untara con el método de Dckey-Fuller (1979) y Phllps-Perron (1988) (Harrs, 2003), medante las nstruccones adf.test() y pp.test(). Cuadro 3. 9 Resultado de la prueba de raíz untara con el programa R Augmented Dckey-Fuller Test Phllps-Perron Unt Root Test data: dff(lakehuron, dfference = 2) data: dff(lakehuron, dfference = 2) Dckey-Fuller Lag order p-value Dckey-Fuller Z(alpha) Truncaton lag parameter p-value *** *** alternatve hypothess: statonary p-value smaller than prnted p-value alternatve hypothess: statonary p-value smaller than prnted p-value Con estas dos pruebas, Dckey-Fuller y Phllps-Perron, el resultado es sgnfcatvo menor al 1%; esto sgnfca que la sere es estaconara y que se puede encontrar un mejor modelo con los datos transformados. Raíz untara para un polnomo de promedo móvl La raíz untara de en el polnomo de promedo móvl puede tener dferentes nterpretacones dependendo de la aplcacón del modelo. Sea { } un proceso causal e nvertble que satsface la sguente ecuacón: 108

122 Entonces la sere dferencada es un proceso no nvertble y con el polnomo de promedo móvl. Entonces, probar la exstenca de raíz untara es equvalente a probar que la sere está sobre dferencada. De antemano se sabe que medante la Funcón de Autocorrelacón Muestral ACF mentras la línea va en descenso puede tomarse como un síntoma de que la sere de tempo no es estaconaro y requere dferencacón. Sn embargo exste otro mecansmo para saber s la sere no es estaconara, que es medante la prueba de Raíz Untara (Brockwell, 2002). Para el caso de raíz untara en un proceso de promedo móvl de orden 1, MA(1) de la forma (Brockwell, 2002) :, donde Se supone raíz untara s, entonces el polnomo de promedo móvl mplca que. Esta gualdad es la hpótess a probar que donde es el estmador de Máxma Verosmltud de, tene la propedad de converger en dstrbucón. Entonces la hpótess a probar es: La regla de decsón es: Donde es el cuantl de la dstrbucón límte de, los valores crítcos de esta dstrbucón para los tres nveles de sgnfcanca son 11.93, 6.80, 4.90 con los nveles de sgnfcanca 0.01, 0.05 y 0.10 respectvamente. Aclaro que la desgualdad de la regla de decsón es resultado de la desgualdad ( ). Consderando la sere de datos produccón de maíz en Méxco para los años de 1960 a 2009, el modelo ajustado se obtene medante el programa ITSM 2000, que es un modelo MA(1) con dferencacón a dstanca 1. ARMA Model: 109

123 X(t) = Z(t) Z(t-1) WN Varance = E+07 AICC = E+03 BIC = E+03 Entonces de acuerdo a la regla de decsón con n=50, valor crtco, se obtene el De acuerdo a la regla de decsón se rechaza la hpótess nula, entonces el polnomo de promedo móvl tene raíz untara; es decr la sere de tempo es estaconara. Pronóstcos para modelos De gual manera como se pronostca para modelos, tambén se puede adaptar para el pronóstco de valores a futuro a un modelo. Por ejemplo, s { } es un proceso casual y es cualquer varable aleatora. Entonces de la defncón 3.89, para { } es un proceso con meda y la autocovaranza, que depende de la y, Entonces el mejor predctor lneal en térmnos de la sere { defne como : }, se 3.93 De manera general, s asummos que el proceso { } satsface, donde { } es un proceso causal y el vector aleatoro ( no está correlaconada con, entonces la ecuacón dferencacón puede reescrbrse de la forma ( ) Nuestro objetvo es encontrar los mejores predctores lneales. Para esto se aplca el operador en cada lado de la ecuacón 3.93 (con ) y usando la lnealdad de se obtene: ( )

124 A se dentfca como el mejor predctor lneal de en térmnos de { } Para encontrar el error cuadrado medo del error de predccón (ECM), es convenente expresar a en térmnos de { }. Para, se denota el predctor un paso adelante por y. Entonces de 3.93 y 3.94 tenemos Y para un modelo, s y, el predctor se defne de la forma ( ) Ajustando, entonces de la defncón de 3.94 y 3.95 tenemos el predctor para un proceso : ( ).3.96 El error cuadrado medo (ECM) del predctor a paso adelante se defne como: ( ).3.97 Donde Entonces para sempre cuando grande, el error cuadrado medo (ECM) de 3.97 se aproxma, es nvertble. 111

125 ( ) Para un modelo ARIMA(1,1,2) Retomando los dato de Lago Huron, medante la funcón auto.arma() se realza una estmacón prelmnar, el cual nos arroja el mejor modelo de acuerdo al menor valor AIC. Luego se ajusta el modelo propuesto medante el método de Máxma Verosmltud con la funcón arma(), sn embargo se tene otras funcones para ajustar un modelo ARIMA que conduce a lo msmo(arma0(), Arma()). dat<-read.table(fle="lakehuron.txt", header=t);attach(dat) LakeHuron<-ts(LAKE,start=c(1875,1),frequency=1) arma<-auto.arma(lakehuron) arma1<-arma0(lakehuron, order=c(1,1,2),method="ml") arma2<-arma(lakehuron,order=c(1,1,2),method="ml") arma3<-arma(lakehuron,order=c(1,1,2),method="ml") Cuadro Parámetros estmados por el método de Máxma Verosmltud Seres: LakeHuron, ARIMA(1,1,2) Call: arma(x = LakeHuron, order = c(1, 1, 2), method = "ML") ar1 ar2 ma1 Coeffcents: s.e sgma^2 estmated as : log lkelhood = AIC = AICc = BIC = Para el pronóstco a años a futuros se emplea la funcón forecast() o la funcón predct(). El programa R nos arroja el pronóstco para 5 años a futuros, el Error cuadrado de cada uno de los datos pronostcados y el ntervalo de confanza al 90% y 95%. lbrary(forecast) forecast(arma2,a.ahead=5,level=c(90,95)) predct(arma2,n.ahead=5,level=c(90,95),se.ft=t) 112

126 Cuadro Pronóstcos haca 5 años a futuros del nvel de agua en el Lago Huron Years Pont Forecast s.e Lo 90 H 90 Lo 95 H Análss de resduales de los modelos: Bondad de ajuste Por lo general, la bondad de ajuste de un modelo estadístco a un conjunto de datos se juzga al comparar los valores observados con los valores predchos obtendos del modelo ajustado. S el modelo ajustado es el apropado, los resduos deben de comportarse de manera que sean consstentes con el modelo. Cuando se encuentra un modelo ARMA(p,q) para una sere dada, se determnan los estmadores de máxma verosmltud, y de los parámetros, y. S los valores predchos de basado de es calculado del modelo ajustado, entonces los resduales se defne de la sguente manera (Brockwell, 2002). S el modelo ARMA(p,q) de Máxma Verosmltud generado por el proceso { }, entonces se dce que { }. Entonces las propedades de los resduales { } deberá reflejar las característcas de un rudo blanco { } generado bajo un proceso ARMA(p,q). En partcular, la secuenca { } deberá ser aproxmado a. No correlaconada s { }.. Independente s { }. Sgue una dstrbucón normal s { } Los resduos estandarzados se obtenen de la dvsón de los resduales y de la desvacón estándar estmada

127 S el modelo ajustado es el apropado, entonces los resduos estandarzados ( ) tenen las msmas propedades de un o, entonces se supone que el rudo blanco { } dervado de un proceso ARMA(p,q) es ndependente. Para saber s el modelo es apropado, el gráfco de los resduales estandarzados con respecto al tempo sgue una secuenca smlar al de un rudo blanco con meda cero y varanza 1. Además el gráfco puede descrbr un patrón de componente cíclco o de tendenca que nos ndque s exste o no presenca de autocorrelacón (Gujarat, 2003); en este caso al parecer los resduos no están correlaconados en el tempo ya que presentan un patrón sstemátco. Otra de las herramentas mportante para la deteccón de autocorrelacón es la Funcón de Autocorrelacón Muestral (ACF) de los resduos. Entonces la ACF muestral se puede probar s los resduos son consstentes con un rudo, examnando la Funcón de Autocorrelacón Muestral de los resduos y rechazando la hpótess de un rudo sí más de dos o tres de los h retrasos (lag) caen fuera de la banda o por lo memos uno está fuera de banda. dat1<- read.table(fle="prod.maz.txt", header=t) attach(dat1);lbrary(tsa) prod.maz<-ts(maz,start=c(1960,1),frequency=1) mejor_modelo1<auto.arma(log(prod.maz),max.p=5,max.q=5,start.p=1,start.q=1,c="ac") R<-resduals(mejor_modelo)/mejor_modelo$sgma; layout(matrx(c(1,1,2,3),2,2,byrow=true)) plot(r,ylab="resduos estandarzados",man="resduales estandarzados para un MA(1)",type="o") ablne(0,0, lty=2); acf(resduals(mejor_modelo),man="acf Resduals") qqnorm(resduals(mejor_modelo));qqlne(resduals(mejor_modelo))# prueba de normaldad medante gráfco 114

128 ACF Sample Quantles Resduos estandarzados Resduales estandarzados para un MA(1) Tme ACF Resduals Normal Q-Q Plot Lag Theoretcal Quantles Fgura Dagnostco del modelo medante gráfcos de los resduales. Para los resduos obtendos del modelo ARIMA(0,1,1) y grafcados con la funcón acf(), nos muestra que el 95% caen dentro de la banda de la funcón de autocorrelacón muestral (ACF). Entonces se acepta la hpótess de que los resduos sguen una secuenca. El gráfco Q-Q Plot tambén es una herramenta para saber s el proceso rudo blanco se dstrbuye normalmente, ya que en el gráfco los resduos se ajustan a la recta. Se pueden llevar a cabo otras pruebas como la Ljung-Box y Shapro-Wlks. La prmera prueba pretende comprobar s la autocorrelacón muestral cae dentro de la banda de la ACF, para esto se usa el estadístco Ljung and Box (1978) (Brockwell, 2002). El contraste de de Ljung and Box analza la hpótess nula: 115

129 Donde se dstrbuye una j-cuadrada,. Entonces la regla de decsón es rechazar la hpótess s al nvel de, de lo contraro de aceptar la hpótess. Box y Prce (1970) propuso el estadístco Ellos demostraron que para un modelo ARMA (p,q) estmado, con grande, se dstrbuía aproxmadamente como una ch-cuadrada con grados de lbertad (Cryer,2008). Como la dstrbucón ch-cuadrada está basada en el teorema del límte central para, Ljung y Box (1978) posterormente descubren que para una, la aproxmacón no era satsfactora. Entonces decden modfcar un poco al estadístco, en donde se defne una prueba estadístca mucho más cercana a la ch-cuadrada para tamaños de muestras más típcos (Cryer, 2008). ( ) Donde, son las autocorrelacones para retrazos, y son los parámetros del modelo. Con la prueba de Shapro-Wlks (2.16) nos permte saber s los datos sguen una dstrbucón normal, se compara el estadístco con el valor, en donde se rechaza la hpótess de normaldad de los datos s. De otra manera se compara el valor teórco con el valor, se rechaza la hpótess de normaldad s el es menor al valor teórco. S es un Rudo Blanco Gaussano, entonces la secuenca de las varables aleatora es déntcamente ndependente dstrbuda bajo una normal estándar con meda cero; además están no correlaconadas. Exsten muchas pruebas estadístcas para probar la normaldad de los errores, el programa R tene funcones útles para llevar a cabo estas pruebas; una de ellas son los hstogramas, QQ-Plots, Correlogramas (Petrs, 2009), entre otras. ad.test():prueba de normaldad de Anderson-Darlng (nortest) chsq.test():prueba de j-cuadrada(stats) hst():hstogramas(stats) jarque.bera.test():prueba de normaldad de Jarque-Bera (tseres) ks.test():prueba de normaldad de Kolmogorov-Smnorv (stats) 116

130 llle.test():prueba de normaldad de Lllefors (nortest) pearson.test():prueba de normaldad de Pearson-J cudrada (nortest) qqnorm():produce el gráfco de normaldad QQ-plot (stats) qqlne() produce la línea de normaldda a la gráfca QQ-plot(stats) shapro.test():prueba de normaldad de Shapro(stats) Box.test():Prueba de autocorrelacón de los resduales con de Ljung y Box(TSA) 4.6. Modelos SARIMA En la seccón se explca cómo se lleva a cabo la elmnacón del componente estaconal para un perodo, el cual se dce que hay que dferencar justamente a dstanca. S se ajusta un modelo dferencando a la sere a una dstanca, entonces el modelo ajustado a la sere orgnal es un proceso estaconal o tambén llamado SARIMA. Tal es el caso para seres de datos en donde se tenen medcones mensuales, es decr que se tene que se tene una coleccón de 12 seres por año; el cual le podemos ajustar un modelo. S se tene un modelo, para la sere dferencada ; donde el modelo con la sere orgnal { } es. De manera general este es un modelo (SARIMA) estaconal (Brocwell, 2002) Defncón del modelo SARIMA S y son enteros negatvos, entonces { } es un proceso con perodo. Entonces la sere dferencada es un proceso causal defndo por Donde,, y Entonces de la defncón anteror 117

131 Entonces enumeran los pasos para dentfcar un modelo SARIMA para un conjunto de datos. Encontrar los valores posble de y que hagan que la sere dferencada sea estaconara. Los componentes de dferencacón estacona anteror se puede se puede representar de la sguente forma, Examnar las funcones de autocorrelacón y autocorrelacón parcal (ACF y PACF) de a dstanca que sea múltplo de para obtener una aproxmacón de y. Es decr, para debe de ser compatble con un modelo. Los valores de y se obtenen observando los valores de, los cuales deben de ser compatbles con los modelos. Consderando el sguente modelo, denotado por, donde las fluctuacones estaconales se producen cada 12 meses. Entonces para,, y s el modelo puede escrbrse como (Shumway, 2006) Para un el prmer orden, de un modelo autorregresvo de promedo móvl estaconal,. Entonces para,,,, y s el modelo puede escrbrse como Predccón con modelos SARIMA El pronóstco del proceso SARIMA es completamente análogo al pronóstco a un proceso ARIMA. El proceso consste en desarrollar los bnomos usados para volver la sere estaconara, es decr desarrollar en termno de. a) ( ) b) ( ) El producto de estas dos expresones resulta un polnomo de orden 118

132 Donde el termno expresa el producto de sgnos y combnatora de los térmnos dados en a) y b). Ajustando la ecuacón anteror para y despejando para tenemos: Entonces, se puede determnar el mejor predctor lneal de basado en { } multplcando en cada lado por. El prmer térmno de la derecha es el predctor lneal de un proceso ARMA de { } en térmnos de { }, cual puede ser calculado como se ha comentado en el captulo anteror. El predctor puede ser calculado recursvamente para, s tenemos en cuenta que para cada. Entonces para el Error Cuadrado Medo (ECM) es análogo al proceso ARIMA, se expresa de la sguente forma ( ) Donde y son obtendos por el algortmo de nnovacón para la sere dferencada { }. Pero para grande, s es dferente de cero para, entonces el ECM se aproxma a Donde 119

133 IV. METODOLOGÍAS PARA UN ANÁLISIS ECONOMÉTRICO. Método de Mínmos Cuadrados Ordnaros (MCO) Para llevar a cabo estudo econométrco y ajustar un modelo para la produccón de maíz en Méxco, se consderó las sguentes varables a partr del año de 1980 a 2009 (Anexo 9.1): : Produccón Naconal de maíz en grano en mles de tonelada : Consumo aparente en mles de tonelada : Poblacón total en mles de personas : Rendmento de maíz tonelada/hectárea. : Superfce sembrada mles de hectáreas : Importacón de maíz en mles de tonelada. Se analzan las varables que estarán mplíctas en el modelo, que mejor predga la produccón. Para este análss se construyen la matrz de correlacón smple, de covaranza; y posterormente para conocer el grado de asocacón entre estas varables se calcula el coefcente de regresón múltple. datos<- read.table(fle="produccon_maz.txt", header=t)#el archvo "produccon_maz.txt" debe de stuarse en Drectoro de trabajo attach(datos);datos; dat<-cbnd(pmg,ca,pt,ren,sup,imp) cor(dat)#para la matrz de correlacón parcal Cuadro 4. 1 Matrz de correlacón smple. PMG CA PT REN SUP IMP PMG CA R= PT REN SUP IMP

134 En la matrz de correlacón smple se apreca ben las varables que pueden explcar mejor el modelo de produccón: CA, PT, REN y posblemente IMP; estas varables presentan una correlacón smple de 0.963, 0.904, y respectvamente. El cual ndca que la varable PMG tene una asocacón lneal alta con las tres prmeras varables, sólo con la varable IMP el grado de asocacón lneal es bajo (0.727) (Códgo 2.8). Entonces se construye modelos de regresón lneal smple, para ver de manera ndvdual s las varables dependentes (CA, PT, REN, IMP) aportan nformacón relevante al modelo de produccón. De esta manera se proponen los prmeros 4 modelos de regresón smple y se estman los parámetros (Códgo 2.9) modelo1<-lm(pmg~ca)# modelo de regresón; summary(modelo1)# un análss completo de la regresón modelo2<-lm(pmg~pt) # modelo de regresón; summary(modelo2)#un análss completo de la regresón modelo3<-lm(pmg~ren); summary(modelo3) modelo4<-lm(pmg~imp); summary(modelo4) Parámetros estmados del modelo 1: Cuadro 4. 2 Estmacón de los parámetros del modelo 1. Coeffcents: Estmate Std.Error t value Pr(> t ) (Intercept) *** CA < *** Sgnf. codes: 0 *** ** 0.01 * Resdual standard error: 1088 on 28 degrees of freedo m Multple R-squared: , Adjusted R-squared: F-statstc: on 1 and 28 DF, p-value: < 2.2e-16 Parámetros estmados del modelo 2: Cuadro 4. 3 Estmacón de los parámetros del modelo 2. Coeffcents: Estmate Std.Error t value Pr(> t ) (Intercept) *** PT *** Sgnf. codes: 0 *** ** 0.01 * Resdual standard error: 1725 on 28 degrees of freedom Multple R-squared: , Adjusted R-squared: F-statstc: on 1 and 28 DF, p-value: 6.93e-12 Parámetros estmados del modelo 3: 121

135 Cuadro 4. 4 Estmacón de los parámetros del modelo 3. Coeffcents: Estmate Std.Error t value Pr(> t ) (Intercept) REN *** Sgnf. codes: 0 *** ** 0.01 * Resdual standard error: 1325 on 28 degrees of freedom Multple R-squared: , Adjusted R-squared: F-statstc: on 1 and 28 DF, p-value: 4.115e-15 Parámetros estmados del modelo 4: Cuadro 4. 5 Estmacón de los parámetros del modelo 4. Coeffcents: Estmate Std.Error t value Pr(> t ) (Intercept) *** IMP *** Sgnf. codes: 0 *** ** 0.01 * Resdual standard error: 2778 on 28 degrees of freedom Multple R-squared: , Adjusted R-squared: F-statstc: on 1 and 28 DF, p-value: 5.273e-06 Los resultados obtendos en cada uno de los modelos lneales estmados, se muestra que los parámetros son estadístcamente sgnfcatvos con un. Medante la prueba de hpótess ndca que los parámetros estmados son estadístcamente dferentes de cero, de esto se concluye que las varables dependentes aporta nformacón mportante al modelo. Los coefcentes de determnacón R-cuadrada múltple y ajustada mden la bondad de ajuste de modelo de regresón (porcentaje de explcacón de la varable dependente por la ndependente. Como en la mayoría de los modelo el coefcente de regresón se acerca a la undad, ndca que la línea de regresón se ajusta a los datos en más del 90%, obtenendo así una buena estmacón de la produccón de maíz en grano (PMG). Sn embargo para formar un modelo más completo en donde se tenga la varabldad total o ncal de los datos, se recurre a calcular una medda descrptva de la capacdad predctva del modelo. Es por eso que se calcula el coefcente de determnacón o coefcente de determnacón múltple al cuadrado 122

136 S denotamos la matrz de correlacón e nversa de las varables (PMG, CA, PT, REN, SUP e IMP) como S y Cuadro 4. 6 Matrz de correlacón de las varables de estudos. PMG CA PT REN SUP IMP PMG CA PT REN SUP IMP Cuadro 4. 7 Matrz de correlacón parcal nversa. PMG CA PT REN SUP IMP PMG CA PT REN SUP IMP Con la defncón de la seccón 2.4.6, se obtene los coefcentes de regresón múltples para las varables: PMG ( ), CA ( ), PT ( ), REN ( ), SUP ( ) e IMP ( ). Las varables que mejor predcen la produccón de maíz en grano (PMG) de acuerdo al coefcente de regresón múltple son: consumo aparente (CA), rendmento (REN) e mportacón (IMP), ya que estos explcan más del 90%.(Códgo 2.10) matrz.cor<-cor(dat)# Matrz de correlacón parcal nversa.s<-solve(matrz.cor) #nversa de la matrz S vect<-dag(nversa.s)# el vector con los elementos dagonal de la matrz nversa de S R2<- 1-vect^-1# el vector con los coefcentes de Regresón Múltple Cuadro 4. 8 Coefcentes de Regresón múltple = = 1 ( ) 1 =

137 Entonces para estmar la produccón de maíz con respecto a las demás varables, de los cuatros modelos planteados se reduce a un modelo de regresón múltple con 3 varables. Esto porque de acuerdo al grado se asocacón, las varables (CA, REN, IMP) explcan más del 90% el comportamento de la produccón de maíz..3.1 Retomando los datos en cuanto a Produccón de maíz en grano (PMG), Consumo aparente (CA), Poblacón total (PT), Rendmento (REN) e Importacón (IMP); se obtene los estmadores del modelo 3. Actualmente se tene programas computaconales que hacen una tarea mportante para llevar a cabo los cálculos estadístcos. En este trabajo se emplea el software R para obtener estos resultados, que es de acceso lbre orentado a objetos a través de lenguaje S (Quck, 2010). La estmacón de los parámetros, y se obtene medante la funcón lm(formula, data) (Códgo 2.11). modelo<-lm(pmg~ca+ren+imp); summary(modelo); anova(modelo) Entonces susttumos los parámetros el modelo de regresón múltples 3.1 con los parámetros estmados del Cuadro 4.9, así que el modelo de produccón de maíz en grano queda de la sguente manera. Cuadro 4. 9 Estmacón de los parámetros del modelo. Coeffcents: Estmate Std.Error t value Pr(> t ) (Intercept) CA *** REN ** IMP *** Sgnf. codes: 0 *** ** 0.01 * Resdual standard error: 499 on 26 degrees of freedom Multple R-squared: , Adjusted R-squared: F-statstc: on 3 and 26 DF, p-value: < 2.2e-16 El resultado obtendo en este modelo, los coefcentes de regresón son estadístcamente sgnfcatvos con un ; esto ndca que los coefcentes son estadístcamente dferentes de cero. De acuerdo a los coefcentes de determnacón R-cuadrada múltple y ajustada s se acerca a la undad, ndca que la línea de regresón se ajusta a los datos, obtenendo así una buena estmacón de la produccón de maíz en grano. 124

138 En el programa R se usa la funcón anova(), códgo 2.11, para obtener el resultado del Análss de Varanza (Faraway, 2006). > anova(modelo) Cuadro Análss de Varanza (ANOVA) para el modelo de produccón. Analyss of Varance Table Response: PMG Df Sum Sq Mean Sq F value Pr(>F) CA <2.20E-16 *** REN E-06 *** IMP E-09 *** Resduals Sgnf. codes: 0 *** ** 0.01 * En la prueba de sgnfcanca global medante la tabla de Análss de Varanza (ANOVA), se contrasta la hpótess nula vs. Entonces en el Cuadro 4.10 con un nvel de sgnfcanca se rechaza la hpótess nula, es decr con un valor del 5% y 10% es menor que los valores de del Cuadro Con esto se concluye que al menos algunos parámetro contrbuye de manera sgnfcatva al modelo. De otra manera, el valor F calculada excede al valor de F crítco al nvel de sgnfcanca 5% y 10%. En la Fgura 4.1 se apreca que los valores obtendo por el modelo propuesto se ajusta a los valores reales (Códgo 2.12). datos<- read.table(fle="produccon_maz.txt", header=t); attach(datos) modelo5<-lm(pmg~ca+ren+imp) m1<-ts(as.matrx(cbnd(ftted(modelo5),pmg)),start=1980,frequency=1) wn.graph(wdth=10, heght=5,pontsze=8) plot(m1,plot.type="sngle",lty=1:2,man="produccón de maíz real y produccón maíz ajustado con método de MCO",ylab="Mles de toneladas",xlab="años",type="o",cex.man=1.2, col=c("blue","red")) legend(2000,15000,c("produccón estmada(mco)","produccón real"),lty=1:2,cex=1.5,col=c("blue","red")) 125

139 Mles de toneladas produccón de maíz real y produccón maíz ajustado con método de MCO produccón estmada(mco) produccón real Años Fgura 4. 1 Comparacón de los valores reales con los valores ajustados por el método de MCO Uno de los supuestos del modelo de regresón lneal que se debe de comprobar es que los errores se dstrbuyen normalmente, es decr ). A contnuacón se realza la prueba de normaldad medante el estadístco de Shapro-Wlk de los modelos de regresón lneal y múltple planteado (Montgomery, 2005). La regla de decsón para contrastar la hpótess nula como lo ndca la seccón 2.5.3, es que rechaza la hpótess nula sí. Es decr, una con una y rechazar la hpótess de normaldad o de lo contraro se acepta que los datos sguen una dstrbucón normal. shapro.test(resduals(modelo1)) #prueba de normaldad con el estadístco shapro-wlks shapro.test(resduals(modelo2)); shapro.test(resduals(modelo3)) shapro.test(resduals(modelo4)); shapro.test(resduals(modelo5)) Cuadro Prueba de Normaldad con el estadístco Shapro-Wlks. Test de Normaldad Modelos Shapro-Wlks W p-value

140 Frequency Sample Quantles De acuerdo a los resultados obtendos en el Cuadro 4.12 (Códgo 2.13), los valores del estadístco es mayor al valor crtco al 5% y 10% ( ) entonces se acepta la hpótess nula; es decr que estadístcamente los datos sgue una dstrbucón normal con y en cada uno de los modelos establecdos. Para obtener el valor del estadístco se usa el parámetro, para lo cual se emplean los valores del Anexo 9.5. Para el valor crítco del estadístco se emplea la tabla del Anexo 9.4. Otra forma de saber s los resduos del modelo de regreson multple 3.1, sgue una dstrbucon normal estandar, es medante el grafco de cualtles y el hstogramas. En la grafca de cuantles muestra una línea recta de 45, es una relacón cercana a una línea recta y en el hstograma muestra una curvatura cercana a la normal. Prueba de Normaldad 5 Normal Q-Q Plot resduals(modelo5) Theoretcal Quantles Fgura 4. 2 Prueba de normaldad medante hstogramas y Q-Q Plot Otras de las pruebas mportantes que se tene que hacer para los varables ndependentes, es que estas varables no estén drectamente relaconadas a lo se le llama problema de colnealdad (entre dos varables ndependente) o multcolnealdad (entre varas). Para la prueba de multcolnealdad Montgomery (2005) propone el Factor de Inflacón de la Varanza, en donde cualquera de los VIF es mayor de 10 ndca que hay presenca de multcolnealdad. Esto mplca que los coefcentes asocados a la regresón están sobreestmados, es decr que la varanza de los 127

141 estmadores es grande y por lo consguente el ntervalo de confanza tambén lo es. Prmero optamos por obtener la matrz C (matrz de correlacón), cuyo elemento dagonal son los factores de nflac n de la varanza. De acuerdo a los resultados del Cuadro 4.12 se tene el Factor de de Inflacón de la Varanza de para la varable CA, de 8.78 para la varable REN y de 4.69 para la varable SUP; asumendo que exste presenca de multcolnealdad (Códgo 2.14). x<-as.matrx(cbnd(ca,ren,sup))# x es la matrz dseño compuesto por las varables CA,REN y SUP matrz_c<-solve(cor(x))# se obtene la matrz de correlacón y su nversa VIF<-dag(matrz_C)# los elementos dagonal de la matrz son los factores de nflacón de la varanza VIF Cuadro Matrz de correlacón y Factor de Inflacón de la Varanza. Matrz C CA REN SUP CA REN SUP Factor de Inflacón de la Varanza CA REN SUP Pero que con los valores VIF obtendos no se sabe cuál es el grado de multcolnealdad, en la sguente prueba se analza el grado. La sguente prueba multcolnealdad es medante las raíces característcas, egenvalores; estas se usaron para medr el grado de multcolnealdad en los datos. S uno o más egenvalores es pequeño esto mplca hay dependenca lneal entre las regresoras. Se calculan el vector de los egen valor y egen vector de la matrz (Cuadro 4.13). x<-as.matrx(cbnd(ca,ren,sup)); xx<-cor(x); matrz_egen<-egen(xx); egenvalores<-matrz_egen$values kj<-max(egenvalores)/egenvalores; kj; k<-max(egenvalores)/mn(egenvalores) 128

142 Cuadro Análss de multcolnealdad a partr de egen valor y egen vector. $values [1] $vectors [,1] [,2] [,3] [1,] [2,] [3,] Sólo se toma los egenvalores para calcular los índces de condcón dados por la formula (2.45), en donde se observa que el valor máxmo del índce de condcón es de 65.21, de esto se concluye que no hay una fuerte dependenca lneal en los datos de produccón. (Códgo 2.15). Cuadro Cálculo de los índces de condcón Se observa que entre más pequeños sea representado por los índces de condcón la dependenca es mayor. Con esta prueba se asegura que el grado de asocacón entre las regresoras no es muy fuerte, de esta manera se puede hacer nferenca confable. Para la prueba de autocorrelacón de los resduos ( ), es decr que nnguno de los errores de una observacón nfluyan en los errores de otra observacón. Una de las pruebas más conocda para detectar la correlacón es el estadístco de Durbn- Watson. A los prmeros 4 modelos se les aplcó la prueba de Durbn-Watson, de acuerdo a los resultados obtendo en el Cuadro 4.15 se muestra que solo el modelo 3 resulta no sgnfcatvo en la autocorrelacón. Se apreca que el valor del estadístco de y con una cas cero (Códgo 2.16). 129

143 lbrary(car)#nstalar la lbrera "car" dw1<-durbn.watson(modelo1,max.lag=1); dw2<-durbn.watson(modelo2,max.lag=1) dw3<-durbn.watson(modelo3,max.lag=1); dw4<-durbn.watson(modelo4,max.lag=1) dw5<-durbn.watson(modelo5,max.lag=1); cbnd(dw1,dw2,dw3,dw4,dw5) Cuadro Prueba de Autocorrelacón con el estadístco de Durbn-watson. Modelo Lag Autocorrelaton D-W Statstc p-value Para el modelo de regresón múltple 3.1 se analza la autocorrelacón de los errores me medante el estadístco Durbn-Watson es: Lag Autocorrelaton D-W Statstc p-value Alternatve hypothess: rho!= 0 Alternatve hypothess: rho[lag]!= 0 De acuerdo a los datos obtendos se observa que los valores de son cercanos a cero, el cual mplca que el estadístco de Durbn-Watson tenden a acercarse a 2, de acuerdo a la regla establecda (Gujarat, 2003) se dce que nnguna perturbacón de algún regresor están correlaconados con el error de otra. Concluyendo que estadístcamente se rechaza la hpótess alternatva, asumendo que no exste autocorrelacón. Para hacer la prueba de homoscedatcdad al modelo 3.1, el cual son las varables que resultan sgnfcatvas para hacer un mejor ajuste de la produccón de maíz en grano en Méxco. En el programa R se aplca la funcón bptest(), para la prueba de homoscedastcdad de Breusch- Pagan. Cuadro Prueba de homoscedastcdad con el estadístco Breusch-Pagan. Medante la prueba de Breush-Pagan (Cuadro 4.16) se tene que el valor del estadístco con 3 grados de lbertad y un, entonces 130

144 probando con una j-cuadrada con 3 grados de lbertad y 5% de nvel de sgnfcanca se tene que. Entonces bajo el supuesto, con un nvel de sgnfcanca del 5% se rechaza la hpótess de homoscedastcdad. En presenca de la prueba de Breusch- Pagan resulta que sí exste heteroscedastcdad en el modelo, el cual mplca que los estmadores dejan de ser MELI. Es por ello que se ntroduce meddas correctvas como el método de Errores estándar robustos de whte (Gujarat, 2003), para resolver el problema de heteroscedastcdad se usó el software EVews 7, ya que el software R aun no cuenta con una funcón que permte resolver este problema. Cuadro Correccón de Heteroscedastcdad medante método de Error Estándar Robusto de Whte, EVews 7. Dependent Varable: PMG Method: Least Squares Date: 05/24/11 Tme: 01:36 Sample: Included observatons: 30 Whte heteroskedastcty-consstent standard errors & covarance PMG=C(1)+C(2)*CA+C(3)*REN+C(4)*IMP Coeffcent Std. Error t-statstc Prob. C(1) C(2) C(3) C(4) R-squared Mean dependent var Adjusted R-squared S.D. dependent var S.E. of regresson Akake nfo crteron Sum squared resd Schwarz crteron Log lkelhood Hannan-Qunn crter F-statstc Durbn-Watson stat Prob(F-statstc) En el Cuadro 4.17 se muestra el resultado de la correccón de heteroscedastcdad medante el método whte, es claro ver que los Errores Estándar por el método de MCO (Cuadro 4.9) son más pequeños que por el método de Whte; esto mplca 131

145 que en cuanto mayor sea el error estándar los valores de son más pequeños. Además no se perde la sgnfcanca de las regresoras mplíctas en el modelo por el método de MCO y Error Estándar Robusto de Whte. De acuerdo al resultado obtendo de la regresón, se obtene una en contraste con el estadístco de prueba, una j-cuadrada al 5% con 9 grados de lbertad de 16.91; se concluye con base a la prueba de Whte que no hay heteroscedastcdad. 28,000 24,000 20,000 16,000 12,000 Forecast: PMGF Actual: PMG Forecast sample: Included observatons: 30 Root Mean Squared Error Mean Absolute Error Mean Abs. Percent Error Thel Inequalty Coeffcent Bas Proporton Varance Proporton Covarance Proporton , FITTED ± 2 S.E. Fgura 4. 3 Modelo ajustado con la correccón de heteroscedastcdad con la prueba de Whte.. Metodología de Box-Jenkns (ARIMA) Ajuste para los datos Lago Huron ( ) (Brockwell, 2002) En el apartado de estmacón prelmnar de acuerdo a las funcones de autocorrelacón (ACF,PACF) se observa que el proceso es estaconaro dferencando a dstanca 2. Además, se obtene una estmacón prelmnar con el método de Yule-Walker o Burg. Sn embargo exste varos métodos para saber cuál es el mejor modelo, en la seccó 3.6 se hace uso de la funcón auto.arma() y sugere un modelo dstnto a los demás. Entonces para ello se consdera el mínmo valor del crtero de nformacón (AIC). dat<-read.table(fle="lakehuron.txt", header=t);attach(dat) LakeHuron<-ts(LAKE,start=c(1875,1),frequency=1) arma1<-arma(lakehuron,order=c(1,1,0), method="ml") arma2<-arma(lakehuron,order=c(1,2,0), method="ml") 132

146 arma3<-arma(lakehuron,order=c(1,2,1), method="ml") arma4<-arma(lakehuron,order=c(1,1,2), method="ml") Cuadro El mejor modelo para los datos Lake Huron con el valor mínmo del AIC Modelos Sgma cuadrada AIC BIC ARIMA(1,1,0) ARIMA(1,2,0) ARIMA(1,2,1) ARIMA(1,1,2) De acuerdo al crtero de nformacón Akake, el mejor modelo que se ajusta a los datos Lago Huron de acuerdo al crtero AIC es un modelo ARIMA(1,1,2). Sn embargo exsten otros supuestos que debe de cumplr, tal es el caso de que los resduales que no estén correlaconados, se dstrbuya bajo una dstrbucón normal. Para estas pruebas se usa la funcón Box.test(), el correlograma para ACF, shapro.test(), el gráfco de cuantles (QQ-Plots) e Hstogramas. Box.test(resduals(arma4),lag=20,type="Ljung-Box") shapro.test(resduals(arma4)) Cuadro Prueba de Normaldad y de Autocorrelacón de los resduales Prueba de Normaldad Shapro-Wlk normalty test data: resduals(arma4) W = , p-value = Prueba de Autocorrelacón Box-Ljung test data: resduals(arma4) X-squared = , df = 20, p-value =

147 Sample Quantles ACF Frequency Resduos estandarzados Prueba de Normaldad para los resduos Resduales estandarzados resduals(arma4) Tme Normal Q-Q Plot Funcon de Autocorrelacón de los resduales Theoretcal Quantles h Fgura 4. 4 Análss de los resduos del modelo ARIMA medante gráfcos lbrary(agrcolae); par(mfcol=c(2,2)) hstograma<-hst(resduals(arma4), man=paste("prueba de Normaldad para los resduos"),col="green") normal.freq(hstograma,col="red", lty=5,lwd=2) qqnorm(resduals(arma4))# prueba de normaldad medante grafco qqlne(resduals(arma4))#lnea del grafco de normaldad R<-resduals(arma4)/arma4$sgma plot(r,ylab="resduos estandarzados",man="resduales estandarzados",type="o") ablne(0,0, lty=2) acf(resduals(arma4),xlab="h",ylab="acf", man="funcon de Autocorrelacón de los resduales") Los resduos del modelo ARIMA no están correlaconados, con la prueba de Ljung-Box los resduos { }. Para retardos, con y, en donde <, se concluye que los resduos no están correlaconados. La prueba de Shapro-Wlks es usado para comprobar s resduos sguen una dstrbucón normal, la regla es que se rechaza la hpótess nula de normaldad de 134

148 los datos s ; de lo contraro, aceptar la hpótess nula s el es mayor al valor teórco. De aquí, que se concluye que los resduos sguen una dstrbucón normal ya que con el valor de es mayor que el valor teorco del 5%. Con la Funcón de Autocorrelacón (ACF) se muestra que el 95% de los retardos cae dentro de la banda, para una. Entonces se acepta la hpótess de que los resduos sguen una secuenca (Dstrbucón Idéntcamente Independente) (Montgomery, 2008). Posterormente, se puede hacer pronóstcos a años futuros con el mejor modelo Una vez encontrado el mejor modelo, el objetvo es que sea capaz de predecr valores a futuros y para hacer un buen pronóstco uno de los métodos es mnmzar el Error Cuadrado Medo (MSE). Además de otros estadístco para evaluar la capacdad predctva como es la Raíz del Error Cuadrado Medo (RMSE), Error Absoluto Medo (MAE), Error Absoluto Medo Porcentual (MAPE), Error Medo (ME) (Montgomery, 2008). Cuadro Estadístcos para evaluar la capacdad predctva de un proceso ARIMA(p,d,q)... Ajuste para los datos Produccón de maíz en Méxco ( ) (INEGI, 2010) En la metodología de Box-Jenkns (1970), antes de modelar la sere de datos de produccón de maíz (1960 a 2009) se llevó a cabo algunas pruebas para saber s la sere muestral no es estaconaro y s fueras el caso, cuantas veces hay que dferencar para que la sere sea estaconara. Medante la funcones acf() y pacf() se obtenen los correlogramas y los valores de autocorrelacón para los datos de produccón de maíz en grano para los años de 1960 a dat1<- read.table(fle="prod.maz.txt", header=t) attach(dat1);lbrary(tsa);prod.maz<-ts(maz,start=c(1960,1),frequency=1) wn.graph(wdth=8, heght=4,pontsze=8) par(mfcol=c(1,2)) acf(prod.maz,xlab="h",ylab="acf",col="blue",man="funcón de Autocorrelacón datos orgnales") acf(dff(prod.maz),xlab="h",ylab="acf",col="blue",man="funcón de Autocorrelacón datos dferencados a dstanca 1") 135

149 ACF ACF Funcón de Autocorrelacón datos orgnales Funcón de Autocorrelacón datos dferencados a dstanca h h Fgura 4. 5 Análss de estaconaredad de los datos a través de las ACF. Cuadro Valores de las autocorrelacones para los datos dferencados a dstanca Medante la Funcón de Autocorrelacón (ACF),, es de gran utldad para dentfcar el orden de un modelo AR(p) o MA(q). Para una sere de datos de N observacones, el límte está dado por, donde es el valor aproxmado de la desvacón estándar del ACF para cualquer retardo suponendo ndependenca. Una fórmula para el error estándar del coefcente de autocorrelacón de la k-esma muestra es proporconado por Bartlett (1946) (Montgomery, 2008). Entonces, el ntervalo para los coefcentes de autocorrelacón debe de ser, para y esto puede ser consderado como evdenca de que la sere es ndependente en el proceso. Sn embargo exsten otras pruebas para saber s el modelo es estaconaro o no lo es, como la prueba de Dckey- Fuller (1979) y Phllps-Perron (1988) (Harrs, 2003). Con el programa R se puede llevar a cabo las pruebas de raíz untara con el método de Dckey-Fuller (1979) y Phllps-Perron (1988) (Harrs, 2003), medante las nstruccones adf.test() y pp.test() de la lbrería tseres y TSA. adf.test(dff(prod.maz,dfference=2))#dckey-fuler pp.test(dff(prod.maz))# Phllps-Perron kpss.test(dff(prod.maz))#esta es otra prueba de raz untara 136

150 Cuadro Análss de raíz untara medante el método de Dckey-Fuller y Phllps-Perron Augmented Dckey-Fuller Test data: dff(prod.maz, dfference = 2) Phllps-Perron Unt Root Test data: dff(prod.maz) Dckey-Fuller Lag order p-value Dckey-Fuller Z(alpha) Truncaton lag parameter p-value *** *** alternatve hypothess: statonary p-value smaller than prnted p-value alternatve hypothess: statonary p-value smaller than prnted p-value De acuerdo a los resultados del Cuadro 4.22, medante la prueba de Dckey-Fuller la sere es estaconara dferencando a dstanca dos y en la prueba Phllps- Perron la sere es estaconara dferencando a dstanca uno. De acuerdo a la Funcón de Autocorrelacón (ACF) de la Fgura 4.6, la sere muestra un patrón de estaconaredad con la dferencacón a dstanca 1. logmaz<-log(prod.maz)#transformacon logartmca Dff<-dff(logmaz) #prmera dferencacon layout(matrx(c(1,1,2,3),2,2,byrow=true)) plot(dff,type="o",ylab="prmera dferencacón",xlab="años de produccón",man="prmera dferencacón a los datos de produccón de maz",col="blue") ablne(0,0,lty=5) acf(dff,xlab="h",ylab="acf",col="blue",man="funcón de Autocorrelacón") pacf(dff,xlab="h",ylab="acf",col="blue",man="funcón de Autocorrelacón Parcal") 137

151 ACF ACF Prmera dferencacón Prmera dferencacón a losa datos de produccón de maz años de produccón Funcón de Autocorrelacón Funcón de Autocorrelacón Parcal h h Fgura 4. 6 Comportamento estaconaro de los datos de produccón de maíz Cryer (2008) propone dentfcar el orden de un modelo, medante el método de autocorrelacón Extendda (EACF). En el programa R se obtene medante la funcón acf(). Aplcar la funco eacf() a los datos dferencados(dff), el resultado es un modelo ARMA(0,1). Es claro que el orden del modelo encontrado es a partr de los datos dferencados. Los resultados de la teracón se muestran en el Cuadro eacf(dff) 138

152 Cuadro Identfcacón del orden del modelo medante la Funcón de Autocorrelacón Extendda Al gual que otros programas, se tene una opcón de ajuste automátco de una sere de datos; en el caso del programa ITSM se una la opcón de Autoft. Para el programa R se usa la funcón auto.arma(objet,max.p=5,max.q=5,start.p=1,start.q=1,c="ac")(mandonald, 2003), permte encontrar al mejor modelo de acuerdo a mínmo AIC medante teracones. A partr de los datos orgnales prod.maz se le aplca la funcón auto.arma() el cual nos arroja un modelo ARIMA(0,1,1) con una dferencacón a dstanca 1, con el menor AIC: auto.arma(prod.maz,max.p=5,max.q=5,start.p=1,start.q=1,c="ac") Cuadro Resultado del ajuste automátco con la funcón auto.arma() Seres: prod.maz, ARIMA(0,1,1) wth drft Call: auto.arma(x,max.p=5,max.q=5,start.p=1,start.q=1,c="ac") ma1 Drft Coeffcents: s.e sgma^2 estmated as : log lkelhood = AIC = AICc = BIC = Uno de los prncpales objetvos es construr un modelo para la sere de tempo que sea capaz de predecr valores a futuro y para hacer un buen pronóstco es mportante mnmzar el Error Cuadrado Medo (MSE). 139

153 modelo1<-modelo1<- (prod.maz,max.p=1,max.q=1,start.p=1,start.q=1,c="ac") modelo2<-arma(prod.maz,order=c(1,1,1),method="ml") modelo3<-arma(prod.maz,order=c(2,1,1),method="ml") modelo4<-arma(prod.maz,order=c(1,2,1),method="ml") modelo5<-arma(prod.maz,order=c(0,2,1),method="ml") accuracy(forecast(modelo1));accuracy(forecast(modelo2)); accuracy(forecast(modelo3));accuracy(forecast(modelo4));accuracy(forecast (modelo5)) Cuadro Evaluacón de los modelos ARIMA (0,1,1) de acuerdo al Error Cuadrado Medo Proceso ARIMA(p,d,q) ARIMA(p,d,q) AIC BIC MSE ME RMSE MAE MPE MAPE MASE ARIMA(0,1,1) ARIMA(1,1,1) ARIMA(2,1,1) ARIMA(1,2,1) ARIMA(0,2,1) En el Cuadro 4.25 se presentan los estadístcos para evaluar el mejor modelo de predccón, un pronóstco a futuro mnmzando el Error Cuadrado Medo (MSE). De acuerdo al crtero del menor AIC, los mejores modelos son:, y respectvamente. Sn embargo el modelo que mejor predce a futuro de acuerdo con el menor MSE es el modelo, se obtuvo la raíz del error cuadrado medo (RMSE) de , un error medo (ME) de 7.8, un porcentaje de error medo absoluto (MAPE) del 9.6%. Se pronostca la produccón de maíz para 5 años futuro (2010 a 2015) con la funcón forecast() con un ntervalo de confanza del 90% y 95%. Los datos pronostcados se muestran en el Cuadro 4.26 con los límtes de predccón del 90% y 95%, además se muestra el gráfco con que nos lustra los datos predchos y el límte de predccón. pronostco<-forecast(modelo1,a.ahead=5,level=c(90,95)) wn.graph(wdth=10, heght=5,pontsze=8) plot(pronostco,ylab="mles de toneladas",xlab="año",man= "Forecast from arma (0,1,1)",type="o", col="red") Cuadro Pronóstco de la produccón de maíz en Méxco a partr del 2010 a 2019 Pont Forecast Lo 90 H 90 Lo 95 H

154 En la sguente Fgura 4.7 se apreca el crecmento de la produccón en los años pronostcado. Fgura 4. 7 Pronóstco de la produccón de maíz en Méxco ( ) Para el dagnóstco del modelo, se comprueba que los resduos no estén correlaconados, que se dstrbuya déntcamente ndependente y bajo una dstrbucón normal. Para saber s los resduos del modelo ARIMA(1,1) no están correlaconados se aplca la prueba de Ljung-Box, es decr que los resduos { }. La prueba de Shapro-Wlks (2.16) nos permte saber s los datos sguen una dstrbucón normal, se compara el estadístco con el valor, en donde se rechaza la hpótess de normaldad de los datos s. De otra manera se compara el valor teórco con el valor, se rechaza la hpótess de normaldad s el es menor al valor teórco. Box.test(resduals(modelo1),lag=20,type="Ljung-Box")#estadstco and Box shapro.test(resduals(modelo1) ) Ljung 141

155 Cuadro Prueba de normaldad y autocorrelacón a los resduos delo modelo ARIMA(0,1,1). Prueba de Normaldad Shapro-Wlk normalty test data: resduals(modelo1) W = , p-value = Prueba de Autocorrelacón Box-Ljung test data: resduals(modelo1) X-squared = , df = 20, p-value = Para retardos, con y, en donde <, se concluye que los resduos no están correlaconados. De acuerdo a la regla de decsón se concluye que se acepta la hpótess de normaldad, es decr los resduos sguen una dstrbucón normal ya que con el valor de calculado es mayor que el valor teórco del 5%. Con la Funcón de Autocorrelacón (ACF) de la Fgura 4.8, se muestra que el 95% de los retardos cae dentro de la banda, para una. Entonces se acepta la hpótess de que los resduos sguen una secuenca (Dstrbucón Idéntcamente Independente) (Montgomery, 2008). lbrary(agrcolae); par(mfcol=c(2,2)) hstograma<-hst(resduals(modelo1), xlm=c(- 4000,4000),ylm=c(0,15),man=paste("Prueba de Normaldad para los resduos"),col="green") normal.freq(hstograma,col="red", lty=5,lwd=2) qqnorm(resduals(modelo1))# prueba de normaldad medante grafco qqlne(resduals(modelo1))#lnea del grafco de normaldad plot(rstandard(modelo1),ylab="resduos estandarzados",man="resduales estandarzados",type="o") ablne(0,0, lty=2) acf(resduals(modelo1),xlab="h",ylab="acf", man="funcon de Autocorrelacón de los resduales") 142

156 Sample Quantles ACF Frequency Resduos estandarzados Prueba de Normaldad para los resduos Resduales estandarzados resduals(modelo1) Tme Normal Q-Q Plot Funcon de Autocorrelacón de los resduales Theoretcal Quantles h Fgura 4. 8 Prueba de Normaldad para los resduos del modelo ARIMA(0,1,1) medante gráfcos En la Fgura 4.8 se observa que los tenen un comportamento de un Rudo Blanco Gaussano, la secuenca de las varables aleatora es déntcamente ndependente dstrbuda bajo una normal estándar con meda cero; además están no correlaconadas. Medante el programa R se tene funcones útles para llevar a cabo estas pruebas, como son los hstogramas, QQ-plots y Funcón de autocorrelacón (Petrs, 2009). Ajuste para los datos mensuales Consumo de electrcdad doméstco ( ) (INEGI, 2012) Consderando los datos grafcados en la seccón del consumo doméstco de electrcdad a partr del mes de Enero del año 2000 a marzo del Se presentan algunos estadístcos para los datos Meddas estadístcas descrptvas Meda 2850 Varanza

157 Log(Consumo de electrcdad) Mn 2258 Medana 2810 Max 3792 De acuerdo al crtero de Brockwell, sí se tene una sere de tempo cuyos cclos no son homogéneos, lo más recomendable en prmer lugar, transformar los datos con logartmos y posteror aplcar las dferencacones para lograr la estaconaredad de la sere. Como se podrá observar en la Fgura 4.9, varanza para los cclos es más homegeneo que los datos orgnales; además de que con esta transformacón desaparecen los valores atípcos (Montgomery,2002). logelectr<-log(sere_electrcdad);wn.graph(wdth=10, heght=4,pontsze=10) plot(logelectr,xlab="tempo(meses)",ylab="log(consumo de electrcdad)",type="o",col="blue",man="logartmo del consumo doméstco de electrcdad en Mexco en ") Logartmo del consumo doméstco de electrcdad en Mexco en Tempo(Meses) Fgura 4. 9 Sere transformada medante logartmo para homogenzar la varanza de los cclos Como se podrá observar en la Fgura 4.9 la sere presenta estaconaldad a dstanca, por lo que dferencando una vez a esta dstanca elmnaremos el componente de estaconaldad. Por lo que la sere dferencada se apreca en la Fgura 4.10 y se puede representar como, donde es logartmo de la sere de consumo domestco de electrcdad mensual. wn.graph(wdth=10, heght=4,pontsze=10) Dff_D<-dff(logelectr,12,1) plot(dff_d,xlab="meses",ylab="dferencacón a dstanca 12 ",type="o",col="blue",man="elmnacón del componente estaconal a los datos log(sere_electrcdad)") 144

158 Dferenccón a dstanca 1 y Dferencacón a dstanca Elmnacón del componente estaconal a los datos log(sere_electrcdad) Meses Fgura Sere dferencada a dstanca 12 para elmnar el componente de estaconaldad, La Fgura 4.10 se observa el componente de tendenca elmnado, antes de haber elmnado el componente estaconal. La sere transformada se representa como, donde y. wn.graph(wdth=10, heght=4,pontsze=10) Dff_Dd<-dff(Dff_D,1,1) plot(dff_dd,xlab="meses",ylab="dferenccón a dstanca 1 y 12",type="o",col="brown",man="Elmnacón del componente estaconal y de tendenca a los datos log(sere_electrcdad)") Elmnacón del componente estaconal y de tendenca a los datos log(sere_electrcdad) Meses Fgura Sere dferencada a dstanca 12 y 1 para elmnar el componente de estaconaldad y de tendenca Se analzan las funcones de Autocorrelacón muestral y Parcal (ACF, PACF) para obtener los valores,, y. 145

159 ACF PACF Funcón de Autocorrelacón Funcón de Autocorrelacón Parcal h h Fgura Correlograma de las ACF y PACF para la sere dferencada De acuerdo a la ACF se observa que para, los valores, ; después de todos los valores son estadístcamente dferente de cero. Entonces se puede ajustar los datos con un modelo, sn embargo se puede ensayar varos modelos y de acuerdo al menor AICC se puedo optar por el mejor modelo. Otras pruebas que se le deben de hacer a la sere, es la de raíz untara y para esto se pueden hacer uso de las funcones adf.test(), pp.test() y kpss(); Dckey-Fuller, Phllps-Perron y Kwatkowsk respectvamente (Ruppert, 2011). Cuadro Valores de las Aautocorrelacones muestral y Parcal h ACF PACF h ACF PACF Entonces el ajuste de los datos se puede hacer medante la funcón arma() del programa R, sn embargo tambén se puede usar la funcón auto.arma() para aproxmar un modelo. 146

160 arma(x,order=c(0,0,0),seasonal=lst(order=c(0,0,0),perod=na),xreg = NULL,method=c("CSS-ML", "ML", "CSS")) Cuadro Resultados de modelos SARIMA obtendo a partr de ensayados P D Q P D Q AIC BIC Sgma^ Como se podrá observar en el Cuadro 4.29 se tenen los crteros de nformacón Akake y Bayesano, cada uno de los modelos ensayados presentan AIC apropado. Sn embargo el de menor AIC podría ser el modelo que mejor se ajuste de los datos. De acuerdo al crtero ya menconado, el modelo apropado para ajustar la sere Consumo de electrcdad doméstco sería un. Entonces para estmacón de los parámetros se empleó la funcón arma() medante el método de máxma verosmltud, cuyo resultado se muestra en el sguente Cuadro arma(logelectr,order=c(0,1,1),seasonal=lst(order=c(0,1,1),perod=12),me thod="ml") Cuadro Resultado obtendo a partr de un modelo ARIMA(0,1,1)(0,1,1)[12] Call: arma(x = logelectr, order = c(0, 1, 1), seasonal = lst(order = c(0, 1, 1), perod = 12), method = "ML") ma1 Sma1 Coeffcents: s.e sgma^2 estmated as : log lkelhood = AIC = AICc = BIC = Este modelo se obtuvo medante la funcón auto.arma() de la lbrería forecast 147

161 ACF PACF De esta manera, recalcando que se ha estado trabajando para el logartmo de la sere orgnal, entonces el modelo ajustado para es un proceso., En la bondad de ajuste, se pretende corroborar que los resduos algunos supuestos. cumplan con Medante las funcones de autocorrelacón muestral, Parcal (ACF, PACF) y el estadístco de Ljung-Box se comprueba que los resduos no estén correlaconado y sean Identcamente Independentes. wn.graph(wdth=10, heght=4,pontsze=10) par(mfcol=c(1,2)) acf(resduals(ajuste),xlab="h",ylab="acf",lag.max=24,man="funcón de Autocorrelacón") pacf(resduals(ajuste),xlab="h",ylab="pacf",lag.max=24,man="funcón de Autocorrelacón Parcal") Funcón de Autocorrelacón Funcón de Autocorrelacón Parcal h h Fgura Prueba de autocorrelacón de los resduales medante los correlogramas Box.test(resduals(ajuste),lag=20,type="Ljung-Box")#estadstco Ljung and Box Box-Ljung test data: resduals(ajuste) X-squared = , df = 20, p-value = Medante los estadístcos de Shapro-Wlk y Jarque-Bera se comprueban s los resduos sguen una dstrbucón normal, es decr. Y medante los hstogramas y QQ-plots, se puede aprecar la normaldad de los resduos. 148

162 Consumo de Electrcdad doméstca Para el pronóstco para años adelante, se emplea la funcón forecast()o predct(). El últmo dato que se tene es hasta Marzo/2012 y se pronostcara para dos años (abrl/2012-dcembre/2013). ajuste<-arma(logelectr, order=c(0,1,1),seasonal=lst(order=c(0,1,1),perod=12),method="ml") lbrary(forecast) pronos_elect<-forecast(ajuste,a.ahead=21,level=c(90,95)) predct(ajuste,n.ahead=21,level=c(90,95),se.ft=t) Cuadro Pronóstcos e ntervalos para el consumo de electrcdad en logatrmo abr/2012-dc/2013 año Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dec $se Lo H $se Lo H wn.graph(wdth=10, heght=5,pontsze=8) plot(pronos_elect,ylab="consumo de Electrcdad doméstca",xlab="tempo(meses)",man= "Pronóstco del consumo doméstco para abr/2012-dc/2013",type="o", col="blue") Pronóstco del consumo doméstco para abr/2012-dc/ Tempo(meses) Fgura Gráfco del modelo ajustado y pronóstco para abr/2012-dc/

163 Se ha estado trabajando sobre los logartmos, sn embargo se puede trabajar con los datos orgnales una vez encontrado el mejor modelo. Entonces s El antlogartmo Entonces para este ejemplo, para ajustar el modelo encontrado a partr de, se obtene el antlogartmo [ ] [ ] V. RESULTADOS Y DISCUSIÓN Se enuncaron los prncpales temas para llevar a cabo un mejor ajuste de la produccón de maíz en grano con el método de Mínmos Cuadrados Ordnaros, ya que el modelo elegdo cumpló con todos los supuestos. Se comprobó que los estmadores fueran MELI y con mínma varanza, que los resduos sean homocedástco con la prueba de Breusch-Pagan y la prueba de Whte. Medante la prueba de Durbn-Watson se demuestra que los errores no están correlaconados y con la prueba de Shapro-Wlks e hstograma se demuestra que la normaldad. Con el método de Box-Jenkns se llevó a cabo el dagnóstco para poder elegr el mejor modelo, de estas pruebas resultó que el mejor modelo es proceso Autoregresvo Integrado de Promedo Móvl con parámetros, y ; es decr. Este modelo hace el mejor pronóstco a futuro ya que presenta el menor Error Cuadrado Medo (MSE), además que los errores cumplen con los supuestos de normaldad, ndependenca y no autocorrelacón. Uno de los mejores software para obtener los valores estadístco en lo personal es el Software R, es un software orentado a objeto con el lenguaje S; además que es de acceso lbre cuenta con lbrería para llevar a cabo un buen análss econométrco. No descarto que tambén exstan otros software potencales para obtener los resultados estadístcos, tal como el SAS, SPSS, EVews, Mntab, S- PLUS, Etc. 150

164 VI. CONCLUSIONES Objetvos generales Presentar los conceptos báscos para el análss de regresón lneal (unvarado y múltple) y la metodología de Box-Jenkns (ARIMA) con datos de seres de tempo unvarado, el cual nos permta llevar a cabo un análss econométrco. El uso del software R como herramenta para obtener resultados confables en el ajuste de los modelos estadístcos. Objetvos partculares c) Elaborar un materal que enunce los prncpales temas de esta dscplna (Econometría), junto con sus teoremas y demostracones correspondentes, con el afán de presentar un tutoral dedcado a profesores y estudantes que se nteresan en la econometría y despertar en ellos el nterés por la programacón hacendo uso del software R. d) Hacer una análss econométrco de la produccón de maíz en grano, medante el ajuste de un modelo estadístco que permta estmar la produccón a partr de los años 1980 a 2009 tomando en cuenta varables que ncden drectamente como es el consumo aparente (CA), la poblacón total (PT), el rendmento (REN), la superfce sembrada (SUP), la mportacón (IMP) (ver Anexo 9.2). Pronostcar la produccón para los años futuros medante un modelo autorregresvo ntegrado de promedo móvl ARIMA(p,d,q). Se abordó los temas de regresón lneal y la estmacón de los parámetros con el método de Mínmos Cuadrados Ordnaros, establecó ejemplos con datos de la economía mexcanas con la fnaldad de plasmar los prncpos báscos para un análss econométrco medante el método de Mínmos Cuadrados. En la metodología de predccón de Box-Jenkns, es una de las más conocda y utlzada en la nvestgacón econométrca. En la parte teórca de este trabajo se hace énfass en el análss econométrco a través de la metodología Box-Jenkns, presenta fundamentos báscos del análss unvarado y se muestra los argumentos más relevantes de la teoría que la sustenta. Se llevó a cabo un ajuste a la sere de datos: venta de autos (Undades venddas) y consumo de electrcdad, consderando las 151

165 respectvas transformacones y los supuestos que deberan cumplr para obtener un mejor modelo y a partr de este una mejor predccón. VII. RECOMENDACIONES La eleccón del software para el ajuste un modelo queda a consderacón del nvestgador, todos los programas menconados tenen la capacdad de hacer un buen pronóstco. Consdero que las undades de meddas nfluyen para obtener un mejor ajuste, en la mayoría de las ctas bblográfcas usan undades de meddas monetaras ($, Dólares, Euros, etc.). Sí sería relevante un análss de contegracón para conocer otros factores que nfluyen en la produccón, nclur varables explcatvas a un modelo ben especfcado, consstente y capaz de proporconar nformacón más relevante. VIII. BIBLIOGRAFÍA BARRO J. R Macroeconomía: Teoría y Polítca. Ltográfca ngramex. Méxco, D. F. 565 p. Box G. E. P Tme Seres Analyss: Forecastng and Control. A John Wley & Sons, Fourth Edton. Customer Care Department, Unted States of Amerca. 746 p. BROCKWELL P. J.; DAVIS R. A Introducton to Tme Seres and Forecastng. Sprnger, Second edton. Department of Statstcs Colorado state Unversty, USA. 434 p. CANTATORE DE F. N. M Manual de Estadístca Aplcada. Edtoral hemsfero sur, S. A. Facultad de Cencas Veternara, Unversdad de Buenos Ares. Buenos Ares, Argentna. CHACÍN L. F Análss de Regresón y Superfce de Respuesta. Unversdad Central de Venezuela. Facultad de Agronomía. Venezuela. P 152

166 CHATFIELD C The Analyss of Tme Seres an Introducton. Chapman & Hall/crc. The Unversty of Bath Unted Kngdom. 283 p. CRAMER J. S Econometría empírca. Fondo de cultura económca. Méxco, D. F. 278 p. CRYER J. D.; CHAN K. S Tme Seres Analyss wth Applcatons n R. Sprnger, Second edton. Department of Statstcs & Actuaral Scence, Unversty of Iowa. Iowa, USA. 491 p. CORREA J. C.; GONZÁLEZ N Gráfcos Estadístcos en R. Posgrado en Estadístca, Unversdad Naconal- Sede Medellín. 229 p. Dsponble en COWPERTWAIT P. S. P Metcalfe A. V. Introductory Tme Seres wth R. Inst. Informaton and Mathematcal Scences, Massey Unversty. New Zealand. 254 p. DALGAARD P Introductory Statstcs wth R. Department of Bostatstcs Unversty of Copenhagen, Denmark. Sprnger, Second Edton. 363 p. DORNBUSH R.; FISHER S Macroeconomía. Mcgraw Hll/Interamercana de España, 5 edcón. S. A. Madrd, España. 974 p. FARAWAY J. J Extendng the Lnear Model wth R. Chapman & Hall. Boca Raton London, New York, USA. 330 p. FOX K.A Manual de econometría. Trad.Ktagorodzk Maurco.1ª ed. Buenos Ares, Argentna. Amorrortu Edtores S.C.A. 558 p. FLORES G. R.; LOSANO S. H Estadístca aplcada para admnstracón. Grupo Edtoral Iberoamercana, S. A de C. V. Méxco, D. F. 615 p. GIL I. S.; LARA G. P. Z Métodos estadístcos: un enfoque nterdscplnaro. 2ª ed. Trllas. Méxco, D. F. 643 p 153

167 GORDON R. J Macroeconoma. Grupo Edtoral Iberoamercana, 2 edcón. Méxco, D. F. 645 p. GUJARATI D. N Econometría, cuarta edcón. McGraw Hll. Méxco, D. F. 972 p. HARRIS R. ; SOLLIS R Appled Tme Seres Modellng and Forecastng. Jonh Wley. Durhan Unversty, England. 302 p. Ihaka R Tme Seres Analyss. Statstcs Department Auckland. 111 p. Unversty of JOHNSON R Estadístca elemental. Edtoral Trllas, S. A de C. V. Méxco, D. F. 515 p. JOHNSTON J Métodos de Econometría. Trad. Otero Moreno José Mª. 3ª Ed. Barcelona, España. Vcens-vves. Pág KIRCHGÄSSNER G.; WOLTERS J Introducton to Modern Tme Seres Analyss. Sprnger. Unversty of St. Gallen. 274 p. P LORÍA E. G Econometría con aplcacones. Pearson Educacón. Méxco, D, F. 331 p MAINDONALD J.; BRAUN W. J Data analyss and graphcs usng R: an Example Based Approach, Thrd Edton. Cambrdge Unversty Press. New York, Unted States of Amerca p. Manzanera T. E Undad de Consultoría Estadístca, curso en R. Department de Estadístca e Investgacón Operatva y Ddáctca de la Matemátca, Unversdad de Ovedo 144.pp. Dsponble en MARTÍNEZ G. A Métodos econométrcos. Colego de postgraduados. Escuela Naconal de Agrcultura. Chapngo, Méxco. 278 p. 154

168 MARTÍNEZ G. A Dseños Expermentales: Tomo No. 2. Colego de Postgraduados. Chapngo, Méxco. 401 p MARTÍNEZ G. A.; CASTILLO M. A Teoría de la Regresón con Aplcacones Agronómcas. Colego de Postgraduados. Chapngo, Méxco. 490 p. MONTGOMERY D. C Introducton to Tme Seres Analsys and Forecastng. Wley-Interscence. New Jersey, Unted States of Amerca. 455 p. MONTGOMERY D. C Introduccón al análss de regresón lneal. CECSA. 3a. edcón. Mexco, D. F. 588 p. MOOD A. M Introduccton to the Theory of Statstcs. McGraw-Hll, tercera edton. Oxford, USA. 564 p. PEÑA G. J. B Introduccón a la Estadístca en las Cencas Bomédcas. Dvsón de Cencas Báscas e Ingenería. Unversdad Autónoma Metropoltana Iztapalapa. Méxco, D. F. p PEÑA D Análss de Datos Multvarantes. Ed. McGraw Hll. Madrd, España. 559 p. PETRIS G.; PETRONE S.; CAMPAGNOLI P Dynamc Lnear Models wth R. Department of Mathematcal Scences. Sprnger. Fayettevlle, USA. 251 p. PFAFF B Analyss of Integrated and Contegrated Tme Seres wth R. Sprnger. Dvson of Publc Health Scences.Washngton, USA.189 p. QUICK J. M Statstcal Analyss wth R. Packt Publshng. Olton Brmngham, UK. 282 p. Ruppert, D Statstcs and Data Analyss for Fnancal Engneerng. School of Operatons Research and Informaton Engneerng. Sprnger. New York, USA. 638 p. 155

169 SHAYLER R. S Matrx Algebra Useful for Statstcs. John Wley & sons. New York State College of Agrculture and Lfe Scences Cornell Unversty, N. Y., USA. 450 p. SPECTOR P Data Manpulaton wth R. Department of statstcs, Unversty of Calforna. Sprnger. New York, USA. 152 p. SHUMWAY H. R Tme Seres Analyss and ts Applcatons wth R Examples. Sprnger, Thrd edton. Department of Statstcs, Unversty of Calforna, USA. 609 p. TROSSET M. W A Introducton to Statstcal Inference and Its Applcatons wth R. Department of Matematcs, College of Wllam & Mary. USA. 350 P. VIRASAKDI CHONGSUVIVATWONG Análss of Epdemologcal Data Usng R and Epcale. Epdemology Unt Prnce of Songkla Unversty, Thaland. P 273 VERZANI J Usng R for ntroductory Statstcs. Taylor & Francs. Boca Raton London New York Washngton, USA. 402 p. WEI, W. W. S Tme Seres Analyss: unvarate and multvarate methods. 2 edtons, Pearson Educaton. Department of Statstcs, The Fox school of Busness and management. Unted states of Amerca. 614 p. Plan de evaluacón Apoyos Drectos al campo, PROCAMPO. Juno, Apoyos y Servcos a la Comercalzacón Agropecuara (ASERCA). Lbrería R. Consultado en Dsponble en Apoyos y servco a la comercalzacón agropecuara (ASERCA). Consultas de Precos y Productos. Consultado en Dsponble en Insttuto Naconal de Estadístca y Geográfca (INEGI). Anuaro Estadístco de los Estados Undos mexcanos. Consultado en Dsponble en 156

170 n=1&upc= Insttuto Naconal de Estadístca y Geográfca (INEGI). Sector Almentaro de Méxco Consultado en Dsponble en Organzacón de la Nacones Undas para la Agrcultura y la Almentacón (FAO). FAOESTAT, Exportacones e Importacones. Consultado en Dsponble en Servco de Informacón Agroalmentara y Pesquera (SIAP). Cerre de produccón agrícola por cultvo. Consultado en Dsponble en

171 IX. ANEXO A. TABLAS DE DATOS ANEXOS Anexo 9. 1 Datos de la Produccón de Maíz, Consumo Aparente, Importacón y Poblacón en Méxco de Anexo 9. 2 Varable para el Análss Econométrco de la Produccón de Maíz en Méxco para los años 1980 a Varables para el análss econométrco de la produccón de maíz a partr de 1980 a 2009 AÑO PMG CA PT REN SUP IMP

CURSO INTERNACIONAL: CONSTRUCCIÓN DE ESCENARIOS ECONÓMICOS Y ECONOMETRÍA AVANZADA. Instructor: Horacio Catalán Alonso

CURSO INTERNACIONAL: CONSTRUCCIÓN DE ESCENARIOS ECONÓMICOS Y ECONOMETRÍA AVANZADA. Instructor: Horacio Catalán Alonso CURSO ITERACIOAL: COSTRUCCIÓ DE ESCEARIOS ECOÓMICOS ECOOMETRÍA AVAZADA Instructor: Horaco Catalán Alonso Modelo de Regresón Lneal Smple El modelo de regresón lneal representa un marco metodológco, que

Más detalles

Análisis de Regresión y Correlación

Análisis de Regresión y Correlación 1 Análss de Regresón y Correlacón El análss de regresón consste en emplear métodos que permtan determnar la mejor relacón funconal entre dos o más varables concomtantes (o relaconadas). El análss de correlacón

Más detalles

Tema 1: Estadística Descriptiva Unidimensional Unidad 2: Medidas de Posición, Dispersión y de Forma

Tema 1: Estadística Descriptiva Unidimensional Unidad 2: Medidas de Posición, Dispersión y de Forma Estadístca Tema 1: Estadístca Descrptva Undmensonal Undad 2: Meddas de Poscón, Dspersón y de Forma Área de Estadístca e Investgacón Operatva Lceso J. Rodríguez-Aragón Septembre 2010 Contendos...............................................................

Más detalles

Relaciones entre variables

Relaciones entre variables Relacones entre varables Las técncas de regresón permten hacer predccones sobre los valores de certa varable Y (dependente), a partr de los de otra (ndependente), entre las que se ntuye que exste una relacón.

Más detalles

EXPERIMENTACIÓN COMERCIAL(I)

EXPERIMENTACIÓN COMERCIAL(I) EXPERIMENTACIÓN COMERCIAL(I) En un expermento comercal el nvestgador modfca algún factor (denomnado varable explcatva o ndependente) para observar el efecto de esta modfcacón sobre otro factor (denomnado

Más detalles

Modelos lineales Regresión simple y múl3ple

Modelos lineales Regresión simple y múl3ple Modelos lneales Regresón smple y múl3ple Dept. of Marne Scence and Appled Bology Jose Jacobo Zubcoff Modelos de Regresón Smple Que tpo de relacón exste entre varables Predccón de valores a partr de una

Más detalles

Econometría. Ayudantía # 01, Conceptos Generales, Modelo de Regresión. Profesor: Carlos R. Pitta 1

Econometría. Ayudantía # 01, Conceptos Generales, Modelo de Regresión. Profesor: Carlos R. Pitta 1 Escuela de Ingenería Comercal Ayudantía # 01, Conceptos Generales, Modelo de Regresón Profesor: Carlos R. Ptta 1 1 cptta@spm.uach.cl Escuela de Ingenería Comercal Ayudantía 01 Parte 01: Comentes Señale

Más detalles

Tema 3. Estadísticos univariados: tendencia central, variabilidad, asimetría y curtosis

Tema 3. Estadísticos univariados: tendencia central, variabilidad, asimetría y curtosis Tema. Estadístcos unvarados: tendenca central, varabldad, asmetría y curtoss 1. MEDIDA DE TEDECIA CETRAL La meda artmétca La medana La moda Comparacón entre las meddas de tendenca central. MEDIDA DE VARIACIÓ

Más detalles

CAPÍTULO 5 REGRESIÓN CON VARIABLES CUALITATIVAS

CAPÍTULO 5 REGRESIÓN CON VARIABLES CUALITATIVAS CAPÍTULO 5 REGRESIÓN CON VARIABLES CUALITATIVAS Edgar Acuña Fernández Departamento de Matemátcas Unversdad de Puerto Rco Recnto Unverstaro de Mayagüez Edgar Acuña Analss de Regreson Regresón con varables

Más detalles

REGRESION Y CORRELACION

REGRESION Y CORRELACION nav Estadístca (complementos) 1 REGRESION Y CORRELACION Fórmulas báscas en la regresón lneal smple Como ejemplo de análss de regresón, descrbremos el caso de Pzzería Armand, cadena de restaurantes de comda

Más detalles

Capitalización y descuento simple

Capitalización y descuento simple Undad 2 Captalzacón y descuento smple 2.1. Captalzacón smple o nterés smple 2.1.1. Magntudes dervadas 2.2. Intereses antcpados 2.3. Cálculo de los ntereses smples. Métodos abrevados 2.3.1. Método de los

Más detalles

Aspectos fundamentales en el análisis de asociación

Aspectos fundamentales en el análisis de asociación Carrera: Ingenería de Almentos Perodo: BR01 Docente: Lc. María V. León Asgnatura: Estadístca II Seccón A Análss de Regresón y Correlacón Lneal Smple Poblacones bvarantes Una poblacón b-varante contene

Más detalles

Investigación y Técnicas de Mercado. Previsión de Ventas TÉCNICAS CUANTITATIVAS ELEMENTALES DE PREVISIÓN UNIVARIANTE. (IV): Ajustes de Tendencia

Investigación y Técnicas de Mercado. Previsión de Ventas TÉCNICAS CUANTITATIVAS ELEMENTALES DE PREVISIÓN UNIVARIANTE. (IV): Ajustes de Tendencia Investgacón y Técncas de Mercado Prevsón de Ventas TÉCNICAS CUANTITATIVAS ELEMENTALES DE PREVISIÓN UNIVARIANTE. (IV): s de Tendenca Profesor: Ramón Mahía Curso 00-003 I.- Introduccón Hasta el momento,

Más detalles

2.2 TASA INTERNA DE RETORNO (TIR). Flujo de Caja Netos en el Tiempo

2.2 TASA INTERNA DE RETORNO (TIR). Flujo de Caja Netos en el Tiempo Evaluacón Económca de Proyectos de Inversón 1 ANTECEDENTES GENERALES. La evaluacón se podría defnr, smplemente, como el proceso en el cual se determna el mérto, valor o sgnfcanca de un proyecto. Este proceso

Más detalles

Figura 1

Figura 1 5 Regresón Lneal Smple 5. Introduccón 90 En muchos problemas centífcos nteresa hallar la relacón entre una varable (Y), llamada varable de respuesta, ó varable de salda, ó varable dependente y un conjunto

Más detalles

Instituto Tecnológico Superior del Sur del Estado de Yucatán EGRESIÓN LINEAL REGRESI. 10 kg. 10 cm

Instituto Tecnológico Superior del Sur del Estado de Yucatán EGRESIÓN LINEAL REGRESI. 10 kg. 10 cm Insttuto Tecnológco Superor del Sur del Estado de Yucatán REGRESI EGRESIÓN LINEAL 100 90 80 70 60 10 kg. 50 40 10 cm. 30 140 150 160 170 180 190 200 Objetvo de la undad Insttuto Tecnológco Superor del

Más detalles

Histogramas: Es un diagrama de barras pero los datos son siempre cuantitativos agrupados en clases o intervalos.

Histogramas: Es un diagrama de barras pero los datos son siempre cuantitativos agrupados en clases o intervalos. ESTADÍSTICA I. Recuerda: Poblacón: Es el conjunto de todos los elementos que cumplen una determnada propedad, que llamamos carácter estadístco. Los elementos de la poblacón se llaman ndvduos. Muestra:

Más detalles

Problemas donde intervienen dos o más variables numéricas

Problemas donde intervienen dos o más variables numéricas Análss de Regresón y Correlacón Lneal Problemas donde ntervenen dos o más varables numércas Estudaremos el tpo de relacones que exsten entre ellas, y de que forma se asocan Ejemplos: La presón de una masa

Más detalles

Correlación y regresión lineal simple

Correlación y regresión lineal simple . Regresón lneal smple Correlacón y regresón lneal smple. Introduccón La correlacón entre dos varables ( e Y) se refere a la relacón exstente entre ellas de tal manera que a determnados valores de se asocan

Más detalles

12-16 de Noviembre de 2012. Francisco Javier Burgos Fernández

12-16 de Noviembre de 2012. Francisco Javier Burgos Fernández MEMORIA DE LA ESTANCIA CON EL GRUPO DE VISIÓN Y COLOR DEL INSTITUTO UNIVERSITARIO DE FÍSICA APLICADA A LAS CIENCIAS TECNOLÓGICAS. UNIVERSIDAD DE ALICANTE. 1-16 de Novembre de 01 Francsco Javer Burgos Fernández

Más detalles

CAPÍTULO 4 MARCO TEÓRICO

CAPÍTULO 4 MARCO TEÓRICO CAPÍTULO 4 MARCO TEÓRICO Cabe menconar que durante el proceso de medcón, la precsón y la exacttud de cualquer magntud físca está lmtada. Esta lmtacón se debe a que las medcones físcas sempre contenen errores.

Más detalles

MODELOS DE ELECCIÓN BINARIA

MODELOS DE ELECCIÓN BINARIA MODELOS DE ELECCIÓN BINARIA Econometría I UNLP http://www.econometra1.depeco.econo.unlp.edu.ar/ Modelos de Eleccón Bnara: Introduccón Estamos nteresados en la probabldad de ocurrenca de certo evento Podemos

Más detalles

Muestra: son datos de corte transversal correspondientes a 120 familias españolas.

Muestra: son datos de corte transversal correspondientes a 120 familias españolas. Capítulo II: El Modelo Lneal Clásco - Estmacón Aplcacones Informátcas 3. APLICACIONES INFORMÁTICAS Fchero : cp.wf (modelo de regresón smple) Seres: : consumo famlar mensual en mles de pesetas RENTA: renta

Más detalles

CAPITULO 3.- ANÁLISIS CONJUNTO DE DOS VARIABLES. 3.1 Presentación de los datos. Tablas de doble entrada.

CAPITULO 3.- ANÁLISIS CONJUNTO DE DOS VARIABLES. 3.1 Presentación de los datos. Tablas de doble entrada. Introduccón a la Estadístca Empresaral Capítulo - Análss conjunto de dos varables Jesús ánchez Fernández CAPITULO - AÁLII COJUTO DE DO VARIABLE Presentacón de los datos Tablas de doble entrada En el capítulo

Más detalles

De factores fijos. Mixto. Con interacción Sin interacción. No equilibrado. Jerarquizado

De factores fijos. Mixto. Con interacción Sin interacción. No equilibrado. Jerarquizado Análss de la varanza con dos factores. Introduccón Hasta ahora se ha vsto el modelo de análss de la varanza con un factor que es una varable cualtatva cuyas categorías srven para clasfcar las meddas de

Más detalles

Licenciatura en Administración y Dirección de Empresas INTRODUCCIÓN A LA ESTADÍSTICA EMPRESARIAL

Licenciatura en Administración y Dirección de Empresas INTRODUCCIÓN A LA ESTADÍSTICA EMPRESARIAL INTRODUCCIÓN A LA ESTADÍSTICA EMPRESARIAL Relacón de Ejerccos nº 2 ( tema 5) Curso 2002/2003 1) Las cento trenta agencas de una entdad bancara presentaban, en el ejercco 2002, los sguentes datos correspondentes

Más detalles

EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 20 DE JUNIO DE horas

EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 20 DE JUNIO DE horas EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 0 DE JUNIO DE 018 15.30 horas Prmer Apelldo: Nombre: DNI: Teléfono: Segundo Apelldo: Grupo y Grado: Profesor(a): e-mal: Pregunta 1 A B C En Blanco

Más detalles

Inferencia en Regresión Lineal Simple

Inferencia en Regresión Lineal Simple Inferenca en Regresón Lneal Smple Modelo de regresón lneal smple: Se tenen n observacones de una varable explcatva x y de una varable respuesta y, ( x, y)(, x, y),...,( x n, y n ) el modelo estadístco

Más detalles

El Impacto de las Remesas en el PIB y el Consumo en México, 2015

El Impacto de las Remesas en el PIB y el Consumo en México, 2015 El Impacto de las Remesas en el y el Consumo en Méxco, 2015 Ilana Zárate Gutérrez y Javer González Rosas Cudad de Méxco Juno 23 de 2016 1 O B J E T I V O Durante muchos años la mgracón ha sdo vsta como

Más detalles

PROPORCIONAR RESERVA ROTANTE PARA EFECTUAR LA REGULACIÓN PRIMARIA DE FRECUENCIA ( RPF)

PROPORCIONAR RESERVA ROTANTE PARA EFECTUAR LA REGULACIÓN PRIMARIA DE FRECUENCIA ( RPF) ANEXO I EVALUACIÓN DE LA ENERGIA REGULANTE COMENSABLE (RRmj) OR ROORCIONAR RESERVA ROTANTE ARA EFECTUAR LA REGULACIÓN RIMARIA DE FRECUENCIA ( RF) REMISAS DE LA METODOLOGÍA Las pruebas dnámcas para la Regulacón

Más detalles

UNIVERSIDAD CARLOS III DE MADRID Ingeniería Informática Examen de Investigación Operativa 21 de enero de 2009

UNIVERSIDAD CARLOS III DE MADRID Ingeniería Informática Examen de Investigación Operativa 21 de enero de 2009 UNIVERSIDAD CARLOS III DE MADRID Ingenería Informátca Examen de Investgacón Operatva 2 de enero de 2009 PROBLEMA. (3 puntos) En Murca, junto al río Segura, exsten tres plantas ndustrales: P, P2 y P3. Todas

Más detalles

EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 6 de Junio de :00 horas. Pregunta 19 A B C En Blanco. Pregunta 18 A B C En Blanco

EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 6 de Junio de :00 horas. Pregunta 19 A B C En Blanco. Pregunta 18 A B C En Blanco EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 6 de Juno de 3 9: horas Prmer Apelldo: Nombre: DNI: Teléfono: Segundo Apelldo: Grupo y Grado: Profesor(a): e mal: Pregunta A B C En Blanco Pregunta

Más detalles

Smoothed Particle Hydrodynamics Animación Avanzada

Smoothed Particle Hydrodynamics Animación Avanzada Smoothed Partcle Hydrodynamcs Anmacón Avanzada Iván Alduán Íñguez 03 de Abrl de 2014 Índce Métodos sn malla Smoothed partcle hydrodynamcs Aplcacón del método en fludos Búsqueda de vecnos Métodos sn malla

Más detalles

PUBLICACIONES DE 4º CURSO

PUBLICACIONES DE 4º CURSO PUBLICACIONES DE 4º CURSO Grado: DERECHO-ADE Asgnatura: ECONOMERÍA Grupos: Únco ema: ESQUEMA EMA Profesores: Inmaculada Vllanúa Departamento de ANÁLISIS ECONÓMICO Curso Académco 04/5 ema : El Modelo Lneal

Más detalles

TEMA III EL ANÁLISIS DE REGRESIÓN LINEAL MÚLTIPLE

TEMA III EL ANÁLISIS DE REGRESIÓN LINEAL MÚLTIPLE TEMA III EL ANÁLISIS DE REGRESIÓN LINEAL MÚLTIPLE LECTURA OBLIGATORIA Regresón Lneal Múltple. En Ral, A. y Varela, J. (008). Estadístca Práctca para la Investgacón en Cencas de la Salud. Coruña: Netbblo.

Más detalles

Índice de Precios de las Materias Primas

Índice de Precios de las Materias Primas May-15 Resumen Ejecutvo El objetvo del (IPMP) es sntetzar la dnámca de los precos de las exportacones de Argentna, consderando la relatva establdad en el corto plazo de los precos de las ventas externas

Más detalles

OPERACIONES ARMONIZACION DE CRITERIOS EN CALCULO DE PRECIOS Y RENDIMIENTOS

OPERACIONES ARMONIZACION DE CRITERIOS EN CALCULO DE PRECIOS Y RENDIMIENTOS P L V S V LT R A BANCO DE ESPAÑA OPERACIONES Gestón de la Informacón ARMONIZACION DE CRITERIOS EN CALCULO DE PRECIOS Y RENDIMIENTOS El proceso de ntegracón fnancera dervado de la Unón Monetara exge la

Más detalles

Análisis cuantitativo aplicado al Comercio Internacional y el Transporte

Análisis cuantitativo aplicado al Comercio Internacional y el Transporte Máster de Comerco, Transporte y Comuncacones Internaconales Análss cuanttatvo aplcado al Comerco Internaconal y el Transporte Ramón úñez Sánchez Soraya Hdalgo Gallego Departamento de Economía Introduccón

Más detalles

TEMA III EL ANÁLISIS DE REGRESIÓN LINEAL MÚLTIPLE

TEMA III EL ANÁLISIS DE REGRESIÓN LINEAL MÚLTIPLE TEMA III EL ANÁLISIS DE REGRESIÓN LINEAL MÚLTIPLE LECTURA OBLIGATORIA Regresón Lneal Múltple. En Ral, A. y Varela, J. (008). Estadístca Práctca para la Investgacón en Cencas de la Salud. Coruña: Netbblo.

Más detalles

DEFINICIÓN DE INDICADORES

DEFINICIÓN DE INDICADORES DEFINICIÓN DE INDICADORES ÍNDICE 1. Notacón básca... 3 2. Indcadores de ntegracón: comerco total de benes... 4 2.1. Grado de apertura... 4 2.2. Grado de conexón... 4 2.3. Grado de conexón total... 5 2.4.

Más detalles

Unidad Central del Valle del Cauca Facultad de Ciencias Administrativas, Económicas y Contables Programa de Contaduría Pública

Unidad Central del Valle del Cauca Facultad de Ciencias Administrativas, Económicas y Contables Programa de Contaduría Pública Undad Central del Valle del Cauca Facultad de Cencas Admnstratvas, Económcas y Contables Programa de Contaduría Públca Curso de Matemátcas Fnanceras Profesor: Javer Hernando Ossa Ossa Ejerccos resueltos

Más detalles

TÉCNICAS AUXILIARES DE LABORATORIO

TÉCNICAS AUXILIARES DE LABORATORIO TÉCNICAS AUXILIARES DE LABORATORIO I.- ERRORES 1.- Introduccón Todas las meddas epermentales venen afectadas de una mprecsón nherente al proceso de medda. Puesto que en éste se trata, báscamente, de comparar

Más detalles

Pronósticos. Humberto R. Álvarez A., Ph. D.

Pronósticos. Humberto R. Álvarez A., Ph. D. Pronóstcos Humberto R. Álvarez A., Ph. D. Predccón, Pronóstco y Prospectva Predccón: estmacón de un acontecmento futuro que se basa en consderacones subjetvas, en la habldad, experenca y buen juco de las

Más detalles

Economía de la Empresa: Financiación

Economía de la Empresa: Financiación Economía de la Empresa: Fnancacón Francsco Pérez Hernández Departamento de Fnancacón e Investgacón de la Unversdad Autónoma de Madrd Objetvo del curso: Dentro del contexto de Economía de la Empresa, se

Más detalles

GERENCIA DE OPERACIONES Y PRODUCCIÓN DISEÑO DE NUEVOS PRODUCTOS Y SERVICIOS ESTRATEGIAS DE OPERACIONES

GERENCIA DE OPERACIONES Y PRODUCCIÓN DISEÑO DE NUEVOS PRODUCTOS Y SERVICIOS ESTRATEGIAS DE OPERACIONES GERENCIA DE OPERACIONES Y PRODUCCIÓN DISEÑO DE NUEVOS PRODUCTOS Y SERVICIOS ESTRATEGIAS DE OPERACIONES PRONÓSTICOS PREDICCIÓN, PRONÓSTICO Y PROSPECTIVA Predccón: estmacón de un acontecmento futuro que

Más detalles

TEMA 4 Variables aleatorias discretas Esperanza y varianza

TEMA 4 Variables aleatorias discretas Esperanza y varianza Métodos Estadístcos para la Ingenería Curso007/08 Felpe Ramírez Ingenería Técnca Químca Industral TEMA 4 Varables aleatoras dscretas Esperanza y varanza La Probabldad es la verdadera guía de la vda. Ccerón

Más detalles

GUIAS DE ACTIVIDADES Y TRABAJO PRACTICO Nº 22

GUIAS DE ACTIVIDADES Y TRABAJO PRACTICO Nº 22 DOCENTE: LIC.GUSTO DOLFO JUEZ GUI DE TJO PCTICO Nº 22 CES: POFESODO Y LICENCITU EN IOLOGI PGIN Nº 132 GUIS DE CTIIDDES Y TJO PCTICO Nº 22 OJETIOS: Lograr que el lumno: Interprete la nformacón de un vector.

Más detalles

EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 19 de Septiembre de :30 horas. Pregunta 19 A B C En Blanco

EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 19 de Septiembre de :30 horas. Pregunta 19 A B C En Blanco EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 19 de Septembre de 01 15:30 horas Prmer Apelldo: Nombre: DNI: Teléfono: Segundo Apelldo: Grupo y Grado: Profesor(a): e mal: Pregunta 1 A B C

Más detalles

ACTIVIDADES INICIALES

ACTIVIDADES INICIALES Soluconaro 7 Números complejos ACTIVIDADES INICIALES 7.I. Clasfca los sguentes números, dcendo a cuál de los conjuntos numércos pertenece (entendendo como tal el menor conjunto). a) 0 b) 6 c) d) e) 0 f)

Más detalles

Tema 6. Estadística descriptiva bivariable con variables numéricas

Tema 6. Estadística descriptiva bivariable con variables numéricas Clase 6 Tema 6. Estadístca descrptva bvarable con varables numércas Estadístca bvarable: tpos de relacón Relacón entre varables cuanttatvas Para dentfcar las característcas de una relacón entre dos varables

Más detalles

Examen Final de Econometría Grado

Examen Final de Econometría Grado Examen Fnal de Econometría Grado 17 de Mayo de 2016 15.30 horas Apelldos: Grado (ADE/ ECO): Nombre del profesor(a): Nombre: Grupo: Emal: Antes de empezar a resolver el examen, rellene TODA la nformacón

Más detalles

17/02/2015. Ángel Serrano Sánchez de León

17/02/2015. Ángel Serrano Sánchez de León Ángel Serrano Sánchez de León 1 Índce Introduccón Varables estadístcas Dstrbucones esde frecuencas c Introduccón a la representacón gráfca de datos Meddas de tendenca central: meda (artmétca, geométrca,

Más detalles

METODOLOGÍA MUESTRAL ENCUESTA A LAS PEQUEÑAS Y MEDIANAS EMPRESAS

METODOLOGÍA MUESTRAL ENCUESTA A LAS PEQUEÑAS Y MEDIANAS EMPRESAS SUBDIRECCIÓN TÉCNICA DEPARTAMENTO DE INVESTIGACIÓN Y DESARROLLO ÁREA DE ANÁLISIS ESTADÍSTICAS ECONÓMICAS METODOLOGÍA MUESTRAL ENCUESTA A LAS PEQUEÑAS Y MEDIANAS EMPRESAS Santago, Enero de 2008. Departamento

Más detalles

DISTRIBUCIONES BIDIMENSIONALES

DISTRIBUCIONES BIDIMENSIONALES Matemátcas 1º CT 1 DISTRIBUCIONES BIDIMENSIONALES PROBLEMAS RESUELTOS 1. a) Asoca las rectas de regresón: y = +16, y = 1 e y = 0,5 + 5 a las nubes de puntos sguentes: b) Asgna los coefcentes de correlacón

Más detalles

CÁLCULO DE INCERTIDUMBRE EN MEDIDAS FÍSICAS: MEDIDA DE UNA MASA

CÁLCULO DE INCERTIDUMBRE EN MEDIDAS FÍSICAS: MEDIDA DE UNA MASA CÁLCULO DE INCERTIDUMBRE EN MEDIDAS FÍSICAS: MEDIDA DE UNA MASA Alca Maroto, Rcard Boqué, Jord Ru, F. Xaver Rus Departamento de Químca Analítca y Químca Orgánca Unverstat Rovra Vrgl. Pl. Imperal Tàrraco,

Más detalles

CAPÍTULO 3 METODOLOGÍA. En el siguiente capítulo se presenta al inicio, definiciones de algunos conceptos actuariales

CAPÍTULO 3 METODOLOGÍA. En el siguiente capítulo se presenta al inicio, definiciones de algunos conceptos actuariales CAPÍTULO 3 METODOLOGÍA En el sguente capítulo se presenta al nco, defncones de algunos conceptos actuarales que se utlzan para la elaboracón de las bases técncas del Producto de Salud al gual que la metodología

Más detalles

Lección 4. Ejercicios complementarios.

Lección 4. Ejercicios complementarios. Introduccón a la Estadístca Grado en Tursmo Leccón 4. Ejerccos complementaros. Ejercco 1 (juno 06). La nformacón relatva al mes de enero sobre los ngresos (X) y los gastos (Y), expresados en mles de euros,

Más detalles

Medidas de Variabilidad

Medidas de Variabilidad Meddas de Varabldad Una medda de varabldad es un ndcador del grado de dspersón de un conjunto de observacones de una varable, en torno a la meda o centro físco de la msma. S la dspersón es poca, entonces

Más detalles

FE DE ERRATAS Y AÑADIDOS AL LIBRO FUNDAMENTOS DE LAS TÉCNICAS MULTIVARIANTES (Ximénez & San Martín, 2004)

FE DE ERRATAS Y AÑADIDOS AL LIBRO FUNDAMENTOS DE LAS TÉCNICAS MULTIVARIANTES (Ximénez & San Martín, 2004) FE DE ERRATAS Y AÑADIDOS AL LIBRO FUNDAMENTOS DE LAS TÉCNICAS MULTIVARIANTES (Xménez & San Martín, 004) Capítulo. Nocones báscas de álgebra de matrces Fe de erratas.. Cálculo de la transpuesta de una matrz

Más detalles

EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 17 de Mayo de :00 horas

EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 17 de Mayo de :00 horas EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 7 de Mayo de 08 9:00 horas Prmer Apelldo: Nombre: DNI: Teléfono: Segundo Apelldo: Grupo y Grado: Profesor(a): e-mal: Pregunta A B C En Blanco

Más detalles

Medidas de Tendencia Central y de Variabilidad

Medidas de Tendencia Central y de Variabilidad Meddas de Tendenca Central y de Varabldad Contendos Meddas descrptvas de forma: curtoss y asmetría Meddas de tendenca central: meda, medana y moda Meddas de dspersón: rango, varanza y desvacón estándar.

Más detalles

Departamento Administrativo Nacional de Estadística

Departamento Administrativo Nacional de Estadística Departamento Admnstratvo Naconal de Estadístca Dreccón de Censos Demografía METODOLOGIA ESTIMACIONES Y PROYECCIONES DE POBLACIÓN, POR ÁREA, SEXO Y EDAD PARA LOS DOMINIOS DE LA GRAN ENCUESTA INTEGRADA DE

Más detalles

Especialista en Estadística y Docencia Universitaria REGRESION LINEAL MULTIPLE

Especialista en Estadística y Docencia Universitaria REGRESION LINEAL MULTIPLE Especalsta en Estadístca y Docenca Unverstara REGRESION LINEAL MULTIPLE El modelo de regresón lneal múltple El modelo de regresón lneal múltple con p varables predctoras y basado en n observacones tomadas

Más detalles

DEMANDA PRIVADA REAL DE CRÉDITO

DEMANDA PRIVADA REAL DE CRÉDITO BANCO CENTRAL DE COSTA RICA DIVISIÓN ECONÓMICA DEPARTAMENTO DE INVESTIGACIONES ECONÓMICAS DEPARTAMENTO MONETARIO DIE-DM/07-2002-DI DOCUMENTO DE INVESTIGACIÓN JUNIO DEL 2002 DEMANDA PRIVADA REAL DE CRÉDITO

Más detalles

TEMA 8: PRÉSTAMOS ÍNDICE

TEMA 8: PRÉSTAMOS ÍNDICE TEM 8: PRÉSTMOS ÍNDICE 1. CONCEPTO DE PRÉSTMO: SISTEMS DE MORTIZCIÓN DE PRÉSTMOS... 1 2. NOMENCLTUR PR PRÉSTMOS DE MORTIZCIÓN FRCCIOND... 3 3. CUDRO DE MORTIZCIÓN GENERL... 3 4. MORTIZCIÓN DE PRÉSTMO MEDINTE

Más detalles

PROPUESTAS PARA LA DETERMINACIÓN DE LOS PARÁMETROS DEL GRÁFICO DE CONTROL MEWMA

PROPUESTAS PARA LA DETERMINACIÓN DE LOS PARÁMETROS DEL GRÁFICO DE CONTROL MEWMA Est. María. I. Flury Est. Crstna A. Barbero Est. Marta Rugger Insttuto de Investgacones Teórcas y Aplcadas. Escuela de Estadístca. PROPUESTAS PARA LA DETERMINACIÓN DE LOS PARÁMETROS DEL GRÁFICO DE CONTROL

Más detalles

Estimación de incertidumbres en calibración de Osciladores

Estimación de incertidumbres en calibración de Osciladores Estmacón de ncertdumbres en calbracón de Oscladores J. Maurco López R. Dvsón de Tempo Frecuenca Centro Naconal de Metrología maurco.lopez@cenam.mx Resumen La frecuenca de salda de los oscladores debe ser

Más detalles

Regresión múltiple k k

Regresión múltiple k k Métodos de Regresón Estadístca Ismael Sánchez Borrego Regresón múltple El modelo de regresón múltple es la extensón a k varables explcatvas del modelo de regresón smple estudado en el apartado anteror.

Más detalles

El contexto básico para el análisis es un modelo de regresión de la forma: α (1)

El contexto básico para el análisis es un modelo de regresión de la forma: α (1) ECONOMETRIA - ECON 3301 - SEMESTRE II - 08 Profesor: Ramón Rosales; rrosales@unandes.edu.co Profesor Taller: Wllam Delgado; w-delgad@unandes.edu.co Profesor Taller: Juan Carlos Vasquez; jvasquez@unandes.edu.co

Más detalles

e i para construir el modelo econométrico que se escribe a continuación:

e i para construir el modelo econométrico que se escribe a continuación: 5.3 Especfcacón del modelo empírco Para este análss se formló n modelo econométrco de seccón crzada, porqe las observacones corresponden a las característcas de las personas encestadas en n msmo período

Más detalles

Marcos Gutiérrez-Dávila marcosgd@ugr.es

Marcos Gutiérrez-Dávila marcosgd@ugr.es Marcos Gutérrez-Dávla marcosgd@ugr.es Introduccón: Relacón de la bomecánca con el deporte de competcón El gesto deportvo consttuye un patrón de movmento estable que se caracterza por el alto grado de efcenca

Más detalles

Boletín de la Tendencia Laboral del Desarrollo Humano

Boletín de la Tendencia Laboral del Desarrollo Humano Boletín de la Tendenca Laboral del Desarrollo Humano Notas técncas AÑO 05 NÚMERO 6 PROGRAMA DE LAS NACIONES UNIDAS PARA EL DESARROLLO MÉXICO Nota técnca Índce de Compettvdad Socal (cs) El cs es una medda

Más detalles

Pruebas Estadísticas de Números Pseudoaleatorios

Pruebas Estadísticas de Números Pseudoaleatorios Pruebas Estadístcas de Números Pseudoaleatoros Prueba de meda Consste en verfcar que los números generados tengan una meda estadístcamente gual a, de esta manera, se analza la sguente hpótess: H 0 : =

Más detalles

Clase 25. Macroeconomía, Sexta Parte

Clase 25. Macroeconomía, Sexta Parte Introduccón a la Facultad de Cs. Físcas y Matemátcas - Unversdad de Chle Clase 25. Macroeconomía, Sexta Parte 12 de Juno, 2008 Garca Se recomenda complementar la clase con una lectura cudadosa de los capítulos

Más detalles

Ejemplo: Consumo - Ingreso. Ingreso. Consumo. Población 60 familias

Ejemplo: Consumo - Ingreso. Ingreso. Consumo. Población 60 familias Ejemplo: Consumo - Ingreso Ingreso Consumo Poblacón 60 famlas ( YX ) P = x [ YX ] E = x Línea de regresón poblaconal 80 60 Meda Condconal 40 20 00 [ X = 200] EY o o o o [ X = 200] EY 80 o o o 60 o 40 8

Más detalles

Comparación entre distintos Criterios de decisión (VAN, TIR y PRI) Por: Pablo Lledó

Comparación entre distintos Criterios de decisión (VAN, TIR y PRI) Por: Pablo Lledó Comparacón entre dstntos Crteros de decsón (, TIR y PRI) Por: Pablo Lledó Master of Scence en Evaluacón de Proyectos (Unversty of York) Project Management Professonal (PMP certfed by the PMI) Profesor

Más detalles

ALN - SVD. Definición SVD. Definición SVD (Cont.) 29/05/2013. CeCal In. Co. Facultad de Ingeniería Universidad de la República.

ALN - SVD. Definición SVD. Definición SVD (Cont.) 29/05/2013. CeCal In. Co. Facultad de Ingeniería Universidad de la República. 9/05/03 ALN - VD CeCal In. Co. Facultad de Ingenería Unversdad de la Repúblca Índce Defncón Propedades de VD Ejemplo de VD Métodos para calcular VD Aplcacones de VD Repaso de matrces: Una matrz es Untara

Más detalles

Relación 2: Regresión Lineal.

Relación 2: Regresión Lineal. Relacón 2: Regresón Lneal. 1. Se llevó a cabo un estudo acerca de la cantdad de azúcar refnada (Y ) medante un certo proceso a varas temperaturas dferentes (X). Los datos se codfcan y regstraron en el

Más detalles

TEMA 10. OPERACIONES PASIVAS Y OPERACIONES ACTIVAS.

TEMA 10. OPERACIONES PASIVAS Y OPERACIONES ACTIVAS. GESTIÓN FINANCIERA. TEMA 10. OPERACIONES PASIVAS Y OPERACIONES ACTIVAS. 1.- Funconamento de las cuentas bancaras. FUNCIONAMIENTO DE LAS CUENTAS BANCARIAS. Las cuentas bancaras se dvden en tres partes:

Más detalles

1.- Una empresa se plantea una inversión cuyas características financieras son:

1.- Una empresa se plantea una inversión cuyas características financieras son: ESCUELA UNIVERSITARIA DE ESTUDIOS EMPRESARIALES. Departamento de Economía Aplcada (Matemátcas). Matemátcas Fnanceras. Relacón de Problemas. Rentas. 1.- Una empresa se plantea una nversón cuyas característcas

Más detalles

Trabajo y Energía Cinética

Trabajo y Energía Cinética Trabajo y Energía Cnétca Objetvo General Estudar el teorema de la varacón de la energía. Objetvos Partculares 1. Determnar el trabajo realzado por una fuerza constante sobre un objeto en movmento rectlíneo..

Más detalles

Universidad Simón Bolívar Conversión de Energía Eléctrica - Prof. José Manuel Aller

Universidad Simón Bolívar Conversión de Energía Eléctrica - Prof. José Manuel Aller Unversdad Smón Bolívar Conversón de Energía Eléctrca Prof José anuel Aller 41 Defncones báscas En este capítulo se estuda el comportamento de los crcutos acoplados magnétcamente, fjos en el espaco El medo

Más detalles

ECONOMETRÍA ELSA NORMA ELIZALDE ANGELES RED TERCER MILENIO

ECONOMETRÍA ELSA NORMA ELIZALDE ANGELES RED TERCER MILENIO ECONOMETRÍA ECONOMETRÍA ELSA NORMA ELIZALDE ANGELES RED TERCER MILENIO AVISO LEGAL Derechos Reservados 0, por RED TERCER MILENIO S.C. Vveros de Asís 96, Col. Vveros de la Loma, Tlalnepantla, C.P. 54080,

Más detalles

Problema: Existe relación entre el estado nutricional y el rendimiento académico de estudiantes de enseñanza básica?

Problema: Existe relación entre el estado nutricional y el rendimiento académico de estudiantes de enseñanza básica? Relacones entre varables cualtatvas Problema: xste relacón entre el estado nutrconal y el rendmento académco de estudantes de enseñanza básca? stado Nutrconal Malo Regular Bueno TOTAL Bajo 13 95 3 55 Rendmento

Más detalles

EJERCICIOS: Tema 3. Los ejercicios señalados con.r se consideran de conocimientos previos necesarios para la comprensión del tema 3.

EJERCICIOS: Tema 3. Los ejercicios señalados con.r se consideran de conocimientos previos necesarios para la comprensión del tema 3. EJERCICIOS: Tema 3 Los ejerccos señalados con.r se consderan de conocmentos prevos necesaros para la comprensón del tema 3. Ejercco 1.R Dos bblotecas con el msmo fondo bblográfco especalzado ofrecen las

Más detalles

Regresión Lineal Simple y Correlación

Regresión Lineal Simple y Correlación 4 Regresón Lneal Smple y Correlacón 4.1. Fundamentos teórcos 4.1.1. Regresón La regresón es la parte de la estadístca que trata de determnar la posble relacón entre una varable numérca, que suele llamarse

Más detalles

4 Contraste de hipótesis en el modelo de regresión múltiple

4 Contraste de hipótesis en el modelo de regresión múltiple 4 Contraste de hpótess en el modelo de regresón múltple Ezequel Urel Unversdad de Valenca Versón: 9-13 4.1 El contraste de hpótess: una panorámca 1 4.1.1 Formulacón de la hpótess nula y de la hpótess alternatva

Más detalles

EJERCICIO 1 1. VERDADERO 2. VERDADERO (Esta afirmación no es cierta en el caso del modelo general). 3. En el modelo lineal general

EJERCICIO 1 1. VERDADERO 2. VERDADERO (Esta afirmación no es cierta en el caso del modelo general). 3. En el modelo lineal general PRÁCTICA 6: MODELO DE REGRESIÓN MÚLTIPLE SOLUCIÓN EJERCICIO. VERDADERO. VERDADERO (Esta afrmacón no es certa en el caso del modelo general. 3. En el modelo lneal general Y =X β + ε, explcar la forma que

Más detalles

Diseño y Análisis de Experimentos en el SPSS 1

Diseño y Análisis de Experimentos en el SPSS 1 Dseño y Análss de Expermentos en el SPSS EJEMPLO. Los sguentes datos muestran las meddas de hemoglobna (gramos por 00 ml) en la sangre de 40 ejemplares de una espece de truchas marrones. Las truchas se

Más detalles

PORTAFOLIO DE TRES ACTIVOS FINANCIEROS

PORTAFOLIO DE TRES ACTIVOS FINANCIEROS PORTAFOLIO DE TRES ACTIVOS FINANCIEROS Contendo:. Introduccón.. Fondos Mutuos. Rendmento y Resgo.. Parámetros estadístcos de un Portafolo de Tres Actvos. a) El Retorno de un Portafolo. b) El Resgo de un

Más detalles

REGRESION LINEAL SIMPLE

REGRESION LINEAL SIMPLE REGREION LINEAL IMPLE Jorge Galbat Resco e dspone de una mustra de observacones formadas por pares de varables: (x 1, y 1 ) (x, y ).. (x n, y n ) A través de esta muestra, se desea estudar la relacón exstente

Más detalles

RESUELTOS POR M. I. A. MARIO LUIS CRUZ VARGAS PROBLEMAS RESUELTOS DE ANUALIDADES ANTICIPADAS

RESUELTOS POR M. I. A. MARIO LUIS CRUZ VARGAS PROBLEMAS RESUELTOS DE ANUALIDADES ANTICIPADAS PROBLEMAS RESUELTOS DE ANUALIDADES ANTICIPADAS. En las msmas condcones, qué tpo de anualdades produce un monto mayor: una vencda o una antcpada? Por qué? Las anualdades antcpadas producen un monto mayor

Más detalles

1.1 Ejercicios Resueltos Tema 1

1.1 Ejercicios Resueltos Tema 1 .. EJERCICIOS RESUELTOS TEMA. Ejerccos Resueltos Tema Ejemplo: Probarque ++3+ + n 3 + 3 +3 3 + + n 3 n (n +) Ã n (n +)! - Para n es certa, tambén lo comprobamos para n, 3,... ( + ) + 3 (+) supuesto certa

Más detalles

UNIDAD 12: Distribuciones bidimensionales. Correlación y regresión

UNIDAD 12: Distribuciones bidimensionales. Correlación y regresión Matemátcas aplcadas a las Cencas Socales UNIDAD 1: Dstrbucones bdmensonales. Correlacón regresón ACTIVIDADES-PÁG. 68 1. La meda la desvacón típca son: 1,866 0,065. Los jugadores que se encuentran por encma

Más detalles

Reconciliación de datos experimentales. MI5022 Análisis y simulación de procesos mineralúgicos

Reconciliación de datos experimentales. MI5022 Análisis y simulación de procesos mineralúgicos Reconclacón de datos expermentales MI5022 Análss y smulacón de procesos mneralúgcos Balances Balances en una celda de flotacón En torno a una celda de flotacón (o un crcuto) se pueden escrbr los sguentes

Más detalles

Regresión lineal y correlación lineal

Regresión lineal y correlación lineal UNIVERSIDAD ESTATAL DEL SUR DE MANABÍ Creada medante regstro Ofcal 61 del 7 de Febrero del 001 CARRERA DE AUDITORÍA Novembre 016 abrl 017 Semnaro de Investgacón Regresón lneal y correlacón lneal Dra. Marsabel

Más detalles

TERMODINÁMICA AVANZADA

TERMODINÁMICA AVANZADA TERMODINÁMICA AVANZADA Undad III: Termodnámca del Equlbro Ecuacones para el coefcente de actvdad Funcones de eceso para mezclas multcomponentes 9/7/0 Rafael Gamero Funcones de eceso en mezclas bnaras Epansón

Más detalles

Estimación de la Demanda: Pronósticos

Estimación de la Demanda: Pronósticos UNIVERSIDAD SIMON BOLIVAR Estmacón de la Demanda: Pronóstcos PS-4161 Gestón de la Produccón I 1 Bblografía Recomendada Título: Dreccón de la Produccón: Decsones Estratégcas. Capítulo 4: Prevsón Autores:

Más detalles

Análisis de error y tratamiento de datos obtenidos en el laboratorio

Análisis de error y tratamiento de datos obtenidos en el laboratorio Análss de error tratamento de datos obtendos en el laboratoro ITRODUCCIÓ Todas las meddas epermentales venen afectadas de una certa mprecsón nevtable debda a las mperfeccones del aparato de medda, o a

Más detalles

PRUEBAS DE ACCESO A LAS UNIVERSIDADES DE ANDALUCÍA PARA MAYORES DE 25 AÑOS MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES

PRUEBAS DE ACCESO A LAS UNIVERSIDADES DE ANDALUCÍA PARA MAYORES DE 25 AÑOS MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES PRUEBAS DE ACCESO A LAS UNIVERSIDADES DE ANDALUCÍA PARA MAYORES DE AÑOS EXÁMENES PROPUESTOS Y RESUELTOS DE MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES CONVOCATORIAS DE --- F Jménez Gómez Este cuaderno

Más detalles