Pronósticos Automáticos

Documentos relacionados
Series de Tiempo Suavización

Gráfico de Desgaste de Herramientas

Análisis Probit. StatFolio de Ejemplo: probit.sgp

Grafico Cusum (Mascara-V)

Estadística Industrial. Universidad Carlos III de Madrid Series temporales Práctica 5

Gráfico Arrhenius. Ejemplo StatFolio: arrhenius.sgp

Análisis de Componentes de la Varianza

Gráficos X-Bar y S. StatFolio de Muestra: xbarschart.sgp

Transformaciones de Potencia

Modelos de Calibración

Gráfico de Medias Móviles (MA)

Diseño de Experimentos Diseños de un Solo Factor Categórico

Gráfico de Control T-Cuadrada Multivariada

Transformaciones de Box-Cox

Análisis de Capacidad Multivariada

Guía breve de análisis de series temporales unidimensionales con Gretl

Exactitud y Linearidad del Calibrador

Gráfico ARIMA. Ejemplo StatFolio: ARIMA charts.sgp

Histogramas. Ejemplo StatFolio: histogram.sgp

Este procedimiento prueba hipótesis acerca de cualquiera de los siguientes parámetros:

Método del Rango (Estudio del Calibrador Variables)

Regresión No Lineal. StatFolio de ejemplo: nonlinear reg.sgp

INDICE. XV 1. Introducción a los pronósticos Actividad

Comparación de dos Muestras - SnapStat

Regresión en Cadena. StatFolio de Ejemplo: ridge reg.sgp

Modelado y simulación en Ingeniería Química. Manuel Rodríguez

PRACTICAS SOBRE LA MODELIZACIÓN DE SERIES TEMPORALES MENSUALES CON LA METODOLOGÍA DE BOX-JENKINS

Diseño de Experimentos Optimización de Múltiples Respuestas

CURSO: ECONOMETRÍA Y ANÁLISIS DE POLÍTICAS FISCALES INSTRUCTOR: HORACIO CATALÁN ALONSO. Especificación de los modelos VAR

Ejemplos de estudios de series de tiempo

Unidad Temática 3: Estadística Analítica. Unidad 9 Regresión Lineal Simple Tema 15

Análisis de Series de Tiempo

EJC 22: METODOLOGÍA BOX JENKINS

Gráficos EWMA. Ejemplo StatFolio: ewmachart.sgp

Estadística y sus aplicaciones en Ciencias Sociales 5. Estimación. Facultad de Ciencias Sociales, UdelaR

Análisis de Capabilidad (Porcentaje Defectuoso)

Gráfico de Control de Aceptación

Instructores: Dr. Martín A. Díaz Viera Dr. Ricardo Casar González

Explicación de la tarea 8 Felipe Guerra

Determinación del tamaño de muestra (para una sola muestra)

Diseño de Experimentos Diseños Factoriales Multinivel

Método del Rango y Promedio (Estudio del Calibrador - Variables)

Selección Diseño de Cribado

Gráfico de Probabilidad Normal

Método Analítico (Estudio del Calibrador Atributos)

Estimación. Diseño Estadístico y Herramientas para la Calidad. Estimación. Estimación. Inferencia Estadística

Tema: Análisis de valores faltantes con SPSS

Método de Análisis del Riesgo (Estudio del Calibrador Atributos)

Ajustando Distribución (Datos Censurados)

Grafico de Cajas y Bigotes

Mínimos Cuadrados Parciales

Diseño de Experimentos Diseños para Varios Factores Categóricos

Modelos de suavizado, aditivos y mixtos

Universidad Mariano Gálvez Ingeniería Electrónica Estadística inferencial. Presenta Dra. En Ing. Rita Victoria de León Ardón

DIPLOMADO EN MODELOS ECONOMÉTRICOS DINÁMICOS. Coordinador: M.F. Esperanza Sainz López

CAPÍTULO 2: PRODUCTOS Y DEMANDAS. en Funpimet, por lo que aquí se analizan los datos históricos de ventas para pronosticar

Diseño de Experimentos Diseño de Componentes de la Varianza

Estimación de Parámetros. Jhon Jairo Padilla A., PhD.

Estimación de Parámetros. Jhon Jairo Padilla A., PhD.

CURSO DE METODOLOGIA DE LA INVESTIGACION

DIPLOMADO EN RELACIONES LABORALES Estadística Asistida por Ordenador Curso

Sílabo de Estadística II

Gráficos de Probabilidad

ADMINISTRACION DE OPERACIONES

Método ANOVA (Estudio del Calibrador Variables)

INDICE Capitulo uno Introducción y estadísticas descriptiva Capitulo dos Conceptos en probabilidad Capitulo tres

PROBLEMAS RESUELTOS SELECTIVIDAD ANDALUCÍA 2005 MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES TEMA 6: TEORÍA DE MUESTRAS

Correlaciones Canónicas

Introducción a las series de tiempo

STATGRAPHICS genera tres tipos de planes de muestreo de aceptación:

INDICE 1. Introducción 2. Recopilación de Datos Caso de estudia A 3. Descripción y Resumen de Datos 4. Presentación de Datos

Econometría II Grado en finanzas y contabilidad

Pronóstico. Pronósticos. Factores Controlables. Porqué? Objetivo. Factores Incontrolables

Análisis Estadístico con Stata. Validación, Pronóstico y Estimación con Programación Matricial (Mata)

Inferencia Estadística

Método Teoría de la Señal (Estudio del Calibrador Atributos)

GEOESTADÍSTICA STICA APLICADA. Tema: Análisis Estructural UNIVERSIDAD NACIONAL AUTÓNOMA

Gráfico Múltiple de Caja y Bigotes

Regresión. Instituto Tecnológico de Ciudad Victoria Maestría en Ciencias en Biología Sesión de Cómputo. Modelo I

Modelos de Series de Tiempo

DIRECCIÓN Y ADMINISTRACIÓN DE PEQUEÑAS EMPRESAS

Curso de nivelación Estadística y Matemática

INTERVALOS DE CONFIANZA

5. Estimación del Modelo y Resultados

TRATAMIENTO DE DATOS CON MS EXCEL. Modulo 2

Método de cuadrados mínimos

Regresión Polinomial. StatFolio de Ejemplo: polynomial reg.sgp

Capítulo IV CASO DE APLICACIÓN

Cómo redactar el reporte.

ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE

Análisis Estadístico en Simulaciones. UCR ECCI CI-1453 Investigación de Operaciones Prof. M.Sc. Kryscia Daviana Ramírez Benavides

Transcripción:

Pronósticos Automáticos Resumen El procedimiento de Pronósticos Automáticos esta diseñado para pronosticar valores futuros en datos de una serie de tiempo. Una serie de tiempo consiste en un conjunto de datos numéricos secuenciales tomados en intervalos igualmente espaciados, generalmente sobre un periodo de tiempo o espacio. Desemejante al procedimiento de pronósticos se espera que el usuario seleccione el modelo del pronóstico a utilizar, este procedimiento contiene muchos modelos y selecciona al mejor modelo posible según criterios especificados. El criterio disponible para la sección del modelo incluye el Criterio de Información Ataide (AIC), el Criterio Hannan-Quinn (HQC), y el Criterio Schwarz- Bayesian (SBC). Este criterio selecciona con el cuadrado medio del error más pequeño, sujeto a una penalización para el número de parámetros desconocidos que se necesitan estimar. Puesto que la salida de este procedimiento es similar al procedimiento Pronósticos, este documento destacará solamente los aspectos únicos del procedimiento de Pronósticos Automáticos. Para una discusión detallada de todas las tablas, consulte la documentación de Pronósticos. Ejemplo StatFolio: autocast.sgp Datos del Ejemplo: El archivo golden gate.sf6 contiene volúmenes mensuales de trafico en Golden Gate Bridge en San Francisco para un periodo de n = 168 meses desde Enero, 1968 hasta Diciembre, 1981. La tabla de abajo muestra una lista parcial de los datos de este archivo: Month (Mes) Traffic (Trafico) 1/68 73.637 2/68 77.136 3/68 81.481 4/68 84.127 5/68 84.562 6/68 91.959 7/68 94.174 8/68 96.087 9/68 88.952 10/68 83.479 11/68 80.814 12/68 77.466 1/69 75.225 2006 por StatPoint, Inc. Pronósticos Automáticos - 1

Los datos fueron obtenidos de una publicación del Golden Gate Bridge. Entrada de Datos La caja de dialogo para la entrada de datos solicita el nombre de la columna que contienen los datos de la serie de tiempo: Datos: Contiene la columna numérica con n observaciones numéricas igualmente espaciadas. Intervalo de Muestreo: Define el intervalo entre observaciones sucesivas. Por ejemplo, los datos del Golden Gate Bridge fueron recolectados una vez cada mes, empezando en Enero, 1968. Estacionalidad: La longitud de la estacionalidad es s, si la hay. Los datos son estaciónales si existen un patrón que se repite en un periodo fijo. Por ejemplo, los datos mensuales como el trafico sobre Golden Gate Bridge tienen una estacionalidad de s = 12. Los datos de horas que se repiten cada día tienen una estacionalidad de s = 24. Si no se ingresa nada, se asume que los datos tienen estacionalidad (s=1). 2006 por StatPoint, Inc. Pronósticos Automáticos - 2

Ajustar los Días: Una variable numérica con n observaciones es utilizada para normalizar las observaciones originales, por ejemplo el número de días trabajados en un mes. Las observaciones en la columna Datos pueden ser divididos por estos valores antes de dibujar un grafico o calcular un análisis. Debe haber suficientes entradas en esta columna para cubrir tanto los datos observados como el número de periodos en los cuales se solicitan los pronósticos. Selección: La selección de un conjunto en los datos. Numero de Pronósticos: Número de periodos que continúan al final de los datos para los cuales se desean los pronósticos. Retención para Validación: Número de periodos m al final de la serie con propósitos de retención para la validación. Los datos en estos periodos no pueden utilizarse para estimar el modelo de pronósticos. Sin embargo, se calculan estadísticas que describen que tan bueno es el modelo estimado para poder pronosticar estas observaciones. En el ejemplo actual, los datos de trafico son mensuales empezando en Enero, 1968, y se tiene una estacionalidad de s = 12. Un m = 24 observaciones al final de la serie de tiempo con propósitos de retención para la validación, mientras los pronósticos pueden generarse de los siguientes 36 meses. Opciones del Análisis El modelo estimado por el procedimiento Pronósticos Automáticos es controlado por la caja de dialogo de Opciones del Análisis: 2006 por StatPoint, Inc. Pronósticos Automáticos - 3

Modelos Incluidos: Especifica el modelo que se debe estimar sobre los datos. Estos son los modelos de los cuales el mejor será seleccionado. La descripción de cada modelo puede encontrarse en la documentación de Pronósticos. Para varios modelos, opciones adicionales son proporcionadas: Modelo Walk Aleatorio Valida si se incluye constante para considerar un modelo que contenga una constante así como una sin constante. Modelo de Medias Móviles Seleccione el orden de valores máximo a considerar. Los modelos se estimarán a partir de 2 valores o más a través del número que se indique. ARIMA con términos AR Específica el orden máximo p de los términos autoregresivos en el modelo. ARIMA con términos MA Específica el orden máximo q de los términos de medias móviles en el modelo. Se puede elegir solo considerar modelos de la forma q = p 1. ARIMA con Diferenciación Específica el orden máximo de diferenciación d. Seleccione Incluir constante para considerar que el modelo incluya un termino constante cuando la diferenciación se desarrolla. 2006 por StatPoint, Inc. Pronósticos Automáticos - 4

Criterio de Información: El criterio utilizado para seleccionar el mejor modelo. Transformación: Antes de ajustar un modelo, los datos pueden transformarse usando algunas de las operaciones indicadas. El procedimiento estima cada uno de los modelos seleccionados y selecciona el modelo que encuentra el valor más pequeño sobre la selección del criterio. Son tres criterios a elegir de: Criterio de Información Akaike El Criterio de Información Akaike (AIC) es calculado por 2c AIC = 2 ln( RMSE) + (1) n donde RMSE es la raíz del cuadrado medio del error durante el periodo de estimación, c es el número de coeficientes estimados en el modelo estimado, y n es el tamaño de muestral utilizado para estimar el modelo. Nótese que AIC es una función de la varianza de los residuos del modelo, penalizado por el número de parámetros estimados. En general, el modelo que será seleccionado minimiza el cuadrado medio del error sin usar también muchos coeficientes (relativo a la cantidad de datos disponibles). Criterio de Hannan-Quinn El Criterio Hannan Quinn (HQC) es calculado por 2 p ln ( ) ( ln( n) ) HQC = 2 ln RMSE + (2) n Este criterio utiliza diferentes penalizaciones para el número de parámetros estimados. Criterio de Información Schwarz-Bayesian El Criterio de Información Schwarz-Bayesian (SBIC) es calculado por ( n) p ln SBIC = 2 ln( RMSE) + (3) n Una vez más, la penalización para el número de parámetros estimados es diferente que para los otros criterios. 2006 por StatPoint, Inc. Pronósticos Automáticos - 5

Resumen del Análisis La salida de Resumen del Análisis calcula un pronóstico estándar para cualquier modelo que tenga el valor más pequeño del criterio especificado. Pronósticos Automáticos - Traffic Datos/Variable: Traffic (Golden Gate Bridge Traffic Volume) Número de observaciones = 168 Indice Inicial = 1/68 Intervalo de Muestra = 1.0 mes(es) Longitud de la estacionalidad = 12 Resumen de Pronósticos Diferenciación no estacional de orden: 1 Diferenciación estacional de orden: 1 Modelo de pronóstico seleccionado: ARIMA(0,1,2)x(2,1,2)12 Número de pronósticos generados: 36 Número de periodos retenidos para validación: 24 Periodo de Periodo de Estadístico Estimación Validación RMSE 2.0522 1.55727 MAE 1.35877 1.16503 MAPE 1.49719 1.18882 ME -0.0402442 0.0221547 MPE -0.0732127 0.00847592 Resumen de Modelo ARIMA Parámetro Estimado Error Estd. t Valor-P MA(1) 0.242799 0.0877347 2.76742 0.006367 MA(2) 0.238687 0.0869116 2.74632 0.006770 SAR(1) -1.04978 0.13349-7.86407 0.000000 SAR(2) -0.0556194 0.119539-0.465283 0.642408 SMA(1) -0.243651 0.0819685-2.97249 0.003446 SMA(2) 0.899649 0.0464212 19.3801 0.000000 Pronóstico Histórico: sí Varianza estimada de ruido blanco = 4.37813 con 149 grados de libertad Desviación estándar estimada de ruido blanco = 2.0924 Número de iteraciones: 17 Al buscar en los modelos, el procedimiento intenta todos los modelos activados sobre la caja de dialogo de Opciones del Análisis. Nota: excepto para el Suavizamiento Exponencial Winter y los modelos ARIMA, los datos estaciónales primero serán ajustados estacionalmente antes de aplicar pronósticos. 2006 por StatPoint, Inc. Pronósticos Automáticos - 6

Una vez que se generan los pronósticos, la estacionalidad se desarrolla de nuevo para crear los pronósticos finales. Para los datos Golden Gate Bridge, se selecciona el procedimiento con un modelo ARIMA (0,1,2)x(2,1,2)12. Note que todos los coeficientes del modelo son estadísticamente significativos. Como podemos apreciar en el grafico sobre la estimación y los pronósticos, los resultados son satisfactorios: Traffic 123 113 103 93 Time Sequence Plot for Traffic ARIMA(0,1,2)x(2,1,2)12 actual forecast 95.0% limits 83 73 1/68 1/72 1/76 1/80 1/84 1/88 Comparación de Modelos El panel de Comparación de Modelos despliega información sobre los modelos que mejor se ajustan por cada tipo solicitado. La sección inferior resume los datos y listas de los modelos estimados: Comparación de Modelos Variable de datos: Traffic Número de observaciones = 168 Indice Inicial = 1/68 Intervalo de Muestra = 1.0 mes(es) Longitud de la estacionalidad = 12 Número de periodos retenidos para validación: 24 Modelos (A) Caminata aleatoria (B) Media constante = 93.153 (C) Tendencia lineal = 66.5074 + 0.0923593 t (D) Tendencia cuadrática = 41.5321 + 0.269169 t + -0.000306429 t^2 (E) Tendencia exponencial = exp(4.24508 + 0.000997307 t) (F) tendencia curtva-s = exp(4.8175 + -80.4029 /t) (H) Suavización exponencial simple con alfa = 0.7835 (I) Suavización exp. De Brown con alfa = 0.3388 Ajuste matemático: Box-Cox con potencia = 0.0 y adendo = 0.0 (J) Suavización exp. De Holt con alfa = 0.7613 y beta = 0.0143 (K) Suavización exp. cuadrática de Brown con alfa = 0.1791 (L) Suavización exp. de Winter con alfa = 0.5165, beta = 0.02, gama = 0.5 (M) ARIMA(0,1,2)x(2,1,2)12 (N) ARIMA(2,0,2)x(1,1,2)12 con constante (O) ARIMA(1,1,1)x(2,1,2)12 con constante (P) ARIMA(1,1,2)x(1,1,2)12 (Q) ARIMA(1,0,0)x(0,1,1)12 con constante 2006 por StatPoint, Inc. Pronósticos Automáticos - 7

Los cinco modelos ARIMA en la lista poseen el mejor ajuste, entre docenas que fueron estimadas. La siguiente sección resume el desarrollo de cada modelo durante la estimación del periodo: Periodo de Estimación Modelo RMSE MAE MAPE ME MPE AIC (A) 2.15723 1.32165 1.458-0.00150458-0.0242249 1.68591 (B) 5.0849 3.86344 4.251 0.00537199-0.292675 3.41922 (C) 3.24619 2.41982 2.66084 0.00022691-0.120425 2.53552 (D) 3.22054 2.34518 2.57551 0.000060774-0.116781 2.53354 (E) 3.25935 2.44179 2.68339 0.0548011-0.0613545 2.54361 (F) 3.19448 2.34628 2.5743 0.0524653-0.0587977 2.5034 (G) 2.48865 1.6626 1.82416 0.255358 0.232329 1.81704 (H) 2.91786 2.07536 2.27504 0.882328 0.869531 2.29448 (I) 2.65308 1.7498 1.92949 0.141644 0.126127 2.10422 (J) 2.96059 1.93325 2.13122-0.316974-0.389177 2.32355 (K) 2.56768 1.71834 1.89248-0.0438619-0.0727782 2.03878 (L) 3.04 1.96053 2.16142-0.361903-0.481662 2.22372 (M) 2.0522 1.35877 1.49719-0.0402442-0.0732127 1.52116 (N) 2.03378 1.25306 1.38098 0.0884528 0.0582524 1.53091 (O) 2.04984 1.33781 1.47744 0.0450175 0.0131063 1.53275 (P) 2.06766 1.28876 1.42164-0.0258518-0.0589859 1.53617 (Q) 2.11182 1.35568 1.49186 0.135221 0.102928 1.53677 La ultima columna hacia la derecha muestral los valores del criterio seleccionado para cada uno de los modelos. En la muestra de los datos, el modelo ARIMA (2,0,1)x(2,1,1)12 (Modelo M) es el mejor, aunque otros modelo ARIMA diferentes son muy cercanos. La salida también demuestra que tan bien estuvo cada modelo durante el periodo de validación de los pronósticos con las observaciones que fueron retenidas para la estimación del proceso: Periodo de Validación Modelo RMSE MAE MAPE ME MPE (A) 2.72132 1.42365 1.46028 0.00416832-0.00391219 (B) 35.7947 5.74478 5.79108 5.74478 5.79108 (C) 6.17679 2.06352 2.09452-2.01854-2.04853 (D) 2.49534 1.38226 1.41552-0.368482-0.386012 (E) 7.17915 2.2584 2.29013-2.25692-2.28857 (F) 2.80136 1.41307 1.4416-0.748106-0.767949 (G) 2.18546 1.30179 1.32752 0.136708 0.130939 (H) 2.56813 1.36359 1.40201 0.542393 0.537291 (I) 2.46638 1.39127 1.4176 0.374832 0.376192 (J) 4.15101 1.66548 1.70837 1.02078 1.01629 (K) 2.90303 1.44906 1.4631 0.424273 0.437374 (L) 4.15181 1.73076 1.76437 0.987824 0.953436 (M) 2.4251 1.16503 1.18882 0.0221547 0.00847592 (N) 2.09206 1.18016 1.22359-0.3114-0.330986 (O) 2.62911 1.13357 1.15323 0.301173 0.292195 (P) 2.0961 1.18316 1.22549-0.0621341-0.0776316 (Q) 2.26482 1.25482 1.29717-0.260738-0.278414 2006 por StatPoint, Inc. Pronósticos Automáticos - 8

El modelo ARIMA seleccionado posee un buen desarrollo, especialmente sobre MAPE con aproximadamente 1.2%, aunque podría cambiarse por otros modelos ARIMA con respecto a RMSE. 2006 por StatPoint, Inc. Pronósticos Automáticos - 9