Semana 3. Semana 3. Correlaciones. Introducción. Regresión. Diferenciación. Series de Tiempo. Suavizamiento. Descomposición.

Documentos relacionados
Regresión Lineal Múltiple

Métodos Estadísticos Multivariados

Estadística II Tema 4. Regresión lineal simple. Curso 2009/10

Modelación estadística: La regresión lineal simple

Estadística Diplomado

ANÁLISIS DE REGRESIÓN

Tema 4. Regresión lineal simple

Capítulo 8. Selección de variables Introducción

Método de cuadrados mínimos

peso edad grasas Regresión lineal simple Los datos

Análisis de Series de Tiempo. Universidad Nacional Autónoma de México. M. en C. César Almenara Martínez. 10 de Noviembre de 2010.

Econometría Aplicada

TEMA 4 Modelo de regresión múltiple

ESTADÍSTICA. Tema 4 Regresión lineal simple

TEMA 3 Modelo de regresión simple

Regresión múltiple. Demostraciones. Elisa Mª Molanes López

Modelado y simulación en Ingeniería Química. Manuel Rodríguez

Estadística II Ejercicios Tema 5

7. REGRESIÓN POR MÍNIMOS CUADRADOS: REGRESIÓN POLINOMIAL. Jorge Eduardo Ortiz Triviño

Herramientas para el Estudio de Mercado. Técnicas de Predicción.

Regresión Simple. Leticia Gracia Medrano. 2 de agosto del 2012

Universidad Mariano Gálvez Ingeniería Electrónica Estadística inferencial. Presenta Dra. En Ing. Rita Victoria de León Ardón

Tema1. Modelo Lineal General.

Estadística aplicada al medio ambiente

Estructura de este tema. Tema 4 Regresión lineal simple. Ejemplo: consumo de vino y dolencias cardíacas. Frecuencias

Regresión con errores autocorrelacionados

ESTADÍSTICA APLICADA. Tema 4: Regresión lineal simple

1. Conceptos de Regresión y Correlación. 2. Variables aleatorias bidimensionales. 3. Ajuste de una recta a una nube de puntos

Solución Ejercicio 7.

ARCH y GARCH. Series de tiempo. Miguel Ángel Chong R. 14 de mayo del 2013

Estimación de densidades basada en núcleos: algunos elementos. Isabel Cañette

7. ANÁLISIS DE VARIABLES CUANTITATIVAS: REGRESIÓN LINEAL SIMPLE

Relación 3 de problemas

Tercera práctica de REGRESIÓN.

Ajustando Curva SnapStat

Ejemplos de estudios de series de tiempo

Pronósticos, Series de Tiempo y Regresión. Capítulo 4: Regresión Lineal Múltiple

Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.

Multicolinealidad Introducción. Uno de los supuestos básicos del modelo lineal general. y = Xβ + u

Ejemplo de Regresión Lineal Simple

Modelos de Calibración

T3. El modelo lineal básico

Regresión lineal simple

T2. El modelo lineal simple

Regresión Lineal Múltiple

ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE

TEMA 2 Diseño de experimentos: modelos con varios factores

MÉTODOS DE PRONÓSTICO TEMA 1: ANÁLISIS DE SERIES DE TIEMPO Y ELABORACIÓN DE PRONÓSTICOS

Modelo de Regresión Lineal

1 Introducción. 2 Modelo. Hipótesis del modelo. MODELO DE REGRESIÓN SIMPLE Julián de la Horra Departamento de Matemáticas U.A.M.

Un modelo para representar una relación aproximadamente

Análisis de Series Temporales (Continuación)

Taller I Econometría I

REGRESIÓN Y ESTIMACIÓN TEMA 1: REGRESIÓN LINEAL SIMPLE

Modelo de Regresión Lineal Simple

Regresión Lineal. El modelo de regresión caracteriza la relación entre una variable respuesta que depende de k variables independientes o regresoras.

Datos bivariantes: regresión

Curso de nivelación Estadística y Matemática

ANÁLISIS DE REGRESIÓN N LINEAL

Procesos autorregresivos

Introducción a las series temporales

CLAVE Lab 11 - Regresión Lineal Simple y Polinomial

(x) = 1 si P (Y = 1 X = x) P (Y = 0 X = x) P (Y = 0 X = x) > P (Y = 1 X = x) P (X = x Y = 0)P (Y = 0) > P (X = x Y = 1)P (Y = 1)

El Modelo de Regresión Lineal General Estimación

Estadística II Examen Final 19/06/2015 Soluciones. Responda a las preguntas siguientes en los cuadernillos de la Universidad

TEMA 2: Propiedades de los estimadores MCO

que represente lo mejor posible la relación entre valores X e Y permitiéndonos inferir un valor a partir del otro.

Teoría de la decisión

Modelos de suavizado, aditivos y mixtos

Estadística Industrial. Universidad Carlos III de Madrid Series temporales Práctica 5

Análisis de Series de Tiempo

Econometría I (LADE). Curso 2001/2002 PRÁCTICA 08

ESTIMACIÓN Estas transparencias contienen material adaptado del curso de PATTERN RECOGNITION AND MACHINE LEARNING de Heikki Huttunen y del libro Duda.

Estadística para la Economía y la Gestión IN 3401

Tema 5. Muestreo y distribuciones muestrales

Guía breve de análisis de series temporales unidimensionales con Gretl

con los supuestos clásicos, uno de ellos es que ninguna de las variables X 1, X 2,, X K es

Econometría Aplicada

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 7)

Práctica 3: Regresión simple con R

Estadística y sus aplicaciones en Ciencias Sociales 5. Estimación. Facultad de Ciencias Sociales, UdelaR

Los estimadores mínimo cuadráticos bajo los supuestos clásicos

La recta de regresión

Tema 8: Regresión y Correlación

Sesgo y varianza del estimador de la razón. con el problema de presición vs. sesgo que ya discutimos. t y. ˆt x

Econometría de series de tiempo aplicada a macroeconomía y finanzas

ANALISIS DE REGRESIÓN Y CORRELACIÓN LINEAL

Apuntes de Series Temporales

Estimación de homografías

TODO ECONOMETRIA TEMA 1: MODELO BASICO DE REGRESIÓN LINEAL MULTIPLE (MBRL)

Regresion lineal simple

ASIGNATURA: ESTADISTICA II (II-055) Ing. César Torrez

Ejercicios Temas 3 y 4: Interpolación polinomial. Ajuste de curvas.

Econometría Universidad Carlos III de Madrid Examen Extraordinario 25 de Junio de Pr (N (0, 1) > 1, 282) = 0, 10

TEMA 10 Correlación y regresión. El modelo de regresión simple

Regresión Lineal Simple y Múltiple Regresión Logística

Unidad Temática 3: Estadística Analítica. Unidad 9 Regresión Lineal Simple Tema 15

Transcripción:

Series de Tiempo

Esquema 1 2 3 4 5 6

Esquema 1 2 3 4 5 6

jj 0 5 10 15 Dividendos de Johnson & Johnson 1960 1965 1970 1975 1980 ACF 0.2 0.2 0.4 0.6 0.8 1.0 0 1 2 3 4 5 6 ACF para la serie de dividendos de Johnson & Johnson.

AP 100 200 300 400 500 600 Pasajeros de Pan Am 1950 1952 1954 1956 1958 1960 ACF 0.2 0.2 0.4 0.6 0.8 1.0 0 1 2 3 4 ACF para la serie de pasajeros de Pan Am.

nysevec.mio 0 2000 6000 10000 NYSE 0 2000 4000 6000 8000 10000 12000 nyseret.mio 0.80 0.90 1.00 1.10 0 2000 4000 6000 8000 10000 12000 Indice del NYSE y returns.

ACF 0.0 0.2 0.4 0.6 0.8 1.0 NYSE 0 10 20 30 40 ACF 0.0 0.2 0.4 0.6 0.8 1.0 0 10 20 30 40 ACF para el índice del NYSE y returns.

v w 3 1 1 2 3 Ruido Blanco 0 100 200 300 400 500 3 1 1 2 3 Tiempo Promedio Movil (3) 0 100 200 300 400 500 v7 1.0 0.0 1.0 Tiempo Promedio Movil (7) 0 100 200 300 400 500 v15 0.6 0.2 0.2 0.6 Tiempo Promedio Movil (15) 0 100 200 300 400 500 Tiempo Promedio Movil con 3, 7 y 15 datos.

MA(3) ACF 0.0 0.2 0.4 0.6 0.8 1.0 0 10 20 30 40 MA(7) ACF 0.2 0.2 0.6 1.0 0 10 20 30 40 MA(15) ACF 0.2 0.2 0.6 1.0 0 10 20 30 40 Lag ACF para promedio Movil con 3, 7 y 15 datos.

speech 0 1000 2000 3000 4000 Grabacion de la silaba aaaaaaahhhhhh (0.1 s.) 0 200 400 600 800 1000 Tiempo Series speech ACF 0.5 0.0 0.5 1.0 0 50 100 150 200 250 ACF para datos de lenguaje.

1.0 0.5 0.0 0.5 1.0 Southern Oscillation Index 1950 1960 1970 1980 0 20 40 60 80 100 Incremento en la Poblacion de Peces 1950 1960 1970 1980 Series SOI e Incremento de Peces.

Southern Oscillation Index ACF 0.4 0.0 0.4 0.8 0 1 2 3 4 Lag Recruitment ACF 0.2 0.2 0.6 1.0 0 1 2 3 4 Lag SOI vs Recruitment CCF 0.6 0.2 0.2 4 2 0 2 4 Lag ACF para SOI e Incremento de Peces.

Esquema 1 2 3 4 5 6

Modelación de S T Enfoque General Graficar la serie y examinar sus características principales, en particular examinar si existe a) una tendencia, b) componentes estacionales, c) cambios repentinos en el comportamiento, d) observations atípicas (outliers). Eliminar la tendencia y las componentes estacionales para obtener residuales estacionarios. Para esto, es posible que sea necesario aplicar una transformación inicial a los datos. Escoger un modelo para los residuales estacionarios, usando diversas estadísticas muestrales, como la autocorrelación muestral. Verificar que los residuales que se obtienen una vez ajustado el modelo, son ruido blanco.

Enfoque General Graficamos los datos para verificar si hay discontinuidades aparentes en la serie, como un cambio de nivel o un cambio de variabilidad. Posibilidad de analizar la serie en segmentos homogéneos. Las observaciones atípicas deben estudiarse cuidadosamente para ver si es razonable eliminarlas.

Enfoque General El gráfico nos puede indicar si es razonable una descomposición del tipo donde X t = m t + s t + Y t m t es una función que varía lentamente que representa la tendencia de la serie, s t es una función periódica con período d que representa la componente estacional y Y t es un proceso estacionario.

Enfoque General Si las fluctuaciones estacionales y las producidas por el ruido aumentan con el nivel del proceso, puede ser necesario aplicar una transformación previa a los datos. Pasajeros de Pan Am en EEUU Pasajeros (1000s) log(ap) 100 200 300 400 500 600 5.0 5.5 6.0 6.5 1950 1952 1954 1956 1958 1960 1950 1952 1954 1956 1958 1960

Transformación logarítmica de os datos.

Tendencia Métodos para construcción de modelos: Ajuste de tendencia polinomial,. Métodos No Paramétricos: Promedios móviles Núcleo local Lowess Splines Espectral No resultan adecuados para construcción de modelos

Esquema 1 2 3 4 5 6

La gráfica muestra el número de huelgas en USA en el período 1951-1980. Huelgas en USA Huelgas 3500 4000 4500 5000 5500 6000 1950 1955 1960 1965 1970 1975 1980 Años

Ajustamos una tendencia cúbica: m t = β 0 + β 1 t + β 2 t 2 + β 3 t 3 a los datos x 1, x 2,..., x n usando mínimos cuadrados.: Buscamos los parámetros β 0, β 1, β 2, β 3 que minimizan la suma n (x t m t ) 2 t=1

Huelgas en USA Huelgas 3500 4000 4500 5000 5500 6000 1950 1955 1960 1965 1970 1975 1980 Años Ajuste de un polinomio cubíco a los datos.

Huelgas en USA Residuales 600 400 200 0 200 400 600 1950 1955 1960 1965 1970 1975 1980 Años Residuales del ajuste de un polinomio cuadrático a los datos.

Tenemos una serie X t, t = 1,..., n que es la serie de interés y queremos analizar la influencia de las series Z t1, Z t2,..., Z tq, con t = 1,..., n a través de una relación lineal: X t = β 1 Z t1 + β 2 Z t2 + + β q Z tq + w t Podemos escribir este modelo lineal de manera general como X t = β Z t + w t

Estimamos β por mínimos cuadrados: Q = n wt 2 = t=1 n (X t β Z t ) 2 t=1 La solución de este problema es ˆβ = (Z Z) 1 Z X Estos estimadores son insesgados y tienen varianza mínima entre los estimadores lineales insesgados.

La suma de errores al cuadrado mínimizada se denota por SSE y es SSE = n (X t ˆβ Z t ) 2 = X X ˆβZ X t=1 Si los errores tienen distribución normal, ˆβ también es el estimador de máxima verosimilitud de β y tiene distribución normal con Cov( ˆβ) = σ 2 w(z Z) 1 σ 2 wc.

Un estimador insesgado para la varianza es s 2 w = MSE = SSE n q donde MSE = Mean Squared Error. Bajo la hipótesis de normalidad, s 2 w tiene distribución χ 2 n q y es independiente de ˆβ. t n q = ˆβ i β i s w cii tiene distribución t con n q grados de libertad.

En este esquema podemos usar el análisis de la varianza para comparar modelos anidados, usando la distribución F. Este procedimiento puede usarse para seleccionar variables paso a paso. Una alternativa que busca comparar modelos sin proceder secuencialmente, evaluando cada modelo por separado, es la siguiente: Supongamos que consideramos un modelo de regresión normal con k coeficientes y llamamos el estimador de MV de la varianza ˆσ 2 k = SSE k n

Criterio de Akaike Akaike sugirió medir la calidad del ajuste para este modelo por una expresión que busca balancear el error del ajuste contra el número de parámetros en el modelo, a través del siguiente coeficiente AIC = log ˆσ 2 k + n + 2k n donde ˆσ k 2 es el estimador de MV de la varianza y k es el número de parámetros en el modelo.

Dos modificaciones de este criterio son las siguientes: Criterio de Akaike Corregido AICc = log ˆσ 2 k + Criterio de Información Bayesiano n + k n k 2 BIC = log ˆσ 2 k + k log n n

70 80 90 100 110 120 130 Mortalidad Cardiovascular 1970 1972 1974 1976 1978 1980 Mortalidad semanal por causas cardiovasculares en Los Angeles County.

Ajuste de tendencia polinomial Consideramos un modelo de la forma X t = m t + Y t donde m t es la tendencia. Una posible forma de m t es regresión polinomial: m t = β 0 + β 1 t + + β p t p que podemos ajustar por mínimos cuadrados.

Mortalidad Cardiovascular mortalidad 1970 1972 1974 1976 1978 1980 70 80 90 100 110 120 130 Ajuste de polinomio de grado 3 mostrando tendencia.

Mortalidad Cardiovascular Residuales 1970 1972 1974 1976 1978 1980 10 0 10 20 30 40 Residuales del ajuste de polinomio de grado 3 mostrando tendencia.

Ajuste de componente estacional Si tenemos un modelo de la forma X t = s t + Y t con componente estacional, podemos superponer a la estimación anterior una componente estacional armónica s t = α 0 + α 1 cos(2πω 1 t) + β 1 sen(2πω 1 t) + + α p cos(2πω p t) + β p sen(2πω p t) que podemos ajustar por mínimos cuadrados.

Mortalidad Cardiovascular Residuales 1970 1972 1974 1976 1978 1980 10 0 10 20 30 40 Ajuste de componente armónica mostrando estacionalidad.

Ajuste de tendencia y componente estacional Si tenemos un modelo de la forma X t = m t + s t + Y t con tendencia y componente estacional, podemos superponer las estimaciones anteriores: m t + s t = β 0 + β 1 t + + β p t p + α 1 cos(2πω 1 t) + β 1 sen(2πω 1 t) + + α p cos(2πω p t) + β p sen(2πω p t) que podemos ajustar por mínimos cuadrados.

Mortalidad Cardiovascular mortalidad 1970 1972 1974 1976 1978 1980 70 80 90 100 110 120 130 pol. cúbico comp. armònica pol. cúbico comp. armónica polinomio cúbico componente armónica Ajuste de polinomio de grado 3 mostrando tendencia y componente armónica mostrando estacionalidad.

Mortalidad Cardiovascular Residuales 1970 1972 1974 1976 1978 1980 20 10 0 10 20 30 Residuales del ajuste de polinomio de grado 3 y componente estacional.

Consideramos ahora un modelo con regresión sobre otras series de datos que corresponden a la temperatura y la comtaminación para el mismo periodo. En las siguientes láminas mostramos en primer lugar las tres series y luego una matriz de gráficos que muestra las posibles relaciones entre las distintas variables.

70 90 110 130 Mortalidad Cardiovascular 1970 1972 1974 1976 1978 1980 Temperatura 50 60 70 80 90 1970 1972 1974 1976 1978 1980 20 40 60 80 100 Particulas 1970 1972 1974 1976 1978 1980 Series para mortalidad cardiovascular, temperatura y contaminación en Los Angeles County.

Mortality 50 60 70 80 90 100 70 80 90 100 120 50 60 70 80 90 100 Temperature Particulates 20 40 60 80 100 70 80 90 100 110 120 130 20 40 60 80 100 Matriz de gráficos para mortalidad cardiovascular, temperatura y contaminación en Los Angeles County.

Intentamos los siguientes modelos: M t = β 1 + β 2 t + w t (1) M t = β 1 + β 2 t + β 3 (T t T ) + w t (2) M t = β 1 + β 2 t + β 3 (T t T ) + β 4 (T t T ) 2 + w t (3) M t = β 1 + β 2 t + β 3 (T t T ) + β 4 (T t T ) 2 + β 5 P t + w t (4)

Modelo k SSE df MSE R 2 AIC BIC (1) 2 40,020 506 79.0.21 5.38 5.4 (2) 3 31,413 505 62.2.38 5.14 5.17 (3) 4 27,985 504 55.5.45 5.03 5.07 (4) 5 20,508 503 40.8.60 4.72 4.77 El modelo seleccionado sería M t = 81.59 0.027t 0.473(T t 74.6) +.023(T t 74.6) 2 + 0.255P t Los errores estándar de los coeficientes son, respectivamente, 0.002, 0.032, 0.003 y 0.019.

Esquema 1 2 3 4 5 6

Buscamos eliminar la tendencia tomando diferencias de términos sucesivos. Para ello definimos el operador de diferencias por X t = X t X t 1 = (1 B)X t donde B es el operador de retardo (backward shift) BX t = BX t 1

Las potencias de estos operadores se definen de la manera usual B j X t = X t j, j X t = ( j 1 (X t )), j 1 con 0 (X t ) = X t. Los polinomios en B y se operan al igual que los polinomios de variables reales. Por ejemplo 2 X t = ( (X t )) = (1 B)(1 B)X t = (1 2B + B 2 )X t = X t 2X t 1 + X t 2

Si aplicamos el operador a una función de tendencia lineal m t = c 0 + c 1 t, obtenemos una función constante m t = m t m t 1 = c 0 + c 1 t (c 0 + c 1 (t 1)) = c 1 De manera similar cualquier tendencia polinomial de grado k puede ser reducida a una constante aplicando el operador k.

Huelgas en USA Huelgas 3500 4500 5500 1950 1955 1960 1965 1970 1975 1980 1500 500 0 500 1955 1960 1965 1970 1975 1980 de la series de huelgas en USA.

Pasajeros (1000s) 100 200 300 400 500 600 Pasajeros de Pan Am en EEUU 1950 1952 1954 1956 1958 1960 log(ap) 5.0 5.5 6.0 6.5 1950 1952 1954 1956 1958 1960 Número de pasajeros de Pan Am (arriba) logaritmo de número de pasajeros (abajo).

diff(ap) 100 50 0 50 1950 1952 1954 1956 1958 1960 diff(log(ap)) 0.2 0.1 0.0 0.1 0.2 1950 1952 1954 1956 1958 1960 de las series de pasajeros de Pan Am.

Esquema 1 2 3 4 5 6

por Promedios Móviles Este método es útil para hallar tendencias a largo plazo y también componentes estacionales. Si x t representa las observaciones entonces ˆm t = k a j x t j j= k donde a j = a j 0 y k j= k a j = 1 es un promedio móvil simétrico de los datos. Con frecuencia usamos a j = 1/(2k + 1), que da igual peso a todos los puntos.

70 80 90 100 110 120 130 Mortalidad Cardiovascular 1970 1972 1974 1976 1978 1980 Mortalidad semanal por causas cardiovasculares en Los Angeles County.

Mortalidad Cardiovascular mortalidad 1970 1972 1974 1976 1978 1980 70 80 90 100 110 120 130 Mortalidad semanal por causas cardiovasculares en Los Angeles County.

Mortalidad Cardiovascular mortalidad 1970 1972 1974 1976 1978 1980 70 80 90 100 110 120 130 ma5 ma53 ma5 ma53 Ajuste de promedios móviles con 5 (azul) y 53 (rojo) datos, mostrando tendencia y estacionalidad en la serie.

Podemos pensar que el promedio móvil es un proceso que se obtiene a partir de X t al aplicar un filtro lineal ˆm t = j= a j X t j con pesos a j = (2q + 1) 1, q j q. En este caso particular se trata de un filtro pasa bajo (low pass) ya que deja pasar las bajas frecuencias y filtra las altas frecuencias. Lo que queda es una estimación de la tendencia de X t que varía lentamente.

Escogiendo los pesos de manera adecuada podemos diseñar filtros que no sólo serán efectivos en la atenuación del ruido, sino que dejan pasar una clase grande de funciones, por ejemplo, los polinomios de grado menor o igual a 3, sin distorsión. El filtro de 15 puntos de Spencer deja pasar los polinomios de grado menor o igual que 3 sin distorsión y se define por (a 0, a 1,..., a 7 ) + 1 (74, 67, 46, 21, 3, 5, 6, 3) 320 con a j = 0 para j > 7 y a j = a j.

local Los métodos que usamos anteriormente para estimar la tendencia y la componente estacional son globales: Suponen que la misma función sirve para todo el rango de valores. La técnica de promedios móviles, en cambio, es una técnica local. A continuación definimos otros suavizadores locales.

por núcleo El suavizamiento por núcleos es un promedio móvil que usa una función de peso. con pesos ˆm t = n w i (t)x i, i=1 w i (t) = 1 ( t i ) C K, C = 1/ b donde K es la función de núcleo. n ( t i ) K b j=1 Se conoce como el estimador de Nadaraya-Watson. Con frecuencia se usa como núcleo la densidad normal típica.

Mortalidad Cardiovascular mortalidad 1970 1972 1974 1976 1978 1980 70 80 90 100 110 120 130 b=104/52=2 b=5/52 por núcleos con dos anchos de banda.

por regresión local El suavizamiento por regresión local usa los datos más cercanos en el tiempo x t k/2,..., x t,..., x t+k/2 para predecir x t usando una regresión local. Para los datos de mortalidad por causas cardiovasculares, la regresión se hizo con k = n/2 para estimar la tendencia y k = n/100 para estimar la componente estacional.

Mortalidad Cardiovascular mortalidad 1970 1972 1974 1976 1978 1980 70 80 90 100 110 120 130 por regresión local.

por LOWESS LOWESS es un método de suavizamiento que usa regresión local para construir una curva suave que muestre la tendencia de una nube de puntos. También se conoce como regresión polinomial local pesada y fue propuesto por Cleveland en 1979. En cada punto se ajusta un polinomio de grado bajo usando un subconjunto de datos cercanos al punto en el cual se quiere estimar la respuesta. El polinomio se ajusta usando mínimos cuadrados pesados, dando mayor peso a los puntos más cercanos

Mortalidad Cardiovascular mortalidad 1970 1972 1974 1976 1978 1980 70 80 90 100 110 120 130 por LOWESS.

por Splines Este método es una extensión de la regresión polinomial. En este caso se divide el intervalo de tiempo en k subintervalos [t 0 = 1, t 1 ], [t 1 + 1, t 2 ],..., [t k 1 + 1, t k = n] Los valores t 1, t 2,..., t k se conocen como nudos. En cada intervalo se ajusta por regresión un polinomio local de modo que en los nudos coincidan los valores del polinomio y de sus primeras derivadas.

por Splines Una variación del método de suavizamiento por splines busca minimizar una combinación de ajuste y el grado de suavidad de la curva, usando la ecuación n (s (x t s t ) 2 ) 2dt + λ t t=1 donde s t es, por ejemplo, un spline cúbico con un nudo en cada t.

Mortalidad Cardiovascular mortalidad 1970 1972 1974 1976 1978 1980 70 80 90 100 110 120 130 por Splines.

Mortalidad Cardiovascular mortalidad 1970 1972 1974 1976 1978 1980 70 80 90 100 110 120 130 ma53 pol. cúbico núcleo reg. local lowess splines Métodos de.

Mortalidad Cardiovascular mortalidad 1970 1972 1974 1976 1978 1980 70 80 90 100 110 120 130 ma5 pol. cúbico núcleo reg. local lowess splines Métodos de.

Las técnicas de suavizamiento también pueden aplicarse al suavizamiento de una serie de tiempo como función de otra. Vimos anteriormente que hay una relación no-lineal entre la serie de mortalidad y la de temperatura. La gráfica en la siguiente lámina muestra gráficas de dispersión de Mortalidad como función de la temperatura y suavizamientos obtenidos con LOWESS y Splines.

Mortalidad 70 80 90 110 130 lowess Mortalidad 70 80 90 110 130 50 60 70 80 90 100 Temperatura splines 50 60 70 80 90 100 Temperatura.

Esquema 1 2 3 4 5 6

Muertes accidentales en USA, 1973 78 muertes 7000 8000 9000 10000 11000 1973 1974 1975 1976 1977 1978 1979 Muertes por causas accidentales en USA 1974-79.

Primer Enfoque. Estimación de la tendencia y estacionalidad Probamos ajustar un modelo con componente estacional. Ajustamos primero un modelo con un armónico con frecuencia 2π/12. Luego añadimos un segundo armónico con frecuencia 2π/6.

Muertes accidentales en USA, 1973 78 muertes 1973 1974 1975 1976 1977 1978 1979 7000 8000 9000 10000 11000 Muertes por causas accidentales en USA 1974-79.

Muertes accidentales en USA, 1973 78 muertes 1973 1974 1975 1976 1977 1978 1979 7000 8000 9000 10000 11000 Muertes por causas accidentales en USA 1974-79.

Los residuales muestran que hay una tendencia cuadrática que debe ser estimada y filtrada Residuales 1973 1974 1975 1976 1977 1978 1979 1000 500 0 500 1000 Muertes por causas accidentales en USA 1974-79.

Para ajustar un modelo completo, que incluya tendencia y componente estacional, usamos en R la función decompose, que usa promedios móviles para el ajuste Decomposition of additive time series random seasonal 400 0 200 600 1500 0 1000 trend observed 8400 8800 9200 9600 7000 9000 11000 1973 1974 1975 1976 1977 1978 1979 Time Muertes por causas accidentales en USA 1974-79.

Segundo Enfoque. para eliminar tendencia y estacionalidad Suponemos inicialmente que el modelo sólo tiene una componente estacional: X t = s t + Y t Aplicamos inicialmente el operador de diferenciación a los datos con un retardo de 12 meses. Si la componente estacional s t tiene período de 12 meses, al hacer esto obtenemos (12) X t = Y t Y t 12

Las diferencias todavía muestran una tendencia ascendente, así que tomamos una diferencia adicional con retardo 1. Diferencias 1000 500 0 500 1974 1975 1976 1977 1978 1979 Muertes por causas accidentales en USA 1974-79.

Diferencias 500 0 500 1000 1974 1975 1976 1977 1978 1979 Muertes por causas accidentales en USA 1974-79.

Diagnóstico Gráficas de dispersión con retardo para el SOI. soi(t) 1.0 0.5 soi(t 1) 0.6 1.0 0.0 1.0 soi(t 4) soi(t) 1.0 0.5 soi(t 2) 0.3 1.0 0.0 1.0 soi(t 5) soi(t) 1.0 0.5 soi(t 3) 0.21 1.0 0.0 1.0 soi(t 6) soi(t) 1.0 0.5 soi(t) 1.0 0.5 0.05 1.0 0.0 1.0 soi(t 7) 1.0 0.0 1.0 soi(t 10) soi(t) 0.18 soi(t) 1.0 0.5 1.0 0.5 0.11 1.0 0.0 1.0 soi(t 8) 0.1 1.0 0.0 1.0 soi(t 11) soi(t) soi(t) 1.0 0.5 1.0 0.5 0.19 1.0 0.0 1.0 soi(t 9) 0.05 1.0 0.0 1.0 soi(t 12) soi(t) 1.0 0.5 0.22 1.0 0.0 1.0 soi(t) 1.0 0.5 0.36 1.0 0.0 1.0 SOI. soi(t) 1.0 0.5 0.41 1.0 0.0 1.0

Diagnóstico Gráficas de dispersión con retardo para el SOI y peces. rec(t) rec(t) rec(t) 0 40 80 0 40 80 0 40 80 soi(t 0) 0.02 1.0 0.0 1.0 soi(t 3) 1.0 0.0 1.0 soi(t 6) 0.15 0.6 1.0 0.0 1.0 rec(t) rec(t) rec(t) 0 40 80 0 40 80 0 40 80 soi(t 1) 0.01 1.0 0.0 1.0 soi(t 4) 0.3 1.0 0.0 1.0 soi(t 7) 0.6 1.0 0.0 1.0 rec(t) rec(t) rec(t) 0 40 80 0 40 80 0 40 80 soi(t 2) 0.04 1.0 0.0 1.0 soi(t 5) 0.53 1.0 0.0 1.0 soi(t 8) 0.56 1.0 0.0 1.0 SOI.