Por qué es interesante el exponente de Hurst?



Documentos relacionados
La relación entre la altura de caída y el tiempo que tarda en rebotar 6 veces una pelota

Covarianza y coeficiente de correlación

Aproximación local. Plano tangente. Derivadas parciales.

8.1. Introducción Dependencia/independencia estadística Representación gráfica: diagrama de dispersión Regresión...

CAPITULO V. SIMULACION DEL SISTEMA 5.1 DISEÑO DEL MODELO

Eduardo Kido 26-Mayo-2004 ANÁLISIS DE DATOS

1.1. Introducción y conceptos básicos

Cap. 24 La Ley de Gauss

QUÉ ES LA RENTABILIDAD Y CÓMO MEDIRLA. La rentabilidad mide la eficiencia con la cual una empresa utiliza sus recursos financieros.

Análisis de los datos

Medias Móviles: Señales para invertir en la Bolsa

Ejercicio de estadística para 3º de la ESO

Física de los Procesos Biológicos Curso 2005/6

ACCIONES Y OTROS TÍTULOS DE INVERSIÓN

Pronósticos. Pronósticos y gráficos Diapositiva 1

4 Pruebas y análisis del software

Covered California Créditos fiscales para Primas de Salud y Reconciliación de impuestos

Profr. Efraín Soto Apolinar. La función lineal. y = a 0 + a 1 x. y = m x + b

Decisión: Indican puntos en que se toman decisiones: sí o no, o se verifica una actividad del flujo grama.

UNIDAD 1. LOS NÚMEROS ENTEROS.

Funciones, x, y, gráficos

DETERMINACIÓN DEL VOLUMEN DE PEDIDO.

Control Estadístico de Procesos

Tema 3. Medidas de tendencia central Introducción. Contenido

Modificación y parametrización del modulo de Solicitudes (Request) en el ERP/CRM Compiere.

Movimiento a través de una. José San Martín

Unidad I. 1.1 Sistemas numéricos (Binario, Octal, Decimal, Hexadecimal)

SISTEMA MEAN REVERSION RSI

PARA QUÉ NÚMEROS REALES... 2 SUCESIONES... 3 NÚMEROS COMPLEJOS... 5 CÓNICAS... 6 FUNCIÓN INVERSA... 7 FUNCIONES CUADRÁTICAS... 8

LINEAS EQUIPOTENCIALES

Tema 2. Espacios Vectoriales Introducción

1. Dominio, simetría, puntos de corte y periodicidad

Capítulo 10. Gráficos y diagramas

Se podría entender como una matriz de filas y columnas. Cada combinación de fila y columna se denomina celda. Por ejemplo la celda A1, B33, Z68.

Datos estadísticos PRESENTACIÓN DE DATOS INDIVIDUALES Y DATOS AGRUPADOS EN TABLAS Y GRÁFICOS

Retiro de activos y el stock de capital bruto

Porcentajes. Cajón de Ciencias. Qué es un porcentaje?

Las materias que más te gustaban en el liceo cuales eran? Y las que menos te gustaban?

Gráficas de caja. El borde derecho de la caja es el tercer cuartil, Q 3, que es la mediana de los valores que están por encima de la mediana.

Otras medidas descriptivas usuales

Estudio desde el punto de vista de teoría de sistemas del modelo de Wilson para la gestión de inventarios

Práctica 5. Curso

La Lección de hoy es sobre determinar el Dominio y el Rango. El cuál es la expectativa para el aprendizaje del estudiante LF.3.A1.

2.0 QUÉ ES NECESARIO PARA EMPEZAR A OPERAR CON FUTUROS?

Consideraciones al precio de un warrant. El precio del warrant: la prima. Factores que afectan al precio de un warrant

PRINCIPIOS FINAN IEROS FUNDAMENTALE DEL FED

Ejemplos de conversión de reales a enteros

Transformación de gráfica de funciones

1

MANUAL DE EJECUCION DE LA ESTRATEGIA Ibex35 Evolución por Josep Codina

Datos del autor. Nombres y apellido: Germán Andrés Paz. Lugar de nacimiento: Rosario (Código Postal 2000), Santa Fe, Argentina

Guía de Preparación de Muestras para PLASTICOS para el Software de Formulación de Datacolor

Siguiendo la tendencia sobre las Acciones del Ibex35

Capítulo 10. Estudio de un caso con parámetros reales: acuífero de Borden

Aumentando x 10 mis posibilidades de ganar. Las griegas

ANALISIS DE UN FONDO DE INVERSION MEDIANTE LA REGRESION Y LA GENERACION DE NUMEROS ALEATORIOS

5 razones por las que NO DEBERÍAS ABRIR UNA TIENDA ONLINE

Monografías de Juan Mascareñas sobre Finanzas Corporativas ISSN: Introducción al VaR

ANÁLISIS DE VARIANZA EMPLEANDO EXCEL y WINSTATS

7. Conclusiones. 7.1 Resultados

TABLA DE DECISION. Consideremos la siguiente tabla, expresada en forma genérica, como ejemplo y establezcamos la manera en que debe leerse.

Medidas de tendencia central o de posición: situación de los valores alrededor

Analítica para tu Tienda Online

Divisibilidad y números primos

Análisis de medidas conjuntas (conjoint analysis)

Colegio Alexander von Humboldt - Lima. Tema: La enseñanza de la matemática está en un proceso de cambio

Un problema sobre repetidas apuestas al azar

Profr. Efraín Soto Apolinar. Factorización

ALCISTAS 100% CERRAMOS LOS LARGOS EN SP500 CASANDRA13 EMPIEZA A OPERAR sábado, 02 de febrero de 2013

hay alguien ahi? por Marcelino Alvarez

Actividades con GeoGebra

UNIDAD 1 LAS LEYES FINANCIERAS DE CAPITALIZACIÓN DESCUENTO

Media vs mediana vs moda Cual medida de tendencia central es mas adecuada? MEDIA conveniencias:

INTRODUCCIÓN: LA FÍSICA Y SU LENGUAJE, LAS MATEMÁTICAS

Algunas cifras de campañas de Marketing que es importante que conozca

Análisis Técnico. Inicación en Bolsa

La derivada de y respecto a x es lo que varía y por cada unidad que varía x. Ese valor se designa por dy dx.

A continuación voy a colocar las fuerzas que intervienen en nuestro problema.

GESTINLIB GESTIÓN PARA LIBRERÍAS, PAPELERÍAS Y KIOSCOS DESCRIPCIÓN DEL MÓDULO DE KIOSCOS

SERIES DE TIEMPO INTRODUCCIÓN

PRIMERA ENTREVISTA A YOLY- (EA-5) Junio de Por qué elegiste estudiar Ciencias de la Educación?

No hay resorte que oscile cien años...

Plática de Maestro. Introducción

FUNCIONES DE UNA VARIABLE Julián de la Horra Departamento de Matemáticas U.A.M.

Tema 3. Manual: Macroeconomía, Olivier Blanchard Presentaciones: Fernando e Yvonn Quijano

PROGRAMACIÓN LINEAL Introducción Inecuaciones lineales con 2 variables

ESTIMACIÓN. puntual y por intervalo

CURSILLO DE ORIENTACIÓN

DOS EXPERIENCIAS DE CLASE CON RECURSOS INFORMÁTICOS. TEMAS: LÍMITES Y APLICACIONES DE FUNCIÓN LINEAL

SÍNTESIS Y PERSPECTIVAS

Lección 3: Líneas de Fibonacci y Medias Móviles

Tipo de interés nominal (TIN)

Circuito RC, Respuesta a la frecuencia.

La Lección de Hoy es Distancia entre dos puntos. El cuál es la expectativa para el aprendizaje del estudiante CGT.5.G.1

CAPÍTULO 1 PRIMEROS PASOS

Comprendiendo el Histograma. El fotometro del siglo 21

Aritmética finita y análisis de error

Transcripción:

Por qué es interesante el exponente de Hurst? El exponente de Hurst ocurre en varias áreas de las matemáticas aplicadas, incluyendo los fractales y la teoría del caos, procesos de larga memoria y análisis espectral. La estimación del exponente de Hurst se ha aplicado en áreas que van desde la biofísica a las redes de computadoras. La estimación del exponente de Hurst fue desarrollada originalmente en la hidrología. Sin embargo, las modernas técnicas para estimar el exponente de Hurst vienen de las matemáticas fractales. Las matemáticas y las imágenes derivadas de la geometría fractal estallaron en el mundo en los años 1970s y 1980s. Es difícil pensar en un área de la ciencia que no haya sido influenciado por la geometría fractal. Además de proporcionar una nueva visión de las matemáticas y la ciencia, la geometría fractal nos ayudó a ver el mundo que nos rodea de una manera diferente. La naturaleza está llena de formas auto-similares fractales, como la hoja de helecho. Una forma auto-similar está compuesta por un patrón básico que se repite en escalas múltiples (o infinitas). Un ejemplo de una forma auto-similar artificial es la pirámide de Sierpinski que se muestra en la Figura 1. Figura 1, Pirámide auto-similar de cuatro lados de Sierpinski Más ejemplos de formas auto-similares,incluyendo la hoja de helecho,se pueden encontar en The Dynamical Systems and Technology Project de la Boston University. El exponente de Hurst está también directamente relacionado con la "dimensión fractal", lo que da una medida de la rugosidad de una superficie. La dimensión fractal se ha utilizado para medir la rugosidad de las costas, por ejemplo. La relación entre la dimensión fractal, D, y el exponente de Hurst, H, es D = 2 H (1) También hay una forma de auto-similitud llamada auto-similitud estadística. Suponiendo que tenemos uno de esos conjuntos imaginarios infinitos de datos auto-similares, cualquier sección del conjunto de datos tiene las mismas propiedades estadísticas que cualquier otro. La autosimilitud estadística se produce en un número sorprendente de áreas de la ingeniería. Las trazas del tráfico de redes de computadoras son auto-similares (como se muestra en la Figura 2) Figure 2, Tráfico de red auto-similar

La Auto-similitud también se ha encontrado en las trazas de referencia de memoria. Redes congestionadas, donde buffers de TCP/IP comienzan a llenarse, pueden mostrar comportamiento auto-similar caótico. La estructura auto-similar observada en los sistemas reales ha hecho de la medición y simulación de datos auto-similares un tema activo en los últimos años. Otros ejemplos de auto-similitud estadística existen en la cartografía (la medición de las líneas de costa), los gráficos por ordenador (la simulación de las montañas y colinas), biología (la medición de los límites de una colonia de moho) y medicina (medición del crecimiento neuronal). Caminos aleatorios y Memoria Larga Un camino aleatorio uni-dimensional puede ser generado arrancando en cero y seleccionando un número aleatorio Gaussiano. En el siguiente paso (en este caso 1), añadir el número aleatorio gaussiano al valor anterior (0). A continuación, seleccionar otro número aleatorio Gaussiano y en el próximo paso del tiempo (2) se añade a la posición anterior, etc.. paso valor 0 0 1 0 + R 0 1 R 0 + R 1 2 R 0 + R 1 + R 2 etc... Aquí R n es un número aleatorio Gaussiano. Los Caminos aleatorios a veces se conocen como movimiento Browniano o ruido Gaussiano. La figura 3 muestra una gráfica de este tipo de camino aleatorio simple. N := 1024 i := 0.. N 1 r := rnorm ( N, 0, 1) A := 0 0 A := A + r i+ 1 i i La estimación del exponente de Hurst para un conjunto de datos proporciona una medida de si los datos son un camino aleatorio puro o tiene tendencias subyacentes. Otra manera de decir esto es que un proceso aleatorio con una tendencia subyacente tiene un cierto grado de autocorrelación (se abundará en esto más adelante). Cuando la autocorrelación tiene un decaimiento muy largo (o infinito matemáticamente) este tipo de proceso Gaussiano se refiere a veces como un proceso de memoria largo. correl ( A, A) C := max( correl ( A, A) )

Figure 3, Un camino aleatorio 1 0.5 C i 0 500 1 10 3 1.5 10 3 0.5 i Los procesos que nosotros, ingenuamente podríamos asumir que son puramente aleatorios a veces resultan exhibir exponente de Hurst estadístico para procesos de memoria larga. Un ejemplo se ve en el tráfico de redes informáticas. Podríamos esperar que el tráfico de la red sería mejor simulado teniendo algún número de fuentes aleatorias enviando paquetes de tamaño al azar en la red. Siguiendo esta línea de pensamiento, la distribución puede ser de Poisson (un ejemplo de distribución de Poisson es el número de personas al azar que llegan a un restaurante por un período de tiempo determinado). Como resultado, el modelo ingenuo de tráfico de la red puede estar equivocado. El tráfico de red se modela mejor mediante un procedimiento que muestra un exponente de Hurst no aleatorio. El exponente de Hurst y el Movimiento Browniano fraccional Los caminos Brownianos se pueden generar a partir de un exponente de Hurst definido. Si el exponente de Hurst es 0.5 <H <1.0, el camino aleatorio será un proceso de memoria larga. Los conjuntos de datos de este tipo se refieren a veces como el movimiento Browniano fraccional (abreviado fbm). El movimiento Browniano fraccional puede ser generada por una variedad de métodos, incluyendo la síntesis espectral utilizando la transformada de Fourier o la transformación wavelet. Aquí, la densidad espectral es proporcional a la Ecuación 2 (al menos para la transformada de Fourier): El movimiento Browniano fraccional se refiere a veces como ruido 1/f. Dado que estos caminos aleatorios se generan a partir de variables aleatorias Gaussianas (conjunto de números), ellos también se conocen como ruido Gaussiano fraccional (o fgn).

La dimensión fractal proporciona una indicación de cuán áspera es una superficie. Como muestra la ecuación (1), la dimensión fractal está directamente relacionada con el exponente de Hurst para un conjunto de datos estadísticamente auto-similares. Un pequeño exponente de Hurst tiene una dimensión fractal alta y una superficie más rugosa. Un mayor exponente de Hurst tiene una dimensión fractal más baja y una superficie más lisa. Esto se muestra en la Figura 4. Figure 4, Movimiento Fraccional Browniano y el exponente dehurst El exponente de Hurst y las Finanzas Mi interés en el exponente de Hurst fue motivado por los conjuntos de datos financieros (series temporales), como el precio diario de cierre o retorno-5 días para un stock. Originalmente, me adentré en la estimación de exponente de Hurst, porque experimenté con compresión wavelet como un método para la estimación de la previsibilidad de una serie de tiempo financiera (véase la compresión Wavelet, el determinismo y la predicción de series de tiempo Mi punto de vista de las series de tiempo financieras, en ese momento, era el ruido mezclado con la predictibilidad. Leí sobre el exponente de Hurst y parecía ofrecer alguna estimación de la cantidad de predictibilidad en un conjunto de datos ruidosos (por ejemplo, un proceso al azar). Si la estimación del exponente de Hurst confirmaba el resultado de la compresión wavelet, es posible que haya alguna razón para creer que la técnica de compresión wavelet era fiable. Yo también he leído que el exponente de Hurst se puede calcular mediante un escalograma wavelet (por ejemplo, un plot del espectro de frecuencias). Yo sabía cómo utilizar wavelets para el análisis espectral, así que pensé que el cálculo exponente de Hurst sería fácil. Simplemente podría reutilizar el código de wavelet que había desarrollado para el análisis espectral. Lamentablemente las cosas muchas veces no son tan simples como parecen. Mirando hacia atrás, hay una serie de cosas que yo no entendía: 1. El exponente de Hurst es no tanto calculado como estimado. Una variedad de técnicas existen para hacer esto y la exactitud de la estimación puede ser una cuestión complicada. 2. Probar el software para estimar el exponente de Hurst puede ser dificultoso. La mejor manera de probar algoritmos para calcular el exponente de Hurst es utilizar un conjunto de datos que tienen un valor conocido del exponente de Hurst. Este conjunto de datos se refiere como movimiento fraccional Browniano (o ruido Gaussiano fractal). Como he aprendido, generar conjuntos de datos con movimiento fraccional Browniano es un tema complejo. Por lo menos tan complejo como la estimación del exponente de Hurst.

3. La evidencia de que las series de tiempo financieras son ejemplos de los procesos de memoria larga es mixto. Cuando se estima el exponente de Hurst, el resultado refleja un proceso de memoria larga o un proceso de la memoria a corta, tal como la autocorrelación? Ya que la autocorrelación está relacionada con el exponente de Hurst (ver ecuación 3, abajo), es esto realmente un problema o no? Me di cuenta que no era el único que piensa que el exponente de Hurst puede proporcionar resultados interesantes cuando se aplican a los datos financieros. La naturaleza fractal intuitiva de los datos financieros (por ejemplo, la serie de tiempos retorno 5 días en la Figura 5) ha llevado a un número de personas a aplicar las matemáticas de los fractales y el caos en el análisis de estas series de tiempo. Figura 5 Antes de empezar a trabajar en el software del exponente de Hurst leí unos cuantos artículos sobre la aplicación del cálculo del exponente de Hurst a series de tiempo financieras, no me di cuenta de cuánto trabajo se ha hecho en esta área. Algunas referencias se enumeran a continuación. Benoit Mandelbrot, who later became famous for his work on fractals, wrote the early papers on the application of the Hurst exponent to financial time series. Many of these papers are collected in Mandelbrot's book Fractals and Scaling in Finance, Springer Verlag, 1997. Edgar Peters' book Chaos and Order in the Capital markets, Second Edition spends two chapters discussing the Hurst exponent and its calculation using the the rescaled range (RS) technique. Unfortunately, Peters only applies Hurst exponent estimation to a few time series and provides little solid detail on the accuracy of Hurst exponent calculation for data sets of various sizes. Long-Term Memory in Stock Market Prices, Chapter 6 in A Non-Random Walk Down Wall Street by Andrew W. Lo and A. Craig MacKinlay, Princeton University Press, 1999. This chapter provides a detailed discussion of some statistical techniques to estimate the Hurst exponent (long-term memory is another name for a long memory process). Lo and MacKinlay do not find long-term memory in stock market return data sets they examined.

In the paper Evidence of Predictability in Hedge Fund Returns and Multi-Style Multi- Class Tactical Style Allocation Decisions by Amenc, El Bied and Martelli, April 2002) the authors use the Hurst exponent as one method to analyze the predictability of hedge funds returns. John Conover applies the Hurst exponent (along with other statistical techniques) to the analysis of corporate profits. See Notes on the Fractal Analysis of Various Market Segments in the North American Electronics Industry (PDF format) by John Conover, August 12, 2002. This is an 804 page (!) missive on fractal analysis of financial data, including the application of the Hurst exponent (R/S analysis). John Conover has an associated root web page Software for Industrial Market Metrics which has links to Notes on the Fractal Analysis... and associated software source code (along with documentation for the source code). El exponente de Hurst, Procesos de Memoria Larga y Leyes de Potencia Que las series de tiempo económicas pueden presentar dependencia a largo plazo ha sido una hipótesis de muchas de las primeras teorías de los ciclos comerciales y de negocios. Estas teorías fueron motivadas a menudo por los distintos patrones cíclicos, pero no periódicos, algunos que parecen casi tan largos como todo el lapso de la muestra. En el dominio de la frecuencia tales series de tiempo se dice que tienen potencia a bajas frecuencias. Tan común es esta característica particular de los datos que Granger (1966) considera que la "típica forma espectral de una variable económica." También se ha llamado "efecto Joseph" por Mandelbrot y Wallis (1968), una referencia bíblica juguetona, pero no la adecuada del profeta del Antiguo Testamento que predijo los siete años de abundancia seguidos por siete años de hambre que Egipto iba a experimentar. En efecto, la predilección de la naturaleza hacia la dependencia a largo plazo ha sido bien documentado en la hidrología, meteorología, geofísica, etc. [Introducción al capítulo 6, A Non-Random Walk Down Wall Street by Andrew W. Lo and A. Craig MacKinlay, Princeton University Press, 1999.] Aquí dependencia a largo plazo es el mismo que un proceso de memoria larga. La economía moderna depende en gran medida en las estadísticas. La mayoría de las estadísticas se basa en la distribución normal Gaussiana. Este tipo de distribución se produce en los datos financieros. Por ejemplo, el retorno 1-día en las existencias se ajusta estrechamente a una curva Gaussiana. En este caso, el retorno de ayer no tiene nada que ver con el retorno de hoy. Sin embargo, a medida que el período de retorno se mueve hacia fuera, a 5-días, 10-días y 20-días, la distribución cambia a una distribución log-normal. Aquí las "colas" de la curva siguen una ley de potencias. Estas series de tiempo de retorno más largo tienen una cierta cantidad de autocorrelación y un exponente de Hurst no aleatorio. Esto ha sugerido a muchas personas que estas series de tiempo de retorno ya no son procesos de memoria larga. Me ha sido difícil encontrar una definición intuitiva para el proceso de memoria a largo plazo, así que voy a dar mi definición: un proceso de la memoria a largo plazo es un proceso con un componente azaroso, donde un evento pasado tiene un efecto de decaimiento sobre los eventos futuros. El proceso tiene algo de memoria de eventos pasados, lo cual es "olvidado" a media que el tiempo transcurre. Por ejemplo, grandes operaciones en un mercado moverán el precio de mercado (por ejemplo, una orden de compra grande tenderá a mover el precio hacia arriba, una orden de venta grande tenderá a mover hacia abajo el precio). Este efecto se conoce como impacto en el mercado (véase The Market Impact Model de Nicolo Torre, BARRA Newsletter, Winter 1998). Cuando una orden tiene impacto de mercado cuantificable, el precio de mercado no rebotará de inmediato al precio anterior, después de que la orden se ejecuta. El mercado actúa como si tuviera un poco de "memoria" de lo que se llevó a cabo y el efecto de la orden decae través del tiempo. Procesos similares permiten momemtum trading para tener algún valor.

La definición matemática de los procesos de memoria largos se da en términos de autocorrelación. Cuando un conjunto de datos exhibe autocorrelación, un valor x i en el tiempo t i está correlacionada con un valor x i + d en el momento de t i + d, donde d es cierto incremento de tiempo en el futuro. En un proceso de memoria largo la autocorrelación decae través del tiempo y la decadencia sigue una ley de potencias. Una serie de tiempo construida a partir de retornos- 30 días de precios de stocks tiende a mostrar este comportamiento. En un proceso de la memoria largo la decadencia de la función de autocorrelación para una serie de tiempo es una ley de potencias: (3) En la Ecuación 3, C es una constante y p(k) es la función de autocorrelación con lag k. El exponente de Hurst está relacionada con el exponente alfa en la ecuación por (4) Los valores del exponente de Hurst varían entre 0 y 1. Un valor de 0.5 indica un verdadero camino al azar (una serie de tiempo Browniana). En un camino aleatorio no hay correlación entre cualquier elemento y un elemento futuro. Un valor del exponente de Hurst 0.5 <H <1 indica "comportamiento persistente" (por ejemplo, una autocorrelación positiva). Si hay un aumento desde el paso de tiempo t i-1 al t i probablemente habrá un aumento de t i al t i+1. Lo mismo es cierto para disminuciones, donde a una disminución tenderá a seguir una disminución. Un valor del exponente de Hurst 0 <H <0.5 existirá para una serie de tiempo con "comportamiento anti-persistente" (o autocorrelación negativa). Aquí un aumento tiende a ser seguido por una disminución. O una disminución será seguida por un aumento. Este comportamiento a veces se llama "reversión media". Entonces, quién es este hombre de Hurst? Hurst pasó toda una vida estudiando el Nilo y los problemas relacionados con el almacenamiento de agua. Él inventó un nuevo método estadístico - el rescaled range analysis (análisis R/S) - que se describe en detalle en un libro interesante, Long-Term Storage: An Experimental Study (Hurst et al., 1965). Uno de los problemas estudiados por Hurst era del tamaño de la construcción de depósitos. Si se construye un depósito ideal, se va a almacenar suficiente agua durante la estación seca, de modo que nunca se agota. La cantidad de agua que fluye hacia adentro y afuera del depósito es un proceso aleatorio. En el caso del flujo de entrada, el proceso aleatorio es impulsado por la lluvia. En el caso del flujo de salida, el proceso es impulsado por la demanda de agua. El exponente de Hurst, Wavelets y el Cálculo Rescaled Range Como he mencionado en otra parte, cuando se trata de wavelets, yo soy el tipo con un martillo para el que todos los problemas son un clavo. Una de las cosas fascinantes acerca de la transformada wavelet es el número de áreas en las que se puede utilizar. Como resultado, una de estas aplicaciones incluye la estimación del exponente de Hurst. (He referido al cálculo del exponente de Hurst como una estimación porque el valor del exponente de Hurst no puede calcularse exactamente, ya que es una medición aplicada a un conjunto de datos. Esta medida tendrá siempre un cierto error.) Como yo ya había desarrollado paquetes de software de wavelets, pensé que sería una tarea sencilla calcular el exponente de Hurst. Sin embargo, no acababa de entender el método utilizado en este trabajo, por lo que decidí implementar el software para el cálculo clásico

rescaled range de Hurst. Luego, podría utilizar el cálculo de Hurst para comprobar el resultado devuelto por mi software de wavelet. Comprensión del Cálculo del Rescaled Range (R/S) No tuve problemas para encontrar referencias sobre el estadístico Rescaled Range. Una búsqueda en Google de "Rescaled Range" Hurst devolvió más de 700 referencias. Lo que tenía dificultad para encontrar fueron referencias correctas y que yo pudiera entender lo suficientemente bien como para implementar el algoritmo de Hurst. Una de las fuentes a las que me dirigí fue el Chaos and Order in the Capital Markets, Segunda Edición, Edgar E. Peters, (1996). Este libro proporciona una buena visión general de alto nivel del exponente de Hurst, pero no me proporcionó suficientes detalles que me permitan implementar el algoritmo. Peters basa su discusión sobre el exponente de Hurst en los capítulos 8 y 9 del libro fractales de Jens Feder (1988). Usando el libro de Feder, y un poco más de iluminación de algunos trabajos de investigación, fui capaz de implementar el software para el algoritmo clásico Rescaled Range propuesto por Hurst. Una de las fuentes a las que me dirigí fue el Caos y el Orden en el libro de los Mercados de Capital, La descripción del estadístico Rescaled Range de Hurst en esta página web inspira en gran medida del libro Jens Feder Fractals. Plenum Press, parece haber sido comprado por Kluwer, un editor conocido por sus altos precios. Fractals aparece en Amazon por 86 dólares. Para un libro publicado en 1988, que no incluye el trabajo posterior en el movimiento browniano fraccional y largos procesos de memoria, esto es un precio bastante elevado (tuve la suerte de comprar una copia usada de Abe Books). Dado que el precio y la edad de este libro hace que el material Prof. Feder relativamente inaccesible, he hecho más que simplemente un resumen de las ecuaciones y se incluyeron algunos de los diagramas de Feder. Si por alguna razón el profesor Feder tropieza en esta página web, espero que va a perdonar a este tramo de doctrina del "uso justo". Modelado del reservorios El cálculo de Hurst tiene más sentido para mí en el contexto en el que se desarrolló: el modelado de reservorios. Esta descripción y las ecuaciones que refleja Fractales de Jens Feder. Por supuesto, cualquier error en esta traducción es mía. El agua de las Sierras de California corre a través de cientos de kilómetros de tuberías hasta el depósito de Crystal Springs, a unos cincuenta kilómetros al sur de San Francisco. La Ecuación 5 muestra la afluencia promedio (media) de agua a través de las tuberías durante un período de tiempo. Ecuación 5, promedio (media) entrante en el tiempo (5) El agua en el reservorio Crystal Springs proviene de la nieve de la Sierra. Algunos años hay una capa de nieve pesada y un montón de flujos de agua en el depósito de Crystal Springs. Otros años, la capa de nieve es fina y la entrada de Crystal Springs no coincide con el uso del agua para las comunidades sedientas de la zona de Silicon Valley y San Francisco. Podemos representar la entrada de agua durante un año como. La desviación respecto de la media para ese año es (el flujo entrante para el año u menos la media). Note que la media es calculada sobre algún periodo multi-año. La ecuación 6 es una sumatoria de la desviación acumulada desde la media, para los años 1 a.

No encuentro esta notación del todo clara. Así que he re-expresado las ecuaciones 5 y 6 en el pseudo-código siguiente: La Figura 6 muestra un plot de los puntos X(t). Figura 6 - Graph by Liv Feder from Fractals by Jens Feder, 1988 El rango, es la diferencia entre el valor máximo X(t b ) y el valor mínimo de X(t a ), durante el período de tiempo. Esto se resume en la ecuación 7. La figura 7 muestra X max el máximo de la suma de la desviación de la media, y X min, el mínimo de la suma de la desviación de la media. X(t) es la suma de la desviación de la media en el tiempo t.

Figura 7 - Illustration by Liv Feder from Fractals by Jens Feder, 1988 El rescaled range se calculó dividiendo el rango por la desviación estándar: (8) La ecuación (9) muestra el cálculo de la desviación estándar sobre el rango. (9) La estimación del exponente de Hurst desde el Rescaled Range El exponente de Hurst se estima mediante el cálculo del promedio Rescald Range sobre múltiples regiones de los datos. En estadística, el promedio (media) de un conjunto X de datos se escribe a veces como el valor esperado, E[X]. Utilizando esta notación, el valor esperado de R/S, calculado sobre un conjunto de regiones (arrancando de un tamaño de la región, de 8 ó 10) converge en la función de potencia exponente de Hurst, que se muestra en la ecuación (10) (10) Si el conjunto de datos es un camino aleatorio, el valor esperado se describe por una función de potencia con un exponente de 0.5. (11) A veces he visto a la ecuación (11) referida como "la dependencia de corto plazo". Esto parece ser incorrecto para mí. La dependencia de corto plazo debe tener cierta autocorrelación (lo que indica una cierta dependencia entre el valor x i y el valor x i+1 ). Si hay un exponente de Hurst de 0.5, es un camino aleatorio y no hay autocorrelación y no hay dependencia entre los valores secuenciales. Se puede trazar una línea de regresión lineal a través de un conjunto de puntos, compuesto por el logaritmo de n (el tamaño de las áreas sobre las que se calcula el promedio rescaled range) y se calcula el logaritmo del promedio rescaled range sobre un conjunto de regiones de tamaño n.

La pendiente de la recta de regresión es la estimación del exponente de Hurst. Este método para estimar el exponente de Hurst fue desarrollado y analizado por Benoit Mandelbrot y sus coautores de trabajos publicados entre 1968 y 1979. El exponente de Hurst se aplica a los conjuntos de datos que son estadísticamente autosimilares. Estadísticamente auto-similares significa que las propiedades estadísticas para el conjunto de datos son los mismos para las sub-secciones del conjunto de datos. Por ejemplo, las dos mitades del conjunto de datos tienen las mismas propiedades estadísticas que el conjunto de datos. Esto se aplica para estimar el exponente de Hurst, donde se estima el rescaled range sobre secciones de diferente tamaño. Como se muestra en la Figura 8, el rescaled range se calcula para el conjunto de datos (aquí RSave 0 = RS 0 ). Entonces el rango reescalado se calcula para las dos mitades del conjunto de datos, resultando en RS 0 y RS 1. Estos dos valores son promediados, resultado RSave 1. En este caso, el proceso continúa dividiendo cada una de las secciones anteriores en un medio y calculando el rango reescalado para cada nueva sección. Los valores de rescaled range para cada sección se promedian. En algún momento la subdivisión se detiene, ya que las regiones se hacen demasiado pequeñas. Por lo general, las regiones tendrán por lo menos 8 puntos de datos. Figura 8, Estimación del Exponente de Hurst Para estimar el exponente de Hurst usando el algoritmo rescaled range, se crea un vector de puntos, donde x i es el log 2 del tamaño de la región de datos usada para calcular RSave i e y i es el log 2 del valor RSave i. Esto se muestra en la Tabla 1. Tabla 1 region size RS ave. X i : log 2 (region size) Y i : log 2 (RS ave.) 1024 96.4451 10.0 6.5916 512 55.7367 9.0 5.8006 256 30.2581 8.0 4.9193 128 20.9820 7.0 4.3911 64 12.6513 6.0 3.6612 32 7.2883 5.0 2.8656 16 4.4608 4.0 2.1573 8.0 2.7399 3.0 1.4541 El exponente de Hurst se estima por una recta de regresión lineal a través de estos puntos. Una línea tiene la forma y = a + bx, donde a es la ordenada al origen y b es la pendiente de la línea. Una línea de regresión lineal calculada a través de los puntos en la Tabla 1 da como resultado una ordenada al origen de -0.7455 y una pendiente de 0.7270. Esto se muestra en la Figura 9, debajo. La pendiente es la estimación del exponente de Hurst. En este caso, el exponente de

Hurst se calculó para un conjunto de datos sintéticos fijados con un exponente de Hurst de 0.72. Figura 9 La figura 10 muestra un diagrama de autocorrelación para este conjunto de datos. La línea azul es la curva de potencia aproximada Figura 10 Variaciones Básicas sobre el algoritmo de Hurst El algoritmo descrito aquí utiliza regiones de datos que no se solapan donde el tamaño del conjunto de datos es una potencia de dos. Cada sub-región es un componente de potencia de dos. Otras versiones del algoritmo de Hurst utilizan regiones superpuestas y no están limitadas a que los tamaños de datos sean una potencia de dos. En mis pruebas no he encontrado que las regiones que se solapan produzcan un resultado más exacto. Elegí un algoritmo con temaño de datos potencia de dos porque quería comparar el estadístico rescaled range al cálculo del exponente de Hurst utilizando la transformada wavelet. La transformada wavelet se limita a los conjuntos de datos donde el tamaño es una potencia de dos.