Alternativas a la ley de Gumbel para la predicción de valores máximos de avenidas Rafael Conejo Ramilo; Ricardo Conejo Muñoz conejo@lcc.uma.es Resumen: En este artículo se comparan la distribución de Gumbel con la familia de n funciones χ ν, estudiando su aplicación para la predicción de caudales máximos de avenida. Se propone un test estadístico para la elección de la función de distribución más adecuada a los datos medidos. Finalmente se analiza el caso de seis estaciones de aforos de la cuenca del Sur, comparando las predicciones según cada una de las funciones de distribución.. Introducción Para predecir la riada máxima que puede producirse en el siglo o en el milenio, uno de los métodos es admitir que los caudales máximos anuales son una variable aleatoria cuya función de distribución es conocida. Una de las primeras distribuciones que se han utilizado fue la de Gumbel; pero basta ojear cualquier libro de Hidrología para comprobar que se han propuesto muchas funciones de distribución y es fácil comprobar que los resultados de las predicciones son diferentes según la función de distribución que se escoja, por lo tanto parece que lo primero que debe estudiarse es que función de distribución se adapta mejor a la muestra que tenemos y es demasiado arriesgado creer que una determinada función puede servir para casos muy diferentes. La función de distribución de Gumbel se ha utilizado muchas veces dándole valores a sus dos parámetros para igualar los dos primeros momentos de la muestra y de la función de distribución, con la única comprobación de la representación gráfica en papel probabilístico. La predicción de un mismo fenómeno como puede ser una riada se puede enfocar desde puntos de vista muy diferentes; para estudiar un encauzamiento interesará saber que caudal en metros cúbicos por segundo puede producirse en un siglo; pero si lo que se pretende es construir un puente sobre un cauce determinado solamente hace falta conocer la altura que alcanzara el agua en ese punto en un siglo. La relación entre la altura del agua y el caudal va a ser, en el caso mas sencillo, una función potencial de exponente de á 3 por lo que es evidente que las variables aleatorias como son la altura máxima anual del agua y el caudal máximo anual en un punto de un cauce tendrán funciones de distribución completamente diferentes y para valorar las dos predicciones no se podrá utilizar la misma función de distribución. Para las predicciones también puede ser necesario conocer el volumen máximo aportado por un río a un embalse en un siglo o milenio, el volumen aportado por un río dependerá de la riada del siglo o la milenaria pero también de la duración del periodo de lluvias, por lo tanto la aportación total será función de dos variables aleatorias que en general crecen al mismo tiempo puesto que una riada es más alta si dura más tiempo el periodo lluvioso, por lo que no es de extrañar que la altura de la riada, el caudal o la aportación del siglo no se puedan predecir con la misma función de distribución.
. Función de distribución χ ν Una familia de funciones de distribución recomendada para la predicción de valores extremos es la función de densidad ( para valores pares ) viene dada por: χ ν cuya ν x x e ν = ( x) ν χ! f ν < cuya media es ν y cuya varianza es ν. De esta familia de funciones de densidad escogemos aquellas en que ν = (,,, 6, 8 ). La más sencilla de todas las de esta familia es la χ ya que es la función exponencial cuya función de distribución es: F χ = - e -x para x para x < Esta función de distribución tiene propiedades muy importantes: En papel semilogarítmico invertido su representación es una recta. Lo que se demuestra fácilmente mediante los respectivos incrementos: x ln ( F( x) ) ( x + t) x = -(x+ t) ln e ln e -x t = = cte. t Si la función de distribución χ se trunca desde x o a infinito la varianza de la nueva distribución sigue siendo, En efecto si. x - f ( x) = k e x x. x x El coeficiente k se obtiene al ser el valor de la integral de la función de densidad en el ámbito de la variable k = x x e x e = x x de donde f ( x) = e para x x o siendo por lo tanto la misma función trasladada de a x o.por lo tanto la varianza no se modifica. 3. Comparación entre las funciones de distribución indicadas Para aplicar cualquier función de distribución a una variable aleatoria representada por una muestra, lo generalmente aceptado es igualar los momentos primero y segundo mediante una transformación lineal, por lo
tanto para comparar la función de Gumbel con la familia de la χ ν obtenemos las probabilidades en los puntos definidos por: x m + k* σ siendo k > - x m / σ ya que la función χ ν solo está definida para valores positivos y siendo x m la media y σ la desviación típica de la variable aleatoria definida por la función de densidad. Los diferentes valores de las funciones vienen dados en la tabla. Por interpolación en el cuadro anterior obtenemos los valores correspondientes a las probabilidades de,98,99,995,998,999, equivalentes a los periodos de 5 5 y, años, que se indican en la tabla. En estos cuadros se incluye la llamada función de distribución χ de la que se hablara más adelante. k Gumbel χ χ χ χ χ 6 χ 8 -,676, -,5,,83,8988 -,358,,7,3557,877 -,5,333,68,39369,37657,35953,35768,57378,756883,68689,63,59399,5768,56653,5,73,8633,88639,77687,7566,76,7397,85589,95,87976,86665,8576,8589,88796,5,973,977,976,9795,9696,975,9835,957737,9639,996,953,953378,9558,9576,5,97756,97396,9668,96983,973,97693,97877 3,98896,9885,97796,9868,98595,988,98966 3,5,99373,9857,9858,98889,99377,997,9958,99668,9883,99,9936,99597,99763,99778,5,99853,99938,99336,99593,99787,998563,99895 5,99979,998,9955,9975,9988,9993,99956 5,5,99955,99,99695,99897,999389,999666,999789 6,99975,9953,99799,99988,999679,9998,99997 6,5,999865,9965,99859,9997,99983,99995,999959 7,99999,99688,99938,999665,9999,999965,99998 7,5,999963,997,99933,999797,99995,99998,99999 8,99998,997859,99955,999877,999976,99999,999997 8,5,99999,998,99969,99995,999988,999996,999999 9,999995,99896,999789,999955,99999,999998,999999 9,5,999997,99873,999855,99997,999997,999999,,999998,99895,9999,999983,999998,, Tabla. Distribuciones de Gumbel comparadas con la familia χ n ν Años Gumbel χ χ χ χ χ 6 χ 8 5,6,98 3,,93,75,6,56 3,7,3 3,99 3,63 3,3 3,5 3,3 3,7 5,83,88,33 3,87 3,66 3,8 5, 8,9 6,5 5,5,59,3,,95, 6,96 5,93 5,,79,5 Tabla.. Probabilidades para distintos periodos de retorno
La comparación de estas funciones de distribución se completa con la figura en la que se han dibujado en escala semilogaritmica invertida las funciones de distribución de la tabla y la función de distribución normal por ser el limite de la χ ν cuando ν tiende a. También se ha dibujado la función que hemos llamado χ. Esta escala semilogaritmica invertida tiene la ventaja de llegar a probabilidades mucho más altas, en los casos que sea necesario. En el caso de la función de Gumbel en su parte derecha es una línea recta. Nótese la escasa diferencia entre esta función y la χ Funciones de distribución en papel semilogaritmico -Log( - F(x)) 3 5 6 7 8 Valores de k 8 6 Ji sub nu= nu= nu= nu=6 nu=8 Gumbel N (;) - Figura. Comparación entre las funciones de distribución. Funciones de distribuciones truncadas. Si de una función de distribución escogemos solo el intervalo ( x o, ) variando convenientemente el coeficiente obtenemos otra función de distribución diferente de la anterior. Como la función de densidad de la variable χ ν no es integrable para el valor pero si para los valores pares para calcular el nuevo coeficiente y la varianza de la función truncada para ν = no podemos obtener una fórmula que nos dé la varianza de las muestras truncadas. Hay que calcularlas mediante las integrales definidas correspondientes. Dado que la función de distribución tiene de media y de varianza para compararla con las funciones de distribución con parámetro diferente, calculamos las varianzas de las distribuciones truncadas para los intervalos definidos por x m + k*σ que en este caso es: + *k k Varianza de distribución truncada 8 3,57877 7 3,536 6 3,586 5 3,99 3,3867 3 3,37 3,8756 3,973,73 -.77, Tabla 3. Varianza de la distribución χ truncada
observándose que al crecer el punto de truncado aumenta el valor de la varianza. De la función de distribución χ ya se ha dicho que las varianzas de las distribuciones truncadas son todas iguales a. (permanece constante). La función de densidad de χ es: f χ ( x) x xe = < Truncando esta función de densidad desde x a obtenemos en función de x el valor de la varianza es: ( 6x + 6) ( x ) σ = + ( disminuye al crecer el punto de truncado ) χ + Del mismo modo para ν = 6 la función de densidad para valores positivos de x es: f ( x) = e χ 6 6 x Truncando esta función de densidad desde x a se obtiene en función de x el valor de la varianza es: 3 σ χ = *(x + 6x + 96x + 9x + 9 ) / ( x + x + 8 ) 6 x La función de densidad de χ 8 es: f χ 8 ( x) x 3 x e = 96 < Como anteriormente obtenemos que la varianza de la distribución truncada es: 6 5 3 3 ( x x x x x x ) ( x x x ) σ χ = + + 6 + 536 + 68 + 96 + 96 + 6 + + 8 8 En resumen por las formulas anteriores vemos que al crecer el punto de truncado x o, la varianza de la distribución truncada disminuye para ν ; para ν = la varianza disminuye de 8 hasta ; para ν = 6 la varianza disminuye de hasta ; y para ν = 8 la varianza disminuye de 6 hasta. Para ν = la varianza es constante y para ν = vemos en la relación anterior que la varianza aumenta al aumentar el punto de truncado. 5. La función de distribución χ p La función Gamma esta definida por: p x Γ(p) = x e dx Haciendo el cambio de variable y = x se obtiene: para p >
p y e y dy = Γ( p) y por lo tanto definimos la función de distribución de χ p como: p x y F ( x) = e y dy χ p Γ(p) teniendo en cuenta la definición de la función Gamma es fácil de deducir que la media de la variable aleatoria que sigue esta distribución es: p*(p+) y que el momento de segundo orden es: p(p+)(p+)(p+3) y que por lo tanto la varianza será p(p+)(p+3) Cuando p = se tiene: F χ ( x) = x e x x dx Esta función tiene de media y de varianza.y las varianzas de las distribuciones truncadas son siempre crecientes. Como esta función tampoco es integrable, los cálculos se han realizado mediante el calculo de las integrales definidas, obteniéndose los valores que figuran en las tablas y y en las figuras y. Varianza Distribuciones truncadas nu=,,,6,8, 5 Varianza en % Varianza total 5 5 Ji sub nu = nu = Gumbel nu = nu 6 nu = 8 - - 6 8 Valores de k siendo ( xm+ k * o ) Figura. Varianza de las distribuciones truncadas
6. Test para comprobar la validez en la aplicación de una función de distribución. Si tenemos una muestra y la ordenamos en orden creciente es decir i x i =< x i + dentro de la muestra se pueden escoger las submuestras truncadas siguientes, y obtener las cuasivarianzas correspondientes: x, x, x 3,...x i..x j...x n. x, x 3,...x i..x j...x n. x 3,...x i..x j...x n.... x i..x j...x n.... x n-, x n-, x n x n-, x n x n La cuasivarianza de la muestra completa es el mejor estadístico centrado que podemos tener para estimar la varianza de la variable aleatoria, los valores siguientes de las cuasivarianzas de las submuestras truncadas, nos darán valores que pueden ser mayores menores o iguales que la cuasivarianza de la muestra completa si estas van disminuyendo al reducirse el numero de elementos de la submuestra truncada, podemos decir que la muestra se comporta de modo parecido a las funciones de distribución truncadas en los casos de la función χ ν cuando el parámetro es superior a. Si prácticamente permaneciera constante diríamos que la muestra sigue la distribución exponencial En cambio si las cuasivarianzas de las submuestras truncadas aumentan en valor al disminuir el numero de elementos solamente podríamos decir que la muestra se parece a la función de distribución χ o a la llamada χ p que son las únicas funciones, de las consideradas en este estudio, que al truncarlas aumenta la varianza. 7. Aplicación del test a los datos de las estaciones aforos de la cuenca del Sur De las estaciones de aforos de la Confederación Hidrográfica del sur de España se han seleccionado los caudales máximos anuales de toda la serie de años, se han ordenado de modo creciente y se han obtenido las cuasivarianzas de las muestras truncadas, eliminando sucesivamente los valores inferiores. Las correspondientes gráficas se muestran en la figura 3 tomando como abscisas el valor mayor de los caudales suprimidos y como ordenadas la cuasivarianza de la muestra truncada expresada en tanto por ciento de la cuasivarianza de la muestra completa. Como para el caudal máximo no esta definida dicha cuasivarianza, se toma el valor cero. En las figuras 3a 3b 3c se observa que las cuasivarianzas de las muestras truncadas aumentan ( de a 6 veces ) al suprimir los caudales más bajos. En cambio en las figuras 3d 3e y 3f las cuasivarianzas disminuyen al aumentar el punto de truncado. Por tanto, en estos casos será acertado utilizar la función de distribución de Gumbel o también las funciones de distribuciones de la χ ν cuando ν >=. En la tabla 3 se resumen las predicciones de las 6 estaciones de aforos para un periodo de retorno de años, utilizando las diferentes funciones de distribución, los caudales máximos registrados y el número de años. Para el cálculo de esos caudales se utiliza la formula x m + k*σ obteniéndose k de la tabla en la fila correspondiente a los años. Se puede comprobar que las predicciones con Gumbel cuando el test de las cuasivarianzas truncadas decrece al aumentar el punto de truncado son aceptables y que en los tres casos restantes, las predicciones con Gumbel son inferiores a la máxima riada registrada en periodo de solo 5 años, y solamente se superan las riadas máximas con las predicciones de la función de distribución χ p ( p = )
Est. de aforos nº años m3/ sg Gumbel χ χ χ Corchado 59 35 379,6 8,8 5, 55, Hoya del Bujo 53 9 6,3 8,7 9,9 9, Cortijo del monte 5 6,8 7, 7,5 33, Las Tosquillas 5 595, 83,9 537,8 63, Presa del agujero 3 68 5,5 6,5 676,5 787, Ardales 5 65.69,.8,.37,3.68,5 Tabla 3. Caudal máximo previsto para un periodo de retorno de años 8. Limitaciones del test propuesto En una función de distribución se encuentran representados todos los valores de la variable aleatoria con probabilidades diferentes según la función de distribución, si se toma un intervalo muy pequeño dentro del campo de variación siempre existe una probabilidad para que la variable aleatoria se encuentre en ese intervalo, pero en cambio al coger una muestra de n elementos, siendo por ejemplo n = 5, la probabilidad de que en ella se encuentre el valor correspondiente a la riada de ó 5 años es muy pequeña. En general, no se encontrará en la muestra. Una muestra de pequeño tamaño cuando lo que se quiere es predecir una riada de un periodo mucho mas amplio, puede considerarse como una muestra truncada superiormente. Para compararla con una función de distribución habría que truncar la función de distribución a partir de un cierto valor. Al aplicar el test de las cuasivarianzas truncadas a una función de distribución que previamente se ha truncado en su parte superior lo que si sabemos es que la varianza de esa función de distribución doblemente truncada será menor que la varianza de la función de distribución truncada solo inferiormente y por lo tanto el test propuesto se queda del lado de la seguridad. 9. Conclusiones () Para representar los puntos de una muestra en lugar de utilizar el papel probabilístico de Gumbel se puede utilizar el papel semilogarítmico invertido con la ventaja de poder añadir uno a continuación de otro si queremos llegar a probabilidades muy altas. () Ordenar la muestra en sentido creciente y obtener las cuasivarianzas de las muestras truncadas si estas decrecen al crecer el punto de truncado es aceptable las predicciones que se pueden hacer con la función de distribución de Gumbel. En caso contrario utilizar este método puede dar previsiones que no estén de acuerdo con la realidad. (3) La función de distribución de Gumbel supone predecir la riada del milenio con la media del periodo mas cinco veces la desviación típica. Si se utiliza la función χ p la predicción del milenio seria la media mas veces la desviación típica.
Estación deaforosdeardales EstacióndeaforosdeHoyadelBujo 7 6 5 8 6 3 5 5 3 5 6 7 8 9 Media,5 m3/sg.( 5 años ) desv.típ. 6, (a) Media 3,8 m3/sg.( 53 años ) desv.típ.,3 (d) 5 EstacióndeaforosdePresadelAgujero Estación de aforos de Cortijo del Monte 3 8 6 3 5 6 7 8 Media 8,5 m3/sg.( 3 años ) desv. típ. 6, (b) 5 5 Media 58, m3/sg.( 5 años ) desv. típ. 3,7 (e) 5 EstacióndeaforosdelasTosquillas Estación de aforos de Corchado 3 8 6 3 5 6 7 5 5 5 3 35 Media 59, m3/sg. ( 5 años ) desv. típ. 98, (c) Media,8 m3/sg. (59 años ) desv. típ. 6, (f) Figura 3. en estaciones de aforos del Sur