Capítulo 5 REVISIÓN DE CONCEPTOS DE ESTADÍSTICA Y PROBABILIDAD



Documentos relacionados
Variables aleatorias continuas

CUESTIONES DE AUTOEVALUACIÓN (TEMA 1)

Sistemas de Generación de Energía Eléctrica HIDROLOGÍA BÁSICA. Universidad Tecnológica De Pereira

EJERCICIOS RESUMEN. Aplicación: INFERENCIA ESTADÍSTICA. Nota técnica preparada por: Mayte Zaragoza Benítez Fecha: 13 de mayo de 2013

Asignatura: Econometría. Conceptos MUY Básicos de Estadística

Eduardo Kido 26-Mayo-2004 ANÁLISIS DE DATOS

Tema 1. Inferencia estadística para una población

Tema 5. Variables aleatorias discretas

Tema 07. LÍMITES Y CONTINUIDAD DE FUNCIONES

T.1 CONVERGENCIA Y TEOREMAS LÍMITE

Selectividad Septiembre 2009 SEPTIEMBRE Opción A

Anexo 4. Herramientas Estadísticas

UNIVERSIDADES DE ANDALUCÍA PRUEBA DE ACCESO A LA UNIVERSIDAD OPCIÓN A

Métodos generales de generación de variables aleatorias

ESTIMACIÓN. puntual y por intervalo

Tema 5. Aproximación funcional local: Polinomio de Taylor. 5.1 Polinomio de Taylor

Universidad del País Vasco

1 Introducción Distribución exponencial Distribución Weibull Distribuciones Gamma y k-erlang... 10

Tema 3: Variables aleatorias y vectores aleatorios bidimensionales

UNIVERSIDAD DE ATACAMA FACULTAD DE INGENIERÍA / DEPARTAMENTO DE MATEMÁTICA

Inferencia Estadística

ESTADÍSTICA SEMANA 4

UNIDAD 4 PROCESOS DE MARKOV

Estimación de la densidad

1.1. Introducción y conceptos básicos

Covarianza y coeficiente de correlación

Medidas de tendencia central o de posición: situación de los valores alrededor

UNIVERSIDAD DE ATACAMA FACULTAD DE INGENIERÍA DEPARTAMENTO DE MATEMÁTICA

Si buscamos conversiones de una variable aleatoria exponencial con parámetro Á,, el método de la transformada inversa produce

4. Se considera la función f(x) =. Se pide:

CAPÍTULO 10 Aplicaciones de la Derivada a Funciones Económicas

MÓDULO 2 CURVAS INTENSIDAD DURACIÓN FRECUENCIA

LA MEDIDA Y SUS ERRORES

Selectividad Septiembre 2013 OPCIÓN B

Diagnosis y Crítica del modelo -Ajuste de distribuciones con Statgraphics-

MATEMÁTICAS CCSS JUNIO 2010 (COMÚN MODELO5) SELECTIVIDAD ANDALUCÍA

Tema 7. Límites y continuidad de funciones

MATEMÁTICAS APLICADAS A LAS C.C. SOCIALES

Relación de problemas: Variables aleatorias

Lección 24: Lenguaje algebraico y sustituciones

Introducción a la Teoría de Probabilidad

Matemáticas C.C.S.S. Repaso de Selectividad 1. Se desea obtener dos elementos químicos a partir de las sustancias A y B. Un kilo de A contiene 8

OPCIÓN A 0 1 X = Podemos despejar la matriz X de la segunda ecuación ya que la matriz. 1 1 ; Adj 0 1 X =

TEMA 5. MUESTREO PARA LA ACEPTACIÓN.

Tema 1: Fundamentos de lógica, teoría de conjuntos y estructuras algebraicas: Apéndice

Fundamentos de Investigación de Operaciones Investigación de Operaciones 1

Límites y Continuidad de funciones

EJERCICIOS RESUELTOS TEMA 3

Academia de Matemáticas. Apuntes para la Materia de Estadística II. Guía Básica para el Estudio de la Estadística Inferencial.

5. DISTRIBUCIONES DE PROBABILIDADES

5 Ecuaciones lineales y conceptos elementales de funciones

UNIVERSIDAD DE ATACAMA

Tema 2 Límites de Funciones

Los números racionales

Tema 1: Test de Distribuciones de Probabilidad

GUÍA DE EJERCICIOS UNIDAD II

_ Antología de Física I. Unidad II Vectores. Elaboró: Ing. Víctor H. Alcalá-Octaviano

LABORATORIO Nº 2 GUÍA PARA REALIZAR FORMULAS EN EXCEL

FUNDAMENTOS DEL ANÁLISIS DE WEIBULL Por Robert B. Abernethy, FL, USA

Tema 3 VARIABLE ALEATORIA DISCRETA. PRINCIPALES DISTRIBUCIONES

LA DISTRIBUCIÓN NORMAL, LA CALCULADORA Y LAS NUEVAS TECNOLOGÍAS Abel Martín ( * ) Rosana Álvarez García ( )

Tema 3 Probabilidades

ESTADISTICA Y PROBABILIDAD

PRUEBAS DE HIPÓTESIS

CONCEPTOS PREVIOS TEMA 2

LÍMITES DE FUNCIONES. CONTINUIDAD

Análisis y cuantificación del Riesgo

CIIF CENTRO INTERNACIONAL DE INVESTIGACION FINANCIERA

NÚMEROS NATURALES Y NÚMEROS ENTEROS

MADRID / JUNIO 06 LOGSE / MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES / OPCIÓN A/ EXAMEN COMPLETO

CAPÍTULO La Distribución Normal

Este documento ha sido generado para facilitar la impresión de los contenidos. Los enlaces a otras páginas no serán funcionales.

15 PARÁMETROS ESTADÍSTICOS

4 Teoría de diseño de Experimentos

CORRELACIÓN Y REGRESIÓN EMPLEANDO EXCEL Y GRAPH

LÍMITES Y CONTINUIDAD

Teóricas de Análisis Matemático (28) - Práctica 4 - Límite de funciones. 1. Límites en el infinito - Asíntotas horizontales

Tema 3. Variables aleatorias. Inferencia estadística

REPASO CONCEPTOS BÁSICOS DE ESTADÍSTICA. DISTRIBUCIÓN NORMAL.

FUNCIÓN EXPONENCIAL - FUNCIÓN LOGARÍTMICA

Clase 2: Estadística

Una función f es derivable en un punto a de su dominio si existe el límite. f(x) f(a) Si f y g son derivables en a, entonces fg es derivable en a y

MEDIDAS DE TENDENCIA CENTRAL

EJERCICIOS RESUELTOS DE REPRESENTACIÓN GRÁFICA DE FUNCIONES REALES

3FUNCIONES LOGARÍTMICAS

Distribuciones de Probabilidad en Arena

Soluciones Examen de Estadística Ingeniería Superior de Telecomunicación

Una desigualdad se obtiene al escribir dos expresiones numéricas o algebraicas relacionadas con alguno de los símbolos

MATEMÁTICAS BÁSICAS UNIVERSIDAD NACIONAL DE COLOMBIA - SEDE MEDELLÍN CLASES # 13 y #14

Cadenas de Markov.

Programa para el Mejoramiento de la Enseñanza de la Matemática en ANEP Proyecto: Análisis, Reflexión y Producción. Fracciones

8LÍMITES Y DERIVADAS. Problema 1. Problema 2. Problema 3

Biometría Clase 8 Pruebas de hipótesis para una muestra. Adriana Pérez 1

ANÁLISIS DE DATOS NO NUMERICOS

Nombre del polinomio. uno monomio 17 x 5 dos binomio 2x 3 6x tres trinomio x 4 x 2 + 2

CAPITULO 4 JUSTIFICACION DEL ESTUDIO. En este capítulo se presenta la justificación del estudio, supuestos y limitaciones de

Clase 5: Variables Aleatorias y Distribuciones de Probabilidad

1. INVERSA DE UNA MATRIZ REGULAR

Comente: Los bancos siempre deberían dar crédito a los proyectos rentables. Falso, hay que evaluar la capacidad de pago.

JOSE VICENTE CONTRERAS JULIO CALCULO INTEGRAL LA ANTIDERIVADA

Transcripción:

Capítulo 5 REVISIÓN DE CONCEPTOS DE ESTADÍSTICA Y PROBABILIDAD 73

La planeación y el diseño de proyectos relacionados con el agua necesitan información de diferentes eventos hidrológicos que no son gobernados por leyes físicas y químicas conocidas, sino por las leyes de azar. Por ejemplo, el caudal de un río varía día a día y año tras año, y no puede predecirse exactamente cual será su valor en un período de tiempo cualquiera. En el caso del diseño de un puente, el estudio hidrológico determinaría la creciente asociada con una probabilidad crítica(se busca determinar el caso crítico), la cual se supone representa el riesgo para el puente. Esto solo puede determinarse a través del análisis probabilístico y estadístico basado en los registros hidrológicos del pasado. Es dable afirmar que la hidrología, en algunos casos, trata con variables aleatorias cuyo comportamiento no puede predecirse con certidumbre. El comportamiento de una variable aleatoria está descrito por una ley de probabilidades, la cual asigna medidas de probabilidad a posibles valores o rangos de ocurrencia de la variable aleatoria. Las variables aleatorias pueden ser discretas o continuas. Se dice que una variable aleatoria es discreta si ella sólo puede tomar valores específicos. Por ejemplo, si N denota el número de días lluviosos en el mes de diciembre, entonces N es una variable aleatoria discreta. En este caso, la ley de probabilidades asocia medidas de probabilidad a cada posible ocurrencia de la variable aleatoria. Una variable aleatoria es continua si puede tomar todos los valores en un rango de ocurrencia. Por ejemplo, si Q es una variable aleatoria que denota el valor de los caudales promedios diarios del río Magdalena, entonces Q 74

puede asumir cualquier valor y es entonces una variable aleatoria continua En este caso la ley de probabilidades asigna medidas de probabilidad a rangos de ocurrencia de la variable aleatoria. En el análisis probabilístico y estadístico en hidrología, se asume que la información histórica disponible de una variable hidrológica representa una muestra tomada de una población cuyas características se desconocen. En el análisis probabilístico se analizan posibles leyes de probabilidad que pueden describir el comportamiento de las variables de la población. En el análisis estadístico, se hacen inferencias sobre la variable (la población), usando la muestra. Por ejemplo, cuando se calcula una media con observaciones disponibles, se está infiriendo que la media calculada es la media de la población, lo cual no necesariamente es verdad, pues esto dependerá de la calidad de la información, del número de observaciones y otros aspectos. El hecho es que muchos fenómenos hidrológicos son erráticos, complejos y de naturaleza aleatoria, y solo pueden ser interpretados en un sentido probabilístico. Uno de los problemas más importantes en hidrología es la interpretación de registros de eventos pasados para inferir la ley de probabilidades de la variable hidrológica (población) de interés, procedimiento que en hidrología se conoce con el nombre de análisis de frecuencia. Por ejemplo supóngase que se tienen registros del caudal del río Magdalena durante un período de 50 años. Son factibles dos tipos de análisis: descriptivo y de inferencia. El primero se realiza sin ninguna referencia a su población, de la cual se tiene una muestra de 50 años. Consiste, básicamente, en calcular propiedades estadísticas, como media, varianza y otras. En el segundo, la muestra se analiza para inferir las propiedades de su población, lo cual ayudará a derivar las características probabilísticas del caudal. El primero es una aplicación de los métodos estadísticos que requieren poca 75

decisión y poco riesgo. El segundo involucra riesgos y requiere una total comprensión de los métodos empleados y el peligro involucrado en la predicción y estimación de las variables. Los objetivos básicos de la estadística en la hidrología son entre otros: ) Interpretación de las observaciones ) Análisis de la calidad de la información 3) Inferencia sobre el comportamiento de la variable 4) Extracción del máximo de información de los registros 5) Presentación de la información en gráficas, tablas, ecuaciones, que básicamente ayudan a la toma de decisiones en el planeamiento de los recursos hídricos. En resumen, el objetivo principal de la estadística en hidrología es obtener información de los fenómenos hidrológicos pasados y hacer inferencias acerca de su comportamiento en el futuro. 5. CONCEPTOS BÁSICOS 5.. Concepto de probabilidad. La probabilidad de ocurrencia de un evento dado es igual a la relación entre el número de sucesos favorables m y el número de sucesos totales, n: m P ( X = x) = (5.) n La teoría de la probabilidad se basa en los siguientes axiomas: 76

) La probabilidad de ocurrencia de un evento, Pi, siempre tiene un valor entre 0 y, así: 0 Pi (5.). La probabilidad de un evento cierto es : α i= P i = (5.3) ) Si X y X son eventos independientes y mutuamente excluyentes, entonces: P X X ) = P( X ) + P( ) (5.4) ( X Dos eventos son independientes si la probabilidad de ocurrencia de uno no se ve afectada por la ocurrencia del otro,. y se dice que son mutuamente excluyentes cuando la ocurrencia de uno imposibilita la ocurrencia del otro. Los axiomas anteriores permiten la definición de conceptos importantes. Por ejemplo, si dos eventos X y X no son mutuamente excluyentes, la probablidad de que ocurra X u ocurra X está dada así: P X X ) = P( X ) + P( X ) P( X ) (5.5) ( X La P X X ) es llamada unión de probabilidades y se lee la probabilidad ( de X o X. 77

La probabilidad de que dos eventos independientes ocurran de manera simultánea es el producto de las probabilidades individuales así: P X X ) = P( X ) P( ) (5.6) ( X La P( X X ) es llamada la probabilidad de intersección y se lee la probabilidad de X y X. La probabilidad de que ocurra un evento X dado que ha ocurrido X se llama probabilidad condicional y se denota así: Ejemplo 5. X X P X ( ) = P( ) X (5.7) P( X ) Supóngase que el río Cauca alcanza cada invierno un nivel de creciente con una frecuencia relativa de 0.. En el Cauca hay un puente cuya probabilidad de falla en los estribos es 0,3 y la experiencia muestra que cuando hay creciente, las probabilidades de esta falla suben a 0,5. Las probabilidades son: P(creciente) = P(C) = 0, P(no creciente) = P(C) = 0,8 P(falla) = P(F) = 0,3 P(no falla) = P(F) = 0,7 P (falla dada creciente) = P(F/C)= 0,5 Se desea conocer la probabilidad de falla del puente. Solución: El puente falla (queda inutilizado) cuando falla en los estribos o cuando hay creciente; esto se puede denotar así: 78

P( C F) = P( C) + P( F) P( C F) Aplicando la ecuación 5.7 de probabilidad condicional: P( C F) = P( C) P( F ) C Reemplazando valores, se obtiene: P ( C F) = 0.. 0. 5 = 0. Al reemplazar este valor en la expresión de unión de probabilidades, se concluye finalmente que P(C F)=0.4 5.. Período de retorno: Se define el período de retorno, Tr, de un evento de cierta magnitud como el tiempo promedio que transcurre entre la ocurrencia de ese evento y la próxima ocurrencia de ese evento con la misma magnitud. Se define también como el tiempo que transcurre para que un evento sea excedido o igualado, al menos una vez en promedio. Si P es la probabilidad de excedencia, se puede demostrar matemáticamente que: (5.8) Tr = P Por ejemplo, si un caudal de 8098 m 3 /s es excedido en promedio una vez cada 0000 años, entonces su período de retorno, Tr, es de 0000 años. 5..3 Concepto de riesgo. En el diseño de obras hidráulicas expuestas a grandes avenidas, es necesario considerar el riesgo asociado con el valor seleccionado para el diseño. Por lo común, el ingeniero diseña una obra para resistir una avenida de cierta magnitud. Se define el riesgo R de un diseño como la probabilidad de que la avenida para la cual se diseña la obra sea excedida. Se entiende que ésta es 79

una situación de riesgo, pues la obra se diseña para soportar cierta avenida máxima, y crecientes mayores le podrían hacer daño o incluso destruirla. El riego R puede entonces escribirse como: R = - ( - T r ) n (5.9) La confiabilidad se define como el complemento del riesgo (Confiabilidad = -R). Se quiere que la obra tenga un riesgo pequeño de dañarse o, lo que es lo mismo, una alta confiabilidad. Ejemplo 5. Qué período de retorno debe escoger un ingeniero en el diseño de un box-culvert, si se acepta solo el 0% de riesgo de avenida en una vida útil, n, de 5 años? Solución: Aplicando la ecuación 5.9 se tiene: R = 0. = - (- Reemplazando los valores de Tr y n se obtiene: TR = 38 años Ejemplo 5.3 T r ) 5 Una presa por gravedad puede fallar por deslizamiento (A), por crecientes (B), o por ambas. Asumir que : ) La probabilidad de falla por deslizamiento es dos veces la probabilidad de falla por creciente: P(A)= P(B) 80

) La probabilidad de falla por deslizamiento, dado que ha habido creciente, es 0.8 3) La probabilidad de falla de la presa es de *0-3 Determinar la probabilidad de que ocurra un deslizamiento, P(A). Solución: La presa queda inutilizada cuando se presenta una falla por deslizamiento o cuando hay una creciente, lo que puede expresarse como: P ( A B) = 0. 00 = P( A) + P( B) P( A B) () Se tiene además que: P(A) = P(B) () Reemplazando la () en la (): 0. 00 = 3P( B) P( A B) (3) Se sabe que: A A B P ( ) = 0. 8 = P( ) B (4) P( B) Resolviendo simultáneamente la (3) y la (4), se obtiene: P(A) = 9. * 0-4 8

Ejemplo 5.4 De 000 circuitos de tubería de acueducto en una ciudad, se reportan 5 contaminados con materias fecales; 5 tienen excesivas concentraciones de plomo (Pb) y entre éstos dos de ellos contaminados también por materias fecales. Se pregunta: a) Cuál es la probabilidad de que un sistema seleccionado al azar resulte con contaminación fecal? b) Suponiendo que un sistema se encuentre contaminado con materias fecales, cuál es la probabilidad de que también esté contaminado con plomo? c) Cuál es la probabilidad de que un sistema seleccionado al azar esté contaminado? d) Suponiendo que la probabilidad de contaminación hallada en el numeral anterior no es satisfactoria, y que se desea que no exceda de 0.0, cuál es el valor permisible para la probabilidad de contaminación por materias fecales, asumiendo que el valor de la probabilidad condicional hallada en el numeral b aún se puede aplicar? Solución: Llamemos P(F) a la probabilidad de contaminación por materia fecal, P(Pb) a la probabilidad de contaminación por plomo y P(C) a la probabilidad de contaminación por plomo o por materia fecal. Se tiene entonces: a) P(F) = 7/000 b) La probabilidad condicional P(Pb/F) puede expresarse como: P( Pb / F) = P(Pb F) P(F) 8

y P(Pb) = 5/000. Reemplazando, se obtiene que: P(PBI/F) = /7 c)se pregunta en este numeral el valor de P(C); este valor establece la probabilidad de que un circuito esté contaminado con plomo o con materias fecales. Como hay 5 circuitos contaminados con materias fecales y 5 contaminados con plomo, se tiene entonces que: P(C) = 0/000= 0.00 d) La probabilidad de contaminación C se puede expresar como: P C) = P( F P ) P( F) + P( B) P( F P ) () ( b b y se conoce el valor de la probabilidad condicional: P( Pb / F) = / 7 = P( Pb F) P( F) Resolviendo la () y la () simultáneamente se halla que: P(F) = 0.00567 () 5. DISTRIBUCIONES DE FUNCIONES DE PROBABILIDADES EN HIDROLOGIA Tal como se había mencionado anteriormente, el comportamiento de las variables aleatorias discretas o continuas se describe con la ley de probabilidades asociada, que asigna medidas de probabilidad a ocurrencias o a rangos de ocurrencia de la variable. Estas leyes de probabilidad reciben el nombre de funciones de distribuciones de probabilidad. Como notación, se representa por una letra mayúscula la variable aleatoria, y por una letra minúscula, un valor específico, una relación o una muestra de la variable. P(X = a) indica la probabilidad de que la variable aleatoria X tenga un valor de a; similarmente, P(a<X<b) indica la probabilidad que la variable aleatoria 83

X esté en el intervalo [a, b].si se conoce la probabilidad P(a<X<b) para todos los posibles valores de a y b, se dice que se conoce la distribución de probabilidades de la variable X. Si se tiene una muestra cuyas observaciones se asumen extraídas de una misma población (idénticamente distribuidas), ellas pueden presentarse como un histograma de frecuencias. Todo el rango disponible de la variable aleatoria se divide en intervalos discretos; se cuenta el número de observaciones que cae en cada intervalo, y el resultado se dibuja en un diagrama de barras como el mostrado en la Figura 3., que representa la precipitación promedio anual en una estación. FIGURA 5. Histograma de frecuencias. Supóngase que se tiene una variable continua y el ancho x del intervalo que se usa para el histograma se escoge tan pequeño como sea posible; supóngase igualmente que se tiene el suficiente número de observaciones en cada intervalo, para que el histograma de frecuencia muestre variaciones suaves en todo el rango de valores. Si el número de observaciones ni en el intervalo i que cubre el rango [xi- x, xi] se divide por el número total de observaciones, N, el resultado se denomina función de frecuencia relativa fs (x): 84

ni f s (x i) = (5.0) n la cual es un estimado de P( xi - x<x<xi), la probabilidad de que la variable aleatoria X caiga en el intervalo [xi - x, xi]. El subíndice s indica que la función es calculada de los datos muestrales. La suma de los valores de las frecuencias relativas en un punto es la función de frecuencia acumulada, Fs(x),dada como: i ( x j) FS (x i) = f S (5.) j= Este es un estimado de P(X xi), la probabilidad acumulada de xi, o función acumulada de probabilidades. Las funciones de frecuencia relativa y frecuencia acumulada se definen para una muestra. Las funciones correspondientes a la población se obtienen en el límite cuando n y x 0. En el límite, la función de frecuencia relativa dividida por el intervalo x, se convierte en la función de densidad de probabilidades fx(x) f X (x) = f lim n û[ 0 S (x) û[ (5.) La función de frecuencia acumulada se convierte en la función acumulada de distribución de probabilidades FX(x) FX (x) = lim FS(x) (5.3) n û[ 0 85

cuya derivada es la función de densidad de probabilidad: dfx (x) fx (x) = (5.4) dx Para un valor dado de la variable aleatoria X, Fx(x) es la probabilidad acumulada P(X x), y puede expresarse como la integral de la función de densidad para el rango X x. P(X x) = F (x) = f (u)du (5.5) X x X en donde u es una variable de integración. Si se tiene la función de distribución acumulada para una variable X y se tiene un valor xa de esa variable, (ver Figura 5.) se cumple que: X ( ) = P ( X x ) F xa (5.6) A Una forma bastante usada en hidrología para escribir el valor de una variable hidrológica asociada a cierto período de retorno es la de utilizar lo que se conoce como factor de frecuencia, K. En este caso, el valor de la variable se puede escribir como: X A = µ + Kσ (5.7) 86

Donde µ representa la media y K es la desviación típica de la variable hidrológica. XT es el valor de la variable aleatoria asociada a un período de retorno T. Como se sabe: F X (X T ) = P = ( X XT) ( X > ) - P X T P(XXT ) representa la probabilidad de excedencia, la cual está relacionada con el período de retorno como: P ( X X ) = T T (5.8) );[ 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0. 0. 0 3 4 5 6 7 8 9 0 x FIGURA 5. Distribución acumulada De donde: F ( X X T ) = T 87

O: Y se obtiene finalmente: K F X (µ + σk) = F = X T T FX - ( ) representa el inverso de la distribución acumulada de probabilidades. Por ejemplo, para obtener FX - ( - /T), se entra al gráfico 5. con el valor de -/T al eje de probabilidades, y se lee en el otro eje el valor del inverso de la distribución acumulada de probabilidades. Lo que significa que el factor de frecuencia es función de la distribución de probabilidades y del período de retorno que se escoja. La función de densidad de probabilidades tiene las siguientes características cuando la variable aleatoria es continua: ) ) - f X (x)dx = (5.9) 3) b P(a X b) = f (x)dx (5.0) a X b f X (x)dx = 0 b (5.) Cuando la variable aleatoria es discreta las anteriores propiedades se pueden denotar así: 88

) ) f ( x i ) = i (5.) 3) xi b ( ) = P a X b f ( xi ) (5.3) xi a i j ( ) = = P X x j f( x i ) (5.4) = i Lo que implica que las probabilidades se definen solo como áreas bajo la función de densidad de probabilidades, FDP, entre límites finitos. Ejemplo 5.5 Hallar la función de distribución acumulada para una variable aleatoria que se define como el número de veces que se lanza una moneda, hasta que aparece cara. Solución: La probabilidad de que caiga cara en cualquier ensayo es ½ y es independiente de la probabilidad de que caiga sello. Si A es el evento de que caiga sello en el primer ensayo y B (es el evento) de que caiga sello en el segundo ensayo, la probabilidad que suceda A y B es: 89

P(AB) = P(A) + P(B) = (/) Si hay x- ensayos, la probabilidad de que caiga sello en el ensayo (x-) es (/) x- y la probabilidad de cara en el x-avo ensayo es: (/) x- ½ = (/) x se tiene entonces que: x P(X=x) Fx(x) ½ ½ ¼ ¾ 3 /8 7/8 en donde x es el número de ensayos, P(X=x) es la probabilidad de ocurrencia de sello en todos los ensayos y FX(x) es la función de probabilidades acumulada. 5.3 MOMENTOS DE LAS DISTRIBUCIONES Las propiedades matemáticas de las distribuciones estadísticas pueden ser definidas en términos de los momentos de la distribución. Los momentos representan parámetros que tienen significado físico o geométrico. Se reconocerá fácilmente la analogía entre los momentos estadísticos y los momentos de área estudiados en mecánica de sólidos. El r-avo momento con relación al origen se define como: = r X - r µ x f (x)dx (5.5) 90

o en el caso discreto: n = r X i= r µ xi f (xi ) (5.6) El subíndice se usa para momentos respecto al origen. El primer momento con respecto al origen representa la media de la distribución. Los momentos pueden definirse con respecto a otro punto distinto al origen. Por ejemplo, el r-avo momento con respecto a la media se puede escribir como: r µ = (x - µ ) fx(x)dx r - n µ r = i= f ( x )( x µ ) X i r (5.7) (5.8) La primera de estas ecuaciones para el caso de una variable aleatoria continua y la segunda si la variable es discreta. Rara vez se necesita calcular más de tres momentos. Estos son usados para estimar los parámetros y describir las características de la distribución. 5.4 CARACTERISTICAS ESTADISTICAS BASICAS Uno de los usos de la estadística es extraer la información esencial de una muestra de datos, para determinar las características y el comportamiento de la población. Hay algunas características básicas, como la media, la varianza y otras que se pueden calcular o estimar utilizando la muestra de datos disponibles, para tratar de entender el comportamiento general de la población. 9

En general, las características estadísticas básicas se calculan como el valor esperado E de alguna función de una variable aleatoria. El valor esperado de una función g(x) de una variable aleatoria X se define como: [ g X) ] = E ( g( u) fx ( u) du (5.9) En donde fx (u) representa la función de distribución de probabilidades (FDP) de la variable X Las principales características son: - La media E: representa el valor esperado de la variable misma. Para una variable aleatoria X, la media E(X) es el primer momento con respecto al origen; es una medida de la tendencia central de la distribución: E(X) = - µ = x f (x)dx (5.30) X El estimador de la media a partir de una muestra se puede escribir como: N ˆ x = xi (5.3) N i= - La varianza K : mide la variabilidad de los datos, la dispersión de los mismos alrededor de la media. Es el segundo momento respecto a la media: 9

E[(X - µ ) ] = σ = (x - µ ) - f X (x)dx (5.3) El estimador de la varianza a partir de una muestra está dado por: N σˆ x = (xi µ x ) (5.33) N - i= - La desviación estándar K: es una medida de la variabilidad con las mismas dimensiones que X; K es la raíz cuadrada de la varianza y su valor estimado se denota por σ. Mientras mayor sea la desviación estándar, mayor es la dispersión de los datos. ( ver Figura 5.3). - El coeficiente de variación CV: está definido por la relación de la desviación estándar y la media, y se puede escribir como: σ CV = (5.34) µ σ ˆ x cuyo estimado es ; es una medida adimensional de la variabilidad. µ ˆ x alrededor de la media. - Asimetría: la distribución de los valores de una distribución alrededor de la media se mide por la asimetría, la cual está dada por el tercer momento alrededor de la media: 3 3 E[(X - µ ) ] = (x - µ ) - f X (x)dx (5.35) 93

FIGURA 5.3 Distribución de probabilidades con diferente desviación estándar. La asimetría se hace adimensional dividiendo la anterior ecuación por K 3 y se obtiene así, el coeficiente de asimetría?: El estimador de? está dado por: x γ 3 = E[(x - µ ) ] 3 σ (5.36) N N (xi - ˆ x ) 3 i= (5.37) = (N -)(N - ) ˆ 3 x Como se muestra en la Figura 5..4, para?>0, asimetría positiva, los datos se concentran a la derecha y para?<0, asimetría negativa, los datos se concentran a la izquierda. 94

γ < 0 γ > 0 f X (x) µ x Ejemplo 5.6 FIGURA 5.4. Distribución de Probabilidades con Diferentes Coeficientes? En una estación pluviométrica se tienen precipitaciones promedias mensuales multianuales de un determinado mes, cuyas frecuencias absolutas se muestran en la tabla siguiente. Encontrar la precipitación promedia mensual. Intervalo en mm Frecuencia Absoluta 00-0 0 0-6 0-30 9 30-40 0 40-50 0 50-60 5 60-70 0 Solución: En total se tiene 00 valores, para cada intervalo se halla el valor medio o marca de clase y se le asigna una frecuencia relativa, la cual es la frecuencia 95

absoluta sobre el número total de valores (00). El valor medio de cada intervalo es xi y la frecuencia relativa es fx(xi). Se elabora entonces la tabla siguiente. Intervalo clase (mm) Valor medio x i (mm) F. absoluta F. relativa f x (x i ) x i f x (x i ) 00-0 05 0 0. 0.5 0-0 5 6 0.6 8.4 0-30 5 9 0.09.5 30-40 35 0 0. 3.5 40-50 45 0 0. 9 50-60 55 5 0.5 3.5 60-70 65 0 0. 33 Σ=00 Σ=38.90 Aplicando la ecuación 5.9 la media se puede expresar como: x =.xifx(xi)=38.9 mm. 5.5 DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES ALEATORIAS DISCRETAS El uso de estas distribuciones se restringe a aquellos eventos aleatorios en los cuales el resultado puede ser descrito solamente como un éxito o como un fracaso, esto es, solo hay dos eventos mutuamente excluyentes para un experimento. Además, los experimentos sucesivos son independientes y la 96

probabilidad permanece constante de ensayo a ensayo. Un ejemplo en hidrología sería la probabilidad de que un día sea lluvioso o seco. La distribuciones de este tipo más usadas en hidrología son la distribución binomial y la geométrica. 5.5. Distribución binomial. Consideramos como p la probabilidad de que el caudal máximo en un año en un río exceda un valor de 800 m 3 /s.la probabilidad de no excederlo, q, es -p.supóngase que se está considerando un período de 3 años. La probabilidad de excedencia en el año 3 y no en los años y es qqp, dado que los eventos son independientes año a año. La probabilidad de excedencia en cualquiera de los 3 años es pqq +qpq + qqp debido a que la excedencia pudo ocurrir en el o., o o en el 3o. año. La probabilidad de excedencia en 3 años está dada como 3q p. La probabilidad de dos excedencias en 5 años es ppqqq, pqpqq...qqqpp. Se puede ver que cada uno de estos términos es q 3 p ; el número de términos es igual al número de formas de arreglar dos items dentro de 5 items. Esto es (5/) = 5x4/ = 0 y la probabilidad de tener dos excedencias en 5 años es (5/)q 3 p Puede generalizarse de tal manera que la probabilidad de x excedencias es n años está dada por (n/x)p x q n-x, lo que también puede expresarse así: P(X x) n! p x!(n x)! ( p) x n x = = (5.38) expresión conocida como distribución binomial. Los parámetros de esta distribución son: µ = np σ = np( p) (5.39) (q p) γ = npq 97

Ejemplo 5.7 Como se dijo anteriormente, una creciente de Tr años de período de retorno se define como aquélla que tiene una probabilidad de excedencia de /Tr en cualquier año. Asumiendo que las máximas crecientes anuales son independientes, la distribución binomial permite resolver varios problemas prácticos en hidrología, así: a) Cuál es la probabilidad de que una creciente con un período de retorno de 50 años ocurra exactamente en ese período? Aplicando la ecuación 5.38 se tiene: 50 49 P(X = ) = ( ) ( / 50) 3 50 = 0.37 b) Cuál es la probabilidad de que en 50 años se presenten 3 crecientes que igualen o excedan la de Tr =50 años? Con la misma ecuación anterior se tiene: P(X = 3) = 50 (/ 3 3 50) ( / 50) 47 = 0.06 c) Cuál es la probabilidad de que una o más crecientes excedan el caudal con 50 años de período de retorno en ese mismo tiempo? La clave para contestar esta pregunta está en las palabras una o más. Como los eventos son independientes y mutuamente excluyentes, se puede escribir: P[una o más crecientes en 50 años] = - P[no crecientes en 50 años] o lo que es lo mismo: 50 0 50 P[una o más crecientes en 50 años]= ( / 50) ( / 50) = 0. 64 0 98

5.5. Distribución Geométrica. Cuando se construye una obra con un caudal de diseño determinado, es de interés para los diseñadores conocer cuántos años pasarán antes que este caudal de diseño sea igualado o excedido. Si p es la probabilidad de excedencia del caudal de diseño (/Tr), la probabilidad de falla en el n-avo año,p, es: n P = ( p) p (5.40) Esta es la llamada distribución geométrica. La media y la varianza de la distribución geométrica son: Ejemplo 5.9 µ = P ( P) σ = P (5.4) El máximo nivel de la creciente anual de un río se denota por H (metros): Asumiendo que la función de densidad de probabilidad se describe como se muestra en la gráfica, determinar: a) La altura de inundación para un período de 0 años. b) Cuál es la probabilidad de que durante los próximos 0 años la altura hallada en el numeral anterior sea excedida al menos una vez?. c) Cuál es la probabilidad de que durante los próximos 5 años este valor sea excedido exactamente una vez? 99

F(H) 5 6 7 H(m) Solución: a) El área bajo la función de densidad es, que equivale a P(56H67) =. Para un caudal con un Tr de 0 años se cumple que: P r= 0 (H HT ) = / 0 = 0.05 lo que significa que 0.05 es un área bajo la función de densidad y: P(H r= 0 HT ) = 0.05 = 0.95 y se plantea la siguiente relación: (7 HT )(0.95) r 0 0.05 = = Despejando el valor de H, se obtiene finalmente: HT r 0 = 6.9 m = 00

b) Se puede escribir la siguiente ecuación: P(HTr=0 sea excedida al menos una vez) = - P(HTr=0 no sea excedida) Aplicando la ecuación 5.38 (binomial ) se puede escribir entonces: 0 0 0 P(HTr=0 sea excedida al menos una vez) = ( 0. 05) ( 0. 95) = 0. 64 0 O sea que P(HTr=0 sea excedida al menos una vez) = 0.64 b) Aplicando también la ecuación 5.38, se tiene: 5 0.4 P(H T r = 0 = ) = (0.05) (0.95) = 0.04 Ejemplo 5.9 Tres diques de control de inundaciones se construyen en una planicie por la cual corren dos ríos, tal como se muestra en la figura. Los diques se diseñan así: El dique I tiene un caudal de diseño con un período de retorno de 0 años. El dique II tiene un caudal de diseño con un período de retorno de 0 años El dique III tiene un caudal de diseño con un período de retorno de 5 años. Asumir que las crecientes en los ríos A y B son estadísticamente independientes y que las fallas de los diques I y III también lo son. a) Cuál es la probabilidad de inundación en un año cualquiera producida solamente por el río A. b) Cuál es la probabilidad de inundación de la planicie en un año? c) Cuál es la probabilidad de que no haya inundación en los próximos 4 años? 0

Solución: a)el río A puede producir inundación en la planicie si falla el dique I o si falla el dique II, lo que se puede expresar como: P(I II) = P(I) + P(II) P(I II) P(I II) = 0.05 + 0. 0. 0.05 = 0.45 b) La probabilidad de inundación se da por el río A o por el río B, lo que puede expresarse como: P(A B) = P(A) + P(B) P(A B) P(A)=0.45, hallado en el numeral anterior y P(B) =/5=0.04, lo que implica que: P (A B) = 0.45 + 0.04 0.45 0.04 = 0.79 c) La probabilidad de inundación, P, en cualquier año, es 0.79, como se explicó en el numeral anterior, y la probabilidad,q, de no inundación será entonces: q = -P = - 0.79 =0.8 y la probabilidad de no inundación en 4 años será entonces: 0

P(no inundación en 4 años) =(0.8) 4 =0.454 Ejemplo 5.0 Un proyecto se diseña con un caudal que tiene un período de retorno de 0 años. Cuál es la probabilidad de que este caudal se presente por primera vez al quinto año de acabado el proyecto? Solución: Este es un ejemplo donde puede aplicarse la distribución geométrica, así: La probabilidad de excedencia, p, para este caso es : p =/Tr=/0=0. Entonces: P(probabilidad de inundación 5 año)=(0.)(-0.) =0.0656 5.6. DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES ALEATORIAS CONTINUAS La mayoría de las variables hidrológicas son variables aleatorias continuas. Enseguida se describen brevemente las distribuciones de probabilidades más usadas en análisis de frecuencia de estas variables. 5.6. La distribución Normal La distribución Normal es una distribución simétrica en forma de campana, conocida también como Campana de Gauss. Es fundamental en el dominio de la estadística y la probabilidad. Una razón es que el teorema del límite 03

central establece que para varias condiciones muy generales, la distribución de la suma de un gran número de variables aleatorias puede aproximarse a la Normal, sin importar a qué distribución pertenezcan ellas mismas. Muchos procesos físicos pueden conceptualizarse como la suma de procesos individuales. Por otra parte, muchos procesos de inferencia estadística se basan en suposiciones de que la variable aleatoria se distribuye normalmente. Es por ello que la Normal encuentre tantas aplicaciones en hidrología: en pruebas de hipótesis, intervalos de confianza, etc. Una variable aleatoria X se distribuye de acuerdo con una distribución de probabilidades Normal si su FDP está dada como: f X x (x µ x ) σ x (x) = e (5.4) σ π Los parámetros de la distribución son dos: la media,e x, y la desviación estándar K x. La asimetría de la distribución es cero. Esta distribución tiene una forma de campana simétrica, como se muestra en la Figura 5.5, por lo tanto la media, la moda y la mediana son iguales. Si se hace la siguiente transformación: µ = ( x µ σ x ) / se obtiene como FDP y como función acumulada de la variable E: x f (u) = F (u) = u u π e π - e u - - w dµ (5.43) 04

FIGURA 5.5 Distribución normal. La variable u es llamada variable estandarizada, tiene media cero y desviación estándar uno. Debido a que la variable normal estandarizada tiene todos sus parámetros conocidos, existen tablas para encontrar la función acumulada de esa variable. La tabla 5. es una de ellas. Aunque la simetría de la distribución la hace inaplicable para valores extremos, la distribución Normal describe el comportamiento probabilístico de los valores medios bastante bien. La distribución normal se usa para: - Aproximar la distribución de probabilidades de errores aleatorios. - Comparar distribuciones: las propiedades de una muestra de variables no normales pueden compararse con las de variables normales. - Muchos estadísticos pueden ser normalmente distribuidos, como, por ejemplo, la media de la mayoría de las variables hidrológicas. 05

06

5.6.. Estimación de parámetros Solo se presentará en estas notas la estimación de parámetros por el método de los momentos, que fue desarrollado en 90 por Karl Pearson. El consideró que un buen estimativo de los parámetros de una distribución de probabilidades es aquél para el cual los momentos de la función de densidad de probabilidades son iguales a los momentos correspondientes de la muestra. Los estimadores de los parámetros de la distribución normal por el método de los momentos son: 5.6.. Factor de frecuencia µ ˆ = (5.44) N N x i i= N / σˆ = = (x ˆ i µ ) (5.45) N Para la distribución normal, el factor de frecuencia está dado como: x - µˆ K = (5.46) σ que es la misma variable reducida, definida por la ecuación (5.4). La magnitud de la variable XT para un período de retorno dado T puede encontrarse, utilizando el factor de frecuencia, con el siguiente procedimiento:. Fu (K) = K = Fu ( ) T T 07

. Usando el valor calculado de en la tabla 5., se lee el valor T de x en la primera columna, que corresponde a K o F - E (- /T) 3. Se calcula el valor buscado como: X T = µ ˆ + Kσˆ Ejemplo 5. Se tiene una estación con 30 años de datos de caudales medios anuales con media de 7 m 3 /s y desviación estándar de 94 m 3 /s. Si los datos se ajustan a una distribución Normal, cuál es el caudal correspondiente a un período de retorno, Tr, de 00 años?. Solución: En este caso se puede escribir: Fu(K) = - /Tr = 0.99 K = Fu - (0.99) Con el valor de 0.99 en la tabla 5., se obtiene: K =.36 El valor asociado a Tr=00 se calcula como: Q00 = µ ˆ + σˆ K = 7 + 94 x.36 = 335.6 m 3 /s Q Q 5.6..3 Intervalos de confianza Cuando se desea hallar cualquier estadístico, por ejemplo la media, generalmente se dispone de una muestra de tamaño limitado. Se quiere saber qué tan cercano puede estar ese estimado al verdadero valor desconocido de la población. En otras palabras, se quisiera conocer con una cierta certeza (probabilidad) la franja de valores entre los cuales se encontraría el verdadero valor de la población. Si esa franja es grande, habrá mucha incertidumbre en el valor estimado de la 08

media, y si es pequeña, habrá, por el contrario, mucha confianza en ese valor estimado. Con ese fin se utilizan los llamados intervalos de confianza. Supóngase, por ejemplo, que se desea estimar la media de la población, E. Asúmase que E y son dos estadísticos (funciones de la muestra aleatoria) tales que: E < E y P(E< E < E) =. Entonces [E, E] es llamado el intervalo de confianza para la media µ., es llamado el nivel de confianza (nivel de probabilidad) y E y E son llamados los límites de confianza inferior y superior, respectivamente. Esta definición puede extenderse al intervalo de estimación de un parámetro cualquiera o a una función del parámetro. Se debe tener en cuenta que los intervalos de confianza y los límites de confianza son realmente variables aleatorias, ya que son funciones del tamaño de la muestra y de estimadores a su vez, función de muestras aleatorias. Como los tamaños de la muestra varían, los intervalos de confianza cambian de una muestra a otra. Mientras más estrecho es el intervalo de confianza, mejor es el procedimiento de estimación. Para el valor estimado asociado a un período de retorno cualquiera, los intervalos de confianza se calculan usando el error estándar, ST, el cual es una medida de la desviación estándar de la magnitud de un evento calculado a partir de una muestra respecto a la verdadera magnitud del evento. Se presentarán para todas las distribuciones, los intervalos de confianza para los diferentes cuantiles de la población. Para la distribución Normal, los límites de confianza para el verdadero valor de un cuantil asociado con un periodo de retorno T son: X T ± u-α ST (5.47) en donde es el nivel de probabilidad, u-α es el cuantil de la distribución Normal estandarizada para una probabilidad acumulada de -α y ST es el error estándar. 09

Cada distribución tiene expresiones para hallar el error estándar, por ejemplo, el de la distribución Normal es: S T = σˆ x N ( / ) + K (5.48) Ejemplo 5. Los caudales medios anuales de un río con media.5 m 3 /s y desviación estandar de 0.6 m 3 /s se distribuyen normalmente. Cuál es la probabilidad de que se produzca un caudal medio igual o menor a m 3 /s, en cualquier año?. Solución: Se tiene entonces que: µ ˆ P(X ) = P( µ ) σˆ Reemplazando los valores:.5 P( µ ) = P( µ 0.83) 0.6 En la tabla 5., se encuentra P(EU-0.83). Considerando la simetría de la distribución normal (ver Figura 5.6 en donde A = B), se tiene: P(EU -0.83) = - P(EU 0.83) = - 0.797 = 0.03 0

Ejemplo 5.3 FIGURA 5.6 Simetría de la distribución normal. La escorrentía anual de una pequeña cuenca se distribuye normalmente con media de 356 mm y desviación estándar de 76. mm. Determinar la probabilidad de que la escorrentía anual sea menor que 80 mm en todos los tres siguientes años. Solución: 80 356 P 80) = P( µ ) = P( µ 0.997) 76. y: P ( µ 0.997) = 0.843 = 0.587 La probabilidad de que sea menor en tres años consecutivos es: 0,587 x 0,587 x 0,587 = 0,00399 5.6. Distribución Log Normal Consideremos un cálculo hipotético de la escorrentía en una cuenca. La escorrentía es el producto de varios factores aleatorios, como lluvia, área

contribuyente, pérdidas, coeficiente de evaporación, etc. En general, cuando la variable aleatoria X es el producto de un gran número de otras variables aleatorias, la distribución de los logaritmos de X puede aproximarse a la Normal, ya que los logaritmos de X son la suma de los logaritmos de los factores contribuyentes. Si se tiene una variable aleatoria X y ln X = Y se ajusta a una distribución Normal, se dice que la variable aleatoria X es lognormalmente distribuida. La función de densidad de esta distribución, si se asume que Y=loga(X), donde a es la base del logaritmo, es: ( y - µ ) y X (x) = exp - (5.49) σ x π y σy f E y es el parámetro de escala y K y es el parámetro de forma. La forma de la distribución lognormal se muestra en la Figura 5.7. FIGURA 5.7 Distribución lognormal.

Se ha demostrado que la distribución lognormal puede aplicarse en un amplio número de eventos hidrológicos, especialmente a aquellos casos en los cuales la variable tiene un límite inferior, la distribución empírica no es simétrica y los factores que causan los eventos son independientes y multiplicativos. Si la variable aleatoria X tiene un límite inferior xo diferente de cero, y la variable Z = X -xo sigue una distribución lognormal con dos parámetros, entonces X se ajusta a una distribución lognormal con tres parámetros. La función de densidad de esta distribución es: [ ln ( X - )- µ ] x o y fx (x) = exp - (5.50) π( X - xo) σ y σy donde los parámetros E y, K y y xo son llamados los parámetros de escala, forma y localización respectivamente. La distribución lognormal con tres parámetros puede aplicarse a eventos con valores positivos o negativos, siempre que x x0; mientras que la lognormal con dos parámetros solo puede aplicarse a eventos con valores positivos. 5.6.. Estimación de parámetros Para la distribución lognormal de dos parámetros, usando el método de momentos, los parámetros se pueden estimar como: σˆ Y = µ ˆ (5.5) N Y = log a(xi ) N i= N N [ log ˆ ] a(x i ) µ Y i= (5.5) Para la distribución lognormal de tres parámetros, xo debe también estimarse. Una manera de estimar xo requiere que el coeficiente de asimetría sea 3

positivo. En este método, el segundo momento de Z = X - xo no depende de x0, esto es, K²z = K²x y E z = E x - x0, entonces el límite inferior xo se puede expresar como: Cvx x0 = µ - x (5.53) Cvz Donde: Donde: w = Cv Cv Cv = x z σ = µ σ = µ x x z z /3 ( - ) w /3 w / [- γˆ + ]; γ > 0 x z ( γˆ + 4 ) x x (5.54) (5.55) en donde? x es el coeficiente de asimetría de x. Los parámetros de la distribución lognormal de dos parámetros también pueden estimarse con base en las relaciones entre los parámetros de la variable transformada µy y σy y los parámetros de la variable original µx y σx, dadas como: µ Y = loga( µ X ) σy (5.56) X Y log σ σ = a + (5.57) µ X 4

En este caso, se estiman µx y σx con los datos originales, y con las ecuaciones anteriores se estiman µy y σy los parámetros de la distribución lognormal. Ejemplo 5.4 Los caudales medios de un río en una estación hidrométrica han sido modelados con las siguientes distribuciones: a) Normal con parámetros E = 56.7 m 3 /s y K= 9 m 3 /s b) Lognormal con parámetros E y = 5.8 y K y = 0.84 Calcular la probabilidad de que el caudal medio esté entre 300 y 400 m 3 /s Solución: a) Si se usa la Normal se tiene: P(3006Q6400)= FX(400)-FX(300) Si se usa la variable estandarizada E, se tiene entonces que: 400 - x P(300UQU400)= F E 300 F u x x = F u (u400) - F u (u300) donde: u300 = (300-56.7)/9 = 0.67 con este valor, se va a la tabla 5. y se encuentra que Fx (0.67) = 0.587 y u400 = (400-56.7)/9 = 0.75 de la tabla 5., se tiene: F x (0.75) = 0.7734 lo que implica que: x 5

P(300UQU400)=0.7734-0.587=0.863 b) Si se usa la distribución lognormal: P(300UQU400)=FY(ln(400))-FY(ln(300)) ln( 400) µ Y ( ) µ = ln 300 F u Fu σ Y σ Y y: ln(300) = 5.704 ln(400) = 5.99 se tiene entonces que: F E (E 5.99 ) = (5.99-5.8)/0.84 = 0.9 de la tabla 5. se tiene que F E (0.9) = 0.886 F E (E 5.704 )= (5.704-5.8)/0.84 = 0.564 de la tabla 5. se obtiene F(0.564) = 0.73 se encuentra finalmente: P(300 U Q U 400) = 0.886-0.73 = 0.06 Este ejemplo se puede resolver también calculando E Y y K Y a partir de E x y K x con las ecuaciones 5.56 y 5.57. 5.6.. Factor de frecuencia Se utiliza el mismo factor de frecuencia que en la distribución Normal, excepto que este se aplica a los logaritmos de la variable y la ecuación, para un cuantil cualquiera XT queda: Y en donde K = F u T ( T) = + K σ ln X (5.58) µ y y 6

Si se quiere trabajar con la variable no transformada al campo logarítmico se tiene que: exp K K = T ( ( ) ( ) ln + Cv ln + Cv / - Cv - (5.59) donde: - KT = F - u (5.60) Tr F u es el inverso de la función de distribución Normal estandarizada T acumulada y Cv es el coeficiente de variación 5.6..3 Intervalos de confianza En el campo transformado, los límites están dados por los de la distribución Normal como: ln ( XT) u-α S ± (5.6) T en donde: S T Y = δ σ (5.6) N y δ = + K T / (5.63) 7

Ejemplo 5.5 Se tiene un río con caudales máximos anuales lognormalmente distribuidos, con µˆ x =5 m 3 /s y σˆ x =5 m 3 /s; se da también µˆ Y =.6554 y σˆ Y =0.346. Encontrar el caudal para un período de retorno de 00 años. Si se tiene un período de retorno de 30 años de registro, cuáles son los límites de confianza para un de 0%?. Solución: El coeficiente de variación se calcula como: σˆ x 5 Cvˆ = = = 0.33 µ ˆ 5 Para hallar KT, se procede así: F (K u T ) = - T I x = - 00 = 0.99 De la tabla 5.: K F (0.99) T = µ =.33 El valor de K se puede calcular usando la ecuación (5.59) como: ( ) ln + exp.33 0.33 ( ln( + 0.33 ) / - - K = 0.333 K= 3.08 El valor asociado a un período de retorno de 00 años será: XT = 5 + 5 x 3.08 = 30.4 m 3 /s 8

Los límites de confianza se hallan así en el campo transformado: ln( XT) ± u-α ST Se calcula primero δ con la ecuación (5.63) y luego ST con la ecuación (5.60), el resultado es:.33 δ = + =.93 0.346 S T =.93* = 0. 30 / De la tabla 5., se lee: E - =E 0.95=.64 Por lo tanto: ln (30.8) ±.64 * 0. = 3.4 ± 0.875 = [3.5, 3.5975] = [e 3.5, e 3.5975 ] = [5.09, 36.5] 5.6.3 Distribución Gumbel Una familia importante de distribuciones usadas en el análisis de frecuencia hidrológico es la distribución general de valores extremos, la cual ha sido ampliamente utilizada para representar el comportamiento de crecientes y sequías. A partir de la distribución general de valores extremos, se pueden derivar tres tipos de distribuciones: la tipo I, comúnmente conocida como Gumbel, la tipo II y la tipo III, llamada también Weibull. Ellas difieren entre sí por el valor del parámetro de forma. La expresión general de la función de densidad de probabilidades para la distribución extrema tipo I o Gumbel es: 9

x -β x -β f X (x) = exp - - exp - α (5.64) α α En donde α y βson los parámetros de la distribución. La distribución Gumbel tiene la forma mostrada en la figura 5.8. 5.6.3. Estimación de parámetros Por el método de momentos, los estimadores de los parámetros son: 6 αˆ = σˆ (5.65) π β ˆ = µ - 0.577αˆ (5.66) donde E y K son la media y la desviación estándar estimadas con la muestra. 5.6.3. Factor de frecuencia El factor de frecuencia para la distribución Gumbel es: K = - 6 π { 0.577 + ln[ lnt - ln( T -)]} r r (5.67) donde TI es el período de retorno. 5.6.3.3 Intervalos de confianza Los límites de confianza por el método de momentos para un nivel de probabilidad son: XT ± u α ST (5.68) - 0

FIGURA 5.8 Distribución Gumbel S T σ = δ (5.69) N [ ] δ +.396K +.K (5.70) = / K es el factor de frecuencia de la distribución, dado por la ecuación 5.67. 5.6.4 Distribución Gamma Esta distribución ha sido una de las más usadas en hidrología. Como la mayoría de las variables hidrológicas son sesgadas, la función Gamma se utiliza para ajustar la distribución de frecuencia de variables tales como crecientes máximas anuales, caudales mínimos, volúmenes de flujo anuales y estacionales, valores de precipitaciones extremas y volúmenes de lluvia de corta duración. La función de distribución Gamma tiene dos o tres parámetros. La última función es llamada también Distribución Pearson tipo III. La distribución Gamma está relacionada con otras distribuciones muy conocidas como las distribuciones Chi-cuadrado y la exponencial negativa, que son casos particulares de la distribución Gamma.

La distribución Gamma de dos parámetros tiene una función de densidad de probabilidades de la forma: f X x (x) = α Γ( β) α β- - e x α (5.7) Donde: 0 U x < para > 0 - < x U para < 0 y : son los parámetros de escala y forma, respectivamente, y "(:) es la función Gamma completa. El parámetro : siempre es mayor que cero, mientras que puede ser positivo o negativo. La función Gamma completa está dada por: β- -z Γ ( β) = z e dz (5.7) 0 La distribución Gamma de tres parámetros tiene la siguiente función de densidad de probabilidades: Donde: xo U x < para > 0 - < x U xo para < 0 β- x - xo x - xo fx (x) = exp - (5.73) α Γ( β) α α y : son los parámetros de escala y forma, respectivamente, y xo es el parámetro de localización.

La Figura 5.9 muestra formas de la función de densidad de probabilidades Gamma para > 0. 5.6.4. Estimación de parámetros Para la distribución Gamma de dos parámetros, usando el método de los momentos, se tienen las siguientes expresiones (para sus parámetros). µ = αβ (5.74) σ = α β (5.75) FIGURA 5.9 Distribución Gamma.( Varas, Bois, 998) Los estimadores de los parámetros, por el método de momentos, son los siguientes: βˆ = Ĉv (5.76) µ ˆ α ˆ = βˆ 3

µ, σ y C v son la media, desviación estándar y coeficiente de variación calculados con la muestra, respectivamente. Para la distribución Gamma con tres parámetros o Pearson tipo III, los parámetros, por el método de momentos, pueden estimarse por: ˆ β = (5.77) γˆ γˆ α ˆ = σˆ (5.78) = µ ˆ αβ ˆ ˆ Xˆ (5.79) 0 γ es el coeficiente de asimetría calculado usando la muestra. 5.6.4. Factor de frecuencia Si se define: K T = Fu - (5.80) Tr el factor de frecuencia K tiene la siguiente forma: γˆ 3 γˆ γˆ γˆ K K T + (Kt ) + (K T 6K T ) (KT ) + K T 6 3 6 6 6 (5.8) 3 4 4

Para la distribución Pearson tipo III o Gamma de 3 parámetros, existen tablas, como la 5., que dan el factor de frecuencia en función del coeficiente de asimetría calculado con la muestra. 5.6.4.3 Intervalos de confianza Si se tiene que: X T S T ± u α ST σ = δ (5.8) N <=<(?,Tr) y está tabulado para la Gamma de dos parámetros y para la Pearson tipo III. La tabla 5.3 da valores de <, para hallar el intervalo de confianza de la distribución Pearson tipo III. 5.6.5 Distribución log Pearson Tipo III Si los logaritmos de la variable aleatoria X se ajustan a una distribución Pearson Tipo III, se dice que la variable aleatoria X se ajusta a una distribución Log Pearson Tipo III. Esta distribución es ampliamente usada en el mundo para el análisis de frecuencia de caudales máximos. Su función de densidad está dada por: β- ln(x)- y ln(x)- y o o - f (x) = x e α x ( ) (5.83) α Γ β α donde es el parámetro de escala, : es el parámetro de forma y yo el parámetro de localización. 5

TABLA 5.. VALORES DE KT PARA LA DISTRIBUCIÓN PEARSON III (ASIMETRÍA POSITIVA) Coeficiente Probabilidad de Excedencia de Asimetría 0.500 0.00 0.00 0.040 0.00 0.00 0.005 3.0-0.396 0.40.80.78 3.5 4.05 4.970.9-0.390 0.440.95.77 3.34 4.03 4.909.8-0.384 0.460.0.75 3.4 3.973 4.847.7-0.376 0.479.4.7 3.093 3.93 4.783.6-0.368 0.499.38.67 3.07 3.889 4.78.5-0.360 0.58.50.6 3.048 3.845 4.65.4-0.35 0.537.6.56 3.03 3.800 4.584.3-0.34 0.555.74.48.997 3.753 4.55. -0.330 0.574.84.40.970 3.705 4.444. -0.39 0.59.94.30.94 3.656 4.37.0-0.307 0.609.30.9.9 3.605 4.98.9-0.94 0.67.30.07.88 3.553 4.3.8-0.8 0.643.38.93.848 3.499 4.47.7-0.68 0.660.34.79.85 3.444 4.069.6-0.54 0.675.39.63.780 3.388 3.990.5-0.40 0.690.333.46.743 3.330 3.90.4-0.5 0.705.337.8.706 3.7 3.88.3-0.0 0.79.339.08.666 3. 3.745. -0.95 0.73.340.087.66 3.49 3.66. -0.80 0.745.34.066.585 3.087 3.575.0-0.64 0.758.340.043.54 3.0 3.489 0.9-0.48 0.769.339.08.498.957 3.40 0.8-0.3 0.780.336.993.453.89 3.3 0.7-0.6 0.790.333.967.407.84 3.3 0.6-0.099 0.800.38.939.359.755 3.3 0.5-0.083 0.808.33.90.3.686 3.04 0.4-0.066 0.86.37.880.6.65.949 0.3-0.050 0.84.309.849..544.856 0. -0.033 0.830.30.88.59.47.763 0. -0.07 0.836.9.785.07.400.670 0.0 0.000 0.84.8.75.054.36.576 6

FIGURA 5.0 Distribución Log-Pearson Tipo III. (Salas, 99). 5.6.5. Estimación de Parámetros Los estimadores de los parámetros por el método de los momentos son: β ˆ = ˆ γ y γˆ y αˆ = σˆ (5.84) y ŷ = µ ˆ αβ ˆ ˆ 0 y Donde µ ˆ y, σˆ y y γˆ son la media, desviación estándar y coeficiente de asimetría calculados usando los logaritmos de los datos, respectivamente. 5.6.5. Factor de frecuencia Si se cumple que Y= ln X, se tiene que: 7

YT = ln XT = µ ˆ + K σˆ y (5.85) y En donde µy y σy son la media y desviación estándar de los logaritmos de X, y K se obtiene de la tabla 5.. TABLA 5.3 VALORES DE < PARA LA DISTRIBUCION PEARSON TIPO III? T r = T r =5 T r =0 T r =0 T r =50 T r =00 0.0.080.698.3748.6845.988.6363 0..0808.006.4367.780.345.868 0..0830.309.4989.885.4986 3.075 0.3.0866.609.560.985.6656 3.365 0.4.093.905.67.095.843 3.474 0.5.0987.399.6838.998 3.077 3.738 0.6.073.349.744.3094 3.09 3.9895 0.7.79.3785.803.498 3.08 4.684 0.8.304.408.8609.5303 3.666 4.5595 0.9.449.4385.970.6403 3.8374 4.868.0.64.4699.974.749 4.05 5.74..799.5030.040.8564 4.699 5.495..003.538.0747.963 4.4996 5.840.3.3.5764.37 3.063 4.700 6.59.4.57.68.7 3.65 4.930 6.499.5.70.6643.73 3.557 5.486 6.847.6.95.757.67 3.3455 5.3644 7.88.7.304.773.308 3.4303 5.576 7.5339.8.345.8374.354 3.500 5.787 7.8783.9.3690.909.408 3.5844 5.989 8.96.0.393.9888.455 3.6536 6.755 8.556 5.6.5.3 Intervalos de confianza Se utiliza la tabla 5.3 para hallar valores del parámetro < y se cumple que: 8