IIC 2012 7 de junio de 2013 Estudio de rampas de producción eólica.
Índice Estado del arte. Definición de rampa. Modelos propuestos. Primeros resultados. Problema a resolver. Metodología de evaluación. Descripción de modelos: Modelos base. Modelos basados en knn. Selección de parámetros. Resultados. Conclusiones. Referencias 2
Definición intuitiva de rampa Cambio brusco en la producción eólica en un periodo corto de tiempo. Qué se considera un cambio brusco? Cuánto es un periodo corto de tiempo? Estado del arte: Definición de rampa I Claves de la definición de rampa P(t) serie temporal de la producción. D t duración de la rampa. umbral de producción (magnitud de la rampa). P th Criterios establecidos D t El valor de se fija para este estudio a 4, pues se ha considerado que no es excesivamente grande ni pequeño, pudiendo tener interés. El valor de P th se determinará como aquel valor que marque el 5% de los cambios más extremos. En el caso probado y para rampas de tamaño 4, se corresponde con un 30% de la potencia instalada. Los ejemplos mostrados en esta presentación se han realizado con la producción del parque Sotavento. 3
Estado del arte: Definición de rampa II Definición 1 Una rampa ocurre al principio de un intervalo si la magnitud del cambio es mayor que un determinado umbral: P(t +D t )- P(t) > P th Definición 2 Igual que la definición 1, salvo que dividimos entre el tamaño del intervalo: P(t + D t )- P(t) D t > P th 4
Definición 3 Estado del arte: Definición de rampa III Una rampa ocurre dentro de un intervalo si la diferencia entre el valor máximo y el mínimo dentro del intervalo es mayor que un determinado umbral: max(p[t,t + D t ])-min(p[t,t + D t ]) > P th Definición 4 Una aproximación distinta definiría las rampas usando un filtro de la señal original: f P t = mean{p(t + h)- P(t + h-n am );h=1,...,n am } Definimos que estamos en una rampa cuando: f P t > P th 5
Estado del arte: Modelos Tipos de modelos en la literatura Modelos de regresión: Modelos aplicados sobre datos históricos, de producción y meteorología. Determinar no sólo el comienzo de una rampa, sino también su magnitud. Metodología de evaluación: MAE, MRE, Modelos de clasificación: Aproximación mediante modelos de detección de ejemplos usados sobre series temporales. Metodología de evaluación: matrices de confusión, curvas ROC, También podemos distinguir modelos: Deterministas. Probabilisticos. Un estudio reciente de interés es: A survey on wind power ramp forecasting, C. Ferrerira et al., Argonne National Library (2011). 6
Estado del arte: Ejemplos de modelos I Prediction of wind farm power ramp rates: a data-mining approach H. Zheng y A. Kusiak Este modelo predice ratios de producción pero no distingue rampas. Compara 5 modelos multivariantes de series temporales. Se aplica a nivel de parque. Se centra en predecir los ratios de producción (10 minutales) definidos como: P(t +10)- P(t) PRR= 10 Metodología de evaluación: MAE y Std of the errors. SVR resulta ser el mejor modelo. 7
Estado del arte: Ejemplos de modelos II Temporal Forecast Uncertainty for Ramps Events B. Greaves et al. Definición 1 de rampa, P th = 50%P y D t 4, aplicada a nivel de parque y de portfolio de parques. Se utilizan NWPs y se predice la producción mediante modelos regresivos multiparamétricos. Se definen probabilidades de rampa con distribuciones normales alrededor del tiempo medio de diferencia entre predicción y producción real. Metodología de evaluación: matriz de confusión. No se intenta predecir la rampa a una hora determinada, sino que se considera acierto si la rampa se produce +- 12 horas desplazada de la hora real. Resultados: Sensibilidad=34-47%, Precision=59-67%. 8
Estado del arte: Ejemplos de modelos II Forecasting southern plains wind ramp events using the wrf model at 3-km K. Bradford et al. Definición 1 de rampa, P th = 20%P y D t =1, aplicada a nivel de parque y de portfolio de parques. Metodología de predicción: cálculo de la potencia como P = 0.5 A p v 3 Con Ael área del rotor, pla densidad del aire y vla velocidad del viento. Metodología de evaluación: matrices de confusión. Se considera acierto cuando la rampa ocurre una hora antes o después de la hora real. Resultados: Sensibilidad=29%, Precision=3.6% (para el portfolio de parques). 9
Estado del arte: Ejemplos de modelos II Forecasting ramps of wind power production with numerical weather prediction ensembles A. Bossavy et al. Definición 4 de rampa (con n AM = 5). Se aplica a nivel de parque. Usa ensembles de predicciones de producción eólica obtienen un ensemble de producción, entrenando con las NWPs un modelo Random Forest por ensemble. Clustering de los ensembles, predicción probabilistica de rampa usando Nadaraya-Watson o LR. Metodología de evaluación: BS= 1 n å (p i - y n i=1 i ) 2 donde p i es la probabilidad predicha de rampa y y i es la rampa observada. Resultados: muy buenos, con porcentajes de error entre 1% y 17% y desviaciones pequeñas. Con los errores dados no es fácil inclinarse por un modelo LR o N-W. Se han probado distintos tamaños de rampa y distintos umbrales en la definición, dependiendo el resultado del tipo de clustering de los ensembles que se lleve a cabo. 10
Objetivo Predecir rampas de producción eólica en un horizonte futuro H. Se centrará la atención en el problema como un problema de clasificación. Datos Producciones del parque de Sotavento (se utilizan normalizadas). Fechas: 1 Febrero 2010 31 Enero 2013. Primeras pruebas: Problema a resolver Definición de rampa La definición 1 aparece como la más natural, pues básicamente aproxima la derivada de la curva. Esta será la definición utilizada en nuestros resultados: En este caso se utilizará con: D t = 4 P th = 30% P P(t +Dt)- P(t) > P th, correspondiente aproximadamente al 5% de rampas 11
Real Primeras pruebas: Metodología de evaluación Metodología de Evaluación Matriz de confusión: Predicción + - + TP FN - FP TN Sensitivity=TP/(TP+FN). Specificity=TN/(TN+FP). Precision=TP/(TP+FP). Los patrones a usar se componen de retrasos de producción y predicciones a 4 horas Para visualizar estas métricas usaremos: Curvas ROC. Área Bajo la Curva (AUC) como medida comparativa entre ROCs. Test DeLong: test estadístico cuya hipótesis nula H0 es que las dos curvas ROC sean iguales. Curvas Precision-Recall (PR). 12
Modelos base Primeras pruebas: Descripción de modelos I Modelo aleatorio. Modelo RLS: Información de producción más predicción RLS (Regularized Least Squares) diario. Modelo RLS: horario Información de producción más predicción RLS horaria. Modelos basados en knn 1. Construimos los patrones. 2. Calcular la distancia dist t,s, entre X t y X s. X t 3. S s =Nearest Neighbors( X s, { X t }, k), el conjunto de los kpatrones más cercanos a X s. 4. es un incremento predicho como media ponderada, donde I s pred 5. Si I s > P th, predecimos rampa en tiempo s y horizonte H. 13
Primeras pruebas: Descripción de modelos II Modelos a comparar Según la métrica utilizada para encontrar vecinos próximos: Euclídeo (distancia isotrópica). Mahalanobis local (distancia anisotrópica) Aproximación temporal. Aproximación de clúster. Según la información de los patrones: Retrasos de producción (modelo aleatorio). Retrasos de producción + Predicciones diarias (modelo RLS). Retrasos de producción + Predicciones horarias (modelo RLS horario). 14
Criterios de prueba Primeras pruebas: Descripción de modelos IV Se consideran predicciones en tres horizontes: suponiendo que se tiene la producción de la hora h, Horizonte 0: se producirá una rampa entre las horas h y h+4. Horizonte 1: se producirá una rampa entre las horas h+1 y h+5. Horizonte 2: se producirá una rampa entre las horas h+2 y h+6. Se consideran tres modelos para cada escenario (12 en total). Se representan las curvas ROC, calculando sensitivity y 100-specificity para diferentes umbrales de predicción de rampa. El umbral de predicción se corresponde con el porcentaje de alarmas que dará nuestro modelo, variando el mismo entre 0% y 100%. Este umbral es independiente del umbral de definición de rampa. El extremo izquierdo de la curva ROC equivale a predecir siempre No rampa (sensitivity=0) y el derecho a predecir siempre Rampa (sensitivity=100). En general un modelo es mejor que otro si su curva ROC está por encima. Se trata de un problema muy desequilibrado (1 rampa por cada 19 no rampas). Por ello el área más relevante de la curva ROC está en su parte izquierda, esto es una specificity alta para que haya pocas alarmas. 15
Primeras pruebas: Resultados Curvas ROC Horizonte 2 Modelo AUC M T H 0,835 M C H 0,844 M E H 0,843 M T D 0,811 M C D 0,808 M E D 0,798 M T 0,671 M C 0,676 M E 0,684 RLS H 0,781 RLS D 0,751 16
Primeras pruebas: Resultados Curvas ROC Horizonte 1 Modelo AUC M T H 0,881 M C H 0,884 M E H 0,891 M T D 0,834 M C D 0,821 M E D 0,823 M T 0,691 M C 0,695 M E 0,703 RLS H 0,814 RLS D 0,751 17
Primeras pruebas: Resultados Curvas ROC Horizonte 0 Modelo AUC M T H 0,925 M C H 0,923 M E H 0,940 M T D 0,855 M C D 0,848 M E D 0,847 M T 0,708 M C 0,712 M E 0,714 RLS H 0,849 RLS D 0,751 18
Primeras pruebas: Resultados Curvas PR Horizonte 2 19
Primeras pruebas: Resultados Curvas PR Horizonte 1 20
Primeras pruebas: Resultados Curvas PR Horizonte 0 21
Conclusiones Conclusiones El estado del arte sobre rampas de producción eólica es escaso. No está clara la definición de rampa. Los modelos existentes no están realizados en un marco homogéneo y no son realmente comparables. El modelo propuesto propone una alternativa sencilla y eficiente. Además, a pesar de tratarse en el fondo de un modelo con enfoque regresivo, presenta resultados de clasificación de rampas, que es el problema a resolver. Los resultados muestran que este sencillo modelo es competitivo y flexible a las necesidades del usuario. Como trabajo futuro se pretenden mejorar estos modelos, ahondando en las métricas y en la posible combinación de horizontes de predicción. 22
Referencias Assessing the accuracy of prediction algorithms for classification: an overview, P. Baldi et al., Bioinformatics 16, 412-424 (2000). Forecasting ramps of wind power production with numerical weather prediction ensembles, A. Bossavy et al., Wind Energy 16(1), 51-63 (2012). Forecasting southern plains wind ramp events using the wrf model at 3-km, K. Bradford et al., Proceedings of the AMS Student conference (2010). A survey on wind power ramp forecasting, C. Ferrerira et al., Argonne National Library (2011). Temporal forecast uncertainty for ramps events, B. Greaves et al., Wind Engineering 33(4), 309-319 (2009). Associating weather conditions with ramp events in wind power generation, C. Kamath, Proceedings of the PSCE Conference (2011). Prediction of wind farm power ramp rates: a data-mining approach, H. Zheng y A. Kusiak, Journal of solar energy engineering, 131(3), 1-8 (2009). 23
Muchas gracias Cátedra UAM-ADIC de Aprendizaje Automático en Modelado y Predicción Instituto de Ingeniería del Conocimiento C/ Francisco Tomás y Valiente, nº 11 EPS, Edificio B, 5ª Planta UAM-Cantoblanco. 28049 Madrid Tlf.: (+34) 91 497 2323 Mvl.: (+34) 609 349 815 Fax.: (+34) 91 497 2334 E-mail: iic@iic.uam.es www.iic.uam.es blog.iic.uam.es 24