Técnicas de aprendizaje automático en plantas fotovoltaicas

Talayero Navales, Ana Patricia
Llombart Estopiñán, Andrés (dir.) ; Melero Estela, Julio Javier (dir.)

Universidad de Zaragoza, 2024


Resumen: La energía solar fotovoltaica es un componente crucial en el escenario energético mundial, gracias a su evolución tecnológica que le permite producir energía a costos competitivos. Sin embargo, el despliegue masivo de plantas fotovoltaicas conlleva desafíos para asegurar su optimización económica en varias fases del proceso, incluyendo la fabricación, instalación de módulos y la operación y mantenimiento durante la explotación de estas instalaciones.
Uno de los retos en la operación y mantenimiento de una planta es el análisis del rendimiento. Este análisis, que se realiza a través de la evaluación de su producción, tiene como objetivo detectar anomalías de manera temprana que afectan a su funcionamiento. Este enfoque proactivo permite orientar el mantenimiento hacia las áreas que más lo necesitan. Al hacerlo, no solo se maximiza el rendimiento de la planta, sino que también se optimizan los ingresos económicos derivados de su operación.
El análisis del funcionamiento de la planta se realiza utilizando los datos medidos comúnmente en la propia planta. Un factor que influye notablemente en el análisis del funcionamiento es el número de estaciones meteorológicas disponibles, que suele ser limitado debido a la competitividad económica en el sector. Debido a la escasez de estas estaciones, los módulos pueden estar situados lejos de los puntos de medición de la irradiancia solar. Esta distancia puede resultar en una discrepancia entre la irradiancia recibida por los módulos y la medida en la estación meteorológica, debido a la no uniformidad en la nubosidad que afecta a la relación entre la irradiancia y la producción, lo que complica el análisis de la producción y, por ende, del rendimiento de la planta.
Para dar respuesta a la necesidad planteada en esta tesis se han estudiado los modelos de aprendizaje automático existentes en la literatura para predecir la producción de plantas fotovoltaicas y además, se han analizado los modelos de caracterización de la irradiancia, lo que permite controlar la calidad de la variable más importante en la caracterización de la producción. Esto añade robustez al proceso.
En la revisión bibliográfica realizada, se han identificado las tres técnicas de aprendizaje automático que se desarrollan y aplican en la tesis. Las redes neuronales por ser las más utilizadas en la bibliografía. Los árboles de decisión, Random Forest y Gradient Boosting, por presentar buenos resultados en otras áreas de la ciencia. Adicionalmente, se ha trabajado con la regresión lineal múltiple, que es el modelo más sencillo y servirá como punto de referencia para la comparación.
Para garantizar la precisión en la predicción de producción e irradiancia en los tres métodos estudiados se necesita seleccionar los hiperparámetros adecuados. El resultado de la búsqueda de los hiperparámetros en general revela que el error es más sensible a unos hiperparámetros concretos, que no existen valores únicos que minimicen el error y que estos además están relacionados entre sí. La metodología de la búsqueda está condicionada por el número de hiperparámetros y el rango de valores de estos, siendo posible utilizar para los modelos de árboles de decisión una búsqueda sistemática, pero para las redes neuronales hay que utilizar una combinación del método de hiper-banda y búsqueda aleatoria. La conclusión del estudio es que el análisis de los hiperparámetros es fundamental para garantizar un resultado adecuado en el ajuste del algoritmo y la definición del modelo de producción de cada una de las plantas.
Para seleccionar el modelo no solo es importante valorar el error del modelo, sino que también hay que analizar el intervalo de confianza de la predicción, que define la incertidumbre del resultado. Para poder calcular los intervalos, se utilizan los modelos Quantile Regression, Quantile Random Forest y Quantile Gradient Boosting, que, a través del cálculo de cuantiles, definen el intervalo de confianza. Y en el caso de las redes neuronales, se adaptan las capas de la red, para que los resultados del modelo tengan una distribución Normal que permite definir los intervalos de confianza del modelo. No se han encontrado estudios similares en la literatura por lo que este estudio supone una clara aportación de la tesis.
Los resultados de los cálculos de los intervalos indican que los modelos basados en cuantiles proporcionan un intervalo asimétrico, con un límite superior más ajustado que el inferior, mientras que las redes ofrecen un intervalo simétrico. La asimetría es preferible en este contexto, ya que refleja tanto el comportamiento de la producción de las plantas como de la irradiancia. Ambas tienen un límite superior técnico que no pueden exceder, mientras que el límite inferior puede llegar a valores muy bajos dependiendo de la nubosidad. Para evaluar la bondad del intervalo, se utiliza la mediana de la amplitud del intervalo como valor de comparación siendo deseable intervalos con amplitudes lo más bajas posibles.
La aplicación de los tres modelos de aprendizaje automático a las plantas para predecir su producción muestra que estos mejoran los resultados respecto al modelo referencia, la regresión lineal múltiple, en un rango del 14% al 30%. Esta mejora varía dependiendo de la planta y del modelo utilizado. Estos resultados justifican claramente la realización de la tesis.
La influencia de las características de la planta sobre la mejora de los resultados es inversamente proporcional a la complejidad de la misma. Es decir, cuanto más compleja sea la planta de modelizar, los modelos de aprendizaje automático presentan una mayor mejora. Así, la planta PV1, de terreno complejo y que solo cuenta con una estación meteorológica, el modelo "Random Forest", tiene una mejora respecto a la referencia del orden del 30%, mientras que el mismo modelo en las plantas PV2 y PV3 presenta una mejora de alrededor del 25%. El modelo "Gradient Boosting" presenta una mejora para la planta PV1 del 26%, para la planta PV2 del 23% y para la planta PV3 del 22%, y las redes neuronales mejoran el resultado de la referencia en la planta PV1 un 16% y en las plantas PV2 y PV3 un 14%.
El modelo "Random Forest" es el que menor error de predicción presenta, entre un RMSE de 1.9% y un 5.4%, dependiendo de la planta, frente a la referencia cuyo rango de error se encuentra en 2.6% y 7.9% para las mismas plantas. Los errores RMSE del modelo "Gradient Boosting" son muy próximos a los del modelo "Random Forest", entre el 2% al 5.9%, mientras que las redes neuronales presentan errores RMSE ligeramente superiores a los modelos de árboles de decisión, entre el 2.2% y el 6.6%.
Los resultados del estudio de los intervalos de la predicción de la producción de la planta muestran que el intervalo del modelo "Random Forest" es más de diez veces más amplio que el de los demás modelos de aprendizaje automático. Esto implica que, aunque el "Random Forest" tiene un error inferior al de los demás modelos, presenta una gran incertidumbre y dispersión en sus resultados. Este comportamiento del "Random Forest" puede ser problemático si se pretende utilizar el modelo para identificar eventos con producción anómala. Sin embargo, el modelo Gradient Boosting que tiene un error similar al modelo Random Forest, tiene intervalo asimétrico y la amplitud de intervalo menor para cualquiera de los niveles de confianza. Por lo que el modelo Gradient Boosting" se destaca como el método preferente para simular el comportamiento de la producción de una planta fotovoltaica a nivel inversor.
Los resultados que presenta el modelo Gradient Boosting son un error del 5.9% en la planta PV1, del 1.9% para la planta PV2 y del 3.2% para la planta PV3, y su intervalo en el nivel de confianza del 90% es de 0.6% unidades arbitrarias de producción en la planta PV1, 0.2% en la planta PV2 y 0.3% en la planta PV3. Además, este modelo tiene una mayor eficiencia en el procesamiento y cálculo.
Cuando se aplican las mismas metodologías a la predicción de la irradiancia, se observa que los los valores de los ajustes de los hiperparámetros conllevan a modelos más complejos en el caso de los árboles de decisión, correspondiendo a que las relaciones entre las variables son menos claras, pero no así en las redes neuronales donde el modelo que se define es similar al que se utiliza en el caso del cálculo de la producción. Así por ejemplo el algoritmo de Random Forest necesita un tamaño de árbol con una profundidad de 29 y 1650 árboles y el algoritmo de Gradient Boosting necesita 850 árboles con un tamaño de árbol marcado por una profundidad de 9, valores muy superiores a los que se manejaban en los modelos de producción. En el caso de las redes neuronales se trabaja con un modelo de 2 capas, con 220 neuronas en la primera capa y 300 en la segunda, valores que son similares a los del modelo de predicción de la producción.
En cuanto a los errores de los modelos, se encuentran en el rango superior de los que se obtenían en la predicción de la producción, así, por ejemplo, en el modelo utilizado como referencia los errores en la predicción de la producción se encontraban en la horquilla 2.6% y 7.9% frente al error de la predicción de la irradiancia que es de un 7.4%. Es decir, predecir la irradiancia a partir de las variables de la estación meteorológica presenta el mismo error que la predicción de la energía a partir de las variables medidas en la planta cuando existen pendientes diferentes y hay grandes distancias. El diferencial de mejora que aportan los modelos más avanzados con respecto al modelo de referencia es de entre un 11% y un 59% dependiendo del modelo en cuestión, por lo que la elección del modelo tiene una mayor repercusión en este proceso.
El modelo que presenta la mayor mejora de resultado y por tanto el menor error en la predicción de la irradiancia es el modelo Grandient Boosting con un error RMSE de 3%. El error del Random Forest en este caso es de 6.6%, peor que el que presentan las redes neuronales que es de 5.7%. El proceso encadenado de generación de los árboles que permite disminuir el error hace que sea muy adecuado para este complejo problema.
La incertidumbre de los modelos aplicados en el cálculo de la irradiancia también se ve aumentada en un orden de diez veces a la que presentan las mismas metodologías en el cálculo de la producción. El modelo que presenta la menor amplitud media de intervalo de confianza es también Gradient Boosting, con el valor de 10.7 para el nivel de confianza del 90%, siendo también el modelo más rápido y eficiente desde un punto de vista computacional. Por lo que Gradient Boosting también resulta el modelo más adecuado para estimar la irradiancia a partir de los datos meteorológicos.
De este estudio se puede concluir que los modelos de aprendizaje automático pueden caracterizar la producción de un inversor de la planta sin otras variables más que las medidas en la planta, con unos errores bajos y una buena precisión del resultado. Disponer de la generación teórica permite identificar desvíos inducidos por ineficiencias de la planta. También estos modelos pueden predecir la irradiancia a partir de medidas climatológicas y de la ubicación exacta del punto de medición, pero con un mayor error e incertidumbre que la producción. Conocer la irradiancia ayuda a mejorar el cálculo de la producción, del Performance Ratio de la planta e incluso disponer de una medida de irradiancia en el caso de que la medida falle. El modelo más apropiado para predecir estas variables en el campo de la fotovoltaica es además el modelo GB.
Si bien los modelos presentados son particulares para los escenarios expuestos, el procedimiento y la metodología utilizados en el estudio son de alcance general. Esto significa que el enfoque basado en modelos de aprendizaje automático, la metodología para el ajuste de los hiperparámetros y la forma de definir los intervalos de confianza pueden son aplicables a cualquier planta fotovoltaica.


Resumen (otro idioma): 

Pal. clave: energía solar ; inteligencia artificial

Titulación: Programa de Doctorado en Energías Renovables y Eficiencia Energética
Plan(es): Plan 509

Área de conocimiento: Ingeniería y Arquitectura
Nota: Presentado: 14 03 2024
Nota: Tesis-Univ. Zaragoza, , 2024






Aportación del TFG/M a la Sostenibilidad: Asegurar el acceso a energías asequibles, fiables, sostenibles y modernas para todos. Tomar medidas urgentes para combatir el cambio climático y sus efectos.



Creative Commons License



Visitas y descargas



 Registro creado el 2024-06-21, última modificación el 2024-06-21


Texto completo:
Descargar el texto completo
PDF

Valore este documento:

Rate this document:
1
2
3
 
(Sin ninguna reseña)