Modelado de un sistema de supervisión de la calidad del aire usando técnicas de fusión de sensores y redes neuronales

  1. Barrón Adame, José Miguel
Zuzendaria:
  1. Antonio Vega Corona Zuzendaria
  2. Diego Andina de la Fuente Zuzendaria

Defentsa unibertsitatea: Universidad Politécnica de Madrid

Fecha de defensa: 2010(e)ko azaroa-(a)k 03

Epaimahaia:
  1. Manuel Recuero López Presidentea
  2. Wilmar Hernández Idazkaria
  3. Francisco Javier Ropero Pelaez Kidea
  4. Rubén Ruelas Lepe Kidea
  5. Daniel Ruiz Fernández Kidea

Mota: Tesia

Laburpena

La contaminación atmosférica es un problema importante de salud ambiental que afecta a muchos países. La ciudad de Salamanca (Guanajuato, México) tiene graves problemas de contaminación atmosférica, y se encuentra catalogada como una de las más contaminadas en el país. Las causas principales de contaminación atmosférica en Salamanca son fuentes fijas y constantes de emisión como industrias químicas y de generación eléctrica. Los efectos ambientales en el aire son graves y se han hecho importantes esfuerzos por medir las concentraciones de Dióxido de Azufre (SO2) y Partículas Menores a 10 micrómetros (PM10), principales contaminantes en la ciudad. Actualmente, las estimaciones del Índice de la Calidad del Aire (ICA) reportadas por las Autoridades Ambientales se realizan con el promedio móvil de las concentraciones de contaminantes por punto de monitorización sin considerar los factores climáticos. Por otra parte, estudios relacionados con la contaminación atmosférica han demostrado que los episodios severos de contaminación atmosférica se deben no sólo a incrementos repentinos en las concentraciones de contaminantes sino también a ciertas condiciones meteorológicas que disminuyen la capacidad de la atmósfera para dispersar estas concentraciones. En la presente Tesis Doctoral se propone un modelo de supervisión inteligente que combina las técnicas de Fusión de Datos de Sensores (FDS) y Redes Neuronales Artificiales (RNA) y contribuye a determinar de forma automática el ICA en la ciudad de Salamanca. El modelo, integra a las variables meteorológicas de dirección y velocidad de viento para determinar los efectos de estas en las concentraciones de contaminantes y determinar el nivel de contaminación atmosférica. La metodología consistió en analizar las series temporales (por minuto) de las concentraciones de contaminantes y las variables de dirección y velocidad de viento para generar patrones de entrenamiento con información relevante y representativa que puedan ser usados para entrenar una RNA de Mapas Auto-organizados (SOM). Para generar los patrones de entrenamiento se consideraron los valores de las concentraciones máximas y mínimas diarias de cada contaminante con los de sus variables asociadas de dirección y velocidad de viento. El proceso para obtener la red SOM resultante consistió en crear y entrenar una red SOM con cuatro neuronas. Los resultados obtenidos fueron analizados y evaluados con los niveles de contaminación establecidos por Autoridades Ambientales. Otra red SOM fue creada y entrenada con una neurona adicional. El criterio de evaluación se volvió a realizar y a evaluar hasta que se obtuvieron los mejores resultados. La red SOM demostró su capacidad como potente clasificador no lineal que presenta la ventaja de poder extraer información subyacente en conjuntos de medidas provenientes de sensores a la vez que hace la función de fusión de datos. Con la FDS se obtiene una ganancia cuantitativa (valores de velocidad y dirección de viento que determinan los valores de las concentraciones de contaminantes) de información respecto a la información que se obtiene bajo la consideración de los diferentes sensores de contaminantes por separado, como se ha realizado hasta ahora en el cálculo del ICA. Junto a esta ganancia cuantitativa se obtiene también una ganancia de carácter cualitativo (información del comportamiento de la contaminación atmosférica), que ayuda a tomar decisiones al respecto de alguna contingencia ambiental. Con el modelo y metodología propuestos e implementados se obtiene, mediante los efectos de las variables de dirección y velocidad de viento en las concentraciones de contaminantes, 1) la clasificación automática en cada una de las estaciones de monitorización de las concentraciones de contaminantes en los niveles de calidad del aire; 2) una representación del nivel de calidad del aire en la ciudad y 3) la determinación automática de posibles episodios de contaminación, aspecto muy importante al clasificar datos de sensores de contaminación que presentan en general cierta inestabilidad. Universidad Politécnica de Madrid ABSTRACT Air pollution is one of the most important environmental problems in developed and undeveloped countries. As many cities in the world, Salamanca (Guanajuato, Mexico) has air pollution problems and is catalogued as one of the most polluted cities in the country. The main causes of air pollution in Salamanca are fixed emission sources, such as chemical industry and electricity generation. The environmental effects in the air are acute and big efforts have been done to measure the Sulphur Dioxide (SO2) and Particulate Matter less than 10 microns in diameter (PM10), the most important air pollutants in Salamanca. Unfortunately, the air pollution value is computed and reported by the Health Authorities with the daily average of SO2 and PM10 pollutant concentrations without take into account meteorological factors. However, It is shown by related studies that severe air pollution episodes are connected with anomalous weather conditions. In this PhD. Thesis, an intelligence monitoring model is proposed to estimate automatically the AQI in Salamanca. Proposed model apply the Sensor Data Fusion (SDF) and Artificial Neural Network (ANN) techniques. To estimate the AQI in Salamanca, the model take into account meteorological variables as decision factors. Proposed methodology analyzes (by minute) the pollutant concentrations and the meteorological variables time series to build the training patterns with relevant and representative information to train a Self-Organizing Map (SOM). To build the training patterns, maximum and minimum daily pollutant concentrations associated with their meteorological variables (wind direction and wind speed) were considered. In the SOM training process, a SOM with four neurons was created and trained. SOM results were analyzed and evaluated with established environmental levels by Environmental Authorities. Another SOM was created and trained with and adicional neuron. The evaluation criterio was done and evaluated to get the best results. ANN have shown their capacity as nonlinear classifiers. ANN gather subjacent information in cluster of measures becoming by the sensors at the same time that fuse the data. Furthermore, with ANN a discriminate function can be implemented, which remove the false episode of pollution, an important aspect in the classification of pollutant sensor data with instability. In function on the meteorological variables, ANN determine if the pollutant concentrations belong to an specific monitoring station. To implement the discriminant function, were selected the daily maximum and minimum concentrations and their associated meteorological variables of wind direction and wind speed. With SDF a quantitative approach information is obtained about the sensors separately. With the quantitative approach, a qualitative approach that help to take decisions about to environmental contingency. Applying SDF a complete estimation of the AQI is done with more resolution over a hazard region to the population. To show the benefits of the suggested and implemented model and methodology, representative days with pollution episodes have been analyzed, obtaining 1) to model the meteorological effects in the pollution concentration, 2) to classify the zone pollutant concentration according the Environmental Authorities and 3) to represent the pollution behaviour in function of the meteorological variables.