Correlacion de material particulado pm 2.5 en funcion a la humedad relativa -- precipitacion usando python, en la ciudad del cusco
Bruce Warthon, Iv\'an Miranda, Iv\'an R. Quispe, Rafael Ponce, Victor, F. Ramos, Ariatna Zamalloa, Julio Warthon, Ruben Tupayachi, Miluska, Zamalloa

TL;DR
This study analyzes the relationship between PM 2.5 levels, relative humidity, and precipitation in Cusco using Python, applying correlation coefficients to understand their statistical connections during 2016-2018.
Contribution
It introduces a Python-based method to evaluate the correlation between air quality and meteorological variables in Cusco, Peru, during 2016-2018.
Findings
Identified significant positive and negative correlations between PM 2.5 and humidity.
Demonstrated the use of Python for statistical analysis of environmental data.
Validated correlations using Student's t-distribution at 5% significance level.
Abstract
The study utilizes data corresponding to the average monthly concentration of particulate matter 2.5 (P.M. 2.5), relative humidity, and precipitation during the period 2016-2018 collected by the High Vol station of the Energy and Atmosphere Center, and the meteorological center SENAHMI (Kayra-UNSAAC). In order to estimate the statistical relationship between two quantitative variables, the Pearson and Spearman correlation coefficients are used, which were obtained using the Python programming language. The obtained t-value is compared with the Student's t-distribution table for a certain level of significance . Positive and negative correlation values are established based on the obtained coefficients, and the interpretation of the Pearson and Spearman correlation values is used to determine if the data is related or not.
| N | Año | Mes | Promedio mensual () | HR media( %) | Precipitación () |
|---|---|---|---|---|---|
| 1 | 2016 | Noviembre | 108.11 | 56 | 28 |
| 2 | 2016 | Diciembre | 54.85 | 70 | 89.8 |
| 3 | 2017 | Mayo | 65.04 | 73 | 11.2 |
| 4 | 2017 | Julio | 152.44 | 63 | 0 |
| 5 | 2017 | Agosto | 121.38 | 60 | 8.4 |
| 6 | 2017 | Setiembre | 68.53 | 61 | 19 |
| 7 | 2017 | Octubre | 81.87 | 62 | 33.7 |
| 8 | 2017 | Diciembre | 75.99 | 68 | 101.7 |
| 9 | 2018 | Enero | 51.6 | 75 | 154.8 |
| 10 | 2018 | Febrero | 37.99 | 75 | 162.5 |
| 11 | 2018 | Marzo | 68.48 | 77 | 146.3 |
| 12 | 2018 | Abril | 81.62 | 72 | 20.3 |
| 13 | 2018 | Mayo | 72.85 | 68 | 0.2 |
| 14 | 2018 | Junio | 62.22 | 69 | 16 |
| 15 | 2018 | Agosto | 102.98 | 69 | 7.1 |
| Muy alta | Alta | Media | Baja | Muy baja | |
|---|---|---|---|---|---|
| Positiva | |||||
| Negativa |
| Lugar de Medida | Promedio mensual de () |
| Punto 1 - San Jerónimo - Ingreso a ladrilleras | |
| Punto 2 - UNSAAC - Pabellón de Educación | |
| Punto 2 - UNSAAC - Pabellón de Educación | |
| Punto 3 - UNSAAC - MULTIRED | |
| Punto 4 - San Sebastián - APV Paraíso de Fátima | |
| Punto 3 - UNSAAC - MULTIRED | |
| Punto 5 - Plaza de Armas de Cusco | |
| Punto 6 - Colegio Clorinda Matto de Turner Punto 7 - Municipalidad de Wanchaq | |
| Punto 8 - Plaza San Francisco Punto 9 - Centro de Salud de Wanchaq | |
| Punto 8 - Plaza San Francisco | |
| Punto 10 - Plaza Limacpampa | |
| Punto 11 - Plaza Pumaqchupan Punto 12 - Calle Matará | |
| Punto 13 - Centro de Salud de Belenpampa | |
| Punto 14 - Centro de Salud de San Jerónimo | |
| Punto 14 - Centro de Salud de San Jerónimo |
| n | r | CI | p-val | Potencia estadística | |
|---|---|---|---|---|---|
| Pearson | 15 | ||||
| Spearman | 15 |
| n | r | CI | p-val | Potencia estadística | |
|---|---|---|---|---|---|
| Pearson | 15 | ||||
| Spearman | 15 |
Peer Reviews
No public reviews on file for this paper yet. If you reviewed it on a platform where reviews are public (OpenReview, ICLR, NeurIPS, ICML), you can paste yours below so the community can read it here.
Videos
No videos yet. Explain this paper in a talk, walkthrough, or lecture? Add one.
Taxonomy
TopicsAgricultural and Food Production Studies · Environmental and Ecological Studies · Quality of Life Measurement
CORRELACIÓN DE MATERIAL PARTICULADO EN FUNCIÓN A LA HUMEDAD RELATIVA - PRECIPITACIÓN USANDO Python, EN LA CIUDAD DEL CUSCO
Bruce Warthon
Iván Miranda
Iván R. Quispe
Rafael Ponce
Victor F. Ramos
Ariatna Zamalloa
Julio Warthon
Ruben Tupayachi
Miluska Zamalloa
Resumen
El presente estudio utiliza datos correspondientes al promedio de concentración mensual de material particulado 2.5 (), humedad relativa y precipitación durante el periodo 2016-2018 recolectados por la estación High Vol del Centro de Energía y Atmósfera - UNSAAC, y el centro meteorologico SENAHMI (Kayra-UNSAAC). Para estimar la relación estadística entre dos variables cuantitativas, se utiliza el coeficiente de correlación de Pearson y Spearman, los cuales fueron obtenidos mediante el lenguaje de programación Python. El valor obtenido de t se compara con el valor obtenido de la tabla t de Student para un cierto nivel de significancia . Se establecen valores de correlación positiva y negativa en función de los coeficientes obtenidos, y se interpretan los valores de correlación de Pearson y Spearman para determinar si los datos están o no relacionados entre si. Se comprueba finalmente nuestra hipótesis, estableciendo una alta correlación negativa entre valores de los promedios mensuales del material particulado en función a la humedad relativa y la precipitación.
Palabras clave: Material particulado 2.5 (), Humedad relativa , Precipitación, Coeficiente de correlación de Pearson, Coeficiente de correlación de Spearman, Python.
Abstract
This study uses data corresponding to the monthly average concentration of particulate matter 2.5 (), relative humidity, and precipitation during the period 2016-2018 collected by the High Vol station of the Energy and Atmosphere Center - UNSAAC and the meteorological center SENAHMI (Kayra-UNSAAC). In order to estimate the statistical relationship between two quantitative variables, the Pearson and Spearman correlation coefficients are used, which were obtained using the Python programming language. The obtained t-value is compared with the value obtained from the Student’s t-table for a certain level of significance . Positive and negative correlation values are established based on the obtained coefficients, and the Pearson and Spearman correlation values are interpreted to determine whether the data are related or not. Finally, our hypothesis is verified by establishing a high negative correlation between monthly average values of particulate matter based on relative humidity and precipitation.
Keywords: Particulate matter 2.5 (), relative humidity, precipitation, Pearson correlation coefficient, Spearman correlation coefficient, Python.
1 Introducción
En las ultimas décadas la ciudad de Cusco viene experimentado un deterioro en la calidad del aire atmosférica causado principalmente por el material particulado, los valores de las concentraciones de los contaminantes atmosféricos han alcanzado valores que conllevan riesgo para la salud de las personas. Según estudios de la Organización Mundial de la Salud (OMS), la exposición prolongada a puede tener efectos negativos en la salud, como la disminución de la función pulmonar, el aumento del riesgo de enfermedades cardiovasculares y la mortalidad prematura [1]. Las partículas finas como pueden penetrar profundamente hasta los alveolos pulmonares de los humanos conllevando a riesgos de salud pública. Además, las también tienen un impacto significativo en el medio ambiente, contribuyendo al cambio climático y la acidificación del suelo y del agua [2].
Los altos niveles de contaminación atmosférica en el Cusco se deben a la unión de varios factores como el incremento del parque automotor en las últimas décadas, sobre todo con vehículos de segundo uso [3]. Los valores proporcionados por la SUNARP y el ENEI muestran que en 1989 habían 11,806 vehículos en circulación, en el 2001 el número fue de 33,316 unidades motorizadas, el crecimiento fue de 282 % en el lapso de 12 años, en el 2010 fue de 85,560 vehículos [3].
La concentración de los contaminantes en la atmósfera esta afectada por variables meteorológicas como, la humedad relativa y precipitación. Por otro lado, la dispersión de estos contaminantes es influenciada por la precipitación y la humeada relativa, así como la estabilidad que predomina en la atmósfera. La hipótesis de la investigación es una posible correlación de la concentración de en el aire y la humedad relativa conjuntamente con la precipitación. En ciudades de altura por encima de los 3000 metros sobre el nivel del mar (msnm) la contaminación del aire puede ser una preocupación particular debido a factores como la menor densidad del aire, la topografía y las condiciones climáticas. A nivel regional se ha puesto atención al problema de la contaminación atmosférica por lo tanto a través de una red de monitoreo automatizada conocida como Sistema de monitoreo Shelter del Centro de Investigación de Energía y Atmosfera - UNSAAC en la ciudad del Cusco. Esta red de monitoreo opero desde 2016 al 2018 con el objetivo de muestrear las concentraciones del material particulado () ubicadas en las periferias de las de la ciudad el cusco. Referente a la condiciones climáticas en la ciudad del cusco la cual está ubicada en una plataforma andina a una altitud de 3,340 m.s.n.m y está a lo largo de una cuenca de 31 km y está rodeado por colinas hacia el norte y oeste y abierta al sur y de esta forma está condicionada para la formación de un bolsón de aire seco donde la dirección predominante de los vientos es de sur a norte [4]. Por lo tanto, en este estudio, se analizarán los datos de , precipitación y humedad relativa recopilados durante un período de dos años para determinar la correlación entre estos factores en la ciudad del Cusco a mas de 3000msnm. Los resultados de este estudio proporcionan información valiosa sobre los factores que influyen en la contaminación del aire en ciudades de alta altitud y contribuyen a la toma de decisiones informadas sobre políticas y medidas de control de la contaminación del aire en estas áreas.
Los estudios anteriores han encontrado que la precipitación puede reducir la concentración de en el aire. Por ejemplo, en un estudio realizado en la ciudad de Wuhan, China, [5]. Encontraron que la precipitación tenía un efecto significativo en la reducción de la concentración de en el aire. Adicionalmente Liu [6], encontró una relación inversa entre la concentración de y la precipitación, lo que indica que la lluvia puede eliminar las partículas del aire en un estudio realizado en Beijing, China. Salinas-Rodriguez et. al [7] tomaron datos en México encontrando una correlación inversa significativa entre la precipitación y la concentración de . Takemoto et. al. [8] realizaron un estudio en la ciudad de Brasil, encontraron una correlación significativa entre la humedad relativa y la concentración de .
Teniendo esto en cuenta, se observa que la humedad relativa también puede influir en la concentración de en el aire. En un estudio realizado en la ciudad de Delhi, India, [9]. Encontraron una correlación positiva entre la humedad relativa y la concentración de . De igual manera otro estudio realizado en la ciudad de Taipéi, Taiwán, por [10], encontró que la humedad relativa estaba inversamente relacionada con la concentración de . Estos resultados sugieren que los efectos de la humedad relativa en las concentraciones de pueden variar según la región y las condiciones climáticas regionales.
A pesar de la importancia de estos factores para las concentraciones de en el aire, se sabe relativamente poco sobre sus interacciones en ciudades de gran altitud como la ciudad de estudio. Por lo tanto, el objetivo de este estudio es correlacionar la concentración de en el aire en función de la humedad relativa y precipitación en la ciudad del Cusco, ciudad que se ubica a una altitud de más de 3000 metros sobre el nivel del mar, con el fin de mejorar la comprensión y los factores que contribuyen a la contaminación del aire. Este análisis se realizará utilizando datos históricos sobre , precipitación y humedad relativa recopilados durante varios años por la estación High Vol del centro de energía y atmósfera de la Unsaac.
En este estudio, se investiga la relación entre los niveles de y las condiciones meteorológicas, específicamente la precipitación y la humedad relativa. Se sabe que la precipitación y la humedad relativa pueden influir en la concentración de en el aire al afectar la formación, la deposición y el transporte de partículas [11].
Estos resultados sugieren que los efectos de la humedad relativa en las concentraciones de pueden variar según la región y las condiciones climáticas regionales. A pesar de la importancia de estos factores para las concentraciones de en el aire, se sabe relativamente poco sobre sus interacciones en ciudades de gran altitud como la ciudad del Cusco.
La metodología ha consistido en analizar los datos obtenidos en el Centro de Investigación de Energía y Atmosfera - UNSAAC en la ciudad del Cusco que cuenta con una cabina móvil o Shelter equipada con analizdores de gases de efecto invernadero y un equipo muestreador de material particulado. Las mediciones se realizaron desde 2016 al 2018 con el objetivo de muestrear las concentraciones del material particulado () ubicadas en diferentes sitios de monitoreo en la ciudad del Cusco, la humedad relativa y precipitación se obtuvieron de datos proporcionados por el SENAHMI ubicado en la granja Kayra perteneciente a la UNSAAC. Asi se pudo establecer una correlación de concentración del material particulado () y las variables meteorológicas (precipitación y humedad relativa). Los resultados de la metodologıa desarrollada nos permitió establecer una correlación de concentración del material particulado () y las variables meteorológicas (precipitación y humedad relativa) para la cual se usaron los valores calculados por el muestreador de material particulado y aplicando Python para el tratamiento de datos, Python es un lenguaje de programación de propósito general que se caracteriza por su facilidad de uso y su capacidad para trabajar con diferentes tipos de datos y estructuras. Es ampliamente utilizado en la comunidad de programación debido a su sintaxis simple y legible, y a la gran cantidad de bibliotecas y módulos disponibles para su uso [12], para este estudio se opto por el uso de librerías de Python como Pandas que es una biblioteca diseñada para el análisis y manipulación de datos. Pandas es una herramienta esencial para el análisis de datos en Python. Ofrece una amplia gama de estructuras de datos, como Series y DataFrames, que son fáciles de manipular y analizar [13]. Conjuntamente con Pingoin una biblioteca de estadísticas de Python que proporciona una amplia variedad de pruebas estadísticas y herramientas para el análisis de datos. Pingouin ofrece una gama de funciones estadísticas útiles, y puede ser una alternativa a otras bibliotecas de estadísticas de Python, como SciPy [14]. Ya que este estudio tiene objetivo adecuar modelos de regresión lineal, tenemos en consideración el coeficiente de correlación de pearson, mencionado que este es una medida de dependencia que nos va permitir calcular el grado de covariación de dos variantes cuantitativas, sólo se aplica cuando las variables se encuentran relacionados de forma lineal, de la misma manera las variables deben de ser continuas [15]. De igual manera se emplea el criterio analítico de Spearman que es un análisis no paramétrico que se usa para muestras con distribución normal dado que este tipo de análisis de correlación tiene el objetivo de medir la relación y asociación de una variable en referencia a otra con el fin de poder determinar si esta pueda servir como predictor; así mismo este coeficiente de correlación analiza también variables nominales y ordinales [16].
La importancia de la investigación ha sido contribuir con el conocimiento sobre los diferentes factores meteorológicos que afectan en la contaminación del aire por en la ciudad del Cusco. Conocer esta relación entre las diferentes variables puede ayudar a identificar patrones y factores que contribuyen en la contaminación del aire en la ciudad del Cusco, la información puede servir para adoptar medidas para disminuir la contaminación del aire.
2 Datos
Los datos considerados para el estudio son distintos meses del 2016 al 2018, estos son valores obtenidos en los muestreos de material particulado. La tabla 1 muestra la concentración de , humedad relativa y precipitación.
3 Metodología
Se ha considerado datos correspondientes a la concentración mensual de material particulado 2.5 () medido durante el periodo 2016-2018, las mediciones se realizó empleando un muestreador de material particulado de alto volumen por parte del Centro de Energía y Atmósfera (UNSAAC). Los datos de precipitación y humedad relativa se obtuvieron del SENAHMI (Kayra-UNSAAC).
Para estimar la relación estadística entre dos variables cuantitativas X y Y, se puede hacer uso de dos coeficiente de correlación (Pearson y Spearman)-técnicas utilizadas en la minería de datos-definidos por las siguientes expresiones 1 y 2 correspondientemente:
[TABLE]
[TABLE]
donde y son datos i-ésimos, y son los valores promedios y y son los valores de la desviación estándar para los atributos y respectivamente y es el número total de datos. Además es distancia entre los rangos. En general, valores de y cercanos a 1 y -1 corresponden a una correlación positiva o negativa, lo que significa que existe una dependencia relativa entre los dos tipos de datos y ; la dependencia es relativa, ya que un valor de y (0-1) corresponden a una nula dispersión en los datos, y a su vez corresponden a un caso ideal. Sin embargo, valores de y (Tabla 2), corresponden a una nula relación entre variables y o una muy grande dispersión de los datos. para establecer una interpretación del valor obtenido de y y ver si los datos y están o no relacionados, y dicha relación no es producto de la aleatoriedad, se calcula el valor de la distribución de Student mediante la expresión:
[TABLE]
donde es el coeficiente de correlación de Pearson o Spearman y es el tamaño de la muestra.
El valor obtenido de se compara con el valor obtenido de la tabla de Student para un cierto nivel de significancia (se ha establecido -correspondiente a un resultado que normalmente es aceptable). Por otro lado, según la tabla de Student para , . Además, para este estudio se ha establecido una hipótesis nula (: no existe correlación significativa entre entre el par de variables) y una hipótesis alterna (: existe correlación significativa entre el par de variables). Los criterios que se utilizan para aceptar o rechazar la hipótesis nula son los siguientes: a) Si el valor de de Student obtenido de la tabla es menor que la calculada, entonces se dice que las variables están relacionadas; la correlación no proviene del azar(Se rechaza la hipótesis nula). b) Por el contrario, si la obtenida de las tablas es mayor que la calculada, entonces se dice que no hay correlación entre las variables, aunque el valor de o sean diferentes de [math]; es decir, se acepta la hipótesis nula.
Para calcular el p-valor a partir del valor estadístico t, primero se necesita conocer los grados de libertad (gl) del estadístico t y luego usar una tabla de distribución t-Student o una calculadora estadística que te proporcione el valor de probabilidad. La fórmula general para calcular el p-valor a partir del valor de t y los grados de libertad es:
[TABLE]
[TABLE]
Donde es la distribución con grados de libertad.
Es importante recordar que el p-valor representa la probabilidad de obtener un valor de igual o más extremo que el observado, bajo la hipótesis nula. Si el p-valor es menor que el nivel de significancia establecido, se rechaza la hipótesis nula y se concluye que existe evidencia estadística para aceptar la hipótesis alternativa( hay evidencia significativa que existe correlación).
Para la estadística, en este estudio utilizaremos las librerías Pandas, StatsModels y Pingouin de Python, que proporcionan funciones para calcular el valor de directamente a partir del coeficiente de correlación de Pearson o Spearman y el tamaño de la muestra.
En primer lugar,para el cálculo del coeficiente de correlación de Pearson y Spearman, las variables y corresponden a las mediciones que se hacen sobre la concentración de y la precipitación. En segundo lugar, las variables y corresponden a las mediciones de concentración de y Humedad Relativa. Ambos medidos durante el periodo 2016-2018. El estudio se realizó con los datos obtenidos de 15 puntos diferentes (tabla 3), ubicados y distribuidos geográficamente en la parte urbana de la ciudad del Cusco (mapa 1).
Los 15 puntos de medición están ubicados a distancias considerables y se encuentran distribuidas en diferentes distritos de la ciudad (tabla 3). Por cada mes, se tiene 1 dato promedio de , precipitación y húmeda relativa; los equipos de medición en algunos puntos arrojaron datos que son erróneos (números negativos o vacíos), por lo que se eliminaron mediante un proceso de limpieza de datos.
The reference list from the paper itself. Each links out to its DOI / PubMed record.
- 1[1] World Health Organization “Guías de calidad del aire de la OMS relativas al material particulado, el ozono, el dióxido de nitrógeno y el dióxido de azufre: actualización mundial 2005”, 2006
- 2[2] Oar Us Epa “Particulate matter (PM) basics”, 2016 URL: https://www.epa.gov/pm-pollution/particulate-matter-pm-basics
- 3[3] Juan Eduardo Gil Mora “Calidad del Aire en la Cuenca Atmosférica del Cusco” In El Antoniano 133.1 , 2018, pp. 27–43
- 4[4] Senamhi-PACC “Caracterización climatica delas regiones de Cusco y Apurimac. Ministerio del Ambiente. Lima-2011”, 2011
- 5[5] L. Zhang “The relationship between PM 2.5 and meteorological conditions in Wuhan, China: seasonal variations and regional differences” In Environmental Science and Pollution Research 27.8 , 2020, pp. 7985–7993
- 6[6] Y. Liu “Characteristics and source apportionment of PM 2.5 during an Asian dust storm episode in Beijing” In Atmospheric Environment 148 , 2017, pp. 129–139
- 7[7] E. Salinas-Rodríguez, M.. García-Cuellar and C.. Martínez-Salinas “Statistical analysis of air pollution data using PM 2.5, temperature and humidity variables in the metropolitan area of Monterrey, Mexico” In Mexico. Environmental Science and Pollution Research 26.7 , 2019, pp. 6428–6437
- 8[8] L.. Takemoto, A… Medeiros, N… Ferreira and V.. Mariani “Evaluation of particulate matter PM 2.5 and PM 10 levels and their correlation with meteorological variables in a Brazilian city” In Revista Brasileira de Meteorologia 34.2 , 2019, pp. 277–287
