R语言广义加性混合模型(GAMM)分析长沙气象因子、空气污染、PM2.5浓度、显著性检验、逐日变化可视化|附代码数据

全文链接:https://tecdat.cn/?p=32981

原文出处:拓端数据部落公众号

气候变化和空气污染对现代社会产生了越来越大的影响。在这种背景下,研究气象和空气污染之间的关系以及其对PM2.5浓度的影响变得非常重要。为了更好地理解和解释这些关系,广义加性混合模型(GAMM)成为一种强大的工具。

长沙作为湖南省的省会城市,其气象条件和空气质量一直备受关注。通过分析长沙地区的气象数据、空气污染指标和PM2.5浓度,可以更加全面地了解该地区的空气质量状况,并揭示气象因素对其变化的影响。

本研究旨在使用R语言中的广义加性混合模型(GAMM)方法,帮助客户来探索长沙地区气象因素与空气污染之间的关系,并进一步研究它们对PM2.5浓度变化的影响。我们将采集长沙地区的逐日气象数据、空气污染指标以及PM2.5浓度数据,应用GAMM模型进行分析。

在分析过程中,我们将考虑多种气象因素,如温度、湿度、风速等,并结合空气污染指标,如PM10、SO2、NO2等,来建立相应的GAMM模型。通过显著性检验,我们将评估各个因素对PM2.5浓度的影响程度,并进一步进行逐日变化的可视化分析,以呈现其动态变化规律。

查看数据

image.png

image.png

读取数据

 
 

airquality=read.csv("长沙气象站逐日气象+空气污染 数据.csv")  
  
Region=read.csv("长沙市年各个站点的PM2.5 每日浓度.csv",skip=1)

image.png

image.png

Table 2. Significance tests of PM2.5levels for different season, region, daytime and day of week. 对不同季节、地区、白天和周日的PM2.5水平进行显著性检验。

这段内容提到了对不同季节、地区、白天和周日的PM2.5水平进行显著性检验。显著性检验是一种统计方法,用于确定两个或多个样本之间是否存在显著差异。

在这个情境中,研究人员可能希望了解不同季节、地区、白天和周日的PM2.5水平是否存在显著差异。PM2.5是指空气中直径小于或等于2.5微米的颗粒物,它对人体健康和环境质量有重要影响。

为了进行显著性检验,研究人员可能会收集来自不同季节、地区、白天和周日的PM2.5水平数据,并使用统计方法来比较这些数据。常用的显著性检验方法包括t检验、方差分析和卡方检验等。

通过进行显著性检验,研究人员可以确定不同季节、地区、白天和周日的PM2.5水平是否存在显著差异,从而为环境保护和公共健康管理提供重要的科学依据。

Season

 
 
 
kruskal.test(PM2.5.ug.m3. ~ Season, data = airquality)

image.png

Region

image.png

Daytime

image.png

Season

 
 
pairwise.t.tes=="summ

image.png

image.png

image.png

image.png

image.png

image.png

image.png

Region

image.png

Day of week

 
 
Weekends1=seq(3,nrow(airquality),by=7)  
  
Weekends2=seq(4,nrow(airquality),by=7)

wilcox.test( airquality$PM2.5.ug.m3.[airquality$Weekends==0] , airquali

image.png

Fig 3. Day to day variations of PM2.5in different seasons, 不同季节PM2.5的逐日变化

不同季节PM2.5的逐日变化指的是在不同季节中,每天空气中PM2.5浓度的变化情况。PM2.5是指空气中直径小于或等于2.5微米的颗粒物,它们可以悬浮在空气中并被人们吸入。PM2.5来源于工业排放、交通尾气、燃煤、木材燃烧等。

在不同季节中,PM2.5的逐日变化可能会有所不同。一般来说,春季和夏季的PM2.5浓度相对较低,而秋季和冬季的PM2.5浓度相对较高。

在春季,天气温暖,风力较大,降雨较多,这些因素有助于减少空气中的PM2.5浓度。此时,植物生长活跃,能够吸收大量的二氧化碳和颗粒物,从而净化空气。

夏季的PM2.5浓度一般较低,主要是因为高温和强烈的阳光可以加速颗粒物的分解和扩散。此外,夏季也是降雨量较多的季节,雨水可以洗刷空气中的颗粒物。

秋季的PM2.5浓度开始上升,主要是因为天气变冷,大气稳定,风力较小,这有利于颗粒物的积累。此外,秋季还是农作物收获季节,农田燃烧残留物会释放出大量的颗粒物。

冬季是PM2.5浓度最高的季节。在冬季,天气寒冷,大气层稳定,风力较小,这导致颗粒物在空气中滞留时间较长。此外,冬季是取暖季节,燃煤和木材燃烧释放的颗粒物也会增加。

总的来说,不同季节PM2.5的逐日变化受到多种因素的影响,包括气温、风力、降雨量、植物生长和人类活动等。了解这些变化有助于我们采取相应的措施来减少PM2.5的污染。

 
 
points(which(airquality$Season=="spring" & airquality$Weekends==1),airq

image.png

image.png

image.png

image.png

不同季节PM2.5的逐日变化 Diurnal variations of PM2.5in different months

不同季节PM2.5的逐日变化是指在不同季节中,每天PM2.5浓度的变化情况。PM2.5是指空气中直径小于或等于2.5微米的颗粒物,它们对人体健康有害。这些颗粒物主要来自于工业排放、交通尾气、燃烧过程和自然来源等。

在不同季节中,PM2.5的逐日变化可能受到多种因素的影响。例如,冬季由于采暖需求增加,燃煤和燃气的使用量增加,导致PM2.5浓度较高。而夏季由于气温升高,光化学反应增多,加上交通尾气和工业排放的贡献,PM2.5浓度也可能较高。

此外,气象条件也会对PM2.5的逐日变化产生影响。例如,风速、风向、降雨等天气因素都会影响PM2.5的扩散和沉降,从而影响其浓度。

因此,不同季节中PM2.5的逐日变化是一个动态的过程,受到多种因素的综合影响。通过对这种变化的研究和监测,可以更好地了解和应对空气质量问题。

 
 
grep( date,airquality$日期)),]$PM2.5.ug.m3.  
plot(Mar,type="p",col=j,ylab="95% CI")

3-5月份

image.png

6-8月份

image.png

9-11 月份

1111.png

12-2 月份

image.png

Correlation coefficient and COD versus distance between the stations 相关系数和COD随站间距离的变化

相关系数是用来衡量两个变量之间的线性关系强度和方向的统计指标。它的取值范围在-1到1之间,其中1表示完全正相关,-1表示完全负相关,0表示无相关性。

相关系数和站间距离的变化之间可能存在一定的关系。如果两个变量之间的相关系数较高(接近1或-1),则说明它们之间存在较强的线性关系。在这种情况下,站间距离的变化可能较小,因为变量之间的关系比较稳定。相反,如果两个变量之间的相关系数较低(接近0),则说明它们之间的线性关系较弱或不存在。在这种情况下,站间距离的变化可能较大,因为变量之间的关系较为不稳定。

 
 
abline(lm(cordata~distdata),col="red")

image.png

image.png

GAMM模型分析温度  湿度,风速 能见度 气压对PM2.5的影响

GAMM(Generalized Additive Mixed Models)是一种灵活的统计模型,结合了广义可加模型(GAM,Generalized Additive Models)和混合模型(Mixed Models)的优点。它可以用于解决包含非线性关系和随机效应的数据建模问题。

GAMM模型主要用于处理长期观测数据和重复测量数据,其中数据可能受到时间、空间或其他相关因素的影响。GAMM模型具有以下特点:

  1. 广义可加模型(GAM)的优点:GAM模型可以通过非线性平滑函数来建模解释变量与响应变量之间的复杂关系,适用于非线性关系的建模。
  2. 混合模型(Mixed Models)的优点:GAMM模型可以处理数据中的随机效应,比如个体间的差异或层级结构中的变化。
  3. 可解释性:GAMM模型通过可加函数模型来描述数据,可以直观地解释模型中的每个平滑项的效应。
  4.  
 
 
gamm(PM2.5.ug.m3.~s(平均温度.摄

image.png

image.png

image.png

 
 
summary(b$gam) # gam style summary of fitted model

image.png

simple checking plots 模型检验

image.png

用AR1残差项拟合模型

image.png

lme拟合的细节

image.png

image.png

拟合模型的Gam风格总结

image.png

模型检验

image.png


QQ截图20230122145443.png

最受欢迎的见解

1.R语言多元Logistic逻辑回归 应用案例

2.面板平滑转移回归(PSTR)分析案例实现

3.matlab中的偏最小二乘回归(PLSR)和主成分回归(PCR)

4.R语言泊松Poisson回归模型分析案例

5.R语言混合效应逻辑回归Logistic模型分析肺癌

6.r语言中对LASSO回归,Ridge岭回归和Elastic Net模型实现

7.R语言逻辑回归、Naive Bayes贝叶斯、决策树、随机森林算法预测心脏病

8.python用线性回归预测股票价格

9.R语言用逻辑回归、决策树和随机森林对信贷数据集进行分类预测

posted @ 2024-07-12 18:45  拓端tecdat  阅读(13)  评论(0编辑  收藏  举报