基于多源数据的 PM2.5 浓度时空分布预测与制图 肖璐 郎艺超 夏浪 楼昭涵 孙楠 黄李童 George Christakos 浙江大学海岛与海岸带研究所 北京市农林科学院北京市农业智能装备技术研究中心 Department of Geography,San Diego State University 摘 要: 随着我国经济、工业化、城市化进程迅速发展, PM 2.5污染在中国已经成为一个极端的环境和社会问题, 并引起广泛关注.采用新技术估算的地表 PM2.5质量浓度, 收集并处理了遥感反演的气溶胶光学厚度 (AOD) , 气象数据, 其他地理数据和污染物排放数据, 采用贝叶斯最大熵 (BME) 结合地理加权回归 (GWR) 来分析 2015 年冬季的 PM2.5暴露在我国东部大范围区域的时空变异特征.结果表明, BME 模型的十折交叉验证结果的决定系数 R2为 0.92, 均方根误差 (RMSE) 为8.32μg·m -3, 平均拟合误差 (MPE) 为-0.042μg·m -3, 平均绝对拟合误差 (MAE) 为 4.60μg·m -3, 与地理加权回归模型的结果相比 (R 2=0.71, RMSE=15.68μg·m -3, MPE=-0.095μg·m -3, MAE=11.14μg·m -3) , BME 的预测结果有极大的提高.空间上, PM 2.5高浓度地区主要集中在华北、长江三角洲、四川盆地, 低浓度地区主要集中在中国的最南部如珠江三角洲和云南的西南部;时间上, 不同月份的研究区域 PM2.5空间分布所有差别, 2015 年的 12 月、2016年 1 月 PM2.5污染最为严重, 2015 年的 11 月, 2016 年的 2 月污染相对较低.关键词: PM2.5; 遥感; 气溶胶光学厚度; 贝叶斯最大熵; 地理加权回归; 制图; 作者简介:肖璐 (1993~) , 女, 硕士, 主要研究方向为空气污染时空数据分析与建模;E-mail:xiaolu93@作者简介:George Christakos, E-mail:gchristakos@基金:国家自然科学基金项目 (529105-N11701ZJ) Space-Time Estimations and Mapping of PM2.5Fine Particulates Based on Multisource DataXIAO Lu LANG Yi-chao XIA Lang LOU Zhao-han SUN Nan HUANG Li-tong George Christakos Institute of Islands and Coastal Ecosystems, Zhejiang University; Beijing Agricultural Intelligent Equipment Technology Research Center, Beijing Academy of Agriculture and Forestry Sciences; Abstract: PM2.5 pollution in China has become an extreme environmental and social problem and has generated widespread public concern. We estimate ground-level PM2.5 from satellite-derived aerosol optical depth ( AOD) , topography data, meteorological data, and pollutant emissions using a new technique, Bayesian maximum entropy ( BME) combined with geographically weighted regression ( GWR) , to evaluate the spatial and temporal characteristics of PM2.5 exposure in an eastern region of China in winter. The overall 10-fold cross-validation R2 is 0. 92, and the root mean squared prediction error ( RMSE) is 8. 32 μg·m -3. The mean prediction error ( MPE) of the predicted monthly PM2.5 is-0. 042 μg·m -3, the mean absolute prediction error ( MAE) is 4. 60 μg·m -3. Compared with the results of the Geographically Weighted Regression model-GWR ( R2= 0. 71, RMSE = 15. 68 μg·m -3, MPE =-0. 095μg·m -3, MAE = 11. 14 μg·m -3) , the prediction by the BME were greatly improved. In this location, the high PM2.5 concentration area is mainly concentrated in North China, the Yangtze River Delta, and Sichuan Basin. The low concentration area is mainly concentrated in the south of China, including the Pearl River Delta and southwest of Yunnan. Temporally, there is migration trend from the coastal areas inland, and PM2.5 pollution is most serious in December 2015 and January 2016. It is relatively low in November 2015 and February 2016.Keyword: PM2.5; remote sensing; aerosol optical depth (AOD) ; Bayesian maximum entropy (BME) ; geographically weighted regression (GWR) ; air pollution mapping; 环境空气污染物包括颗粒物、臭氧、二氧化氮、二氧化硫等污染物, 空气动力学直径小于 2.5μm 的细颗粒物质 (PM 2.5) , 它是呼吸道, 心脏病, 肺部疾病的主要污染物质之一[1].PM 2.5可引起严重的心血管疾病, 心脏病, 呼吸系统疾病甚至肺癌[2,3], 根据世界卫生组织 2014 年的报告, 2012 年世界各地发生了370 万人与周围空气污染有关的过早死亡事件.特别是对于中国这样的人口大国, 随着中国经济, 工业化, 城市化进程迅速发展, 公众更容易暴露在污染的空气中, PM 2.5污染在中国已经成为一个极端的环境和社会问题[4], 并且引起了公众以及政府环保部门的重点关注.一般来说, 地面测量被认为是收集 PM2.5浓度最可靠的方法, 但是大多数污染物浓度信息是从地面监测点获得的, 这些方法有很多限制比如这些监测站点数量有限, 分布不均匀[9], 并且在不同年份具有不同的数量和测量频率范围[10].中国在 2012 年底陆续开展了全国大中城市的地面站点 PM2.5浓度的实时采样监测, 然而受仪器设备价格、监测站要求高、人力资源限制等, 我国在 2013 年前还没有建立起全国的空气质量监测网络系统, 所以仅依靠稀少站点的监测手段是无法满足获取全国大范围内的 PM2.5浓度时空分布信息[11].遥感技术可以提供连续高分辨率和大范围时空尺度的 PM2.5数据, 因为其反演的大气气溶胶光学厚度 (aerosol optical depth, AOD) 产品与大气颗粒浓度具有显著的相关性[12].国内外研究表明, 许多研究人员试图使用一系列传统的统计模型估算地面PM2.5水平, Wang 等[13]使用了线性回归模型, Liu 等[14]提出了化学传输模型 (CTM) , Lee 等[15]提出了混合效应模型 (MEM) , 而 Ma 等[16]应用了地理加权回归 (GWR) 模型, 都达到了显著的效果.因此, 遥感技术、时空模型和预测理论在评估空气污染和环境卫生方面发挥了重要作用.但现有研究缺乏对模型的精度和稳健性分析[11], 以及一套严谨的针对地统计的时空地理数据分析的理论框架的应用还比较缺乏.因此本研究拟结合高分辨率的遥感 AOD、气象数据、污染物排放数据以及其他基础地理空间数据, 而且综合考虑 PM2.5空间差异性, 提出一种集成多源数据集预测冬季中国东部大气污染浓度的新的时空建模方法———基于贝叶斯最大熵的时空预测和制图技术 (BME) 结合地理加权回归, 以期为今后的政府环保部门的污染治理以及人体暴露研究提供决策上的支持.1 材料与方法1.1 研究区域概况本研究区域选取我国大部分区域, 即除去新疆、西藏、青海、内蒙古、黑龙江省 (图 1) , 由于这些区域的 PM2.5监测点稀疏且分布不均匀, 为了模型的精度和准确性, 而且由于受冬季雪地, 海拔, 雾气和云等影响, 黑龙江地区、新疆、西藏大部分地区、青海和内蒙古东部、四川盆地等地无法获得有效的遥感观测数据, 先前的研究如 Ma 等[16]、Zou[17]、陈辉等[18]对这些区域的 PM2.5的预测也都是空白区域, 所以这些省份不纳入本研究区域.本文整个研究地区面积为418 万 km, 占全国总面积的 47.08%, 研究区域人口为 12.72 亿, 占总人口的 93%,其中包括 357 997 个 3 km×3 km 分辨率的空间规则格网.如此大区域及人口对于我国治理环境污染并开展健康效益评估有重大的意义.图 1 研究区域及 PM2.5 站点分布示意 Fig.1 Spatial distribution of PM2.5monitoring sites in the study area 下载原图1.2 数据收集和预处理本研究数据如下.①地面空气污染物监测站点数据:每日 24 h 平均PM2.5、NO 2、CO 浓度来源于中国环境监测总站网上发布平台 () , 时间范围:2015 年 11 月 1 日至 2016 年 2 月 29 日期间.PM 2.5、NO 2、CO 浓度小于 2μg·m-3[19] (占总记录的 5.6%) 而且一个月之内少于 15 d 观测记录的站点被剔除, 因为这些观察值和站点不符合中华人民共和国环境空气质量标准 (china national ambient air quality standards, CNAAQS) 的要求, 也不利于模型的构建.日均 PM2.5、NO 2、CO 数据用于计算每个月的平均浓度, 通过使用 R 3.3.2 (https://www.r-project.org/) 获得 4 个月相应污染物的浓度平均值, 得到了 3 种污染物的 1 408 个站点 3 009 个月平均质量浓度观测值, 同时为了减轻地理上的边缘效应, 将研究区域周围平均分布的 43 个监测站点纳入了研究范围;②本研究使用的 MODIS V。