近年来,不断增加的固体废物产量一直威胁着自然环境和人类安全。随着全球城市化进程的加快,城市固体废物(MSW)显着增加。生活垃圾的综合管理是一种有效的方法,但对生活垃圾产生量的准确预测是一个复杂的问题。一些传统的预测模型(多变量线性回归模型、时间序列分析模型等)使用简单的方法是成功的,但它们通常预先选择一个基本的数学模型,这限制了真实反映MSW特征的能力。
具有高精度的机器预测模型可以获取新的复杂数据并对其进行深度挖掘,越来越多地用于创建MSW生成的短期、中期和长期预测。其中,人工神经网络(ANN)、支持向量机(SVM)和梯度提升回归树(GBRT)等算法已被用于预测城市固体废物的产生。然而,缺乏基于大规模数据收集和广泛影响变量的高精度模型,限制了模型的广泛适用性。
为满足大规模综合治理的需要,实现短期城市生活垃圾产生量预测,清华大学陆伟景教授与团队成员通力合作,使用了130多个(全国、城市)的数据。和多层次的特征变量(如社会经济因素、自然条件和内部条件),建立一个机器学习的多城市城市生活垃圾生成模型,准确率高。他们的工作分析和探索了两个典型大城市(北京和深圳)的垃圾管理模式。这项名为“Developmentofmachinelearningmulti-citymodelforurbansolidwastegenerationprediction”的研究在线发表在FrontiersofEnvironmentalScience&Engineering上。
本研究构建了覆盖130个城市的MSW生成和特征变量数据库。在该数据库的基础上,采用先进的机器学习(GBRT)算法构建垃圾产生预测模型(WGMod)。在模型开发过程中,通过加权分析确定了MSW产生的主要影响因素。选取的关键影响因素为年降水量、人口密度和年平均气温,权重分别为13%、11%和10%。
WGMod表现出良好的性能,R2=0.939。北京和深圳城市垃圾产生量模型预测表明,未来3-5年北京垃圾产生量将逐渐增加,而深圳未来3年垃圾产生量将快速增长。两者之间的差异主要是由不同的人口增长趋势驱动的。
本研究建立了一个城市固体废弃物产生和特征变量数据库,包含1012个数据集,覆盖130个城市。开发的WGMod性能相当不错,非常适合预测的MSW产生。本研究为多城市城市生活垃圾生成模型开发提供了科学方法和基础数据。