重型货车OBD数据分析
Date:
NOx对人体健康、大气环境、生态环境等都会造成相当的影响。机动车是NOx排放的主要贡献者。随着机动车电气化的推行和国家标准的提高,移动源排放的NOx已经有了极大的改善。然而,重型货车往往有较高的车身重量,燃烧柴油,并难以实现电动化,已经成为了移动源NOx排放的最主要来源。为控制重型货车的NOx排放,国家出台了国VI标准,规定所有新出厂的重型货车都必须安装OBD装置。在这样的背景下,完成了下列研究。
(1)重型货车NOx排放分析框架
灵感来源:思路实际上来自于一些表格数据转化为图像的研究,就像下图那样(Estebsari A, Rajabi R. Single residential load forecasting using deep learning and image encoding techniques[J]. Electronics, 2020, 9(1): 68.)。
将数据转化为图像有三个好处。其一,可以压缩数据量,只保留关键的排放规律。其二,可以更加方便的置入深度神经网络中,挖出更深层次的排放规律(原始的表格数据并不能反映整体的排放特性,只能反映局部的时序特征)。其三,可视化的图像比表格化的图像更加直观。在这个思路的基础上,开展了相关工作——我们希望通过生成的图片,使用卷积神经网络训练深度学习模型,最终完成精准的车辆问题诊断。 我们从OBD数据平台上下载了32辆同型号的重型货车数据,将数据按照不同条件置入不同的箱中,从而生成了车辆对应的排放特性图片,通过观察图片,即可分析出车辆的主要排放原因。为进一步探索,抽取了三辆车做为案例研究,在此基础上,为这三辆车建立了机器学习模型,并使用复现的模型解释方法(原始的PDP、ICE不支持XGBOOST)解释了机器学习模型的行为,最终给出了针对性的治理建议。研究的流程图如下:
由于数据不够丰富,并且无法进行实车调查(这意味着深度学习没有目标值),没能按照原始研究计划,但是还是做了一些小小的尝试————将车辆编为1-32号,使用类似于VGG的深度神经网络(网络结构如下),建立了CNN深度学习模型。该模型的NLLloss 从1.19 => 2.01 * 10**(-7)
这种方法有巨大的潜力,如果有精准的故障数据集,就可以训练精准的模型,实现高排放原因的精准识别。
(2)重型货车NOx数据填补
灵感来源:思路来自本科时参与的工作(He C, Ji M, Li T, et al. Deriving full‐coverage and fine‐scale XCO2 across China based on OCO‐2 satellite retrievals and CarbonTracker output[J]. Geophysical Research Letters, 2022, 49(12): e2022GL098435.)。由于云层遮挡、地球自转等诸多原因,OCO2记录的CO2柱浓度会存在大量的缺失值。而机器学习可以通过其他数据,来估计这些缺失值。类似的,发动机冷却液温度低于70℃时,机动车的NOx传感器会关闭,也会产生类似的数据缺失现象。因此产生了用历史数据完成数据缺失填补的想法。 数据是从OBD数据平台上下载的————26辆包含一个月数据的重型货车OBD数据数据集,6辆包含一年数据的OBD数据数据集。 研究的工作流如下:
将来,这些方法或许可以用于大数据平台的数据填补。
