基于模式识别机器学习算法的热力站动态能耗指标预测模型【摘要】以我公司n个典型热力站和其所带热用户为实验对象,以所在地区天气预报和天气实时数据为依据,对供暖期间所采集的热力站供暖数据、天气预报数据、典型供暖用户室内温度,通过模式识别机器学习算法对样本进行学习训练,形成一套完整热力站动态能耗指标预测模型。【关键词】模式识别机器学习态能耗指标预测欧式距离复合相关系数0.引言在集中供热系统中,热量主要以水为载体从热源厂通过一次管线输送到热力站,热力站通过换热设备进行热交换后,将热水通过二次管线输送到热用户户内。为了使用户室温达标,同时降低能源消耗,需要根据天气预报情况不断地对热力站的热负荷进行调整。目前,传统的调整方式是通过预报的室外温度结合热力站所带供热面积进行计算,同时根据风、雪和日照等因素,凭借经验进行人为修正。得出各个热力站的未来预测负荷(大部分用二次送水平均温差或送回水温度作为调整参量)和延迟时间,但由于用户需热情况复杂,受热力站及二次管网系统结构、供暖用户建筑物结构、保温情况甚至用户用热习惯等多重因素影响,传统的计算方式多以调度人员的经验和一些计算公式(人为的设定一些估值)无法准确获得合理热负荷值预测值,其估算的调整结果容易出现用户室温不达标或室温偏高导致能源浪费等情况的发生。针对上述情况,本文采用了模式识别机器学习算法对各供热参数进行数据集合统计计算和分析,得出热力站热负荷和影响热负荷的各个因素之间的关系,从而准确高效地调节和控制用户室温,在节能降耗的同时提升供热舒适度。1.算法研究1.1.数据采集实现模式识别机器学习算法对各供热参数进行数据集合计算,作为基础的数据采集工作非常关键,其采集内容、采集频率和采集数据质量是关系到整个数据模型分析结果能否可用的关键重要因素。1.1.1采集内容目前,国内的热力站运行数据,百分之九十采用了以PLC控制技术为主要采集手段,通过无线VPDN技术或有线(光纤专线)将PLC采集的热力站数据上传到相应的调度中心SCADA系统,所有这些数据可以通过网络实现对各个热力站数据的监视和调度。同时,也可以通过IOT(物联网)技术将热计量数据和用户室内温度上传到SCADA系统或上一级调度系统(能管系统);天气预报和实时天气预报数据考虑到网络安全因素可以通过购买专业地区气象台数据通过接口上传到调度系统(能管系统);或在SCADA系统中增加室外环境温度、风力、湿度和照度采集测点实现气象实时数据的采集;同时,其次日天气预报数据可人为的手工录入系统。1.1.2采集频率数据采集频率的设定,一般考虑如下三个方面的因素;一是SCADA系统的数据处理能力的限制,目前,大多数系统都可以实现秒级的数据采集和处理。二是受到数据上传链路带宽和性能的限制,一般情况是,基于无线VPDN的数据传输,其数据传输时间为不大于5分钟,且其控制数据下行为即时策略,采集上行为固定时间间隔。而对于专线(光纤专线)上传的数据频率一般为5秒级;三是IOT(物联网)数据,包括用户室内温度和热计量数据,由于受到其网络带宽和无源(电池供电)限制,其传输频率一般设置在10分钟到30分钟。天气预报一般以小时为最小采集单位。1.1.3数据质量数据采集质量的控制,关系到整个系统能否正常使用,确保数据质量应满足如下三点;第一:数据采集测点的稳定性和采集精度的控制,其中,流量和热负荷的采集设备,其采集设备的选型十分重要,在热力站建设和系统改造时要给与足够的重视。第二:设备采集精度的控制,一般情况下,标准的数据采集设备0.2级精度是可以满足要求的,但在室内温度测量方面,由于其有效可用测量范围(大于15度小于28度之间),要求注意控制其采集精度和采集环境的控制,必要时可对室内温度采集设备增加偏移量补偿调整。第三:对于天气预报等数据,要求数据传输接口的稳定性,必要情况下,可以通过冗余方法提供两个天气预报数据源。1.2.数据存储实现模式识别机器学习算法对各供热参数进行数据集合计算,数据存储方法是系统进行集合计算的保证。合理有效的数据存储方式关系到整个系统能否正常的使用。目前,有如下三种存储方法。1....