企业新闻
沈宇科技 > 企业新闻 > 当前位置
监控系统数据采集与预处理

    本研究所描述的预测方法的主要目的是分析收集摄像头干扰器的报警信号的历史数据。将历史信号作为分类数据的属性,将预测内容置于分类类别中。所有的分析方法都基于Spark大数据平台提供的分类算法。预测方法在图1中示意性地示出,并且包括两部分。第一部分利用决策树算法对变电站的故障类型进行预测。本部分将两种方法应用于实际案例。通过比较决策树算法和朴素贝叶斯算法的结果,得出决策树算法更适合于故障类型预测的结论。第二部分利用灰色系统理论对故障发生时间进行预测。然后将这两部分结合起来构造一种新的监控干扰器故障预测方法。具体步骤如下。
 
第一步。对采集到摄像头屏蔽器的报警信号数据进行预处理。收集到的数据根据站点和数据属性进行分类。随后,根据某个子序列的长度将数据划分为若干个子序列。报警信号类型的数据必须由哈希表替换,以将文本数据转换为双类型数据,然后可用于Spark平台。时间数据需要累加运算来产生时间差数据,并将白系统转换为灰色系统。
第二步。使用保留法来评估算法的性能。将预处理后的数据按0.6:0.4的比例随机分成两部分,其中一部分称为训练分类模型的训练数据集,另一部分称为训练模型的测试数据集。
第三步。将训练数据集输入算法,训练决策树的分类模型和灰色模型。
第四步。将测试数据集输入到训练好的算法模型中进行测试。这个过程称为工作会议。
 
将测试数据输入分类模型,得到预测的分类类别。如果该类别与数据中的真实类别相同,则结果是准确的;否则,结果不准确。随后,将监控干扰器测试数据量除以准确类别数,得到预测精度。

5案例研究
数据采集与预处理
本研究于2016年在中国西南某地区采集了17675630条断层信息。每条数据包含43种类型的信息,包括发生时间、报警信息、设备ID、变压器名称和变压器电压等级。本研究讨论了发生时间和报警信息。报警信息包括六个不同的元素,即通知、超控、异常、事故、偏转和其他。通知表示设备正常运行,其余五类表示变压器故障。因此,如果能准确地预测摄像头干扰器信号类型及其发生时间,就可以预测变压器的故障及其发生时间。发生时间包括每天24小时,即从上午00:00到晚上11:00;每小时是一种数据类型,共有24种数据类型