摘要:大数据思维能力是目前社会最新、最流行的一种研究方法,也是数据经济思维能力的重要组成部分之一。而水务企业中的老水厂则存在设备陈旧,结构复杂等诸多问题,本课题将两者相结合,利用老水厂现有的数据记录进行全面的相关性分析,从而找出与单位电耗组最相关的关联物数据组,对单位电耗的可能趋势进行预测分析,实现节能降耗的目的。

关键词:数据经济思维能力,节能降耗,自来水厂,数据分析

引言

大数据思维能力是目前社会上最新、最流行的一种研究方法,也是数据经济思维能力的重要组成部分之一。根据维克托•迈尔-舍恩伯格在《大数据时代》一书中的理论。大数据思维能力有三个特征,

第一条,数据处理不再是随即样本而是全体数据;

第二条,数据不再最求精确性而是具有纷繁混杂性;

第三条,分析事物不再最求因果关系,更重要的是相关关系。

分析事物不再追求“为什么”,而是“是什么”。分析过程不确定具体目标,因为分析结果往往是人难以预料的。而大数据的核心则是利用关联物进行趋势可能性的预测。

根据其理论,计算机技术只是大数据思维能力的一种工具,其方法可以应用于各行各业。因此,它具有应用于水务行业的可能性。本课题组试图将其引入一家老水厂,以期产生新的价值。

以王阳明水厂为例,该水厂建于上个世纪五六十年代,原水取自30公里以外的地表水,中途还具有取水、中间提升两个泵站。

由于它是逐年改造提升,原水管线也是分阶段延长改造,该厂整个供水系统存在设备设施陈旧,结构复杂,问题关联性强等情况,所以局部的提升改造难以实施。

将新方法引用于老水厂,在不变动老水厂任何设施设备的基础上挖掘出新的价值,从而降低老水厂整体运营成本是本课题组要解决的问题。

准备阶段

根据大数据思维能力的理论,在对数据进行全面分析之前是没有明确的课题目标的,只有一个降低运营成本或提升效率的大致方向。

在最佳状态下,一个具备计算机自动控制系统的水厂具备15分钟每次以上频率记录数据的能力,这样的高频数据进行分析是最理想的。但是该水厂老旧,所有的运行全靠人工手动并无计算机自动控制和数据记录,因此数据只有从人工报表上获取。而且所获取的最高数据频率是日数据。

最后我们根据现实情况,取得了2013年度1-10月份时间、日供水量、单位矾耗、单位电耗、日均浊度等五组所有日数据。

根据常规的数据分析思维,我们将对此进行数据抽样分析。但是根据大数据思维能力,我们决定将运用我们所能获取的所有数据。

常规的数据分析软件有Excel、SAS、SPSS等。经过对功能成本以及运算能力等的综合考虑我们选用了IBM SPSS 软件进行数据分析。

数据分析的前提是要让计算机认出读懂这些数据。我们的原始数据往往散落于各种花里胡俏的报表之中,这些好看却又不实用的形式让计算机难以适应。

对于分析系统来说,简单的二维表形式是最理想的。因此,课题组采用人工转录的方式,将分散于各种报表中的数字以二维表的形式录入Excel中,再汇集导入IBM SPSS软件中。

数据分析

我们对以上五组数据用CORRELATIONS语句进行相关性分析,得到表1矩阵图

对变量间的相关性进行分析得出,日供水量和单位电耗数据组之间的相关性系数为0.687,两者间的相关性最大。因此我们选择这两组数据进行重点研究,准备找出两者间的具体关系。

我们再对这两组数据组进行进一步的曲线相似度分析,基本的思路是用各种曲线函数对其进行近似度匹配,得出结果如图1所示,其三次函数与其近似度最相匹配。

从该图中可以发现,该厂的单位电耗和日供水量有着显著相关性,也就是说单位电耗随着日供水量的变化而变化。根据大数据思维能力的理论,日供水量是单位电耗的关联物。

通过分析关联物可以发现,当日供水量处于15万吨左右时,整个供水系统的单位电耗处于最低状态,低于或高于这个值,单位电耗都将提升。

因此,在理想状态下,日供水量逼近15万吨,也就意味着整个系统能耗最低。

根据大数据思维能力的理论,相关关系分析通常情况下能取代因果关系起作用,即使不可取代的情况下,它也能指导因果关系起作用。

是什么原因导致这个现场的出现,问题可能出在原水输水管线,取水、提升泵站的机泵上。

但是在现实情况下,我们无具备条件去更换机泵或是原水管线,也没有必要在这些问题上继续专研,因为我们发现可以从水量调度入手来实现节能降耗的目的。

结束语

课题组将13年的分析成果提交给调度中心请其协助测试。结果在14年的实际运行过程中在考虑应急突发事件因素下,全年单位电耗比上一年度下降了2%。在某些应急突发因素影响较少的月份甚至可以下降至8%。效果十分明显。

由此可见,将大数据思维能力引入水务行业是十分有意义的。特别是那些具有高频大量数据的水厂和部门,所发挥的作用将会出乎我们的意料。

图1

发表评论

您的电子邮箱地址不会被公开。