(国网浙江永康市供电有限公司 浙江永康 321300)
摘要:在同期线损治理工作中,对某条10KV配网问题线路进行排查时,若人工对该线路的用户、台区的电量进行跟踪、统计、分析,需要付出大量的精力和时间。传统人工统计分析的方法工作效率较低,急需开发新的数据分析方法提升工作效率。
关键词:电力数据;Python;R语言
本次数据源于用电信息采集系统,以A线为例,从数据系统中采集该线路用户、台区的电量,为保证数据的连续性和准确性,连续采集A线30天的数据(2020年1月1日至2020年1月30日,详见图一)。
图一 A线电量数据
本次数据分析使用python、R语言作为工具,主要具有以下3个功能:
一、分析出表计、终端故障的用户、台区
表计、终端故障的用户、台区连续几天采集得到的数据往往具有一定突变特性(分析工具中突变阈值设定为0.5)。譬如某专变正常情况下日均用电量约100度,终端故障时采集得到的当日电量可能为0电量,次日电量可能为200度,此类情况是由电量采集数据推送延迟造成的。
二、分析出可能存在偷电、漏电情况的用户、台区
通过统计A线所有用户、台区的长期日用电量(分析工具中取2020年1月1日至2020年1月30日电量数据),计算得到每个用户、台区的日均用电量(基准参考值)。分析工具对A线所有用户、台区的某日用电量与其参考值做对比(阈值设定为±25%,可依据实际请款更改),导出超出阈值的用户、台区列为疑似排查对象。
该部分功能分析工具代码如下:
#导入数据
data<-read.table(file=" Electric_Data.txt",header=T)
data
#求周期内的均值
average<-apply(data[,c(5:34)],1,mean)
average
data1<-data.frame(data,average)
data1
#平均值与参照值的差值占均值的比重
dif<-abs(data1$average-data1$x0)/data1$average
dif
data2<-data.frame(data1,dif)
data2
#筛选所有的NA,并删除NA行
na<-data2[is.na(data2$dif),]
data3<-data2[-4,]
#筛选出差值百分比大于等于0.25的用户
abnormal<-data3[data3$dif>=0.25,]
abnormal
#NA行添加回异常用户数据框
abnormal_new<-rbind(na,abnormal)
abnormal_new
三、分析出该线路用户、台区的稳定性
此项功能是本分析工具的一项辅助功能,在实现前两项功能的前提下:标记超出阈值的天数和用户、台区,导出在统计时间段内所有用户、台区在阈值内天数的百分比(即稳定性),并计算出所有用户、台区所统计数据的方差作佐证。
该部分功能分析工具代码如下:
#异常用户30天与平均值的差值占均值的比重
for(i in 5:34){
abnormal_new[,i+32]<-abs(abnormal_new[,i]-abnormal_new$average)/abnormal_new$average
}
abnormal_new
#统计异常用户中30天与平均值的差值占均值的比重大于0.25的天数个数
day<-rowSums(abnormal_new[,c(37:66)]>=0.25)
day
per<-day/30
per
abnormal_new1<-data.frame(abnormal_new,day,per)
abnormal_new1
#求周期内的方差
variance<-apply(abnormal_new1[,c(5:34)],1,var)
variance
abnormal_new2<-data.frame(abnormal_new1,variance)
abnormal_new2
#输出结果
setwd("F:\\")
write.table(abnormal_new2," Electric_Data.csv",sep=",")
运用分析工具对A线数据分析得到疑似异常用户如图二所示。该数据分析工具可为工作人员迅速找出疑似异常用户,节省人力成本,从而明显提高线损治理工作效率。
图二 A线疑似异常用户
参考文献:
【1】牛聪. 基于实时数据的电力大客户线损计算与决策分析管理[D].
【2】何明跃, 郭勇. 电力综合线损分析系统的架构及实现方法探析[J]. 中国包装科技博览, 2012, 000(008):140-141.