配电网信息物理系统恶性数据链检测与识别

论文作者:匿名 论文来源:https://www.bgsywzz.cn/ 发布时间:2021/04/10

  摘要:由于恶性数据链干扰配电网的信息输出和转发控制能力,因此需检测配电网信息物理系统中的恶性数据链。根据恶性数据时间序列节点融合恶性数据链能量特征,并构建其高维映射结构,通过高维映射结构拟合恶性数据,获取恶性数据链。采用谱特征提取方法建立恶性数据链谱特征量模型,实现配电网信息物理系统恶性数据链的分类检测。仿真结果表明,采用该方法进行配电网信息物理系统恶性数据链检测的自适应性较好,分辨能力较强,在配电网信息物理系统恶性数据链检测识别中具有很好的应用价值。


  关键词:配电网;信息物理系统;恶性数据链;检测


  中图分类号:TM64文献标识码:A


  配電网是由物理网络、信息设备和计算单元模块共同组成的一种信息物理系统,其具有运行方式多样、兼容性大等优点,但在配电网信息物理系统进行配电过程中,受到配电网信息物理系统使用环境以及设备技术指标参量的影响,导致配电网信息物理系统中产生恶性数据[1]。而配电网信息物理系统的恶性数据主要是指用户的不正常扣费信息、恶意攻击数据以及个人资料泄露等内容。恶性数据的存在,不仅为阻碍配电网系统运行效率,还对电力用户造成经济损失。为此,需在该系统中增添恶性数据检测的设备,实现系统的多级控制,进行信息流的准确识别与发送。但该做法会使系统结构更复杂,且开销较大,导致配电网信息物理系统的运行产生不确定性,因此,为提高配电网的信息输出和转发控制能力,研究配电网信息物理系统恶性数据链检测方法,在配电网的优化设计中具重要意义[2,3],目前在配电网信息物理系统理论分析领域,国内外已经取得一些初步的研究成果。


  文献[4]中提出一种基于改进混沌分区算法的配电网信息物理系统恶性数据链快速提取方法,利用混沌分区算法进行配电网信息物理系统恶性数据链检测,但该方法进行配电网信息物理系统恶性数据链检测的自适应性差,计算开销较大。文献[5]中提出基于分布式大数据融合的配电网信息物理系统恶性数据链检测识别方法,采用多层次的配电网信息物理系统恶性数据链传感器分布式阵列采集方法,进行配电网信息物理系统恶性数据链检测,但该方法的抗干扰性差,但该方法进行配电网信息物理系统恶性数据链检测的收敛性差。


  针对上述问题,提出了配电网信息物理系统恶性数据链快速提取算法。算法具体内容如下:


  (1)考虑恶性数据的周期性,计算该数据的时间序列节点距离,获取其高维映射结构,为恶性数据检测的准确率提供限制环境,增强检测准确率;


  (2)通过恶性数据的多重共线性特征线性拟合,得到恶性数据链;


  (3)计算恶性数据的平均互信息量,构建谱特征量提取模型,为恶性数据的识别提供可能性;


  (4)计算合并簇中恶性数据链的负载量,据此进行恶性数据链特征模糊聚类,将特征相似数据融合为一体,节省数据检测的时间开销;


  (5)检测算法可行性及有效性。


  经仿真实验分析,本方法在配电网信息物理系统恶性数据链的检测和识别能力上,具有优越性能。


  1配电网信息物理系统恶性数据链采集和


  统计分析模型


  为提升恶性数据检测的实用性,所研究配电网适用环境为多用户小区,考察电压控制、有功出力控制与功率因数调节应用场景中产生的恶性数据,而数据内容包含电网进行上述场景操作过程中产生的用户的不正常扣费信息、恶意攻击信息以及个人资料泄露的信息等。为检测与识别配电网信息物理系統恶性数据链,首先需要采集系统中的恶性数据,根据恶性数据的时间序列节点距离构建高维映射结构,并通过映射结构进行恶性数据的拟合,最终获取恶性数据链。


  1.1恶性数据的高维映射结构


  为实现配电网信息物理系统恶性数据链检测与识别,采集配电网信息物理系统恶性数据,其中在配电网进行电压控制、有功出力控制与功率因数调节时所产生的恶性数据从结构上可分为周期性结构和非周期性结构[6],并构建配电网信息物理系统恶性数据传感网络模型。首先假设传感网络模型中恶性数据特征的分布时间序列为{Mn},n=1,2,…,N,分布时间序列中每个簇有一个簇头节点(SN)和若干簇内节点(V0),通过欧氏距离公式进行恶性数据时间序列节点之间的距离求解,计算公式如下:


  d(i,j)=(xi-xj)2+(yi-yj)2(1)


  其中,xi,yi,xjyj分别表示配电网信息物理系统中恶性数据时间序列节点i与节点j的横坐标与纵坐标,d(i,j)表示两节点之间的欧氏距离。


  根据恶性数据时间序列节点距离,结合大数据融合方法,进行恶性数据能量特征的相似度融合[7],得到融合结果为:


  E(L)=LEi(2)


  其中,Ei表示恶性数据节点(中间节点)i的负载量;L为恶性数据特征的传输链路集。其中配电网信息物理系统中的传输负载信息发送给i节点的负载量为:


  C(nj)=Eilδ+E(L)(3)


  式中,E(L)为相似度融合结果,δ为负载比值,l为传输链个数。根据负载量融合结果,挖掘配电网信息物理系统恶性数据的属性分区特征,采用多模融合方法在配电网信息物理系统中实现恶性数据采集。根据采集到的恶性数据进行数据特征量的频谱偏移特性提取,对提取的谱特征量采用机器学习算法进行配电网信息物理系统恶性数据谱特征匹配,结合大数据输出时间延迟,得到配电网信息物理系统恶性数据信息重组的特征空间,其表达式为:


  Xn={Xn,Xn-τ,Xn-2τ,…,Xn-(d-1)τ}(4)


  在信息重组的特征空间中挖掘配电网信息物理系统恶性数据的平均互信息量,得到互信息分布集合为:


  Ri={R1,R2,R3,…,Rd}(5)


  式中,Rd表示互信息分布的d个信息量。采用并行挖掘方法,挖掘配电网信息物理系统恶性数据特征的关联规则[8],对互信息分布矩阵进行酉分解,得到特征分解的向量集为:


  Tr={X1,X2,…,Xm}(6)


  式中,Xm表示信息重组的特征空间的m个向量。采用奇异值特征分布式融合方法对配电网信息物理系统恶性数据进行高维映射,得到在高维映射空间内的配电网信息物理系统恶性数据的数据结构模型,该模型可用二维矩阵模型描述:


  V=C(nj)∑T∑(RTiRi)(7)


  式中,T表示恶性数据处理时间。通过式(8)得到配电网信息物理系统恶性数据的高维映射结构,在该结构上可进行数据的统计分析。


  1.2恶性数据的线性拟合


  基于配电网信息物理系统恶性数据的高维映射结构,对恶性数据的尺度和时延等参量进行自适应学习和智能检测,实现配电网信息物理系统恶性数据的谱峰搜索[9]。其中,配电网信息物理系统恶性数据的尺度参量为:


  Si=Lεfsd2V(8)


  式中,εfs代表恶性数据特征参数;d代表时延参数。恶性数据的时延参量集合为:


  di={Xd+1,Xd+2,…Xd+m}(9)


  式中,Xd+m为在m序列中的时延参数集合,采用关联规则挖掘方法进行配电网信息物理系统恶性数据的结构重组,恶性数据的时延参量满足类间平衡性,由此构建配电网信息物理系统恶性数据序列分析模型[10]。采用相关性的特征数据挖掘方法,进行检验统计分析,并对配电网信息物理系统恶性数据进行聚类处理。配电网信息物理系统恶性数据分布式传感器存储介质中,输出负载w的均衡调度模型为:


  ηwkω=diTwkTk>w,k∈Rw,w∈W(10)


  其中,Twk代表恶性数据的快速提取的检验统计量。配电网信息物理系统恶性数据的快速提取的检验统计量Twk可以表示为:


  Twk=Emink∈RwΗwh,kηw=


  -1θln∑k∈wexpηwkω,w∈W,h∈H(11)


  式中,ηw表示线性拟合值,θ是检验调节参数,配电网信息物理系统恶性数据的多重共线性特征线性拟合需满足Twk<Ηwh,k,其中,配电网信息物理系统恶性数据的频谱峰值ξwkω可以表示为:


  Ηwh,k=minξPrTwk≤ξ≥ω=


  ETwk+γwkωk∈Rw,w∈W(12)


  式中,γwk表示最大峰值拟合值,ξ表示多重阈值。最后,对配电网信息物理系统恶性数据采用广义最小二乘法进行线性拟合[11],获取完整的恶性数据链,拟合过程为:


  ETx(L,d)=Lηwkω+Si,S>QSi,S≤Q(13)


  在数据拟合过程中,将配电网信息物理系统数据的特征空间区域分为S和Q,设配电网信息物理系统恶性数据的内生性谱特征量S的解向量由{s1,s2,…,sn}构成,那么配电网信息物理系统恶性数据的熵分布概率为Ps(si),i=1,2,…,n,Q由大数据模糊测试集的解向量{q1,q2,…,qn}构成,综上分析,完成恶性数据的拟合。通过对恶性数据的拟合,为配电网信息物理系统恶性数据链的检测奠定理论基础[12]。


  2恶性数据链检测与识别


  2.1恶性数据链谱特征量模型


  对获取到的恶性数据链采用谱特征提取方法分析配电网物理系统恶性数据链的样本分布特征,根据分布特征,进行恶性数据链检测。对应的配电网信息物理系统恶性数据链快速提取的检测概率为Pq(qj),j=1,2,…,n。在极限学习训练下,构建配电网信息物理系统恶性数据链特征重组模型:


  H(s)=-∑ni=1Ps(si)log2Pq(14)


  式中,Ps(si)表示配电网信息物理系统恶性数据链特征分布概念集si出现在仿射分区区域S的概率,类似地,Pq表示配电网信息物理系统恶性数据链特征的本体特征概念集。


  初始化簇中心到簇内点的数据链A,得到配电网信息物理系统恶性数据链的平均互信息量分别为:


  qw=∑k∈RwH(s)w,w∈W(15)


  构建配电网信息物理系统恶性数据链模型,对多载波配电网信息物理系统恶性数据链进行频谱分解,采用链路随机分配方法进行配电网信息物理系统恶性数据链输出传感序列的均衡控制,得到配电网信息物理系统恶性数据链特征分解子序列表示为:


  r2(n)=Aexp[j(qwT+θ),


  n=0,1,…,(N-3)/2(16)


  根据r1(n)和r2(n)进行(N-1)/2点离散变换,提取配电网信息物理系统恶性数据链的谱特征量,谱特征量提取模型为:


  Uk=∑ni=1Twi+r2(n)H(s)(17)


  式中,Twi表示数据链在不同输出负载时的提取时间,在此基础上,可根据提取的谱特征量进行恶性数据链的分类检测[13]。


  2.2配电网信息物理系统恶性数据链的分类检测


  根据谱特征体系结果,进行配电网信息物理系统恶性数据链检测,采用神经网络分析方法,进行配电网信息物理系统恶性数据链检测优化,得到合并簇中恶性数据链的负载量:


  R1(k)=r2(n)exp(-jω0Tp/2),


  k=0,1,…,(N-3)/2(18)


  R2(k)=Akexp(jφk),


  k=0,1,…,(N-3)/2(19)


  其中,ω0為配电网信息物理系统恶性数据链的负载预测误差,Tp为时间窗口,Ak为配电网信息物理系统恶性数据链的特征偏移幅值,φk为输出扩展相位。对配电网信息物理系统恶性数据链进行线性预测,根据全局寻优结果,得到数据块在各合并簇上最大长度,对配电网信息物理系统恶性数据链进行自适应盲分离处理,给定目标函数的解空间是从Rn到R,得到配电网信息物理系统恶性数据链集聚簇离群点U∈Rn,即根据上述建立的谱特征量提取模型在簇内点的数据链A中寻找一个点,采用自适应神经网络学习算法进行配电网信息物理系统恶性数据链特征模糊聚类,当数据聚类的判决阈值满足:


  0≤pk+1≤R2(k)-pk≤1(20)


  初始化N个数据聚类中心,采用模糊聚类分析方法,进行配电网信息物理系统恶性数据链特征聚类处理,快速提取配电网信息物理系统中的恶性数据链:


  minimize12‖w‖2+C∑ni=1ξisubjecttoyi-(w'Φ(xi)≤ε-ξiξi,≥0,i=1,2,…,n;C>0(21)


  式中,Φ(xi)表示恶性数据信息重组的特征空间函数,C表示判决阈值,ξi表示频谱集的峰值。至此,实现配电网信息物理系统恶性数据链快速提取。


  3仿真实验与结果分析


  为测试本方法在实现配电网信息物理系统恶性数据链智能检测中的性能,进行仿真实验。


  实验建立在Matlab7仿真工具基础上,采用Intel(R)Core(TM)2DuoCPU2.94GHz处理器,配电网信息物理系统恶性数据链分布的阵列为200*400,对配电网信息物理系统恶性数据链的采样带宽长度为12s。


  在Oracle电力系统信息库中选取大小为1024MB的任意电力信息数据169个,排除可用性较差的实验数据、特征点较弱的信息数据以及数据链特征点连贯性较差的信息数据,剩余100个初始样本数据,同时向其中加入大小为27MB的不正常扣费信息、恶意攻击数据以及个人资料泄露等恶性数据信息,对初始样本序列采样的周期长度为T=0.16s,配电网信息物理系统恶性数据链的基频频率为100kHz,根据上述仿真环境和参数设定,将本文算法应用至电网客户用电质量检测中,并以某小区的配电网使用情况为例,分析监测管理系统中恶性数据运行行为,进行配电网信息物理系统恶性数据链检测识别。首先分析该小区的原始配电网物理系统数据链的样本分布情况,分布情况如图1所示。


  分析图1可知,在配电网信息物理系统中,恶性数据链是由恶性初始数据和恶性终止数据组合而成,且呈集合状聚集在一起。以恶性数据链为研究样本,在云计算环境下,进行配电网信息物理系统恶性数据链快速提取,提取配电网信息物理系统恶性数据链的谱条纹特征,结果如图2所示。


  通过图2可知,采用本方法进行配电网信息物理系统恶性数据链快速提取,提取的数据链具有很高的分辨能力,提高了对配电网信息物理系统恶性数据链的准确检测和识别能力,得到配电网信息物理系统恶性数据链特征数据检测准确率,其中配电网信息物理系统恶性数据链检测与识别的准确率计算公式为:


  G(s)=sMTTD(F2e+86.35Fe+14230)(22)


  式中,s代表偏差变化率;Fe代表隶属度函数。


  根据式(22),在信息大小为25MB的范围内进行恶性数据链的挖掘,分别采用不同方法进行恶性数据链的挖掘准确率进行对比,对比结果如图3所示。


  分析图3结果得知,随着迭代次数的增大,对快速提取的准确性不断提升,采用本方法进行配电网信息物理系统恶性数据链检测的准确度达到100%,比传统方法的平均准确率分别提高14.6%和13.4%。测试不同数据规模下的数据快速提取的时间开销,得到对比结果见表1,分析表1结果得知,本方法进行配电网物理系统恶性数据链检测的时间开销较短,提高了数据监测识别的实时性。


  根据表1可知,在进行恶性数据链的检测与识别过程中,本方法的时间开销较少,很大程度上优化了恶性数据链的检测与识别的效率。


  4结论


  为提高配电网信息物理系统的故障诊断和分析能力,需对配电网信息物理系统的恶性数据链进行检测和识别,提出了配电网信息物理系统恶性数据链快速提取算法。采用并行挖掘方法,进行配电网信息物理系统恶性数据链特征的关联规则挖掘,并对配电网信息物理系统恶性数据链进行聚类处理。采用链路随机分配方法进行配电网信息物理系统恶性数据链输出传感序列的均衡控制,实现配电网信息物理系统恶性数据链快速提取。研究得知,本方法进行配电网信息物理系统恶性数据链检测识别的准确性较高,恶性数据链提取能力较好,时间开销较小。

相关推荐