用電信息采集系統(tǒng)、自動化技術(shù)等在配電網(wǎng)的應(yīng)用,為智能配電網(wǎng)運用大數(shù)據(jù)技術(shù)解決各種問題提供了路徑。但是在電力數(shù)據(jù)的采集、傳輸及存儲過程中常常會出現(xiàn)數(shù)據(jù)缺失、數(shù)據(jù)異常等質(zhì)量問題,這些異常數(shù)據(jù)的存在使配電網(wǎng)的運行、調(diào)度、分析實驗等工作受到潛在的影響。因此,如何對這些數(shù)據(jù)進行修復(fù)成為當(dāng)前研究的一個重要熱點問題。
事實上,針對缺失數(shù)據(jù)的處理技術(shù)廣泛存在于各行各業(yè)之中,缺失數(shù)據(jù)處理工作隨著各個領(lǐng)域特征的不同,以及數(shù)據(jù)應(yīng)用目的的不同可采用多種方法。實際處理時,往往根據(jù)缺失數(shù)據(jù)的特征屬性、數(shù)據(jù)處理需要達到的目的、數(shù)據(jù)缺失的具體原因等選擇最佳的處理方法以求達到最好的效果。
配電網(wǎng)負(fù)荷數(shù)據(jù)往往存在時空特征明顯、數(shù)據(jù)的規(guī)律性較強、數(shù)據(jù)在電力系統(tǒng)規(guī)劃、調(diào)度、運行等各個環(huán)節(jié)的應(yīng)用面較廣等特征,所以需要對缺失的數(shù)據(jù)進行較為精準(zhǔn)的填充和修補。
針對配電網(wǎng)負(fù)荷數(shù)據(jù)具有時間規(guī)律的特點,對缺失數(shù)據(jù)的填充修補主要分為三種類型:
①采用構(gòu)造映射的方法,根據(jù)數(shù)據(jù)規(guī)律的相似性,構(gòu)造已有數(shù)據(jù)對缺失數(shù)據(jù)的映射進行修補;
②采用多重填補的方法,通過構(gòu)造或者模擬影響其變動規(guī)律的相關(guān)因素的運動軌跡,推斷出缺失數(shù)據(jù)的可能范圍,再進一步通過統(tǒng)計、綜合分析等方法從中優(yōu)選最匹配結(jié)果;
③采用機器學(xué)習(xí)的方法,在海量數(shù)據(jù)集中進行數(shù)據(jù)集的聚類分析,通過去噪、壓縮感知等方法匹配與缺失數(shù)據(jù)所屬數(shù)據(jù)集最為接近的特征,從而完成對缺失數(shù)據(jù)的填補。
在配電網(wǎng)負(fù)荷數(shù)據(jù)有較多積累的現(xiàn)狀下,采用聚類分析,并按照特征匹配的方法填補缺失數(shù)據(jù)已成為針對具有時間特性規(guī)律數(shù)據(jù)的一種廣泛而有效的方法。針對電力負(fù)荷數(shù)據(jù),主要采用的聚類方法包括最近鄰加權(quán)聚類、K均值聚類、熵權(quán)聚類等多種分析方法,這些方法的基本思想均為先將數(shù)據(jù)對象聚類,劃分成多個簇,根據(jù)簇內(nèi)相似對象對缺失數(shù)據(jù)進行修補。
其中,基于密度的含噪聲應(yīng)用空間聚類(density-based spatial clustering of applications with noise, DBSCAN)方法對數(shù)據(jù)集的分布不敏感,抗噪性好,且對于數(shù)據(jù)集的識別能力較強,針對空間分布較為廣泛的配電網(wǎng)負(fù)荷數(shù)據(jù)聚類具有較好的適應(yīng)性,但該方法在處理大量龐雜數(shù)據(jù)時的計算速度還有待進一步提高。
基于上述背景,內(nèi)蒙古電力經(jīng)濟研究院的研究人員依據(jù)配電網(wǎng)負(fù)荷數(shù)據(jù)的時序特性,提出一種改進的DBSCAN二次聚類方法對配電網(wǎng)負(fù)荷缺失數(shù)據(jù)進行修補。
圖1 數(shù)據(jù)修補算法流程
首先依據(jù)負(fù)荷數(shù)據(jù)長周期特征的關(guān)鍵指標(biāo),提取每一個數(shù)據(jù)記錄的關(guān)鍵信息,針對縮減的數(shù)據(jù)集進行初步聚類,然后在初步聚類的基礎(chǔ)上針對完整數(shù)據(jù)再次進行DBSCAN空間密度二次聚類,以利于縮短由于龐大數(shù)據(jù)集而延長的聚類時間。其次通過負(fù)荷數(shù)據(jù)的數(shù)值屬性相似度和記錄值相似度比較,以相似度最大為原則、以同類數(shù)據(jù)屬性相同為原則修復(fù)缺失的負(fù)荷數(shù)據(jù)。最后將仿真結(jié)果與實測數(shù)據(jù)進行對比,驗證所提方法對配電網(wǎng)負(fù)荷數(shù)據(jù)修復(fù)的有效性和準(zhǔn)確性。
圖2 本方法對缺失負(fù)荷曲線的修補結(jié)果
研究人員最后得出如下結(jié)論:
1)在針對配電網(wǎng)負(fù)荷數(shù)據(jù)進行缺失數(shù)據(jù)修補時,DBSCAN二次聚類算法可以較好地依據(jù)負(fù)荷特性對負(fù)荷數(shù)據(jù)進行修補,且修補效果較好。
2)改進的DBSCAN二次聚類算法,通過首先按照長時間周期特征對數(shù)據(jù)進行初步聚類形成子集,再在每一個子集內(nèi)按照短時間周期二次聚類的方法,有效提高了聚類算法的計算速度。
3)算例分析結(jié)果表明,DBSCAN二次聚類算法進行數(shù)據(jù)修補有更高的準(zhǔn)確度,且針對連續(xù)性數(shù)據(jù)缺失也能取得較好的修補效果。
后續(xù)研究還需要重點結(jié)合兩方面問題進行考慮:一是兩次DBSCAN聚類中,參數(shù)Eps和MinPts大小的適度配合,尤其是面向更大量數(shù)據(jù)的時候,兩者的相互配合直接關(guān)系到計算速度的提升幅度;二是負(fù)荷記錄綜合相似度包含多種負(fù)荷屬性特征,針對不同類型的數(shù)據(jù)修補問題,各權(quán)重大小如何取值才能取得更好的數(shù)據(jù)修補效果。
本文編自2021年第12期《電氣技術(shù)》,論文標(biāo)題為“基于DBSCAN二次聚類的配電網(wǎng)負(fù)荷缺失數(shù)據(jù)修補”,作者為蔡文斌、程曉磊 等。