国产精品不卡在线,精品国产_亚洲人成在线高清,色亚洲一区,91激情网

  • 頭條內(nèi)蒙古工業(yè)大學(xué)的研究人員提出風(fēng)電機(jī)組異常數(shù)據(jù)的在線清洗方法
    2021-11-21 作者:馬然 栗文義 齊詠生  |  來源:《電工技術(shù)學(xué)報(bào)》  |  點(diǎn)擊率:
    分享到:
    導(dǎo)語風(fēng)電機(jī)組數(shù)據(jù)采集與監(jiān)視控制系統(tǒng)運(yùn)行數(shù)據(jù)中含有大量異常數(shù)據(jù),對(duì)風(fēng)電機(jī)組健康狀態(tài)預(yù)測(cè)影響嚴(yán)重。為此,針對(duì)風(fēng)電機(jī)組健康狀態(tài)預(yù)測(cè)中對(duì)異常數(shù)據(jù)進(jìn)行在線清洗的實(shí)際需求,內(nèi)蒙古工業(yè)大學(xué)的研究人員馬然、栗文義、齊詠生,在2021年第10期《電工技術(shù)學(xué)報(bào)》上撰文,提出一種異常數(shù)據(jù)在線清洗方法。分析表明該方法能準(zhǔn)確并實(shí)時(shí)地識(shí)別各類異常數(shù)據(jù),有效提升風(fēng)電機(jī)組健康狀態(tài)預(yù)測(cè)的性能。

    準(zhǔn)確可信的數(shù)據(jù)采集與監(jiān)視控制系統(tǒng)(Super- visory Control And Data Acquisition, SCADA)運(yùn)行數(shù)據(jù)是風(fēng)電機(jī)組發(fā)電性能預(yù)測(cè)、故障預(yù)測(cè)與健康管理等工作的基礎(chǔ)。然而,由于機(jī)組運(yùn)行環(huán)境惡劣,很多現(xiàn)場(chǎng)采集的數(shù)據(jù)質(zhì)量較差,特別是因棄風(fēng)限電、工況波動(dòng)等原因?qū)е碌臄?shù)據(jù)異常問題尤為突出。高比例異常數(shù)據(jù)對(duì)運(yùn)行數(shù)據(jù)的真實(shí)規(guī)律、特征參量的相關(guān)性關(guān)系等信息的挖掘與應(yīng)用影響極大,因此風(fēng)電機(jī)組數(shù)據(jù)清洗工作至關(guān)重要。

    風(fēng)電機(jī)組數(shù)據(jù)清洗方法主要從特征空間的距離、概率和密度等角度界定異常值。但是目前的研究多以風(fēng)功率數(shù)據(jù)為清洗對(duì)象,主要研究機(jī)組發(fā)電性能預(yù)測(cè),而數(shù)據(jù)清洗方法在機(jī)組健康狀態(tài)預(yù)測(cè)中的應(yīng)用研究目前仍較少。

    在風(fēng)電機(jī)組整機(jī)性能預(yù)測(cè)與健康狀態(tài)評(píng)估的應(yīng)用中,有關(guān)研究指出,模型分析法如神經(jīng)網(wǎng)絡(luò)更適合于異常檢測(cè),而高斯混合模型、主成分分析及其改進(jìn)算法等概率統(tǒng)計(jì)方法對(duì)機(jī)組性能退化的預(yù)測(cè)適應(yīng)性更好。

    然而,概率統(tǒng)計(jì)方法對(duì)數(shù)據(jù)質(zhì)量要求較高,數(shù)據(jù)清洗的應(yīng)用方向不同時(shí),清洗對(duì)象、需要清洗的異常數(shù)據(jù)以及清洗方法均會(huì)有所差別,因此有必要對(duì)風(fēng)電機(jī)組健康狀態(tài)預(yù)測(cè)中的異常數(shù)據(jù)清洗工作進(jìn)行針對(duì)性研究。

    首先,選擇運(yùn)行數(shù)據(jù)中可反映機(jī)組性能退化的關(guān)鍵特征參量構(gòu)成清洗對(duì)象,如風(fēng)速-功率、轉(zhuǎn)速-功率數(shù)據(jù),而軸溫、油溫等參量作為機(jī)組健康狀態(tài)預(yù)測(cè)與故障檢測(cè)的重要特征依據(jù),剔除其中的異常點(diǎn)反而可能造成故障信息丟失,不能輕易清洗。其次,確定待清洗的異常數(shù)據(jù),包括堆積點(diǎn)與離群點(diǎn)。

    離群點(diǎn)可能反映了工況變化,在基于模型分析法預(yù)測(cè)發(fā)電性能或故障時(shí)可以不清洗,但離群點(diǎn)分散性較大,對(duì)其進(jìn)行合理清洗將有利于基于概率統(tǒng)計(jì)方法預(yù)測(cè)機(jī)組的健康狀態(tài)。

    此外,不同機(jī)組的運(yùn)行數(shù)據(jù)存在采樣周期不同、概率分布特征呈差異化等特點(diǎn),隨著機(jī)組性能的逐漸退化,數(shù)據(jù)分布特征更趨復(fù)雜,這些都對(duì)數(shù)據(jù)清洗方法的通用性、精度、運(yùn)算效率、穩(wěn)定性以及工程適用性提出了較高要求。因此,有必要針對(duì)風(fēng)電機(jī)組健康狀態(tài)預(yù)測(cè)深入研究運(yùn)行數(shù)據(jù)關(guān)鍵特征參量的選擇,以及堆積點(diǎn)和離群點(diǎn)的在線清洗方法。

    目前,可用于解決運(yùn)行數(shù)據(jù)特征參量選擇的方法有Relief、互信息、隨機(jī)森林與鄰域粗糙集 等。其中,Relief和互信息基于相關(guān)性度量,屬于過濾法,具有快速高效、獨(dú)立于預(yù)測(cè)模型的優(yōu)點(diǎn),但Relief為有監(jiān)督法,而SCADA數(shù)據(jù)往往沒有分類標(biāo)簽;隨機(jī)森林屬于封裝法,可與鄰域粗糙集應(yīng)用于負(fù)荷預(yù)測(cè)或故障識(shí)別中對(duì)特征集的尋優(yōu)與約簡(jiǎn)。

    因此,基于互信息選擇與機(jī)組運(yùn)行狀態(tài)相關(guān)性強(qiáng)的關(guān)鍵特征參量有利于簡(jiǎn)單、快速地確定清洗對(duì)象,并利用Copula函數(shù)無需假設(shè)數(shù)據(jù)的分布形態(tài)即可描述其實(shí)際分布規(guī)律的特點(diǎn),解決互信息計(jì)算中聯(lián)合概率密度函數(shù)估計(jì)難的問題。

    為保證數(shù)據(jù)清洗方法的識(shí)別精度與運(yùn)算效率,聯(lián)合考慮關(guān)鍵特征參量的概率分布、時(shí)序特征與密度分布:利用單一Copula建立風(fēng)速-功率、轉(zhuǎn)速-功率等多元特征參量的置信等效功率區(qū)間,解決傳統(tǒng)概率統(tǒng)計(jì)方法在樣本分布不均、異常值較多時(shí)識(shí)別精度低的問題,同時(shí)避免采用混合Copula,確保算法的運(yùn)算效率;僅考慮置信邊界外的可疑數(shù)據(jù),結(jié)合其時(shí)序特征和密度分布依次清洗堆積點(diǎn)與離群點(diǎn),解決DBSCAN算法無法在線清洗[10-11]的問題;進(jìn)一步基于Copula模擬實(shí)際異常數(shù)據(jù),解決數(shù)據(jù)清洗模型定量分析的問題。

    基于上述研究背景,內(nèi)蒙古工業(yè)大學(xué)的研究人員針對(duì)風(fēng)電機(jī)組健康狀態(tài)預(yù)測(cè)中異常數(shù)據(jù)的在線清洗進(jìn)行研究。分析風(fēng)電機(jī)組性能退化過程中的數(shù)據(jù)特征,在此基礎(chǔ)上,提出基于經(jīng)驗(yàn)Copula-互信息(Empirical Copula-based Mutual Information, ECMI)法選擇關(guān)鍵特征參量,并基于Copula結(jié)合異常值的時(shí)序特征與密度分布建立數(shù)據(jù)清洗模型(Copula-based data cleaning model combining Time-series Features and Density Distribution, Copula-TFDD),對(duì)堆積點(diǎn)和離群點(diǎn)等典型異常數(shù)據(jù)進(jìn)行在線識(shí)別。

    內(nèi)蒙古工業(yè)大學(xué)的研究人員提出風(fēng)電機(jī)組異常數(shù)據(jù)的在線清洗方法

    圖1 Copula-TFDD數(shù)據(jù)清洗模型流程

    科研人員通過研究得出如下結(jié)論:

    1)提出基于ECMI的特征參量選擇方法。選擇反映風(fēng)電機(jī)組整機(jī)性能的關(guān)鍵特征參量構(gòu)成清洗對(duì)象,對(duì)實(shí)測(cè)風(fēng)速-功率、轉(zhuǎn)速-功率數(shù)據(jù)中的堆積點(diǎn)和離群點(diǎn)等典型異常數(shù)據(jù)進(jìn)行清洗。

    2)基于風(fēng)電機(jī)組實(shí)測(cè)運(yùn)行數(shù)據(jù)的概率分布、時(shí)序特征與密度分布提出Copula-TFDD數(shù)據(jù)清洗模型。該方法可以對(duì)具有不同采樣周期和差異化概率分布的運(yùn)行數(shù)據(jù)實(shí)現(xiàn)在線清洗,且能有效提升機(jī)組健康狀態(tài)預(yù)測(cè)的性能。

    3)基于Copula給出了人工模擬符合實(shí)際異常數(shù)據(jù)分布特征的數(shù)據(jù)集的方法。通過對(duì)Copula- TFDD的精度、運(yùn)算效率和穩(wěn)定性的定量分析,驗(yàn)證了該數(shù)據(jù)清洗方法的工程應(yīng)用性較強(qiáng)。

    本文編自2021年第10期《電工技術(shù)學(xué)報(bào)》,論文標(biāo)題為“風(fēng)電機(jī)組健康狀態(tài)預(yù)測(cè)中異常數(shù)據(jù)在線清洗”,作者為馬然、栗文義、齊詠生。