• 
    <ul id="auswy"><sup id="auswy"></sup></ul>
  • <ul id="auswy"></ul>
    ABB
    關注中國自動化產業發展的先行者!
    CAIAC 2025
    2025工業安全大會
    OICT公益講堂
    當前位置:首頁 >> 案例 >> 案例首頁

    案例頻道

    流程工業中的數據挖掘建模與應用
    • 企業:控制網     領域:工控機     行業:建筑樓宇    
    • 點擊數:2450     發布時間:2007-09-26 10:17:37
    • 分享到:
    數據挖掘是應用一系列技術從大型數據庫或數據倉庫中提取人們感興趣的信息和知識,已在零售業得到了廣泛的應用,卻在流程過程中使用較少。針對某石化企業的連續重整過程,利用決策樹歸納法,建立反應器溫度波動模型,對實時數據進行預測,對于引起反應器溫度波動較大的操作提出建議性的決策樹規則,從而達到改善控制效果和提高裝置運行平穩性的目的。



                                                             關鍵詞:流程工業;連續重整;數據挖掘
        彭松濤
    男,中國石油化工股份公司信息系統管理部  北京  100029。

    1   引言
     
        流程工業包括石化、冶金、電力、輕工、制藥、造紙、環保等在國民經濟中占主導地位的行業,是經濟發展的重要支柱產業。流程工業生產過程物流和能量流連續,產品相對穩定,生產周期長,工藝流程基本不變,通過調整在線工藝參數可使生產具有一定程度的柔性。目前我國流程工業企業普遍存在著能耗大、產品質量差、生產工藝落后、自動化及操作水平低等問題,1999年我國流程工業能耗普遍比國外先進水平高出30%;而據測算,僅通過優化自動化系統及過程工藝參數的在線優化技術對過程生產增加收益的典型值為裝置產值的3%-5%。針對現有生產工藝設備,從企業大量保存的歷史數據中提取有用的知識,根據這些知識提高過程的控制及操作水平,在當今能源和自然資源緊張的情況下具有重要的經濟和技術意義。
     
        流程工業的生產過程優化問題按時期分兩大類,一類是設計時的優化,工藝流程、設備類型和尺寸、生產操作條件都可以調整,但確定之后一般不做修正;另一類是運行中的優化,此時工藝及設備因素均已確定,只有操作條件可以變動。當環境條件變量變動時,運行變量值需要及時做相應的調整。一般而言,生產裝置的操作條件在設計時已按設計指標優化并定義為標準操作參數,如按反應動力學分析得到的原料配比,過程單元設備的工作參數等。但在長期生產過程中,由于原料成份、公用工程等工況的改變和設備老化等常見因素,設計階段定義的操作參數往往不能達到期望的效果。操作優化的目的是在現有工藝及設備條件下,通過調整可控變量,使生產過程處于最優工況附近,從而提高產值、降低能耗。雖然對于數學模型的優化問題已較容易解決,但由于現實生產過程的復雜性,精確建模的工作非常困難。
     
        相對于建立能充分反映系統全局動態的精確模型而言,用戶更關注于得到一些對指導生產有益的不精確甚至僅僅是定性正確的信息。另一方面,隨著各種傳感器、智能化儀表及數據庫在工業過程中的廣泛應用,流程工業企業在日常生產中積累了大量的過程歷史數據,這些數據蘊涵了工業過程的客觀規律和操作人員的豐富經驗。但生產過程包括各種物理及化學過程,具有機理復雜、數據信息量大、處理難度大的特點。由于早期的工業計算設備缺乏足夠的計算能力、有效的分析算法,這些包含過程運行狀態信息數據的利用還只是停留在一個比較淺的層次上,大量的數據只是用來產生各種統計報表,或僅作動態查詢以服務于在線優化或控制系統,而沒有進行進一步的分析。

        數據挖掘技術的出現使得從海量數據中提取操作優化信息變得可能,它不僅能對過去的數據進行查詢和遍歷,并且能夠找出數據之間的潛在聯系及規律,從中提取輔助用戶決策的關鍵性信息。數據挖掘技術是近年國內外活躍的研究領域,商業化的數據挖掘軟件已獲得大量應用。但工業技術數據領域的數據挖掘相對尚未成熟。本文的目標,就是在介紹數據挖掘基本概念以及流程工業數據的特點上,結合流程工業的實際應用,解決工業中操作參數調優、故障診斷及預測等常見的問題,為流程企業日常生產經營提供決策決策依據。

    2  流程工業數據特點
     
        數據挖掘(Data Mining, 簡稱DM)又被稱為數據庫中的知識發現(Knowledge Discovery in Database, 簡稱KDD) 、知識抽取(Information Extraction)等, 是在大量數據集中提取隱含的、目前未知的、最終可理解的、有效的、新穎的、對于決策過程有用的知識的非平凡的過程[7]。數據挖掘技術是人工智能、統計技術、模式識別、數據庫等領域交叉研究的產物。
     
        數據挖掘可以分為探索型(描述型)數據挖掘和預言型(預測)數據挖掘兩大類。所謂探索型數據挖掘是指在預先未知任何模式的情況下, 在數據集內查找模式的一種技術, 探索型數據挖掘主要包括統計分析、可視化、聚類分析、概念描述、關聯分析、序列分析等。預言型數據挖掘則是已知一些模式的基礎上在數據中查找特定變量與其他變量之間關系的一種技術, 預言型數據挖掘主要包括分類、回歸預測、孤立點檢測、規則歸納、時間序列預測等。數據挖掘自從上個世紀90年代提出后, 經過十幾年的發展, 到現在已經發展為一種比較成熟的技術, 目前對數據挖掘的研究主要集中在數據挖掘模型[16]、數據挖掘技術和算法、數據挖掘應用等研究上。
     
        盡管數據挖掘在許多領域得到很好的應用, 然而在流程工業中, 數據挖掘的應用卻受到很大限制, 已有的一些應用其效果也沒有像在商業、金融、保險、生物學等領域中所報道的那樣好。究其原因, 一個很重要的因素是由于流程工業的數據特點所決定的, 以數據挖掘中的分類模式為例, 流程工業中的歷史數據具有以下幾個特點:
     
        (1) 生產裝置產生的數據量巨大, 數據樣本維數多。以煉油工業為例, 反映系統運行狀況的數據由數據采集系統每隔幾秒、十幾秒就在實時數據庫中產生一組數據, 每組數據中包含上萬個記錄, 如何從這些海量數據中得到有用的知識, 對于常用的數據挖掘算法是一個挑戰;
     
        (2) 數據時間性強, 隨著時間波動;流程工業的連續生產中, 由于工況的改變、操作控制的調整、原料改變, 數據時刻在變化, 這更增加了從中提取知識的難度;
     
        (3) 與商業上事務處理數據庫中的數據不同, 流程工業數據的屬性之間往往存在復雜的非線性關系以及相互耦合的現象;
     
        (4) 流程工業數據的質量指標和操作參數之間存在較大的時間滯后。在很多情況下, 由于裝置是連續生產的, 因此很難得到操作參數與質量指標之間精確對應的數據記錄;
     
        (5) 與商業上數據很少存在孤立點、噪聲不同, 流程工業數據中往往存在較大噪聲或者孤立點。由于原料改變、工藝改變、人為因素、生產裝置故障以及測量儀表問題使得流程工業數據中不可避免地存在孤立點, 進一步增加了數據挖掘的難度;
     
        (6) 可用于分析的質量數據少。在流程工業的數據挖掘中, 通常需要對一些質量指標如產量、能耗、收率、純度、雜質含量、環境影響等進行評價, 然而這些指標中, 有些往往是無法直接測量的,如產率、收率等, 有些雖然可以通過實驗室分析化驗得到, 如純度、雜質含量等, 但這些指標采樣周期長, 通常只有一天兩到三次, 造成數據質量不高。
      
        現有的數據挖掘軟件大多以商業過程中事務處理為背景, 而這些事務本身相對比較簡單, 目的也比較明確, 但在流程工業數據挖掘中則復雜得多, 例如當前操作參數下, 產品的某些質量指標比較差, 想通過數據挖掘來知道為什么。對于這樣一個問題, 首先我們需要對工藝有一個比較全面的了解, 需要了解影響質量指標的主要操作參數有那些, 另外可能因為影響質量指標的操作參數太多, 我們只能選擇其中的一部分, 還要考慮這些參數之間的耦合關系, 最后還要考慮時間滯后。由于工業過程所具有的特點, 很有可能我們需要的參數找不到, 在這種情況下可以采用一些其他的方法, 如建模來得到需要的參數, 但這樣會使得最后挖掘出來的知識置信度較低, 這些因素決定了流程工業數據挖掘的難度。

    3   流程工業中的數據挖掘建模
     
        針對流程工業數據的特點以及日常操作應用情況,流程工業中的數據挖掘建模建立在對海量數據的處理基礎上。與傳統商業上的數據挖掘應用不同,流程工業中的數據挖掘涉及到生產過程的各個方面,貫穿于流程工業整個管理活動過程中,工業數據挖掘的應用主要包括預測建模、故障診斷、操作性能優化、新產品/工藝開發、庫存預測等等應用方面。
     
        3.1  操作性能優化
     
        數據挖掘可以為企業生產挖潛增效。但是由于各種不可控的因素,生產狀態不可避免地發生波動,操作參數也應隨之調整。數據挖掘將根據對生產歷史數據的分析和挖掘,診斷當前的生產狀況,提出改變生產操作參數的具體建議,使生產維持在優化狀態。在多變量的操作環境中,單一的質量要求對應著多種操作可能,人工無法完成這個對應質量控制要求的I/O模式匹配。在長期的操作過程中,有各種原因所致的設定值波動和調整,由于流程工業的大時滯多變量復雜性,操作參數優化未得到重視和利用。
     
        對大量生產數據進行挖掘找到產品質量與工藝參數的模型關系,分析諸多變量作用下的產品質量規律,幫助質檢人員、工藝人員弄清影響產品質量的主次因素,提出相應的對策,進一步調整工藝參數,進行質量控制,為實現生產過程操作優化提供指導。數據挖掘用于流程工業裝置性能優化主要解決以下兩個問題:
     
        (1)裝置運行性能分析:對裝置歷史數據進行關聯規則挖掘,找出裝置操作參數和產品產量及質量之間的關聯。如采用關聯規則數據挖掘,尋找最佳的原油混煉比。
     
        (2)采用決策樹、關聯規則數據挖掘找出班組操作差異性所在以及影響差異性的主要裝置控制參數從歷史記錄中提取最優工藝設定及操作。
     
        生產裝置性能優化主要采用以下兩種方法實現:第一種方法是在歷史數據中尋找最優記錄所對應的工藝設定值或動態操作過程,并基于樣本相似性度量的搜索和時序匹配方法充分利用已有的歷史經驗,給出與當前工況最近似的最優估計;另外一種方法是根據歷史數據提取既有狀態的本質特征并利用各種方法探索歷史中沒有的最優方案,這方面內容比較接近的是序貫實驗設計方法、定性推理方法、模式識別調優法。
     
        3.2  預測建模以及故障診斷
     
        在有條件建立比較準確的過程機理模型時,機理建模方法應是首選。但由于流程工業的復雜性和大規模性,建立精確的數學模型異常困難。當可以得到被控過程的輸入輸出數據時,可采用基于數據挖掘的方法,如神經網絡、支持向量回歸、PLS回歸。當很難建立被控過程的定量數學模型時,住往采用基于知識的方法,如定性模型、模糊模型。采用基于數據挖掘的數據預測技術,可以建立起一些無法測量變量的預測模型,根據建立的模型可以進一步對影響目標變量的操作參數之間的關系進行分析,找出改善質量指標的操作變量調整策略。
     
        利用數據挖掘還可以診斷和解決生產中的瓶頸問題、以及檢測生產中的異常問題。例如,當生產中出現質量不合格、產量上不去、能耗或物耗居高不下等其他制約生產的難題時,采用數據挖掘中的關聯規則、聚類等方法找出解決問題的辦法?;跀祿诰蚍椒?,對裝置的歷史數據包括正常狀態、異常狀態及各種故障狀態數據進行聚類、分類及孤立點分析,可建立系統狀態的評估和故障診斷模型。在此基礎上可以根據典型故障或異常工況對裝置運行進行實時監控.,當系統狀態或動態趨勢與故障樣本匹配時可及時辨識出故障類型。對于數據噪聲較小的數據集,可直接采用決策樹及關聯規則方法從數據集中分析故障與工況及操作因素之間的相關性,從而分析故障發生的原因。
     
        3.3  其他應用
     
        對于流程企業中的一個新裝置、新工藝,數據挖掘通過對收集到的生產數據進行數據挖掘,可以幫助企業迅速找到生產的規律,確定最佳的生產操作參數,減少摸索的時間,盡快生產出合格產品,達到設計指標。開發新產品、設計新工藝時,采用數據挖掘可以幫助企業從有限的已知數據中發現規律,指出方向,少走彎路,縮短開發和設計時間。
     
        采用數據挖掘可以從企業保存的大量歷史數據中獲取對生產經營有用的知識,全面、客觀地分析企業的運作現狀,探索企業運營的客觀規律,使之為企業經營決策提供有價值的信息,達到減少庫存、降低能耗、減少采購成本、提高管理效率的目的,進而使得企業獲得利潤。

    4  流程工業數據挖掘應用實例
     
        以某石化企業連續重整裝置重整反應器為研究對象,采用數據挖掘中的決策樹方法來建立過程操作優化的決策樹模型。利用該模型,可以對裝置的操作給出合理的建議,以幫助操作工提高操作水平,優化裝置的生產。
     
        該裝置用于生產苯、甲苯、二甲苯等基本有機原料,同時副產氫氣。重整過程主要反應有:環烷脫氫、異構化、加氫裂化和烷烴的脫氫環化反應。在重整過程中,反應器溫度對加氫裂化和芳構化影響較大,提高反應溫度有利于芳烴的生成,但當溫度進一步提高時,加氫裂化反應增多,而芳構化反應減少,且催化劑結炭增加。因此,反應溫度是重整過程中一個比較重要的參數,反應器反應溫度的波動過大會直接影響芳烴收率以及裝置運行平穩性。如何減少控制系統中控制參數對于反應器溫度波動的影響,提高裝置運行的平穩性,具有重要的意義。采用決策樹歸納的數據挖掘方法,對于過程系統數據庫中的歷史數據進行分析,建立反應器溫度波動的決策樹預測模型,利用建立的模型對過程系統當前的操作進行預測,對于引起反應器溫度波動較大的操作進行預警,根據生成的決策規則,對于這些操作提出建議性的調整措施,并反饋作用于控制系統,達到改善控制,提高裝置運行的平穩性的目的。
     
        以石化企業七月份連續重整過程的歷史數據為對象,該數據來源于該裝置的DCS。重整反應主要工藝過程簡述如下: 來源于預加氫裝置脫戊烷塔低料與加氫裂化裝置的重石腦油進入進料緩沖罐,其液位與壓力由控制器LC3003、PC3005控制。原料經過聯合進料換熱器預熱后進入反應進料加熱爐BA301加熱,然后進入1號反應器DC301,從1號反應器出來后進入中間加熱爐BA302A/B、2號反應器,然后依次進入加熱爐BA303、3號反應器DC303、加熱爐BA304、4號反應器DC304,最后進入產品分離罐。該裝置主要測量點總共為95個,從中選取和反應器緊密相連19個主要測量點,其中包括重整進料緩沖罐液位與壓力,重整進料量,進料加熱爐、中間加熱爐壓力,反應器進出口溫度等。主要測量點見表1。 

    表1   主要測量點工位號

        得到的數據經過去除噪聲,填補缺失值等預處理后,得到一段時間之內的控制參數變化引起反應溫度波動率的分類數據模型,其中為時間間隔,在系統運行的過程中根據需要可以調節。為簡單起見,將溫度波動離散化為兩類,得到類標號為High、Low的數據集,兩類類標號分別代表反應溫度波動較大和較小。進過計算,得到不同時間間隔下的決策樹規則。

    表2   決策規則


    表3   決策規則

        以上每條規則的規則體中的數字代表該參數增加或減少的百分數,正值代表增加,負值代表減少。每條規則后面的百分數代表該規則的置信度。如秒時,規則1表示的意義為,當DC301入口溫度增加量超過10%,FA301壓力減少量超過4.8%,DC302入口溫度增加量超過0.4%,那么反應器溫度波動將會比較高,該條規則的置信度為75.8%。
     
        從規則 1、2、3 可以看出進料緩沖罐FA301壓力(PC3005)出現在三條決策規則的規則體中,進一步從規則 4 中可以看出:進料緩沖罐壓力下降太大(超過4.7%),將可能導致反應器溫度波動過高,并且這條規則的置信度較高為88.2%;另外,從規則 5 中可以看出進料加熱爐BA301的入口溫度(也就是聯合進料換熱器出口溫度)下降不超過0.037%以及DC303入口溫度向上波動不超過0.163%,那么反應器將有比較小的溫度波動,置信度為97.2%,由此可見,聯合進料換熱器換熱效果和工作穩定性對反應器有著重要影響。利用得到的反應器溫度波動決策樹模型,對來自系統實時數據庫中的當前操作進行預測,如果溫度波動較大,利用決策樹規則對控制參數進行調整,可以提高整個裝置運行的平穩性。

    5  總結
     
        針對目前我國流程工Q業企業普遍存在著能耗大、產品質量不穩定、生產工藝落后、自動化及操作水平低等問題,以數據挖掘為手段,針對現有生產工藝設備,從企業保存的大量的歷史數據中獲取對生產經營有用的知識,全面、客觀地分析企業的運作現狀,探索企業運營的客觀規律,以達到優化生產、提高產品質量、減少庫存、降低能耗目的,進而使得企業獲得利潤,進一步根據這些知識提高過程控制及操作水平,在當今能源和自然資源緊張的情況下具有重要的經濟和戰略意義。

    熱點新聞

    推薦產品

    x
    • 在線反饋
    1.我有以下需求:



    2.詳細的需求:
    姓名:
    單位:
    電話:
    郵件: