摘要:崖城氣田南山基地的ESD系統(tǒng)是基于Rockwell Allen-Bradley PLC5來實現(xiàn),該系統(tǒng)的可靠性和穩(wěn)定性密切關(guān)系到南山基地的安全生產(chǎn)。近來南山ESD系統(tǒng)多次出現(xiàn)故障,該故障直接導(dǎo)致全廠區(qū)緊急關(guān)停,對安全生產(chǎn)造成了一定的影響。通過全面收集故障現(xiàn)象,深入分析故障現(xiàn)象,最終找到了原因,在不停輸?shù)那闆r下,在線更換卡件,解決了該故障。關(guān)鍵詞:PLC;遠程I/O 鏈路;ASB 模塊;不停輸
1 背景介紹
中海油崖城氣田是目前國內(nèi)最大的海上氣田,三亞南山基地是其陸地油氣處理基地,負責把海上送下來的油氣進行處理和銷售。整個基地處理高度集成,自動化控制程度很高。自動化控制系統(tǒng)由集散控制系統(tǒng)(DCS),緊急關(guān)斷系統(tǒng)(ESD)火警系統(tǒng)組成。ESD系統(tǒng)是氣田緊急關(guān)斷系統(tǒng)(Emergency shut down),也是設(shè)施保護系統(tǒng),是基地油氣處理設(shè)施的重要組成部分,對于氣田的安全生產(chǎn)起到至關(guān)重要的作用。按照安全獨立原則要求,獨立于DCS集散控制系統(tǒng),其安全級別高于DCS。
2010年初,南山發(fā)生生產(chǎn)關(guān)斷和緊急關(guān)斷。維修儀表人員前往中控室,上線ESD系統(tǒng)PLC 程序,發(fā)現(xiàn)在程序中輸入點從I:71/00---I:71/17;I:72/00---I:72/17;I:75/00(生產(chǎn)報警),I:75/01(撤離),I:75/02(緊急集合),I:75/03(緊急關(guān)停),---I:75/17 共3組數(shù)據(jù)48個開關(guān)輸入點的值大部分為0,如一些液位開關(guān)信號,來自倉庫火警系統(tǒng)關(guān)停信號。該3組數(shù)據(jù)均來自其對應(yīng)的所有3塊數(shù)字輸入模塊,故產(chǎn)生了誤關(guān)停。根據(jù)生產(chǎn)恢復(fù)的需要,儀表在ESD系統(tǒng)PLC程序中將相關(guān)的開關(guān)量輸入點進行了邏輯強制,操作并對相關(guān)模擬量的輸入點在旁通操作站進行了旁通,按照程序進行了記錄。至此,生產(chǎn)關(guān)斷和緊急關(guān)斷得以復(fù)位。因為,控制斷塞流捕集器和減壓站上兩個SDV-2102和SDV-2123的輸出點是掛在ESD系統(tǒng)遠程I/O機架的輸出模塊上的,當遠程I/O適配器ASB模塊與PLC處理器通訊故障時,輸出點無法帶電,只能到現(xiàn)場進行操作,兩閥打開。而銷售計量撬 SDV-4033能夠正常打開,因為控制SDV-4033的輸出點是掛在另一個遠程I/O機架輸出模塊上的,這個遠程I/O機架和PLC 處理器通訊正常。恢復(fù)生產(chǎn)后,現(xiàn)場人員對有通訊問題的遠程I/O機架進行了斷電,然后上電的復(fù)位操作后,兩塊輸出卡上電,程序里輸入點的值與現(xiàn)場輸入卡的點的狀態(tài)一致,PLC處理器掃描到了遠程機架 I/O中的輸入輸出,遠程適配器ASB 模塊ACTIVE狀態(tài)燈由閃綠變?yōu)槌>G,及時恢復(fù)了ESD系統(tǒng)。
類似故障現(xiàn)象在2008年和2009年也出現(xiàn)過多次,同一遠程機架 I/O不定期失效的根本原因還有待進一步排查。
2 故障現(xiàn)象收集
2.1 故障現(xiàn)象一
遠程 I/O 機架適配器ASB模塊上的三個狀態(tài)指示燈的狀態(tài)分別為:
ACTIVE:綠色閃爍;
ADAPTER FAULT:滅;
I/O RACK FAUL:滅。
查找PLC 手冊,該警報描述為:Remoteadapter not actively controlling I/O; 引起該警報可能的原因:Processor is in program or testmode; Scanner is holding adapter module in faultmode.
正常的狀態(tài)應(yīng)分別為:
ACTIVE:常綠;
ADAPTER FAULT:滅;
I/O RACK FAUL:滅,如圖1所示。
圖1 ASB remote I/O adapter 模塊
2.2 故障現(xiàn)象二
通過檢查遠程I/O機架輸出卡輸入卡件狀態(tài),發(fā)現(xiàn)說明其對應(yīng)的來自現(xiàn)場的變送器模擬信號,液位開關(guān),壓力開關(guān),手動按鈕,SDV的限位開關(guān),來自倉庫火警系統(tǒng) PLC關(guān)停警報信號在卡件上的顯示燈均正常,為閉合帶電狀態(tài)。但是在PLC 程序數(shù)據(jù)文件中,發(fā)現(xiàn)其對應(yīng)的值卻為0,正常應(yīng)為1。說明現(xiàn)場的設(shè)備本身均為正常,只是PLC處理器無法掃描到這些遠程I/O,在程序數(shù)據(jù)表里值為0。
2.3 故障現(xiàn)象三
通過檢查遠程I/O機架輸出卡上的輸出點對應(yīng)的紅色狀態(tài)燈全部為滅的狀態(tài),說明沒有電壓信號輸出到閥門和馬達。但是在程序數(shù)據(jù)表中發(fā)現(xiàn)這些輸出點對應(yīng)的值為1。說明遠程I/O機架輸出卡無法通過remoteI/O 鏈路通訊電纜接收到處理器中這些狀態(tài)為“1“的輸出指令,如圖2所示.
圖2 故障時的遠程I/O機架輸入輸出卡
2.4 故障現(xiàn)象四
在PLC程序中發(fā)現(xiàn):channel status的1B口的Rack7和Rack10顯示F, F即表示該 Rack為fault。有故障的遠程I/O機架均為Rack7和Rack10。1B口為remote I/O scanner通信口,連接的為remote I/O 適配器。并發(fā)現(xiàn)Rack7和Rack10有很多的retries,其他的rack均為0 個retries,如圖3所示。
圖3 故障時在FPS 程序中顯示的scanner channel的狀態(tài)
2.5 故障現(xiàn)象五
恢復(fù)生產(chǎn)后,PLC 處理器上的CH1的1B通信口的狀態(tài)燈為“綠色閃爍” 。正常應(yīng)該為常綠。1B通信口是用來連接remote scanner 和remote I/O adapter 的,如果出現(xiàn)“綠色閃爍” ,說明at least one remote adapter is faulted or failed。hhhhhhhh可能的原因:power off at remote rack or communication cablebroken。在做好相關(guān)的旁通和邏輯強制后,對故障遠程I/O 機架進行斷電然后上電的復(fù)位操作后,以上的故障現(xiàn)象立即消失,ESD系統(tǒng)工作正常。
根據(jù)以上的5個最直觀的現(xiàn)象,現(xiàn)在可以得出的結(jié)論是:故障遠程I/O 機架的輸入和輸出卡是完全正常的。問題就在于PLC處理器掃描不到故障遠程I/O 機架致使處理器和該遠程I/O 機架無法通訊,導(dǎo)致了緊急關(guān)停。現(xiàn)在要做的工作就是查找,故障遠程I/O 機架間接性出現(xiàn)故障的根本原因。
3 故障分析
可能處理器和故障遠程I/O 機架 remote I/O鏈路通信出現(xiàn)了故障。有可能是受到了一些噪聲干擾,比如大功率的馬達或者電焊機突然啟動或者通信電纜信號屏蔽線損壞等。這個可能性還是存在的。驗證該可能性是否存在,只要調(diào)查當天發(fā)生故障時該區(qū)域進行的相關(guān)作業(yè)就可以。通過檢查歷史作業(yè)記錄,發(fā)現(xiàn)發(fā)生故障時并沒有類似的操作。并且故障時,發(fā)現(xiàn)Rack10和Rack11 remoteI/O 工作正常。因為所有的rack是前后串接,所以就說明通信電纜是沒有問題的。至于終端電阻,標準配置為82歐姆,與處理器掃描器處的終端電阻相等。終端電阻大小選擇與通信波特率、通信距離以及處理器的版本系列號等因素有關(guān)。終端電阻是為了消除在通信電纜中的信號反射,保證信號的通訊質(zhì)量。在remote I/O鏈路通信過程中,有兩種原因?qū)е滦盘柗瓷洌鹤杩共贿B續(xù)和阻抗不匹配。阻抗不連續(xù),信號在傳輸線末端突然遇到電纜阻抗很小甚至沒有,信號在這個地方就會引起反射。這種信號反射的原理,與光從一種媒質(zhì)進入另一種媒質(zhì)要引起反射是相似的。消除這種反射的方法,就必須在電纜的末端跨接一個與電纜的特性阻抗同樣大小的終端電阻,使電纜的阻抗連續(xù)。由于信號在電纜上的傳輸是雙向的,因此,在通訊電纜的另一端可跨接一個同樣大小的終端電阻。引起信號反射的另個原因是數(shù)據(jù)收發(fā)器與傳輸電纜之間的阻抗不匹配。這種原因引起的反射,主要表現(xiàn)在通訊線路處在空閑方式時,整個網(wǎng)絡(luò)數(shù)據(jù)混亂。要減弱反射信號對通訊線路的影響,可以通過在兩端跨接兩個匹配的終端電阻來消除。前兩次出現(xiàn)故障時,均是更換了終端電阻,給故障機架進行斷電,然后上電復(fù)位后上述故障現(xiàn)象消失。作為一個功率為0.5W的金屬鍍膜的電阻,才更換4個月左右的時間就會壞,這種可能性還是很小的,并且為什么2008年之前十幾年了沒有壞,最近今年卻連續(xù)“壞了”3次。所以從某種程度上來說,這三次故障和終端電阻沒有什么直接的關(guān)系。還存在更深一層次我們沒有發(fā)現(xiàn)的根本原因。每次更換終端電阻不能解決根本問題。
如果故障遠程I/O 機架適配器ASB模塊自身不穩(wěn)定,會造成這種故障。ASB 模塊本身就是介于故障遠程I/O 機架與處理器之間。以串行方式接收來自處理器的數(shù)據(jù)和向處理器發(fā)送數(shù)據(jù);支持半槽、單槽,二槽I/O尋址,掃描機架里的槽位信息。基于前面詳細列舉的5個故障信息,都足以說明是該適配器 ASB 模塊出現(xiàn)了故障。該5種故障現(xiàn)象與ASB 模塊的功能是完全匹配的。第5個故障現(xiàn)象就說明了問題在于其中某一個remote I/O,否則我們還會花更多的精力和時間去排除鏈路上的其他設(shè)備,或者處理器或者UPS電源等;現(xiàn)場的輸入信號均為1,但是輸入卡的信號無法發(fā)送到處理器,導(dǎo)致程序中對應(yīng)的輸入點為0;程序中通過邏輯運行的輸出值與現(xiàn)場輸出卡對應(yīng)的輸出點的狀態(tài)不相匹配,如程序中輸出為1,現(xiàn)場輸出卡卻為0;更直觀的是捕捉到了ASB模塊的故障診斷燈出現(xiàn)了綠色閃爍這一現(xiàn)象,說明問題的確是出在ASB 模塊;第4個故障現(xiàn)象也說明了就是該Rack7和Rack10出現(xiàn)了fault,三次故障時均有該警報出現(xiàn)在程序中;綜合對以上5個故障信息的分析,基本上我們可以得出故障就位于已經(jīng)使用了十幾年的適配器 ASB 模塊上。至于ASB 模塊的故障是何引起,我們調(diào)查了這三次故障的共同歷史背景信息,大概判斷可能是由于室內(nèi)工況溫度較高,導(dǎo)致ASB模塊某些電子元件受高溫老化,工作穩(wěn)定性下降。目前室內(nèi)冷凝器工作正常,溫度控制恢復(fù)正常。
4 故障解決方案
故障原因確定后,接下來的工作就是解決該故障。考慮到之前室內(nèi)工況溫度較高,并且ESD 系統(tǒng)的重要性以及不影響生產(chǎn)的前提下在線更換ESD系統(tǒng)卡件的復(fù)雜性,現(xiàn)場計劃更換ASB 適配器模塊,同時一起更換已經(jīng)使用超過17年的機箱和電源模塊,確保ESD系統(tǒng)工作的高度可靠性和穩(wěn)定性。由于AB產(chǎn)品不支持熱插拔作業(yè),所以該工作必須在遠程I/O機架完全斷電的前提下才能進行;并且現(xiàn)有的新的ASB 適配器模塊均是E系列版本,在線使用的是D系列版本。換上新的機箱和ASB模塊,不能確定處理器能夠掃描到rack7和rack10。不同版本的硬件開關(guān)組態(tài)又有不同的標準,如果硬件開關(guān)組態(tài)不正確,將會導(dǎo)致ESD 系統(tǒng)無法工作。
圖4 機架背板開關(guān)組態(tài)設(shè)置方法
鑒于以上3點考慮,得出該項工作有3個最大的技術(shù)難點:
(1)保證整個機箱斷電后,生產(chǎn)和設(shè)備運行不能受到影響。因為斷電后,會導(dǎo)致此機箱內(nèi)所有I/O置0,從而導(dǎo)致全廠區(qū)關(guān)停。
(2)由于ASB模塊系列版本號升級后,其中硬件開關(guān)組態(tài)標準發(fā)生了變化。機箱母板和ASB 模塊等的硬件開關(guān)設(shè)置比較復(fù)雜。
(3)如果換上去新的ASB模塊,出現(xiàn)處理器無法掃描到這張卡件的情況,就必須得在PLC程序中將其模式切換到PROGRAM來進行AUTO CONFIGURE,這樣就會出現(xiàn)整個ESD系統(tǒng)輸出置0,全廠區(qū)關(guān)停。這個風險我們必須考慮并準備有控制措施。
針對以上3個技術(shù)難題,我們的解決方案是:
(1) 為了保證生產(chǎn)的穩(wěn)定和連續(xù),對于輸入信號,我們可以在PLC 程序中進行邏輯強制和旁通,對于輸出信號,由于失電,對于比較重要的關(guān)斷閥,可以在現(xiàn)場進行手動強制打開;對于比較重要的需要一直運轉(zhuǎn)的馬達聯(lián)鎖信號,可以在MCC開關(guān)柜里面將繼電器進行臨時跳接。對于消防泵,由于失電,可能會誤啟動,可以將其中切換到OFF狀態(tài),現(xiàn)場守候。為了保證不遺漏任何一個輸入輸出點,打印出來所有I/O點,核對每一個點并和操作一起檢查其旁通、邏輯強制等措施。同時,由于該區(qū)域保護系統(tǒng)已經(jīng)臨時失效,需要有專門人員進行巡檢,并隨時與中控溝通。
(2) 嚴格按照AB 手冊對其進行硬件開關(guān)組態(tài)設(shè)置。其設(shè)置方法如圖4圖5所示。其中圖4為機架背板開關(guān)組態(tài)設(shè)置方法,圖5為ASB模塊S1&S2開關(guān)組態(tài)設(shè)置方法。
(3)通過認真研究AB手冊以及和Rockwell 廠家溝通,最終確認,如果是增加或者減少一個機箱的話,的確要在PROGRAM的模式下進行AUTO CONFIGURE,將會導(dǎo)致整個ESD系統(tǒng)關(guān)停。我們本次作業(yè)時更換ASB模塊,沒有改變其在remote I/O通訊鏈路上的rack地址,也沒有增加或減少機架,不需AUTOCONFIGURE。在驗證該結(jié)論的過程中,所投入的精力最多,也是當時最難確定的。
最終落實以上3個技術(shù)方案后,于2010年3月30日在連續(xù)生產(chǎn)的前提下,成功地對更換了故障遠程I/O機架的機箱,ASB和電源模塊。至今,ESD系統(tǒng)工作正常,沒有出現(xiàn)類似故障。
圖5 ASB模塊S1&S2開關(guān)組態(tài)設(shè)置方法
5 結(jié)論
ESD系統(tǒng)再沒有出現(xiàn)類似故障,說明故障得到徹底解決,也證明只要有正確的方法,深入細致的故障診斷和充分的準備,在不停輸?shù)那闆r下可以做到在線更換AB PLC-5 遠程I/O 機箱卡件。
參考文獻:
[1] Cat. No 1771-ASB Series D Remote I/O Adapter Module User Manual,ALLEN-BRADLEY[Z].ROCKWELL INTERNATIOANL COMPANY, 1995
[2] Cat. No 1771-ASB Series E Remote I/O Adapter Module User Manual,ALLEN-BRADLEY[Z].ROCKWELL INTERNATIOANL COMPANY, 2000
[3] PLC-5 Family Programmable Controllers Hardware Installation Manual,ALLEN-BRADLEY[Z].ROCKWELL INTERNATIOANL COMPANY, 2000
[4] Data Highway/ Data Highway Plus/ Data Highway II Cable InstallationManual, ALLEN-BRADLEY[Z].ROCKWELL INTERNATIOANLCOMPANY, 1994
黃若平(1982-)
男,湖北荊州人,本科,2005年畢業(yè)于長江大學(xué)自動化專業(yè),工學(xué)學(xué)士學(xué)位,現(xiàn)任中海油崖城氣田高級儀表師,主要從事于作業(yè)公司儀表和控制系統(tǒng)的現(xiàn)場技術(shù)工作。
王回綏(1984-)男,甘肅靜寧人,本科,現(xiàn)任中海油崖城氣田中級儀表師,主要從事于作業(yè)公司儀表和控制系統(tǒng)的現(xiàn)場技術(shù)工作。
摘自《自動化博覽》2011年第十一期