摘要
“狼來了”是大家耳熟能詳的寓言故事,這則寓言對那些仍在麻痹中祈禱、賭運氣的?;菲髽I很有啟示意義?!鞍踩P鍵報警”扮演了故事中的“牧童“角色,操作員則相當于故事中承擔施救任務的“村民”。而漠視“安全報警”的風險代價遠遠超乎普通人的直覺認知,報警響應失效釀成的慘禍不再只是頭腦中的想象場景,屢屢發生的工藝(過程)安全事故就如同“狼來了”的故事結局,悲劇場景在現實中的一幕幕地重演。
那么要如何才能筑牢報警響應這第一道事故防線?表表決心、喊喊口號等形式主義的做法顯然于事無補,甚至適得其反。本文介紹了基于標本兼治的體系化解決之道。簡言之,?;菲髽I應基于ISA18.2/IEC62682標準,建立實施涵蓋報警系統生命周期各階段有效的報警管理體系,并配套應用專業的智能化先進報警響應管理系統軟件(如北京思創的SARMS),從而幫助操作員提高響應效能。
一、工藝(過程)安全事故教訓和報警響應失效機制
ISA-18.2 / IEC 62682標準中的術語“報警”專指向操作員指示設備故障、工藝偏差或其它需要及時響應的異常情況的視聽刺激手段。
應確保報警系統以正確有效的方式和時間提供正確的信息,以使控制室操作員及時洞察險情并采取正確的響應行動以糾正異常工況,從而避免事故或盡量減緩后果(人身傷亡、設備故障、資產或環境損害)。
絕大多數情況下,“自動報警+人工響應”都是抵御重大安全事故的第一道重要防線。迄今為止,國內外所有的工藝(過程)安全事故的原因幾乎都可以追溯到報警響應這一防線的失守。報警響應失效釀成的慘禍不再只是頭腦中的想象場景,傳說中“狼來了” 的故事一次次在現實中重演,其中典型的事故如下:
1994年英國Milford港Texaco煉油廠爆炸
2018年1月22日美國Pryor Trust井噴事故
2005年3月23日BP Texas City煉油廠大爆炸
吉林石化雙苯廠硝基苯精餾塔11.13特大爆炸
報警響應安全防線由如下圖所示的三大子系統組成,依次完成偵察險情-診斷決策-響應動作三項任務,缺一不可,其中任一環節失效都會導致整體防線的失守,從而導致報警響應的失效機制。
上圖中的硬件(傳感器、DCS/PLC控制站、執行器和HMI操作站硬件)失效在PSM(工藝過程安全管理)體系中屬于設備完整可靠性管理的要素范疇,在此不作闡述。眾所周知,有效的操作人員對最大限度地提高生產效率、產品質量和生產裝置的安全可靠性至關重要。而且,目前存在一個自動化和人因可靠性之間的悖論,即自動化程度越高、范圍越廣越可靠,操作員越盲目樂觀,重要線索越容易被忽視或誤解。自動化系統一但有故障,對操作員的要求反而越高。然而,操作員的人因失效除了受制于報警的可靠性,還涉及到PSM的COO/OD(運維管理和紀律)、SOP(標準操作規程)、培訓和績效保障、應急響應等多個要素,在此也不詳細討論。本文討論重點是和操作員響應有密切關聯的HMI和相關報警軟件如何為操作員提供有效的幫助,以完成以下三大任務環節:
1、偵察(傳感設備+HMI+視聽刺激+人工觀察):報警信息如何有效幫助操作員透過現象(視聽刺激),洞察本質(事故因果劇情)?
2、診斷(HMI+人腦思考):報警信息如何提供明確充足的決策分析依據(例如危險劇情、優先級和響應時間)?
3、響應(人工+執行設備):響應規程聯動如何幫助操作員執行決策并密切觀察干預效果反饋?
二、自控系統內置報警功能的典型癥狀:泛濫低效
DCS等自控系統內置報警功能存在以下幾種妨礙操作員響應性能的典型癥狀:
報警洪災。
高頻(抖顫)報警。
滋擾報警。
HMI設計不良。
報警管理不善。
報警信息孤島。
模擬儀表時代,每名操作工每個班次平均收到100條報警,而DCS普及后的數字化時代,報警設置變得異常容易方便,導致報警數量急劇增加!每名操作工每個班次平均收到4000條以上的報警,遠遠超過操作員能夠從容應對的設計負荷限制。這帶來了新的難題和挑戰,面對頻繁、甚至泛濫)且無類別和優先級劃分的報警事件, 操作員沒有能力對隱藏其中的真正險情臨時做出正確的診斷評估和及時的響應決策,大量無關緊要的滋擾報警(如同“牧童的謊報”)令日趨麻痹的操作員(如同“村民”)完全漠視報警,甚至違規全面抑制(屏蔽)報警功能。而當險情真正降臨時(“大灰狼真來了”),操作員面對報警洪災而不知所措(如1994年英國Milford港Texaco煉油廠爆炸事故),甚至因違規關閉報警系統以致于操作員對近在咫尺的險情毫無察覺而束手無策(如2018年1月22日美國Pryor Trust井噴事故),最終釀成慘重事故。
三、ISA18.2/IEC62682報警生命周期管理體系:標本兼治之道
如何筑牢報警響應這第一道事故防線呢?答案是通過有效的報警管理提升操作員的響應性能。那么如何管理才稱得上有效呢?有效解決方案就是建立實施基于ISA18.2/IEC62682標準的涵蓋報警系統的全生命周期各階段(識別與合理化、設計、采購和實施、運行維護、性能監測評估、變更管理、體系審計和改進)的基于PDCA內外雙循環的報警管理體系,并配套應用專門的智能化先進報警響應管理系統軟件,從而為操作員創造一個能夠及時正確偵察感知、診斷和響應報警的良好環境。這是解決本文上一章所列舉的自控系統內置報警功能各種典型癥狀的標本兼治之道。
本文第二章列舉了DCS等自控系統內置報警功能的各種典型癥狀,其共同根源可以歸結為缺乏上圖所示的報警管理體系,具體主要表現在以下方面:
首先,沒有制定報警導則和開展各項活動所需的詳細規程,報警未經合理化分析而隨意設置,導致報警數量太多且無類別和優先級劃分,報警點的設定僅憑經驗直覺而缺乏基于PST(工藝過程安全時間)和可容忍響應時間的計算依據,HMI報警顯示界面上無完整的危險劇情和明確具體的響應規程。
其次,自控系統內置軟件無報警管理功能,對其KPI(關鍵性能指標)無法進行持續的監測評估和統計分析,從而無法對報警合理化的結果和后續的設計做針對性的優化調整(變更),也未開展體系審計以形成良性的PDCA循環。另外,除一線操作人員外,管理層對報警及其處置情況無法及時了解,不利于生產調度和決策指揮。
盡管操作員的可靠性還涉及操作規程、培訓及演練、操作管理和紀律等PSM(工藝過程安全管理)要素(非本文討論范疇),但如本文第二章所述,報警系統自身的性能直接影響操作員的偵察和診斷決策的可靠性。美國CCPS在一篇專著指出:KPI(性能指標)不受監控的報警系統在本質上屬于薄弱低效的系統,有時甚至幾乎等同于完全損壞(無效)。對報警系統缺乏有效管理和監控會導致報警泛濫低效常態化,進一步迫使操作員隨意抑制報警,最終使得報警響應這第一道事故防線幾乎形同虛設!
特別需要注意,對報警系統KPI的實時監測和周期性精準統計分析是確保報警管理體系PDCA循環的關鍵保障,而通過人工方式不僅效率低下,而且僅能統計一到兩項簡單指標(如前10位頻繁報警),準確度、計劃性和及時性也不夠高。因此,需要依托專業的智能化先進報警響應管理系統軟件(比如思創公司開發的SARMS軟件)自動監測統計分析下表所示的多項報警系統KPI(關鍵性能指標)基準(至少統計30天):
要改善上表中的KPI,尤其是要減少報警數量,必須確保ISA18.2/IEC62682報警生命周期管理體系形成PDCA良性循環,其中有兩項任務極其關鍵,即持續的報警KPI性能監測與報警合理化。
一是對每一個報警信號(尤其是報警率高的信號)開展正規的合理化分析,以確定該報警是否必要,另外對報警進行分類,并計算報警設定值、確定報警優先級,然后進行基本設計(設置報警死區、延遲時間等屬性與參數),必要時采用先進(增強型)報警設計方案。
二是安裝智能化先進報警管理系統軟件(如北京思創的SARMS),對每套裝置的報警信號實時在線統計分析,發現并消除滋擾報警、陳舊報警、頻繁報警、報警洪災等,對報警系統持續進行優化(返回合理化和設計階段),降低報警率。需要注意,報警合理化并非一次性工作,而是基于持續的報警KPI性能監測和周期性(7~30天)統計分析反饋結果而相應重復開展的活動。
四、SARMS智能化先進報警管理系統軟件:報警管理體系有效實施的必備工具
綜上所述,ISA18.2/IEC62682報警生命周期管理體系是針對自控系統內置報警功能各種典型癥狀的唯一的標本兼治之道,為操作員創造能及時正確偵察感知、診斷和響應報警的良好環境以提升操作員響應性能奠定了基礎,是筑牢報警響應這第一道事故防線的根本前提。那么企業應如何踐行ISA18.2標準呢?首先是對相關人員開展必要的培訓,然后制定APD、報警系統KPI基準、ASRS以及各階段活動的管理和技術規程,最后根據規程開展各階段活動。
對于新企業或新建項目可按照ISA18.2報警生命周期流程圖中的順序從APD開始進入PDCA循環;對于已有APD的企業的新建項目,可以從報警識別與合理化階段進入DCA-PDCA循環,或者先對APD做審計更新后,再做報警識別與合理化(CA-PDCA循環)。
對于現役報警系統,則宜采用CA-PD(ca-pdca)CA方式啟動技術改造項目,即不從P階段開始,而首先開展C(檢查)和A(改進)階段的活動,通過對企業報警管理現狀和現役報警系統的實際性能表現做初次摸底調查與分析評估,從而為設定適當的改進目標提供依據,為后續的PDCA良性循環提供一個啟動基準。
具體的做法是,首先依據ISA18.2/IEC62682標準對報警管理現狀的進行初次宏觀審計(基于粗略的檢查表),同時依托專業的智能化先進報警響應管理系統軟件對現役報警系統的KPI(關鍵性能指標)開展監測與分析評估(至少統計30天的數據),再根據審計和監測評估結果以及企業愿望和資源情況來確立報警系統的KPI初始基準。完成了上述初始CA階段活動后,就可以正式進入首輪PDCA循環,完成后再重復下一輪PDCA循環,周而復始并持續改善提高(建議周期不超過1年)。具體工作內容參見本文第二章。
無論是新建項目還是現役報警系統,都必須依托專業的智能化先進報警響應管理系統軟件,才能確保將ISA18.2/IEC62682報警生命周期管理體系中的各項活動納入高質量的PDCA循環,從而持續改善報警系統的各項KPI指標,筑牢報警響應這第一道事故防線。本章對由北京思創信息系統有限公司(www.kariehill.com)開發的SARMS智能化先進報警響應管理系統軟件的主要功能和應用效果做一下簡單介紹。
需要強調一下,SARMS智能化先進報警響應管理系統軟件的功能用途和自控系統操作站HMI軟件的報警功能用途是有顯著區別的,如下圖所示:
SARMS軟件不僅具備對各種基于HMI軟件的報警系統進行監控、管理和優化的功能,同時也具備HMI軟件的報警信息監控功能,只是信息終端由控制室的操作站換成了生產管理局域網上的PC機和經過授權的手機端,數據大約有秒級的延時(接近實時)。SARMS軟件的組成結構如下圖所示:
SARMS軟件的主要功能如下:
SARMS軟件的數據庫從DCS/PLC/SIS/GDS/FAS系統中自動采集各類信號,包括工藝報警、設備報警、易燃有毒氣體報警、火災報警、手動按鈕報警等。另外,SARMS軟件支持報警的初步設計功能,可在軟件中設置(組態)各種報警屬性,如報警限值(設定點)、報警信號類型(形式)、死區(滯環)、延遲激活/解除、報警信息(描述、原因/后果、響應規程等)。
SARMS軟件的KPI監測評估分析模塊對各類報警的各項KPI(關鍵性能指標)進行統計分析并與目標基準比對,顯示指標差距,督促分析導致差距的原因,為報警合理化結果與設計組態的更新糾正提供依據,以消除滋擾報警,改善性能。
另外,各類報警信號可按管控級別通過局域網、手機App或短信自動推送給不同層級的管理人員。SARMS軟件將報警監控功能由操作站HMI擴展至生產管理網絡上的PC機和相關人員手機端,大大提高了對安全關鍵報警的監控力度和廣度。領導層可隨時隨地(包括出差期間和非工作時間)接收掌握報警信息,不僅可及時協助現場進行分析和處理,還可以起到倒逼管理的作用。
SARMS軟件的報警合理化輔助模塊支持從HAZOP軟件CAH和LOPA軟件CAS中導入危險劇情和相關數據,不僅提高報警合理化的工作效率,還可將數據同步至報警信息監控模塊,利用HAZOP/LOPA分析結果作為知識庫自動分析并顯示和工藝報警關聯的劇情(原因、后果、可容忍響應時間),以便操作人員及時決策和采取響應行動。
對于安全關鍵報警信號,還可進一步與相應的報警響應規程(報警后處置步驟)聯動,同時推送至PC機和手機端,推送方式和內容關聯報警類別和優先級,有助于指揮人員及時決策和行動,有效發揮“黃金 5分鐘”作用;報警響應規程中提供的信息可支持缺乏經驗的初級操作員掌握高級操作員的知識,促進響應的一致性。如果操作站HMI軟件支持,建議組態報警響應規程彈窗功能,并與PC機和手機端的信息同步。
傳統的紙質應急處置卡涵蓋場景不全,一般限于發生?;稬OPC(失事點)之后的應對措施 ,針對性不強,未細化到針對每個安全關鍵報警一一對應設置專門的響應規程(應急處置方法步驟)。另外,除非操作人員在腦中熟記,否則查尋應急處置卡費時(尤其是在整本的操作手冊中查找),容易錯失及時阻止危險劇情傳播或事故擴大的“黃金5分鐘” 窗口期!而SARMS軟件的報警響應規程自動推送功能可將應急處置的時間關口從LOPC后前移至工藝參數剛剛偏離報警時,在不停產的前提下保證了安全。即使對于在LOPC之后需要啟動事故應急預案的安全關鍵報警(比如火氣報警或SIF拒動報警),SARMS軟件可自動推送事故應急預案以供管理層核實確認后及時下達啟動預案的決策,掌控關鍵的“黃金5分鐘”,避免事故擴大化!
SARMS軟件支持先進報警(增強型報警)設計和組態。比如基于狀態的報警/抑制,這種設計對抑制報警洪災有顯著作用。首出報警(SOE)是另外一種常見的先進報警設計。
支持CSV文件格式的報警組態文件的導入和導出。
企業可采用SARMS智能化先進報警響應管理系統軟件實現對全廠所有數字自動化控制系統(DCS/PLC/F&G等)的報警信息匯總和分布式監控,補充和擴展報警響應規程推送功能。同時對現役各種報警系統性能指標進行監測分析以持續改善,典型的項目工作流程如下圖所示:
在上圖所示的活動中,持續的報警KPI性能監測和報警合理化是ISA18.2/IEC62682報警生命周期管理體系PDCA循環中兩項最關鍵的任務。如本文第二和第三章所述,必須依托專業軟件才能確保KPI監測的質量和實時性,報警合理化可以采用電子表格工具而以人工方式開展分析(基于PH&RA),但用軟件輔助分析有益于提高效率和質量。北京思創信息系統有限公司研發的SARMS智能化先進報警和應急響應管理系統軟件不僅具備上述兩項功能,另外還內置報警信息和響應規程全方位24小時推送(聯網PC端和手機端)功能,同時具備事故前后應急響應調度指揮功能。北京思創提供和SARMS軟件配套的工程服務,包括實時數據或報警信息采集,基于MADB(報警主數據庫)的報警組態(配置),另外還為企業提供SARMS管理系統信息化平臺搭建運行所必需的下列相關咨詢服務:
1、指導業主制定體系化的報警導則以及開展報警合理化所需的標準工作規程;
2、主持或指導報警合理化分析;
3、幫助業主培養報警合理化分析的專業人才;
4、指導業主開展現場應急處置方案的可執行性分析。
當SARMS智能化先進報警響應管理系統軟件信息化平臺搭建調試完成并上線投運后,企業還需要制定配套的相關服務和崗位責任制度,制定工藝參數報警考核細則,加大檢查和考核力度,以考核促工藝報警管理水平的提升,以確?;贗SA18.2/IEC62682標準的綜合管理解決方案真正落地運行。
實踐證明,使用SARMS智能化先進報警響應管理系統綜合解決方案后能顯著提高報警的性能指標,并有助于提升報警管理的有效性和操作員的響應性能(正確性和速度),典型的使用效果如下圖所示:
某上市大型氯堿化工集團,原來各生產裝置的報警率都很高,因其主要產品PVC的生產屬于典型的間歇式工藝(約8 小時一個批次),在批次之間的開停工階段更會產生報警洪災。2021年開始逐步實施SARMS智能化先進報警響應管理系統結合報警合理化的綜合解決方案后,實現了報警數量大幅降低,尤其是采用基于狀態的抑制后消除了開停工階段的報警洪災,其中,聚合二期DCS報警數量比優化前減少了96.80%。其2021年前半年各生產裝置的報警KPI均逐步改善提升,參見下表:
總結
漠視“安全報警”的風險代價超乎普通人的直覺和想象,國內外屢屢發生的工藝(過程)安全事故慘痛教訓為人們一遍遍地敲響警鐘。牧童絕望凄厲的哭喊“大灰狼真來了”在耳邊一次次地回響,試圖喚醒那些可能仍在麻痹中祈禱賭運氣的?;菲髽I。
“如何筑牢報警響應這第一道事故防線”是擺在現實面前的嚴峻考題,必須通過體系化的科學方法才能從根本上予以解決。
概括而言,體系化的科學解決方案就是基于ISA18.2/IEC62682標準,建立實施涵蓋報警系統生命周期各階段(識別與合理化、設計、采購和實施、運行維護、性能監測評估、變更管理、體系審計和改進)有效的報警管理體系,并配套應用專業的智能化先進報警響應管理系統信息化平臺軟件(如北京思創的SARMS),從而為操作員創造一個能夠及時正確地感知偵察、診斷并響應報警的良好條件和環境,同時加強對操作員的報警響應日常培訓和定期演練,以最大程度降低人因失誤概率,確?!皥缶?人工響應”這第一道事故防線的安全可靠性,并和后續其它保護層的安全措施協作,共同將工藝(過程)安全事故風險降低,并維持在法律和企業的可容忍風險目標以下。此外,守牢報警響應這第一道事故防線,不僅確保了安全,還能顯著減少被迫緊急停車所導致的直接和間接生產損失。另外,報警性能的改善提升有助于提高工藝狀況平穩率、勞動生產率和產品質量,還可能有助于降低原料和能源消耗。