RCA、RCFA和FMEA在設備運維和故障診斷工作中是高頻詞匯,已經成了很多工程師的口頭語,但是這幾個名詞都分別是什么意思?它們是故障診斷么?
仔細辨別這些詞的意思并非咬文嚼字,在設備故障診斷以及設備全生命周期管理的工作中,這些名詞具有專門的含義,并且也指向專門的工作?;煜蜑E用會帶來很多誤解。
故障診斷的定義
故障診斷是最常用的詞匯,因此與之相關的概念十分多,包括“故障”、“失效”等,同時故障診斷與相臨近的工作發生很多聯系,有時候故障診斷的內容也會和其他工作內容相互混淆,比如“維修”、“維護”、“預測性維護”、“狀態監測”等。為了清楚故障診斷的含義,我們首先從故障診斷的定義談起,然后介紹故障診斷的任務工作內容。
首先,故障診斷的定義:故障診斷也稱診斷,是對設備或者系統故障進行查找的過程。用來檢查尋找故障的程序稱為診斷程序(請注意,這里的程序指的不一定是計算機程序,也包括流程,思路等),對其他設備或系統執行診斷的系統稱為診斷系統。
故障診斷是一種了解機器在運行過程中的狀態,并判斷其正?;蛘弋惓5倪^程。也有的資料里提出了,故障診斷是在機器運行過程中,不拆解機器并進行設備狀態是否正常的判斷。
故障診斷的范圍(工作內容)
故障診斷的主要工作包含三個方面:故障監測與發現、故障位置確定、故障類型判斷。
為了便于理解,經常將故障診斷工作的三個任務成為定時、定位、定責。
故障診斷的“定時”任務:當設備運行的時候,如果出現了某種故障,那么故障診斷的任務首先需要確定故障是什么時候發生的,這樣的工作就是故障的定時。
故障診斷的“定位”任務:當設備出現故障的時候,故障診斷工作的一個重要任務就是確定故障發生的位置。故障定位的作用是為了后續故障處置工作提供信息支持。在一些設備的故障處置工作中,第一步往往是故障的隔離,也就是將發生故障的部位與整個系統進行隔離(在工業設備中,往往會使用設備切換的方式,將備用機投入使用),避免故障的擴展,此時故障診斷的定位就為故障隔離提供了目標。
故障診斷的“定責”任務:故障診斷的定責工作就是確定故障的類型。需要注意的是,嚴格意義的故障診斷定責工作就是故障類型的確定,不包含故障原因的查找以及故障的恢復工作。實際工作中,多數工程師都將故障診斷的定責與故障原因查找和故障恢復發生了混淆。
既然故障診斷的任務不包括故障原因的查找,那么平常的故障診斷工作中尋找問題原因的工作是如何進行的呢?在實際工作中,從設備出現故障,到工程師發現故障并非是一個完整的工作循環,其間還少了故障原因查找(分析)、故障處置與排除,設備故障恢復的工作,并且這這些工作過程中還需要采取一些措施,以防止故障再次出現。
所有這些從故障發現和類型確定環節到設備故障恢復環節中的工作,都需要基于針對故障的分析。
故障分析的工作分析什么呢?根據目的的不同又有哪些差異呢?今天昌暉儀表談談RCA、RCFA和FMEA。
RCA
RCA是Root Cause Analysis的縮寫,字面上的意思是根本原因分析。事實上根據ASQ(American Society for Quality)的定義:RCA是一個結構性的調查過程,旨在確定導致問題的真正原因,并且采取相應措施消除這一誘因。
RCA是一個廣泛的定義,它包含對問題誘因的解釋和建模的一套寬范圍的方法、工具和技術。事實上RCA不僅僅可以用于工業設備,它同樣適用于組織機構問題、生產問題和管理問題等的分析。
同時,從RCA的定義不難發現,RCA包含了原因查找和采取相應措施等工作。因此不難發現,設備工程師日常所進行的所謂故障診斷工作實際上更像RCA的工作。
RCFA
RCFA是Root Cause Failure Analysis 的縮寫,字面意思是失效根本原因分析。RCFA是失效分析的范疇,失效分析的工作指的是對失效的觀察、界定以及描述。在進行失效分析的過程中,不一定需要對導致失效的原因進行確認。
很多用戶都會發現,當你把失效的設備給專門機構進行失效分析的時候,失效分析報告的結論僅僅是對失效模式進行分類,最多會加入一些國際標準對此類失效可能誘因的描述,并不會對你實際的設備問題和誘因進行分析。嚴格意義上說,這樣的工作是符合RCFA定義的。
另一方面,RCFA的分析對象是“失效”?!笆А笔且阅撤N物理改變(或者物理失效)為目標的,而RCA分析的對象可能是安全事件、質量事件等更多領域的“故障”。
FMEA
FMEA是Failure Mode and Effects Analysis 的縮寫,即失效模式及其后果分析。FMEA是在產品合計階段和過程設計階段對構成產品的子系統、零件,對構成過程的各個工序逐一進行分析,找出潛在失效模式、并分析其可能得后果,從而預先采取必要措施,提高產品質量和可靠性的系統化活動。
從FMEA的定義可以看到,這是一個基于假設的分析方法。這里的假設是指對“可能發生故障”的假設,也就是對于故障潛在發生的可能,其分析的指標包括風險和可能性等。
FMEA可以被理解為一種預先實施的分析工作,其目的是在問題發生以前減少問題誘因。這和大多數工程師所討論的設備出現故障之后的分析和處置顯然不是一回事兒。
故障診斷、RCA、RCFA和FMEA的關系
設備運維領域相關的名詞具有本質的差異,并且具有一定的關系。
在設備進行設計、安裝、調試和運行的時候,工程師會使用FMEA的體系去降低設備出現故障的可能性。
當設備投入運行的時候,故障診斷工作負責對故障發生的時間、位置和類型進行確認。
當設備故障的定時、定位、定責信息收集到之后,可以支持RCFA工作。通過RCFA工作進一步識別了設備失效的類型。所有的信息將通過RCA工作得到導致設備出現故障的原因,并提出改善措施避免故障再一次的發生。
上述過程才是設備從設計、安裝、投入運行到最后故障恢復的全過程的正確叫法。因此,工程師們,請嚴格規范使用名詞。
作者:王勇
共有訪客發表了評論
網友評論