MTBF,即平均故障間隔時間,英文全稱是“Mean Time Between Failure”,就是從新的產品在規定的工作環境條件下開始工作到出現**個故障的時間的平均值。MTBF越長表示可靠性越高正確工作能力越強 。單位為“小時”。它反映了產品的時間質量,是體現產品在規定時間內保持功能的一種能力。
具體來說,是指相鄰兩次故障之間的平均工作時間,也稱為平均故障間隔。它僅適用于可維修產品。同時也規定產品在總的使用階段累計工作時間與故障次數的比值為MTBF。磁盤陣列產品一般MTBF不能低于50000小時。MTBF值是產品設計時要考慮的重要參數,可靠性工程師或設計師經常使用各種不同的方法與標準來估計產品的MTBF值。
1、MTBF的計算方法
失效時間是指上一次設備恢復正常狀態起,到設備此次失效那一刻之間間隔的時間。
MTBF值是產品設計時要考慮的重要參數,可靠性工程師或設計師經常使用各種不同的方法與標準來估計產品的MTBF值。相關標準包括MIL-HDBK-217F、Telcordia SR332、Siemens Norm、Fides或UTE C 80-810(RDF2000)等。不過這些方法估計到的值和實際的平均故障間隔仍有相當的差距。計算平均故障間隔的目的是為了找出設計中的薄弱環節。
2、MTBF 是平均故障間隔時間
隨著服務器的廣泛應用,對服務器的可靠性提出了更高的要求。所謂“可靠性”,就是產品在規定條件下和規定時間內完成規定功能的能力;反之,產品或其一部分不能或將不能完成規定的功能是出故障。概括地說,產品故障少的就是可靠性高,產品的故障總數與壽命單位總數之比叫“故障率”(Failure rate),常用λ表示。例如正在運行中的100只硬盤,一年之內出了2次故障,則每個硬盤的故障率為0.02次/年。
當產品的壽命服從指數分布時,其故障率的倒數就叫做平均故障間隔時間,簡稱MTBF。即:MTBF=1/λ 。
標準故障率的曲線可以用眾所周知的“浴盆曲線”來描述。所有元件和系統的曲線形狀都近似相同-只是時間軸方向上的延伸率不同。它可以分 為三個區域:早期故障期(I),有效工作期(II),生命終期(III)。MTTF包含了區域I和 II,而MTBF只包含了區域(II)。
第I部分描述了早期故障,它通常是由潛在的材料失效或者是在發貨前的*終產品檢測中沒被發現的制造缺陷所造成的。早期故障通常持續的時間較短,即使是很復雜的系統在使用了200 小時后也很少再出現早期故障。例如DC-DC轉換器來說,大多數早期故障會在使用24小時之內 發生。24小時對保質期為三年的轉換器來說可能很短,但是試想一個DC-DC轉換器的工作頻率為100Hz,開關三極管和變壓器在使用的**天就會被操作1億4千萬次以上,因而如果有元件 缺陷的話這段時間內就應該會發生故障。
因為熱應力也是增加失效率的原因之一,從早期故障到有效工作之間的過渡時間(T1)可以 通過在熱箱中的預燒處理得到顯著的縮短。如果產品在高溫條件下工作, 那么4小時的預燒時間測試就足以發現幾乎所有的早期故障。如果在*終應用中還是出現了早期故障,那么可以增加預燒時間。對于高可靠性的應用裝置例如鐵軌,預燒時間多為24小 時。
在有效工作壽命階段,區域II,故障率持續穩定在較低的等級。第二個過渡時間(T2),從 有效果工作壽命階段到產品的生命終期,受到許多因素的影響,比如設計以及所使用的元件 的質量,制造時的組裝質量以及應用的環境壓力。區域III表明了產品壽命周期的末期,其間 由于磨損,材料的化學降解和突發故障導致產品性能下降。
大多制造商使用預燒處理來發現主要的早期故障,MTBF特性通常可以在規格書中找到。
一些制造商更傾向于使用MTBF失效率的倒數,基于109小時,稱為失效時間(Failures In Time/FIT):
*近看到一款可用于服務器的硬盤,MTBF高達120萬小時,保修5年。120萬小時約為137年,并不是說該種硬盤每只均能工作137年不出故障。由MTBF=1/λ可知λ=1/MTBF=1/137年,即該硬盤的平均年故障率約為0.7%,一年內,平均1000只硬盤有7只會出故障。
3、MTBF的計算
通常,我們在產品的手冊或包裝上能夠看到如產品MTBF值,如8000小時,2萬小時,那么,MTBF的數值是怎樣算出來的呢,假設一臺電腦的MTBF為3萬小時,是不是把這臺電腦連續運行3萬小時檢測出來的呢?答案是否定的,如果是那樣的話,我們有那么多產品要用幾十年都檢測不完的。其實,關于MTBF值的計算方法,目前*通用的權威性標準是MIL-HDBK-217、GJB/Z299B和Bellcore,分別用于軍工產品和民用產品。其中,MIL-HDBK-217是由美國國防部可靠性中心及Rome實驗室提出并成為行業標準,專門用于軍工產品MTBF值計算,GJB/Z299B是我國軍用標準;而Bellcore是由AT&TBell實驗室提出并成為商用電子產品MTBF值計算的行業標準。
MTBF計算中主要考慮的是產品中每個器件的失效率。但由于器件在不同的環境、不同的使用條件下其失效率會有很大的區別,例如,同一產品在不同的環境下,如在實驗室和海洋平臺上,其可靠性值肯定是不同的;又如一個額定電壓為16V的電容在實際電壓為25V和5V下的失效率肯定是不同的。所以,在計算可靠性指標時,必須考慮上述多種因素。
簡單介紹MTBF的一種計算方式
(1)先求出各元器件的工作故障率λp:
λp=λb*πQ*πS*πT
其中λb:元器件基本故障率,元器件失效率表中查得
πQ:為器件的品質系數,由物料認證工程師確認
πS:為電壓或電流應力系數
πT:為器件的溫度系數
(2)λ求出系統的工作故障率λs
λs=πE*SUM(Aλp1,Bλp2,...NλPI)
其中λpi:第i種元器件的工作故障率
πE:環境系數,根據系統應用環境選擇環境系數
Ni:第i種元器件的數量
N:產品中元器件的種類
(3)MTBFλ第三步,求出產品的MTBF=1/λs
其實MTBF針對可靠度只是衡量指標,這些計算實際上都還是**步,更重要的是后面的步驟:根據這些衡量指標的計算過程,發現影響產品可靠性的關鍵部件、環節等等,改進產品的設計、生產,*終的目的是提高產品的可靠性。
4、MTBF分析的目的
(1)針對高頻率故障零件的重點對策及零件壽命延長的技術改造依據。
(2)進行零件壽命周期的推算及*佳維修計劃編制。
(3)有關點檢對象、項目的選擇與點檢基準的設定、改善。
(4)用于指導內外部維修工作分配。根據公司內設備修復能力的評價,以設備類型、作業種類的不同來決定內部分別承擔工作的維修質量與設備效率方面的風險,作為維修外包的重要參考。
(5)設定備品備件基準。機械、電氣零件的各儲備項目及基本庫存數量,應根據MTBF的記錄分析來判斷,使其庫存水平達到*經濟的狀況。
(6)作為選擇維修技術方法改善重點的參考依據。為了提高設備開動率,必須縮短與設備停機相關的長時間維修作業及工程調整、切換的時間。因此,有必要對維護作業方法進行檢驗,而其檢驗的項目、優先順序的選擇等基本情況,均需要依據MTBF的分析記錄表。
(7)用于設備對象設定預估運行時間標準,及其維護作業的選定與維護時間標準的研究。維修計劃預估時間標準的設定及維護作業的選定,必須考慮設備維護重復周期或標準時間值與實際維護時間的差異及相應維護作業特性等因素,因此,MTBF 分析表是非常必要的。
(8)圖樣整理及重新選定重點設備或零件時的參考。MTBF的分析記錄表所記錄的設備零件改造項目或摩擦劣化等信息,以及設備圖樣修改或前期制作等情況,通過能經常作分析檢驗及重要性排序管理,可以使工程圖樣管理變得更容易。
(9)運行操作標準的設定、修訂及決定設備維護業務的責任分派。
(10)提供設備的可靠性、維修性設計的技術資料。維護技術*重要的是以MTBF分析表為基礎,收集有關設備的可靠性、可維修性設計的技術信息,以便提供給設計部門在設計設備時參考。