Czasami terminy „przewidywanie” i „oszacowanie” są używane zamiennie, jednak ta praktyka nie jest prawidłowa. Metody przewidywania współczynnika MTBF obliczają wartość na podstawie projektu systemu, zazwyczaj stosowane są na początku cyklu eksploatacji produktu.
Metody przewidywania i obliczania współczynnika MTBF
Metody przewidywania są użyteczne w przypadku małej ilości lub braku danych roboczych, tak jak ma to miejsce w przypadku promu kosmicznego lub projektów nowych produktów. Jeżeli dostępna jest wystarczająca liczba danych roboczych, nie należy usuwać metod przewidywania. Zamiast tego należy użyć metod szacowania współczynnika MTBF, ponieważ odzwierciedlają one rzeczywiste pomiary awarii. Metody szacowania współczynnika MTBF obliczają wartość na podstawie obserwowanej próbki podobnych systemów. Zazwyczaj wykonuje się to po wdrożeniu dużej populacji produktów. Oszacowanie współczynnika MTBF jest najczęściej używaną metodą obliczania współczynnika MTBF, głównie ponieważ wykonuje się je na podstawie rzeczywistych produktów, które oddano do użytku.
Wszystkie te metody są z natury statystyczne, co oznacza, że dają one przybliżoną wartość rzeczywistego współczynnika MTBF. Żadna metoda nie jest standardem w całym przemyśle. Dlatego tak ważne jest, aby producenci zrozumieli zasady działania tych metod i wybrali najlepszą odpowiednio do danego zastosowania. Metody opisane poniżej, mimo że ich lista jest niepełna, stanowią ilustrację, na jak wiele sposobów można uzyskać współczynnik MTBF.
Metody przewidywania niezawodności
Pierwsze metody przewidywania niezawodności zostały opracowane w 1940 roku przez niemieckiego naukowca o nazwisku Von Braun oraz niemieckiego matematyka Erica Pieruschka. Próbując rozwiązać wiele problemów związanych z niezawodnością rakiety V-1, Pieruschka pomagał Von Braunowi przy modelowaniu niezawodności i w ten sposób utworzył pierwszy udokumentowany nowoczesny predyktywny model niezawodności. Później wraz ze wzrostem przemysłu nuklearnego NASA przyczyniła się do dalszego rozwoju analizy niezawodności. Obecnie istnieje wiele metod przewidywania współczynnika MTBF.
MIL-HDBK 217
Opublikowany przez armię amerykańską w 1965 roku model Military Handbook 217 utworzono w celu zapewnienia standardu oceny niezawodności systemów elektronicznych i sprzętu wojskowego w celu zwiększenia niezawodności projektowanego sprzętu. Ustanawia on wspólną płaszczyznę porównywania niezawodności między dwoma lub więcej podobnymi projektami. Model Military Handbook 217 jest również określany jako Mil Standard 217 lub po prostu 217. W tym modelu istnieją dwa sposoby przewidywania niezawodności: prognozowanie na podstawie liczebności części (ang. Parts Count Prediction) oraz prognozowanie na podstawie analizy narażeń części (ang. Parts Stress Analysis Prediction).
Metoda przewidywania liczby części służy ogólnie do przewidywania niezawodności produktu na początku cyklu opracowywania produktu w celu uzyskania przybliżonej oceny niezawodności względem docelowej niezawodności lub specyfikacji. Współczynnik awarii oblicza się poprzez zliczenie podobnych elementów produktu (np. kondensatorów) i pogrupowanie ich na różne typy elementów (np. kondensator foliowy). Liczba elementów w każdej grupie zostaje wtedy pomnożona przez ogólny współczynnik awarii oraz czynnik jakości określony w modelu 217. Na koniec dodaje się współczynniki awarii wszystkich różnych grup części, aby uzyskać końcowy współczynnik awarii. Według definicji metoda zliczania części zakłada, że wszystkie elementy występują w seriach i wymaga oddzielnego obliczania wskaźników awarii dla elementów nieseryjnych.
Metoda przewidywania obciążenia części jest używana znacznie później w cyklu opracowywania produktu, tuż przed wprowadzeniem projektu rzeczywistych obwodów i sprzętu do produkcji. Jest ona podobna do metody zliczania części pod względem sposobu sumowania wskaźników awaryjności. Jednak w przypadku korzystania z metody obciążenia części wskaźnik awaryjności dla każdego elementu jest obliczany osobno na podstawie określonych poziomów obciążenia, które działa na element (tzn. wilgotność, temperatura, wibracje, napięcie). Aby przypisać odpowiednie poziomy obciążenia dla każdego elementu, projekt produktu i jego oczekiwane środowisko muszą być odpowiednio udokumentowane i zrozumiałe. Metoda obciążania części generuje zwykle mniejszy wskaźnik awaryjności niż metoda zliczania części. Z powodu wymaganego poziomu analizy ta metoda jest bardzo czasochłonna w porównaniu z innymi metodami.
Obecnie model 217 jest rzadko używany. W 1996 roku armia amerykańska ogłosiła, że należy zaprzestać używania modelu MIL-HDBK-217, ponieważ „okazał się być zawodny i jego używanie może doprowadzić do błędnego i mylącego oszacowania niezawodności”. Model 217 został odrzucony z wielu powodów, z których większość jest związana z faktem, iż niezawodność elementów przez ostatnie lata znacznie wzrosła do punktu, w którym nie jest już traktowana jako główna przyczyna awarii produktu. Wskaźniki awaryjności modelu 217 są bezpieczniejsze (wyższe) niż w przypadku dostępnych obecnie elementów elektronicznych. Dokładna analiza awarii obecnie używanych urządzeń elektronicznych pokazuje, że przyczyną większości awarii było najprawdopodobniej błędne zastosowanie (błąd ludzki), sterowanie procesami lub projekt produktu.
Telcordia
Model przewidywania niezawodności Telcordia został opracowany w przemyśle telekomunikacyjnym i na przestrzeni lat ulegał wielu zmianom. Najpierw został opracowany przez firmę Bellcore Communications Research pod nazwą Bellcore jako metoda umożliwiająca oszacowanie niezawodności urządzeń telekomunikacyjnych. Mimo, że model Bellcore był oparty na modelu 217, jego modele niezawodności (równania) zostały zmienione w 1985 roku, tak aby odzwierciedlały doświadczenia dotyczące urządzeń telekomunikacyjnych. Ostatnia wersja modelu Bellcore to TR-332 Issue 6 z grudnia 1997 roku. Następnie w roku 1997 firma SAIC zakupiła model Bellcore i zmieniła jego nazwę na Telcordia. Ostatnia wersja modelu Telcordia Prediction Model to SR-332 Issue 1, opublikowana w maju 2001 roku, która dodatkowo oferuje różne metody obliczeń poza tymi w modelu 217. Obecnie model Telcordia nadal jest stosowany jako narzędzie do projektowania produktów w tej branży.
HRD5
HRD5 to model opracowany na podstawie podręcznika danych o niezawodności elementów elektronicznych (Handbook for Reliability Data for Electronic Components) używany w systemach telekomunikacyjnych. Model HRD5 został opracowany przez firmę British Telecom i jest używany głównie w Wielkiej Brytanii. Jest podobny do modelu 217, ale nie obejmuje tak wielu zmiennych środowiskowych i zawiera model przewidywania niezawodności obejmujący szerszy zakres elementów elektronicznych, włącznie z telekomunikacyjnymi.
RBD (Reliability Block Diagram)
Schemat blokowy niezawodności (Reliability Block Diagram — RBD) jest reprezentatywnym narzędziem do kreślenia i obliczeń używanym do modelowania gotowości i niezawodności systemu. Struktura schematu blokowego niezawodności definiuje wzajemne logiczne oddziaływanie awarii w systemie, ale niekonieczne ich logiczne lub fizyczne połączenie. Każdy blok może przedstawiać pojedynczy element, podsystem lub inną reprezentatywną awarię. Schemat może przedstawiać cały system, dowolny podzbiór lub kombinację tego systemu, która wymaga analizy awarii, niezawodności lub gotowości. Służy również jako narzędzie do analiz, które przedstawia sposób działania każdego elementu systemu oraz wpływ każdego elementu na działanie całego systemu.
Model Markowa
Modelowanie Markowa umożliwia analizę złożonych systemów, takich jak architektury elektryczne. Modele Markowa są znane również jako schematy przestrzeni stanu lub wykresy stanu. Przestrzeń stanu jest zdefiniowana jako zbiór wszystkich stanów, w których system może się znajdować. W przeciwieństwie do schematów blokowych, wykresy stanów stanowią dokładniejszą reprezentację systemu. Wykresów stanów uwzględniają zależności awarii elementów, jak również różnych stanów, których nie można przedstawić za pomocą schematów blokowych, takich jak zasilacz UPS zasilany z baterii. Poza współczynnikiem MTBF, modele Markowa udostępniają różne inne pomiary systemu, włącznie z dostępnością, współczynnikiem MTTR, prawdopodobieństwem wystąpienia danego stanu w określonym czasie i wiele innych.
FMEA / FMECA
Analiza FMEA (Failure Mode and Effects Analysis) jest procesem używanym do analizy trybów awarii produktu. Te informacje są następnie używane do określania wpływu każdej awarii na produkt, co prowadzi do ulepszenia projektu produktu. Analizę można przyspieszyć, przypisując do każdego trybu awarii poziom ważności. W przypadkach tego typu można ją nazwać analizą FMECA (Failure Mode, Effects and Criticality Analysis). W analizie FMEA używane jest podejście „wstępujące”. Na przykład w przypadku zasilacza UPS analiza zaczyna się od elementu na poziomie płyty drukowanej, a kończy się na poziomie całego systemu. Poza używaniem jej jako narzędzia do projektowania produktu, może ona również służyć do obliczania niezawodności całego systemu. Dane dotyczące prawdopodobieństwa potrzebne podczas obliczeń mogą być trudne do uzyskania w przypadku różnych części sprzętu, szczególnie jeśli mają wiele stanów lub trybów pracy.
Drzewo uszkodzeń
Analiza za pomocą drzewa uszkodzeń jest techniką opracowaną przez Bell Telephone Laboratories, która służy do przeprowadzania oceny bezpieczeństwa systemu Minuteman Launch Control System. Później zastosowano ją do analizy niezawodności. Drzewa awarii mogą być pomocne w szczegółowym określeniu ciągu zdarzeń, normalnych i dotyczących awarii, które prowadzą do analizowanej awarii lub niepożądanego zdarzenia na poziomie elementu (analiza „od góry do dołu”). Niezawodność jest obliczana przez konwersję pełnego drzewa awarii na odpowiedni układ równań. Można to zrobić, wykorzystując algebrę zdarzeń nazywaną również algebrą Boolowską. Podobnie jak w przypadku analizy FMEA, dane dotyczące prawdopodobieństwa potrzebne do obliczeń mogą być trudne do uzyskania.
HALT
Metoda HALT (Highly Accelerated Life Testing) służy do zwiększania ogólnej niezawodności projektu produktu. Metoda HALT służy do określania czasu potrzebnego na wystąpienie awarii produktu, poddając go szczegółowym pomiarom i kontrolowanemu obciążeniu, takiemu jak temperatura i wibracje. Rzeczywista ilość czasu do wystąpienia awarii produktu szacowana jest z wykorzystaniem modelu matematycznego. Chociaż za pomocą metody HALT można oszacować współczynnik MTBF, jego główną funkcją jest zwiększanie niezawodności projektu produktu.
Metody szacowania niezawodności
Metoda prognozowania na podstawie podobieństwa elementów Ta metoda umożliwia szybkie oszacowanie niezawodności na podstawie wcześniejszych danych dotyczących niezawodności podobnego elementu. Efektywność tej metody zależy głównie od stopnia podobieństwa sprzętu nowego do istniejącego, dla którego dostępne są zebrane dane robocze. Podobne powinny być procesy produkcyjne, środowiska pracy, funkcje produktu i projekty. Ta metoda przewidywania jest szczególnie użyteczna w przypadku produktów odpowiadających określonej ścieżce rozwoju, ponieważ wykorzystuje wcześniejsze doświadczenia. Jednak w ostatecznym przewidywaniu należy dokładnie przeanalizować i uwzględnić różnice między nowymi projektami.
Metoda pomiaru danych eksploatacyjnych
Metoda pomiaru danych eksploatacyjnych jest oparta na rzeczywistych doświadczeniach związanych z produktami. Ta metoda jest prawdopodobnie najczęściej używana przez producentów, ponieważ stanowi integralną część programu kontroli jakości. Programy te często noszą nazwę Zarządzanie wzrostem niezawodności. Śledząc wskaźnik awaryjności używanych produktów, producent może szybko określić i rozwiązać problemy, usuwając dzięki temu usterki produktów. Ponieważ metoda ta opiera się na rzeczywistych awariach w trakcie pracy, uwzględnia ona tryby awarii pomijane czasami przez metody przewidywania. Ta metoda obejmuje śledzenie przykładowej grupy nowych produktów i zbieranie danych dotyczących awarii. Po zebraniu danych obliczane są współczynniki awaryjności i MTBF. Współczynnik awaryjności stanowi procent grupy jednostek, których „awaria” jest spodziewana w roku kalendarzowym. Oprócz kontroli jakości dane te są używane również w celu udostępnienia klientom i partnerom informacji dotyczących procesów związanych z niezawodnością i jakością. Ponieważ metoda ta jest powszechnie używana przez producentów, zapewnia wspólną płaszczyznę porównywania wartości współczynnika MTBF. Porównania te umożliwiają użytkownikom oszacowanie różnic dotyczących niezawodności produktów, co stanowi narzędzie ułatwiające podejmowanie decyzji dotyczących specyfikacji lub zakupu. Podobnie jak w przypadku innych porównań, bardzo ważne jest, aby krytyczne zmienne były takie same dla wszystkich porównywanych systemów. W przeciwnym razie istnieje prawdopodobieństwo podjęcia niewłaściwej decyzji, która może spowodować straty finansowe.
Współczynnik MTBF jest „modnym terminem” używanym powszechnie w branży IT. Wiele wartości używanych jest bez zrozumienia ich rzeczywistego znaczenia. Współczynnik MTBF, będąc wskaźnikiem niezawodności, nie oznacza szacowanego okresu eksploatacji produktu. Ostatecznie wartość współczynnika MTBF jest bez znaczenia, jeśli nie zdefiniowano awarii i jeśli założenia odbiegają od rzeczywistości lub nie są w ogóle określone.