MTBF・MTTR と稼働率シミュレーター 戻る
信頼性工学

MTBF・MTTR と稼働率シミュレーター

修理しながら使い続けるシステムが「どれだけ頼りになるか」を評価するツールです。総稼働時間・故障回数・修復時間を変えると、MTBF(平均故障間隔)・稼働率(アベイラビリティ)・ミッション信頼度・年間ダウンタイムがリアルタイムで分かり、「何ナイン」の水準かを確認できます。

パラメータ設定
総稼働時間 T_op
h
観測期間中に実際に稼働した延べ時間(8760h=1年)
故障回数 N_fail
観測期間中に発生した故障(停止)の総数
平均修復時間 MTTR
h
故障発生から復旧までに要する平均時間
ミッション時間 t
h
無故障で完遂したい1回の運用の長さ
計算結果
MTBF 平均故障間隔 (h)
故障率 λ (/h)
稼働率(アベイラビリティ)(%)
ミッション信頼度 R(t) (%)
年間ダウンタイム (h)
稼働率の評価
システムの稼働タイムライン — 稼働(緑)と修復(赤)

長い緑のセグメントが MTBF(稼働)、短い赤のセグメントが MTTR(修復)を表します。緑が占める割合が稼働率です。タイムラインは時間とともに左へスクロールします。

ミッション信頼度 R(t) とミッション時間
稼働率と MTTR の関係
理論・主要公式

$$\text{MTBF}=\frac{T_{op}}{N_{fail}},\qquad A=\frac{\text{MTBF}}{\text{MTBF}+\text{MTTR}},\qquad R(t)=e^{-t/\text{MTBF}}$$

MTBF:平均故障間隔(総稼働時間 T_op を故障回数 N_fail で割る)。A:稼働率(アベイラビリティ)。R(t):ミッション時間 t を無故障で完遂する確率。

$$\lambda=\frac{1}{\text{MTBF}},\qquad D_{year}=(1-A)\times 8760$$

λ:故障率(MTBF の逆数、1時間あたりの故障発生率)。D_year:年間の期待ダウンタイム。稼働率 A は MTBF を増やしても、MTTR を減らしても向上する。

MTBFと稼働率とは

🙋
機器のカタログに「MTBF 5万時間」とか書いてありますよね。あれって「5万時間は壊れません」っていう意味なんですか?
🎓
よくある誤解だね。MTBF は「平均故障間隔」で、ざっくり言うと「同じ機種をたくさん並べたとき、平均してどれくらいの間隔で1台が壊れるか」を表す統計値なんだ。1台ごとの寿命保証じゃない。故障率が一定の集団なら、MTBF より前に壊れる個体は山ほどある。「保証期間」とはまったく別物だと思っておいたほうがいい。
🙋
なるほど…。じゃあ実務で「このシステムは頼りになる」って言うとき、何の数字を見ればいいんですか?
🎓
一番よく使うのが「稼働率(アベイラビリティ)」だよ。A = MTBF ÷(MTBF+MTTR)。MTTR は平均修復時間、つまり壊れてから直るまでの時間。稼働率は「全時間のうち、システムがちゃんと動いて仕事ができている割合」なんだ。左で故障回数を増やすと MTBF が短くなって、稼働率がスッと下がるのが見えるはずだよ。
🙋
あ、本当だ。でも修復時間 MTTR を動かしても稼働率が変わりますね。MTBF を伸ばすのと、どっちが大事なんですか?
🎓
いい質問だ。実はそこが信頼性設計の肝でね。稼働率は「故障を減らす(MTBF を伸ばす)」方向と「修理を速くする(MTTR を縮める)」方向の、両方から上げられるんだ。例えばデータセンターのサーバなら、部品を二重化して故障そのものを減らすのも手だし、予備品を常備して交換を10分で終わらせるのも手。下の「稼働率と MTTR」グラフを見ると、MTTR を縮めるだけで稼働率がぐっと上がるのが分かるよ。
🙋
「ファイブナイン」って言葉も聞きます。あれは稼働率のことですか?
🎓
そう、ファイブナインは稼働率 99.999% のこと。9 が5つ並ぶからファイブナイン。これがどれだけ厳しいか実感するには、年間の停止許容時間を計算するといい。1年は約 52万5600分だから、99.999% だと止まっていいのは年間たった約5分。スリーナイン(99.9%)なら年8.8時間、フォーナイン(99.99%)なら年53分。電話交換機や金融システムはファイブナインを狙うけど、そのためには冗長化と自動フェイルオーバが必須で、コストは桁違いに上がるんだ。
🙋
最後にもうひとつ。「ミッション信頼度 R(t)」って稼働率とは別の数字なんですよね?
🎓
そう、答える質問が違うんだ。稼働率は「全時間のうち何割が動いているか」。ミッション信頼度 R(t) = e^(−t/MTBF) は「ある特定の長さ t の運用を、途中で一度も故障せずに完遂できる確率」。例えば人工衛星の打ち上げや、無停止で回したい連続運転プラントの一工程みたいに「この区間だけは絶対に止まってほしくない」という場面で効いてくる。同じ MTBF でも、ミッションが長いほど R(t) は指数関数的に下がっていくよ。

よくある質問

MTBF(Mean Time Between Failures、平均故障間隔)は修理して使い続ける「修理系」システムの指標で、ある故障から次の故障までの平均稼働時間です。MTTF(Mean Time To Failure、平均故障寿命)は電球やヒューズのように壊れたら交換する「非修理系」の指標で、使い始めから故障までの平均時間です。本ツールが扱うのは修理系で、MTBF = 総稼働時間 ÷ 故障回数 で求めます。修理時間 MTTR を含むかどうかが両者の最大の違いです。
必ずしもそうではありません。稼働率は A = MTBF ÷(MTBF+MTTR)で決まるため、MTBF が長くても MTTR(修復時間)が長ければ稼働率は下がります。例えば MTBF が 10000 時間でも、1回の修理に 500 時間かかれば稼働率は約 95.2% にとどまります。逆に MTBF が 730 時間と短くても MTTR が 8 時間なら稼働率は 98.9% です。稼働率は「故障を減らす」方向と「修理を速くする」方向の両方から改善できる、というのが信頼性設計の要点です。
ファイブナインは稼働率 99.999% を指し、1年(8760時間=525600分)のうち停止が許されるのは約 5.3 分だけ、という非常に厳しい水準です。スリーナイン(99.9%)なら年間約 8.8 時間、フォーナイン(99.99%)なら約 53 分の停止に相当します。電話交換機や基幹サーバ、金融システムなどでファイブナインが目標になりますが、これを達成するには冗長構成・自動フェイルオーバ・予備品の常備が不可欠で、コストも急増します。
違います。MTBF は寿命でも保証期間でもなく、あくまで統計的な「平均の故障率」を時間に直したものです。故障率が一定の集団では、多くの個体は MTBF より前に故障します。例えば MTBF が 50000 時間のハードディスクでも、5年(約44000時間)使えば故障する確率は無視できません。MTBF は「この機種を多数並べたとき、平均してどれくらいの間隔で1台が壊れるか」を表す指標であり、1台ごとの寿命保証ではない点に注意が必要です。

実世界での応用

データセンター・IT インフラ:サーバ、ストレージ、ネットワーク機器の SLA(サービス品質保証)は稼働率で定義されます。「月間稼働率 99.95% 以上」といった契約値を満たすため、設計段階で各構成要素の MTBF と MTTR を積み上げ、冗長化の有無を含めてシステム全体の稼働率を見積もります。MTTR を縮めるための無停止保守・ホットスワップ・自動フェイルオーバは、稼働率を上げる最も費用対効果の高い投資のひとつです。

製造業の設備保全(OEE):工場の生産設備では、稼働率は設備総合効率 OEE の三要素(時間稼働率・性能稼働率・良品率)のうち時間稼働率に対応します。突発故障による停止を減らすため、MTBF を監視して劣化傾向を捉え、計画保全や予知保全に切り替える判断材料にします。同じ設備でも、修理体制と予備品在庫しだいで MTTR が数倍変わり、結果として年間生産量に直結します。

航空・宇宙・防衛:人工衛星や航空機システムでは、ミッション信頼度 R(t) が設計目標になります。打ち上げから運用終了まで「修理ができない」前提のため、稼働率より「ミッション期間を無故障で完遂できる確率」が問われます。冗長系を組み、各サブシステムの故障率 λ を積み上げて、要求 R(t) を満たすかを検証します。

調達・保守契約の評価:機器を購入・リースする側は、カタログ MTBF と保守 SLA の MTTR から、運用後の稼働率と年間ダウンタイムを試算します。本ツールのような簡易計算で「この MTBF・MTTR なら年間何時間止まるか」を把握しておくと、複数ベンダーの提案を同じ土俵で比較でき、保守費用と停止損失のトレードオフを定量的に議論できます。

よくある誤解と注意点

まず最大の誤解が、「MTBF を寿命や保証期間と混同する」ことです。MTBF は1台の製品が必ず動き続ける時間ではなく、多数の母集団に対する平均的な故障率を時間で表した統計量です。故障率が一定の指数分布に従うなら、ある母集団のうち約63%は MTBF の時間に達する前に故障します。「MTBF 10万時間」をうたうディスクでも、保証は5年(約4.4万時間)どまり、というのはこのためです。MTBF の数値を「個体の寿命」と読み替えると、保守計画も予備品手配も大きく外れます。

次に、「稼働率の計算条件を確認しない」こと。同じ「99.9%」でも、24時間×365日を母数にするか、営業時間だけを母数にするかで意味がまったく違います。また MTTR に「故障の検知時間」「部品の調達リードタイム」「立ち上げ確認の時間」を含めるかどうかでも数値は大きく変わります。実務でトラブルになりやすいのが、ベンダーの提示する MTTR が「現地到着後の作業時間だけ」で、検知遅れや部品待ちを含まないケースです。稼働率を比較するときは、必ず「何を分母にし、MTTR に何を含めるか」を揃えてください。

最後に、「稼働率の高さとミッション信頼度を取り違える」点。稼働率が 99% でも、長時間ミッションの成功率は別問題です。MTBF 730 時間・稼働率 98.9% のシステムでも、720 時間連続のミッションを無故障で終える確率 R(t) は約 37% しかありません。「ふだんはほぼ動いている」ことと「特定の長い区間を一度も止まらず走り切る」ことは、まったく別の要求です。稼働率は冗長化と速い修理で上げられますが、ミッション信頼度を上げるには故障そのものを減らす(MTBF を伸ばす)か、ミッションを短く区切るしかありません。用途に応じて、見るべき指標を取り違えないことが重要です。

使い方ガイド

  1. 総稼働時間(時間)を入力します。例えば製造装置が過去12ヶ月間に8000時間運転した場合は8000と入力します
  2. その期間の故障回数を入力します。同じ装置で年間4回故障した場合は4と入力し、自動的にMTBF(平均故障間隔)=8000÷4=2000時間と計算されます
  3. 平均修復時間(MTTR)を時間単位で入力します。過去の修理実績から平均8時間要した場合は8と入力します
  4. ミッション継続時間を入力します。例えば航空機の1フライトが3時間の場合は3と入力し、その間の成功確率が計算されます
  5. シミュレーションボタンを押すと、稼働率(アベイラビリティ)、故障率λ、年間ダウンタイム、稼働率レベル評価が自動計算されます

具体的な計算例

半導体製造装置での実例:総稼働時間7200h、故障回数3回、平均修復時間10h、ミッション継続時間24h の場合、MTBF=2400h、故障率λ=0.000417/h、稼働率=99.59%、ミッション信頼度=99.00%、年間ダウンタイム=35.9h と計算されます。このシステムは「5ナイン(99.999%)」には届きませんが「4ナイン(99.99%)」に近い信頼性水準です。

実務での注意点

  1. MTBF値は過去データから算出するため、最低でも3~5年分の運転実績を集計することで統計的信頼性が向上します。単年度データでは季節変動の影響を受けやすくなります
  2. MTTR短縮は稼働率向上の最大レバーです。修復時間を10hから2hに削減すれば、同じMTBFでも稼働率は99.59%から99.96%へ改善されます
  3. ミッション信頼度は時間経過とともに指数関数的に低下するため、MTBF=1000hのシステムで100h連続運転する場合(信頼度90.5%)と1h単位で10回実行する場合(信頼度99.9%)では大きく異なります
  4. 年間ダウンタイムは契約対象外の予防保全時間を含まないため、実際のスケジューリングではMTTR実績値に1.2~1.5倍の余裕係数を掛けることが業界慣行です