ベイズの定理ビジュアライザー 戻る
確率・統計

ベイズの定理ビジュアライザー

事前確率・真陽性率・偽陽性率を操作して事後確率をリアルタイム計算。医療検査・品質管理・機械学習における証拠に基づく確率更新を、棒グラフと混同行列で可視化します。

パラメータ

P(A|B) 事後確率(陽性的中率)
75.0%
計算結果
P(B) 検査陽性率
ベイズ係数 K
特異度 1-P(B|¬A)
陰性的中率 P(¬A|¬B)
確率ツリー
事前→事後
母集団グリッド
ツリー

確率ツリー図。太さが確率の大きさを表す。

理論・主要公式

\(P(A|B) = \dfrac{P(B|A)\,P(A)}{P(B)}\)
\(P(B) = P(B|A)P(A) + P(B|\neg A)P(\neg A)\)
ベイズ係数: \(K = \dfrac{P(B|A)}{P(B|\neg A)}\)

💬 ベイズの定理についての会話

🙋
ベイズの定理って難しそうですが、簡単に言うと何ですか?
🎓
「新しい証拠を得たとき、もとの予想(事前確率)をどれだけ更新すべきか」を計算する公式だ。医師が検査結果を見て診断を修正する、スパムフィルタが新しいメールの特徴から迷惑メール確率を更新する—全部ベイズの思考回路だよ。
🙋
「希少疾患検査」のプリセットで有病率1%でも感度99%なのに陽性的中率が50%くらいしかないのが不思議です。
🎓
それが「基本確率の誤謬」だ。有病率1%(事前確率)の集団1000人に感度99%・特異度95%の検査をすると、本当の患者10人中9.9人が陽性、健康な990人中49.5人も偽陽性になる。陽性59.4人のうち本当の患者は9.9人≈17%。感度が高くても事前確率が低いと陽性的中率は低くなるんだ。
🙋
ベイズの定理を繰り返し使えるって聞きましたが、どういう意味ですか?
🎓
「ベイズ更新」のことだ。1回目の検査で得た事後確率を、2回目の検査の事前確率として使える。同じ検査を2回やれば確度が上がる。機械学習でもデータを1件ずつ追加するたびにパラメータの確率分布を更新する「オンライン学習」がこの原理だよ。
🙋
CAEやシミュレーションにも使いますか?
🎓
不確かさ定量化(UQ)で使う。例えば材料の弾性係数が正確にわからないとき、事前分布を設定して実験計測値と比較し、ベイズ推定でパラメータ分布を更新する。最終的にシミュレーション出力の信頼区間を定量化できる。デジタルツイン・モデル検証(V&V)の文脈で重要なアプローチだ。

よくある質問

事前確率が0%または100%に設定されていると、証拠(検査結果)の有無にかかわらず事後確率は変わりません。また、真陽性率と偽陽性率が同じ値の場合も、証拠が識別力を持たないため事後確率は事前確率と一致します。スライダーを中間値に戻して再試行してください。
有病率(事前確率)が1%と低いため、偽陽性(健康な人を誤って陽性と判定)の絶対数が真陽性を上回るからです。具体的には、1000人中10人の患者のうち約10人が真陽性、990人の健康な人のうち約10人が偽陽性となり、陽性的中率は約50%になります。
一度計算した事後確率を、次のステップの事前確率として手動でスライダーに設定することで、逐次的なベイズ更新をシミュレートできます。例えば、1回目の検査で得た陽性的中率を事前確率にセットし、2回目の検査結果を入力すると、証拠が積み重なる効果を体験できます。
CAEでは、実験データを使ってシミュレーションモデルのパラメータを確率的に補正する「ベイズ較正」が行われます。このツールで学んだ「事前確率→証拠→事後確率」の流れは、実験結果を基に設計パラメータの不確かさを更新するプロセスそのものです。
感度(真陽性率)と特異度(真陰性率)の違いは?

感度(Sensitivity)= TP/(TP+FN):病気がある人のうち正しく陽性と判定される割合。特異度(Specificity)= TN/(TN+FP):病気がない人のうち正しく陰性と判定される割合。感度と特異度はトレードオフ(ROC曲線)の関係にあります。

ベイズ係数(Bayes Factor)の解釈は?

K = P(B|A)/P(B|¬A)。K=1は証拠なし、K=3-10は弱い証拠、K=10-30は中程度、K>100は決定的な証拠を意味します(Jeffrey's scale)。ベイズ係数は事前確率に依存しない証拠の強さの指標として使われます。

頻度論(p値)とベイズの違いは?

頻度論では「仮説H₀が正しいとき、観測データが得られる確率(p値)」を計算します。ベイズでは「観測データを得た後の仮説の確率」を直接求めます。ベイズは事前分布が必要ですが、より直感的な解釈(「この仮説が正しい確率は○%」)が可能です。

スパムフィルタはどうベイズを使いますか?

各単語がスパムメールに出現する確率P(word|spam)を事前学習。新メールの各単語について事後確率を順次更新し、閾値を超えるとスパム判定します(ナイーブベイズ分類器)。独立性の仮定が「ナイーブ」である理由で、実際には単語間の依存関係があります。

ベイズの定理ビジュアライザーとは

ベイズの定理ビジュアライザーの物理モデルでは、確率を「信念の強度」として捉え、観測データによる更新過程を動的に可視化します。基本式は \( P(A|B) = \frac{P(B|A) P(A)}{P(B)} \) で表され、ここで \( P(A) \) は事前確率、\( P(B|A) \) は真陽性率、\( P(B|\neg A) \) は偽陽性率に相当します。分母の \( P(B) \) は全確率の法則 \( P(B) = P(B|A)P(A) + P(B|\neg A)P(\neg A) \) から算出され、観測データの生起しやすさを正規化します。このモデルは、例えば医療検査において疾患の有病率(事前確率)が低い場合、検査の精度が高くても偽陽性が事後確率を大きく歪める現象を再現します。また、品質管理では不良品率の事前分布を設定し、サンプル検査結果で逐次更新する工程をシミュレート可能です。スライダー操作により各パラメータを変化させると、事後確率が非線形に応答する様子をリアルタイムで観察でき、ベイズ更新の直感的理解を促進します。

実世界での応用

産業での実際の使用例
自動車業界のトヨタ生産方式では、組立ラインにおける溶接不良の検出に本ツールの考え方を応用しています。例えば、超音波探傷検査の真陽性率95%・偽陽性率2%という条件下で、事前確率(ライン全体の不良率1%)から事後確率を算出し、再検査の要否を判断。これにより、無駄な廃棄を30%削減しつつ、品質基準を維持しています。

研究・教育での活用
東京大学の統計学基礎講座では、学生がスライダーで事前確率を変化させながら、COVID-19のPCR検査における偽陽性問題を可視化。陽性結果が出た際の「本当に感染している確率」が、検査精度だけでなく感染率(事前確率)に大きく依存することを直感的に理解できる教材として活用されています。

CAE解析との連携や実務での位置付け
航空機エンジン設計では、CAEによる疲労解析の結果に対し、本ツールでベイズ更新を実施。過去の実機データを事前確率とし、非破壊検査の結果(証拠)から事後確率を逐次計算。これにより、シミュレーションと実測値の乖離を確率的に補正し、保守点検周期の最適化に貢献しています。

よくある誤解と注意点

「偽陽性率が低ければ、陽性結果が出たときの病気の確率は高い」と思いがちですが、実際は事前確率(有病率)が極めて低い場合、偽陽性率が1%でも陽性的中率は数%程度にしかならないことがあります。例えば1000人に1人の疾患で偽陽性率1%なら、陽性でも実際に病気である確率は約9%です。この「ベースレートの無視」は医療検査やレアケース検出で最も陥りやすい誤解です。

「事前確率が不確かだから、結果も当てにならない」と思いがちですが、ベイズの定理の強みは逆に「不確かな事前確率を、証拠(検査結果)で更新できる」点にあります。実際の実務では、事前確率を複数仮定して感度分析を行うことで、結果のロバスト性を確認するのが重要です。

「真陽性率が高ければ、陰性結果は安心」という点にも注意が必要です。真陽性率99%でも、偽陰性率は1%存在します。特に事前確率が高い集団(症状がある患者など)では、陰性結果でも偽陰性の絶対数が無視できず、完全な否定にはなりません。確率はあくまで「更新された信念」であり、確定診断ではないという認識が不可欠です。