実験計画法 DOE シミュレーター 戻る
実験・最適化

実験計画法 DOE シミュレーター

フル因子計画・部分実施計画・中心複合計画 (CCD)・Plackett-Burman を切り替えて、必要実験回数・統計的検出力・OFAT に対する節約率をリアルタイムに比較できます。因子数を変えるたびに「フル因子で爆発する→部分実施で抑える」の挙動が見えるツールです。

パラメータ設定
因子数 k
独立に変化させる入力変数の数
計画タイプ
スクリーニング → 最適化の順に複雑化
中心点反復数 n_c
純誤差推定・曲率検出のための中央水準反復
推定主効果 σ
検出したい効果の大きさ(応答変数の単位)
残差標準偏差 σ_n
繰り返し測定のばらつき(純誤差)
検出力目標 1-β
通常 0.80(=80%)以上を目標とする
計算結果
必要実験回数
計画分解能
主効果数
2因子交互作用数
検出力 (%)
OFAT比節約 (%)
実験点配置 — 立方体プロット

立方体の頂点が 2^k 因子点、軸方向に伸びる点が CCD の軸点 (±α)、中央が中心点反復。計画タイプを切り替えると配置が変化します。

計画タイプ別 必要実験回数の比較
検出力 vs 実験回数
理論・主要公式

$$\text{Full } 2^k = 2^k \text{ runs},\quad \text{CCD} = 2^k + 2k + n_c,\quad \text{Power} = 1 - \beta$$

k = 因子数、n_c = 中心点反復、Resolution III = 主効果のみ独立、IV = 主効果と一部の2因子交互作用独立、V 以上 = 全2因子交互作用独立。

$$\text{Fractional }2^{k-p} = \frac{2^k}{2^p},\quad \text{PB} \ge 4\lceil(k+1)/4\rceil \text{ runs}$$

部分実施は実験回数を 1/2^p に削減するかわりに、一部の効果が交絡 (confounding) して独立に推定できなくなります。PB は4の倍数の最小実験回数で主効果のみ推定。

$$t = \frac{\Delta}{\sigma_n}\cdot\frac{\sqrt{N}}{2},\quad \text{Power} \approx 1 - \exp\!\left(-\frac{(t-z_{\alpha/2})^2}{2}\right)$$

推定主効果 Δ・残差標準偏差 σ_n・総実験回数 N から t 統計量を作り、両側検定の閾値 z_{α/2}=1.96 で検出力を概算(簡易近似式)。

実験計画法 (DOE) — 直交計画とFactorial設計

🙋
実験計画法、名前は知ってるんですが、結局のところ何の役に立つんですか?「実験を計画する」って当たり前のことに聞こえてしまって…。
🎓
そう感じるよね。でも「計画」の意味が普通の現場の感覚とちょっと違うんだ。多くの人がやるのは OFAT、つまり「ひとつだけ動かして他は固定、結果を見て次の因子を動かす」というやり方。直感的でわかりやすいけど、これは情報効率がすごく悪い。例えば3因子を3水準で OFAT すると 10 回くらい実験が必要で、しかも因子同士の組み合わせ効果(交互作用)はまったく見えない。DOE のフル因子計画 2^3 なら 8 回で、主効果3本+交互作用3本を全部独立に推定できる。同じ手間で得られる情報量がぜんぜん違うんだ。
🙋
なるほど!じゃあ常にフル因子でやればいいんですね。…と思って k を 5 に上げたら、実験回数が 32 に跳ね上がりました。これ、現実的にきついやつだと思うんですが…。
🎓
いいところに気付いた。それが「次元の呪い」だね。2^k は k=2 で 4、k=5 で 32、k=8 で 256 と倍々に増えていく。そこで出てくるのが部分実施計画 (Fractional Factorial)。スライダーで計画タイプを「2^(k-1) 1/2 部分実施」に切り替えてみて。実験回数が半分になるけど、代償として一部の「交互作用」が主効果と交絡 (confound) して、個別には分離できなくなる。これを表すのが分解能 (Resolution) III, IV, V という指標で、V 以上なら2因子交互作用までキレイに分けられる。スクリーニング段階なら III/IV で十分、最適化したいなら V 以上、と使い分けるんだ。
🙋
CCD と Plackett-Burman っていう謎の選択肢もありますね。これは何が違うんですか?
🎓
用途がまったく違うんだ。Plackett-Burman は「主効果しか興味ない、とにかく重要因子を素早く絞り込みたい」スクリーニング用。10〜20因子を12〜24回で一気にふるいにかけられる。一方 CCD (中心複合計画) は「絞り込んだ3〜5因子を、応答曲面で最適化したい」段階で使う。2^k 因子点に加えて軸点 (±α 位置) と中心点反復を入れることで、応答を2次関数 y = b0 + Σbi·xi + Σbij·xi·xj + Σbii·xi² でモデル化できる。だから実務では「PB でスクリーニング → CCD で最適化」という二段階運用が定石になっている。
🙋
「検出力」っていうのも出てきますけど、これは何を意味しているんですか?スライダーを動かしても変化が結構大きいですね。
🎓
統計的検出力 (Power, 1-β) は「本当に効果があるとき、それを実験できちんと有意と判定できる確率」のこと。慣例的に 0.80 以上が目標とされる。検出力は (1) 効果が大きいほど↑ (2) 残差ばらつきが小さいほど↑ (3) 実験回数が多いほど↑、で決まる。だからスライダーで σ_n(残差標準偏差)を上げると検出力がガクッと落ちる。逆に中心点反復 n_c を増やして総実験数を稼ぐと回復する。本ツールは t = Δ/σ_n × √N/2 から検出力を簡易近似してるんだ。本格的にはノンセントラル t 分布で計算するけど、設計段階の目安としてはこれで十分だよ。
🙋
最後に出ている「OFAT比節約」がマイナスのときがあるんですが、これって DOE のほうが OFAT より実験多いってことですか?
🎓
そう、そのケースは確かにある。k が少なくて中心点もたくさん入れると、フル因子+中心点の合計が「OFAT で 3 水準・k 因子」の見かけ上の回数を超えてしまう。ただし大事なのは、DOE は「同じ回数でも得られる情報量がまったく違う」点。主効果だけじゃなくて交互作用や曲率まで取れる。だから「節約%」が負でも、情報量で割ったコスト(実験あたりの推定パラメータ数)で見れば DOE のほうが圧倒的に有利。k=5 以上にしてみると、節約%がプラスにグンと跳ね上がるよ。

よくある質問

OFAT (One Factor At a Time) は「他の因子を固定して、ひとつだけ動かす」という素朴なやり方で、k 因子・各3水準なら 3k+1 回程度の実験が必要です。DOE の 2^k フル因子計画なら 2^k 回で、しかも交互作用(因子同士の組合せ効果)まで同時に推定できます。例えば k=5 なら OFAT は約16回・主効果しか分かりませんが、フル因子は32回で主効果10本+交互作用10本を全部独立に推定できます。実験回数は増えても情報量あたりのコストは DOE の方が圧倒的に小さくなります。
因子数 k が4以下ならフル因子計画 (2^k=16回以下) で十分実用的です。k=5 以上になると 32, 64, 128… と倍々に増えるので、1/2 部分実施 (2^(k-1))、1/4 部分実施 (2^(k-2)) を使って実験回数を抑えます。代償として一部の効果が「交絡 (confounding)」して個別に分離できなくなります。分解能 (Resolution) III は主効果だけ独立、IV は主効果と2因子交互作用の一部が独立、V以上は全2因子交互作用が独立です。スクリーニング段階では Resolution III/IV、最適化段階では Resolution V 以上を選びます。
CCD は応答曲面法 (RSM: Response Surface Methodology) の代表的計画で、応答 y を因子の2次関数 y = b0 + Σbi·xi + Σbij·xi·xj + Σbii·xi² で近似したいときに使います。実験点は (1) 2^k 因子点、(2) 2k 個の軸点 (±α 位置)、(3) 中心点 nc 回反復、の合計 2^k + 2k + nc 回。これで2次効果まで推定可能になり、最適点の探索や曲率の検出に向きます。スクリーニング (PB や Fractional) で重要因子を3〜5個に絞ってから CCD で最適化、という2段階運用が実務の定石です。
Plackett-Burman (PB) は主効果のみを最小実験回数で推定するスクリーニング計画です。4の倍数の実験回数で、最大 k = 実験回数 -1 の因子を扱えます。例えば 12回で 11 因子、20回で 19 因子まで一気にスクリーニングできます。Resolution III で2因子交互作用は主効果と交絡しますが、「どの因子が重要かを早く知りたい」段階では極めて強力。製薬・食品・遺伝子発現など、因子が10〜20個ある分野で標準的に使われます。本ツールでも PB を選ぶと実験回数が劇的に減るのが分かります。

実世界での応用

製造プロセス最適化:射出成形・切削加工・半導体プロセスなどで、温度・速度・圧力・時間といった条件を同時に最適化するのに DOE が標準的に使われます。例えば射出成形では金型温度・射出速度・保圧・冷却時間の4因子をフル因子計画 (16回) または1/2部分実施 (8回) で網羅し、ヒケ・反り・寸法精度を同時に最小化します。Six Sigma の「分析 (Analyze)・改善 (Improve)」フェーズの中核ツールです。

製品開発・配合最適化:樹脂のコンパウンド配合、医薬品の処方、食品の調合などでは、混合計画 (Mixture Design) と CCD を組み合わせます。Stat-Ease の Design-Expert、JMP、Minitab といった商用ソフトが標準。例えば3成分の医薬製剤で、有効成分・賦形剤・崩壊剤の比率を変えて溶出プロファイルを最適化、というケースで DOE が威力を発揮します。

CAE 解析・仮想実験:シミュレーションは1回が高コスト(HPC で数時間〜数日)なので、サンプリング戦略として DOE が必須です。実機実験と違って「中心点で測定誤差」がない代わりに、メタモデル (Kriging, RBF, 多項式回帰) を構築する基礎データとして、Latin Hypercube Sampling や CCD が使われます。流体解析・構造最適化・最適化アルゴリズム (Bayesian Optimization) の初期点設計に直結します。

品質工学・タグチメソッド:日本発の品質工学では直交配列表 L8, L16, L18 を使った「内側因子×外側因子」の二重直交設計で、ロバスト性(ばらつきへの強さ)を SN 比で評価します。本ツールが扱う Factorial / Fractional は欧米流の Box-Hunter 系、タグチは日本流の田口流ですが、根底にある「実験を計画する」思想は共通です。トヨタ・パナソニックなど日本の製造業の競争力の一翼を担ってきた手法です。

よくある誤解と注意点

まず最も多いのが、「分解能 III なのに交互作用も解釈してしまう」誤用です。Resolution III の部分実施計画では、ある主効果が他の2因子交互作用と完全に交絡 (confound) しています。つまり「A の主効果」と表示された値が、実は「A + BC + DE + …」の和を測っているだけかもしれない。これを知らずに「主効果が出た!」と解釈すると、本当に効いているのは交互作用、という大きなミスリードになります。本ツールも分解能を表示しますが、結果を解釈する前に必ず「どの効果がどの効果と交絡しているか」を Aliasing Table で確認してください。

次に、「中心点をゼロにしてしまう」こと。中心点 n_c は「純誤差」を推定し、「曲率の有無」を検出するために必要です。中心点ゼロの 2^k 計画は線形モデルしかフィットできず、応答が非線形(最適点がある等)の場合に大きく外れた予測をします。最低でも n_c = 3〜5 を入れ、もし中心点と立方体頂点の平均に有意差があれば「曲率あり → CCD に拡張」というシグナルとして使うべきです。本ツールで n_c を0にすると検出力が下がるのもこれが理由です。

最後に、「ランダム化を忘れる」こと。DOE は実験順序がランダムであることを前提に統計推定をしています。実際の現場では「温度を変えるのが面倒だから低温→高温の順にまとめてやる」とブロック効果(時間・装置温度ドリフト・オペレーターの慣れ)が因子効果と交絡し、立派な分解能 V の計画でも結論が壊れます。実行不可能ならブロック計画 (Blocking) として最初から計画に組み込むべきです。「設計はキレイなのに結果がノイズだらけ」というトラブルの多くは、このランダム化漏れが原因です。

使い方ガイド

  1. 因子数(k)を設定:例えば半導体製造で拡散炉の温度・圧力・ガス流量の3因子なら k=3
  2. 各因子の水準範囲を指定:温度は900~1100℃、圧力は0.5~2.0 atm など実験範囲を入力
  3. 中心点数(nc)を決定:応答曲面法の精度向上には nc=3~5 が標準、ノイズが大きい場合は増加
  4. 効果の最小検出差(Δ)を設定:工程能力指数 Cpk で許容できる変動量、例:厚膜で±5 μm
  5. ノイズ標準偏差(σ)を入力:過去データから推定、半導体ウェハ膜厚では σ=2~3 nm が典型
  6. 各計画方式の必要実験回数・分解能・検出力を自動比較表示

具体的な計算例

化学反応器の収率最適化を想定:反応温度・触媒濃度・撹拌速度の3因子(k=3)、各因子2水準で計画を構成。2^3フル因子計画は8回実験、中心点3点で合計11回。半分部分実施(2^(3-1))は4回+3点で7回と39%削減。効果の最小検出差 Δ=2%、ノイズ σ=1.5% のとき、フル因子計画の検出力は87%、部分実施は78%。一方OFATで同じ精度を得るには18回必要なため、部分実施は61%の実験削減となる。

実務での注意点