多項式カオス展開 (PCE) UQ シミュレーター — Hermite多項式

ガウス入力 X～N(μ,σ²) に対して Y = a₁X + a₂X² を Hermite 多項式で展開し、出力の平均・分散・Sobol 感度を解析的に求めるツールです。係数 y_k やモンテカルロサンプルとの一致をリアルタイムに確かめながら、不確かさ伝播の感覚を掴めます。

パラメータ設定

入力平均 μ

入力ガウス分布 X～N(μ,σ²) の平均値

入力標準偏差 σ

入力ばらつきの大きさ。σ が大きいほど非線形項の寄与が増える

PCE次数 P

展開を打ち切る最大次数。Y が二次多項式なので P≥2 で厳密

モデル線形係数 a₁

応答モデル Y = a₁X + a₂X² の一次係数

モデル二次係数 a₂

二次の非線形性。a₂=0 にすると応答は完全に線形

計算結果

—

PCE次数 P

—

出力平均 E[Y]

—

出力分散 Var[Y]

—

出力標準偏差 σ_Y

—

1次 Sobol指標 (%)

—

2次 Sobol指標 (%)

—

入力分布 → 応答 → 出力分布

左の入力ガウス分布から粒子をサンプリングし、応答 Y=f(X) を通って右の出力分布に到達します。出力ヒストグラムは MC 近似、滑らかな曲線は PCE 構築の解析分布です。

PCE 係数 y_k vs 次数 k

出力曲線 Y(ξ)（ξ ∈ [-3, 3]）

理論・主要公式

$$Y(\xi) = \sum_{k=0}^{P} y_k\,He_k(\xi),\quad E[Y]=y_0,\quad Var[Y]=\sum_{k=1}^{P} y_k^2\,k!$$

He_k は確率論的 Hermite 多項式（He₀=1, He₁=ξ, He₂=ξ²-1, He₃=ξ³-3ξ, He₄=ξ⁴-6ξ²+3）。係数 y_k は標準正規重みに対する直交射影で計算し、平均は y₀、分散は y_k² と k! の重み付き和で書ける。

$$y_0 = a_1\mu + a_2(\mu^2+\sigma^2),\quad y_1 = (a_1 + 2 a_2\mu)\sigma,\quad y_2 = a_2\sigma^2$$

Y = a₁X + a₂X² を X = μ+σξ で書き換え、ξ² = He₂(ξ)+1 を使うと得られる解析解。k≥3 の係数はゼロになる。

$$S_1 = \frac{y_1^2}{\mathrm{Var}[Y]},\qquad S_2 = \frac{2\,y_2^2}{\mathrm{Var}[Y]}$$

Hermite-PCE から直接得られる Sobol 感度指標。S₁ は線形成分、S₂ は二次（非線形）成分が出力分散に占める割合。

多項式カオス展開 (PCE) と不確かさ伝播

🙋

「不確かさ定量化」って、入力がブレたとき出力もブレますよね…という話ですよね？それを多項式で表すって、ちょっと不思議です。

🎓

そう、入力 X が確率変数のとき、出力 Y も確率変数になる。これを「ばらつきが伝わる」と言って、その分布や統計量を効率よく求めるのが UQ の中心テーマだ。PCE のアイデアはとてもエレガントで、出力 Y を「入力に紐づいた標準的な確率変数 ξ の多項式の和」で表す。ξ をガウス入力の標準化と思えば、Y(ξ) = y₀ He₀ + y₁ He₁(ξ) + y₂ He₂(ξ) + … と書き、係数 y_k さえ求まれば平均・分散・分布形まで全部出てくる、というわけ。

🙋

右の「PCE 係数 y_k」のグラフを見ると、y₃ 以降は本当にゼロですね。これって偶然じゃないんですか？

🎓

偶然じゃなくて理屈どおりだよ。今回のモデルは Y = a₁X + a₂X² で X の二次までしか含まない。X = μ + σξ を代入して整理すると、ξ⁰ ξ¹ ξ² までしか出てこない。ξ² を Hermite 基底に書き直すと He₂(ξ)+1 になるから、結果として y₀, y₁, y₂ だけが値を持ち、k≥3 は厳密にゼロになる。だからこのおもちゃ問題では P=2 で「打ち切り誤差ゼロ」の解析解になっているんだ。実用では P=3〜5 ぐらいで滑らかな応答ならほぼ収束する。

🙋

「Sobol指標」も気になります。1次と2次で98% と 2% に分かれていますけど、これは何を表しているんですか？

🎓

これは出力分散の「内訳」だと思ってくれていい。S₁=98% は「Var[Y] のうち 98% は入力 X の線形応答（a₁X 由来）で説明できる」、S₂=2% は「残り 2% が非線形（a₂X² 由来）の寄与」という意味だ。Hermite-PCE では各次数の係数が独立に分散に効くので、y₁² と 2 y₂² の比率を取るだけで Sobol 指標が出てしまう。これがモンテカルロ系の Sobol 推定（追加で何万サンプルも要する）と比較したときの大きな強みなんだ。

🙋

σ を大きくしてみたら、急に S₂ の割合が増えました。なんでですか？

🎓

よく気づいたね。y₁ = (a₁ + 2 a₂μ)σ で σ に比例するのに対して、y₂ = a₂σ² は σ の二乗に比例する。だから σ を 2 倍にすると y₁ は 2 倍、y₂ は 4 倍になり、二次項の分散寄与（2 y₂²）がぐっと前に出てくる。CAE で言えば「入力のばらつきが小さいうちは線形近似で十分だが、ばらつきが大きくなると非線形項を無視できなくなる」という直感そのもの。設計許容差の妥当性を見るときに、まさにこの感覚が役に立つよ。

🙋

CAE で実際に PCE を使うときって、こんな簡単な多項式じゃなくて、有限要素ソルバーがブラックボックスになりますよね？係数 y_k はどうやって求めるんですか？

🎓

実用では「非侵入型 PCE」と呼ぶやり方が主流だよ。ソルバーには手を入れず、決められたサンプル点（ガウス求積点や Sobol/LHS 点）で計算結果 Y を取り、最小二乗回帰やガラーキン射影で y_k を求める。20〜200 評価で済むので、1 評価が数時間の FEM でも現実的だ。係数が決まれば、あとは解析的に E[Y], Var[Y], Sobol 指標まで一気に出る。このシミュレーターはその「最後のステップ」を可視化していると思ってくれるといい。

よくある質問

PCE は確率変数で表される不確かな入力に対して、出力を直交多項式の有限和で展開する不確かさ定量化（UQ）手法です。Y(ξ) = Σ y_k He_k(ξ) のように書き、係数 y_k はガラーキン射影・回帰・スパースサンプリングなどで求めます。入力分布に応じて使う基底が決まっており（Wiener-Askeyスキーム）、ガウス入力なら Hermite、一様分布なら Legendre、ガンマ分布なら Laguerre が最適です。モンテカルロ法に比べて、滑らかな応答に対しては圧倒的に少ないサンプル（数十〜数百回の評価）で高精度な出力統計が得られるのが特徴です。

Hermite 多項式 He_k(ξ) は標準正規分布 N(0,1) の重み e^(-ξ²/2)/√(2π) に関して直交します。つまり E[He_i He_j] = i! δ_ij が成り立ち、係数 y_k = E[Y He_k]/k! を独立に計算できるのです。直交性のおかげで出力分散も Var[Y] = Σ_{k≥1} y_k² k! と単純な和で書け、係数間にクロス項が現れません。入力分布が変われば適切な基底も変わり、これを最適に対応付けたのが Wiener-Askey スキームです。

モンテカルロ（MC）は実装が簡単で次元数の影響を受けにくい一方、平均で 1/√N 程度の収束しかしないため、CAE 解析を 10,000 回まわすような重い計算になります。PCE は応答が滑らか（入力に対して多項式や指数で表せる程度）であれば、低次（P=3〜5）の打ち切りで MC 数万回相当の精度を数十回の評価で得られます。ただし応答が不連続・しきい値・離散的なジャンプを含む場合は収束が悪く、MC や層別サンプリング、スパースグリッドへ切り替える必要があります。

PCE 係数 y_k が分散に寄与する大きさは y_k²·k!（Hermite 基底の場合）です。各入力変数（または変数の組み合わせ）に属する基底だけを集めて分散全体に対する比率を取ると、それがそのまま Sobol 感度指標になります。例えば 1 入力 Y = a₁X + a₂X² の場合、y₁²（線形項）と 2 y₂²（二次項）の比率が、それぞれ「線形成分が分散に占める割合」「非線形成分が占める割合」になります。MC ベースの Sobol 指標と違い、追加サンプルを取らずにポストプロセスだけで得られるのが大きな利点です。

実世界での応用

確率的有限要素法（SFEM）：材料定数（ヤング率・降伏応力・損失係数）や境界条件（荷重・温度・接触剛性）にばらつきがある構造解析で、応答（応力ピーク・最大変位・固有振動数）の確率分布を求める用途。決定論的な FEM ソルバーをそのまま使い、ガウス求積点でだけ計算して PCE 係数を回帰する「非侵入型 PCE」がスタンダードです。MC 1 万回を PCE 50 回に置き換えられる場面が多く、自動車・航空・原子力の信頼性評価に広く使われています。

CFD・熱流体の不確かさ伝播：乱流モデル係数（k-ε の Cμ など）、入口流速、表面粗さといった不確かさが、抵抗係数や温度分布のばらつきにどう伝わるかを評価します。CFD は 1 ケースが数時間〜数日かかるため MC は事実上不可能で、Sparse-PCE やスパースグリッド+Smolyak と組み合わせて 20〜100 ケースで分布推定するのが定石です。NASA・ONERA など航空機の認証関連で多数の事例があります。

制御系・電子回路のロバスト設計：センサーノイズ、抵抗の公差、温度ドリフトに対して制御性能や回路特性がどれだけブレるかを評価し、ワーストケースを過大に取らずに済ませる用途。PCE のサロゲートが得られれば、その上で Sobol 指標を計算して「どの公差が最も効くか」を判定し、コスト最適な公差配分（トレランスアロケーション）に直結します。半導体・パワーエレクトロニクスでも近年定着してきました。

気象・地球科学・金融工学：気候モデル感度評価、地下水流動の不確かさ、オプション価格のパラメータ不確かさなど、入力に多次元の確率変数を含む大規模シミュレーションでも PCE が活躍します。多次元ではテンソル積基底が爆発するため、スパース PCE・適応 PCE・低ランクテンソル分解などの手法と組み合わせ、必要最小限の基底だけを残して計算を抑えるのが現代の主流です。

よくある誤解と注意点

まず最大の落とし穴が、「応答が滑らかでない問題に低次 PCE を使ってしまう」こと。PCE は応答 Y(ξ) が ξ について解析的・滑らかな場合に指数収束しますが、座屈・衝突・接触のように不連続やしきい値を含む応答では、低次の Hermite 展開がギブス現象のように振動し、平均は合っても分散・テール確率を大きく取り違えます。判定の目安は「P を 1 上げたとき係数のノルムが幾何級数的に減るか」。減らないなら多項式 PCE は不適で、スパースグリッド・ハイブリッド MC・分割領域 PCE などへ切り替える必要があります。

次に、「入力分布と基底のミスマッチ」。Wiener-Askey スキームでは入力分布ごとに最適な基底が決まっています（ガウス→Hermite、一様→Legendre、指数→Laguerre、ベータ→Jacobi）。例えば一様分布入力に Hermite を使うと、直交関係が崩れて係数同士が交差し、収束も精度も大きく悪化します。複数の異なる分布が混在するときは、各入力をその分布に応じた標準確率変数へ等価変換（Rosenblatt/Nataf 変換）してから対応する基底を使うのが正攻法です。

最後に、「PCE の係数を信じて外挿してしまう」誤用。PCE はサンプル点付近（典型的には ±3σ）で構築された近似で、その範囲を大きく逸脱した入力に対する応答を保証しません。例えば実装で σ を学習時の 5 倍にして使うと、Y(ξ) は ξ の多項式なので発散的に大きな値を返しますが、それは現実の系の応答ではなく単なる多項式の外挿です。極値・テール確率を扱うときは、PCE の有効域を明示し、その外側は MC や IS（重要度サンプリング）で補完する設計にすべきです。

多項式カオス展開 (PCE) UQ シミュレーター — Hermite多項式

多項式カオス展開 (PCE) と不確かさ伝播

よくある質問

実世界での応用

よくある誤解と注意点

使い方ガイド

具体的な計算例

実務での注意点

多項式カオス展開 (PCE) UQ シミュレーター — Hermite多項式

多項式カオス展開 (PCE) と不確かさ伝播

よくある質問

実世界での応用

よくある誤解と注意点

使い方ガイド

具体的な計算例

実務での注意点

関連ツール