極値統計 GEV シミュレーター 戻る
統計・信頼性工学

極値統計 GEV シミュレーター — 100年確率と再現期間

一般化極値分布(GEV)で「100年に1回の値」「30年の供用期間中にそれを超える確率」を計算するツールです。位置 μ・スケール σ・形状 ξ を変えると Gumbel/Fréchet/Weibull の3族が切り替わり、再現期間 T 年に対応する極値 z_T と 95% 信頼区間がリアルタイムで分かります。

パラメータ設定
位置パラメータ μ
分布の中心位置(例:年最大値の典型値)
スケール σ
分布の広がり(標準偏差に相当する尺度)
形状 ξ
ξ>0:Fréchet(重尾)/ξ=0:Gumbel/ξ<0:Weibull(有限上限)
再現期間 T
この期間に平均1回だけ超える値(年超過確率 = 1/T)
観測標本数 N
年最大値データの年数。N が多いほど CI は狭くなる
ミッション期間
構造物・装置の供用年数。この間に z_T を超える確率を計算
計算結果
再現値 z_T
GEV ファミリー
年超過確率 (%)
ミッション期間超過確率 (%)
95% CI 幅
推定信頼度 (KS-p)
GEV PDF と再現値 — 3族ファミリー比較

3本の曲線は Gumbel(緑、ξ=0)/Fréchet(赤、ξ>0)/Weibull(青、ξ<0)の PDF。点線が再現値 z_T、下のヒストグラムはサンプル年最大値の頻度。

再現値 z_T vs 再現期間 T(対数軸)
GEV PDF — 形状 ξ による3形状の比較
理論・主要公式

$$F(z) = \exp\left[-\left(1 + \xi\,\frac{z-\mu}{\sigma}\right)^{-1/\xi}\right]$$

GEV 分布の CDF。μ:位置、σ:スケール、ξ:形状。ξ=0 のとき右辺は exp(-exp(-(z-μ)/σ))(Gumbel)に縮退する。

$$z_T = \mu + \frac{\sigma}{\xi}\left[\left(-\ln(1-1/T)\right)^{-\xi} - 1\right]$$

T 年再現値 z_T。T は再現期間(年)、z_T はその再現期間に対応する極値。ξ=0 では z_T = μ − σ·ln(−ln(1−1/T)) となる。

$$P_{\text{mission}} = 1 - \left(1 - \tfrac{1}{T}\right)^{D}$$

ミッション期間 D 年に z_T を 1 回以上超える確率。T=100, D=30 で約 26%(決して「100年は安全」ではない)。

極値統計 GEV — 100年再現期間と Gumbel/Fréchet/Weibull

🙋
「100年に1度の洪水」っていう言い方、ニュースでよく聞きますが、実際は何年も連続で起きてる気がします。あれって本当に100年に1回なんですか?
🎓
いいところに気づいたね。「100年再現期間」は「平均して100年に1度起きる」という意味で、毎年独立に確率 1/100 = 1% で抽選していると考えるんだ。だから2年連続で起きる確率も 1%×1% = 0.01% ある。さらに、30年の供用期間中に少なくとも1回起きる確率は 1−(1−0.01)^30 で約26%にもなる。左で「再現期間 T=100、ミッション期間 30 年」のままにしてあるけど、右上の「ミッション期間超過確率」がまさにこの 26.0% を出している。
🙋
え、4回に1回も起きるんですか!100年は安全だと思ってました…。じゃあ、その「100年に1回の値」自体はどうやって決めるんですか?
🎓
GEV — 一般化極値分布 — を使うんだ。たとえば過去 50 年分の「年最大降水量」を集めると、その分布は GEV に従う、というのが Fisher-Tippett-Gnedenko の定理から保証されている。位置 μ、スケール σ、形状 ξ の3パラメータを最尤法か L-モーメント法で推定して、z_T = μ + (σ/ξ)·[(−ln(1−1/T))^(−ξ) − 1] という公式で 100 年値 z_100 を計算する。デフォルト値だと z_100 ≈ 137.6 だね。
🙋
「ファミリー」のところに「Fréchet 重尾」って出てます。Gumbel とか Weibull とか、3つあるみたいですが、何が違うんですか?
🎓
形状パラメータ ξ の符号で決まる3つの兄弟分布なんだ。ξ=0 が Gumbel(軽尾)で、年最高気温みたいに極端な外れ値があまり出ない現象。ξ>0 が Fréchet(重尾)で、ベキ乗で裾が減衰する。地震マグニチュード、株価暴落、保険損失みたいに「想定外に大きい値」が出る現象だね。ξ<0 が Weibull(有限上限)で、ある値で打ち切られる。風速や材料強度みたいに物理的な上限がある場合に出てくる。ξ スライダーを動かすと、グラフの形が連続的に変わるのが見えるよ。
🙋
CI 幅 が 12.6 ってけっこう大きいですね…。z_100 = 137.6 ± 6.3 ってことは、本当の100年値は 131 から 144 くらいまでブレるってことですか?
🎓
そう、そこが極値統計の本質的な難しさなんだ。N=50 年分のデータから T=100 年値を外挿しているわけだから、推定誤差は避けられない。標本サイズ N を 200 に増やすと CI 幅は半分近くまで縮む(√N で縮む)し、逆に T=1000 に伸ばすと外挿距離が広がって CI はもっと広がる。だから実務では、CI を考慮した「保守的な設計値」として z_T の上側 95% 信頼限界を使うこともある。それと、年最大値ではなく POT 法(閾値超過法)に切り替えるとサンプル効率が上がって CI が狭まるよ。
🙋
なるほど!結局、設計時には「何年再現期間で設計するか」と「供用期間中の超過確率は何%まで許すか」をセットで決めるってことですね。
🎓
その通り。土木・建築の耐震設計では「再現期間 475 年(50 年供用で超過確率 10%)」が一つの基準。原子力では 10,000 年再現期間を使ったりする。一方、保険業界の PML(Probable Maximum Loss)は 200 年や 250 年。業界・対象設備で再現期間の基準は大きく違うんだ。本ツールでスライダーをいじりながら、自分の設計対象に合う再現期間と供用期間中の超過確率の組み合わせを探してみるといいよ。

よくある質問

形状パラメータ ξ の符号で決まります。ξ=0 は Gumbel(Type I, 軽尾)で、指数的に裾が減衰します。年最高気温や日最大降雨量の多くがこれに近い形です。ξ>0 は Fréchet(Type II, 重尾)で、裾が冪乗で減衰し、上限がありません。株価のクラッシュ、保険損失、地震マグニチュードなど「想定外に大きい値」が起こりうる現象に対応します。ξ<0 は Weibull(Type III, 有限上限)で、ある最大値で打ち切られます。物理的に上限がある現象(風速の上限など)に使われます。本ツールでは ξ を -0.5〜0.5 で変化させ、3族の挙動を直感的に比較できます。
T 年再現期間とは「平均して T 年に 1 回その値を超える」という意味で、年超過確率は 1/T です。再現期間 100年の値 z_100 は、年超過確率 1%(0.01)の極値を指します。重要なのは「100年に1回だから100年は安全」ではないこと。30年の供用期間中に少なくとも 1 回 z_100 を超える確率は 1−(1−0.01)^30 ≈ 26% にもなります。本ツールでは「ミッション期間超過確率」としてこの値を直接表示し、設計者が再現期間と供用期間の関係を誤らないよう支援します。
GEV のパラメータ推定(最尤法・L-モーメント法)には大標本理論に基づく漸近正規性があり、推定誤差はおおむね √N に反比例して縮みます。本ツールの 95% 信頼区間幅はデルタ法の簡易近似で、σ·√(0.5·ln T / N) 程度の標準誤差から求めています。標本 N=50 で T=100年再現値を推定すると CI 幅は±10〜15 程度になり、外挿(N年分のデータから T(≫N)年の再現値を推定)の不確実性が大きいことが分かります。実務では POT 法や階層ベイズで CI を厳密に評価します。
ブロック最大値法は「年最大値」のように一定期間の最大値を1サンプルとし、それらが GEV に従うと仮定して当てはめます。データが整理しやすく解釈も直感的ですが、年内に複数のイベントがあっても 1 つしか使わないためサンプル効率が悪いという欠点があります。POT 法は、ある閾値を超えた全ての値を「超過量」として扱い、一般化パレート分布(GPD)に当てはめます。サンプル数を大幅に増やせるため CI が狭くなりますが、閾値選択と独立性確認(嵐の宣言など)が必要です。河川流量や台風強度では POT が好まれます。本ツールは BM 法に相当する GEV のパラメータを直接操作します。

実世界での応用

土木・水文工学(洪水・降雨・地震):河川堤防やダムの設計では、過去の年最大流量データから GEV を当てはめ、100年再現流量・1000年再現流量を求めます。日本の一級河川は基本高水流量に200年再現期間を使うことが多く、欧州では同じ目的に GEV の Gumbel 近似(ξ=0)がよく用いられます。地震では再現期間 475年(50年で超過確率10%)が建築基準法の標準で、原子力施設は10,000年再現期間まで考慮します。

構造工学(風荷重・波荷重):高層ビル・橋梁・洋上風力タービンの設計では、観測地点での年最大風速や年最大有義波高に GEV を当てはめます。形状パラメータ ξ は風速で-0.1〜0.0、波高で0.0〜0.1あたりが典型値です。100年再現値を基準に荷重係数を掛けて設計荷重を決定します。台風や巨大波の場合は POT 法で年内の複数イベントを活用して推定精度を上げます。

信頼性工学(部品寿命・保証期間):製品の最弱リンク寿命は Weibull 分布(GEV の ξ<0 ケース)に従うことが多く、自動車や航空機部品の保証期間設定に用いられます。「100台中 1台が故障するのは何年後か」を Weibull で推定し、保証期間を決めます。GEV の枠組みは「最大寿命」より「最小寿命(最弱リンク)」に対して使われることが多いのが信頼性工学の特徴です。

金融・保険(VaR・PML):市場リスク管理では日次株価変動の年最大下落幅に GEV を当てはめ、VaR(Value at Risk)の裾リスクを評価します。Fréchet(ξ>0)になることが多く、これは「ブラックスワン」が現実に存在することを意味します。保険業界では PML(Probable Maximum Loss)の見積もりに 200年再現期間や 250年再現期間を使い、再保険購入の判断材料にします。

よくある誤解と注意点

最大の誤解は「100年に1度=100年は安全」という直感です。これは確率論的に完全な間違いで、30年供用期間中に z_100 を超える確率は約 26%、50年供用なら約 40% にもなります。本ツールが「ミッション期間超過確率」を 6 つの主要指標の 1 つとして大きく表示するのも、この誤解を避けるためです。設計時は必ず「再現期間 T」と「供用期間 D」の両方をセットで決定し、許容できる超過確率(例:D 年で 10% 以下)から逆算して T を選ぶのが正しいアプローチです。

次に多いのが「形状パラメータ ξ を 0 に固定しがち」という落とし穴です。Gumbel 分布(ξ=0)は数学的に扱いやすく Excel の GUMBEL.DIST 関数もあるため、つい全データに Gumbel を当てはめがちです。しかし実際には ξ がわずかに正(重尾)であることが多く、ξ=0 を仮定すると T 年再現値を大きく過小評価します。例えば真の ξ=0.1 のデータに Gumbel を当てはめると、T=1000 年再現値で 30〜50% も低く出ます。必ず ξ も推定し、AIC/BIC で Gumbel vs Fréchet を比較してください。

最後に「N 年のデータから T (≫N) 年の再現値を外挿することの危険性」を意識すべきです。30 年分のデータから 1000 年再現値を求めるのは、データ範囲の 33 倍を外挿する作業で、本ツールの簡易 CI でも幅は ±20〜30 になります。さらに気候変動による非定常性(μ や σ が時間とともに変化する)を考慮すると、定常 GEV の仮定自体が成り立たなくなることもあります。近年は時間依存パラメータをもつ非定常 GEV や、複数地点のデータを統合する空間極値モデルが研究されており、極端現象が増加傾向にある現代では特に重要なテーマです。

使い方ガイド

  1. 位置パラメータ μ(-50~50)、スケール σ(0.1~20)、形状 ξ(-0.5~0.5)を入力して GEV 分布族を指定します。ξ=0 で Gumbel、ξ>0 で Fréchet、ξ<0 で Weibull に自動分類されます。
  2. 再現期間 T(1~1000年)を設定すると、その期間に一度起こりうる極値を計算します。例えば T=100 の場合、毎年 1% の確率で超過する閾値が算出されます。
  3. 出力された再現値 z_T、年超過確率、ミッション期間(例:50年運用)中の超過確率、95% 信頼区間、KS-p値(適合度)を確認して設計基準値や安全係数を決定します。

具体的な計算例

河川堤防の年最大流量データに μ=850 m³/s、σ=120 m³/s、ξ=0.15(Fréchet)を当てはめた場合、100年確率の再現値は z_100≈1420 m³/s と計算されます。年超過確率は 1.0% となり、30年のダム運用期間中の超過確率は 26.3% です。95% CI は [1310, 1540] で、KS-p=0.87 と高い適合度を示しており、設計洪水流量として 1450 m³/s(上側マージン込み)を採用する根拠になります。

実務での注意点

  1. ξ>0.5 の急勾配 Fréchet では右尾部が厚く、千年確率の計算が不安定になります。σ を過度に大きくしないで十分な観測データ(最低 30年以上)を確保してください。
  2. ミッション期間超過確率は単純な 1-(1-p)^n ではなく GEV の累積分布から正確に計算されるため、設計基準値の保守的な決定に信頼できます。
  3. KS-p が 0.05 未満の場合は分布のあてはめが悪く、別の分布族(例:GPD の閾値超過モデル)への切り替えを検討してください。
  4. 風速・地震加速度・降雨量など異なるハザード間で再現期間を比較する際は、必ず各々の ξ 値の差異を考慮して、単純な加算ではなく同時確率を計算してください。