NAFEMSって有名なんですか？他にもベンチマーク集ってあるんですか？

NAFEMSはFEM/CFD界隈では超有名な国際団体で、300問以上の公式ベンチマーク集を持っている。それとは別に流体系ではEROFTACのデータベースや、乱流モデル検証用のTurbulence Modeling Resource（NASA提供）が有名だ。構造では線形弾性からクリープ・大変形まで幅広くカバーされている。

実務でベンチマークってどんなタイミングで使うんですか？毎回やるんですか？

主に3つのタイミングがある。①新しいソルバーや機能（新しい乱流モデルとか）を導入するとき、②ソルバーのバージョンアップ後に精度退化がないか確認するとき、③客先や規制当局に「このソルバーは信頼できます」と証明するとき——つまりV&Vの一部として使うんだ。ASME V&V 10なんかでもベンチマーク結果の提示が推奨されている。

へぇ、客先への説明にも使えるんですね。でも、ベンチマーク問題って実際の製品形状と全然違いますよね？意味あるんですか？

鋭い指摘だ。確かに単純形状と実製品は違う。でもベンチマークの目的は「ソルバーコアの数値精度」を切り離して確認することにある。例えば熱伝達係数の計算が正しくできているか、接触問題の法線方向の応力分布が正確かどうか——これを実製品で確かめようとすると変数が多すぎて何が悪いか判断できない。だから「変数を絞った標準問題」で基礎的な精度を担保するわけだ。

CAEベンチマーク — CAE用語解説

Q: 先生、「CAEベンチマーク」って実際に何をやるんですか？ ソルバーを「テスト」するって言いますけど、どんな問題を解かせるんでしょう？

ざっくり言うと、解析的な厳密解や実験データが既知の標準問題をソルバーに解かせて、どれだけ正確か・速いかを採点する作業だよ。例えばNAFEMSが公開している「単純梁の曲げ応力」や「薄肉シェルの座屈荷重」みたいな問題に対して、理論値との誤差が何%か確認する。

カテゴリ: 用語集 | 2026-01-15

CAE visualization for cae benchmark - technical simulation diagram

CAEベンチマーク

🧑‍🎓

先生、「CAEベンチマーク」って実際に何をやるんですか？ソルバーを「テスト」するって言いますけど、どんな問題を解かせるんでしょう？

CAEベンチマークの理論基礎

基本概念と支配方程式

🧑‍🎓

CAEのベンチマークでよく出てくる「支配方程式」って、具体的に何を指しているんですか？

🎓

CAEの文脈では、解析対象の物理現象を記述する基礎方程式を指します。例えば構造解析なら、弾性体の変位と応力の関係を表す

$$ \nabla \cdot \sigma + \mathbf{b} = 0 $$

という平衡方程式が支配方程式の一つです。ここでσは応力テンソル、bは体積力です。ベンチマークでは、この方程式をどの精度で、どれだけ効率的に解けるかを評価します。

🧑‍🎓

「非線形性」という言葉もよく聞きますが、線形と非線形の違いは何が支配方程式に影響するんですか？

🎓

本質的な違いは、応力-ひずみ関係や境界条件が線形（比例関係）かどうかです。線形弾性ではフックの法則

$$ \sigma = E \epsilon $$

が成り立ちますが、材料非線形（塑性）では応力がひずみの履歴に依存します。幾何非線形では、変形が大きいために平衡方程式を変形後の形状で立て直す必要があり、方程式自体が更新されます。これが計算コストを桁違いに増やす要因です。

🧑‍🎓

CFDで「乱流モデル」の比較がよくありますが、これも支配方程式の違いから来るんですか？

🎓

その通りです。ナビエ-ストークス方程式は全ての流れを記述しますが、直接数値シミュレーション(DNS)は現実的でないため、平均化やモデリングを行います。例えば、k-εモデルは乱流エネルギーkとその散逸率εに関する2つの追加輸送方程式を解きます。一方、SST k-ωモデルは壁面近くの解像度が異なります。ベンチマークでは、同じ流路でもモデルによって予測される圧力損失や剥離点が数%〜十数%変わることを確認します。

🧑‍🎓

「無次元数」もベンチマークで重要と聞きました。具体的にどう使われるんですか？

🎓

無次元数は、異なるスケールや条件の現象を同じ土俵で比較するための基準です。例えばレイノルズ数(Re)は慣性力と粘性力の比で、同じReなら流れ場は相似になります。NACA0012翼型のベンチマークでは、Re=6×10^6（亜音速）やMach数=0.15といった条件が設定され、異なるソルバーで計算した揚力係数C_Lや抗力係数C_Dを比較します。これにより、コードやモデルの普遍的な性能を評価できるのです。

CAEベンチマークの数値計算手法

FEM/CFD離散化、ソルバー設定

🧑‍🎓

「メッシュ依存性」という言葉を目にします。ベンチマークではこれをどう評価するんですか？

🎓

メッシュを細かくする（h-refinement）につれて解析解に収束するかどうかを確認します。具体的には、ある代表的な出力値（例えば応力集中部の最大ミーゼス応力）の変化を追跡します。粗いメッシュから始め、要素数を2倍、4倍...と増やし、結果の変化が例えば1%未満になった時点を「メッシュ収束」と判断します。Ansysのベンチマーク例では、L形状ブラケットのフィレット部応力で、二次要素を使うと一次要素よりはるかに早く収束することが示されています。

🧑‍🎓

ソルバーについて「直接法」と「反復法」の比較もよく見ます。ベンチマークでは何を測るんですか？

🎓

主に「求解時間」と「メモリ使用量」です。直接法（例：MUMPS, PARDISO）は前処理が少なく安定ですが、メモリ消費がO(N^1.5)程度と大きい。反復法（例：CG法、GMRES）はメモリ効率が良い代わりに、収束性が問題に依存し、前処理（ICCG, AMG）が性能を左右します。ベンチマークでは、100万自由度の線形弾性問題を解くのに、直接法が50GBのメモリと5分、反復法が10GBと3分、といった具合に具体的な数値で比較します。

🧑‍🎓

「タイムステップ」の影響はどう評価しますか？特に非定常解析で。

🎓

時間積分の安定性と精度を評価します。例えば、CFDの非定常ベンチマーク「Flow past a cylinder (Re=100)」では、ストローハル数St（渦放出周波数）を計算します。タイムステップΔtを小さくしていき、Stの値が一定に収束することを確認します。また、陰的解法と陽的解法では条件が異なります。陽的解法では、CFL条件

$$ C = u \frac{\Delta t}{\Delta x} < C_{max} $$

に従い、安定な最大Δtが決まります。ベンチマークでは、精度を保ちつつ、最も計算コストの低いΔt/解法の組み合わせを探ります。

🧑‍🎓

「並列計算効率」のベンチマークでは、何をどう測れば「効率が良い」と言えるんですか？

🎓

「強スケーリング」と「弱スケーリング」の2つの観点で測ります。強スケーリングは問題規模を固定してCPUコア数を増やし、計算時間がどれだけ短縮されるかを見ます。理想は計算時間がコア数に反比例ですが、通信オーバーヘッドでそれより悪化します。弱スケーリングは、1コアあたりの仕事量を固定して全体の問題規模とコア数を同時に増やし、計算時間が一定に保たれるかを見ます。例えば、Abaqus/Explicitを使った衝突解析で、コア数を4から256に増やした時、強スケーリング効率が85%から65%に低下する、といった結果が示されます。

CAEベンチマークの実務適用

ワークフロー、チェックリスト

🧑‍🎓

自分でCAEソフトの性能をベンチマークしたい場合、まず何から始めるべきですか？

🎓

まず、業界で標準的とされる「ベンチマークケース」を選ぶことです。構造解析なら、NAFEMSのLe10（薄板曲げ）やSn01（3Dソリッド）といった公認問題があります。これらには参照解が提供されているので、自分の結果と比較できます。最初は線形静解析のようなシンプルなケースから始め、メッシュサイズや要素タイプ（一次/二次）を変えて、精度と計算時間のトレードオフを把握するのが定石です。

🧑‍🎓

ベンチマーク実行時に、必ず記録すべき項目は何ですか？

🎓

最低限以下の項目は記録します：

1. **ハードウェア仕様**: CPUモデル（例: Intel Xeon Gold 6348）、コア数、メモリ容量（例: 512 GB DDR4）、ストレージタイプ（NVMe SSD等）。 2. **ソフトウェア環境**: ソルバー名とバージョン（例: Ansys Mechanical 2024 R1）、OS、コンパイラ（使用する場合）。 3. **問題設定**: 要素数/節点数、要素タイプ、材料定数、境界条件。 4. **計算結果**: 総計算時間（ウォールタイム）、メモリ使用量ピーク、求解にかかった反復回数/時間。 5. **物理量の結果**: 注目する応力、変位、周波数などの数値。これらをスプレッドシートに体系的に記録することが比較の基礎になります。

🧑‍🎓

「計算時間」だけを比較するのは危険と聞きました。他にどんな指標を見るべきですか？

🎓

確かに、計算時間だけでは不十分です。重要なのは「精度あたりの計算コスト」です。例えば、ソルバーAは10分で誤差1%の解を出し、ソルバーBは5分で誤差5%の解を出した場合、単純にBが速いとは言えません。また、メモリ使用量も重要で、大規模問題ではメモリ不足で計算自体ができない場合があります。さらに、ソルバーの「ロバスト性」（様々な問題設定で失敗せずに解けるか）や、「ユーザー介入の少なさ」（パラメータ調整の手間）も実務では無視できない評価指標です。

🧑‍🎓

ベンチマーク結果をどう解釈し、実際の業務に活かせばいいですか？

🎓

ベンチマーク結果は「絶対的な順位付け」ではなく、「適材適所の判断材料」として使います。例えば、自社の解析案件の80%が中規模の線形静解析だとします。ベンチマークで、ソフトウェアXはこの種の問題に特化して高速で、ソフトウェアYは非線形や動解析に強いが線形静解析は普通、という結果が出れば、標準ツールをXに統一する判断ができます。また、ハードウェア選定では、メモリ帯域幅が重要なアプリケーション（Explicitソルバー）と、クロック周波数が重要なアプリケーション（Implicitソルバー）で最適なCPUが異なる、といった知見を得られます。

CAEベンチマークのソフトウェア比較

Ansys/Abaqus/COMSOL等

🧑‍🎓

Ansys MechanicalとAbaqus/Standardは、どちらも汎用構造解析ソルバーですが、ベンチマークではどのような違いが現れますか？

🎓

両者のアーキテクチャの違いが性能に現れます。Ansys Mechanicalはデフォルトで分散メモリ並列(DMP)を活用し、大規模線形問題での並列効率が高い傾向があります。一方、Abaqus/Standardは接触問題のアルゴリズム（特に一般接触）に強く、複雑な接触を含む非線形問題でロバスト性と収束性に優れるというベンチマーク結果があります。具体的な数値例では、1000万要素の線形弾性解析で、Ansysが128コアで強スケーリング効率78%、Abaqusが65%という比較も見られます（ハードウェア依存）。

🧑‍🎓

CFDでは、FluentとSTAR-CCM+の比較はどうですか？

🎓

Fluent（Ansys）は長い歴史を持つソルバーで、豊富な乱流モデルとユーザー定義関数(UDF)によるカスタマイズ性が特徴です。STAR-CCM+（Siemens）は「連成解析」と「メッシング」の一体化が強みで、特に多相流や動メッシュを伴う問題でのワークフローの効率性がベンチマークで評価されます。計算速度そのものは、単純な内部流れ（例：Automotive Aeroのベンチマーク）では両者に大差ないことも多いですが、複雑な形状の全自動メッシュ生成ではSTAR-CCM+がユーザー介入時間を短縮できるという定性的な評価があります。

🧑‍🎓

COMSOL Multiphysicsは「マルチフィジックス」が売りですが、単一物理場の問題では他のソルバーに劣るんですか？

🎓

必ずしも劣るわけではありませんが、設計思想が異なります。COMSOLは有限要素法(FEM)に統一されており、電磁界、伝熱、構造、流体（低速）を同じフレームワークで扱えます。単体の構造解析ベンチマークでは、AbaqusやAnsysのような大規模並列求解の最適化が進んだ専用ソルバーに、特に超大型問題では計算時間で差をつけられることがあります。しかし、例えば圧電効果（構造-電界連成）や焦電効果（熱-電界連成）のような本質的に連成した問題では、COMSOLの統一的なアプローチが設定の簡便さと精度の面で優位になることが多いです。

🧑‍🎓

オープンソースソフトウェア（CalculiX, OpenFOAM）は商用ソフトと比べてどう評価されますか？

🎓

コアとなる数値解法の性能自体は、よくチューニングされた商用ソルバーに匹敵する場合もあります。例えば、OpenFOAMの単純な乱流チャネル流計算はFluentと同等の精度と速度を出せます。しかし、ベンチマークで差がつくのは「ロバスト性」「ユーザビリティ」「特殊機能」です。商用ソフトは、収束が難しい非線形問題での自動的なパラメータ調整（例：Abaqusの自動ステップ制御）や、高度な材料モデル（超弾性、クリープ）が充実しています。また、前処理・後処理の統合環境やテクニカルサポートも含めた総合的な「生産性」で比較すると、商用ソフトに軍配が上がることが多いのが現実です。

CAEベンチマークのトラブル対応

よくあるエラーと対策

🧑‍🎓

ベンチマーク実行中に「ソルバーが収束しない」というエラーが出ました。最初に疑うべき原因は何ですか？

🎓

まず、問題設定そのものに物理的な不具合がないか確認します。具体的には：1. **単位系の不一致**: 材料のヤング率200GPaを200と入力していないか。2. **拘束不足**: 剛体変位が抑制されていない「浮いた」構造になっていないか。3. **材料/要素の不適切**: ほぼ不可圧縮な材料（ゴム）に完全積分要素を使うと体積ロッキングを起こします。ベンチマークケースであれば、これらの基本設定は正しいはずなので、次にメッシュ品質（アスペクト比、歪み）や、非線形解析の場合は初期荷重の大きさ（一度に載せすぎ）を疑います。

🧑‍🎓

「メモリ不足」で計算が途中で止まります。ベンチマークで使用するマシンのメモリはどれくらい見積もればいいですか？

🎓

必要なメモリはソルバーと問題の種類で大きく変わります。大まかな経験則としては：

- **Abaqus/Standard (Implicit)**: 1万自由度あたり約10〜50MB。100万自由度で10〜50GB。 - **Abaqus/Explicit (Explicit)**: メッシュと要素に強く依存するが、Implicitよりは少ない。100万要素で数GB〜十数GB。 - **Ansys Fluent (CFD)**: セル数が100万の場合、使用メモリは約500MB〜1GB（モデルや解法による）。最も危険なのはImplicitソルバーの直接法です。必要なメモリは自由度Nに対してO(N^1.5)で増加するため、問題規模を2倍にするとメモリ使用量は約3倍になります。ベンチマーク前には、ソルバーマニュアルのメモリ見積もり式か、小規模ケースでの使用量から外挿して見積もるべきです。

🧑‍🎓

並列計算でコア数を増やすと、かえって計算が遅くなることがあります。これはなぜですか？

🎓

これは「並列オーバーヘッド」が原因です。主な要因は3つ：1. **通信時間**: コア間でメッシュデータや計算結果を同期する時間。コア数が増えると通信ネットワークが飽和します。2. **負荷分散の不均一**: メッシュを自動分割した場合、各コアに割り当てられた要素数や計算負荷に偏りがあると、最も負荷の大きいコアが終わるまで全体が待機します（同期処理の場合）。3. **逐次処理部分**: 並列化できない前処理や後処理の部分がボトルネックになります（アムダールの法則）。対策としては、問題規模に対して適切なコア数を見極め（小さな問題で多数のコアを使わない）、ソルバーが提供する高品質なメッシュ分割ツール（MET