实验设计法 (DOE) — CAE术语解说

分类：术语集 | 2026-03-28

CAE visualization for design of experiment - technical simulation diagram

实验设计法 (DOE) 是什么

🧑‍🎓

经常听到实验设计法（DOE）这个说法，但在CAE环境中到底是什么意思？应该不是物理实验的相关内容吧？

🎓

Design of Experiments，简称DOE。最初是在1920年代由R.A.费舍尔为提高农业实验效率而系统化的统计手法。在CAE中，它被用作"系统地决定使用哪些设计变量组合进行分析"的方法。例如，进行汽车保险杠碰撞分析时，要改变板厚、材料、肋部布置这3个因子，如果全部组合会产生数百个案例。使用DOE的话，只需数十个案例就能有效地把握各因子的影响程度和交互作用。

🧑‍🎓

我明白了，是减少计算次数的同时不遗漏重要信息，对吧？因为逐个尝试会导致计算成本爆增？

🎓

完全正确。CAE分析一次可能要花数小时到数天。比如5个因子各5个水平的完全因子计划需要 $5^5 = 3{,}125$ 个案例。如果每个案例2小时，就需要约260天的计算。而使用DOE，同样的5个因子可以用50到100个案例左右就能把握主效应和主要交互作用。

为什么CAE需要DOE

🧑‍🎓

参数化研究不就是随便选几个参数做几次分析就可以了吗？非要用DOE的理由我不太明白……

🎓

"随便选"是最危险的。实际工作中常见的是，工程师凭直觉分析几个案例，就得出"增加板厚就能提高强度"的结论。但实际上板厚和材料之间存在交互作用，某种材料下增加板厚反而会降低疲劳寿命。DOE正是为了用统计的方法防止这种遗漏。

🧑‍🎓

交互作用，就是因子之间的组合效果，对吧。单因子逐个改变（One-Factor-At-a-Time）的方法看不出这个效果？

🎓

看不出来。OFAT（One-Factor-At-a-Time）是"固定其他因子，只改变一个"的方法，是最基础的参数化研究，但无法检测交互作用，而且只能覆盖设计空间的一部分。DOE将多个因子同时系统地变化，所以能分离推定主效应和交互作用。从统计学意义上讲信息效率要高得多。

代表性的DOE手法

完全因子计划 (Full Factorial Design)

🧑‍🎓

首先请讲讲完全因子计划。这应该是最基本的吧？

🎓

是将所有因子的所有水平组合都试一遍的方法。如果有 $k$ 个因子，每个因子 $n$ 个水平，那么实验次数是 $n^k$。2个因子3个水平的话就是 $3^2 = 9$ 个案例可以接受，但10个因子3个水平就要 $3^{10} = 59{,}049$ 个案例，在实际CAE中基本不可能。所以完全因子计划仅限于因子3到4个、水平数较少的情况。

拉丁超立方体法 (Latin Hypercube Sampling, LHS)

🧑‍🎓

拉丁超立方体法，名字很酷，但具体怎样工作呢？

🎓

简单说，"将各因子的值域 $N$ 等分，从各区间必然抽样一次"的方法。比如板厚1.0到5.0mm范围内要取20个样本，就把这个范围分成0.2mm刻度的20个区间，从每个区间中随机选一点。所有因子都这样独立操作，设计空间就能被均匀覆盖。与随机抽样不同，不会出现"某些区域点密集、某些区域空荡荡"的问题。

🧑‍🎓

在CAE最优化工具中经常看到LHS。modeFRONTIER、OptiSLang等都有。在实际工作中怎样用？

🎓

典型流程是"用LHS生成初始样本 → 执行分析 → 构建响应曲面（代理模型） → 探索最优点"。比如翼形空气动力学最优化，将翼型参数10个通过LHS采样100点，用CFD分析100个案例，构建Kriging模型，然后在其上运行遗传算法。这样就能用100次CFD分析代替10万次。

LHS的数学定义如下。对 $k$ 个因子生成 $N$ 个样本点时，各因子 $x_i$（$i=1,\ldots,k$）的值域 $[a_i, b_i]$ 被 $N$ 等分，第 $j$ 个样本点中因子 $i$ 的值由以下方式确定：

$$x_i^{(j)} = a_i + \frac{\pi_i(j) - u_{ij}}{N}(b_i - a_i), \quad j=1,\ldots,N$$

其中 $\pi_i$ 是 $\{1,2,\ldots,N\}$ 的随机排列，$u_{ij} \sim U(0,1)$ 是均匀随机数。

田口法（正交表、SN比）

🧑‍🎓

田口法是日本方法吧。在CAE中还在使用吗？

🎓

当然在用。特别是在日本的汽车和电器制造商中，品质工程的文化很根深蒂固。田口法的核心是正交表和SN比两个要素。正交表（$L_9$、$L_{18}$、$L_{27}$ 等）用最少的实验次数均匀地安排因子组合。SN比（Signal-to-Noise Ratio）是量化"对波动的稳健性"的指标，分为望目特性、望小特性、望大特性三类。

🧑‍🎓

请举个具体例子。比如冲压成形分析怎样用？

🎓

很好的例子。设要防止冲压成形中的"起皱"和"撕裂"。控制因子有压板力、冲头速度、模具圆角、润滑条件这4个，各3个水平。用 $L_9$ 正交表只需9个成形模拟案例就够了。把材料批次波动（板厚公差、$r$ 值变动）作为误差因子配置到外部正交表。用SN比评估结果，能一目了然地看出"压板力影响最大，但冲头速度对撕裂没有影响"这样的主效应。

望目特性的SN比由以下公式定义：

$$\text{SN比} = 10\log_{10}\frac{\bar{y}^2}{s^2} \quad [\text{dB}]$$

其中 $\bar{y}$ 是响应的平均值，$s^2$ 是方差。SN比越大，说明设计对目标值的波动越小（越稳健）。

响应曲面法 (Response Surface Methodology, RSM)

🧑‍🎓

响应曲面法经常和DOE一起讲，但确切的关系是什么？

🎓

如果说DOE决定"在哪里计算"，那么RSM就是"从计算结果构建连续的数学模型"。两者通常配套使用。用DOE选定的样本点执行CAE分析，然后把结果（应力、位移、阻力系数等）近似为输入变量的函数。这就是代理模型（代理模型）。

🧑‍🎓

代理模型有哪些种类？

🎓

代表性的有3种。多项式近似（2次响应曲面）最简单，2个因子的话形式为 $y = \beta_0 + \beta_1 x_1 + \beta_2 x_2 + \beta_{11}x_1^2 + \beta_{22}x_2^2 + \beta_{12}x_1 x_2$。用Box-Behnken计划或CCD（中心复合计划）来确定系数。Kriging（高斯过程回归）必然通过样本点，补间精度高，适合非线性强的响应。近年来神经网络型代理模型也增多了。

🧑‍🎓

实际应用中，比如用RSM最优化热交换器的翅片形状，这样的用法吗？

🎓

正是那样。翅片间距、高度、厚度、角度这4个参数通过LHS取60点进行采样，执行60个共轭热传导CFD分析。从结果为传热性能（Nu数）和压力损失（Δp）构建Kriging模型，进行多目标最优化求Pareto前沿。1个CFD分析要3小时的话，60个案例只需180小时，也就是一周多就能到达最优设计。逐个尝试的话要花好多年。

2次多项式响应曲面的一般形式：

$$\hat{y}(\mathbf{x}) = \beta_0 + \sum_{i=1}^{k}\beta_i x_i + \sum_{i=1}^{k}\beta_{ii}x_i^2 + \sum_{i系数向量 $\boldsymbol{\beta}$ 通过最小二乘法推定：$\hat{\boldsymbol{\beta}} = (\mathbf{X}^T\mathbf{X})^{-1}\mathbf{X}^T\mathbf{y}$

CAE中的DOE工作流

🧑‍🎓

能分步详细讲讲在实际项目中如何应用DOE吗？

🎓

典型的工作流分5个步骤。
Step 1：问题定义 — 明确目的函数（要最小化/最大化的响应）和设计变量（因子）及其范围。比如"碰撞时的胸部加速度最小化，设计变量是A柱板厚（1.2到2.0mm）和前纵梁截面形状（3种）"。
Step 2：选择DOE配置 — 根据因子数、水平数、计算预算选择手法。连续因子多用LHS，离散因子多用正交表，非线性响应需要精密建模用CCD。
Step 3：执行分析 — 对DOE确定的各案例运行CAE分析。通常用自动化脚本（Python + Abaqus/OpenFOAM）批量处理。
Step 4：响应分析 — 用主效应图、交互作用图、方差分析（ANOVA）定量评估各因子的贡献度。必要时构建代理模型。
Step 5：最优化和确认分析 — 在代理模型上探索最优点，然后用CAE进行确认分析验证预测精度。

🧑‍🎓

Step 4的方差分析（ANOVA）具体能得到什么信息？

🎓

ANOVA能显示响应的全变动中"因子A占百分之几""因子A和B的交互作用占百分之几""无法解释的剩余变动占百分之几"。比如碰撞分析中，板厚的贡献率65%、材料的贡献率20%、交互作用10%、残差5%的话，就能判断"首先最优化板厚最有效"。在有限计算预算下，能明确优先顺序获得最大改善。

手法对比表

🧑‍🎓

到底选哪种手法好呢？请告诉判断标准。

🎓

判断标准有3个。（1）因子数和计算预算：因子3个以下用完全因子计划就行，5个以上用LHS或正交表。（2）目的：稳健设计用田口法，连续最优化用LHS加代理模型，2次模型足够用CCD。（3）因子性质：连续变量（尺寸、温度）多用LHS，离散变量（材料种类、形状类型）多用正交表。实际工作中LHS最常用，通用性高，不确定时首先从LHS开始是常识。

🧑‍🎓

最近听说贝叶斯最优化和自适应DOE，和传统DOE有什么区别？

🎓

传统DOE是"先一次性决定所有样本点，然后一起分析"的批处理型。自适应DOE（逐次DOE）是"分析几点 → 更新代理模型 → 自动选择下一个分析点 → 分析"的循环方式。贝叶斯最优化是其代表，用Acquisition Function（EI：期望改善值等）来平衡"最有可能是最优点的地方"和"还不太了解的地方"来决定下一点。同样的计算预算下，批处理型相比这种自适应方式往往能更高效地到达最优解。

对CAE术语的正确理解是团队内交流的基础。 — Project NovaSolver也面向实务者的学习支援。

请告诉我们实验设计法 (DOE) 实际工作中遇到的课题

Project NovaSolver面向CAE工程师每天面对的课题——设置的复杂性、计算成本、结果的解释——努力寻求解决方案。你的实务经验将成为开发更好工具的原动力。

联系我们（准备中）