实验设计法 (DOE) — CAE术语解说

分类:术语集 | 2026-03-28
CAE visualization for design of experiment - technical simulation diagram

实验设计法 (DOE) 是什么

🧑‍🎓

经常听到实验设计法(DOE)这个说法,但在CAE环境中到底是什么意思?应该不是物理实验的相关内容吧?


🎓

Design of Experiments,简称DOE。最初是在1920年代由R.A.费舍尔为提高农业实验效率而系统化的统计手法。在CAE中,它被用作"系统地决定使用哪些设计变量组合进行分析"的方法。例如,进行汽车保险杠碰撞分析时,要改变板厚、材料、肋部布置这3个因子,如果全部组合会产生数百个案例。使用DOE的话,只需数十个案例就能有效地把握各因子的影响程度和交互作用。


🧑‍🎓

我明白了,是减少计算次数的同时不遗漏重要信息,对吧?因为逐个尝试会导致计算成本爆增?


🎓

完全正确。CAE分析一次可能要花数小时到数天。比如5个因子各5个水平的完全因子计划需要 $5^5 = 3{,}125$ 个案例。如果每个案例2小时,就需要约260天的计算。而使用DOE,同样的5个因子可以用50到100个案例左右就能把握主效应和主要交互作用。


为什么CAE需要DOE

🧑‍🎓

参数化研究不就是随便选几个参数做几次分析就可以了吗?非要用DOE的理由我不太明白……


🎓

"随便选"是最危险的。实际工作中常见的是,工程师凭直觉分析几个案例,就得出"增加板厚就能提高强度"的结论。但实际上板厚和材料之间存在交互作用,某种材料下增加板厚反而会降低疲劳寿命。DOE正是为了用统计的方法防止这种遗漏。


🧑‍🎓

交互作用,就是因子之间的组合效果,对吧。单因子逐个改变(One-Factor-At-a-Time)的方法看不出这个效果?


🎓

看不出来。OFAT(One-Factor-At-a-Time)是"固定其他因子,只改变一个"的方法,是最基础的参数化研究,但无法检测交互作用,而且只能覆盖设计空间的一部分。DOE将多个因子同时系统地变化,所以能分离推定主效应和交互作用。从统计学意义上讲信息效率要高得多。


代表性的DOE手法

完全因子计划 (Full Factorial Design)

🧑‍🎓

首先请讲讲完全因子计划。这应该是最基本的吧?


🎓

是将所有因子的所有水平组合都试一遍的方法。如果有 $k$ 个因子,每个因子 $n$ 个水平,那么实验次数是 $n^k$。2个因子3个水平的话就是 $3^2 = 9$ 个案例可以接受,但10个因子3个水平就要 $3^{10} = 59{,}049$ 个案例,在实际CAE中基本不可能。所以完全因子计划仅限于因子3到4个、水平数较少的情况。


拉丁超立方体法 (Latin Hypercube Sampling, LHS)

🧑‍🎓

拉丁超立方体法,名字很酷,但具体怎样工作呢?


🎓

简单说,"将各因子的值域 $N$ 等分,从各区间必然抽样一次"的方法。比如板厚1.0到5.0mm范围内要取20个样本,就把这个范围分成0.2mm刻度的20个区间,从每个区间中随机选一点。所有因子都这样独立操作,设计空间就能被均匀覆盖。与随机抽样不同,不会出现"某些区域点密集、某些区域空荡荡"的问题。


🧑‍🎓

在CAE最优化工具中经常看到LHS。modeFRONTIER、OptiSLang等都有。在实际工作中怎样用?


🎓

典型流程是"用LHS生成初始样本 → 执行分析 → 构建响应曲面(代理模型) → 探索最优点"。比如翼形空气动力学最优化,将翼型参数10个通过LHS采样100点,用CFD分析100个案例,构建Kriging模型,然后在其上运行遗传算法。这样就能用100次CFD分析代替10万次。


LHS的数学定义如下。对 $k$ 个因子生成 $N$ 个样本点时,各因子 $x_i$($i=1,\ldots,k$)的值域 $[a_i, b_i]$ 被 $N$ 等分,第 $j$ 个样本点中因子 $i$ 的值由以下方式确定:

$$x_i^{(j)} = a_i + \frac{\pi_i(j) - u_{ij}}{N}(b_i - a_i), \quad j=1,\ldots,N$$

其中 $\pi_i$ 是 $\{1,2,\ldots,N\}$ 的随机排列,$u_{ij} \sim U(0,1)$ 是均匀随机数。

田口法(正交表、SN比)

🧑‍🎓

田口法是日本方法吧。在CAE中还在使用吗?


🎓

当然在用。特别是在日本的汽车和电器制造商中,品质工程的文化很根深蒂固。田口法的核心是正交表SN比两个要素。正交表($L_9$、$L_{18}$、$L_{27}$ 等)用最少的实验次数均匀地安排因子组合。SN比(Signal-to-Noise Ratio)是量化"对波动的稳健性"的指标,分为望目特性、望小特性、望大特性三类。


🧑‍🎓

请举个具体例子。比如冲压成形分析怎样用?


🎓

很好的例子。设要防止冲压成形中的"起皱"和"撕裂"。控制因子有压板力、冲头速度、模具圆角、润滑条件这4个,各3个水平。用 $L_9$ 正交表只需9个成形模拟案例就够了。把材料批次波动(板厚公差、$r$ 值变动)作为误差因子配置到外部正交表。用SN比评估结果,能一目了然地看出"压板力影响最大,但冲头速度对撕裂没有影响"这样的主效应。


望目特性的SN比由以下公式定义:

$$\text{SN比} = 10\log_{10}\frac{\bar{y}^2}{s^2} \quad [\text{dB}]$$

其中 $\bar{y}$ 是响应的平均值,$s^2$ 是方差。SN比越大,说明设计对目标值的波动越小(越稳健)。

响应曲面法 (Response Surface Methodology, RSM)

🧑‍🎓

响应曲面法经常和DOE一起讲,但确切的关系是什么?


🎓

如果说DOE决定"在哪里计算",那么RSM就是"从计算结果构建连续的数学模型"。两者通常配套使用。用DOE选定的样本点执行CAE分析,然后把结果(应力、位移、阻力系数等)近似为输入变量的函数。这就是代理模型(代理模型)。


🧑‍🎓

代理模型有哪些种类?


🎓

代表性的有3种。多项式近似(2次响应曲面)最简单,2个因子的话形式为 $y = \beta_0 + \beta_1 x_1 + \beta_2 x_2 + \beta_{11}x_1^2 + \beta_{22}x_2^2 + \beta_{12}x_1 x_2$。用Box-Behnken计划或CCD(中心复合计划)来确定系数。Kriging(高斯过程回归)必然通过样本点,补间精度高,适合非线性强的响应。近年来神经网络型代理模型也增多了。


🧑‍🎓

实际应用中,比如用RSM最优化热交换器的翅片形状,这样的用法吗?


🎓

正是那样。翅片间距、高度、厚度、角度这4个参数通过LHS取60点进行采样,执行60个共轭热传导CFD分析。从结果为传热性能(Nu数)和压力损失(Δp)构建Kriging模型,进行多目标最优化求Pareto前沿。1个CFD分析要3小时的话,60个案例只需180小时,也就是一周多就能到达最优设计。逐个尝试的话要花好多年。


2次多项式响应曲面的一般形式:

$$\hat{y}(\mathbf{x}) = \beta_0 + \sum_{i=1}^{k}\beta_i x_i + \sum_{i=1}^{k}\beta_{ii}x_i^2 + \sum_{i系数向量 $\boldsymbol{\beta}$ 通过最小二乘法推定:$\hat{\boldsymbol{\beta}} = (\mathbf{X}^T\mathbf{X})^{-1}\mathbf{X}^T\mathbf{y}$

CAE中的DOE工作流

🧑‍🎓

能分步详细讲讲在实际项目中如何应用DOE吗?


🎓

典型的工作流分5个步骤。
Step 1:问题定义 — 明确目的函数(要最小化/最大化的响应)和设计变量(因子)及其范围。比如"碰撞时的胸部加速度最小化,设计变量是A柱板厚(1.2到2.0mm)和前纵梁截面形状(3种)"。
Step 2:选择DOE配置 — 根据因子数、水平数、计算预算选择手法。连续因子多用LHS,离散因子多用正交表,非线性响应需要精密建模用CCD。
Step 3:执行分析 — 对DOE确定的各案例运行CAE分析。通常用自动化脚本(Python + Abaqus/OpenFOAM)批量处理。
Step 4:响应分析 — 用主效应图、交互作用图、方差分析(ANOVA)定量评估各因子的贡献度。必要时构建代理模型。
Step 5:最优化和确认分析 — 在代理模型上探索最优点,然后用CAE进行确认分析验证预测精度。


🧑‍🎓

Step 4的方差分析(ANOVA)具体能得到什么信息?


🎓

ANOVA能显示响应的全变动中"因子A占百分之几""因子A和B的交互作用占百分之几""无法解释的剩余变动占百分之几"。比如碰撞分析中,板厚的贡献率65%、材料的贡献率20%、交互作用10%、残差5%的话,就能判断"首先最优化板厚最有效"。在有限计算预算下,能明确优先顺序获得最大改善。


手法对比表

🧑‍🎓

到底选哪种手法好呢?请告诉判断标准。


🎓

判断标准有3个。(1)因子数和计算预算:因子3个以下用完全因子计划就行,5个以上用LHS或正交表。(2)目的:稳健设计用田口法,连续最优化用LHS加代理模型,2次模型足够用CCD。(3)因子性质:连续变量(尺寸、温度)多用LHS,离散变量(材料种类、形状类型)多用正交表。实际工作中LHS最常用,通用性高,不确定时首先从LHS开始是常识。


🧑‍🎓

最近听说贝叶斯最优化和自适应DOE,和传统DOE有什么区别?


🎓

传统DOE是"先一次性决定所有样本点,然后一起分析"的批处理型。自适应DOE(逐次DOE)是"分析几点 → 更新代理模型 → 自动选择下一个分析点 → 分析"的循环方式。贝叶斯最优化是其代表,用Acquisition Function(EI:期望改善值等)来平衡"最有可能是最优点的地方"和"还不太了解的地方"来决定下一点。同样的计算预算下,批处理型相比这种自适应方式往往能更高效地到达最优解。


对CAE术语的正确理解是团队内交流的基础。 — Project NovaSolver也面向实务者的学习支援。

请告诉我们实验设计法 (DOE) 实际工作中遇到的课题

Project NovaSolver面向CAE工程师每天面对的课题——设置的复杂性、计算成本、结果的解释——努力寻求解决方案。你的实务经验将成为开发更好工具的原动力。

联系我们(准备中)
本文的评价
谢谢你的回答!
有参考
价值
希望更
详细
报告
错误
有参考价值
0
希望更详细
0
报告错误
0
由NovaSolver贡献者编写
匿名工程师与AI — 网站地图