试验设计 DOE 模拟器 返回
实验・优化

试验设计 DOE 模拟器

切换全因子计划・部分实施计划・中心复合计划 (CCD)・Plackett-Burman,实时比较必要实验次数・统计检出力・OFAT 节约率。每次改变因子数时「全因子爆炸→部分实施抑制」的行为一目了然。

参数设置
因子数 k
独立变化的输入变量的数量
计划类型
筛选 → 优化的复杂度递增
中心点重复数 n_c
纯误差推定・曲率检出的中心水平重复
推定主效果 σ
要检出的效果大小(响应变量单位)
残差标准差 σ_n
重复测量的变异(纯误差)
检出力目标 1-β
通常以 0.80(=80%)以上为目标
计算结果
必要实验次数
计划分解能
主效果数
2因子交互作用数
检出力 (%)
OFAT比节约 (%)
实验点配置 — 立方体图

立方体顶点为 2^k 因子点,沿轴方向延伸的点为 CCD 的轴点 (±α),中央为中心点重复。切换计划类型时配置变化。

计划类型别 必要实验次数比较
检出力 vs 实验次数
理论・主要公式

$$\text{Full } 2^k = 2^k \text{ runs},\quad \text{CCD} = 2^k + 2k + n_c,\quad \text{Power} = 1 - \beta$$

k = 因子数、n_c = 中心点重复、Resolution III = 仅主效果独立、IV = 主效果与部分2因子交互作用独立、V以上 = 全2因子交互作用独立。

$$\text{Fractional }2^{k-p} = \frac{2^k}{2^p},\quad \text{PB} \ge 4\lceil(k+1)/4\rceil \text{ runs}$$

部分实施将实验次数削减为 1/2^p,但一部分效果 (confounding) 混淆无法独立推定。PB 用最少4的倍数次数仅推定主效果。

$$t = \frac{\Delta}{\sigma_n}\cdot\frac{\sqrt{N}}{2},\quad \text{Power} \approx 1 - \exp\!\left(-\frac{(t-z_{\alpha/2})^2}{2}\right)$$

从推定主效果 Δ・残差标准差 σ_n・总实验次数 N 构建 t 统计量,用双侧检验阈值 z_{α/2}=1.96 概算检出力(简易近似式)。

试验设计法 (DOE) — 直交计划与因子设计

🙋
我听说过试验设计的名字,但说到底有什么用?「设计实验」听起来像是理所当然的事……
🎓
这样感觉很正常。但「设计」的含义和一般现场的理解有点不同。很多人做的是 OFAT,即「仅改变一个因子固定其他,看结果后改变下一个因子」的方法。直观易懂但信息效率很低。例如3个因子3水平用 OFAT 需要约10次实验,而且看不到因子间的组合效果(交互作用)。DOE 的全因子计划 2^3 只需8次,就能独立推定3个主效果+3个交互作用。同样的劳力得到的信息量完全不同。
🙋
明白了!那总是用全因子就行啦。……结果把 k 改成5,实验次数跳到32次。这在现实中好像很吃力…
🎓
你注意到了关键问题。这就是「维数灾难」。2^k 在 k=2 时是4,k=5 时是32,k=8 时是256,倍增增长。所以出现了部分实施计划 (Fractional Factorial)。把计划类型滑块改成「2^(k-1) 1/2 部分实施」试试。实验次数减半,但代价是部分「交互作用」与主效果混淆 (confound),无法单独分离。用分解能 (Resolution) III, IV, V 这些指标表示,V以上能清晰分开2因子交互作用。筛选阶段用 III/IV 就够,优化时用 V 以上。
🙋
还有 CCD 和 Plackett-Burman 这些神秘选项。这些有什么区别?
🎓
用途完全不同。Plackett-Burman 是「仅关心主效果,想快速筛出重要因子」的筛选用。10~20个因子可在12~24次快速粗筛。CCD (中心复合计划) 则是「用3~5个筛出的因子,想用响应曲面优化」的阶段用。在 2^k 因子点基础上加轴点 (±α 位置) 和中心点重复,能用2次函数 y = b0 + Σbi·xi + Σbij·xi·xj + Σbii·xi² 建模。实务标准做法是「PB 筛选→CCD 优化」的两阶段。
🙋
还有「检出力」也出现了。这是什么意思?滑块移动时变化很大呢。
🎓
统计检出力 (Power, 1-β) 是「当确实有效果时,实验能正确判定为显著的概率」。惯例上以 0.80 以上为目标。检出力由 (1) 效果大↑ (2) 残差波动小↑ (3) 实验次数多↑ 决定。所以滑块增加 σ_n(残差标准差)检出力会急剧下降。反之增加中心点重复 n_c 来增加总实验数就能恢复。本工具用 t = Δ/σ_n × √N/2 概算检出力。严格用非中心 t 分布,但设计阶段这样近似就够了。
🙋
最后「OFAT比节约」有时是负数。这是说 DOE 比 OFAT 更多实验?
🎓
是的,确实有这种情况。k 少且中心点多时,全因子+中心点合计会超过「OFAT 三水平 k 因子」的表面实验数。但重点是,「同样次数 DOE 的信息量完全不同」。不仅主效果,交互作用和曲率都能看到。所以即使「节约%」为负,按单位信息量成本来看 DOE 优势巨大。试试把 k 改成5,你会看「节约%」正值大幅跳升。

常见问题

OFAT (One Factor At a Time) 是「固定其他因子,仅改变一个」的朴素方法,k 个因子・各3水平则需要 3k+1 次左右的实验。DOE 的 2^k 全因子计划用 2^k 次,且能同时推定交互作用(因子间的组合效果)。例如 k=5 时,OFAT 约16次・仅了解主效果,但全因子32次可独立推定10个主效果+10个交互作用。实验次数增加但单位信息量成本远低于 OFAT。
因子数 k 为4以下时,全因子计划 (2^k=16次以下) 就足够实用。k=5 以上时,32, 64, 128… 次数倍增,应使用 1/2 部分实施 (2^(k-1))、1/4 部分实施 (2^(k-2)) 来抑制实验次数。代价是部分效果「混淆 (confounding)」无法单独分离。分解能 (Resolution) III 仅主效果独立,IV 是主效果和部分2因子交互作用独立,V以上是全2因子交互作用独立。筛选阶段选 Resolution III/IV,优化阶段选 Resolution V 以上。
CCD 是响应曲面法 (RSM: Response Surface Methodology) 的代表计划,当想用因子的2次函数 y = b0 + Σbi·xi + Σbij·xi·xj + Σbii·xi² 来近似响应时使用。实验点包括 (1) 2^k 因子点、(2) 2k 个轴点 (±α 位置)、(3) 中心点 nc 次重复,共 2^k + 2k + nc 次。可推定2次效果,适合最优点探索和曲率检出。实务的标准做法是「用 PB 或 Fractional 筛选重要因子至3~5个,再用 CCD 优化」的两阶段运用。
Plackett-Burman (PB) 是用最少实验次数仅推定主效果的筛选计划。4的倍数次数可处理最多 k = 实验次数 -1 个因子。例如12次可筛选11个因子,20次可筛选19个。Resolution III 中2因子交互作用与主效果混淆,但在「快速了解哪个因子重要」的阶段极为强大。药学・食品・基因表达等因子10~20个的领域标准应用。本工具中选 PB 可明显看出实验次数的大幅下降。

实际应用

制造工艺优化:射出成型・切削加工・半导体工艺等中,温度・速度・压力・时间等条件的同时优化中,DOE 标准应用。例如射出成型中金型温度・射出速度・保压・冷却时间4因子用全因子计划 (16次) 或1/2部分实施 (8次) 网罗,同时最小化缩孔・翘曲・尺寸精度。Six Sigma 的「分析 (Analyze)・改善 (Improve)」阶段核心工具。

产品开发・配方优化:树脂复合配方、医药处方、食品调配等中,混合设计 (Mixture Design) 与 CCD 结合。Stat-Ease 的 Design-Expert、JMP、Minitab 等商用软件标准。例如3成分医药制剂中,有效成分・赋形剂・崩解剂比例变化来优化溶出曲线,DOE 威力显著。

CAE 仿真・虚拟实验:模拟一次成本高(HPC 需数小时~数日),所以采样战略中 DOE 必需。与实机实验不同「中心点无测量误差」,但构建代理模型 (Kriging, RBF, 多项式回归) 的基础数据中,Latin Hypercube Sampling 或 CCD 使用。流体仿真・结构优化・优化算法 (Bayesian Optimization) 初始点设计直接相关。

品质工学・田口方法:日本品质工学中直交阵表 L8, L16, L18 用「内侧因子×外侧因子」双重直交设计,用 SN 比评估鲁棒性(对波动的强度)。本工具处理的 Factorial / Fractional 是欧美 Box-Hunter 系统,田口是日本流,但根底「实验计划」思想共同。丰田・松下等日本制造业竞争力的支撑手法。

常见误区与注意事项

最常见的是「分解能 III 却解释交互作用」误用。Resolution III 的部分实施计划中,某主效果与其他2因子交互作用完全混淆 (confound)。即「A 的主效果」显示的值,可能实际是「A + BC + DE + …」的和。不知道这点还「主效果出现了!」解释,会导致本质是交互作用的大误导。本工具显示分解能,但解释前必须用别名表 (Aliasing Table) 确认「哪个效果与哪个效果混淆」。

再者是「中心点设为0」的错误。中心点 n_c 用于推定「纯误差」和检出「曲率存在」。无中心点的 2^k 计划只能拟合线性模型,响应非线性(存在最优点等)时预测偏离很大。最低需要 n_c = 3~5,若中心点与立方体顶点平均有显著差异,这是「曲率存在→扩展为CCD」的信号。本工具 n_c 设为0时检出力下降就是这个原因。

最后是「忘记随机化」。DOE 假定实验顺序随机。实际现场「改温度麻烦所以低温→高温顺序做」会产生区块效果(时间・装置温度漂移・操作者习惯),与因子效果混淆,即使分解能 V 的漂亮计划也完全坏掉。无法实现随机化时应作为区块设计 (Blocking) 事先纳入计划。「设计漂亮结果噪声大」的多数麻烦,原因都是这个随机化遗漏。

使用指南

  1. 设置因子数(k):例如半导体制造扩散炉中温度・压力・气体流量3因子时 k=3
  2. 指定各因子水平范围:温度900~1100℃、压力0.5~2.0 atm 等实验范围输入
  3. 确定中心点数(nc):响应曲面法精度提高需 nc=3~5 标准,噪声大时增加
  4. 设置最小检出效果差(Δ):工艺能力指数 Cpk 容许变量,例厚膜±5 μm
  5. 输入噪声标准差(σ):从过去数据推定,半导体晶圆膜厚典型 σ=2~3 nm
  6. 各计划方式的必要实验次数・分解能・检出力自动比较显示

具体计算例

化学反应器收率优化设想:反应温度・催化剂浓度・搅拌速度3因子(k=3),各因子2水平构成计划。2^3全因子计划8次实验,中心点3次共11次。半部分实施(2^(3-1))4次+3次共7次,节约39%。效果最小检出差 Δ=2%、噪声 σ=1.5% 时,全因子计划检出力87%,部分实施78%。与之相比 OFAT 达同样精度需18次,部分实施节约61%的实验。

实务注意事项