试验设计 DOE 模拟器

参数设置

因子数 k

独立变化的输入变量的数量

计划类型

筛选 → 优化的复杂度递增

中心点重复数 n_c

纯误差推定・曲率检出的中心水平重复

推定主效果 σ

要检出的效果大小（响应变量单位）

残差标准差 σ_n

重复测量的变异（纯误差）

检出力目标 1-β

通常以 0.80（=80%）以上为目标

计算结果

—

必要实验次数

—

计划分解能

—

主效果数

—

2因子交互作用数

—

检出力 (%)

—

OFAT比节约 (%)

—

实验点配置 — 立方体图

立方体顶点为 2^k 因子点，沿轴方向延伸的点为 CCD 的轴点 (±α)，中央为中心点重复。切换计划类型时配置变化。

计划类型别必要实验次数比较

检出力 vs 实验次数

理论・主要公式

$$\text{Full } 2^k = 2^k \text{ runs},\quad \text{CCD} = 2^k + 2k + n_c,\quad \text{Power} = 1 - \beta$$

k = 因子数、n_c = 中心点重复、Resolution III = 仅主效果独立、IV = 主效果与部分2因子交互作用独立、V以上 = 全2因子交互作用独立。

$$\text{Fractional }2^{k-p} = \frac{2^k}{2^p},\quad \text{PB} \ge 4\lceil(k+1)/4\rceil \text{ runs}$$

部分实施将实验次数削减为 1/2^p，但一部分效果 (confounding) 混淆无法独立推定。PB 用最少4的倍数次数仅推定主效果。

$$t = \frac{\Delta}{\sigma_n}\cdot\frac{\sqrt{N}}{2},\quad \text{Power} \approx 1 - \exp\!\left(-\frac{(t-z_{\alpha/2})^2}{2}\right)$$

从推定主效果 Δ・残差标准差 σ_n・总实验次数 N 构建 t 统计量，用双侧检验阈值 z_{α/2}=1.96 概算检出力（简易近似式）。

试验设计法 (DOE) — 直交计划与因子设计

🙋

我听说过试验设计的名字，但说到底有什么用？「设计实验」听起来像是理所当然的事……

🎓

这样感觉很正常。但「设计」的含义和一般现场的理解有点不同。很多人做的是 OFAT，即「仅改变一个因子固定其他，看结果后改变下一个因子」的方法。直观易懂但信息效率很低。例如3个因子3水平用 OFAT 需要约10次实验，而且看不到因子间的组合效果（交互作用）。DOE 的全因子计划 2^3 只需8次，就能独立推定3个主效果＋3个交互作用。同样的劳力得到的信息量完全不同。

🙋

明白了！那总是用全因子就行啦。……结果把 k 改成5，实验次数跳到32次。这在现实中好像很吃力…

🎓

你注意到了关键问题。这就是「维数灾难」。2^k 在 k=2 时是4，k=5 时是32，k=8 时是256，倍增增长。所以出现了部分实施计划 (Fractional Factorial)。把计划类型滑块改成「2^(k-1) 1/2 部分实施」试试。实验次数减半，但代价是部分「交互作用」与主效果混淆 (confound)，无法单独分离。用分解能 (Resolution) III, IV, V 这些指标表示，V以上能清晰分开2因子交互作用。筛选阶段用 III/IV 就够，优化时用 V 以上。

🙋

还有 CCD 和 Plackett-Burman 这些神秘选项。这些有什么区别？

🎓

用途完全不同。Plackett-Burman 是「仅关心主效果，想快速筛出重要因子」的筛选用。10～20个因子可在12～24次快速粗筛。CCD (中心复合计划) 则是「用3～5个筛出的因子，想用响应曲面优化」的阶段用。在 2^k 因子点基础上加轴点 (±α 位置) 和中心点重复，能用2次函数 y = b0 + Σbi·xi + Σbij·xi·xj + Σbii·xi² 建模。实务标准做法是「PB 筛选→CCD 优化」的两阶段。

🙋

还有「检出力」也出现了。这是什么意思？滑块移动时变化很大呢。

🎓

统计检出力 (Power, 1-β) 是「当确实有效果时，实验能正确判定为显著的概率」。惯例上以 0.80 以上为目标。检出力由 (1) 效果大↑ (2) 残差波动小↑ (3) 实验次数多↑ 决定。所以滑块增加 σ_n（残差标准差）检出力会急剧下降。反之增加中心点重复 n_c 来增加总实验数就能恢复。本工具用 t = Δ/σ_n × √N/2 概算检出力。严格用非中心 t 分布，但设计阶段这样近似就够了。

🙋

最后「OFAT比节约」有时是负数。这是说 DOE 比 OFAT 更多实验？

🎓

是的，确实有这种情况。k 少且中心点多时，全因子＋中心点合计会超过「OFAT 三水平 k 因子」的表面实验数。但重点是，「同样次数 DOE 的信息量完全不同」。不仅主效果，交互作用和曲率都能看到。所以即使「节约％」为负，按单位信息量成本来看 DOE 优势巨大。试试把 k 改成5，你会看「节约％」正值大幅跳升。

常见问题

OFAT (One Factor At a Time) 是「固定其他因子，仅改变一个」的朴素方法，k 个因子・各3水平则需要 3k+1 次左右的实验。DOE 的 2^k 全因子计划用 2^k 次，且能同时推定交互作用（因子间的组合效果）。例如 k=5 时，OFAT 约16次・仅了解主效果，但全因子32次可独立推定10个主效果＋10个交互作用。实验次数增加但单位信息量成本远低于 OFAT。

因子数 k 为4以下时，全因子计划 (2^k=16次以下) 就足够实用。k=5 以上时，32, 64, 128… 次数倍增，应使用 1/2 部分实施 (2^(k-1))、1/4 部分实施 (2^(k-2)) 来抑制实验次数。代价是部分效果「混淆 (confounding)」无法单独分离。分解能 (Resolution) III 仅主效果独立，IV 是主效果和部分2因子交互作用独立，V以上是全2因子交互作用独立。筛选阶段选 Resolution III/IV，优化阶段选 Resolution V 以上。

CCD 是响应曲面法 (RSM: Response Surface Methodology) 的代表计划，当想用因子的2次函数 y = b0 + Σbi·xi + Σbij·xi·xj + Σbii·xi² 来近似响应时使用。实验点包括 (1) 2^k 因子点、(2) 2k 个轴点 (±α 位置)、(3) 中心点 nc 次重复，共 2^k + 2k + nc 次。可推定2次效果，适合最优点探索和曲率检出。实务的标准做法是「用 PB 或 Fractional 筛选重要因子至3～5个，再用 CCD 优化」的两阶段运用。

Plackett-Burman (PB) 是用最少实验次数仅推定主效果的筛选计划。4的倍数次数可处理最多 k = 实验次数 -1 个因子。例如12次可筛选11个因子，20次可筛选19个。Resolution III 中2因子交互作用与主效果混淆，但在「快速了解哪个因子重要」的阶段极为强大。药学・食品・基因表达等因子10～20个的领域标准应用。本工具中选 PB 可明显看出实验次数的大幅下降。

实际应用

制造工艺优化：射出成型・切削加工・半导体工艺等中，温度・速度・压力・时间等条件的同时优化中，DOE 标准应用。例如射出成型中金型温度・射出速度・保压・冷却时间4因子用全因子计划 (16次) 或1/2部分实施 (8次) 网罗，同时最小化缩孔・翘曲・尺寸精度。Six Sigma 的「分析 (Analyze)・改善 (Improve)」阶段核心工具。

产品开发・配方优化：树脂复合配方、医药处方、食品调配等中，混合设计 (Mixture Design) 与 CCD 结合。Stat-Ease 的 Design-Expert、JMP、Minitab 等商用软件标准。例如3成分医药制剂中，有效成分・赋形剂・崩解剂比例变化来优化溶出曲线，DOE 威力显著。

CAE 仿真・虚拟实验：模拟一次成本高（HPC 需数小时～数日），所以采样战略中 DOE 必需。与实机实验不同「中心点无测量误差」，但构建代理模型 (Kriging, RBF, 多项式回归) 的基础数据中，Latin Hypercube Sampling 或 CCD 使用。流体仿真・结构优化・优化算法 (Bayesian Optimization) 初始点设计直接相关。

品质工学・田口方法：日本品质工学中直交阵表 L8, L16, L18 用「内侧因子×外侧因子」双重直交设计，用 SN 比评估鲁棒性（对波动的强度）。本工具处理的 Factorial / Fractional 是欧美 Box-Hunter 系统，田口是日本流，但根底「实验计划」思想共同。丰田・松下等日本制造业竞争力的支撑手法。

常见误区与注意事项

最常见的是「分解能 III 却解释交互作用」误用。Resolution III 的部分实施计划中，某主效果与其他2因子交互作用完全混淆 (confound)。即「A 的主效果」显示的值，可能实际是「A + BC + DE + …」的和。不知道这点还「主效果出现了！」解释，会导致本质是交互作用的大误导。本工具显示分解能，但解释前必须用别名表 (Aliasing Table) 确认「哪个效果与哪个效果混淆」。

再者是「中心点设为0」的错误。中心点 n_c 用于推定「纯误差」和检出「曲率存在」。无中心点的 2^k 计划只能拟合线性模型，响应非线性（存在最优点等）时预测偏离很大。最低需要 n_c = 3～5，若中心点与立方体顶点平均有显著差异，这是「曲率存在→扩展为CCD」的信号。本工具 n_c 设为0时检出力下降就是这个原因。

最后是「忘记随机化」。DOE 假定实验顺序随机。实际现场「改温度麻烦所以低温→高温顺序做」会产生区块效果（时间・装置温度漂移・操作者习惯），与因子效果混淆，即使分解能 V 的漂亮计划也完全坏掉。无法实现随机化时应作为区块设计 (Blocking) 事先纳入计划。「设计漂亮结果噪声大」的多数麻烦，原因都是这个随机化遗漏。

试验设计法 (DOE) — 直交计划与因子设计

常见问题

实际应用

常见误区与注意事项

使用指南

具体计算例

实务注意事项