认识论不确定性与偶然性不确定性
认识论不确定性与偶然性不确定性的理论基础
两种类型的不确定性
老师,认识论不确定性和偶然性不确定性有什么区别? 都是"不确定性"吧?
好问题! 简单来说,偶然性不确定性(aleatory uncertainty)是自然界的固有变化性,再多数据也消除不了。而认识论不确定性(epistemic uncertainty)源自知识不足,通过改进模型或增加数据可以减少。
具体有哪些案例呢?
比如考虑汽车碰撞试验。同一辆车在相同条件下碰撞,钢板的屈服应力却因批次略有不同。这是自然界的变化性 ― 即偶然性不确定性。即使做100万次试验,这种变化也不会消失。
另一方面,碰撞仿真中使用的摩擦系数来自文献,本质上我们不知道真实值。进行精密实验就能接近真值。这是认识论不确定性。
我明白了。"能否减少"是关键点!
完全正确。还有一点很重要 ― V&V国际规范ASME V&V 20要求明确区分并定量化两者。混淆会导致无法看清改进空间。
| 特性 | 偶然性(Aleatory) | 认识论(Epistemic) |
|---|---|---|
| 别名 | 不可约不确定性、统计不确定性 | 可约不确定性、系统不确定性 |
| 原因 | 自然变化性(概率波动) | 知识·数据·模型不足 |
| 可否降低 | 不可 ― 本质上随机 | 可 ― 通过改进模型和数据降低 |
| 数学表示 | 概率分布 $f_X(x)$ | 区间 $[a, b]$、信念函数、P-box |
| CAE例子 | 材料强度的批次变化、风荷载变化 | 湍流模型误差、未知边界条件 |
| 传播方法 | Monte Carlo、PCE | 区间分析、Dempster-Shafer |
偶然性不确定性的数学表达
偶然性不确定性用公式怎么表示?
偶然性不确定性用概率论处理。为输入变量 $X$ 分配概率密度函数 $f_X(x)$,然后求输出 $Y = g(X)$ 的统计量。
输出 $Y$ 的期望值和方差可以这样表示:
也就是说,如果输入的概率分布完全已知,原则上输出分布也能算出来,对吧?
是的。但实际上 $g(\cdot)$ 是巨型CAE模型,无法解析积分。所以用Monte Carlo采样或多项式混沌展开(PCE)。
认识论不确定性的数学表达
认识论不确定性是否也能用概率分布表示?
这个问题有两个流派。贝叶斯主观概率派认为认识论不确定性也可以用概率分布表示。而非概率方法派认为"数据不足时随意假设概率分布很危险",倾向用区间或模糊集表示。
区间表示的情况下,变量 $\theta$ 的可能取值范围是:
比如湍流模型常数 $C_\mu$,不同文献给出 $0.07 \leq C_\mu \leq 0.11$。现在我们不知道哪个值是"真实"的,只能用这个范围。这就是用区间表示的认识论不确定性。
概率分布和区间的传播方法肯定完全不同吧。
完全不同。正因为如此,才需要P-box和Dempster-Shafer理论这样的框架来统一处理两者。
概率箱(P-box)
P-box这个名字听过,但没太理解…
P-box(Probability box)是用累积分布函数(CDF)的上界和下界来表示不确定性的方法。它能同时处理偶然性和认识论不确定性,这是最大优点。
具体例子:钢材屈服应力服从正态分布 $N(\mu, \sigma^2)$(这是偶然性不确定性)。但平均值 $\mu$ 由于数据不足,我们只知道 $\mu \in [340, 360]$ MPa(这是认识论不确定性)。此时CDF不是一条曲线,而是带状区域。这个带就是P-box。
我明白了!分布的"形状"已知,但参数有范围的情况呀。
正是!分布信息更少的情况下也能用P-box。比如分布形状都不清楚,只知道均值和方差的范围。这时用Chebyshev不等式从上下界构造分布无关的P-box。
Dempster-Shafer 证据理论
Dempster-Shafer理论是什么? P-box的哪里不同?
Dempster-Shafer(DS)理论是从不完全证据中表示信念程度的框架。概率论给每个事件分配一个概率,而DS理论用信念函数Bel和似然函数Pl表示概率的下界和上界。
机制是这样的。首先定义基本概率分配(BPA: Basic Probability Assignment)函数 $m$,表示每个证据的"质量",赋予空集外的子集:
信念函数和似然函数定义为:
Bel是"至少能相信的"下界,Pl是"最多能相信的"上界,对吗?
完全正确!实际应用中,比如多位专家有不同意见。专家A说"参数在 $[2, 5]$ 范围",专家B说"在 $[4, 7]$ 范围"。我们给各意见分配信度(BPA),用Dempster结合规则整合,最后看哪个区间汇聚了最多证据。
这样也能用于共识建立吧。
ASME V&V 20 中的位置
ASME V&V 20怎么规定的?
ASME V&V 20-2009 "Standard for Verification and Validation in Computational Fluid Dynamics and Heat Transfer"定义模型检验指标 $E$ 为:
其中 $S$ 是仿真结果,$D$ 是实验数据。这个 $E$ 包含的不确定性分为三类:
- $u_{\text{num}}$ ― 数值不确定性(离散化误差、迭代误差等):认识论
- $u_{\text{input}}$ ― 输入不确定性(材料常数、边界条件变化):偶然性+认识论混合
- $u_D$ ― 实验不确定性(测量误差、再现性):偶然性+认识论混合
关键点是,如果 $|E| \leq u_{\text{val}}$,并不能说"模型已验证",而是说"在检验不确定性范围内相容"。认识论不确定性要明确标示出来作为将来改进的空间。
区分开就能看到"改进空间在哪"了。很合理的设计。
认识论不确定性与偶然性不确定性的数值计算方法
偶然性不确定性的传播方法
偶然性不确定性怎么具体传播?
最标准的是Monte Carlo采样(MCS)。从输入变量的概率分布中生成 $N$ 个样本,每个样本运行一次CAE模型。输出的直方图自然形成。
需要多少个样本? CAE一次计算都很耗时…
收敛速率是 $O(1/\sqrt{N})$,与输入维数无关是优点。但要准确捕捉分布尾部(如99百分位数),需要 $N \geq 10{,}000$。实务中经常用拉丁超立方体采样(LHS)来大幅减少所需样本数。
| 方法 | 收敛速率 | 需要样本数 | 特点 |
|---|---|---|---|
| 简单Monte Carlo | $O(N^{-1/2})$ | 10,000〜1,000,000 | 通用性高,高维也能用 |
| 拉丁超立方体 | $O(N^{-1/2})$ 以上 | 100〜10,000 | 分层采样,降低方差 |
| 多项式混沌展开(PCE) | 指数级 | $(p+1)^n$ 左右 | 低维、光滑响应面强 |
| Kriging/高斯过程 | ― | 10〜100 | 代理模型,少样本利用 |
认识论不确定性的传播方法
认识论不确定性没有概率分布,能用Monte Carlo吗?
不能。认识论不确定性用区间表示时,用区间分析求输出的最大值和最小值:
简单情况下可以利用 $g$ 的单调性只评估端点。但有多个认识论参数时,需要解优化问题。常用遗传算法或粒子群优化这样的全局优化。
认识论不确定性用Dempster-Shafer表示时呢?
那样的话对每个焦点要素(focal element)评估模型,在输出侧构造Bel和Pl。若焦点要素有 $m$ 个,至少需要 $2m$ 次模型评估(每个焦点要素的上下端)。
混合不确定性的传播(双重循环法)
现实中两种不确定性都有吧。怎么同时处理?
最经典的是双重循环法(Double-loop method)。外层循环改变认识论参数,内层循环对偶然性参数做Monte Carlo:
结果是每个认识论参数值对应一条CDF。这些曲线的包络线就是输出的P-box。
外层100次 × 内层10,000次 = 100万次CAE计算…现实不可能啊?
完全同意。所以接下来要说的代理模型才如此重要。
代理模型加速
怎么实际操作双重循环?
实务中用代理模型(surrogate model)替代CAE,速度快得多。主要手法有:
- 多项式混沌展开(PCE):用偶然性变量的正交多项式展开输出。展开系数可含认识论参数依赖性,一举两得。
- Kriging(高斯过程回归):从少量训练数据得到任意点的预测值和预测方差。预测方差本身可看作认识论不确定性指标。
- 神经网络:高维输入有优势,但外推性能和可解释性有问题。
用代理模型可把CAE计算数降到数十〜数百,同时在双重循环中做 $10^6$ 次以上的代理模型评估。但代理模型本身的近似误差成为新的认识论不确定性,也要验证。
认识论不确定性与偶然性不确定性的实务应用
不确定性分类工作流
实务中怎么判断"这是偶然性还是认识论"?
按以下流程判断:
- 列出所有输入变量 ― 材料常数、荷载、尺寸、模型参数等
- 对每个变量问:"增加数据后范围会缩小吗?"
- 会 → 认识论(例:只做3次试验的摩擦系数)
- 不会 → 偶然性(例:公差范围内的尺寸变化)
- 分离混合情况 ― 材料强度的批间变化(偶然性)+ 测量系统误差(认识论)
- 分类结果表格化,多人评审
判断不清楚时怎么办?
实际上"完全清楚"的情况很少。建议保守倾斜 ― 不确定时当认识论处理。这样能标记"需改进的地方",后续可用数据细化。反之当偶然性定了就很难改。
实务最佳实践
现场做不确定性分析的诀窍?
- 先做灵敏度分析再UQ:别急着全量处理,用Morris法或Sobol指标找出影响大的变量。集中火力那些。
- 认识论范围与专家讨论:区间设太宽结果没用,太窄藏风险。基于物理约束和文献充分论证。
- 报告用"带状"显示结果:不是一条曲线,而是带(认识论不确定性造成的宽度)要清晰可见。"最佳估计○○但考虑认识论不确定性范围○○〜○○"这样表述。
- V&V报告附PIRT表:PIRT(现象识别与排序表)矩阵化显示各现象的重要性与知识等级。这是不确定性分类的根据。
常见陷阱
初手容易犯什么错?
许多! 列举常见的:
- 全都当偶然性处理:对认识论不确定性硬分配概率分布,结果看不清改进空间。"不知道就用均匀分布"特别危险。
- 低估双重循环计算量:没有代理模型直接上双重循环,计算跑不完。
- 忽视认识论参数间的相关性:两个参数物理上有关联(如杨氏模量和泊松比),独立设范围会高估输出范围(保守过头,设计成不了)。
- 分类一次定了,不再改:项目推进数据增加,认识论变量可能转为偶然性。定期审查分类。
1号陷阱,现场特别常见…
对。一致分布是"正当的逃脱",但掩盖了无知。区间或P-box诚恳多了。
认识论不确定性与偶然性不确定性的软件比较
UQ工具比较
认识论和偶然性的分离实战中用什么软件?
主流UQ工具汇总如下。商用和开源都有:
| 工具名 | 类型 | 认识论/偶然性分离 | P-box | DS理论 | 双重循环 |
|---|---|---|---|---|---|
| Dakota(Sandia NL) | OSS | ○ | ○ | ○ | ○ |
| OpenTURNS | OSS | ○ | △ | × | ○ |
| UQLab(ETH Zurich) | 学术 | ○ | △ | × | ○ |
| Ansys optiSLang | 商用 | ○ | × | × | ○ |
| SimLab(JRC) | OSS | ○ | × | × | △ |
| COSSAN | 学术 | ○ | ○ | ○ | ○ |
Dakota功能最全啊。用起来难吗?
Dakota是Sandia开发的开源UQ框架,功能最全。可调用任意外部求解器(Abaqus、OpenFOAM等)。关键是输入文件中明确区分 epistemic 和 aleatory 变量,双重循环用 nested 方法直接写。缺点是无GUI,需学习。Python包装pyDakota会简化点。
Python环境的话OpenTURNS也不错吧。
OpenTURNS是EDF和Airbus等共同开发的Python库。API直观,分布·采样·灵敏度·代理建模一应俱全。P-box原生支持有限,但自己写双重循环容易。
认识论不确定性与偶然性不确定性的先端研究
不精密概率论的最前沿
P-box和DS理论之后的研究方向?
不精密概率论(Imprecise Probability)是统一框架。P-box、DS理论、区间概率、下确率、信念结构全是特例。
活跃研究课题:
- 随机集(Random Sets):DS理论扩展到连续空间。焦点要素能连续取。
- 含区间的多项式混沌展开:PCE系数用区间表示,高效构造输出P-box。省去双重循环。
- 贝叶斯模型平均(BMA):模型形式本身的认识论不确定性用多模型加权平均处理。权重由贝叶斯因子决定。
- 信息间隙理论(Info-gap):非概率鲁棒决策框架。求对最坏情况的"免疫度"。
理论统一了软件实现应该也简化吧。
机器学习与不确定性定量化
最近机器学习处理不确定性的话题也热啊。
CAE与ML交界处很活跃。比如:
- 物理信息神经网络(PINN):物理法则内嵌到损失函数。PINN的预测不确定性分离(MC Dropout、Deep Ensemble)热门。
- 贝叶斯神经网络(BNN):网络权重配上先验分布,权重的不确定性(认识论)自然表现。数据噪声(偶然性)同步估计。
- 主动学习+UQ:代理模型的认识论不确定性大的区域重点采样。少计算次数高效精化P-box。
认识论和偶然性的区分在ML也重要起来了。
反向传递也在,ML手法在CAE-UQ里加速了很多。两领域融合快得很。
认识论不确定性与偶然性不确定性的故障处理
典型故障与对策
不确定性分析的常见问题教教?
1. P-box太宽,决策无法用
- 原因:认识论范围设太保守,或参数间独立假设不当。
- 对策:物理约束进一步缩小范围。参数相关性反映进来(如弹性常数间约束)。灵敏度分析固定低影响变量。
2. Monte Carlo收敛慢(分布尾部不稳定)
- 原因:样本数不足以捕捉99百分位等。
- 对策:重点采样(Importance Sampling)集中尾部。或用拉丁超立方体降低所需样本。
3. 双重循环计算爆炸
- 原因:没用代理模型直接跑,外层100×内层10000+次。
- 对策:建PCE或Kriging代理,CAE计算降到100以下。用代理跑百万级评估。
4. Dempster-Shafer结合出现矛盾
- 原因:两位专家意见完全不重叠(如$[1, 3]$和$[5, 7]$)。
- 对策:Dempster规则冲突度高会不稳定。试Yager修正规则或TBM(Transferable Belief Model)。或回访专家重新论证。
5. 分类争议,团队无共识
- 原因:某变量到底偶然还是认识,设计方和V&V方意见不合。
- 对策:不争论"正确分类",改成"两种假设的结果差异"定量对比。差小则分类无关紧要。差大则值得追加数据。实用主义解决。
5号方法很实用。哲学争论做不完,数值对比清楚。
正是。工程逻辑最终是"对决策有没有帮助"。定量对比往往秒杀概念讨论。
相关主题
更多
错误