多物理场降阶模型(ROM)
理论与物理
ROM是什么
老师,降阶模型是通过牺牲精度来换取速度的吗?一听到“近似”这个词,总感觉精度会下降...
问得好。结论是,有时可以在几乎保持精度的情况下,将计算时间减少到1/1000以下。比如说,一个10万自由度的FEM模型,一次分析需要30分钟。如果把它变成ROM,可能只需要20到50个自由度就能求解,0.01秒就能出结果。
诶,10万变成50!?减少这么多,真的能保持精度吗?
可以的。原理是这样的。收集几十个全阶FEM的结果并观察,会发现大部分的变化其实可以用少数几个“模式”来解释。例如,计算汽车发动机缸体热变形的100个案例,温度分布变化的99.9%可以用大约10个基底的叠加来重现。提取这些主要模式的技术就是POD(Proper Orthogonal Decomposition:本征正交分解),在这些模式上求解方程就是ROM。
原来如此,就像照片的JPEG压缩一样吗?保留人眼可见的部分,舍弃看不见的部分...
正是如此!JPEG将图像的频率成分分解,只保留重要成分;ROM也是将物理场的变化分解,只保留重要的模态。本质上是相同的思路。这项技术如今已成为数字孪生实时响应预测的必备技术,已在Ansys Twin Builder和Siemens Amesim中实用化。
POD(本征正交分解)的数学原理
请讲解一下POD的数学机制。“提取模式”具体是怎么做的?
首先,在不同参数或时间点求解全阶模型 $N_s$ 次,将每次的解向量 $\mathbf{u}_i \in \mathbb{R}^N$($N$ 为自由度数)作为列排列,构建快照矩阵:
对其应用奇异值分解:
这里 $\mathbf{U} = [\boldsymbol{\phi}_1, \boldsymbol{\phi}_2, \dots]$ 的每一列是POD模态(基向量),$\boldsymbol{\Sigma}$ 的对角元素 $\sigma_1 \geq \sigma_2 \geq \dots$ 是表示各模态“重要性”的奇异值。
奇异值越大,模态越重要对吧。那么在哪里“截断”呢?
根据累积能量比来判断。定义前 $r$ 个模态的累积贡献率为:
通常选择满足 $E(r) \geq 0.999$(99.9%)的最小 $r$。实际应用中,$r$ 通常在10到100左右,相对于 $N$ 的10万到100万来说极少。将前 $r$ 个POD基排列成矩阵 $\boldsymbol{\Phi} = [\boldsymbol{\phi}_1, \dots, \boldsymbol{\phi}_r] \in \mathbb{R}^{N \times r}$,用于近似全阶解:
$\mathbf{a} \in \mathbb{R}^r$ 是降阶坐标,求解它就是ROM的任务。
Galerkin投影降阶
用POD构建基底后,如何推导出降阶方程呢?
假设全阶半离散方程具有如下形式:
将 $\mathbf{u} = \boldsymbol{\Phi}\mathbf{a}$ 代入,并在两边左乘 $\boldsymbol{\Phi}^T$(Galerkin投影),得到:
$N \times N$ 的系统被降阶为 $r \times r$ 了!$\tilde{\mathbf{M}}$, $\tilde{\mathbf{K}}$, $\tilde{\mathbf{f}}$ 可以离线预先计算,所以在线阶段只需解一个小规模的联立方程。
哦哦,10万×10万的矩阵变成50×50了!那肯定快。但是非线性情况会怎样?
问得尖锐。当存在非线性项 $\mathbf{g}(\mathbf{u})$ 时,投影后需要每步计算 $\boldsymbol{\Phi}^T \mathbf{g}(\boldsymbol{\Phi}\mathbf{a})$。这里 $\mathbf{g}$ 的计算本身依赖于全阶的 $N$,所以直接计算不会变快。这是非线性ROM的核心难题,后面会通过超降阶来解决。
多物理场ROM的公式化
像结构-热耦合这样的多物理场问题,ROM化会怎样处理?为每个物理场分别构建ROM吗?
主要有三种方法。以结构场 $\mathbf{u}_s$ 和温度场 $\mathbf{u}_t$ 的耦合问题为例说明:
1. 整体式ROM:对所有物理场组合的状态向量 $\mathbf{u} = [\mathbf{u}_s^T, \mathbf{u}_t^T]^T$ 执行POD。能自然地捕捉耦合效应,但存在缩放问题(应力是MPa量级,温度是K量级等)。
2. 分离型ROM:对每个物理场独立应用POD,然后在界面上耦合各自的ROM。易于复用现有的ROM代码,但需要注意耦合的稳定性。
3. 块对角ROM:将各物理场的POD基底以块对角形式组合,耦合项作为非对角块进行投影的折中方案。实际应用中最常用。
原来如此,块对角型的话,即使物理量尺度不同,也能在各场中进行归一化,还能保持耦合对吧。实际中哪种用得最多?
商业工具中块对角型是主流。Ansys Twin Builder将各物理场的FOM分别ROM化并导出为FMU,然后在系统模型上结合。这实质上是分离型ROM的一种形式。COMSOL的“模型降阶”功能也采用块对角式方法。
参数化ROM
能构建出即使设计参数(材料常数、形状尺寸)改变也能使用的ROM吗?如果每次都要重新求解全阶FEM就没有意义了...
这就是参数化ROM。将参数 $\boldsymbol{\mu}$(例如:杨氏模量、板厚、流入速度)的依赖性嵌入ROM。基本策略有两种:
全局基法:在参数空间广泛采样,汇总所有快照应用POD。基底包含了参数变化,因此也能用于新的参数值。
插值法:为离散的参数值构建局部ROM,对中间参数值则对ROM算子进行插值。但简单地插值ROM矩阵会破坏正定性,因此需要Grassmann流形上的插值等几何学方法。
例如,“板厚从3mm到5mm变化时,能瞬时查看应力分布”这样的事情就变得可能了,对吧?
是的。在设计探索中评估100种参数组合时,全阶FEM需要100×30分钟=50小时,而pROM只需要100×0.01秒=1秒。实际上,在汽车车身设计中使用碰撞ROM进行板厚优化的案例正在增加。
各项的物理意义
- POD模态 $\boldsymbol{\phi}_i$:全阶解的“主成分”。第一模态表示最大的变化方向,高阶模态捕捉更细微的变化。与结构振动的固有模态不同,POD模态是数据驱动的,可应用于任意物理场(温度、压力、位移等)。
- 奇异值 $\sigma_i$:对应模态“能量”的平方根。$\sigma_i^2$ 与该模态的贡献度成正比。奇异值衰减越快($\sigma_i \sim i^{-p}$, $p > 1$),越能用少数模态实现高精度近似。对流主导的流动衰减慢,扩散主导的问题衰减快。
- Galerkin投影 $\boldsymbol{\Phi}^T(\cdot)$:将全阶残差正交投影到低维空间的操作。试函数与基函数相同。保证残差与POD基的列空间正交的最优性条件。
- 降阶质量矩阵 $\tilde{\mathbf{M}}$:如果POD基底是标准正交的,则 $\tilde{\mathbf{M}} = \mathbf{I}$(单位矩阵),计算进一步简化。
假设条件与适用限制
- POD基底仅在训练数据范围内有效。对训练范围外的参数进行外推,精度可能急剧下降
- 对于对流主导的问题(高雷诺数流动等),POD模态衰减慢,需要大量模态才能达到足够精度
- 对于强非线性(接触、破坏、相变等),Galerkin投影的稳定性可能无法保证
- 在多物理场ROM中,如果各物理场的缩放不当,POD会偏向某一方
- 包含移动边界、拓扑变化的问题难以直接ROM化(需要特殊的基底更新)
量纲分析与典型的降阶率
| 问题类型 | FOM自由度 $N$ | ROM自由度 $r$ | 降阶率 $N/r$ | 典型精度(RMSE) |
|---|---|---|---|---|
| 结构-热耦合 | $10^5$ | 20〜50 | 2,000〜5,000 | < 0.5% |
| FSI(流固耦合) | $10^6$ | 50〜200 | 5,000〜20,000 | 1〜3% |
| 电磁-热耦合 | $10^5$ | 15〜40 | 2,500〜7,000 | < 1% |
| 非定常流体 | $10^6$ | 100〜500 | 2,000〜10,000 | 2〜5% |
POD的意外起源 —— 从湍流研究中诞生的万能工具
POD的原型可追溯到1943年Karhunen和Loeve分别提出的随机过程展开定理。将其引入流体力学的是Lumley(1967年),目的是提取湍流场的“相干结构”。当时由于计算机性能不足,只能应用于有限的数据。但到了2000年代,随着FEM的大规模化和SVD算法的进步,它作为ROM构建的标准方法迅速普及。有趣的是,这种方法与图像压缩的主成分分析、信号处理的KLT、统计学的SVD在数学本质上是相同的。只是领域不同,同一个思想在数学史上被多次“重新发现”的绝佳例子。
数值解法与实现
快照收集策略
ROM的精度取决于快照的质量,那么如何高效地收集快照呢?
有三种主要策略:
1. 均匀采样:将参数空间网格化,在每个点执行FOM。简单,但参数数量增加时会发生组合爆炸。参数2~3个时实用。
2. 拉丁超立方采样:高效覆盖参数空间的准随机采样。比均匀采样用更少的样本数获得同等的覆盖。实际应用中最常用。
3. 贪婪法:逐次添加使ROM误差估计值最大的参数点。最有效率,但需要实现误差估计器。
对于多物理场情况,结构和热会分别采样吗?
耦合较弱时,有时会为各物理场独立采集快照,但强耦合时务必从耦合FOM中采集快照。例如,电子电路板的热-结构耦合中,温度分布和翘曲变形密切相关,只学习其中一方的变化模式无法再现耦合效应。
超降阶
刚才提到非线性项评估是瓶颈。超降阶是什么机制?
这是非线性ROM的核心技术。介绍两种代表性方法:
DEIM:非线性项 $\mathbf{g}(\mathbf{u})$ 本身也用POD基近似,只在少数“魔法点”处评估 $\mathbf{g}$。无需遍历所有单元,计算量从 $O(N)$ 减少到 $O(m)$。
这里 $\boldsymbol{\Psi}$ 是非线性项的POD基,$\mathbf{P}$ 是魔法点的选择矩阵。
ECSW:优化单元子集和权重,用少数单元近似Galerkin投影后的能量。特点是能保持Galerkin投影的能量守恒性,在结构非线性中稳定性高。
两者都是“无需计算全部单元,从少数代表点重建整体”的思路。实际应用中,DEIM多用于流体系统,ECSW多用于结构系统。
数据驱动ROM
最近也听说使用机器学习的ROM,这和基于物理的ROM有什么区别?
なった
詳しく
報告