什么是缩约模型（ROM）？会牺牲精度吗？

ROM是一种从全阶模型（FOM）的仿真结果中提取主要变化模式（模态），并在低维空间中求解方程的方法。如果构建得当，可以在几乎保持精度的同时，将计算时间缩短至1/1000以下。

什么是POD（本征正交分解）？

POD是对快照矩阵应用奇异值分解，用少数正交基表示数据能量（方差）大部分的方法。通常，满足累积贡献率99.9%的模态数量约为总自由度的0.01%至0.1%，可实现大幅度的维度缩减。

ROM在数字孪生中如何应用？

数字孪生需要实时接收传感器数据并立即返回响应预测，而全阶FEM计算时间不足。ROM可在数毫秒内计算响应，并集成到Ansys Twin Builder或Siemens Amesim等平台中运行。

数据驱动ROM与基于物理的ROM有何不同？

基于物理的ROM通过POD+Galerkin投影保持控制方程的结构，而数据驱动ROM（如DMD、LSTM等）则直接从仿真或实验数据中学习输入输出关系。基于物理的方法外推能力强，数据驱动方法对复杂非线性系统更灵活。

多物理场降阶模型（ROM）

分类: 連成解析 / マルチフィジックス | 更新 2026-04-12

Reduced order model workflow showing POD basis extraction from full-order multiphysics snapshots

マルチフィジックス縮約モデル：フルオーダーFEMのスナップショットからPOD基底を抽出し、低次元空間で連成方程式を解く

理论与物理

ROM是什么

🧑‍🎓

老师，降阶模型是通过牺牲精度来换取速度的吗？一听到“近似”这个词，总感觉精度会下降...

🎓

问得好。结论是，有时可以在几乎保持精度的情况下，将计算时间减少到1/1000以下。比如说，一个10万自由度的FEM模型，一次分析需要30分钟。如果把它变成ROM，可能只需要20到50个自由度就能求解，0.01秒就能出结果。

🧑‍🎓

诶，10万变成50！？减少这么多，真的能保持精度吗？

🎓

可以的。原理是这样的。收集几十个全阶FEM的结果并观察，会发现大部分的变化其实可以用少数几个“模式”来解释。例如，计算汽车发动机缸体热变形的100个案例，温度分布变化的99.9%可以用大约10个基底的叠加来重现。提取这些主要模式的技术就是POD（Proper Orthogonal Decomposition：本征正交分解），在这些模式上求解方程就是ROM。

🧑‍🎓

原来如此，就像照片的JPEG压缩一样吗？保留人眼可见的部分，舍弃看不见的部分...

🎓

正是如此！JPEG将图像的频率成分分解，只保留重要成分；ROM也是将物理场的变化分解，只保留重要的模态。本质上是相同的思路。这项技术如今已成为数字孪生实时响应预测的必备技术，已在Ansys Twin Builder和Siemens Amesim中实用化。

POD（本征正交分解）的数学原理

🧑‍🎓

请讲解一下POD的数学机制。“提取模式”具体是怎么做的？

🎓

首先，在不同参数或时间点求解全阶模型 $N_s$ 次，将每次的解向量 $\mathbf{u}_i \in \mathbb{R}^N$（$N$ 为自由度数）作为列排列，构建快照矩阵：

$$ \mathbf{S} = [\mathbf{u}_1, \mathbf{u}_2, \dots, \mathbf{u}_{N_s}] \in \mathbb{R}^{N \times N_s} $$

对其应用奇异值分解：

$$ \mathbf{S} = \mathbf{U} \boldsymbol{\Sigma} \mathbf{V}^T $$

这里 $\mathbf{U} = [\boldsymbol{\phi}_1, \boldsymbol{\phi}_2, \dots]$ 的每一列是POD模态（基向量），$\boldsymbol{\Sigma}$ 的对角元素 $\sigma_1 \geq \sigma_2 \geq \dots$ 是表示各模态“重要性”的奇异值。

🧑‍🎓

奇异值越大，模态越重要对吧。那么在哪里“截断”呢？

🎓

根据累积能量比来判断。定义前 $r$ 个模态的累积贡献率为：

$$ E(r) = \frac{\sum_{i=1}^{r} \sigma_i^2}{\sum_{i=1}^{N_s} \sigma_i^2} $$

通常选择满足 $E(r) \geq 0.999$（99.9%）的最小 $r$。实际应用中，$r$ 通常在10到100左右，相对于 $N$ 的10万到100万来说极少。将前 $r$ 个POD基排列成矩阵 $\boldsymbol{\Phi} = [\boldsymbol{\phi}_1, \dots, \boldsymbol{\phi}_r] \in \mathbb{R}^{N \times r}$，用于近似全阶解：

$$ \mathbf{u} \approx \boldsymbol{\Phi} \mathbf{a} $$

$\mathbf{a} \in \mathbb{R}^r$ 是降阶坐标，求解它就是ROM的任务。

Galerkin投影降阶

🧑‍🎓

用POD构建基底后，如何推导出降阶方程呢？

🎓

假设全阶半离散方程具有如下形式：

$$ \mathbf{M}\dot{\mathbf{u}} + \mathbf{K}\mathbf{u} = \mathbf{f} $$

将 $\mathbf{u} = \boldsymbol{\Phi}\mathbf{a}$ 代入，并在两边左乘 $\boldsymbol{\Phi}^T$（Galerkin投影），得到：

$$ \underbrace{\boldsymbol{\Phi}^T \mathbf{M} \boldsymbol{\Phi}}_{\tilde{\mathbf{M}} \in \mathbb{R}^{r \times r}} \dot{\mathbf{a}} + \underbrace{\boldsymbol{\Phi}^T \mathbf{K} \boldsymbol{\Phi}}_{\tilde{\mathbf{K}} \in \mathbb{R}^{r \times r}} \mathbf{a} = \underbrace{\boldsymbol{\Phi}^T \mathbf{f}}_{\tilde{\mathbf{f}} \in \mathbb{R}^r} $$

$N \times N$ 的系统被降阶为 $r \times r$ 了！$\tilde{\mathbf{M}}$, $\tilde{\mathbf{K}}$, $\tilde{\mathbf{f}}$ 可以离线预先计算，所以在线阶段只需解一个小规模的联立方程。

🧑‍🎓

哦哦，10万×10万的矩阵变成50×50了！那肯定快。但是非线性情况会怎样？

🎓

问得尖锐。当存在非线性项 $\mathbf{g}(\mathbf{u})$ 时，投影后需要每步计算 $\boldsymbol{\Phi}^T \mathbf{g}(\boldsymbol{\Phi}\mathbf{a})$。这里 $\mathbf{g}$ 的计算本身依赖于全阶的 $N$，所以直接计算不会变快。这是非线性ROM的核心难题，后面会通过超降阶来解决。

多物理场ROM的公式化

🧑‍🎓

像结构-热耦合这样的多物理场问题，ROM化会怎样处理？为每个物理场分别构建ROM吗？

🎓

主要有三种方法。以结构场 $\mathbf{u}_s$ 和温度场 $\mathbf{u}_t$ 的耦合问题为例说明：

1. 整体式ROM：对所有物理场组合的状态向量 $\mathbf{u} = [\mathbf{u}_s^T, \mathbf{u}_t^T]^T$ 执行POD。能自然地捕捉耦合效应，但存在缩放问题（应力是MPa量级，温度是K量级等）。

$$ \begin{bmatrix} \mathbf{u}_s \\ \mathbf{u}_t \end{bmatrix} \approx \boldsymbol{\Phi}_{\text{mono}} \mathbf{a} $$

🎓

2. 分离型ROM：对每个物理场独立应用POD，然后在界面上耦合各自的ROM。易于复用现有的ROM代码，但需要注意耦合的稳定性。

$$ \mathbf{u}_s \approx \boldsymbol{\Phi}_s \mathbf{a}_s, \quad \mathbf{u}_t \approx \boldsymbol{\Phi}_t \mathbf{a}_t $$

3. 块对角ROM：将各物理场的POD基底以块对角形式组合，耦合项作为非对角块进行投影的折中方案。实际应用中最常用。

$$ \begin{bmatrix} \mathbf{u}_s \\ \mathbf{u}_t \end{bmatrix} \approx \begin{bmatrix} \boldsymbol{\Phi}_s & \mathbf{0} \\ \mathbf{0} & \boldsymbol{\Phi}_t \end{bmatrix} \begin{bmatrix} \mathbf{a}_s \\ \mathbf{a}_t \end{bmatrix} $$

🧑‍🎓

原来如此，块对角型的话，即使物理量尺度不同，也能在各场中进行归一化，还能保持耦合对吧。实际中哪种用得最多？

🎓

商业工具中块对角型是主流。Ansys Twin Builder将各物理场的FOM分别ROM化并导出为FMU，然后在系统模型上结合。这实质上是分离型ROM的一种形式。COMSOL的“模型降阶”功能也采用块对角式方法。

参数化ROM

🧑‍🎓

能构建出即使设计参数（材料常数、形状尺寸）改变也能使用的ROM吗？如果每次都要重新求解全阶FEM就没有意义了...

🎓

这就是参数化ROM。将参数 $\boldsymbol{\mu}$（例如：杨氏模量、板厚、流入速度）的依赖性嵌入ROM。基本策略有两种：

全局基法：在参数空间广泛采样，汇总所有快照应用POD。基底包含了参数变化，因此也能用于新的参数值。

插值法：为离散的参数值构建局部ROM，对中间参数值则对ROM算子进行插值。但简单地插值ROM矩阵会破坏正定性，因此需要Grassmann流形上的插值等几何学方法。

🧑‍🎓

例如，“板厚从3mm到5mm变化时，能瞬时查看应力分布”这样的事情就变得可能了，对吧？

🎓

是的。在设计探索中评估100种参数组合时，全阶FEM需要100×30分钟=50小时，而pROM只需要100×0.01秒=1秒。实际上，在汽车车身设计中使用碰撞ROM进行板厚优化的案例正在增加。

各项的物理意义

POD模态 $\boldsymbol{\phi}_i$：全阶解的“主成分”。第一模态表示最大的变化方向，高阶模态捕捉更细微的变化。与结构振动的固有模态不同，POD模态是数据驱动的，可应用于任意物理场（温度、压力、位移等）。
奇异值 $\sigma_i$：对应模态“能量”的平方根。$\sigma_i^2$ 与该模态的贡献度成正比。奇异值衰减越快（$\sigma_i \sim i^{-p}$, $p > 1$），越能用少数模态实现高精度近似。对流主导的流动衰减慢，扩散主导的问题衰减快。
Galerkin投影 $\boldsymbol{\Phi}^T(\cdot)$：将全阶残差正交投影到低维空间的操作。试函数与基函数相同。保证残差与POD基的列空间正交的最优性条件。
降阶质量矩阵 $\tilde{\mathbf{M}}$：如果POD基底是标准正交的，则 $\tilde{\mathbf{M}} = \mathbf{I}$（单位矩阵），计算进一步简化。

假设条件与适用限制

POD基底仅在训练数据范围内有效。对训练范围外的参数进行外推，精度可能急剧下降
对于对流主导的问题（高雷诺数流动等），POD模态衰减慢，需要大量模态才能达到足够精度
对于强非线性（接触、破坏、相变等），Galerkin投影的稳定性可能无法保证
在多物理场ROM中，如果各物理场的缩放不当，POD会偏向某一方
包含移动边界、拓扑变化的问题难以直接ROM化（需要特殊的基底更新）

量纲分析与典型的降阶率

问题类型	FOM自由度 $N$	ROM自由度 $r$	降阶率 $N/r$	典型精度（RMSE）
结构-热耦合	$10^5$	20〜50	2,000〜5,000	< 0.5%
FSI（流固耦合）	$10^6$	50〜200	5,000〜20,000	1〜3%
电磁-热耦合	$10^5$	15〜40	2,500〜7,000	< 1%
非定常流体	$10^6$	100〜500	2,000〜10,000	2〜5%

Coffee Break 闲谈角

POD的意外起源 —— 从湍流研究中诞生的万能工具

POD的原型可追溯到1943年Karhunen和Loeve分别提出的随机过程展开定理。将其引入流体力学的是Lumley（1967年），目的是提取湍流场的“相干结构”。当时由于计算机性能不足，只能应用于有限的数据。但到了2000年代，随着FEM的大规模化和SVD算法的进步，它作为ROM构建的标准方法迅速普及。有趣的是，这种方法与图像压缩的主成分分析、信号处理的KLT、统计学的SVD在数学本质上是相同的。只是领域不同，同一个思想在数学史上被多次“重新发现”的绝佳例子。

数值解法与实现

快照收集策略

🧑‍🎓

ROM的精度取决于快照的质量，那么如何高效地收集快照呢？

🎓

有三种主要策略：

1. 均匀采样：将参数空间网格化，在每个点执行FOM。简单，但参数数量增加时会发生组合爆炸。参数2~3个时实用。

2. 拉丁超立方采样：高效覆盖参数空间的准随机采样。比均匀采样用更少的样本数获得同等的覆盖。实际应用中最常用。

3. 贪婪法：逐次添加使ROM误差估计值最大的参数点。最有效率，但需要实现误差估计器。

🧑‍🎓

对于多物理场情况，结构和热会分别采样吗？

🎓

耦合较弱时，有时会为各物理场独立采集快照，但强耦合时务必从耦合FOM中采集快照。例如，电子电路板的热-结构耦合中，温度分布和翘曲变形密切相关，只学习其中一方的变化模式无法再现耦合效应。

超降阶

🧑‍🎓

刚才提到非线性项评估是瓶颈。超降阶是什么机制？

🎓

这是非线性ROM的核心技术。介绍两种代表性方法：

DEIM：非线性项 $\mathbf{g}(\mathbf{u})$ 本身也用POD基近似，只在少数“魔法点”处评估 $\mathbf{g}$。无需遍历所有单元，计算量从 $O(N)$ 减少到 $O(m)$。

$$ \mathbf{g}(\mathbf{u}) \approx \boldsymbol{\Psi} (\mathbf{P}^T \boldsymbol{\Psi})^{-1} \mathbf{P}^T \mathbf{g}(\mathbf{u}) $$

这里 $\boldsymbol{\Psi}$ 是非线性项的POD基，$\mathbf{P}$ 是魔法点的选择矩阵。

🎓

ECSW：优化单元子集和权重，用少数单元近似Galerkin投影后的能量。特点是能保持Galerkin投影的能量守恒性，在结构非线性中稳定性高。

两者都是“无需计算全部单元，从少数代表点重建整体”的思路。实际应用中，DEIM多用于流体系统，ECSW多用于结构系统。

数据驱动ROM

🧑‍🎓

最近也听说使用机器学习的ROM，这和基于物理的ROM有什么区别？