AI × CAE · Machine Learning in Simulation

AI × CAE — 机器学习在仿真工程中的应用

用神经网络加速设计迭代、用PINN直接求解偏微分方程、用生成式AI重塑拓扑优化——AI正在从根本上改变CAE工程师的工作方式。

1. 为什么要在CAE中引入AI？

传统CAE工作流程中存在一个根本性的矛盾：高精度仿真的计算代价非常昂贵，而设计优化却需要大量重复仿真。一次完整的汽车碰撞仿真可能耗时数小时甚至数天，但设计工程师可能需要评估数百种设计方案。这个矛盾在以下场景中尤为突出：

设计空间探索

多参数优化时，全因子实验方案的仿真数量随参数数量指数增长——传统方法根本跑不完。

实时反馈需求

数字孪生、在线质量控制等场景需要毫秒级的仿真响应，传统FEA/CFD完全无法满足。

逆问题求解

已知测量结果，反推材料参数或边界条件——传统方法需要大量迭代，AI可大幅加速。

AI在CAE中的核心价值是：用少量高质量仿真数据训练快速预测模型，然后在设计优化/实时监控中用这个快速模型替代昂贵的高精度仿真。这并非取代传统仿真，而是在体系结构上进行分层——传统仿真负责提供准确数据，AI模型负责快速插值和预测。

2. 主要应用场景

2.1 替代模型 / 代理模型（Surrogate Model）

替代模型（也叫代理模型）是用数据驱动的方法，训练一个能快速预测仿真输出的"替身"模型。训练完成后，用替代模型代替原始FEA/CFD进行设计优化，速度可提升3~5个数量级（从小时到毫秒）。

替代模型工作流程

① 设计参数采样
（拉丁超立方/Sobol序列）

→

② 高精度仿真
（FEA / CFD，100~1000次）

→

③ 训练ML模型
（GP / NN / RBF）

→

④ 快速优化
（遗传算法 / 梯度下降）

常见的替代模型方法：

高斯过程回归（GPR / Kriging）：既能预测均值，也能估计不确定度（置信区间），非常适合与贝叶斯优化结合。样本量较小时表现优异。
径向基函数（RBF）：数学简单，在设计空间不太高维时效果好，工程应用成熟。
深度神经网络（DNN）：在高维参数空间和复杂非线性关系中有优势，但需要更多训练样本（通常需要数千次仿真）。
图神经网络（GNN）：直接处理非结构化网格，可以预测整个温度场/应力场（而非仅标量输出），是当前研究热点。

2.2 物理信息神经网络（Physics-Informed Neural Networks, PINN）

PINN是2019年由Raissi等人提出的方法，核心思想是：将物理定律（PDE）直接嵌入神经网络的损失函数，让网络在拟合数据的同时也满足物理方程约束。

PINN损失函数（以热传导方程为例）

设神经网络近似 $T(x,y,t;\theta)$，总损失函数由三部分组成：

$$\mathcal{L}(\theta) = \underbrace{w_r \mathcal{L}_r}_{\text{PDE残差}} + \underbrace{w_b \mathcal{L}_b}_{\text{边界条件}} + \underbrace{w_d \mathcal{L}_d}_{\text{数据拟合}}$$

其中PDE残差损失：

$$\mathcal{L}_r = \frac{1}{N_r}\sum_{i=1}^{N_r}\left[\rho c_p \frac{\partial \hat{T}}{\partial t} - \nabla\cdot(k\nabla \hat{T}) - Q\right]^2\bigg|_{(x_i,t_i)}$$

梯度 $\partial \hat{T}/\partial x$ 等由自动微分（Automatic Differentiation）计算，无需网格。权重 $w_r, w_b, w_d$ 的平衡对训练效果至关重要。

PINN的独特优势：

无网格：不需要网格划分，在复杂几何或移动边界问题中有优势
逆问题天然支持：可以同时求解未知的PDE系数（如材料参数）和场量
少量数据即可训练：物理约束补偿了数据不足

当前局限性（2026年现状）：

复杂几何和高雷诺数流体问题训练困难，收敛不稳定
计算效率通常低于传统FEM（训练时间长）
工程落地案例尚不成熟，主要在研究阶段

2.3 拓扑优化结合生成式AI

传统拓扑优化（如SIMP方法）已经是成熟技术，但其输出通常是黑白密度图，需要大量人工后处理才能变成可制造的几何。生成式AI（特别是扩散模型和VAE）的引入可以：

生成满足约束的几何方案：给定边界条件和性能目标，直接生成3D结构
从数据库泛化：学习已有优化案例的规律，快速给出新问题的优化初始方案
可制造性约束嵌入：训练时加入制造约束（最小特征尺寸、支撑结构等），避免传统拓扑优化生成不可制造的结构

2.4 数字孪生（Digital Twin）

数字孪生是将实物资产（发动机、风电叶片、制造设备）与其高保真数字模型实时同步的技术。AI在其中扮演的关键角色：

数字孪生中AI的作用

状态估计
融合传感器数据和仿真结果，估计无传感器位置的状态（如内部温度）

实时预测
替代模型取代高精度仿真，实现实时剩余寿命预测

异常检测
预测值与传感器实测值偏差超出阈值时触发预警

工艺优化
强化学习持续优化生产参数，以仿真为环境进行训练

2.5 降阶模型（Reduced Order Models, ROM）

降阶模型是通过提取高维仿真结果的主导模式，构建低维近似模型的方法。与纯数据驱动的替代模型不同，ROM保留了更多物理结构信息。

主要ROM方法

正交分解法（Proper Orthogonal Decomposition, POD）：对仿真快照矩阵做奇异值分解（SVD），提取能量最大的模态：

$$\mathbf{U} \approx \sum_{k=1}^{r} a_k(t) \boldsymbol{\phi}_k(\mathbf{x}), \quad r \ll N$$

其中 $\boldsymbol{\phi}_k$ 为POD基函数（空间模态），$a_k(t)$ 为时间系数，$r$ 为截断阶数，$N$ 为原始自由度数。通常保留前10~50个模态就能捕获99%以上的能量。

动态模态分解（Dynamic Mode Decomposition, DMD）：直接从时间序列数据中提取动力学特征（频率和增长率），特别适合处理流场快照，可用于流动预测和控制。

工程师问答：AI × CAE入门

🧑‍🎓

我刚开始学AI和CAE结合，感觉替代模型、PINN、ROM概念混在一起，搞不清楚。能给我捋一下它们的区别吗？

🎓

好问题，这三个确实容易混。简单说：
• 替代模型：把仿真当黑盒，输入几个设计参数（比如壁厚、开孔大小），输出几个性能指标（最高温度、最大应力）。纯数据驱动，不关心物理方程。
• PINN：让神经网络去解PDE本身，网络的输出就是整个物理场。物理定律在训练中强制满足。
• ROM：对高维仿真结果做"数据压缩"，提取主要物理模态。保留了物理结构，是传统仿真的降维近似。
从工程实用角度：目前最成熟的是替代模型，已在汽车行业大量落地；ROM在航空领域用得多；PINN还主要在学术阶段。

🧑‍🎓

要训练一个替代模型，我需要多少次仿真数据？

🎓

这取决于参数维度和问题复杂度，没有万能答案。经验规则：用高斯过程（GPR）的话，3~5维参数通常50~200次仿真就够；用神经网络需要更多，通常500~5000次；如果是图神经网络预测全场，可能需要数千到万次。所以第一步是降低参数维度——用灵敏度分析（比如Sobol指数）先筛掉不重要的参数，然后再做采样。另外，主动学习（Active Learning）可以智能地选择下一个采样点，大幅减少所需仿真次数——它会在预测不确定度最高的区域补充数据，而不是盲目均匀采样。

🧑‍🎓

拉丁超立方采样是什么？跟随机采样有什么区别？

🎓

举个例子：你有2个参数，各取0~1范围，想采100个点。完全随机采样，可能会出现某个区域扎堆、某个区域空白的情况，覆盖不均匀。拉丁超立方采样（Latin Hypercube Sampling, LHS）的规则是：把每个参数的范围划成N等份，保证每一层各只出现一次——就像在N×N的格子里放皇后，每行每列只有一个。结果是采样点在参数空间中分布更均匀，用相同数量的点能覆盖更广的参数范围，从而用更少的仿真训练出更准确的替代模型。这是替代模型方法里最常用的采样策略。

🧑‍🎓

PINN训练老是不收敛，有什么诊断思路？

🎓

PINN的训练比普通深度学习难多了，这是公认的。常见问题和对策：
第一，各损失项权重不平衡——PDE残差和边界条件项的数量级差很大，导致梯度相互干扰。可以用自适应权重（NTK权重、梯度归一化）。
第二，激活函数选择——tanh比ReLU适合PINN，因为需要高阶导数连续。
第三，采样点数量和分布——在边界层、奇点等梯度大的区域要加密采样点。
第四，降低问题规模——先在1D或2D验证PINN实现是否正确，再上3D。
第五，学习率调度——一开始用大学习率快速收敛，后期切换L-BFGS做精细优化。很多开源实现（DeepXDE、NeuralPDE.jl）已经内置了这些技巧。

🧑‍🎓

我想用PyTorch做一个简单的替代模型，大概是什么流程？

🎓

流程很直接：第一步，用Abaqus/OpenFOAM跑100~500次仿真，把输入参数和输出指标存成CSV；第二步，用pandas读入，做归一化（StandardScaler），split成训练集和测试集；第三步，定义一个3~5层的MLP（全连接网络），用MSE作为损失函数，Adam优化器训练；第四步，在测试集上用R²和RMSE评估精度；第五步，如果精度达标（比如R² > 0.99），就可以用这个网络代替仿真去跑遗传算法或贝叶斯优化了。整个流程用scikit-learn的GPR做反而比PyTorch更简单，当训练数据量不大时推荐先试GPR，不够用了再换神经网络。

3. 常用框架与工具

框架/工具	类别	CAE中的用途	特点
PyTorch	深度学习框架	替代模型（NN/GNN）、PINN实现	自动微分完善，动态图，科研主流
TensorFlow / Keras	深度学习框架	替代模型、工业部署	生产部署成熟（TF Serving），工业界用多
scikit-learn	机器学习库	高斯过程回归、随机森林替代模型	上手最简单，小样本替代模型首选
DeepXDE	PINN专用库	各类PDE的PINN实现	支持PyTorch/TF后端，内置多类PDE
FEniCS + dolfinx	开源FEA求解器	生成PINN训练数据，或与AI联合求解	Python接口友好，与机器学习生态兼容
OpenFOAM	开源CFD求解器	批量CFD仿真生成替代模型训练数据	免费，支持Python脚本自动化批量运行
ANSYS Discovery Live	商业AI仿真工具	GPU加速实时仿真（内置降阶/AI加速）	拖动几何即时看结果，设计前期探索利器

4. 数据生成策略

训练AI-CAE模型的瓶颈往往不是算法，而是高质量训练数据的获取代价。以下策略可有效降低数据生成成本：

拉丁超立方采样（LHS）

均匀覆盖参数空间，相同数量的样本点提供比随机采样更好的空间覆盖度。适合初始数据集构建。Python中用 scipy.stats.qmc.LatinHypercube 实现。

主动学习（Active Learning）

训练初步模型后，识别预测不确定度最高的区域，在该区域补充仿真数据。反复迭代，用最少的仿真次数达到目标精度。与GPR天然结合（利用预测方差作为不确定度度量）。

多保真度采样（Multi-Fidelity）

用粗网格低精度仿真生成大量"廉价"数据，用细网格高精度仿真生成少量"昂贵"数据，通过协同Kriging（Co-Kriging）融合两类数据，以较低代价获得高精度替代模型。

灵敏度分析预筛选

训练前用Sobol全局灵敏度指数筛去对输出影响小的参数，将参数维度从20维降到5维，采样效率大幅提升（维度诅咒）。Morris方法可作为低代价的初步筛选。

5. 面临的挑战

AI-CAE当前主要挑战

训练数据成本：高精度仿真本身价格高昂，获取足够训练数据是最大瓶颈
外推能力不足：替代模型在训练数据范围之外的泛化能力差，超出训练域会失效
物理一致性：纯数据驱动的模型可能预测出违背物理定律的结果（如负温度、不守恒的流场），PINN虽然改善了此问题但训练更难
可解释性：黑盒模型难以通过工程审查，汽车/航空等安全关键行业对此高度敏感
高维场预测：从少数标量参数预测整个三维物理场，是当前研究的核心难题
缺乏标准化：AI-CAE目前缺乏类似ASME V&V标准的验证规范，工程采信度仍是问题

深度问答：商业工具与实际落地

🧑‍🎓

Altair HyperWorks里有没有内置的AI优化功能？还是说都要自己写Python？

🎓

Altair有一个专门的模块叫 HyperStudy，内置了设计空间探索、DOE（实验设计）、替代模型（支持RBF、GPR等）、以及多目标优化。可以通过GUI直接连接Abaqus、LS-DYNA等求解器，自动批量运行仿真、提取结果、训练替代模型——整个流程不需要写代码。适合生产环境中没有太多编程基础的工程团队。当然，如果你想用最新的深度学习替代模型，还是需要结合Python自己实现，HyperStudy对这一块支持有限。ANSYS optiSLang是类似定位的竞品，在欧洲汽车行业用得很多。

🧑‍🎓

数字孪生实际项目里，AI部分和传统仿真部分是怎么分工的？

🎓

典型架构是这样的：离线阶段，用高精度CAE跑几百种工况，建立替代模型；在线阶段，传感器数据进来后，先用数据融合算法（比如卡尔曼滤波）估计系统状态，再调用替代模型快速预测下一步会发生什么。如果偏差超出阈值（比如温度传感器显示比预测高20°C），自动触发高精度重新仿真更新替代模型。这叫"在线模型更新"。真正的商业数字孪生（比如GE的Predix平台、Siemens的数字化企业方案）都是这个思路，只是工程细节复杂很多，数据接口、安全性、实时性要求都是挑战。

6. AI × CAE 子栏目

代理模型详解

高斯过程、神经网络代理、响应面方法——推荐入门

物理信息神经网络（PINN）

PDE嵌入训练、自动微分、逆问题求解、无网格方法

降阶模型（ROM）

POD、DMD、自编码器——高维系统的快速近似

AI辅助设计优化

贝叶斯优化、遗传算法、强化学习、多目标优化