深度学习 (Deep Learning) — CAE术语解说

分类: 术语表 | 2026-03-28
CAE visualization for deep learning - technical simulation diagram

深度学习概述

定义

深度学习(Deep Learning)是一种采用多层神经网络机器学习方法。在CAE领域,深度学习广泛应用于加速高计算成本的数值仿真(FEMCFD等),包括代理模型(快速近似替代方案)、PINN(融合物理约束的神经网络)、迁移学习(用少量数据适应新问题)、以及CNN(直接预测物理场分布)等技术。

神经网络的基本结构是对输入 $\mathbf{x}$ 进行多层非线性变换,得到输出 $\hat{\mathbf{y}}$:

$$\hat{\mathbf{y}} = f_L \circ f_{L-1} \circ \cdots \circ f_1(\mathbf{x}), \quad f_l(\mathbf{z}) = \sigma(\mathbf{W}_l \mathbf{z} + \mathbf{b}_l)$$

其中 $\mathbf{W}_l$ 为权重矩阵,$\mathbf{b}_l$ 为偏置向量,$\sigma$ 为激活函数(ReLU、GELU、tanh等)。

代理模型

🧑‍🎓

深度学习在CAE中怎么用?它能替代FEM或CFD吗?


🎓

不是完全替代,而是越来越多地作为代理模型(替代模型)使用。以汽车碰撞仿真为例,一次完整的FEM计算需要数小时。但如果预先用数百到数千个计算结果训练一个神经网络,那么输入新的设计参数后,网络能在毫秒级别内预测应力分布,速度快1000倍左右。


🧑‍🎓

听说快1000倍,但精度能保证吗?能用于设计决策吗?


🎓

你问对了。代理模型的精度很大程度取决于训练数据的数量和质量。在实务中,常见的策略是"用代理模型进行设计筛选,最终用传统FEM/CFD验证"的混合方案。比如,用代理模型初步筛选1万个设计方案,再用完整仿真精细验证其中排名靠前的100个。


代理模型训练过程中,将输入参数 $\boldsymbol{\mu} = (\mu_1, \mu_2, \ldots, \mu_d)$(材料特性、形状参数、边界条件等)与对应的物理量 $\mathbf{u}(\boldsymbol{\mu})$ 配对,最小化以下损失函数:

$$\mathcal{L}_{\text{data}} = \frac{1}{N}\sum_{i=1}^{N} \left\| \hat{\mathbf{u}}(\boldsymbol{\mu}_i; \boldsymbol{\theta}) - \mathbf{u}_i \right\|^2$$

其中 $\boldsymbol{\theta}$ 表示网络的所有参数(权重和偏置)。

PINN(物理信息神经网络)

🧑‍🎓

PINN最近经常听说,它和普通神经网络有什么区别呢?


🎓

Physics-Informed Neural Network的简称,最大的特点是在损失函数中融入支配方程的残差。普通深度学习只从数据学习,但PINN会直接"告诉"网络"这个解必须满足Navier-Stokes方程"之类的物理约束。


🧑‍🎓

具体怎么把物理规律融入呢?感觉很难理解...


🎓

以稳态热传导为例,支配方程是 $\nabla^2 T = 0$。PINN通过自动微分计算网络输出 $\hat{T}(x,y)$ 的二阶偏导,然后在损失函数中加入惩罚项,使得 $\nabla^2 \hat{T}$ 接近零。这样即使某些区域缺乏训练数据,物理规律本身也会约束网络给出合理的预测。实际中常见的例子是逆问题——比如根据几个温度传感器的数据推断材料的热导率。


PINN的总损失函数通常具有以下形式:

$$\mathcal{L}_{\text{PINN}} = \underbrace{\lambda_{\text{data}} \mathcal{L}_{\text{data}}}_{\text{与观测数据的一致性}} + \underbrace{\lambda_{\text{PDE}} \mathcal{L}_{\text{PDE}}}_{\text{支配方程残差}} + \underbrace{\lambda_{\text{BC}} \mathcal{L}_{\text{BC}}}_{\text{边界条件残差}}$$

其中PDE残差项通过自动微分计算为:

$$\mathcal{L}_{\text{PDE}} = \frac{1}{N_r}\sum_{i=1}^{N_r}\left| \mathcal{N}[\hat{u}](\mathbf{x}_i) \right|^2$$

$\mathcal{N}[\cdot]$ 是微分算子(例如 $\nabla^2 u - f$ 或 $\rho(\mathbf{u}\cdot\nabla)\mathbf{u} + \nabla p - \mu\nabla^2\mathbf{u}$)。

迁移学习

🧑‍🎓

迁移学习在CAE中怎么用?我只听过图像识别中的例子。


🎓

思路完全相同。是把用相似物理现象训练过的模型的权重作为初值,迁移到新问题上。例如,你用NACA 0012翼型的空气动力数据(5000条)训练了一个模型,现在要用它来预测NACA 4412翼型的特性。只需额外准备200-300条数据,就能达到很高的精度。如果完全从零开始,可能需要3000条数据。


🧑‍🎓

也就是说,仿真数据生成的成本本身就能大幅降低?那很实用啊。


🎓

完全正确。在CAE领域,生成一条数据需要几分钟到几小时,所以削减数据生成成本的影响力非常大。迁移学习能将成本降低一个数量级。不过要注意,如果源任务和目标任务在物理上差异太大,反而会产生负面效果(所谓"负迁移"),所以判断物理相似性很重要。


CNN场预测

🧑‍🎓

听说CNN能直接预测应力分布和温度场,但网格数据怎么变成图像输入呢?


🎓

好问题。有几种方法,最直观的是符号距离场(SDF)表示。把分析对象的几何形状转换成规则网格图像,每个像素存储该点到物体表面的距离。然后把这个SDF和边界条件一起作为CNN的输入通道,输出通道就是应力或温度的等高线图。


🧑‍🎓

明白了。"把几何变成图像,把物理量也变成图像"。用什么网络结构呢?


🎓

U-Net和编码-解码结构很常用。本来是图像分割里用的,但输入换成SDF或边界条件图,输出换成应力或速度等高线图就行。跳跃连接能更好地保留空间细节。推论耗时只需几毫秒,可以集成到实时设计工具中。


🧑‍🎓

三维问题能用吗?图像好像是二维的...


🎓

可以用3D CNN处理。但内存消耗立方级增长,通常 $128^3$ 是实际应用的上限。最近还有图神经网络(GNN)的方向,能直接处理非结构网格,自由度更高。基于PointNet的方法也在进展,可以直接处理点云数据。


实务中的注意点

🧑‍🎓

把深度学习引入CAE时,有什么要特别注意的?


🎓

最关键的是外插问题。神经网络在训练数据范围内(内插)精度很高,但对于未见过的条件——比如陌生的材料特性或极端荷载——预测往往会失效。物理仿真内含守恒律,外插时还能勉强应对,但纯数据驱动模型就没这个保证。所以要么像PINN那样融入物理约束,要么通过验证评估外插区域的可信度。


🧑‍🎓

那深度学习到底是CAE的"盟友"还是"对手"?


🎓

绝对是盟友。FEM/CFD和深度学习是互补的。FEM/CFD物理严密但速度慢,深度学习速度快但泛化有限。现在最佳实践是混合策略——用物理求解器生成训练数据,用深度学习高速推理,对重要案例再用求解器验证。未来在数字孪生和实时控制领域,DL代理模型的需求会大幅增长。


关联术语

准确理解CAE术语是团队沟通的基础。— Project NovaSolver也致力于为实务工作者提供学习支持。

在深度学习 × CAE的实务中遇到困难?

Project NovaSolver针对CAE工程师日常面临的课题——建模复杂性、计算成本、结果解释——进行解决方案开发。你的实务经验将成为更好工具开发的原动力。

咨询(准备中)
本文评价
感谢你的反馈!
有参考
价值
希望更
详细
有错误
请报告
有参考价值
0
希望更详细
0
有错误请报告
0
由 NovaSolver 贡献者编写
匿名工程师 & AI — 网站地图
查看作者档案