深度学习 (Deep Learning) — CAE术语解说
深度学习概述
定义
深度学习(Deep Learning)是一种采用多层神经网络的机器学习方法。在CAE领域,深度学习广泛应用于加速高计算成本的数值仿真(FEM、CFD等),包括代理模型(快速近似替代方案)、PINN(融合物理约束的神经网络)、迁移学习(用少量数据适应新问题)、以及CNN(直接预测物理场分布)等技术。
神经网络的基本结构是对输入 $\mathbf{x}$ 进行多层非线性变换,得到输出 $\hat{\mathbf{y}}$:
$$\hat{\mathbf{y}} = f_L \circ f_{L-1} \circ \cdots \circ f_1(\mathbf{x}), \quad f_l(\mathbf{z}) = \sigma(\mathbf{W}_l \mathbf{z} + \mathbf{b}_l)$$其中 $\mathbf{W}_l$ 为权重矩阵,$\mathbf{b}_l$ 为偏置向量,$\sigma$ 为激活函数(ReLU、GELU、tanh等)。
代理模型
深度学习在CAE中怎么用?它能替代FEM或CFD吗?
不是完全替代,而是越来越多地作为代理模型(替代模型)使用。以汽车碰撞仿真为例,一次完整的FEM计算需要数小时。但如果预先用数百到数千个计算结果训练一个神经网络,那么输入新的设计参数后,网络能在毫秒级别内预测应力分布,速度快1000倍左右。
听说快1000倍,但精度能保证吗?能用于设计决策吗?
你问对了。代理模型的精度很大程度取决于训练数据的数量和质量。在实务中,常见的策略是"用代理模型进行设计筛选,最终用传统FEM/CFD验证"的混合方案。比如,用代理模型初步筛选1万个设计方案,再用完整仿真精细验证其中排名靠前的100个。
代理模型训练过程中,将输入参数 $\boldsymbol{\mu} = (\mu_1, \mu_2, \ldots, \mu_d)$(材料特性、形状参数、边界条件等)与对应的物理量 $\mathbf{u}(\boldsymbol{\mu})$ 配对,最小化以下损失函数:
$$\mathcal{L}_{\text{data}} = \frac{1}{N}\sum_{i=1}^{N} \left\| \hat{\mathbf{u}}(\boldsymbol{\mu}_i; \boldsymbol{\theta}) - \mathbf{u}_i \right\|^2$$其中 $\boldsymbol{\theta}$ 表示网络的所有参数(权重和偏置)。
PINN(物理信息神经网络)
PINN最近经常听说,它和普通神经网络有什么区别呢?
Physics-Informed Neural Network的简称,最大的特点是在损失函数中融入支配方程的残差。普通深度学习只从数据学习,但PINN会直接"告诉"网络"这个解必须满足Navier-Stokes方程"之类的物理约束。
具体怎么把物理规律融入呢?感觉很难理解...
以稳态热传导为例,支配方程是 $\nabla^2 T = 0$。PINN通过自动微分计算网络输出 $\hat{T}(x,y)$ 的二阶偏导,然后在损失函数中加入惩罚项,使得 $\nabla^2 \hat{T}$ 接近零。这样即使某些区域缺乏训练数据,物理规律本身也会约束网络给出合理的预测。实际中常见的例子是逆问题——比如根据几个温度传感器的数据推断材料的热导率。
PINN的总损失函数通常具有以下形式:
$$\mathcal{L}_{\text{PINN}} = \underbrace{\lambda_{\text{data}} \mathcal{L}_{\text{data}}}_{\text{与观测数据的一致性}} + \underbrace{\lambda_{\text{PDE}} \mathcal{L}_{\text{PDE}}}_{\text{支配方程残差}} + \underbrace{\lambda_{\text{BC}} \mathcal{L}_{\text{BC}}}_{\text{边界条件残差}}$$其中PDE残差项通过自动微分计算为:
$$\mathcal{L}_{\text{PDE}} = \frac{1}{N_r}\sum_{i=1}^{N_r}\left| \mathcal{N}[\hat{u}](\mathbf{x}_i) \right|^2$$$\mathcal{N}[\cdot]$ 是微分算子(例如 $\nabla^2 u - f$ 或 $\rho(\mathbf{u}\cdot\nabla)\mathbf{u} + \nabla p - \mu\nabla^2\mathbf{u}$)。
迁移学习
迁移学习在CAE中怎么用?我只听过图像识别中的例子。
思路完全相同。是把用相似物理现象训练过的模型的权重作为初值,迁移到新问题上。例如,你用NACA 0012翼型的空气动力数据(5000条)训练了一个模型,现在要用它来预测NACA 4412翼型的特性。只需额外准备200-300条数据,就能达到很高的精度。如果完全从零开始,可能需要3000条数据。
也就是说,仿真数据生成的成本本身就能大幅降低?那很实用啊。
完全正确。在CAE领域,生成一条数据需要几分钟到几小时,所以削减数据生成成本的影响力非常大。迁移学习能将成本降低一个数量级。不过要注意,如果源任务和目标任务在物理上差异太大,反而会产生负面效果(所谓"负迁移"),所以判断物理相似性很重要。
CNN场预测
听说CNN能直接预测应力分布和温度场,但网格数据怎么变成图像输入呢?
好问题。有几种方法,最直观的是符号距离场(SDF)表示。把分析对象的几何形状转换成规则网格图像,每个像素存储该点到物体表面的距离。然后把这个SDF和边界条件一起作为CNN的输入通道,输出通道就是应力或温度的等高线图。
明白了。"把几何变成图像,把物理量也变成图像"。用什么网络结构呢?
U-Net和编码-解码结构很常用。本来是图像分割里用的,但输入换成SDF或边界条件图,输出换成应力或速度等高线图就行。跳跃连接能更好地保留空间细节。推论耗时只需几毫秒,可以集成到实时设计工具中。
三维问题能用吗?图像好像是二维的...
可以用3D CNN处理。但内存消耗立方级增长,通常 $128^3$ 是实际应用的上限。最近还有图神经网络(GNN)的方向,能直接处理非结构网格,自由度更高。基于PointNet的方法也在进展,可以直接处理点云数据。
实务中的注意点
把深度学习引入CAE时,有什么要特别注意的?
最关键的是外插问题。神经网络在训练数据范围内(内插)精度很高,但对于未见过的条件——比如陌生的材料特性或极端荷载——预测往往会失效。物理仿真内含守恒律,外插时还能勉强应对,但纯数据驱动模型就没这个保证。所以要么像PINN那样融入物理约束,要么通过验证评估外插区域的可信度。
那深度学习到底是CAE的"盟友"还是"对手"?
绝对是盟友。FEM/CFD和深度学习是互补的。FEM/CFD物理严密但速度慢,深度学习速度快但泛化有限。现在最佳实践是混合策略——用物理求解器生成训练数据,用深度学习高速推理,对重要案例再用求解器验证。未来在数字孪生和实时控制领域,DL代理模型的需求会大幅增长。
关联术语
- 代理模型(Surrogate Model): 用低成本模型近似高成本仿真。除深度学习外,还包括克里金插值、RBF等。
- PINN(物理信息神经网络): 在损失函数中融入支配方程残差的神经网络。
- 迁移学习(Transfer Learning): 将某任务的学习知识迁移到相似任务的方法。
- CNN(卷积神经网络): 采用卷积层的神经网络,擅长处理图像类空间数据。
- 自动微分(Automatic Differentiation): PINN的基础技术,沿计算图精确计算偏导数。
- GNN(图神经网络): 能直接处理非结构网格的图结构网络。
准确理解CAE术语是团队沟通的基础。— Project NovaSolver也致力于为实务工作者提供学习支持。
在深度学习 × CAE的实务中遇到困难?
Project NovaSolver针对CAE工程师日常面临的课题——建模复杂性、计算成本、结果解释——进行解决方案开发。你的实务经验将成为更好工具开发的原动力。
咨询(准备中)相关主题
价值
详细
请报告