在功率器件的热设计中，FEM用于什么？

FEM用于确保SiC MOSFET或IGBT的芯片温度（结温Tj）维持在额定值以下的设计。它可以分析等效电路无法评估的三维热分布，例如因芯片贴装层空洞导致的局部热阻上升。

Cauer模型和Foster模型有什么区别？

Cauer模型是与物理层结构（芯片→芯片贴装→基板→散热器）对应的RC串联连接，各节点温度具有物理意义。Foster模型是通过传递函数曲线拟合得到的RC并联连接，其中间节点没有物理意义。

如何预测功率循环寿命Nf？

使用Coffin-Manson型经验公式 Nf = A·ΔTj^(-n) 进行预测。其中ΔTj是结温振幅，系数A和n因封装及Al/Cu引线键合方式而异。LESIT测试数据是行业标准。

芯片贴装层空洞会产生多大影响？

以英飞凌CoolSiC 1200V模块为例，芯片贴装层空洞率达到5%时，结温会上升约15°C。若不使用FEM进行三维分析，则无法评估这种局部影响。

功率半导体器件的热分析

分类: 電磁場解析 › パワーエレクトロニクス | 综合版 2026-04-11

Power semiconductor junction temperature distribution and thermal resistance network FEM analysis

パワー半導体モジュールのジャンクション温度分布と熱抵抗ネットワーク

理论与物理

概述 — 为何需要FEM

🧑‍🎓

老师，在功率器件的热设计中，FEM是用来做什么的？数据手册上不是有热阻吗，用那个计算不就可以了吗？

🎓

问得好。数据手册上的热阻 $R_{\theta,jc}$ 是“芯片表面均匀发热，背面均匀冷却”这一理想条件下的值。但实际上没那么简单。

SiC MOSFET的芯片温度由结温 $T_j$ 管理。超过额定175°C，寿命会呈指数级下降。这里的问题在于封装内部的芯片贴装层空洞。制造过程中进行焊锡接合时，无论如何都会残留微小空隙。这些空洞会局部提高热阻，但这是1D等效电路无法评估的。必须使用FEM进行3D分析。

🧑‍🎓

影响有那么大吗？具体温度会上升多少呢？

🎓

英飞凌的CoolSiC 1200V模块有报告称，芯片贴装层空洞率仅为5%时，局部结温就会上升约15°C。如果设计时额定裕量只有20°C，那么5%的空洞率就可能导致可靠性崩溃。

因此，功率半导体的热设计需要保证的是“最差点温度”而非“平均温度”，为此必须使用FEM求解3D温度分布。

🧑‍🎓

仅仅5%的空洞就15°C…只看数据手册绝对发现不了呢。

热阻网络 $R_{\theta,ja}$

🧑‍🎓

首先想请教一下基础知识，数据手册上记载的热阻，具体是什么样的结构呢？

🎓

功率器件的稳态温度，可以用结（芯片接合面）到周围环境的热阻串联和来表示。这就是所谓的结到环境热阻 $R_{\theta,ja}$：

$$ T_j = T_a + P_{\text{loss}} \cdot R_{\theta,ja} $$ $$ R_{\theta,ja} = R_{\theta,jc} + R_{\theta,cs} + R_{\theta,sa} $$

各项的物理含义

$T_j$（结温）：半导体芯片的最高温度点。Si-IGBT额定150~175°C，SiC-MOSFET额定175~200°C。此温度支配寿命。
$T_a$（环境温度）：冷却系统入口的空气温度。车载应用设想最坏情况105°C，工业应用设想40~55°C。
$P_{\text{loss}}$（损耗功率）：导通损耗 $P_{\text{cond}} = I^2 R_{\text{DS(on)}}$ 与开关损耗 $P_{\text{sw}} = \frac{1}{2}(E_{\text{on}}+E_{\text{off}}) f_{\text{sw}}$ 的总和。
$R_{\theta,jc}$（结到壳）：从芯片到封装背面。包含芯片贴装层（焊锡/烧结银）、DBC/AMB基板。典型值为0.1~1.0 K/W。
$R_{\theta,cs}$（壳到散热器）：TIM（热界面材料）的热阻。导热硅脂为0.1~0.5 K/W，导热垫为0.5~2.0 K/W。
$R_{\theta,sa}$（散热器到环境）：散热器+冷却系统的性能。自然对流为1~10 K/W，强制风冷为0.1~1 K/W，水冷为0.01~0.1 K/W。

🧑‍🎓

从芯片到散热器，热阻像是一层一层叠加起来的印象呢。但如果只是这样，1D计算不就足够了吗？

🎓

稳态且均匀发热的话，那样就够了。但实际工作中，有三个理由需要使用FEM：

空洞的影响：芯片贴装层的局部缺陷导致热量无法扩散，在芯片上产生温度热点
热干扰：多芯片模块（如6合1封装）中，相邻芯片的发热会相互干扰
瞬态响应：PWM开关的重复会导致温度以数十kHz的频率波动，成为疲劳的原因

Cauer模型与Foster模型

🧑‍🎓

要处理瞬态的温度变化该怎么办呢？只有稳态热阻不够吧？

🎓

这时就需要用到瞬态热阻抗 $Z_{\theta}(t)$。数据手册上必定会记载 $Z_{\theta,jc}(t)$ 曲线。用RC等效电路来近似它的就是Cauer模型和Foster模型。

$$ Z_{\theta}(t) = \sum_{i=1}^{n} R_i \left(1 - e^{-t/\tau_i}\right), \quad \tau_i = R_i \cdot C_i $$

🎓

项目	Foster模型	Cauer模型
电路构成	RC并联元件的串联连接	RC串联元件的串联连接
参数获取	$Z_{\theta}(t)$ 曲线拟合（容易）	从物理层结构推导或从Foster转换
中间节点温度	无物理意义	对应各层界面温度
边界条件变更	不可（需要重新拟合）	可以（可应对散热器变更等）
与FEM的协同	困难	容易（因对应层结构）
电路仿真器	SPICE/PLECS 中广泛使用	物理模型派偏好

🧑‍🎓

也就是说，Foster因为是曲线拟合所以方便，但换了散热器就不能用了。Cauer对应物理结构，所以与FEM兼容性好，是这样吧。

🎓

没错。实际工作中，通常区分使用：系统仿真（PLECS, Simulink）用Foster，封装详细设计的FEM（Ansys, COMSOL）用Cauer类物理模型。也经常采用从FEM结果提取Foster参数，再传递给电路仿真器的流程。

控制方程 — 3D非稳态热传导

🧑‍🎓

请告诉我用FEM求解时的基础方程。

🎓

功率器件热分析求解的是3D非稳态热传导方程（傅里叶方程）：

$$ \rho c_p \frac{\partial T}{\partial t} = \nabla \cdot (k \nabla T) + Q_v $$

各项的物理含义

$\rho c_p \frac{\partial T}{\partial t}$（蓄热项）：材料储存热量的能力。$\rho$ 是密度 [kg/m³]，$c_p$ 是比热容 [J/(kg·K)]。SiC芯片（$\rho = 3210$ kg/m³, $c_p = 690$ J/(kg·K)）较小，所以响应快。
$\nabla \cdot (k \nabla T)$（热传导项）：基于傅里叶定律的热扩散。SiC的热导率 $k = 370$ W/(m·K) 约为Si（$k = 148$ W/(m·K)）的2.5倍。芯片贴装用焊锡（$k \approx 50$ W/(m·K)）是瓶颈。
$Q_v$（体积发热密度）：芯片内的焦耳热。集中在MOSFET有源区，典型量级为 $10^7 \sim 10^9$ W/m³。芯片面积越小，单位面积发热密度越高。

边界条件

第1类（狄利克雷）：$T = T_0$（固定散热器基座温度。水冷时为冷却水温度。）
第3类（牛顿冷却）：$-k \frac{\partial T}{\partial n} = h(T - T_{\infty})$（空冷面。自然对流 $h = 5\text{–}25$ W/(m²·K)、强制对流 $h = 50\text{–}500$ W/(m²·K)。）
第4类（辐射）：$-k \frac{\partial T}{\partial n} = \varepsilon \sigma (T^4 - T_{\text{sur}}^4)$（高温环境下重要。封装表面 $\varepsilon \approx 0.9$。）
界面热阻：$q = \frac{\Delta T}{R_{\text{contact}}}$（TIM层或芯片贴装界面。FEM中用薄层单元或热接触来表现。）

材料物性的温度依赖性

材料	$k$ [W/(m·K)]	$\rho c_p$ [MJ/(m³·K)]	温度依赖性注意事项
SiC（4H）	370 @25°C → 200 @175°C	2.21	温度上升导致热导率大幅下降（注意正反馈）
Si	148 @25°C → 80 @175°C	1.66	同上
Cu（基板）	398 @25°C → 385 @175°C	3.44	温度依赖性小
Al₂O₃（DBC基板）	35	3.08	温度依赖性几乎可忽略
AlN（AMB基板）	170	2.37	高热导率。面向高功率
Si₃N₄（AMB基板）	90	2.33	高强度。功率循环耐受性优异
Sn-Ag-Cu焊锡	58	1.65	芯片贴装层。空洞导致有效值下降
烧结Ag	250	2.48	下一代芯片贴装。高可靠性

功率循环寿命预测 $N_f$

🧑‍🎓

知道了温度，怎么把它和寿命联系起来呢？

🎓

功率半导体的寿命由温度的“振幅”和“最高值”两者决定。反复的温度波动会导致引线键合剥离或焊锡裂纹扩展。预测这个的就是功率循环寿命公式：

$$ N_f = A \cdot \Delta T_j^{\;-n} \cdot \exp\!\left(\frac{E_a}{k_B \cdot T_{j,\max}}\right) $$

各项及典型参数值

$N_f$（失效循环数）：功率循环寿命。引线键合剥离的典型值为 $10^4 \sim 10^7$ 次循环。
$\Delta T_j$（温度振幅）：一次循环的结温变化幅度 [K]。$\Delta T_j = 50$ K 时约 $10^6$ 次循环，$\Delta T_j = 100$ K 时降至约 $10^4$ 次循环。
$n$（温度指数）：Coffin-Manson指数。Al引线键合 $n \approx 4 \sim 5$，Cu引线键合 $n \approx 3 \sim 4$。
$E_a$（活化能）：阿伦尼乌斯项。焊锡疲劳 $E_a \approx 0.8$ eV，引线键合 $E_a \approx 0.06 \sim 0.08$ eV。
$T_{j,\max}$（最高结温）：绝对温度 [K]。温度越高劣化加速越快。
$k_B$（玻尔兹曼常数）：$8.617 \times 10^{-5}$ eV/K。

与LESIT试验数据的对应

基于行业标准LESIT（Leistungselektronik Simulation und Technologie）试验数据的简化公式：

$$ N_f = A \cdot \Delta T_j^{\;-n} $$

封装 / 连接技术	$A$	$n$	出处
IGBT / Al引线 / 焊锡	$3.025 \times 10^{14}$	4.416	LESIT (ECPE)
IGBT / Cu引线 / 烧结Ag	$9.3 \times 10^{14}$	−5.3	Infineon (参考)
SiC MOSFET / Cu夹片	−	−	尚无充分数据

🧑‍🎓

诶，温度振幅 $\Delta T_j$ 变成2倍，寿命就会缩短 $2^{4.4} \approx 21$ 倍吗！

🎓

正是如此。所以功率器件的热设计不仅仅是“降低平均温度”，“减小温度振幅” 直接关系到寿命。具体对策有：增加散热器的热容量以平滑温度波动、提高开关频率以减小单脉冲的 $\Delta T_j$ 等。

要精确求得这个 $\Delta T_j$，有时仅靠RC等效电路精度不够。特别是在多芯片模块，或不同开关条件混杂的逆变器中，最佳实践是：通过FEM瞬态分析获取温度时间波形，用雨流法进行循环计数，再代入寿命公式。

Coffee Break 闲谈角

IGBT的热失控 — “温度升高电流增大”的正反馈恐怖

IGBT有个麻烦的特性。温度升高，$V_{\text{CE(sat)}}$（集电极-发射极饱和电压）会增加，导致损耗增加，温度进一步升高——这是一个正反馈循环。并联连接的IGBT如果特性存在差异，流过更多电流的芯片会更热，进而吸引更多电流。对策是：在设计时始终通过仿真监控 $T_j$，并构建精确的热阻模型。数据手册的热阻是DC值，但实际的开关动作中，如果不用脉冲热阻 $Z_{\theta}(t)$，就会低估瞬时温度。另一方面，SiC MOSFET具有正温度系数（温度升高 $R_{\text{DS(on)}}$ 增加 → 电流减小），因此具有并联连接时电流自然平衡的巨大优势。

数值解法与实现

FEM离散化与单元选择

🧑‍🎓

用FEM求解3D热传导方程时，具体是怎么离散化的呢？

🎓

转换为弱形式后用伽辽金法离散化。温度场 $T$ 用形函数 $N_i$ 近似：

$$ T^h(\mathbf{x}, t) = \sum_{i=1}^{n} N_i(\mathbf{x}) \, T_i(t) $$ $$ [C]\dot{\{T\}} + [K_{\theta}]\{T\} = \{Q\} $$

🎓

这里 $[C]$ 是热容矩阵，$[K_{\theta}]$ 是热传导矩阵，$\{Q\}$ 是热负荷向量。与结构分析的 $[K]\{u\}=\{F\}$ 形式相同，但温度随时间变化，所以增加了 $[C]\dot{\{T\}}$ 项。

功率器件热分析中单元的选择很重要：

单元类型	推荐用途	注意事项
六面体二次（20节点）	芯片·基板的层状结构	最高精度。用扫描网格沿层方向分割
四面体二次（10节点）	散热器翅片等复杂形状	网格生成容易但单元数增加
壳单元（薄板）	DBC基板的铜箔（0.3mm厚等）	对于用实体单元会导致单元数爆炸的薄层有效
热接触	TIM层、芯片贴装界面	无需单元即可表现界面热阻。也可模拟空洞

🧑‍🎓

芯片只有0.1mm左右，散热器却有几十mm。尺度完全不同呢。网格设计看起来好难…

🎓

这正是功率器件热分析的难点所在。芯片厚度100μm对比散热器50mm。存在500倍的尺度差。技巧是：用扫描网格沿层方向分割3~5层，面内只在温度梯度陡峭的区域细化。芯片正下方的芯片贴装层厚度方向至少需要3层，空洞周围面内需要0.1mm以下的网格。

瞬态分析的时间积分

🧑‍🎓

时间方向的离散化怎么做呢？开关频率在10kHz以上，时间步长看起来会很麻烦。

🎓

这正是实际工作中的关键。要追踪一个开关周期（$f_{\text{sw}} = 10$ kHz 则为 $100\,\mu$s）内的温度变化，需要时间步长 $\Delta t \leq 10\,\mu$s 左右。但如果用微小步长追踪功率循环寿命评估所需的数分钟至数小时的任务剖面，计算量会爆炸。

实际工作中采用两阶段方法：

开关周期尺度：用FEM或RC等效电路分析几个周期的温度振荡，获取单脉冲的 $\Delta T_j$
任务剖面尺度：将平均损耗波形输入等效电路模型（Foster/Cauer），获取分钟至小时尺度的温度变化

时间积分通常使用后向欧拉法（一阶隐式法）或Crank-Nicolson法（二阶隐式法）：

$$ \left(\frac{[C]}{\Delta t} + \theta [K_{\theta}]\right) \{T\}_{n+1} = \frac{[C]}{\Delta t} \{T\}_n + \{Q\}_{n+\theta} $$