功率半导体器件的热分析
功率半导体器件热分析的理论基础
概述 — 为什么需要FEM
老师,功率器件热设计为什么要用FEM?数据手册上已经给出热阻了,用那个计算不就行了吗?
好问题。数据手册上的热阻 $R_{\theta,jc}$ 是在"芯片全面均匀发热,底面均匀冷却"的理想条件下测得的。但实际情况远不是这样。
SiC MOSFET的芯片温度用结温 $T_j$ 来管理。超过定额175°C就寿命会指数级衰减。关键问题在于:在封装内部,**晶粒接触层(die-attach)的微小空隙会局部增加热阻**。这是在制造焊接过程中不可避免地产生的。这些空隙导致的热阻局部增加是一维等效电路无法评估的,必须用FEM进行3D分析。
这种空隙的影响真的那么大吗?具体会升温多少呢?
英飞凌的CoolSiC 1200V模块案例表明,**晶粒接触层空隙率仅5%就会导致局部结温上升约15°C**。如果设计的定额余量只有20°C,空隙率5%就足以使可靠性破裂。
所以功率半导体的热设计必须保证"最坏点温度"而不仅仅是"平均温度",这正是FEM需要用来进行3D温度分布分析的原因。
原来空隙这么严重。看来不用FEM根本看不出来啊。
热阻网络 $R_{\theta,ja}$
先从基本原理开始教起来。数据手册上的热阻是什么结构呢?
功率器件的稳态温度由结温(junction)到周围环境(ambient)的热阻直列和决定。这就是所谓的**结-环境间热阻** $R_{\theta,ja}$:
从芯片到散热器,热阻逐层堆积的意思吧。这样的话一维计算就够了啊?
稳态、均匀发热的话是够的。但实务中有3个理由需要FEM:
- 空隙的影响:晶粒接触层的局部缺陷导致热无法均匀散布,在芯片上形成温度热点
- 热干扰:多芯片模块(6-in-1封装等)中相邻芯片的发热会相互干扰
- 过渡特性:PWM开关的重复循环导致温度在数十kHz频率下振荡,这是疲劳的原因
Cauer模型与Foster模型
温度变化如何处理呢?仅用稳态热阻是不够的吧。
对,需要用**过渡热阻抗 $Z_{\theta}(t)$**。数据手册上必然会有 $Z_{\theta,jc}(t)$ 的曲线。这个可以用RC等效电路来近似——Cauer和Foster两种模型。
| 项目 | Foster模型 | Cauer模型 |
|---|---|---|
| 电路构成 | RC并联元件的直列接连 | RC直列元件的直列接连 |
| 参数获取 | 从 $Z_{\theta}(t)$ 曲线拟合(容易) | 从物理层结构导出或从Foster转换 |
| 中间节点温度 | 无物理意义 | 对应各层界面温度 |
| 边界条件变更 | 不可(需重新拟合) | 可行(适用于散热器变更等) |
| 与FEM的配套 | 困难 | 容易(层结构对应) |
| 电路仿真器 | 广泛用于SPICE/PLECS | 物理模型派的偏好 |
Foster是曲线拟合所以方便,但改了散热器就不能用。Cauer对应物理结构所以和FEM配套好,是这个意思吧。
完全正确。实务上**系统仿真(PLECS、Simulink)用Foster**,**封装详细设计FEM(Ansys、COMSOL)用Cauer型物理模型**来分工。FEM结果可以提取Foster参数传给电路仿真器,这样形成一个完整的流程。
控制方程 — 3D非稳态热传导
FEM求解的基本方程是什么?
功率器件热分析求解的是**3D非稳态热传导方程(傅立叶方程)**:
功率循环寿命预测 $N_f$
有了温度后,怎样换算成寿命呢?
功率半导体的寿命由温度的"振幅"和"最高值"共同决定。反复的温度摆动会导致线键合离举和焊料裂纹。用**功率循环寿命式**来预测:
等等,温度振幅 $\Delta T_j$ 加倍的话寿命要缩短 $2^{4.4} \approx 21$ 倍吗?!
就是这样。所以功率器件的热设计不仅要"降低平均温度",更要"**减小温度摆动幅度**"——这直接关乎寿命。具体对策包括:增大散热器热容量平滑温度变化、提高开关频率以减小单个脉冲的 $\Delta T_j$,等等。
要准确取得 $\Delta T_j$,单靠RC等效电路精度不够的时候很多。特别是多芯片模块或混合开关工况的逆变器,必须用FEM过渡分析获取温度时间波形,用雨流法计算循环,再代入寿命式。这才是最佳实践。
IGBT的热失控 — "温度升高导致电流增加"的正反馈恐怖
IGBT有个讨厌的特性。温度上升时 $V_{\text{CE(sat)}}$(集电极-发射极饱和电压)增加导致损失增加,温度进一步升高——形成正反馈环路。并联的IGBT若存在特性偏差,电流多的芯片温度更高,进而吸收更多电流。对策是:用仿真持续监视 $T_j$,建立精确的热阻模型。数据手册的热阻是DC值,但实际开关动作中**脉冲热阻 $Z_{\theta}(t)$** 才是支配因素。一旦忽视了这点,就会严重低估瞬时温度。相比之下,SiC MOSFET拥有正的温度系数(温度升高时 $R_{\text{DS(on)}}$ 增加 → 电流减少),这在并联接连时能自然平衡电流分配,是巨大的优势。
功率半导体器件热分析的数值计算手法
FEM离散化与单元选择
3D热传导方程怎样用FEM来离散化?
转换为弱形式后用Galerkin法离散。温度场 $T$ 用形状函数 $N_i$ 近似:
这里 $[C]$ 是热容量矩阵,$[K_{\theta}]$ 是热导率矩阵,$\{Q\}$ 是热负荷矢量。和结构分析的 $[K]\{u\}=\{F\}$ 形式一样,但由于温度随时间变化,多了 $[C]\dot{\{T\}}$ 项。
功率器件热分析中单元选择很关键:
| 单元类型 | 推荐用途 | 注意事项 |
|---|---|---|
| 六面体二阶(20节点) | 芯片·基板的层结构 | 精度最高。用扫掠网格在厚度方向分层 |
| 四面体二阶(10节点) | 散热器鳍片等复杂形状 | 网格生成容易但单元数增多 |
| 壳单元(薄板) | DBC基板的铜箔(0.3mm厚等) | 当厚度太小时,用固体单元会导致单元数爆炸 |
| 热接触 | TIM层、晶粒接触界面 | 不需建模单元即可表现界面热阻。也可模拟空隙 |
芯片只有0.1mm,散热器却有好几十mm。尺度差这么大,网格设计得很困难啊…
正是这里的难点。芯片厚100μm和散热器50mm相比,**跨度500倍**。做法是用扫掠网格在厚度方向3~5分层,面内只在温度梯度大的区域细化。特别是芯片直下的晶粒接触层,厚度方向至少3层,面内在空隙附近要细到0.1mm以下。
过渡分析的时间积分
时间方向怎样离散化?开关频率10kHz以上的话,时间步长会很小吧。
这是实务的关键。要追踪开关一个周期($f_{\text{sw}} = 10$ kHz时为 $100\,\mu$s)内的温度变化,需要 $\Delta t \leq 10\,\mu$s。但寿命评估需要数分钟到数小时的任务曲线,全部用微秒步长计算会导致计算量爆炸。
实务采用**两层级方法**:
- 开关周期尺度:用FEM或RC等效电路求解数周期的温度振荡,得到单脉冲的 $\Delta T_j$
- 任务曲线尺度:将平均损失波形代入等效电路(Foster/Cauer),求解分~小时尺度的温度变化
时间积分一般用**后向欧拉法(一阶隐格式)**或**Crank-Nicolson法(二阶隐格式)**:
$\theta = 1$:后向欧拉(无条件稳定·一阶精度),$\theta = 0.5$:Crank-Nicolson(无条件稳定·二阶精度但有振荡风险)
电热耦合分析
之前说SiC的导热系数随温度大幅变化。温度变了损失也变,损失变了温度又变……是不是无限循环?
聪明。这就是**电热耦合(Electro-Thermal Coupling)**。温度上升时:
- $R_{\text{DS(on)}}$ 增加(MOSFET情况)→ 导通损失增加
- $k_{\text{SiC}}$ 降低 → 热散发变困难
- 温度进一步上升 → 正反馈环
正确处理需要**弱耦合**(温度→损失→温度交替迭代)或**强耦合**(电气方程和热方程同时求解)。实务多用弱耦合。通常3~5次迭代就收敛。
晶粒接触空隙建模
那个空隙FEM怎样建模呢?
主要3种手法:
- 直接建模:用X光检查图像获取空隙形状和位置,在晶粒接触层网格中挖去空隙形状(用空气层 $k \approx 0.026$ W/(m·K) 表现)。最准确但费功夫。
- 等效导热系数法:从空隙率 $\phi$ 算等效导热系数。用Maxwell-Eucken式 $k_{\text{eff}} = k_s \frac{2k_s + k_v - 2\phi(k_s - k_v)}{2k_s + k_v + \phi(k_s - k_v)}$。能评估平均影响但捕捉不到局部热点。
- 热接触+局部热阻:用热接触表现晶粒接触界面,在空隙位置设定局部高界面热阻。网格改动最少。
如果目标是可靠性评估,必须用手法1。量产工序管控的话,手法3就足够了。
功率半导体器件热分析的实务应用
分析工作流程
实际做功率器件热分析的时候,第一步从哪开始?
典型的流程是这样的:
- CAD导入与简化:从封装CAD数据中删除对分析无关的细节(线键、引脚等),但芯片-晶粒接触-基板-底板的层结构要保持
- 损失条件确定:用电路仿真器(PLECS/LTspice等)计算各工况下的导通损失和开关损失
- 网格生成:芯片面内0.2~0.5mm,厚度方向最少芯片3层、晶粒接触3层、基板5层
- 物性温度依存性定义:至少把SiC/Si的 $k(T)$ 和焊料的 $k(T)$ 用温度表输入
- 边界条件设置:散热器底面设TIM包含的等效热传系数,或直接温度固定
- 稳态分析初始验证:先稳态求解校验温度分布合理性
- 过渡分析:代入任务曲线(加速工况或实际行驶数据)
- 寿命计算:提取温度波形,用雨流法计数 $\Delta T_j$,代入寿命式求 $N_f$
网格设计要点
功率器件特有的网格设计要注意哪些?
| 部位 | 推荐网格尺寸 | 单元类型 | 原因 |
|---|---|---|---|
| 芯片(厚100μm) | 面内0.2mm / 厚度3层 | 六面体扫掠 | 温度梯度陡峭。必须二阶单元 |
| 晶粒接触(25~100μm) | 面内0.1mm / 厚度3层 | 六面体扫掠 | 空隙评估尤其需要细化 |
| DBC/AMB基板 | 面内0.5mm / 厚度5层 | 六面体扫掠 | 铜箔与陶瓷要分层 |
| 底板 | 面内1~2mm | 六面体或四面体 | 应力分析时推荐六面体 |
| 散热器 | 鳍间2~5mm | 四面体可 | 温度梯度缓和。粗网格可接受 |
网格收敛检验:芯片上的最高温 $T_{j,\max}$ 在3层网格密度下要在±1°C以内。功率器件定额余量小,网格导致的1~2°C误差会显著影响寿命评估。
边界条件设置
散热器要不要全部建模?会不会导致单元数太多?
实务上分3个层级:
- 1级(封装单独):底板底面温度固定($T_c = T_a + P_{\text{loss}} \cdot R_{\theta,sa}$)。最简便。散热器设计已定时有效
- 2级(封装+散热器):散热器底面或鳍表面设对流边界条件。需要评估热干扰时必须
- 3级(CFD耦合):冷却液/空气流场也用CFD求解。精度最高但计算费用大。数据中心大型冷却器用
车载IGBT模块通常用2级。水冷夹套底面设"等效热传系数" $h_{\text{eq}} = 5000\text{~}15000$ W/(m²·K) 的做法很普遍。
实验验证与V&V
仿真结果怎样用实验验证?芯片温度好像无法直接测…
实际上芯片温度可以**间接**测量。主要方法3种:
- Vce(sat)法 / Vds法(TSEP: Temperature Sensitive Electrical Parameter):半导体正向压降和温度成正比的特性。可以捕捉0.1μs级的过渡响应。符合JEDEC JESD51-14。工厂量产检验也用这个
- 红外热像仪:拆开封装上面,涂均匀放射率涂层后用红外相机拍摄。能获得面内分布,但拆封改变了热边界条件的问题
- 光纤光栅(FBG)传感器:在基板上贴光纤测局部温度。能获得芯片直下的基板温度
实务中**用Vce法测 $Z_{\theta}(t)$ 曲线,和FEM过渡响应比较**最可靠。 $T_{j,\max}$ 预测精度±5°C以内是合格线。
功率半导体器件热分析的软件对比
主要工具对比
功率器件热分析有哪些工具?
| 工具 | 开发商 | 特点 | 强项 |
|---|---|---|---|
| Ansys Icepak | Ansys | FVM+FEM的电子冷却专用。Workbench集成 | 模块~系统级热流体分析 |
| Ansys Mechanical | Ansys | 通用FEM。热-结构耦合强 | 功率循环应力分析、线键寿命 |
| COMSOL Multiphysics | COMSOL | 电气-热-结构完全耦合 | 研究用途、自定义物理模型 |
| Simcenter Flotherm | Siemens | 电子设备冷却专用。高速求解器 | 紧凑模型(DELPHI)生成 |
| Simulia Abaqus | Dassault | 非线性FEM。可用子程序扩展 | 焊料疲劳、蠕变分析 |
| PLECS + FEM链接 | Plexim | 电路仿真器和FEM耦合 | 任务曲线寿命预测 |
应用场景选择指南
结果该选哪个工具?预算有限的情况怎么办?
按用途来选:
- 封装设计者:Ansys Icepak + Mechanical的组合是业界标配。从晶粒接触空隙评估到功率循环寿命应力分析,一条龙搞定
- 电路设计者要评系统寿命:PLECS(电路仿真器)加Foster/Cauer模型。不用FEM,从数据手册 $Z_{\theta}(t)$ 拟合即可
- 研究和自定义物理:COMSOL。电气-热-结构-化学(离子迁移)等都可以自己写方程
- 开源从入门:Elmer FEM + OpenFOAM。学术论文级的分析完全够,但CAD连接较弱
功率半导体器件热分析的先进研究
数字孪生与寿命监测
最近听说"数字孪生",功率器件热设计也能用吗?
正热门。电动车的功率模块就在研究**在线数字孪生**——实车运行时实时推估 $T_j$,预测剩余寿命(RUL)。
工作原理:
- 离线FEM参数化求解各种损失条件,生成**缩约模型(ROM)**
- **车载ECU**上运行ROM,从电流电压传感信号实时推估 $T_j$
- 用**累积损伤准则**(Miner法则)积算消耗的寿命,给出维保提示
丰田Prius和宝马iX3据说已装载了这类在线温度推估功能。
SiC/GaN器件的热课题
下一代的SiC和GaN,热设计的课题有什么变化吗?
很大的变化。两个原因:
- 芯片小型化:SiC的耐压比Si高,所以芯片可以做得更小。同样功率在更小面积上处理,**热流密度达到200~500 W/cm²**。Si时代的50~100 W/cm²数倍。传统散热器冷却不足
- 高频动作:GaN HEMT能做到100kHz以上开关,高频化使每个脉冲的持续时间缩短,$Z_{\theta}(t)$ 的过渡特性成为主导。稳态 $R_{\theta}$ 无法准确评温
应对策略包括:**双面冷却**(芯片上下都散热)、**烧结Ag键合**(热导率比焊料高5倍)、**直流液冷(喷气淬冷)**等新冷却技术蓬勃发展。这些新结构FEM能准确建模,传统1D等效电路则难以应对,这进一步凸显了FEM的价值。
功率半导体器件热分析的问题排查
常见失误与对策
老师,功率器件热分析中初学者常犯什么错?
山里一样多。按频率从高到低:
| 失误类型 | 表现 | 原因与对策 |
|---|---|---|
| 温度异常高 | $T_j > 500°C$ 等非物理值 | 损失单位混乱。W和mW、mm和m互相搞反。Ansys Mechanical默认SI单位(m、W),CAD通常mm。一定要统一 |
| 温度太低 | $T_j \approx T_a$ 基本无升温 | 发热体体积太大。不是把损失分布到整个芯片,而要集中到活性区(MOSFET的栅极下方) |
| 晶粒接触影响看不出 | 加空隙后温度变化<1°C | 网格太粗。晶粒接触层只有1层网格的话捕捉不到温度梯度。需要厚度3层以上 |
| 过渡分析振荡 | 温度非物理性摆动 | 时间步长太大(Crank-Nicolson时)。换后向欧拉,或把 $\Delta t$ 设为 $\tau_{\min}/5$ 以下 |
| 电热耦合不收敛 | 迭代发散 | 缺少松弛系数。温度更新改为 $T^{k+1} = \omega T_{\text{new}} + (1-\omega) T^k$,$\omega$ 设0.5~0.7 |
调试检查清单
"结果不对劲"时怎样调试?有步骤吗?
深呼吸,按顺序检查:
- 单位系统确认:所有物性值、边界条件、损失的单位是否一致?特别注意热导率 [W/(m·K)] 和损失 [W] 和长度 [m or mm]
- 能量守恒检验:输入热量 $P_{\text{loss}}$ 和从边界散出的热流积分相等吗?偏差>1%就有问题
- 定常解的合理性检验:$T_j - T_a = P_{\text{loss}} \times R_{\theta,ja}$ 的手算值和仿真值吻合吗?差2倍以上就是根本输入错
- 网格收敛:网格加倍细密后 $T_{j,\max}$ 有无变化?如果还在变,网格不够
- 单芯片独立验证:多芯片模块出问题的话,先用单芯片简单模型重现
经验上,不良的80%源于**单位混乱**和**损失输入错**。复杂物理问题反而少见。
8割是单位和损失…。看来高级的物理之前,要先把基本数据搞对。
没错。这是CAE全体通用的真理——**垃圾进去垃圾出来**。反过说,物性和边界条件认真设置好,FEM就能给出精确的答案。功率器件热分析是部件厂和系统厂之间品质保证的共同语言。学好这个,实务中必然大用处。
价值
的内容
错误