1. 项目概述:当功率MOSFET遇上“体温计”
在高压直流配电系统,比如全电飞机、卫星平台或者高端工业设备里,固态功率控制器(SSPC)和固态断路器(SSCB)是守护电路安全的“智能开关”。它们取代了传统的机械断路器和继电器,速度快、无电弧、寿命长,还能远程控制和自诊断,听起来很完美,对吧?
但干过这行的工程师都知道,这些固态开关有个“阿喀琉斯之踵”——里面的核心开关器件,通常是功率MOSFET,非常怕热。尤其是在负载发生短路这种最恶劣的故障时,巨大的短路电流会在瞬间让MOSFET产生惊人的热量。传统的保护策略,比如反时限过流保护,在面对这种毫秒级的剧烈温升时,往往反应迟钝或者设置不合理。结果就是,保护动作还没触发,MOSFET的结温已经冲破了安全红线,直接热击穿失效。一旦作为“守门员”的SSPC自己烧了,整个配电系统的可靠性就无从谈起。
所以,我们面临的核心矛盾是:如何在短路发生时,既快速限制电流保护后级负载和线路,又能确保MOSFET自身不被“烧死”?这篇分享要聊的,就是一个把“热管理”思想深度融入“限流保护”策略的实战方案。简单说,就是给MOSFET装上一个“高精度体温计”和“体温预测模型”,实时计算它内部的“核心体温”(结温),并以此为依据,动态、精准地决定限流保护应该持续多久。这不再是拍脑袋设定一个固定的保护时间,而是让保护策略变得有“温度感知”,实现真正的智能保护。
2. 传统固态开关保护策略的局限与痛点
在深入我们的新方案之前,有必要先看看现有的保护方法为什么在高压大电流场景下会“失灵”。理解这些痛点,才能明白我们为什么要大费周章地引入热管理。
2.1 反时限过流保护的“慢半拍”
绝大多数SSPC的过流保护都基于反时限特性曲线。其基本原理是模拟导体的热积累过程:电流越大,发热越快,达到保护阈值所需的时间就越短。公式通常长这样:t = K / ( (I/Ip)^r - 1 ),其中K、r是常数,I是实测电流,Ip是基准电流。
听起来很合理,但问题出在哪?
- 时间尺度不匹配:反时限曲线是为过载(比如1.5倍到6倍额定电流,持续数百毫秒到数秒)设计的。而高压直流系统(例如270V)发生短路时,短路电流可能在几十微秒内飙升到额定电流的十几倍甚至几十倍。MOSFET的温升是以毫秒甚至微秒级计算的,反时限算法在最初的几十毫秒内可能根本来不及反应。
- 忽略瞬时热冲击:反时限算法关注的是“热积累效应”,但对于短路瞬间的峰值功率冲击(
P = I² * Rds(on))极其敏感。一个270V/20A的SSPC,假设MOSFET导通电阻10mΩ,发生10倍额定电流(200A)短路时,瞬时功耗高达200² * 0.01 = 400W。如此巨大的功率集中在一个小小的芯片上,其温度可能在几毫秒内飙升上百摄氏度,反时限曲线此时提供的保护时间窗口可能远远不够。
注意:很多工程师会直接套用交流配电系统的反时限曲线到直流固态开关上,这是非常危险的。直流系统没有电流过零点,短路电流一旦建立,就会持续施加在器件上,直到被切断,其热应力是连续且剧烈的。
2.2 简单限流与放大区工作的“饮鸩止渴”
另一种常见的短路保护思路是快速进入限流状态,通过控制MOSFET的栅极电压,使其工作在饱和区与放大区的边缘,从而将电流钳位在一个设定值(例如5倍额定电流)。
这种方法确实能快速抑制电流峰值,但它引入了新的问题:
- 效率极低,发热剧增:当MOSFET工作在线性放大区时,其管压降
Vds会变得很大。此时功耗P = Vds * I不再主要由导通电阻决定,而是由这个较大的Vds决定。即使限流值只有100A,如果Vds达到几十伏,瞬时功耗也能轻松达到数千瓦,这比完全导通时的导通损耗(I² * Rds(on))要大得多。 - 热应力集中:这种巨大的功耗几乎全部转化为热量,且由于是主动限流状态,热量会持续产生。如果限流保护时间设置过长,MOSFET会因持续的高热而加速老化甚至直接烧毁。这就好比为了不让水流冲垮堤坝(限流),却让水闸本身被高温熔化了。
2.3 固态断路器(SSCB)方案的“重量级”代价
对于短路保护,还有一种思路是使用专门设计的固态断路器(SSCB)。它通常采用IGBT、GTO等具有更强浪涌能力的器件,追求在极短时间内(微秒级)分断故障电流。
然而,SSCB并非SSPC的完美替代品:
- 体积与重量:为了实现快速分断和大容量,SSCB需要复杂的驱动、吸收电路和强大的散热系统(如液冷),导致其体积和重量远超SSPC。
- 成本与复杂度:高性能的IGBT/GTO以及配套的驱动保护电路成本高昂。
- 适用场景:SSCB更像一个纯粹的“保险丝”,而SSPC集成了开关、保护和智能控制功能。在需要频繁通断、远程控制、状态监测的分布式配电节点上,SSPC的集成化优势更明显。
因此,我们的目标很明确:在SSPC的紧凑架构内,设计一种既能快速响应短路、有效限流,又能确保MOSFET自身绝对安全的保护策略。答案就是——基于实时热管理的限流保护。
3. 核心策略:将热模型植入保护逻辑
我们的策略核心,是将MOSFET的热特性从被动的“承受者”转变为主动的“决策依据”。整个控制逻辑围绕一个中心展开:实时估算MOSFET的结温,并以此作为限流保护时间的唯一仲裁者。
3.1 系统架构优化:为“体温”监测铺路
要实现精准的热管理,首先需要给系统装上更敏锐的“感官神经”和更快的“反射弧”。我们对传统SSPC的电路进行了关键优化:
- 高速采样电路:弃用响应较慢的霍尔电流传感器,采用隔离运放配合精密采样电阻的方案对总线电压、MOSFET的
Vds电压和输出回路电流进行采样。采样频率提升到MHz级别,使得控制系统能捕捉到电流和电压的瞬时变化(di/dt,dVds/dt),这对于判断故障类型(容性负载启动、过载、短路)至关重要。 - 硬件PWM限流环:在FPGA主控之外,增加一个由模拟比较器构成的硬件PWM电路。当电流瞬间超过设定的硬阈值时,无需等待FPGA的软件响应周期(通常几十微秒到毫秒),硬件电路能在纳秒级触发,立即控制BUCK电路进入限流模式。这为软件算法争取了宝贵的响应时间。
- 集成BUCK拓扑:在功率回路中串联一个电感,构成一个BUCK电路。在短路瞬间,电感能抑制电流上升率(
di/dt),避免电流冲击超出MOSFET的安全工作区。同时,通过PWM控制这个BUCK电路,可以更平滑地实现电流钳位,减少开关应力。
优化后的SSPC工作逻辑是一个多模态控制系统:
- 正常导通态:负载电流平稳,MOSFET完全导通。
- 硬件预限流态:短路发生,硬件电路第一时间介入,固定占空比限流。
- 软件主动限流态:FPGA接管,根据实时计算的结温和负载类型,动态调整PWM占空比,实施最优限流。
- 容性负载缓启动态:识别为大电容负载,采用软启动充电曲线。
- 过载反时限保护态:常规过载,走反时限保护曲线。
- 过热保护态:无论处于何种状态,一旦实时估算结温达到危险阈值(如
Tj_max的0.7-0.8倍),立即执行关断保护。
3.2 热模型的建立:从外壳温度到结温的“透视”
这是整个策略的技术核心。我们无法直接在MOSFET芯片内部埋入热电偶,但可以通过测量其外壳(或散热器)温度,结合热模型,反推出结温。
1. 建立三维热模型首先,需要为SSPC模块(特别是MOSFET及其散热路径)建立精确的三维结构模型。这包括:
- MOSFET芯片(热源)
- 内部引线框架和焊料层
- 陶瓷绝缘基板(如果有)
- 导热硅脂层
- 铝合金散热器或壳体
- 周围空气域(用于对流换热仿真)
使用有限元分析软件,为每一层材料赋予准确的热物性参数:导热系数、比热容、密度。
2. 稳态与瞬态热分析根据能量守恒定律(热力学第一定律),可以建立系统的热平衡方程。对于稳态分析,流入系统的热量等于流出系统的热量,节点温度不随时间变化。其矩阵方程为[K]{T} = {Q},其中[K]是热传导矩阵,{T}是节点温度向量,{Q}是节点热流向量。
对于瞬态分析(短路过程就是典型的瞬态),则需要考虑热容的影响,方程为[C]{dT/dt} + [K]{T} = {Q}。[C]是比热矩阵。通过有限元仿真,我们可以得到在特定功耗(如短路限流时的PD = Vds * I)下,MOSFET从芯片到外壳的温度场分布。
3. 关键输出:热阻网络与温度映射关系仿真的目的,是提取出关键的热阻参数,并建立外壳测温点温度T_case与芯片结温T_junction之间的映射关系。最常用的简化模型是“热阻网络”,例如结到壳的热阻RθJC,壳到环境的热阻RθCA。
T_junction = T_case + PD * RθJC
但实际中,RθJC并非恒定值,它随温度、功耗变化。通过仿真,我们可以得到一组在不同功耗PD和壳温T_case下的T_junction数据,进而拟合出一个更精确的、包含非线性效应的经验公式或查找表,烧录到FPGA中。
3.3 控制策略的实现:用温度决定时间
有了实时结温估算能力,保护逻辑就变得清晰而直接:
- 实时数据采集:FPGA高速采集
Vds和Ids,计算瞬时功耗PD(t) = Vds(t) * Ids(t)。同时,通过紧贴MOSFET封装安装的(如NTC热敏电阻或数字温度传感器)读取外壳温度T_case(t)。 - 结温实时估算:将
PD(t)和T_case(t)代入预先建立的热模型(公式或查找表),实时计算当前结温T_j_est(t)。这里需要考虑热容带来的热惯性,即当前的功耗不会立刻全部体现为温升,算法中通常采用热网络模型或滤波算法来模拟这种热传递过程。 - 动态保护决策:
- 设定温度阈值:设定一个绝对安全温度
T_trip(例如125°C,低于器件最大结温150°C)。 - 预测与行动:在短路限流状态下,控制器不仅知道当前的
T_j_est,还能根据当前的功耗PD和热模型,预测在未来一段时间(如下一个10ms)内,结温是否会达到T_trip。 - 执行保护:一旦预测结温将超过
T_trip,无论预设的固定限流时间是否结束,立即命令SSPC完全关断,实现基于热边界的保护。如果预测温升较慢,则可以允许限流状态持续更久,为系统尝试重合闸或等待后备保护提供可能。
- 设定温度阈值:设定一个绝对安全温度
这种策略的本质,是将保护判据从固定的“电流-时间”曲线,转变为动态的“电流-温度-时间”三维曲面。时间不再是预设的,而是由器件实时热状态决定的因变量。
4. 从仿真到实测:一个270V/20A SSPC的完整实现
理论需要实践验证。我们以一款符合ASAAC标准的270V直流、20A额定电流的SSPC模块为例,完整走一遍设计、仿真和测试流程。
4.1 电路与结构设计
功率级设计:选用两颗低Rds(on)的功率MOSFET并联,以分担电流和降低导通损耗。计算在20A额定电流下,单管导通损耗约为20² * 0.01Ω / 2 = 2W(假设均流理想)。驱动电路设计合理的栅极电阻,将开关时间控制在50ns左右,以平衡开关损耗和EMI。
BUCK电感设计:这是抑制di/dt的关键。目标是在短路时,将电流上升率限制在MOSFET安全工作区内。根据公式V = L * di/dt,假设总线电压270V,希望di/dt不超过10A/μs,则所需电感量L = V / (di/dt) = 270V / (10A/μs) = 27μH。考虑到体积和饱和电流,我们最终选取了一颗4.7μH、饱和电流超过300A的合金粉末磁环电感。
采样与驱动:电流采样采用0.5mΩ的锰铜采样电阻配合隔离差分运放,Vds采样通过高压差分探头芯片实现。温度传感器选用响应快的贴片NTC,安装在MOSFET的封装中心正下方。
结构散热设计:采用ASAAC标准板卡结构,MOSFET通过导热硅脂安装在厚重的铝合金散热基板上。基板背面设计有齿状散热鳍片,用于强制风冷。三维模型导入热仿真软件,为后续分析做准备。
4.2 热仿真与模型校准
在仿真软件中,设置环境温度为55°C(常见高温工作条件)。对短路限流工况进行瞬态热仿真:
- 边界条件:MOSFET施加瞬态功耗脉冲。根据电路仿真,在5倍限流(100A)且MOSFET工作在线性区时,
Vds约30V,瞬时功耗PD高达3000W。但这是峰值,由于PWM限流,平均功耗会低很多。我们假设一个最恶劣的持续功耗场景,例如200W。 - 仿真结果:经过2秒的持续发热,仿真显示MOSFET芯片最高结温达到136.1°C,而其外壳上我们安装传感器的位置温度为117.9°C。这就得到了一个关键数据点:在200W功耗、55°C环境温度下,结壳温差约为18.2°C。通过改变功耗进行多次仿真,我们可以拟合出
ΔT_jc与PD的关系曲线。
4.3 控制算法在FPGA中的实现
FPGA内部实现以下核心功能:
- 高速ADC接口:并行采集多路电流、电压、温度信号。
- 故障检测状态机:根据
di/dt和I_peak快速判断故障类型(短路、过载、容性冲击)。 - 热模型计算单元:这是一个硬件逻辑实现的查找表或多项式计算器。输入是
T_case和实时计算的PD,输出是T_j_est。为了简化实时计算,我们提前将仿真和标定得到的热模型离散化为一个二维查找表。 - 多模态PWM发生器:根据状态机的输出,产生对应模式的PWM信号(固定占空比、可变占空比、软启动波形)。
- 热保护仲裁器:持续比较
T_j_est与阈值T_trip。一旦超标,立即产生最高优先级的关断信号,覆盖其他任何控制状态。
4.4 原型测试与结果分析
搭建测试平台:使用270V直流电源,SSPC输出接一个13.5Ω的阻性负载(模拟20A额定工作),并在负载两端并联一个大功率接触器来模拟短路。
测试过程:
- SSPC正常带载20A运行。
- 触发接触器,造成负载短路。
- 示波器捕捉电流波形,红外热像仪监测MOSFET表面温度。
测试结果:
- 电流波形:短路发生后,电流迅速上升,但在达到100A(5倍额定)时被成功钳位,波形呈锯齿状,显示PWM限流正常工作。
- 温度与保护时间:我们设定外壳温度保护点为120°C。测试中,当红外热像仪显示MOSFET表面热点温度达到118.5°C时,SSPC执行最终关断。从短路开始到关断的总时间为1974ms。
- 与仿真对比:仿真预测在类似条件下,外壳温度约117.9°C时关断。实测118.5°C,误差在0.6°C以内。误差主要来源于:导热硅脂层厚度不均带来的接触热阻误差、传感器安装位置与仿真监测点的微小偏差、以及环境空气流动的不确定性。
关键结论:测试成功验证了控制策略的有效性。SSPC在短路后没有像传统方案那样要么立即关断(可能误动),要么死守固定时间直到烧毁,而是根据MOSFET的实际热状态,“坚持”了尽可能长的时间(近2秒)后安全关断。这为系统识别是否为瞬时故障、或等待上级备份保护动作提供了宝贵的时间窗口。
5. 工程实践中的要点与避坑指南
将热管理限流策略从论文落地到产品,中间有很多细节决定成败。这里分享一些实战中积累的经验和容易踩的坑。
5.1 热模型精度是生命线
“垃圾进,垃圾出”:如果热模型不准,整个保护策略就失去了意义。
- 材料参数要实测:不要完全依赖芯片数据手册的
RθJC,那个值是在理想测试条件下得出的。你的PCB铜厚、导热硅脂的导热系数、散热器接触面平整度,都会极大影响实际热阻。最好能对首批样品进行热标定:给MOSFET施加一个已知的直流功耗PD,等待热稳态后,同时用红外热像仪(看外壳)和电学法(如利用MOSFET体二极管作为温度传感器)估算结温,反向推算出实际的热阻。 - 关注瞬态热阻抗:短路过程是瞬态的,器件能否承受,更多取决于瞬态热阻抗
ZθJC(t)。这个曲线通常也在数据手册中。你的限流保护时间必须落在瞬态热阻抗允许的“能量脉冲”范围内。我们的热模型最好能兼容瞬态计算,或者至少用最恶劣的稳态模型留出足够裕量。
5.2 传感器选型与安装是瓶颈
测不准,一切都白搭。
- 响应速度:NTC热敏电阻响应较慢(时间常数可能上百毫秒),对于毫秒级的快速温升可能滞后。热电偶或高速数字温度传感器(如TMP117)是更好选择,但成本更高。
- 安装位置:传感器必须安装在热流路径上且最接近芯片热源的位置。通常推荐安装在MOSFET封装底部、散热器安装孔附近。用高性能导热胶固定,确保良好热接触。绝对避免只将传感器随意贴在散热器鳍片上。
- 电气隔离:如果温度传感器是非隔离的,需要做好隔离放大或采用隔离通信接口(如I2C隔离器),防止功率地的噪声干扰。
5.3 控制环路稳定性与噪声
硬件PWM限流环是双刃剑。
- 振荡风险:电流采样、比较器、PWM驱动构成一个模拟闭环。如果环路相位裕度不足,容易在限流点附近产生振荡,导致电流波形不稳,加剧开关损耗和热应力。需要在比较器后端加入适当的迟滞,或者用RC电路做一点延时滤波。
- 噪声免疫:短路瞬间的
di/dt和dv/dt极大,会产生严重的电磁干扰。采样电路必须做好屏蔽和滤波。电流采样信号线要使用双绞线或同轴线,远离功率走线。电源和地平面要干净。
5.4 软件算法的鲁棒性
FPGA/单片机里的算法要足够“聪明”和“健壮”。
- 热模型计算的实时性:复杂的浮点运算在低端MCU上可能耗时过长。考虑将热模型简化为分段线性插值查找表,或者用定点数运算。确保计算周期远小于温升时间常数。
- 故障判别逻辑:短路、容性负载启动、电机堵转都可能产生大电流。需要结合
di/dt、dVds/dt、电流绝对值以及负载历史状态进行综合判断,避免误触发限流或误关断。例如,容性负载启动电流大但dVds/dt为负(电压在建立),而短路时dVds/dt可能为正(电压被拉低)。 - 状态恢复机制:触发限流或过热保护后,不能简单地锁死。需要设计自动重试或故障锁存逻辑。例如,首次过热保护后,延迟一段时间(让器件冷却),再自动尝试闭合一次。如果再次快速触发,则判定为永久故障,锁存并上报。
6. 拓展与展望:不止于保护
基于热管理的限流保护策略,其价值远不止于“防止烧管子”。它为我们打开了一扇通往更智能、更可靠的功率电子系统的大门。
1. 寿命预测与健康管理实时结温数据是评估器件寿命的关键。通过记录MOSFET在工作中的温度波动(ΔTj)和平均结温,可以利用Coffin-Manson等寿命模型估算其剩余寿命。这对于实现预测性维护、提前更换老化器件至关重要,特别适用于航空航天、轨道交通等对可靠性要求极高的领域。
2. 功率循环能力优化在许多应用中,负载是周期性变化的。知道了器件的实时热状态,就可以动态调整其功率输出上限。例如,在结温较低时,允许短时超载运行;在结温升高时,主动降额运行。这能在不增加硬件成本的前提下,最大化系统的瞬态功率输出能力。
3. 与系统级热管理的联动单个SSPC的热数据可以上传到系统主控制器。主控制器可以综合所有节点的热信息,进行全局的热均衡调度。例如,关闭某些非关键负载,为关键负载的SSPC提供更好的散热条件,或者调整风扇转速,实现系统级的最优热管理和能效控制。
回到我们最初的原点,功率器件怕热,我们就盯着它的“体温”来做决策。这套方法听起来不复杂,但需要跨领域的知识融合:电力电子、热设计、控制理论、嵌入式软件。它要求工程师不能只盯着电路图,还要懂材料热特性,会建模仿真,能写底层驱动和算法。在实际项目中,最大的挑战往往不是原理,而是如何在不理想的现实条件下(如参数漂移、传感器误差、环境突变)让这套系统稳定可靠地工作。这需要大量的测试、迭代和对细节的偏执。但当你看到自己设计的SSPC在严酷的短路测试中一次次安然无恙,那种成就感,就是对我们这份工作的最好回报。