1.4 电子微组装可靠性设计方法
电子微组装可靠性设计,应在产品性能功能设计的同时,考虑如何有效控制其固有的退化和失效风险,满足这一要求的设计策略,是采用基于失效物理(PoF)的可靠性设计方法。
1.4.1 失效物理(PoF)方法的发展
自美国空军的罗姆航空发展中心(RADC)1962年组织一系列失效物理(PoF)研讨会并正式确定失效概念以来,PoF方法及其应用研究已有50多年,目前PoF作为一个可靠产品的开发方法已在行业和许多国家及地区得到广泛认可,特别是航天、航空等领域对高可靠电子产品的需求,是PoF方法工程应用的最大推动力。
从应用的角度,PoF发展所奠定的技术基础经历了以下三个主要阶段。
(1)1962—1966年,RADC发起并组织失效物理年度研讨会,学者提出研究失效物理以根除失效的概念。例如,在RADC(1961年)提出失效物理项目以解决军用设备复杂度增加带来的更高失效问题的推动下,大量关于机械、电子产品的失效机理及退化模型研究成果发表:1962年贝尔实验室基于Arrhenius模型研究发表了“高应力老化导致半导体器件失效”论文;1963年Tambrrino提出元器件工艺过程发生任何变化都可能引发新失效机理;1964年Ingram从概率的角度介绍了设备性能特征和失效机理;1965年Shiomi提出了一种通用累积退化模型及其在连续不同应力水平下元器件寿命的评估;1966年Gill和Wokman介绍了以高应力试验和失效分析确定失效机理为基础的可靠性筛选程序。
(2)1967—1999年,IEEE主办国际可靠性物理年会(IRPS),学者提出各种材料和元器件的失效物理模型,主张采用失效物理方法进行可靠性评估以弥补MIL-HDBK-21的局限性。例如,1970年Frankel和Kinsolving研究了基于实验室加速条件评价元器件在恶劣环境下的可靠性;1974年Black建立了电子迁移(EM)失效时间预计模型;1979年Crook建立了半导体器件与介质层时变击穿(TDDB)模型;1984年Hieber和Pape建立了基于蠕变破裂的在机械应力和温度条件下计算材料断裂的时间模型;1990年Pecht等提出采用失效物理方法进行可靠性评估;1991年Dasgupta和Pecht发表一系列论文讨论材料失效机理和应力损伤模型;1993年Engel发表了机械磨损机理的失效模型;1993年Cushing等比较了基于经验数据的可靠性预计方法(如MIL-HDBK-217)和PoF方法,并提出了采用PoF方法解决可靠性预计方法的局限性问题;1996年Mendel正式提出概率PoF(PPoF)并推导出考虑PoF的统计寿命模型;1999年Modarres等提出了基于PoF模型和失效应力不确定性的可靠性预测概率问题。
(3)2000—2016年,国际上多个行业标准组织发布各类失效物理模型以及失效物理可靠性预测方法,形成对传统手册可靠性预计方法的补充。尽管1992年、1996年IPC标准组织发布了IPC-SM-785和IPC-D-279标准,系统地介绍了PCB板SMT互联焊点的热疲劳、绝缘电阻退化等机理以及寿命评估模型,但关于电子器件及其封装的各种失效机理模型,是在2000年后,由JEDEC、IEEE、FIDES、NASI/VITA等行业标准组织陆续发布,包括半导体器件失效物理模型,以及板级、封装级到元器件级的失效物理可靠性评估方法。例如,JEP122H—2016半导体器件失效机理及模型,IEEE Std 1413.1TM—2002基于IEEE1413的可靠性预计方法选择和应用,FIDES guide 2009—2010电子系统可靠性方法,ANSI/VITA51.2—2016失效物理可靠性预计。
我国也十分重视对失效物理方法及应用的研究。如在1977年至2015年期间,编译、编写并出版了可靠性物理、失效分析技术、可靠性试验等多种专著,对促进我国失效物理的研究和应用起到了重要作用。目前,基于失效物理的可靠性技术应用研究,主要集中在新材料(如无铅焊料、高K电介质等)、高密度组装封装(如SiP、MCM等)产品的可靠性预测,以及恶劣环境下(空间、深海、核爆等)产品的失效预测,通过软件程序来运行基于预测目的的算法,并结合底层元器件的失效物理预测,实现系统级产品的可靠性定量设计。
1.4.2 基于PoF可靠性设计的基本原理
采用失效物理方法进行可靠性设计,目的是有效控制可能导致产品失效的机理,核心就是控制诱发失效机理的应力,使其不超过规定的应力阈值[42]。例如,为保证长期工作的半导体器件的可靠性,核心是控制Si器件PN结工作温度不超过规定的降额结温,使器件退化速率满足可靠性指标要求,而控制PN结温的方法,可以通过芯片结构设计、封装材料选择、使用环境控制等设计手段实现;同样,为保证短期工作的半导体器件极限性能,核心是控制Si器件的PN结工作温度不超过175℃。
因此,基于失效物理可靠性设计的基本原理,是通过控制诱发主要失效机理的应力水平(Fr),使其不超过可靠性要求规定的应力阈值(Sr),实现主要失效机理的有效控制。当产品长期工作时,规定应力阈值(Sr)的获取,需要根据可靠性指标要求(失效率或寿命),由相关失效机理的“寿命—应力”失效物理模型计算获得;当产品短期工作时,规定应力阈值(Sr)根据最大额定值获得。
对包含n个微组装部位的产品,根据式(1-10),基于失效物理可靠性设计的基本原理,可表示为:
[Fr(i,j)](m+1)×n<[Sr(i,j)](m+1)×n
当产品长期工作时,n个微组装部位失效机理的应力阈值:
当产品短期工作时,n个微组装部位失效机理的应力阈值:
[Sr(i,j)](m+1)×n=[FM(i,j)](m+1)×n
式中,Fr(i,j)是产品第j个微组装部位的第i类载荷应力响应值;Sr(i,j)是产品第j个微组装部位的第i类载荷应力阈值;[Fr(i,j)](m+1)×n是产品(m+1)×n个载荷应力响应值矩阵(应力类别i=1,2,…,m,1∩m,微组装部位j=1,2,…,n);[Sr(i,j)](m+1)×n是产品(m+1)×n个应力阈值矩阵;表示产品第j个微组装部位的第i类载荷应力在规定工作寿命ML或规定工作失效率条件下的最大允许值;tf(i,j)>ML表示第j个微组装部位在第i类应力作用下失效机理的退化时间tf(i,j)大于产品规定工作寿命ML;λ(i,j)<λMAX表示第j个微组装部位在第i类应力作用下失效机理的失效率λ(i,j)小于产品规定工作失效率λMAX;[FM(i,j)](m+1)×n是产品第j个微组装部位的第i类载荷应力的最大额定值。
围绕诱发失效机理应力(Fr)不得超过可靠性规定的应力阈值(Sr),这一基本原理,微组装可靠性设计的一项重要工作是提取应力响应(Fr)和计算应力阈值(Sr)。采取测试、仿真和计算等手段,提取薄弱环节的应力响应值。单一热源微组装产品的温度响应测定可参照GJB 548B—2005标准的方法1012“热性能”,多热源复杂结构微组装产品(HIC、MCM、SiP、微波组件等)内装元器件的温度响应测定或热性能评价,可参考《电子微组装可靠性设计(应用篇)》;微结构振动模态特性的仿真和测试,可参考《电子微组装可靠性设计(应用篇)》;气密封装微组装产品内部水汽含量的测量,可参照GJB 548B—2005标准的“方法1018.1内部水汽含量”,外部水汽渗入时间的计算,可参考本书第8章;微组装产品内部电磁场的探测,可参考本书第9章。
通过所建立的失效物理模型,结合可靠性指标要求,计算微组装主要失效机理(薄弱环节)的各类应力阈值(温度、机械、湿度、振动加速度等),同时采取测试、仿真等手段,提取薄弱环节的应力响应值,验证是否超出应力阈值,若超出阈值,则实施设计改进降低薄弱环节的应力水平,不断迭代分析验证,使薄弱环节的应力水平控制在阈值之下并保证足够裕量,由此薄弱环节失效机理的退化或过应力损伤得到控制。
1.4.3 基于PoF的可靠性设计解决方案及核心技术链
基于失效物理的可靠性设计核心技术链,包括潜在失效机理分析(薄弱环节分析)、可靠性设计指标分解、潜在失效机理评估、优化设计分析等技术。这些核心技术在微组装产品的整个设计链中起着重要作用,如图1-19所示。
基于失效物理的可靠性设计,关键是按导致失效的应力类型,分别进行潜在问题分析。应力类型包括:温度应力(恒定温度/温度循环/温度冲击)、机械应力(振动/机械冲击)、潮湿应力(相对湿度)、电磁应力(电场/磁场)、盐雾应力(盐雾比例)、辐射应力(辐照累积/单粒子效应)、低气压(海拔高度)、电应力(电流/电压)、多应力耦合(热电/热力/等),发现应力下潜在失效机理(薄弱环节),由此对产品进行可靠性设计指标分解,即分解针对为各应力下主要失效机理定量控制的可靠性设计指标,进而获得操作层面可实现的可靠性设计指标,同时为潜在失效评估奠定基础。
潜在失效机理分析(包括热失效机理、机械失效机理、潮湿失效机理等各类应力下的失效机理分析),目的是确定在各类应力下可能导致产品失效的主要失效机理和失效部位。对微组装产品而言,结合以往失效分析结果采用FTA方法进行潜在失效机理分析,是设计阶段发现底层薄弱环节及影响因素并建立失效机理信息库的一种有效方法。针对可能的主要失效模式,建立基于失效物理的微组装组件故障树,对故障树中的故障对象、失效模式、失效部位、失效机理、机理因子、影响因素等6层次失效物理过程事件进行分析,确定可能导致失效的潜在失效机理,提取诱发失效机理的机理因子(应力因子),通过机理因子分析和失效物理模型计算,进一步确定导致失效的应力阈值,以应力阈值为基准,针对与机理因子相关的外部影响因素进行控制和优化设计。基于失效物理的电子元器件故障树构建方法,见《电子微组装可靠性设计(应用篇)》第5章。
图1-19 基于失效物理的微组装可靠性设计核心技术链
可靠性设计指标分解,包括可靠性热设计、机械可靠性设计、耐潮湿设计等各类应力下可靠性设计指标的分解,是指将产品可靠性指标分解为产品可靠性设计指标,分解的目的是在设计层面给出具有针对性和可操作性的可靠性定量设计指标,形成产品可靠性设计指标体系。指标分解包括两类:一是针对产品长期工作可靠性要求,分解出在温度、机械、潮湿、电磁、盐雾、辐射、低气压、电载等各类应力下应控制的失效机理和各机理允许最短失效时间及最高允许失效率指标,必要时考虑这些应力耦合下的失效机理控制指标;二是针对产品短期工作极限性能要求,分解出在各类应力下所有薄弱环节或关键部位的最大额定应力指标,避免过应力损伤。由此,结合产品可靠性要求,形成可靠性设计指标体系。
潜在失效评估,包括潜在的热失效机理、机械失效机理、潮湿失效机理等各类应力下主要失效机理的失效时间、失效率及微区应力水平的评估,评估的目的是判断潜在失效机理是否存在导致产品失效的风险。采用特性仿真、失效物理模型计算、物理特性测试等技术,对潜在失效机理进行量化评估,获取薄弱环节失效机理的失效时间、失效率及微区应力响应值,对比评估结果与可靠性设计指标要求,判断失效风险。
优化设计分析,包括微组装结构/材料优化设计分析、内装元器件优选分析,以及微组装制造工艺参数优化、关键工艺参数离散性控制分析,设计分析的目的是依据潜在失效评估结果,结合微组装结构、材料和内装元器件的可选择性,以及制造工艺的可实现性,借鉴以往设计案例,权衡确定优化设计方案。
基于失效物理的可靠性设计方法流程,见本书第5章。
1.4.4 失效物理模型的应用
失效物理模型,是基于失效物理可靠性设计的重要基础。本书第5章、第6章、第7章、第8章、第9章、第10章,分别给出微组装产品在四类典型应力下的失效物理模型和应力响应模型,以及基于失效物理的失效控制与可靠性设计方法。针对微组装可靠性设计的应用,需要了解这些失效物理模型的基本概念及应用特点。
1)温度应力失效物理模型
(1)高温过应力失效模型:TJ≥TJM,表示当微组装产品短期工作时,内装元器件工作温度TJ超过最高允许温度上限TJM(短期工作温度阈值),即认为发生高温过应力失效。可用于评估微组装产品短期工作状态下,内装元器件是否存在高温过应力失效的风险。重点关注半导体芯片的高温过应力失效。
(2)稳态温度退化模型(Arrhenius模型):,描述微组装产品长期工作时,内装元器件工作温度TJ在规定的降额温度TJD(长期工作温度阈值)之下,元器件逐渐退化最终失效的退化寿命与稳态温度之间的关系。可用于计算确定在规定寿命或失效率指标要求下,内装元器件可承受的降额温度阈值,评估微组装产品长期工作下是否存在过早退化失效的风险。重点关注半导体芯片、有机黏结胶、内引线键合界面、芯片倒装焊界面的稳态温度退化。
(3)温度冲击过应力失效模型:P<F,表示当微组装产品在快速温变环境(ΔT≥30℃/min)下短期工作时,微互连或组装结构耐受温变强度P小于规定的温变应力要求F时,即认为发生温度冲击过应力失效。可用于评估微组装产品在快速温变环境下短期工作,是否存在温度冲击过应力失效的风险。重点关注陶瓷基板、大尺寸芯片和大尺寸MLCC、金属气密封装玻璃绝缘子的温度冲击过应力失效。
(4)温度循环热疲劳损伤模型(Conffin-Manson模型):,描述微组装产品在温度循环(1~2次循环/天,ΔT<20℃/min)条件下长期工作时,互连焊点等在热机械应力反复作用下,因塑变累积损伤导致开裂失效的低周疲劳寿命与温循应力之间的量化关系。可用于计算确定在规定寿命或失效率指标要求下,互连焊点可承受的温循应力阈值,评估微组装产品在温度循环条件下长期工作,是否存在热疲劳失效的风险。重点关注大尺寸倒装芯片凸点、大尺寸功率芯片焊料层、塑封器件键合丝、板级器件BGA等表贴焊点的温循热疲劳。
2)机械应力失效物理模型
(1)振动疲劳损伤模型(Basquin定律)[105]:Nf=Ccf(Δσ)-m,描述微组装产品在振动应力条件下长期工作时,互连焊点、金属气密封装结构等在机械应力反复作用下,因疲劳累积损伤导致开裂失效的高周疲劳寿命与振动应力之间的量化关系。可用于计算在规定寿命或失效率指标要求下的互连焊点、金属气密封装结构可承受的振动应力阈值,评估微组装产品在振动条件下长期工作,是否存在振动疲劳失效的风险。重点关注板级大尺寸器件BGA焊点、大尺寸金属气密封装盖板焊缝的振动疲劳。
(2)谐振损伤模型:fn=f,当微组装产品在振动环境下工作时,若微组装结构固有频率fn等于振动激励频率f,即认为发生谐振损伤失效。可用于评估微组装产品在振动环境下工作,存在谐振损伤的风险。重点关注大尺寸板级表贴器件焊点、大尺寸金属气密封装盖板焊缝、真空器件电子枪精细结果的谐振损伤。
3)潮湿应力失效物理模型
(1)湿度-温度腐蚀失效模型(Peck模型等):,表示当微组装产品在潮湿环境下工作,金属封装外壳、内部芯片在潮湿应力的长期作用下,因电化学反应导致失效的腐蚀寿命与湿度、温度之间的量化关系。可用于计算确定在规定寿命或失效率指标要求下,器件可承受的温度及湿度应力阈值,评估微组装产品在潮湿环境下工作发生腐蚀的风险,重点关注金属封装外壳、塑封器件芯片等腐蚀问题,以及金属气密封装水汽渗漏问题。
(2)导电阳极丝(CAF)失效模型:tf=[af(1000Leff)n]/[Vm(Q-Qt)],描述多层基板在潮湿环境下工作,层间布线在潮湿和电压应力的长期作用下,因层间金属离子迁移导致失效的时间与水汽含量、多层板结构之间的量化关系。可用于计算确定在规定寿命或失效率指标要求下,多层板可承受的水汽含量阈值,评估多层板在潮湿环境下工作发生CAF的风险。