首页 理论教育 单粒子效应对SOC系统的影响

单粒子效应对SOC系统的影响

时间:2023-06-25 理论教育 版权反馈
【摘要】:SOC可显著提高电子系统集成度和性能,减小系统的重量和体积,降低系统的功耗。利用241Am源发出的能量为5.486 MeV的α粒子辐照器件,结果表明,由单粒子翻转导致的数据错误和单粒子功能中断是SOC单粒子效应主要的错误类型,占总错误数的90.74%,严重影响了系统可靠性。表5-8Xilinx Zynq-7000 SOC单粒子效应试验结果利用SOC软件故障注入系统,开展了Zynq-7000 SOC寄存器、存储器和DMA控制器的故障注入试验。

单粒子效应对SOC系统的影响

(一)航天器常用SOC系统及典型结构

系统级芯片(System-on-Chip,SOC)是在一个芯片上集成CPU、DSP、存储器、模拟电路和各类I/O,以实现一个完整系统功能的芯片。SOC可显著提高电子系统集成度和性能,减小系统的重量和体积,降低系统的功耗。因此,使用SOC是满足航天电子产品集成化、小型化、高性能、低功耗要求的重要措施。国外开展SOC辐射效应和抗辐射加固技术的研究较早,20世纪90年代,就已经开展了相关研究,已有针对不同的SOC架构和基于不同微处理器的SOC辐射效应研究的相关报道。例如,NASA研制了RAD6000和RAD750抗辐射加固芯片,Boeing公司研制了49核抗辐射加固处理器Maestro,以及Aeroflex Gaisler公司研制了UT699、P2020和P5020 SOC芯片,并且分别开展了重离子单粒子效应试验,获得了L1 Cache和L2 Cache的单粒子效应截面随LET值变化的关系曲线。2010年,美国NEPP(NASA Electronic Parts and Packaging)已经提出了SOC测试方法、SOC辐射效应和SOC抗辐射加固技术的主要任务和目的。

北京微电子技术研究所研发的飞行器测控SOC,采用三模冗余、EDAC等多层次容错机制来提高SOC的可靠性。同时,对SOC进行抗辐射加固设计,抗总剂量效果在300 krad(Si)以上,错误翻转率能达到10-5 error/(bit·day)。

Xilinx Zynq-7000 SOC是基于Xilinx全可编程的可扩展处理平台结构,该结构在单个芯片内集成了32位ARM Cortex-A9双核处理器系统(Processing System,PS)和Xilinx可编程逻辑系统(Programmable Logic,PL)。该芯片基于最新的高性能、低功耗、28 nm高K金属栅极工艺,采用软件(C语言)和硬件(Verilog HDL)相结合的全可编程方法。处理器系统(PS)包括应用处理单元、存储器接口、I/O外设和复杂互连结构。可编程逻辑系统(PL)采用Xilinx Artix-7 FPGA,包括可编程逻辑块(Configurable Logic Block,CLB)、36 Kbit BRAM、数字信号处理DSP48E1切片、时钟管理、可配置I/O、模拟/数字转换器(XADC)等。Xilinx Zynq-7000 SOC框架结构如图5-14所示。

图5-14 Xilinx Zynq-7000 SOC框架结构

(二)SOC系统单粒子效应故障表现形式

大规模片上系统SOC作为可编程计算载荷的处理器及数据加速处理单元的实现平台,其芯片内部的片上存储器、硬IP外设的配置寄存器以及双核ARM处理器和FPGA的存储单元对单粒子翻转敏感,容易发生瞬态且可恢复的软错误,体现在软件上会导致软件的运行发生控制流错误和数据流错误,使软件的运行轨迹发生混乱或产生错误的计算结果。具体单粒子效应故障表现形式如下:

(1)数据错误。由SEU造成的数据计算结果出错或者内存数据出错。

(2)功能中断。测试程序出现中断,经软复位后,程序恢复正常。

(3)运行超时。测试程序运行时间,超过程序正常运行所需要的时间。

(4)系统停止。辐射造成系统崩溃,程序中止,软复位无效,需要断电重启。

(三)SOC系统单粒子软错误故障模式

28 nm Xilinx Zynq-7000 SOC单粒子效应故障具有典型的代表性。利用241Am源发出的能量为5.486 MeV的α粒子辐照器件,结果表明,由单粒子翻转导致的数据错误和单粒子功能中断是SOC单粒子效应主要的错误类型,占总错误数的90.74%,严重影响了系统可靠性。因此,对于纳米级SOC,由于CMOS工艺尺寸的减小、集成度及结构复杂度的增加,所导致的翻转错误和功能中断将越来越多,产生的机理也更加复杂。(www.xing528.com)

对于SOC,如何防护单粒子功能中断将成为一个严峻的问题。试验结果也表明,对于28 nm Xilinx Zynq-7000 SOC而言,PL、直接内存访问控制器(Direct Memory Access,DMA)和高速数据缓存(D-Cache)出现的错误较多,并且错误类型丰富,说明这几个模块对单粒子效应比较敏感,在试验过程中,未检测到电流增大的现象。单粒子效应试验结果如表5-8所示。

表5-8 Xilinx Zynq-7000 SOC单粒子效应试验结果

利用SOC软件故障注入系统,开展了Zynq-7000 SOC寄存器、存储器和DMA控制器的故障注入试验。注入结果表明:①寄存器:不同的测试程序,敏感寄存器不同,敏感寄存器与测试程序的功能紧密相关;在多种测试程序下,R15和R11寄存器都非常敏感,故障率超过了80%;不同的寄存器注入故障后,导致系统的错误类型不同,这与寄存器自身的作用相关。②存储器:不同的存储区域,系统的错误类型不同,其中,代码存储区更容易出现系统控制运行异常,例如,程序中止和运行超时,而数据存储区更容易导致数据错误,导致运行结果的不一致。③DMA控制器:确定了源地址寄存器、目的地址寄存器和控制寄存器为DMA的敏感寄存器,其中,源地址寄存器和目的地址寄存器非常敏感,导致系统出错率达到90%以上,并且源地址寄存器和控制寄存器主要导致数据错误,而目的地址寄存器还可以导致程序中止和运行超时等错误。

Xilinx的Zynq® UltraScale+™ MPSOC是一款基于16 nm FinFET工艺的SOC器件,包含主频为1.5 GHz的四核ARM® Cortex-A53处理器、双核Cortex-R5实时处理器、Mali-400 MP2图形处理器和可编程逻辑器件。可编程逻辑资源包括:可配置逻辑块(CLB)和触发器(FF)。此外还有专用乘法器(Dedicated Multipliers)、双口块存储器(BRAM)、可编程I/O、时钟管理电路和扩展路径资源等。

加拿大MDA公司开展了该器件的高能质子辐照试验,质子能量范围为65~520 MeV,最大LET值约为10 MeV·cm2/mg,将该器件的质子试验结果与其他Xilinx产品的质子辐照试验结果进行了对比。其他Xilinx产品工艺结构特征如表5-9所示,器件功能模块质子单粒子翻转截面如表5-9所示。

表5-9 Xilinx SOC单粒子效应试验结果

从表中可以看出,随着器件特征尺寸的减小,其功能模块的质子单粒子翻转截面呈下降趋势,尤其是这款16 nm FinFET工艺的SOC系统,其存储单元翻转截面下降了近一个数量级

(四)SOC系统单粒子硬错误故障模式

SOC系统的SEL效应研究工作相对较少,在前述α粒子辐照Xilinx Zynq-7000 SOC试验中,并未观察到SEL现象;而Zynq® UltraScale+™ MPSOC质子辐照条件下,也未观测到SEL现象。SOC系统抗单粒子闩锁特征还有待进一步研究。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈