MELTAC平台PIF卡串码问题的分析及对策

(整期优先)网络出版时间:2022-03-31
/ 2

MELTAC平台 PIF卡串码问题的分析及对策

姚兴瑞

辽宁红沿河核电有限公司 大连 116001

摘要: 2014年-2017年,某电站发生多起DCS(MELTAC平台)PIF优选卡串码故障,及PIF卡机笼串码故障。PIF卡是DCS(集散控制系统)平台优选卡件,为日本三菱机电制造。DCS平台通过PIF卡驱动专设安全设施动作来实现反应堆保护功能。当PIF卡发生地址冲突时,一方面会导致所驱动设备拒动或误动,严重影响反应堆保护系统可用性,对安全产生重大影响。另一方面可能触发机组后撤的运行规程,导致机组被迫后撤,影响发电机组的稳定性。本文结合PIF卡机理,对该问题进行根本原因分析并制定了有效解决手段,对同类问题的处理有较好的参考意义。

关键词: DCS PIF卡 专设设备 FPGA地址锁存 RM16银离子迁移

  1. 引言

2014年-2017年,某电站发生多起DCS PIF优选卡串码故障,及PIF卡机笼串码故障。PIF卡是DCS(集散控制系统)平台优选卡件,为日本三菱机电制造。DCS平台通过PIF卡驱动专设安全设施动作来实现反应堆保护功能。当PIF卡发生地址冲突时,一方面会导致所驱动设备拒动或误动,严重影响反应堆保护系统可用性,对安全产生重大影响。另一方面可能导致机组被迫后撤,影响机组安全稳定运行。

  1. PIF卡功能简述

PIF卡布置在逻辑处理机柜内,其主要功能是对来自软件信号、BUP、ECP和DAC控制信号进行优选,在多个信号同时触发的情况下,按照硬接线信号优先于软件信号、保护信号优先于控制信号的设计要求,保证设备能够按照预期的保护逻辑执行相应的保护功能。PIF卡包括四种型号,可用于两个输出(开优先或者关优先)或一个输出(开或关)的逻辑,针对不同的设备类型使用不同类型的PIF卡。


  1. PIF地址识别机理及串地址分析

每一个PIF卡根据其所在机笼中的卡位对应唯一的物理地址,该地址用4位二进制来表征。例如,卡槽2 (S3412)的地址为0100,卡槽A(S341A)的地址为0101。PIF卡在插入卡槽且通电的情况下,通过地址模块(RM16)自动识别卡件地址,并将地址报告给CPU。

62453882c5331_html_715194adf3290856.png

图1 PIF卡机笼PIF卡地址

CPU实时采集PIF卡地址信息,确保CPU的指令能够正确的执行。当PIF卡发生故障时,如地址模块RM16管脚发生短路,可能导致CPU无法准确识别PIF卡的状态,经过多次自检周期后,仍无法获得PIF卡状态,CPU将发出超时报警。

以图1为例,如S341A(A槽)的RM16模块的管脚发生短路,可能导致其对应地址错误的由0101识别为0100,而由于机笼里原本已有地址为0100的卡件,CPU执行周期扫描时无法判断真实的卡件状态,从而产生超时报警,同时,停止更新故障卡件对应的指令输出,导致卡件出现拒动。

正常情况下,CPU通过总线管理卡(Bus Master)与PIF卡进行通信,控制执行机构(泵、风机、阀门等)按照逻辑要求进行动作。RM16模块是PIF内部的地址识别模块,该模块共有10个管脚组成,其中:3、8、2、9管脚用于卡件地址判断;5、4、7管脚用于机笼地址识别;6为电源,1和6连通,0浮空。为提高导电性能,管脚均采用金属银制成。


经对故障PIF卡微观分析、切片分析、离子残留物分析、湿热老化试验分析等,发现发生故障的S3412和S341A的地址模块(RM16)的PIN3和PIN4之间存在黑色氧化物迁移的迹象。通过对黑色物质进行成分分析,确认其主要成分是银的氧化物。

进一步分析该故障模块,发现这是一种电化学迁移的现象——银离子迁移。由于PIN3和PIN4两个针脚间存在一定的电势差,在一定的外部环境催化下,银离子从高电平的管脚逐渐向低电平的管脚进行迁移,迁移后在管脚间逐渐形成树枝状的桥接,造成针脚间的短路。由于这个短路现象,S341A的地址被错误的识别为S3412,从而导致地址冲突报警。之后对卡件上所有的RM模块进行检查发现,在涂有三防漆的模块上未发现类似的迁移现象,而部分未覆盖三防漆的RM模块则较多的发现了树枝状的迁移轨迹。


通过以上分析,基本清楚了PIF卡地址串码的发生机理:由于RM管脚的材质采用了较为活泼的金属银,在环境的作用下,发生了银离子迁移的现象,CPU扫描到错误地址的卡件后,无法识别卡件状态,从而产生了超时报警。

  1. 根本解决措施的制定和实施

清楚了PIF卡串码故障的机理,笔者提出从两个方面改善PIF卡的性能,提升卡件的可靠性。

硬件方面,通过对RM模块表面涂覆三防漆,实现防潮、防盐雾、防霉的作用,从而有效的隔绝外部环境对于金属银的影响,有效减缓银离子的迁移现象。此外,由于现场适用的卡件已经长期暴露于环境当中,部分管脚虽然暂时未发生短路现象,但也存在明显的银离子迁移轨迹,这将成为卡件长期安全可靠运行的隐患。为了解决这一问题,在涂覆三防漆之前,增加了对RM模块进行酒精清洗的步骤,通过在实验室环境下的酒精清洗和显微镜检查,发现清洗后可以有效去除已经发生的迁移现象。清洗完成后,再对RM模块涂覆三防漆,可以长期的防止银离子迁移现象的发生,使迁移问题得以解决。

软件方面,由于PIF卡在安装到机笼里后,正常情况下,其所在位置固定,不会发生变化。CPU实时扫描卡件位置的机制所带来的收益不大,并且导致了一个RM模块问题引起整个卡件功能异常的后果。为避免此种情况的影响,现场通过升级FPGA芯片增加锁存PIF卡地址的功能。当卡件放入机笼后,第一次通电工作时,RM16模块读取所在卡件位置,并将位置信息反馈FPGA,FPGA采集到地址信息后将此信息锁存在芯片上,之后CPU每次读取卡件地址只要读取FPGA锁存的地址即可,这个地址直到下次卡件下电前不再发生变化。同时,为了进行故障探测,FPGA也会实时采集RM模块的地址信息,与之前锁存的信息进行比较,如果地址相同,则说明RM模块工作正常;如果地址不同,则说明RM模块发生了故障,此时FPGA将故障信息反馈给CPU并产生报警信息。但由于FPGA内已经锁存了初始上电的卡件地址,实际CPU与PIF卡通信仍能正常进行,这样就能保证PIF卡正常执行其安全功能的前提下,实现故障检测,为后续的维修留出充足的窗口和时间。

  1. PIF卡方案实施后的效果

通过实施PIF卡硬件和软件的升级工作,巧妙的解决了银离子迁移和PIF卡地址串码的问题,通过升级后对系统运行情况的持续跟踪,卡件升级后的三年内故障现象基本消失,系统可靠性得到大幅度提升,同时,也大大减轻了维修人员的负担,降低了系统运维的成本,使电站在安全性和经济性方面获得较大的收益。

  1. 结语

本次PIF卡的根本原因定位及科学正确的改进策略,从根本上解决了PIF卡及机笼串码的故障,防止设备拒动/误动,极大增加了DCS的可靠性,从而保证了机组安全稳定运行,守护了机组安全,同时该策略为国内首创,为能源工业或IT行业在处理卡件串址或CPU寻址方面提供了解决问题的思路和参考。