工控网首页
>

应用设计

>

电厂事故案例之DPU异常事件分析及处理

电厂事故案例之DPU异常事件分析及处理

2013/3/28 17:02:58

一、事件经过

2003102623:10 某电厂#2机组正常运行(当时负荷280MW),操作员站及大屏显示的运行参数突然变为坏点(粉红色),持续2分钟后仍未恢复,DCS系统网络通讯堵塞,系统处于瘫患状态,机组被迫手动停机。

热控人员立即到场检查发现:有8DPU(分散处理单元)自检状态显示处于离线脱状态,4对主/备用DPU均处于离线状态。检查离线状态DPU机柜,发现对应的DPU主机都在停机状态,进一步检查出现异常问题的DPU历史状态,发现第一出现异常问题的DPU5DPU,时间为23:06:50,错误信息为“Send Fail”“WSAEWOULDBLOCK”(传输故障), 23:07:10起,6DPU出现下网信息“Shutdown for I/O Driver Fail”(I/O驱动出错),并且在每1秒钟内该信息报文重复广播450余次,此后历史记忆显示其它DPU相应出现报警。热控人员通过手动复位脱网的DPU,相应DPU上网、显示、操作均恢复正常。

二、原因分析

根据报警历史的检查结果,6DPU23:07:10起,每秒钟都发出大量的“Shutdown for I/O Driver Fail”的系统报文,至23:09:25停止发送。这些大量的报警信息导致DCS系统网络异常,使得多个DPU离线。

按系统设计原理,“Shutdown for I/O Driver Fail”是在该DPU复位时,为记录复位原因而发出的一条系统报文。正常情况下,“Shutdown for I/O Driver Fail”的报警通告次数应该是一次的,出现该报文后DPU应自行复位。

从历史记录看,6DPU并未复位,并持续发出报警信息。DCS制造厂判断为WINDOWS NT操作系统方面的安全漏洞,使得在特定条件下会引发重复报警。

三、防范措施

1.针对可能发生的引发大量报警通告的极端工况,新华公司将#2机组的软件版本统一成R04SP3,取消了相应的报警通告,避免再次发生类似现象。

2.对于DCS系统和MIS的接口,新华公司建议在MIS侧的网关站上,加装病毒防火墙,并及时更新病毒库。同时及时更新操作系统的补丁。从而提高系统的安全性。

3.今后对于WINDOWS NT操作系统发布的关于安全性方面的补丁,新华公司在经过项目验证后,应及时配合电厂予以更新。

4.运行中出现任何异常,及时与热控专业人员联系。

5.进一步提高DCS系统的可靠性和稳定性,DCS系统日常维护中还应注意以下事项:

1)日常维护过程中,在不需要修改DPU组态的情况下,不应以ENG级别登录 DPU。以免造成过多的DPU变黄和拷贝的现象。

2)班组技术人员处理缺陷时,如果不需要连接DPU,尽量使用DPU组态软件离线的打开组态文本文件,来查找测点位置,而不要去连接DPU

3)对DCS系统所有的修改,无论是组态软件、系统软件还是文件属性等,都应在工程师站有详细的文字记录。

4)应定期检查MMI的硬盘,关闭不必要的共享功能。原则上MMI不应开放“完全控制”的共享功能,最多设置“只读”的共享功能。对于系统维护需要更新文件的“ENG”目录,即便开放“完全控制”的共享功能,用户级别也不能设置成“EVERYONE”,而应设置成“ADMINISTRATOR”或其他专用帐号。

5)对于一对冗余的DPU,尽量使用同一型号的硬件。

6)参照西门子等系统的维护要求,应利用停机时间逐个复位XDPS系统的DPUMMI。一般要求每隔半年要复位一次DPUMMI

7)对已投运的DCS系统不要任意增加功能和硬件,以免影响DPU的负荷率和稳定性。如确有增加的必要,也应经过仔细的论证及双方认可。

8DPUWATCHDOG跳线时间应设置成10秒。

投诉建议

提交

查看更多评论
其他资讯

查看更多

助力企业恢复“战斗状态”:MyMRO我的万物集·固安捷升级开工场景方案

车规MOSFET技术确保功率开关管的可靠性和强电流处理能力

未来十年, 化工企业应如何提高资源效率及减少运营中的碳足迹?

2023年制造业“开门红”,抢滩大湾区市场锁定DMP工博会

2023钢铁展洽会4月全新起航 将在日照触发更多商机