梅钢热轧机房改造

(整期优先)网络出版时间:2021-04-18
/ 2

梅钢热轧 机房改造

程林 盛磊

上海梅山钢铁股份有限公司 设备部 江苏南京 210039


摘要:随着梅钢智慧制造的不断深入,智能化和集中运维项目的不断推进,尤其是热轧多个区域机房的搬迁和集中运维,这就要求集中运维后的机房保持高度的稳定性。梅钢热轧拥有1422轧线和1780轧线两条生产轧线及机房,本文阐述的是两个轧线机房合并改造的一些经验,对机房的改造与管理有一定参考价值。


关键词:机房改造;


  1. 机房改造前的问题与必要性

1422原有机房已投用多年,经过多次局部改造以及服务器等设备的增加,机房空间日益紧张,空间布置不合理。随着机柜和服务器等设备增加后,无序布线,导致机柜内和地板下线缆凌乱,存在安全隐患和线缆维护困难。

1780机房自2012年投用以来,服务器等设备的增加,也增加了UPS系统的负荷,原有UPS只有30KV的功率,且单控制器,一旦发生控制器电路板故障,导致UPS供电停止,将会发生轧线生产停止等严重生产事故。

1780机房的空调冷量不足且分布不均衡,现有服务器的功率都较大,导致热量负荷增加较多,空调设备布置不合理,一旦空调故障,极易出现局部过热现象,严重时发生服务器过热而断电故障。


自动化作业区原仅负责1422轧线二级过程控制系统,1780轧线建成投产后,同步增加了对1780轧线相关二级系统工作。由于人员较少,全部人员集中在1780轧线办公,对1422中心机房采用视频监控与每日现场点检相结合的管理模式进行运维管理。所需维护的核心设备分散,间隔路程较远,发生故障,由于路程延长了故障处理时间,造成不必要的停产时间失与设备损坏。通过对1422和1780区域机房进行合并与改造,可以有效提高故障处理响应速度,降低管理人员劳动强度。


  1. 机房改造的分析设计和改造原则

针对计算机机房存在的问题及缺陷,以及机房在前期运维中出现的各类故障,在机房改造的可研时,分别从机房装修、配电、空调、新风、综合布线、环境监控等系统进行分析,提出相应解决方案,从安全性、可靠性、可管理性、可拓展性、实用性和先进性五个维度进行探讨验证。

机房改造首先要把安全可靠性放在首要位置上,保证各个环节都安全可靠,特别是机房的场地环境、用电安全、防雷、防火和防水、静电防护等在遭受灾害时的应急措施等方面内容。

作为核心的过程控制系统的机房,机房改造后需要拥有足够的电源和空调设备,输入电源的供给需不间断并有备份冗余,双回路的供给。机房空调的配置需要考虑空调负荷与运行情况相调节,也需要考虑电源供给的稳定性和备用性。

机房过程控制系统的复杂性,在机房的改造建设中,需要建立一套全面、完善的机房管理和监控系统。其基本设施应智能化,实现集中管理监控,实时监控、监测整个机房的运行状况。通过监控管理和运维点检相结合的管理模式,应做到故障快速发现并快速处理,提高系统运行性能。

机房就必须具有良好的灵活性与可扩展性,不仅需要能支持现有的设备系统,还应在空间布局、系统电网容量、网络设备端口等方面留有充分的扩展余地,便于将来进一步开发以及适应未来系统更新换代。

在机房改造前,对整个改造项目进行计划估价,在保持最高性价比的前提下对机房进行改造,高效能的充分利用现有机房设备。在充分考虑机房系统功能完善的基础上,使其实用性达到最优。



3、机房改造

3.1装修改造

1422机房安装防静电地板由于使用多年,地板龙骨支架有部分损坏,多年前的布线都是从地板下布线,纵横很多电缆和光纤网线等线路,存在一定的安全隐患。1422机房和1780机房集中运维并重新装修后,地面采用大理石铺地,在铺设槽钢支架后放置服务器机柜,机柜位置布局合理,计算机的接口设备从槽钢支架下进行布线,机房顶部采用无边防静电地板,并配备相应的地板出风口。在顶部位置,配备专业走线桥架,分别配置强电和弱电走线桥架,避免了火灾隐患和线路干扰等隐患。两条轧线机房合并改造后,虽空间有限,但设备布局合理,使得改造后机房整洁、大方。


3.2 UPS及配电改造

原有1780的机房的UPS系统只有单电源输入,供电功率不足,无法满足两条轧线的服务器及网络等设备电源供给,两条轧线检修和断电维护时间存在不同步问题,系统的核心服务器不能停电,其配电系统的改造更加重要。

针对早期机房UPS及配电系统的诸多不稳定性,在这次机房改造的时候对这些问题做了相对应性处理。改造后的UPS电源采用精密配电柜统一分配供电电源,输入电源分别取自两个不同的高配变压器接入点,每路输入输出均带监控功能,实时监测电流、电压、功率等参数,能够有效对供电隐患做出预警。对原有UPS系进行扩容,新增相同规格的UPS并入原有UPS系统,实现在线扩容,并相应增加蓄电池接入新UPS系统中,并做好抗震承重措施。

  • 考虑到单控制柜供电系统可靠性较差的状况,新升级的UPS系统升级采用UPS控制柜的双机并行在线系统。

  • 需考虑在极限情况下,两路输入电源都发生供电中断的情况下,机房的服务器电池供电的时间能达到两个小时,确保在这个时间内,对服务器及网络设备进行对应应急处理;

  • 对于断电后易造成重大损失的机房设备,在考虑设置冗余UPS不间断电源外, 还接入了热轧区域的保安电源,当供电系统运转正常,保安电源处于待机状态,一旦两路输入电源都中断时,系统能快速切换到保安电源;输入电源恢复时,机组可切换并退出运行。

在整个施工过程不具备长时间停机安装与调试,利用检修时间完成原有部分设备的拆除,新增控制柜,采用UPS旁路带负载保证轧线正常生产,利用两条轧线同时停机的2天时间内,完成并机调试及切换工作。


3.3空调改造

对于原有机房,其空调考虑冗余不够,且随着机房内设备的增加,机房内的热负荷会越来越大,原有的空调设备已不能满足机房建设要求。

针对机房的热量大、发热源集中的特点,在改造时采用精密空调和工业水冷空调相结合的制冷方式,并相应调整机柜布局来改善机房内气流组织,保证机房内恒温恒湿的环境。,并根据实际温湿度状态的变化来调整空调的制冷方案。同时也做好空调输入电压被切断时的应急处理预案。


3.4综合布线系统改造

综合布线系统是机房网络的一个重要组成部分,支撑着整个网络的连接、互联和运行。机房经过多次布线,弱电线缆杂乱无章,部分布线缺乏标识,查线困难。利用机房改造的时机对综合布线也进行相应调整。改造将弱电线缆整洁、美观,每条网线均附上标签,彻底清除机房活动地板下强电、弱电线缆,改为上走线敷设。

经过以上步骤处理,强弱电系统实现标准化、模块化,具备灵活性精细化管理,机柜就比较整齐、 简洁。同时也方便机房管理人员查找线路, 且减少物理层面间的网络信号干扰。


3.5机房环境监测系统

由于机房管理具有一定复杂性,1422轧线机房虽和1780机房合并改造,但也保留一些网络设备。在机房的建设改造过程中,建立了一套全面、完善的机房管理和监控系统。采用机房主要入口视频监控,空调机漏水检测,UPS、温湿度检测等设备的智能接口,核心服务器硬件性能检测等参数实施监控。以上设备监控系统通过集中监控,实现统一、集中的管理。机房的消防系统要采用消防自动检测系统,接入公司消防系统,发生异常,能自动监测火情、自动报警功能,和公司环保部门每周有专人进行设备点检,在机房过道内,每隔10米左右,配置小型灭火箱,混合干冰灭火器和干粉灭火器,因机房环境问题,在机房内多数使用干粉灭火器,具体使用根据火警的具体情况而定。防雷系统也由公司专业辅助配置安装及管理。


结束语

在机房改造的过程中,通过制定详细改造方案、明确项目施工进度,严格监督管理,保障机房的系统安全及稳定。通过实施过程,积累了丰富的机房改造实施经验,但也遇到了一些突发性的故障待解决,比如忽略UPS配电柜原有上端额定电流和下端不匹配问题以及变电站故障导致UPS输入电路全部中断的极限情况。在改造中不断发现并解决问题,这样才能使得升级后的机房环境配置达到最优。


参考文献

  1. 庞峰.浅析计算机机房改造[J].建材发展导向  2013年第3期292-293

  2. 何铁军.浅谈网络平台数据中间机房改造的一般原则 2011(000)024