IDC机房维护制度
一、 概述
基础设施管理主要是对各类基础设施设备的巡检、监控、维护、操作,本体系制定了上述内容的具体方法及相关要求。本体系指定的目标是保障机房基础设施、设备正常、安全、可持续运行,规范日常运行管理工作,对保障机房正常使用环境的设备运行进行有效监控。本体系适用于基础设施各相关岗位。
二、 维护职能划分
日常巡检工作内容应由机房值班人员负责,巡检结束在系统中进行记录。
维护保养工作应由专业服务人员实施,维护保养结束后及时填写维护保养记录,并应由机房运维岗位负责人签字确认。
原则上UPS及精密空调的维护应由设备专业工程师实施。
三、 供配电系统
供配电系统是指通过电源由多种配电设备(或元件)和配电设施所组成直接向终端用户分配电能的一个电力网络系统。是对低压配电柜、UPS系统等的统称。
3.1 日常巡检内容
供配电系统日常巡检内容包括:
(1)环境温度、洁净度,注意有无异味、异常声响等; (2)查看各个开关的仪表显示应正常; (3)查看各开关状态确认无误; (4)检查各开关有无异常声响、变形;
3.2 巡视检查频次
每日一次。
3.3 维护保养
3.3.1 年维护
年维护属于预防性维护,应停电进行。
a)完成设备的季度维护工作。
b)清扫变配电设备内外卫生。
c)检查电器元件的操作机构是否灵活,不应有卡涩或操作力过大现象。
d)检查主要电器的主辅触头的通断是否可靠。
e)检查各母线的连接、绝缘支撑件、安装件、其它附件安装是否牢固可靠。
3.4 巡视检查注意事项
(1)巡检时必须严格遵守各项安全运行工作制度。
(2)巡检时应禁止带手表、手链等金属物件。
(3)巡检时应携带对讲设备以保持通讯畅通。
(4)巡检应二人进行,巡检完成后应向机房运维岗位负责人汇报巡检情况。
(5)巡检时必须严格执门禁管理方面的规定,只在授权区域内进行巡检。
(6)在巡检中发现设施或设备工作异常时,应立即向机房运维岗位负责人汇报并按照机房运维岗位负责人的安排进行处理,协助机房运维岗位负责人或相关人员填写相关报告。
四、 UPS系统
UPS(Uninterruptib1e Power Supply)意为“不间断供电电源’’,是一种含有储能装置(常见的是蓄电池),以逆变器为主要组成部分的恒压恒频的交流供电设备。
4.1 UPS的日常巡检
(1)检查卫生环境、温湿度状况;
(2)检查UPS运行状态,记录各种运行数据,包括电压、电流、频率、功率、带载率等;
(3)观察UPS风扇有无异响,运行是否正常;
(4)观察UPS主机内部有无异响、震动;
(5)观察UPS输入、输出柜各进出线开关状态(检查项同普通开关柜);
(6)观察电池外观有无明显鼓胀、渗液或开裂;
(7)日常巡检工作由值班人员进行,巡检状况因记录在《日常巡检记录表中》;
4.2 巡检频次 每日一次。
4.3 UPS设备维护保养
4.3.1 季度维护(主要进行放电测试)
a)除进行月维护的项目外,还应对UPS的电池进行放电。
b)电池组应放电至额定容量的60~70%,并记录放电后再次充满时的后备时间。
c)不可同时对相同负荷的两路UPS进行放电,且放电测试间隔应大于48小时。
d)对UPS设备进行整体除尘。
e)巡检工程师填写《UPS系统维护记录》。
4.3.2 年检维护(主要进行电气部件紧固操作)
a)除进行UPS季度检的项目之外,还应对整体UPS设备进行紧固操作。
b)联系UPS厂家对UPS的内部参数进行校对,对内部器件进行检查测试。
c)年检操作必须关机进行,关机后应对UPS内部进行放电操作。
d)由于旁路仍有部分带电,应对带电部分作出明显标记,以警示维护人员。
e)巡检负责人填写《UPS系统维护记录》。
五、 精密空调系统
机房精密空调是针对现代电子设备机房设计的专用空调,它的工作精度和可靠性较高。 5.1 日常巡检内容
(1)查看设备机房内的回风温、湿度;
(2)查看空调机有无异响;
5.2 日常巡检频次
每日一次。
5.3 维护保养
5.3.1 季度维护
a)进行日常维护的所有维护项目。
b)擦拭机组外壳。(不要用强腐蚀物或强化学物质,可用干净的纱布沾上中性洗涤剂擦拭)
c)检查室外风机有无抱死,破损,运转情况是否正常,并清除积灰(夏季每月1次,每周检查)。
d)清洗空气过滤网(空气过滤网不要等到报警后再更换,应根据机房中空气质量状况定期进行更换)。
e)对制冷管路上各接口进行检查,观察是否有油迹,螺纹接口如果有油迹可用板手进行紧固。
f)检查压缩机高低压参数,根据检查情况补充或释放制冷剂。
g)当有备用电源时,在使用前要检查电源相序是否与市电一致。
h)由设备专业工程师进行空调全面健康检查,并提交检查报告。
i)巡检工程师按规定填写《空调维护记录表》。
5.3.2 年度维护。
a)进行季度维护的所有维护项目。
b)对所有的电器接线端子进行检查,不应有松动。
c)检查高压控制器、高压压力开关的动作是否良好。
d)由巡检工程师按规定填写《空调维护记录表》。
六、 消防灭火系统
火灾自动报警系统是由触发器件、火灾报警装置、火灾警报装置以及具有其它辅助功能的装置组成的火灾报警系统。一般火灾自动报警系统和自动灭火系统、防排烟系统、通风系统、空调系统、防火门等相关设备联动,自动或手动发出指令、启动相应的装置。
6.1 巡视检查内容
6.1.1 消防灭火系统
(1)气体灭火系统需要进行每日巡查,查看是否有火灾报警、设备故障报警、未处理事件等非正常情况。
(2)消防设施需要进行每日巡查。
6.1.2 安全疏散设施
(1)检查时应保持疏散通道、安全出口畅通,严禁占用疏散通道,严禁在安全出口或疏散通道除摆放杂物。
(2)检查消防安全疏散指示标志和应急照明设施。
(3)应保持防火门、消防安全疏散指示标志、应急照明、机械排烟送风机等设施处于正常状态。
6.1.3 消防器材
(1)烟、温感报警检查,查看是否有报警、设备故障报警、未处理事项等非正常情况。
(2)灭火器,消防箱,防火栓,手动报警器,玻璃破碎检查,应保持设施的完整性,查看是否处于正常工作状态。
6.2 巡视检查频次
每日一次。
6.3 保养维护
6.3.1 季度维护
a)每季度应对所有的火灾探测器采用抽测的方式进行测试。
b)每季度对报警阀应进行开阀试验,观察阀门开启和密封性,以及报警阀各部件的工作状态是否正常。检查系统的压力开关报警功能是否正常。
c)每季度对应急照明进行一次功能性测试,切断正常供电电源。
d)每季度对疏散指示标志进行一次功能性测试。
e)由分包服务责任人按规定填写《消防系统维护记录》。
6.3.2 年维护
a) 灭火器年检,查看是否有异常情况。
b) 在一年内通过定期,分区域性测试将所有火灾探测器测试一遍。并核对火灾探测器的地址是否正确。
一、机房人员日常行为准则1、必须注意环境卫生。禁止在机房内吃食物、抽烟、随地吐痰;对于意外或工作过程中弄污机房地板和其它物品的,必须及时采取措施清理干净,保持机房无尘洁净环境。
2、必须注意个人卫生。工作人员仪表、穿着要整齐、谈吐文雅、举止大方。
3、机房用品要各归其位,不能随意乱放。
4、机房应安排人员值日,负责机房的日常整理和行为督导。
5、进出机房按要求必须换鞋,雨具、鞋具等物品要按位摆放整齐。
6、注意检查机房的防晒、防水、防潮,维持机房环境通爽,注意天气对机房的影响,下雨天时应及时主动检查和关闭窗户、检查去水通风等设施。
7、机房内部不应大声喧哗、注意噪音/音响音量控制、保持安静的工作环境。
8、坚持每天下班之前将桌面收拾干净、物品摆放整齐。
二、机房保安制度
1、出入机房应注意锁好防盗门。对于有客人进出机房,机房相关的工作人员应负责该客人的安全防范工作。最后离开机房的人员必须自觉检查和关闭所有机房门窗、锁定防盗装置。应主动拒绝陌生人进出机房。
2、工作人员离开工作区域前,应保证工作区域内保存的重要文件、资料、设备、数据处于安全保护状态。如检查并锁上自己工作柜枱、锁定工作电脑、并将桌面重要资料和数据妥善保存等等。
3、工作人员、到访人员出入应登记。
4、外来人员进入必须有专门的工作人员全面负责其行为安全。
5、未经主管领导批准,禁止将机房相关的钥匙、密码透露给其它人员,同时有责任对信息保密。对于遗失物品的情况要即时上报,并积极主动采取措施保证机房安全。
6、机房人员对机房安全制度上的漏洞和不完善的地方有责任及时提出改善建议。
7、禁止带领与机房工作无关的人员进出机房。
8、绝不允许与机房工作无关的人员直接或间接操纵机房任何设备。
9、出现机房盗窃、破门、火警、水浸、110报警等严重事件时,机房工作人员有义务以最快的速度和最短的时间到达现场,协助处理相关的事件。
三、机房用电安全制度
1、机房人员应学习常规的用电安全操作和知识,了解机房内部的供电、用电设施的操作规程。
2、机房人员应经常实习、掌握机房用电应急处理步骤、措施和要领。
3、机房应安排有专业资质的人员定期检查供电、用电设备、设施。
4、不得乱拉乱接电线,应选用安全、有保证的供电、用电器材。
5、在真正接通设备电源之前必须先检查线路、接头是否安全连接以及设备是否已经就绪、人员是否已经具备安全保护。
6、严禁随意对设备断电、更改设备供电线路,严禁随意串接、并接、搭接各种供电线路。
7、如发现用电安全隐患,应即时采取措施解决,不能解决的必须及时向相关负责人员提出解决。
8、机房人员对个人用电安全负责。外来人员需要用电的,必须得到机房管理人员允许,并使用安全和对机房设备影响最少的供电方式。
9、机房工作人员需要离开当前用电工作环境,应检查并保证工作环境的用电安全。
10、最后离开机房的工作人员,应检查所有用电设备,应关闭长时间带电运作可能会产生严重后果的用电设备。
11、禁止在无人看管下在机房中使用高温、炽热、产生火花的用电设备。
12、在使用功率超过特定瓦数的用电设备前,必须得到上级主管批准,并在保证线路保险的基础上使用。
13、在危险性高的位置应张贴相应的安全操作方法、警示以及指引,实际操作时应严格执行。
14、在外部供电系统停电时,机房工作人员应全力配合完成停电应急工作。
15、应注意节约用电。
四、机房消防安全制度
1、机房工作人员应熟悉机房内部消防安全操作和规则,了解消防设备操作原理、掌握消防应急处理步骤、措施和要领。
2、任何人不能随意更改消防系统工作状态、设备位置。需要变更消防系统工作状态和设备位置的,必须取得主管领导批准。工作人员更应保护消防设备不被破坏。
3、应定期进行消防演习、消防常识培训、消防设备使用培训。
4、如发现消防安全隐患,应即时采取措施解决,不能解决的应及时向相关负责人员提出解决。
5、应严格遵守张贴于相应位置的操作和安全警示及指引。
6、最后离开的机房工作人员,应检查消防设备的工作状态,关闭将会带来消防隐患的设备,采取措施保证无人状态下的消防安全。
五、机房用水制度
1、禁止将供水管道和设施安装在机房内。
2、应格遵守张贴于相应位置的安全操作、警示以及安全指引。
六、机房硬件设备安全使用制度
1、机房人员必须熟知机房内设备的基本安全操作和规则。
2、应定期检查、整理硬件物理连接线路,定期检查硬件运作状态(如设备指示灯、仪表),定期调阅硬件运作自检报告,从而及时了解硬件运作状态。
3、禁止随意搬动设备、随意在设备上进行安装、拆卸硬件、或随意更改设备连线、禁止随意进行硬件复位。
4、禁止在服务器上进行试验性质的配置操作,需要对服务器进行配置,应在其它可进行试验的机器上调试通过并确认可行后,才能对服务器进行准确的配置。
5、对会影响到全局的硬件设备的更改、调试等操作应预先发布通知,并且应有充分的时间、方案、人员准备,才能进行硬件设备的更改。
6、对重大设备配置的更改,必须首先形成方案文件,经过讨论确认可行后,由具备资格的技术人员进行更改和调整,并应做好详细的更改和操作记录。对设备的更改、升级、配置等操作之前,应对更改、升级、配置所带来的负面后果做好充分的准备,必要时需要先准备好后备配件和应急措施。
7、不允许任何人在服务器、交换设备等核心设备上进行与工作范围无关的任何操作。未经上级允许,更不允许他人操作机房内部的设备,对于核心服务器和设备的调整配置,更需要小组人员的共同同意后才能进行。
8、要注意和落实硬件设备的维护保养措施。
七、软件安全使用制度
1、必须定期检查软件的运行状况、定期调阅软件运行日志记录,进行数据和软件日志备份。
2、禁止在服务器上进行试验性质的软件调试,禁止在服务器随意安装软件。需要对服务器进行配置,必须在其它可进行试验的机器上调试通过并确认可行后,才能对服务器进行准确的配置。
3、对会影响到全局的软件更改、调试等操作应先发布通知,并且应有充分的时间、方案、人员准备,才能进行软件配置的更改。
4、对重大软件配置的更改,应先形成方案文件,经过讨论确认可行后,由具备资格的技术人员进行更改,并应做好详细的更改和操作记录。对软件的更改、升级、配置等操作之前,应对更改、升级、配置所带来的负面后果做好充分的准备,必要时需要先备份原有软件系统和落实好应急措施。
5、不允许任何人员在服务器等核心设备上进行与工作范围无关的软件调试和操作。未经上级允许,不允许带领、指示他人进入机房、对网络及软件环境进行更改和操作。
6、应严格遵守张贴于相应位置的安全操作、警示以及安全指引。
八、机房资料、文档和数据安全制度
1、资料、文档、数据等必须有效组织、整理和归档备案。
2、禁止任何人员将机房内的资料、文档、数据、配置参数等信息擅自以任何形式提供给其它无关人员或向外随意传播。
3、对于牵涉到网络安全、数据安全的重要信息、密码、资料、文档等等必须妥善存放。外来工作人员的确需要翻阅文档、资料或者查询相关数据的,应由机房相关负责人代为查阅,并只能向其提供与其当前工作内容相关的数据或资料。
4、重要资料、文档、数据应采取对应的技术手段进行加密、存储和备份。对于加密的数据应保证其可还原性,防止遗失重要数据。
九、机房财产登记和保护制度
1、机房的日常物品、设备、消耗品等必须有清晰的数量、型号登记记录,对于公共使用的物品和重要设备,必须建立一套较为完善的借取和归还制度进行管理。
2、机房工作人员应有义务安全和小心使用机房的任何设备、仪器等物品,在使用完毕后,应将物品归还并存放于原处,不应随意摆放。
3、对于使用过程中损坏、消耗、遗失的物品应汇报登记,并对责任人追究相关责任。
4、未经主管领导同意,不允许向他人外借或提供机房设备和物品。
十、团队精神和相互协作
1、机房工作小组人员应树立团队协作精神。
2、任何将要发生的给其他人员工作和安排产生影响的事情,或需要与其他工作人员互相协调的事情,应先提出和协调一致,禁止个人独断独行的作风。
3、工作分工要明确,责任要到位、工作计划要清晰,工作总结要具体。
4、小组人员有义务服从工作安排,并有义务对工作安排提出更加合理化建议和意见。
5、营造民主协作的工作环境,任何人员有权利和义务组织、联络其他小组成员、主管领导等展开讨论、开展会议、及时反映问题、做到相互沟通、协同工作。
IT运维中有一项重要内容就是对IDC机房的运维。IDC机房是用来存放服务器的场所,对IDC机房的维护可以保障服务器的正常运行,减少故障发生,延长设备寿命。如何对IDC机房进行维护呢?让我们一起听听IT运维专家的建议:
IDC机房运维
1.机房环境控制
定期对设备进行除尘、清理,调整安保摄像头清晰度,防止由于机器运转、静电等因素将尘土吸入监控设备内部。同时检查机房通风、散热、净尘、供电、架空防静电地板等设施。机房室内温度应控制在5℃-35℃,相对湿度应控制在30%-85%。
2.机房空调维护
检查空调运行是否正常,换风设备运转是否正常。从视镜观察制冷剂液面,看是否缺少制冷剂。检查空调压缩机高、低压保护开关、干燥过滤器及其他附件。
IDC机房运维
3. UPS及蓄电池维护
根据实际情况进行电池核对性容量测试;进行电池组充放电维护及调整充电电流,确保电池组正常工作;检查记录输出波形、谐波含量、零地电压;查清各参数是否配置正确;定期进行UPS功能测试,如UPS同市电的切换试验。
4. 消防设备维护
检查火警探测器、手动报警按钮、火灾警报装置外观及试验报警功能;检查火灾警报控制器的自检、消音、复位功能及主备用电源切换功能。
IDC机房运维
5. 电路维护
镇流器、灯管及时更换,开关更换;线头氧化处理,标签巡查更换;供电线路绝缘检查,防止意外短路。
6. 基础维护
静电地板清洗清洁,地面除尘;缝隙调整,损坏更换;接地电阻测试;主接地点除锈、接头紧固;防雷器检查;接地线触点防氧化加固。
IDC机房运维
7. 机房管理体系
完善机房运维规范,优化机房运维管理体系,技术维护人员24小时及时响应。
IDC机房承载着服务器的各种事项,服务器上架、下架、处理故障等等。因此要建立健全的运维体系,保障IDC机房的平稳健康运营。
转自 https://www.toutiao.com/i6598010104509891079/
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)