一、机房日常运维管理
1、运维人员每天在8:30到达机房进行设备巡检,每天17:30下班后再次进行设备巡检,并在《设备日巡检记录表》中进行记录。如发现异常情况,需立即上报机房主管人员,并联系相关产品服务商获取技术支持。
2、对任何异常情况及其处理操作应在事件单中被记录,为日后的问题管理提供依据。
3、机房运维人员每天上、下午均应合理安排时间在机房查看设备运行状态,包括内存、硬盘、CPU等系统资源状态,如出现资源运行异常,应查看相关系统设备运行进程并转入事件管理流程进行处理。
4、保持机房整洁、卫生。所有设备摆放整齐有序,不得将任何废弃物品留在机房内。不得存放与工作无关的物品,机房的物品不得私自带走。
二、机房网络安全管理
1、新购置的设备,在安装、使用前应当认真经过安检。使用之前采取防止病毒感染措施,试运行正常后,再投入正式运行。
2、机房设备严禁连接互联网。
3、对于网络设备和服务器,要制定不同的用户账号,赋予不同的用户操作权限,并予以登记、备案。禁用guest账户,删除服务器中的多余的、过期的以及共享的账户。必须定期统计相关信息和操作状况,并向上级领导。
4、设置登录服务器的操作超时锁定,超过10分钟不操作即锁定,需要重新认证后登录。
5、系统中所涉及的涉密服务器、终端、以及应用程序的本地登录和远程登录必须进行用户身份鉴别,并与安全审计相关联,保证系统内安全事件的可查性。
6、禁止任何部门和个人严禁进行渗透测试,严禁攻击其它联网主机,严禁散布病毒。
7、严格执行计算机操作规程和各项管理制度,加强对管理人员和工作人员的防病毒教育。
8、网络服务器应当安装防火墙系统,加强网络安全管理。
9、病毒检测和网络安全检测必须指定专门的技术和管理人员负责;负责人员必须定期对网络安全和病毒检测进行检查。定期采用国家相关主管部门批准使用的检测工具对系统进行安全性检测,检测工具和版本应及时更新。对于发现的系统软件和应用软件的安全隐患,必须及时从系统软件开发商和应用软件开发商获取相关的补救措施,如安装补丁软件、制定新的安全策略、升级病毒库等。
三、机房硬件设备安全管理
1、机房运维人员必须熟知机房内设备的基本安全操作和规则,特别是对服务器、交换机进行熟悉操作,做到及时维护。
2、应定期检查、整理设备连接线路,定期检查硬件运作状态(如设备指示灯、仪表),定期调阅硬件运作自检报告,从而及时了解设备运作状态。
3、禁止随意搬动设备、随意在设备上进行安装、拆卸硬件、或随意更换设备连线、禁止随意进行硬件复位。
4、禁止在服务器上进行实验性质的配置操作,如需要对服务器进行配置,应在其他可进行试验的机器上调试通过并确认可行后,才能对服务器进行准确的配置。
5、对会影响到全局的硬件设备的更改、调试等操作应预先发布通知,并且应有充分的时间、方案、人员准备,才能进行硬件设备的更改。
6、对重大设备配置的更改,必须首先形成方案文件,经过讨论确认可行后,由具备资格的技术人员进行更改和调整,并应做好详细的更改和操作记录。对设备的更改、升级、配置等操作之前,应对更改、升级、配置所带来的负面后果做好充分的准备,必要时需要先准备好后备配件和应急措施。
7、不允许任何人在服务器、交换设备等核心设备上进行与工作范围无关的任何操作。未经上级允许,不得对核心服务器和设备进行调整配置。
8、硬件设备出现故障时,应填写好《硬件设备维修故障登记表》,详细填写故障状况及故障原因,并报修,故障处理结束后,因填写处理情况及结果,交由上级验收、签字后,存档备查。
9、存储过涉密信息的硬件和固件应到具有涉密信息系统数据恢复资质的单位进行维修。
10、不再使用或无法使用的设备应按照国家保密工作部门的相关规定及时进行报废处理,并记录最终去向。
四、机房软件安全使用管理
1、设立计算机软件管理台帐,对每套计算机软件进行登记,并纳入资产管理。
2、妥善保存计算机软件介质、说明书、使用许可证(或合同)等资料。
3、根据操作说明,正确使用各类应用软件。
4、须安装非专用软件,须经上报并检测、办理安装使用备案手续。
5、软件必须由专人来保管,禁止任何人员将机房软件私自拷贝、随意向外传播。
6、任何在用软件的升级均需主管人员书面批准。
五、机房资料、文档和数据安全管理
1、资料、文档、数据等必须有效组织、整理和归档备案。
2、硬盘、软盘、光盘、磁带、带存储功能的设备等涉密信息存储介质应按照所存储信息的最高密级标明密级。
3、禁止任何人员将机房内的资料、文档、数据、配置参数等信息擅自以任何形式提供给其他无关人员。
4、对于牵涉到网络安全、数据安全的重要信息、密码、资料、文档等必须妥善存放。外来工作人员的确需要翻阅文档、资料或者查询相关和数据的,应由机房相关负责人代为查阅,并只能向其提供与其当前工作内容相关的数据或资料。
5、重要资料、文档、数据应采取对应的技术手段进行加密、存储和备份。对于加密的数据保证其还原行,防止遗失重要和数据。
6、严禁使用计算机、终端机、因特网为无关人员查询、调阅涉密数据;存有秘密信息的磁盘、光盘,严禁外借、复制;不得向无关人员提供网络入口及口令。
7、调动工作时,必须将自己经管的涉密文件、资料和使用的保密笔记本上交,并递交在调离后一定期限内不失密泄密的保证书。
8、发现失、泄密现象,要及时上报。
9、不再使用或无法使用的涉密信息存储介质在进行报废处理时,应进行信息消除或载体销毁处理,所采用的技术、设备和措施应符合国家保密工作部门的有关规定。
六、机房保安管理
1、中心机房应采取有效的门控措施,并装备“三铁一器”。
2、出入机房应注意锁好防盗门。对于有客人进出机房,机房相关的工作人员应负责客人的安全防范工作。最后离开机房的人员必须自觉检查和关闭所有机房门窗、锁定防盗装置。应主动拒绝陌生人进出机房。
3、工作人员离开工作区域前,要保证服务器、交换机等设备控制台的密码处于锁定状态。
4、运维人员要严格执行人员出入登记制度,不得邀请无关人员到机房参观,外单位系统、线路维护人员要进入机房需提前与管理人员联系,批准后方可由管理人员陪同进入,并填写《人员出入登记表》。
5、外来人员进入必须有专门的工作人员全面负责其行为安全。
6、未经主管领导批准,禁止将机房相关的钥匙、保安密码等物品和信息外借或透漏给其他人员,同时有责任对保安信息保密。对于遗失钥匙、泄漏保安信息的情况即时上报,并积极主动采取措施保证机房安全。
7、机房人员对机房保安制度上的漏洞和不完善的地方有责任及时提出改善建议。
8、绝不允许与机房工作无关的人员直接或间接操纵机房任何设备。
9、出现机房盗窃、破门、火警、水浸、110报警等严重事件时,机房工作人员有义务以最快的速度和最短的时间到达现场,协助处理相关的事件。
七、机房用电安全管理
1、机房人员应学习常规的用电安全操作和知识,了解机房内部的供电、用电设施的操作规程。
2、机房人员应经常学习、掌握机房用电应急处理步骤、措施和要领。机房应安排有专业资质的人员定期检查供电、用电设备、UPS设备。
3、机房人员应定好UPS放电计划,对UPS的放电时长做出准确的评估,并做出更换或修复UPS计划报告相关人事。
4、运维人员定期检查UPS各项运行参数、负载、电池容量是否正常,如有异常,应及时调整处理,并做好记录。
5、严禁随意对设备断电、更改设备供电线路,严禁随意串接、并接、搭接各种供电线路、严禁把电源排插散落在地。发现用电安全隐患,应即时采取措施解决,不能解决的必须及时向相关负责人员提出解决。机房内的电源开关、电源插座要明确标出控制的设备。
6、在使用功率超过特定瓦数的用电设备前,必须得到上级主管批准,并在保证线路的保险的基础上使用。
7、在发生市电报警要尽快赶往机房查看,并通告相关人员。事件处理完后,应及时复位市电报警设备。
8、在外部供电系统停电时,机房工作人员应全力配合完成停电应急工作。当需要发电机发电时,应计算好机房用电功率合理选择发电机型号发电,严禁发电超负载供电。
9、定期(不长于三个月)对供电设施进行检测与检修,保障供电正常。
八、机房空调管理
1、为保证设备良好的工作环境,应保持合适的机房温度和湿度,机房温度应保持在22℃--26℃,机房湿度应低于70%。
2、空调运行时,巡检人员按时检查各项运行参数、状态是否正常,如有异常,应及时调整处理,并做好记录。
3、定期进行空调机的清理,防止因散热不良造成空调的工作异常。
4、配备备用电风扇,以防止空调出现故障时机房温度的快速上升。定期进行备用电风扇可用性检查。
5、每年春秋换季期对空调系统进行全面的检查保养,确保机组的正常运行。
6、每天巡检一次,确保空调系统正常运行,如发现故障应及时上报。夏季要提高巡检频率,每天两次,上下午各一次。
7、机房维护人员应懂得进行一些必要的空调降温手段,以便在出现温度升高的状况下能通过辅助手段降低温度上升的速度。
九、机房消防安全管理
1、机房工作人员应熟悉机房内部消防安全操作和规则,了解消防设备操作原理、掌握消防应急处理步骤、措施和要领。
2、消防设备应放在显眼易取之处,任何人不能随意更改消防系统工作状态、设备位置。需要变更消防系统工作状态和设备位置的,必须取得主管领导批准。工作人员更应保护消防设备不被破坏。
3、每日对火灾重大风险点如蓄电池组进行巡检,检查内容包括电池是否漏水,有无发热异常,电极触点是否连接正常。
4、插座及蓄电池附近不得摆放纸箱、说明书等易燃物品。
5、应定期消防常识培训、消防设备使用培训。如发现消防安全隐患,应即时采取措施解决,不能解决的应及时向相关负责人员提出解决。
6、严禁在机房内吸烟和使用明火,如因线路或其他原因引起明火,应及时拨打119和通知相应负责人迅速解决问题。
7、定期检查消防设备状态,保证消防设备可用性。
十、机房应急响应
1、机房停电时,UPS设备将为机房设备提供电力支持,但UPS能够提供的电力有限,因此需要根据实际情况进行处理,具体如下:
在停电时,有短信报警机制通知到机房维护人员,维护人员应马上通知机房主管人员,并在一小时内赶回机房。
机房维护人员积极配合主管人员协调各供电电路运维方及时检查处理市电回路故障。
按照《基本业务服务设备列表》,只保留基本业务服务设备运行,对其余设备进行关闭。
当UPS电力不足时,应及时关闭所有设备,避免突然断电造成的系统设备故障。
2、当机房温度升高时,为保护各设备,需要采取相应的应急处理措施,具体如下:
达到温度阈值时,应有短信通知机制通知机房维护人员,维护人员一小时内到场,马上启用备用电风扇。
当机房温度超过28℃时,维护人员应立即通知主管人员并积极协调空调维护商尽快处理。
在温度超过35℃时,可以根据《基本业务服务设备列表》关闭非基本设备,只提供基本业务服务设备运行;
当机房温度超过40℃时,应当关闭所有系统设备运行。
3、火灾不像供电及空调故障那样存在一段缓冲期去处理或减少影响,对无人值守机房来说一旦发生火灾,势必导致重大财产损失。对于机房火灾应当是预防为主,因此必须重视每日的蓄电池组巡检。当机房发生火灾时,本着先救人,后救物的思想原则采取相应的应急处理措施,具体如下:
有报警机制通知到所属地区消防部门,并通知到机房维护人员及主管人员。并根据预先制定的火灾发生时联系人目录通知到位。
到场后立即断开电源,防止由于电源引起的火情进一步扩大。
寻找安全的地点监控火情,并积极配合消防人员应对火灾。
4、设备发生故障时,使用备用设备替换现有设备,并保证新设备配置和用户密钥与旧设备一致、保证新设备配置和数据与旧设备一致。
5、传输线路干路发生故障时,请及时联系网络供应商,对线路进行检测维修。
6、发生不可预见的紧急请况时,及时向主管人员汇报,并与相关技术人员联系,采取妥当的应急办法进行应急处理。
需要注意下面几点1.合理布线
合理有效的线缆布局对于机房整理的节约电能、节能降耗、空间节约、改善空气对流起到重要作用.
机房整理的布线方法:
一般综合布线系统要求距离尽量短而整齐,排列有序,具体的方式有“田”字形和“井”字形两种.其中:“田”字形较适用于环形机房布局,“井”字形较适用于纵横式机房布局. 它的位置可安排在地板下和吊顶两个地方,各有各的特点,下面分别加以阐述:
1、地板布线:这是一种最常见的布线方式,它充分利用了地板下的空间,但要注意地板下漏水、鼠害和散热,还应保证在每个机房机柜下方开凿相应的穿线孔(包括地板和线槽).
2、吊顶布线:该布线方式特别适合于经常需要布线的机房,目前也非常流行,此方式中吊顶内包含了各种布线电源、弱电布线,在每个机柜上方开凿相应的穿线孔(包括地板和线槽),当然也要注意漏水、鼠害和散热,具体布线的内容有:强电布线、弱电布线和接地布线,其中强电布线和弱电布线均放在金属布线槽内,具体的金属布线槽尺寸可根据线量的多少并考虑留有一定的余量(一般为100×50或50×50).强电线槽和弱电线槽之间的距离应保持至少5cm以上,互相之间不能穿越,以防止相互之间的电磁干扰.下面将一一加以阐述:
1、强电布线:在新机房装修进行强电布线时,应根据整个机房的布局和UPS的容量来安排,在规划中的每个机柜和设备附近,安排相应的电源插座,插座的容量应根据接入设备的功率来定,并留有一定的冗余,一般为10A或16A.电源的线缆直径应根据电源插座的容量并留有一定的余量.
2、弱电布线:弱电布线中主要包括同轴细缆、超五类网线和电话线等,布线时应注意在每个机柜、设备后面都有相应的线缆,并应考虑以后的发展需要,各种线缆应分门别类用扎带扎好.
3、接地布线:由于新机房内都是高性能的计算机和网络通讯设备,故对接地有着严格的要求,接地也是消除公共阻抗,防止电容耦合干扰,保护设备和人员的安全,保证计算机系统稳定可靠运行的重要措施.在机房地板下应布置信号接地用的铜排,以供机房内各种接地需要,铜排再以专线方式接入该处的弱电信号接地系统.
在弱电布线的时候,为了保证传输的速率和网络的稳定,还应该注意以下几点:
1、如果在2个端点间有多余的线缆,应该按照需要的长度将其剪断,而不应将其卷起并捆绑起来(双绞线的长度越长,传输质量越差,而且过长的线缆会为整理造成一定难度).
2、线缆的接头处反缠绕开的线段的距离不应超过2cm,过长会引起较大的近端串扰(双绞线的缠绕要求是很严格的,缠绕密度很大程度上会影响到传输质量).
3、在接头处,线缆的外保护层需要压在接头内而不能在接头外.虽然在线缆受到外界拉力时整个线缆均会受力,但若外保护层压在接头外,则受力的将主要是线缆和接头连接的金属部分.
4、在线缆接线施工时,线缆的拉力是有一定限制的,一般为9kg左右.过大的拉力会破坏线缆对绞的匀称性.
5、由于六类线缆要比一般的五类线粗,为了避免线缆的缠绕(特别是在弯头处),在管线设计时一定要注意管径的填充度,一般内径20mm的线管以放2根六类线为宜
机房维护
机房的日常维护可以为设备提供良好运转环境,保障系统运转安全、正常,保持通信畅通.
日常维护具体内容:
保持机房清洁干净,防尘防潮,防止鼠虫进入.
严禁在设备的计算机终端上玩游戏,禁止装入其他无关的软件或将计算机挪用.
每天须参照日常维护操作指导的相关内容,进行常规检查和测试,并做好记录.
发现问题须及时处理,处理不了的问题应立即向有关单位联系解决.遇到紧急情况不要慌张,切忌手忙脚乱.
维修时按设备相应规范说明书来进行,避免因人为因素而造成事故.
出现设备瘫痪等重大事故时,按照重大问题处理顺序进行排除,并立即通知相关单位.
已经损坏的单板不能放在机柜内,应装入防静电袋妥善保管,以免引起其他故障.
对弱电设备硬件操作应预先戴好防静电手环.
禁止擅自对设备进行复位、加载或轻易改动数据.如果确需更改,要在更改之前做好数据备份,改动 后一周内确认机器运行无误,再删除备份数据. 严禁使用终端软件以外的其它软件直接对数据库进行查询和修改,以免导致不良后果.
遇到强雷雨时,维护人员要及时巡查近端、远端模块局机房或通知值班人员注意观查、以防万一.
计算机终端口令要按级别划分权限,定期更改,并只向维护责任人发放.管理级口令只有维护负责人掌握,做到严格管理、责权分明.
机房的日常维护注意事项:
日常维护:
1.定期检查钢瓶压力表指针,保证钢瓶压力在允许范围内(使用承重装置的应检查承重器).一般时间为一个月,并做好记录.
2.定期检查气体灭火主机运行状况,包括主电、备电的工作情况,联动设备的工作情况等外观、线路,做好记录.一般一个月进行一次.
自检:
自检要对系统做一个全面的模拟火警的测试,一般一个季度进行一次.
1.保护好钢瓶,拆掉电磁阀,避免测试时气体喷出.
2.对报警主机进行模拟测试,比如:感烟报警、感温报警、手动启动、紧急停止、各个报警装置的报警状态和联动、喷放延时的情况. 3.机房系统整理
系统保护方案——保护卡强大的防护功能
当前病毒泛滥,很多保护卡难以防范.如机器狗病毒可以逃过保护卡的保护,在网络传播各种病毒,让很多机房管理老师都很是头疼.保护卡强大的防护功能不但可以防止机器狗病毒还可以防止其他底层病毒.有效减少机房老师的维护工作.
机房方案——变量拷贝硬盘保护卡
保护卡的多操作系统相互隔离功能,使机房不同操作系统各行其道,随意增、删数据互不影响.满足了机房承担的各种系统环境的需求(如:DOS、LINUX、UNIX、VISTA、WINXP等并存).实现了一机多用的强大功能
关于建议履行合同约定提供运行报告的函**机房:
近期,由于我单位托管在贵单位的服务器经常死机,加之贵单位忽然断电无法及时通知我单位,造成了我单位工作上的不便,为更好地促进我单位服务器运行安全,确保我单位工作正常运转,特建议贵单位按照我们之间的合同约定“每半月按时出具服务器运行报告”给我单位,特此函告!
**单位
二0一二年六月二十七日
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)