1.现场查看,接到故障处理信息后,第一时间安排人员到现场对故障情况进行查看,确认故障的现象与范围。
2.初步控制故障,然后上报领导。并且下派专业人员处理故障。
3.形成书面报告,描述故障发生过程,存档。
4,查找原因,派遣故障专业人员处理故障并且找出故障原因。
5.后续跟进,处理好故障之后,持续至少三个月事件跟踪评测,查看整改方案的执行力度与落实情况。
每年数据中心都会发生很多事故,就说说今年的吧。2017年6月17日下午16点30分左右,新浪微博几乎全平台瘫痪,故障持续约一小时,微博CIO王巍在事后回应称,这次故障的原因是“外部机房整层掉电”。在微博还没有从阴影中走出来的时候,6 月19 日午间,有不少网友反映使用饿了么点餐出现了问题,比如很早点的午餐迟迟未送达、看不到订单等情况。不少网友以为是商家或者骑手的问题,事实上是饿了么平台机房发生故障导致的。安全性是数据中心运营的第一要义,世界公认的数据中心标准组织和第三方认证机构Uptime Institute把数据中心分为Tier I—Tier IV四个等级,等级越高,安全性越强。而XDC+数据中心就是按照Tier IV标准建造的数据中心,通过2N配置,7x24x365x5’极速运维响应等措施,保障数据安全。欢迎分享,转载请注明来源:夏雨云
评论列表(0条)