数据中心灾难:未雨绸缪

日期: 2017-10-23 作者:Dan Morris翻译:陈晓诚 来源:TechTarget中国 英文

多年来,我设计了好几个数据中心,帮助企业应对灾难恢复和灾难避免。这些IT设施,可以在建筑物的任何区域找到,从地下两层,地下三层,到每个楼层。经验告诉我,数据中心的灾难会以任何可以想象,甚至无法想象的类型出现。

下面这个案例,数据中心位于一栋六层楼高建筑的二楼。

下了一场暴雨,但并没有将建筑周围淹没。但是,毫无征兆的,位于二楼的数据中心,CIO认为是安全的,却被淹没。由水引起的电涌使建筑的电力中断–数据都丢失了。

经过检查,公司发现大约一英尺的水几乎灌满数据中心的活动地板。由于水位于活动地板下,运营人员没有发现问题,直到装有线缆的线槽里的报警器响。(线槽是大型布线管,数据中心通常在活动地板下使用,但是不能完全密封。)

令人费解的是:一楼没有进水,除了从二楼滴下来的水。停车场和地下室是干的。二楼以上的所有楼层都没有问题- 没有损坏的管道。但是数据中心几乎都毁了。

我们调查发现,事件发生的几个月前,该公司安装了一台新的主机。为了安装,拆下了一扇窗户,起重机被用来运送主机,然后将窗户重新安装,并重新密封。计算机的水冷却器工作正常,线槽中有水检测装置。这样看来,数据中心的规划,没有问题。

进一步调查,我们的一个团队成员注意到,二楼有一条装饰狭窄走道,向内倾斜(这是一个潜在问题)但是有排水管,可以将水从建筑物中排出。那么水从何而来?

搬离数据中心设备之后,我们发现更换的窗户的填缝有问题。事实证明,装饰走道上的排水管被堵塞,水在走道的外侧聚集,从更换的窗户的填缝缝隙中倒灌。这是一连串不可能发生事件的连锁反应:大楼物业没有检查,以确保走道上的排水管是畅通的,重新密封窗户的劣质施工,让暴雨有了可乘之机。

医疗中心灾难

另一起案例,发生在美国中部一所高校内的医疗中心。校园有多个设施。IT位于医院对面街道上的一栋建筑内。IT运营在地面上。保护电缆埋在地下,连接校园内的所有建筑。多年来,没有发生过问题。某个夏日,一场暴风雨,闪电击中了数据中心和医院中间的街道,就位于医院的电缆上方。

发生灾难几率有多大?

这不重要,就是发生了,闪电将街道下的电缆直接融化。在电缆熔化之前,通过它的电涌摧毁了数据中心和医院的电脑 ——所有这些电脑都被融化或烧毁。没有什么还能使用。我要告诉你,电涌保护器,也会不起作用。喷嘴融化并掉落,释放煤气,有些东西真的会爆炸。

为数据中心灾难做好准备

这些数据中心的灾难发生在几年前。今天,有不同的工具来帮助应对长时间的数据中心中断所带来的影响,包括位于云端的灾难恢复,以及自动将受损服务器的处理转移的分布式服务器群组。然而,即使在今天,我们也会遇到可能导致意想不到的麻烦的灾难。比如Irma和Harvey飓风,以及墨西哥的8.2和7.1级地震,灾难随时可能发生。

所以,假设你有一个灾难恢复计划,这里有一些建议来减轻数据中心灾难的影响:

你是否加固了数据中心或公司的工作设施?有没有人想过可以造成数据中心灾难的所有常见的情况,和低概率事件?飓风,龙卷风,雷暴以及一辆卡车撞倒装卸码头边的变压器,只是摧毁数据中心的其中一些可能。

当灾难发生时,就是启动灾难恢复的时候。你的恢复计划是不是最新的?自从上次测试以来,是否足以应对公司的增长,及其IT支持?谁能宣布灾难,并启动恢复计划?你的通讯录是最新的吗,其中有一些人已经离开公司了吗?如果你依赖云备份,你确定自己和其他必要人员,可以在断电或风暴灾难中访问资源吗?

总是有不可预见的危险。加固建筑物是昂贵的。当你认为你已经覆盖了所有的情况,想想那些低概率事件,然后计算成本效益数字,来确定最佳的行动方案。

灾难预防和恢复是一种保险。这是概率与影响和损害程度之间的权衡。这显然是董事会层面的决策。但是,我相信预防是首要的,然后是快速恢复。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

翻译

陈晓诚
陈晓诚

TechTarget中国兼职翻译

相关推荐