在《FAA的IT灾备规划四个教训(上)》中,TechTarget的专家介绍了FAA进行IT灾备规划的第一条教训:设备故障是灾备要防备的排名第一的问题。本文中将介绍从中可以吸取的其他教训: 2.设备故障还混合有修改或者配置管理的问题,是一种双重问题。 Morency说:“当你审查设备故障时,要关注的不只是硬件问题。有时,你可能误做了一个修改。
尽管主路由器上的电路板出问题了,但是原来准备好的备份可能没有正确配置,所以该备份在问题出现时永远不会接管过去(起到备份的作用)。”这一点看起来是美国联邦航空管理局出现这次事故的真正原因。 Morency说:“所以对于生产环境的配置修改,必须有一些严格……
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
在《FAA的IT灾备规划四个教训(上)》中,TechTarget的专家介绍了FAA进行IT灾备规划的第一条教训:设备故障是灾备要防备的排名第一的问题。本文中将介绍从中可以吸取的其他教训:
2.设备故障还混合有修改或者配置管理的问题,是一种双重问题。
Morency说:“当你审查设备故障时,要关注的不只是硬件问题。有时,你可能误做了一个修改。尽管主路由器上的电路板出问题了,但是原来准备好的备份可能没有正确配置,所以该备份在问题出现时永远不会接管过去(起到备份的作用)。”这一点看起来是美国联邦航空管理局出现这次事故的真正原因。
Morency说:“所以对于生产环境的配置修改,必须有一些严格的措施,不管是对配置或者是数据,没有经过彻底的测试,就不能引进到生产环境中来。”
Burton集团公司的Ruth表示,对现有系统的任何升级或者改动,都需要通过业务持续性或者灾备规划的影响评估报告。“美国联邦航空管理局的这次事故可能是有人做了一点修改(他们认为无关紧要,调整了数据库),导致的系统崩溃。但是,这里的教训是,在没有项目管理类人员确保针对这次修改对业务运营的影响进行评估的情况下,你不应该允许技术人员去做修改。”
3.IT灾备规划中的测试能力很关键。
Ruth说:“听起来,美国联邦航空管理局停电事故的问题之一是:没有受到停电影响的站点没有运行应用程序的能力。而且令人震惊的是,人们没有分析剩下的那些站点有是否能力承担起(备用)功能。”
Ruth说测试能力和执行情况是“基本障碍和问题” 。“你必须知道你为保证能缓步前进(而且希望不是)能提交的最低限度的服务,就像在本案例中,停止了三分之一国家的航空交通”。
4.然而,万无一失的测试有时候是不可能实现的。
Morency说:“在那些经过合并和收购的组织中,有新的产品应用需要完成接管,需要测试的范围就变的越来越大。突然之间,你需要的资源也会变的更多,包括执行那些测试设备,还有人力和业务部门人员。”
根据Morency的意思,即使遵循了测试最佳实践,但是数据中心变更的数量还是会把它推向风险。他说:“需要被覆盖的配置可能只需要微小的改动。但是那里可能有大差异。这就是为什么更多的机构关注的是故障切换的问题,而不是手工恢复的问题”。
作者
Executive Editor Linda Tucci oversees news and e-zine projects for SearchCIO.com and SearchCIO-Midmarket.com. She has covered CIO strategy since joining TechTarget in 2005, focusing most recently on big data, mobile computing and social media. She also writes frequently about the CIO role and CIO careers for SearchCIO.com's weekly CIO Matters column. Prior to joining TechTarget she was a business columnist for the St. Louis Post-Dispatch. Her freelance work has appeared in The Boston Globe and T
翻译
相关推荐
-
ITIL流程管理六步走
服务管理实施前后主要的变化,表面看增加了一些流程经理,增加了一些“领导”——事件经理、变更经理,配置经理,问题经理。
-
FAA的IT灾备规划四个教训(上)
美国联邦航空管理局(简称FAA)最近出现了一些计算机故障,这些故障造成了机场国际航班的延误和取消。就IT灾备规划方面来说,CIO们从中能学到什么呢?
-
配置管理是政府ITIL应用实战的关键
服务台、配置管理、底层平台、ITSM软件作为ITIL落地的四大要素,各级政府部门唯有在具体实践中充分重视其重要性,才能保证政府IT运维全面提速,进而提升政务服务效率。
-
从何处开始实施ITIL与配置管理
目前,随着关于IT基础结构标准库(ITIL)配置管理数据库(CMDB)广告宣传的泛滥和各种相关书籍的出版,从业者对于如何实现配置管理感到困惑,这已不足为奇。