专家们说,在重大业务中断或者灾难之后,恢复企业运营需要一位有影响力的业务主管开发一个业务连续性计划。现实中许多企业却完全不是这样做的,在这些企业中,IT部门主管负责成功地为企业的IT运营开发一个灾备计划和(或者)持续运营计划,但这一为IT运营制定的计划被扩大到更广的整个企业范围内。
正是在这样的领导制度下,基本上这个计划决定了组织可以承受丢失多少数据,可以忍受丢失数据多久——它们分别就是著名的恢复点目标RPO(Recovery Point Objective,指出现灾难时多长时间可以让业务继续运作)和恢复时间目标RTO(Recovery Time Objective,指出现灾难时会丢失多长时间的数据)——这代表了一个组织的恢复能力有多好和多快。
Richard Jones说:“许多人都会有一个错误的认识,那就是:业务持续性是IT部门的职责,或者这是每一个人的责任。” Richard Jones是Burton Group公司的一位分析师,他正在研究“公司在灾备和业务持续性方面取得成功和失败的决定性因素是什么”。Jones是位于犹他州Midvale市Burton的数据中心战略集团的任职董事,他说:“取得成功的公司大部分都有集中的组织结构,人员被安排在恰当的位置来推动流程。而有的公司业务主管并不紧密地参与到计划中来,他们总是说‘让其他人来做这事吧’,这样做出来的计划就是那种无济于事的计划。”
John Morency是位于康涅狄格州斯坦福德Gartner公司的一位分析师,他说,理论上,业务持续性BC(Business Continuity)管理人员“应该总是”业务单元中的一员。现实中却经常是程序经理对IT业务持续性计划非常感兴趣,然后据此衡量公司级的业务持续性计划。Morency表示,在紧急情况下这种做法是可行的,但是业务持续性和恢复要考虑的一大部分很重要的因素不在IT的范围之内,需要对业务如何运作有更深刻的理解才行。
他说:“而且到最后,如果程序一直持续不变,业务持续性管理人员不得不报告给CEO或者董事会,或者首席风险管理主管(如果公司有这样的角色的话),但肯定不是报告给IT部门。”
业务持续性计划的标准恢复时间目标RTO和恢复点目标RPO
要想把恢复时间目标RTO和恢复点目标RPO定义到最合适,还需要企业领导者(包括董事会)的参与。不同公司、不同行业,RTO和RPO的设置需求都不一样。例如,Jones发现制造业公司的数据中心断电三天不是一个大问题,因为设备可以继续生产。但是三天之后,停电就开始消耗公司成本。
另一方面的问题是金融利息,Jones获悉,一笔交易停止一分钟就会花费公司一百万美元到两百万美元。
公司只能在RTO,RPO和成本之间权衡找到折中点。例如,Jones谈到有一家银行要求出纳员保留他们交易的纸质票据;如果数据中心停电了,出纳员们就去查到应用程序中他们的最后一笔交易,然后加班把停电期间没录入系统的数据依据纸质票据重新录入。这样他们就不需要花大价钱建立一个系统来保证数据零丢失。
Jones说:“与为了保证数据零丢失花大价钱建立镜像数据中心、互相之间同步执行数据复制相比,为发生频率很小的事件采取这种做法成本很低。”
Morency表示,大部分企业由于成本高昂而只定义单一的RPO和RTO的做法是不现实的,除非这家企业的CIO能保证组织持续运行。由于在使用RPO和RTO方面没有官方基准,Gartner一般使用一个四层系统(见后面的表格)和其他地方的许多指导建议。
Morency说大部分组织按层次进行分段数据恢复,第一层和第二层包括应用和流程中对产生收益最关键的数据。这些层要求恢复时间小于24小时,数据恢复点是四小时或者更短的时间。组织这样设置目标后,将可能使用一些磁盘之间复制的方式,因为磁带恢复太慢了。
业务影响分析:财务成本是易事
在RTO和RPO的基础上计算停止运营期见的经济损失需要从业务影响分析开始,该分析包括硬性成本和软性成本。硬性的数量容易获得,CFO可以告诉公司该公司一天赚多少钱,不生产会损失多少钱,或者每天的运行效率和工资支出比例是什么样,或者更新设备要花多少钱。
比较难合计的是间接的业务影响,比如客户不满意,或者发生停电时相关费用的差异都是这一类成本。
Jones说:“这些间接成本大部分都是主观的,但是你需要及早行动,尽力量化间接业务影响。”
在负责切实可行的RPO或者RTO策略时,量化分析甚至是准量化的分析至关重要。IT部门常犯的经典错误是来了以后问企业负责人他们需要多快恢复运行。
Morency说:“企业返回来的答案一定总是‘我们必须持续运行或者我们只能停一小时’。 ”
业务流程,应用程序和数据恢复层次
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
作者
Executive Editor Linda Tucci oversees news and e-zine projects for SearchCIO.com and SearchCIO-Midmarket.com. She has covered CIO strategy since joining TechTarget in 2005, focusing most recently on big data, mobile computing and social media. She also writes frequently about the CIO role and CIO careers for SearchCIO.com's weekly CIO Matters column. Prior to joining TechTarget she was a business columnist for the St. Louis Post-Dispatch. Her freelance work has appeared in The Boston Globe and T
翻译
相关推荐
-
教你如何规避五个常见灾难恢复陷阱
TechTarget最近在社交媒体Twitter上发起关于灾难恢复计划的讨论,很多从业人员以及专家们,包括特别专家Paul Kirvan(他是一位拥有超过20年业务连续性和灾难恢复经验的独立顾问和审计师),一起分享了他们的建议和想法,比如如何安排灾难恢复(DR)测试。
-
小企业环境如何避免服务器合并和虚拟化
对很多公司来说,服务器虚拟化意味着合并。通常,服务器的合并会带来性能和可用性问题。避免服务器合并的时间决定于在一台实体机上可放多少台虚拟机……
-
美航订票故障警示:IT投入不足后患无穷
美航糟糕的运营状况极大影响到企业IT系统的正常运营,缺乏足够的预算,无力完成IT系统的部署更新,可谓隐患重重。
-
信息化内参(3):未雨当绸缪,备份要抓紧
企业需要面对的是当微软不再提供Windows XP安全更新时,企业的信息和数据安全如何保障?从现在开始,备份和转移数据吧!虚拟化和云备份或许是不错的选择。