案例研究:灾难恢复计划通过VMware解决裸机恢复

日期: 2010-11-21 作者:Linda Tucci翻译:陈德彦 来源:TechTarget中国 英文

这是一个一家中等规模的公司通过使用虚拟化和复制取代磁带备份大大提高了在它的灾难恢复计划中的恢复时间的故事。在这个过程中,解决了其70台Windows服务器群的裸机恢复问题。   在这个故事中,一个行业的IT主管如此习惯于管理风险(保险)以至于他能得到一笔“有点令人震惊”(约900,000美元)的开支的支持,该IT主管安排IT部门能做和不能做什么,且让业务部门来计算成本。   北卡罗莱纳州农业局互助保险公司是一家中型企业,该企业极需要迅速和可靠的灾难恢复过程。

位于罗利的财产和人身意外伤害保险公司,其业务遍及Tar Heel州的所有100个县。它在总部有650名员工,另外2,100名员工遍布所有县……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

这是一个一家中等规模的公司通过使用虚拟化和复制取代磁带备份大大提高了在它的灾难恢复计划中的恢复时间的故事。在这个过程中,解决了其70台Windows服务器群的裸机恢复问题。

  在这个故事中,一个行业的IT主管如此习惯于管理风险(保险)以至于他能得到一笔“有点令人震惊”(约900,000美元)的开支的支持,该IT主管安排IT部门能做和不能做什么,且让业务部门来计算成本。

  北卡罗莱纳州农业局互助保险公司是一家中型企业,该企业极需要迅速和可靠的灾难恢复过程。位于罗利的财产和人身意外伤害保险公司,其业务遍及Tar Heel州的所有100个县。它在总部有650名员工,另外2,100名员工遍布所有县,每年直接承保保费低于90亿美元。

  信息系统部门经理Steve Zeidman说:“我们的目标是在灾难申报的48小时覆盖关键业务功能。”

  Zeidman说,在保险公司,现金流量是国王。邮寄账单、核实索赔处理人的覆盖面、从客户提取损失通知书和支付索赔的能力依赖于数字流程。IT基础设施是多层的:一台大型主机和一个大型Windows服务器群,将数据集中在总部办公室。多年来,使用Tivoli存储管理器的灾难恢复计划涉及备份和从磁带恢复数据。然后,大约两年前,因为恢复时间太慢,这家保险公司开始重新评估备份和恢复能力。

  裸机恢复问题,磁带太费时

  凭借其行之有效的备份程序,大型机是一个已知量。IT部门可以自信地向企业保证停电24小时以内备份,也就是最多发生24小时的数据丢失。 Zeidman回忆说,70台Windows服务器是另一个故事。

  他说:“我们发现服务器群基本上是不可恢复的。如果我们继续我们使用的方法去恢复它,那将花费数周的时间。”

  Zeidman说,裸机恢复是一个指一次灾难性的失败后重建计算机的过程的问题。一些配置要求,用于恢复数据的硬件配置和用于备份的硬件配置相同——甚至当服务器的品牌相同时,更陡峭的问题需要攀登。

  他说:“如果没有遇到驱动程序问题,我们永远都不会得到足够匹配的硬件,驱动问题将导致服务器‘蓝屏’。”

  此外,从磁带恢复证明太费时。Zeidman说:“由于磁带装载和卸载,我们发现每台服务器的恢复需要耗费超过五个小时的时间。我们绝对需要数据位于恢复中心,这是我们确定的一点。”

  进入服务器虚拟化、复制

  IT部门决定使用虚拟化和数据复制来实现这一目标。

  多亏物理到虚拟的转换,该保险公司的灾难恢复计划现在涉及五台运行VMware的冷IBM服务器,该服务器位于距该公司灾难恢复(DR)中心500英里外的纽约州斯特灵(Zeidman说,该公司最初试图把它的IBM刀片服务器转变为虚拟服务器,但发现刀片技术“不适合”,因此它使用大型IBM服务器取代它们。)一个OC-3电路连接总部到存储复制数据的磁盘阵列,复制是通过位于斯特灵场地的IBM全球镜像和NetApp SnapMirror来实现的,这取代了用于12 TB的关键业务数据的备份磁带。

  在这台大型主机上,无论是恢复点目标(RPO)还是恢复时间目标(RTO),都从24小时下降到15分钟。

  对于顽固的服务器群,自2007年VMware实施以来,Zeidman的团队已经使得恢复时间从70小时降至36小时,并且对于下个月的再次测试会剃掉更多个小时的时间,他们非常有信心。RPO是15分钟。

  专家对虚拟化和DR的建议

  一位分析师警告,为他们的灾难恢复计划寻找服务器虚拟化的公司需要认识到,更快的RTO需要除虚拟化以外更多的东西。Gartner公司的分析师John Morency通过电子邮件说:“如果生产数据和虚拟系统映像仍然被备份到磁带上,服务器虚拟化本身不会为用户带来太多。实时的积蓄来自大多数情况下(如果不是全部,仅生产数据)使用磁盘到磁盘复制以及一个标准化的方法的一种组合——例如,VMware站点恢复管理器的使用——对于虚拟机备份和故障转移(这种方法也使用磁盘到磁盘)“。

  位于犹他州Midvale的Burton Group公司的数据中心战略组服务主管理Richard Jones说,除了恢复以外,一些公司,像最近的一位客户,从在其他区域的虚拟化中寻找节省时间的方法。 他说:“令它们惊讶的是,他们的DR测试时间——他们每半年测试一次——下降幅度超过50%,需要来执行测试的IT员工人数也下降了近一半。”

  差距分析为商业决策奠定基础

  快速和可靠的DR(毫不奇怪)并不便宜。 Zeidman说,他的公司的解决方案的成本达到直接承保保费的0.1%,留给读者去做这个数学计算(900,000美元)。Zeidman没有为这个解决方案做成本分析或者业务影响分析。

  Zeidman说:“我的输入纯粹来自一个操作级别。根据我的意见,我提出了在灾难恢复中我们可以做和不能做的事情以及哪些业务部分将会丢失管理意见。我告诉他们到达我们需要的点的成本,他们接受了。“

  他补充说:“最初的成本是有点令人震惊,但他们理解这个利益。”

  业务部门并不总是那么迁就。对于SunGard公司业务可用性服务,最近一次对220位IT经理和277位业务线领导的民意调查显示,当谈到灾难恢复准备,在IT经理和业务主管之间存在严重的脱节。尽管两个部门压倒多数地同意,信息对于企业的成功是非常重要,但74%的IT经理认为DR和业务连续性对于企业成功很重要,而仅49%的业务主管这么认为。
 
  Zeidman说:“在保险业,我们有很精明的管理。我们购买再保险,例如,为了确保我们能够支付任何灾难性的索赔。他们将这个看作再保险的另一个层面。”

作者

Linda Tucci
Linda Tucci

Executive Editor Linda Tucci oversees news and e-zine projects for SearchCIO.com and SearchCIO-Midmarket.com. She has covered CIO strategy since joining TechTarget in 2005, focusing most recently on big data, mobile computing and social media. She also writes frequently about the CIO role and CIO careers for SearchCIO.com's weekly CIO Matters column. Prior to joining TechTarget she was a business columnist for the St. Louis Post-Dispatch. Her freelance work has appeared in The Boston Globe and T

相关推荐

  • 灾难恢复方案:虚拟化可帮忙

    灾难复原计划过程从根本上说不是以技术为中心的,那么何时虚拟化可以使意外中断后的数据恢复更快更容易?

  • VMware食言:背弃EMC的Virtustream混合云

    在风险讨论的几月之后的现在,VMware不再参与EMC的Virtustream混合云品牌构建业务。通过8-K监管文件,VMware声明确认退出该业务。

  • 呼叫中心虚拟化有助于提升客户体验

    呼叫中心坐席越来越多地成为贵公司的代言人。让他们持续接受培训,处理整个范围的客户互动是实现客户满意度的关键一步。许多主要品牌商在虚拟化其呼叫中心,有效利用分散的且多样化的劳动力。

  • 遵义医专数字化校园建设实录

    成立于2006年的遵义医专信息技术网络管理中心是该校信息化尤其是数字校园计划的主要实施者。目前已完成教务管理系统、数字迎新及学生管理系统、办公自动化管理系统等多个网络应用平台建设。