跨过云计算部署失败的十故障

日期: 2012-12-05 来源:TechTarget中国 英文

  每一个云计算供应商,从谷歌到Rackspace,从亚马逊到Salesforce.com,都曾经遇到过断电的困扰。当这些断电情况突发时,人们就开始质疑云计算的可行性。但是这对于那些投资人来讲,这些只不过是云计算的成本之一,这并不能动摇他们对云计算投资的决心。

  断电现象几乎会发生在我们所消费的每一项服务中。今天,即便iPhone 4有着惊人的掉话率,苹果公司仍在享受着创记录的利润。然而,那些质疑智能手机或者iPhone还有Apple的可行性的言论又在哪儿呢? 这些发生在数据中心里的断电事件随处可见。那些质疑内部IT部门可行性的言论呢?你上一次断电时什么时候?你是否质疑过国家电网的可行性? 你可以采取很多措施来应对断电情况的发生——使用备用发电机(在云环境下可以备份数据),但是这些措施并不能解决根本问题。停电是服务商的问题,而不是你的问题。

  与其它常见的故障一样,用户在决定成功或者失败的时候扮演着更为积极的角色。以下列举出一些企业们引进云计算的时候出现的最常见的错误。

  1. 没有清晰地定义“成功”这一概念

  很多公司都视云计算为今天包治百病的良药。底线存在问题?引进云。难以保证远程员工的生产性?相信云。是否越来越多的员工在家里工作?也许云可以帮忙。

  “制定不切实际的期望值是企业出现云计算问题的头号原因,”ISACA(国际信息系统审计与控制协会)副主席Robert Stroud说。

  “很多企业都认为他们只需要向云供应商提出自己的要求,然后,一切就将像童话故事里一般自己完美地运作。”

  如果那是你在家里设置了一个新的应用程序,你还会那样天真么?如果你没有制定具体实际的目标,那么,当云计算辜负了你的期望的时候千万不要感到惊讶。

  2. 落后的计算概念

  今年年初,Heroku因为亚马逊EC2的断电而彻底傻了眼。Heroku为Ruby on Rail提供了亚马逊托管的云部署平台。当天气因素导致断电,Heroku亲眼目睹了它的整个架构伴随着平台上四万多个应用程序在一瞬间灰飞烟灭的过程。

  事实上该公司早就为排除故障和冗余做了自己所能想到的一切。但是他们没有意识到的是,自己把所有的一切都托管给了一个单一的亚马逊“可用区域”。

  事后,亚马逊与Heroku通力合作,很快就追回了他们的平台,但是通过这次事故却可以看出计算理念的落后可能破坏云计算所作出的努力。故障转移、备份、和信息冗余比较容易在计算世界中进行虚拟化。如果你对现场进行了备份,那么你就能一直保持良好的状态。

  “云计算中的稳定性是复杂的,这是我们吸取的教训之一,”Heroku的首席执行官Byron Sebastian说,“云架构是一个完整的解决方案,这是一个云计算的谎言。就像任何其它IT系统一样,在云中你同样需要附加软件。”

  因此,为了给用户提供诸如先进的故障转移、负载平衡和信息冗余等服务,Heroku扩大了自己的平台,所有的一切都为云托管的应用程序量身定制。

  3. 不能坚持让服务供应商负责

  Heroku是幸运的。在他们面对困难的时候,亚马逊及时向他们伸出了援助之手。其他人可能就没有这么幸运了。浏览一下主要的云计算平台用户论坛,你就会发现大量不满的宣泄。

  “某某厂商丢失了我所有的数据但是却对此置之不理!”像这样的抱怨不计其数。(这种抱怨的言论后面通常添加了很多感叹号。)当然其中不乏一些自己把事情搞砸了却想找人发泄不满的人,也有一些心理不平衡的疯子,但是确实有不少合理的抱怨。

  有些人屏蔽了关于其他用户对于服务厂商的抱怨记录,我与这些人中的很多人谈过,但是很少有人会对这些由用户服务所产生的争论进行讨论。

  Novell的商业服务管理解决方案市场部经理Michele Hudnall给我发邮件的时候强调了清晰定义服务水平协议(SLA)的重要性。Hudnall提醒说,必须小心缺乏服务水平协议、模糊定义服务水平协议和那些整体服务管理不佳的情况。

  在关键业务出现问题的时候,哪怕只是在很短的时间内,企业就可能失去1%到2%的收入。当发生这种情况的时候,坚持要求服务供应商负起责任非常重要。这可能意味着需要就你的合同和服务水平协议中的赔偿条款和补救措施进行重新谈判。

  Gartner最近起草了一份云供应商应该履行的消费者权益清单。其中包括服务水平协议中解决负债、补救措施、业务指标等条款;影响用户业务流程的服务项目的改变的告知权;了解系统技术限制的权利等等。

  4. 你自己未能负起责任

  即便你拥有一个具体的服务水平协议,也不意味着在出现问题的时候就可以摆脱困境。举例来说,如果你在云中存储了敏感客户数据,之后这些数据遭到别人的破坏,这将引发什么?难道你真的认为仅仅用服务水平协议就可以解决问题了吗?谁将为你的客户负责?没错,必须是你。

  本月早些时候一个AT&T的安全漏洞泄露了超过十万iPad用户的邮件地址。大多用户都把矛头指向了苹果公司,但其实问题出在AT&T的云服务上。

  这只是一个小小的漏洞。毕竟,大多数人的邮箱地址已经被大量的垃圾邮件入侵过很多次。然而,如果泄露的内容是信用卡或者是其它个人信息,苹果将面临的问题就不像iPhone 4遇到的天线问题那么微不足道了。

  “你永远不可能摆脱责任,”Stroud说。“云供应商可能是你的信息托管载体,但实际情况是,如果出现任何差错,名誉扫地的将会是你。”

  5. 缺乏对供应商的仔细调研

  几乎每个服务厂商、托管公司和互联网服务提供商都标榜自己是“云供应商”。然而,并非所有的云供应商都一模一样。虽然对谷歌、亚马逊和IBM下注似乎在近几年内相当安全,但是你也不能就此认为所有的云计算创始公司都拥有相同的服务水准。

  如果你的云供应商出现问题了怎么办?去年云巨头Coghead的崩盘让所有人看到了忽略供应商调查会冒多大的风险。Coghead依靠低廉的价格来拉拢客户。然后当出现财务问题并且不能筹集更多的风险资本的时候,它做出了这样的决定,让客户们在短短几周的时间内将其数据撤离该公司的系统。

  其实事情可能会更糟。如果你的云供应商在没有预先通知的情况下直接倒闭了呢?如果发生其他更不好的意外呢?

  6. 对于服务供应链了解甚少

  即便你的云供应商的名誉十分可靠,你是否确信他们提供的服务同样可靠?云供应商越来越喜欢将自己的服务外包给第三方。了解整个服务供应链对于准确判断你将签约的服务的可行性十分重要。

  如果你正在面对一个大型云供应商,你的手上至少需要有一个他们的把柄,这样,负面信息可以激励他们去解决问题。至于较小的厂商,就需要你自己来把握了。

  7. 忽视管理和监控应用程序

  很多企业都错误地认为管理和性能问题将在实现云以后消失。“对于传统的应用程序,你将花费80%时间和资源在管理和监控上,”Sebastians称,“云能够有效地节省这部分时间和资源,但是不能将它们降低为零。”

  如果你的应用程序表现不佳,你的客户将不会责怪云供应商,而会指责你。“你的应用程序里将会出现错误,这是不可避免的,”Sebastian说,“有了正确的性能管理和监控工具,你将会在一切成为灾难之前拥有更多的机会来发现这些错误。”

  8. 对财务现实的无知

  很多企业引进云是因为它比设置内部IT部门廉价。一般情况确实如此,但是即便是云服务更便宜,企业也应该看到它昂贵的本质。

  为什么这么说呢?

  “我们对于今天在各种技术上的花费知之甚少,”Stroud说。

  这也不完全是你的错误。IT系统的财务透视确实是一个棘手的问题。许多经费并不透明。谁消耗了什么?谁支付什么?谁可以消耗多少?对于许多IT部门而言,这些问题的答案可能十分模糊。伴随着云的发展,这些问题的答案将变得更加不明朗。

  9. 不了解云在法律上的繁琐程度

  当你外包计算资源的时候,你的业务即便再小也可能会冒一定的的法律风险。你可能需要遵守不同司法管辖区的法律,你也可能会面临不同的法律责任,这取决于你的数据到底在哪儿。

  据Gartner称,“服务供应商对于他们将数据存放在哪个司法管辖区和他们的用户必须遵循的各种法律规定的解释并不明了。”

  遵守行业规范也是件比较麻烦的事情。即使云服务能够限制风险并且在技术上使你的兼容性更强,你也需要一段艰难的时间来证明这一点。

  10. 对云计算的误解

  最后,云部署失败的最大原因是因为企业们并不了解云的本质。许多公司发愁的问题其实并不是他们自己数据中心里存在的问题。断电、安全漏洞和兼容性问题是全体IT界需要面临的挑战,而不单单是云。

  事实上云所解决的问题比它制造的问题要多的多。云可以减少你的IT管理和维护麻烦,可以让你把注意力从IT转移到核心业务上去。对于云的误解是一个巨大的错误。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

相关推荐

  • 灾难恢复规划中应避免地架构错误

    今天IT系统的复杂性要为系统宕机的80%负责,但是公司还在用相同的方式设计他们的灾难恢复系统。本文提出了灾难恢复规划中已犯的三个错误。

  • 技术支出更多地从IT流向业务

    业务技术支出(不受IT控制的部分)的比例将会达到35%。在本系列采访的第一部分中,Prentice解释了比例上升背后的驱动因素,并谈到资金的去向。

  • 拒绝推诿 可持续管理应用

    系统的建设逐渐增多,维护和稳定性开始受到新的挑战。伴随IT系统复杂性的不断提升,应用管理服务越来越成为企业释放IT价值的重要手段之一。

  • 企业IT系统协同集成技术探究

    企业IT系统集成就是概据企业IT企业的战略要求,对市场所有的或自行开发的技术和产品进行合理的选择,采用适合企业IT企业发展的计算模式和体系结构……