信息生命周期要求数据快速做出调整

日期: 2008-10-12 作者:Sarah Varney翻译:王霆 来源:TechTarget中国 英文

由于不能对数据进行有效地分类以及对结构化数据和非结构化数据进行合理匹配,企业对信息生命周期的管理变得异常困难。面对这样的局面,一些大型公司正试图通过增加存储来寻求补偿,而不只是采取更为有效的数据管理措施。   但又有谁会对此发出指责?   我们并不认为通过信息生命周期管理(ILM),也就是对数据进行智能存储、归档、保存、更新、以及最终的处置可以解决所有问题。然而,这的确是有希望实现的。

  ILM的真正价值在于它可以在一定程度上对公司范围内的信息循环进行处理,从而使其满足业务需求。这意味着公司员工可以根据自己的需求随时利用这些数据,而根据另一个同等高效的流程,也随时可以对这些数据进行删除。而一……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

由于不能对数据进行有效地分类以及对结构化数据和非结构化数据进行合理匹配,企业对信息生命周期的管理变得异常困难。面对这样的局面,一些大型公司正试图通过增加存储来寻求补偿,而不只是采取更为有效的数据管理措施。

  但又有谁会对此发出指责?

  我们并不认为通过信息生命周期管理(ILM),也就是对数据进行智能存储、归档、保存、更新、以及最终的处置可以解决所有问题。然而,这的确是有希望实现的。

  ILM的真正价值在于它可以在一定程度上对公司范围内的信息循环进行处理,从而使其满足业务需求。这意味着公司员工可以根据自己的需求随时利用这些数据,而根据另一个同等高效的流程,也随时可以对这些数据进行删除。而一些相对不是很重要的数据会被移交给RAID这样更为廉价的存储设备。

  专家表示,目前的问题是许多大型公司在对数据进行分类时遇到了困难。换句话说,就是他们无法确定某条信息该被存储的位置、以及该被保留多长时间。不幸的是,有太多的公司认为通过增加存储容量可以解决这一问题。

  Gartner常务董事Barry Runyon表示:“在大多数网站,数据保留政策仍然要受存储备份日程的驱使”。许多公司缺乏合适的、先进的政策来将存储设备与数据类型、或是与数据保留措施进行搭配。

  随着2006年e-discovery(“网络发现”)法规的颁布,ILM及数据存储变得越来越重要。该法规是对联邦民事诉讼条例的修订和补充,确定了数码文件和记录也应该同纸张文件具有相同法律效力的原则。

  ILM的重要性

  但是,这些结构化(指存在于ERP、客户关系管理、财务和销售点系统等等应用程序中的数据)和非结构化(存在于Word文档或emails中的数据)数据所占据的数以百万计的容量成为对其进行合理配置的主要障碍。

  非结构化数据可以存在于工作站、PDAs、电话、iPods、个人电脑、博客、Facebook、语音邮件、电子邮件、PowerPoint演示文稿、甚至是视频文件中。目前根本不可能对其各个数据块间的关系进行数据类型配置。相比之下,传统的“关联”数据却可以依据类别被存储在表格和行列中。

  Runyon表示,第二个障碍是分类难题¬——相比较数据类型匹配问题,这种分类难题要更为深奥、更为棘手。

  所有的非结构化数据都必须被分类,这意味着此类数据都必须被加上相应的描述符,通过这些描述符可以对其性质和重要性进行识别。当然目前也有一些工具能够对某些类型的数据进行分类,但他们往往不能同时工作。而且如果你不知道将哪些数据存在第一位,你就无法确定其中哪些是需要保留的。Runyon还强调,不要介意搜索多个数据类型来确定某一数据的存储位置,例如,在某些特定情况下你要对已存储的所有相关材料进行排查。

  这就要求找一个共同的方法来对数据进行智能化分类,以使数据保留政策能够与相应组织的业务目标或是遵从性要求协调一致。

  尽管说在数据分类方面还面临着严峻的挑战,但ILM相关产品的销售量仍然在持续上涨。不过,这很大程度上是受到像RAID和光盘等相关存储产品的驱动。事实上,Mass.州Cambridge Forrester Research Inc.公司已经做出预测,说受到e-discovery法规遵从性条款的刺激,到今天年底为止ILM产品销售额将从2006年的2.8亿美元增长到13亿美元。

  根据e-discovery法规的规定,各公司将会有90天的时间对相关的数据和文本文件进行检索和交付处理。

  “在医疗保健领域,我们对e-discovery法规存在很多担忧,” Runyon说,他一直致力于该领域的研究。他还表示:“如果某一天有律师来向你索要某个病人20年前病例记录,而你已经将其删除了,这将会是一件很麻烦的事情。但是,假如你有合适的记录保留政策,规定‘如果病人恢复健康,其病例记录在7年后将删除’,你就不会受到类问题的困扰。”

  “许多医疗保健机构每年都会去购买数TB(兆兆字节)的存储设备,而这只会使问题变得更糟,”他补充道。数据是被存储了,但没人能够找到它。

  目前仍然主要靠手工迁移

  在Georgia的Gwinnett County IT总部,人们对ILM背后的一些想法表示了赞赏。但是就目前而言,对于管理信息生命周期的努力一直还是集中在改善存储手段和工具方面。Gwinnett County位于Atlanta市东北30英里,占地437平方英里,拥有近800000名居民。

  “在Gwinnett County,我们大约有170TB的数据靠磁带备份。此外,通过存储整列、直接附加存储和网络附加存储等手段还可以对150TB的数据进行即时存储,”其CIO兼IT主管John Matelski在email中这样写道。他还指出,其IT部门正在努力地工作,以确保能够按照留存需求对相关数据进行高效存储。

  但是,据Matelski介绍,目前数据分类主要是基于其业务价值,对其存储等级的选择还是一个手动过程。“现在的主要问题是尽管已经出现了一些能够帮助促进ILM的工具,但我还没有找到一种能够对结构化和非结构化数据进行桥接、收集和处理的合适工具,”他解释道。

  对于一些大型的医疗保健机构来说,对于各种类型数据的存储和检索能力变得越来越关键。据Gartner公司的Runyon估计,有80%到90%的医疗保健相关数据是非结构数据。在这样的情况下,许多医疗保健公司(不论规模大小)仍然在不断购买大量的存储设备来处理各种类型的数据。

  医疗保健公司和机构在处理非结构化数据时遇到的问题极为严峻。Kirk Mahlen是一家隶属于宗教团体的医疗保健机构的前分区CIO,该机构规模在本行业排在前五位(每年销售额达80亿美元),他也表示支持这一观点。“文件影像系统目前仍然是医疗保健机构使用的主要技术。传真和纸质报告也依然在被使用,”Mahlen说。在他之前所在的公司, ILM战略方面的下一步措施将会是尽可能多的提取非结构化数据并对其进行结构化处理,使其能够被存储到Oracle公司的数据库系统中。

  尖端的解决方案正在孤独地苦苦挣扎

  目前来讲,这方面专门的应用程序解决方案还很不稳定。比如说,有些产品连接着email和文件系统。而有些附件被存在email或是服务器中。你会遇到什么问题?你得到的只是相关数据的几个副本。

  Nick Semple是PA Consulting Group公司负责知识管理服务的总经理。他补充说,重复数据删除软件帮了不少忙,可要想消除非结构化数据的副本就没那么容易了。

  Runyon表示,从一定程度上讲,数据分类和SRM(存储资源管理)工具都可以发挥一定作用。“所有的存储设备供应商都拥有他们自己的SRM工具,但他们没有实现兼容,”他说。

  因此,必须找出其数据来源和时间才能将这些问题解决。

  Runyon补充说,无论是这两大阵营中的哪一个(数据分类工具供应商或是SRM供应商)都会做长期考虑,看ILM究竟能否成为现实。在将来,存储方法将变得无关紧要。数据分类工具很有可能会完全融入SRM工具。

  Runyon表示,如果ILM问题不能得到解决,医疗保健部门在三到五年内将会面临一个危机。到那时,相关的遵从性要求将会把这些医疗保健机构埋葬在数据之中。“但是,毫无疑问ILM最终将会取得成功,” Runyon 说,“为了取得这种成功,已经有太多的钱被投入到了这一领域。”

作者

Sarah Varney
Sarah Varney

Technology Editor

翻译

王霆
王霆

相关推荐