数据简化技术是当今企业级数据存储中一个热门的话题,其原因也是显而易见的。简化数据带来的优势不仅会节约存储空间,而且也会减少线缆,交换机端口,供电以及制冷设备的使用。此外,数据简化技术同样会带来时间,成本以及运维方面的工作量上的节省。本文介绍了针对中小企业环境下的主存储上的数据简化技术,其内容包括了重复数据删除技术,数据压缩技术,基于内容识别的压缩技术以及源端后处理数据简化技术。
重复数据删除技术 重复数据删除技术得益于它能够对重复的文件,数据块等进行消重处理,因而成为一个不错的数据简化技术。重复数据删除技术使得次级存储上的数据占用率大大降低,原因是在源端待备份,快照或者复制的目标对象中……
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
数据简化技术是当今企业级数据存储中一个热门的话题,其原因也是显而易见的。简化数据带来的优势不仅会节约存储空间,而且也会减少线缆,交换机端口,供电以及制冷设备的使用。此外,数据简化技术同样会带来时间,成本以及运维方面的工作量上的节省。本文介绍了针对中小企业环境下的主存储上的数据简化技术,其内容包括了重复数据删除技术,数据压缩技术,基于内容识别的压缩技术以及源端后处理数据简化技术。
重复数据删除技术
重复数据删除技术得益于它能够对重复的文件,数据块等进行消重处理,因而成为一个不错的数据简化技术。重复数据删除技术使得次级存储上的数据占用率大大降低,原因是在源端待备份,快照或者复制的目标对象中有大量的重复数据,而这些在到达次级存储前都进行了重复数据删除操作。重复数据删除比率由10:1到500:1不等,根据数据的不同类型以及时间帧的不同而有所不同,这也是为什么当今大多数备份软件,虚拟磁带库以及备份目的端存储设备都内嵌有重复数据删除技术。
然而大多数数据存储管理员们都对这项应用于目标存储上的主存储重复数据删除技术未感到明显的兴趣。一些知名厂商的系统比如EMC公司的Celerra、Data Domain、ExaGrid公司的EX系列、NetApp公司的FAS以及V-series,当他们应用于主存储重复数据删除技术的时候,并没有表现出于备份、快照或者复制源端进行重复数据删除技术的明显优势。并且他们在白皮书中所承诺的消重比率和用户或者供应商所实际测试结果相比也有所差距。导致这一差距的原因在于,没有那么多的数据可以进行重复数据删除操作并且重复数据删除算法对压缩数据上的应用也并不太完美。数据压缩操作会改变数据块的组成并极大的减少了重复数据块的存在。许多非结构化的目标数据,比如微软office系列的数据(pptx文件、docx文件以及xlsx文件)、JPEGS格式、MPEGs格式、PDFs格式、ZIPs格式等文件都是经过压缩处理后的。
重复数据删除技术面临的另外一方面的挑战则是应用以及用户性能。比如说,写或者读的数据响应时间可能会被影响。同样,写性能可能会由于采用了内联重复数据删除技术或者后处理重复数据删除技术而被降低。内联重复数据删除技术由于需要在数据被真正写入存储前就进行重复数据删除操作,因此会产生一定的延时。读性能也会因此而受到影响。这方面的性能降低可能不会对一些例如虚拟机黄金系统镜像以及ISO文件方面的应用产生负面的影响,反而会达到最好的消重效果。
数据压缩技术以及主存储设备
根据生产环境下用户以及供应商对主存储重复数据删除技术的测试,数据压缩技术,比如StorWize公司的STN设备,表现出来的消重性能略胜于主存储上的重复数据删除技术。数据压缩技术会将所有的零位从原始数据中去除,相比主存储上重复数据删除技术,这样操作的方式会达到同样或者稍好的效果,并且对系统性能的影响几乎是为零的。然而,对于已经压缩过的数据来说,数据压缩技术的意义并不太大。最合适数据压缩技术的还是一些结构化的数据,比如数据库和电子邮件,同样也包括一些未被压缩过的数据。
基于内容识别的压缩技术
基于内容识别的压缩技术,比如像Ocarina Networks公司的optimizer,是完全不同的另外一种主存储上数据简化技术。这项技术相比于重复数据删除技术以及数据压缩技术都更有优势。这是一项后处理的技术,首先会将数据从其原始的格式解压缩,之后会将其重复的存储对象做删除操作,之后再将处理后的对象重新进行压缩操作以恢复其原有的格式。如果之前数据并未进行过压缩操作,它会直接将重复的存储对象删除后再进行压缩操作。
这项技术的缺憾来自于部署其于环境中的前提条件。在使用基于内容识别的压缩技术的时候,需要将放置一个读码器和一个解码器来允许用户或者是应用本身读取重复数据删除和压缩后的数据。读码器可以存在于用户的工作站上、服务器上、应用上或者就是存储系统本身上。
基于源端的后处理数据简化技术
第三种主存储数据简化技术是基于源端的后处理数据简化技术,这也是推荐给中小企业环境的。这种类型的数据简化技术同样是可内容识别的但和之前的技术不同的是,它在将内嵌图片转化为最合适的文件格式和解析度的时候的操作是通过将“超过大小的部分“删除的。这样的效果不仅能大大减小文件的大小同时也能满足不影响视觉内容完整性的需要。基于源端的数据简化文件优化技术可以应用于文件服务器或者桌面计算机上并且在价格上对于中小企业也是不错的选择。基于源端的数据简化技术支持微软office系列文件以及JPEG格式的文件。同时,这种技术的效果也类似于其他内容识别技术。此外,它也并不需要用其他的软件去打开或者读取那些已经被优化过的文件。换句话说,任何用户都可以在他们的工作站上读取并且更改一个已经优化过的微软Office格式或者JPEG格式的文件而不需要指定特定的软件。
然而,基于源端级别的后处理数据简化技术仅局限于它所支持的文件类型。它也并不能支持其他类型的文件或者数据库。另外,它必须安装在文件服务器上或者桌面计算机上。
总的来说,上述所包括的每种主存储数据简化技术都可以适用于中小企业环境下的主存储数据简化规划中。每种技术都能提供相当不错的数据简化效果,但每种也都分别有各自有待发展的地方。每个数据存储环境也是不尽相同的。最关键的一点就是选择合适于自己环境的主存储数据简化技术,合理的使用它并使得在最低成本下能提供最佳的数据简化性能。
作者
相关推荐
-
小企业电子邮件归档方案分析
小企业电子邮件归档解决方案的选择需要谨慎考虑。本文你将学会如何寻找电子邮件归档工具,以及云计算的出现如何能作为可选的电子邮件归档解决方案。
-
专家手把手教你如何选择备份
本文专栏作家Brien Posey先生以Q&A的形式与助理编辑John Hilliard交流了一些适用于小型企业备份的各种方案,以及各自的优缺点。您可以直接听原音频或查看下文。
-
五步更好管理企业数据
考虑到不断膨胀的信息数量以及它所代表的潜在危险,一旦信息不受保护,各机构团体要怎样才能掌控它?
-
小型企业如何以低预算处理海量数据
目前,我们正处在一个数据暴增的时代,许多小型企业由于没有相应地提高IT预算,而对海量数据带来的挑战显得力不从心。