小企业存储与中端存储系统购买指南

日期: 2014-04-21 作者:Marc Staimer翻译:冯昀晖 来源:TechTarget中国 英文

存储系统过去二十年来的变革已经极大地超越了所有其它IT技术领域的发展,并且这种创新变革趋势并没有减缓的迹象。在IT运营中我们需要对中端存储提出哪些要求?当前以及新兴的中端存储技术类型在满足这些需求方面有什么差异?一起来看本文的分析。 中端存储的内涵和外延 中端存储通常是指那些比直接附加存储(DAS)更可靠的更具性能的存储系统,但是比企业级存储在性能和可靠性方面都要差一些。从历史来看,中端存储系统会卖给中小型企业(SMB),作为他们的主存储系统,也会卖给大型企业的分支机构或者部门级运营使用。

通常,中端系统提供像重复数据删除和复制这类功能,还有多种连接方案可选(包括iSCSI、REST和光纤通道)……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

存储系统过去二十年来的变革已经极大地超越了所有其它IT技术领域的发展,并且这种创新变革趋势并没有减缓的迹象。在IT运营中我们需要对中端存储提出哪些要求?当前以及新兴的中端存储技术类型在满足这些需求方面有什么差异?一起来看本文的分析。

中端存储的内涵和外延

中端存储通常是指那些比直接附加存储(DAS)更可靠的更具性能的存储系统,但是比企业级存储在性能和可靠性方面都要差一些。从历史来看,中端存储系统会卖给中小型企业(SMB),作为他们的主存储系统,也会卖给大型企业的分支机构或者部门级运营使用。通常,中端系统提供像重复数据删除和复制这类功能,还有多种连接方案可选(包括iSCSI、REST和光纤通道)。性能度量多少有点争议,通常用IOPS和吞吐量来度量。一般业界基准包括针对存储区域网络(SAN)的SPC-1、SPC-2,还有针对网络附加存储(NAS)的SPECsfs。

企业对中端存储的需求

通常中端存储需求可以分六个方面关注:容量、性能、可管理性、数据保护、技术更新和总拥有成本(请看下面的详细描述)。

中端存储需求

优点

 容量

选择的中端存储系统必须能在存储系统的生命周期内满足或者超过组织的可用容量需求。

 性能

选择流程中的关键是要把应用程序和用户性能需求以最具成本效益的技术相匹配。
 可管理性  把中端存储专家的需求与组织当前以及未来的能力相匹配非常关键。如果不匹配将会带来严重错误,管理员的不满以及不良体验。
 数据保护 在选择中端存储系统时,要选择在规定预算内能提供所有需要数据保护的产品。中端存储数据保护分层的方法最有意义。

 技术更新

技术更新在将来某个时候可能成为问题。具体会带来多少问题取决于在中端存储系统中选择的技术。

总拥有成本(TCO)

总拥有成本TCO是购买中端存储的一个关键要素。要确保在比较不同系统以及最终比较总拥有成本时考虑是对等公平的,要包括进来所有因素,不要出现意外开支。TCO一般是用资本支出(CapEx)和运营支出(OpEx)来衡量的。常见的TCO度量是按每TB来计算的。

容量

硬盘驱动(HDD)是在中端存储系统中提供容量的主要技术。现今可以找到的高容量HDD主要是SATA或者近线 SAS(NL-SAS)接口。这两种都是每分钟7200转的。从历史上来看,SATA和FATA都一直是中端存储高容量HDD的可选方案。当FATA逐步停止使用,NL-SAS超过了SATA占据了高容量中端存储系统HDD的统治地位。这种来源于NL-SAS的内部双端口,有较低的静默数据错误,价位也非常接近于SATA。

中端存储可以有三种方式扩容:向上扩容,横向扩容或者两种方式的混合扩容。向上扩容意思是存储系统可以在单个或者两个控制器系统中处理许多硬盘。有了高容量HDD抽屉和中端存储系统中SAS在底板上的实现,在小空间内扩容变得更容易了。横向扩容支持通过以集群或者网格架构的方式添加更多控制器(通常称为节点)来扩展容量。混合模式的意思是在同一套中端存储系统中同时采用了这两种手段。

性能

对于中端存储系统的性能,有许多谣言。它是一种端对端的生态系统,也应该以这样的方式管理。在研究中端存储的性能时,首先要考虑的因素是速度和驱动器数量。HDD速度主要有每分钟15千转,10千转和7200转这几种。较快的RPM(每分钟转数)可以认为是更高的IOPS和更快的吞吐量。更多的驱动数意味着更多的IOPS总数和吞吐量,直到达到底板的限制。Short-stroking HDD(只使用HDD驱动盘片的外层部分)增加了IOPS和吞吐量,但同时极大地降低了可用存储量。固态硬盘(SDD)紧跟着利用了NAND闪存。它们与HDD相比,通常能以更低的容量,花更高的成本提供更出色的IOPS和吞吐量。

性能也受存储网络类型的影响,主要网络类型是:SAN、NAS和云计算。SAN通常延时最短,可以理解为有更大的IOPS,但是也并不总是那样。最高的带宽性能,最低的延时非InfiniBand莫属,它现在就能达到40 Gbps,而且在一年内将达到56Gbps和100Gbps;其次是FC,能达到16Gbps;然后是FCoE/iSCSI/AoE,能达到10Gbps,到今年晚些时候能达到40Gbps。NAS性能也会随着2011年pNFS或者并行NFS的发布而有所提升(并行NFS使用多个端口就好像使用唯一虚拟通道一样)。延时仍然是个问题,但是带宽问题将不复存在,因为FCoE,iSCSI和AoE都运行于相同的以太网。即使利用REST HTTP的云存储网络也可能存在来自目前一些供应商SAN的延时。

其它影响中端存储性能的因素还有:

  • 存储网络端对端的带宽和延时;
  • 存储控制器的IOPS和吞吐量限制(目前大部分中端存储还是x86架构,遵循摩尔定律,而有一些有额外定制的ASIC或者FPGA);
  • 内存和闪存容量,它们可以加速写入、读取,或者两者都包括;
  • 连接到HDD或SSD的控制器后端带宽;
  • 自动存储分层软件;
  • 重复数据删除和(或者)压缩;
  • 控制器或节点数量(许多横向扩容中端存储系统有严格的每系统镜像节点数量限制,因为节点多了以后性能会开始打折扣)。

可管理性

中端存储作为一门学科项目的日子已经变成了预期与规则的比较。中等存储的运营价值主张已经在转移向把专业知识构建进存储系统,而不是管理员。NAS系统这么做已经有一段时间了,戴尔EqualLogic为SAN开创了这种可管理性类型。它已经成为了较高端的中等存储筹码。即使是以手工任务比其它存储网络更加繁重而知名的光纤中端存储,也变得越来越自动化了。

重要的是要注意,仍然有许多中端存储系统缺少这方面的复杂性和自动化级别。这些系统通常远比自动化系统成本低,而且可以有多种方式调试性能,尽管它需要管理员具备一定的专业知识。

数据保护

有许多种方式可以保护HDD故障或不可恢复的读取错误,这种故障出现的频率远比制造商宣称的概率要高。RAID是最常见的HDD数据保护措施,但RAID在重建、数据丢失和性能方面开始出现问题。这推动了RAID的创新,例如,三重奇偶校验RAID,加速了RAID重建的宽条带RAID;而且RAID实际上是HDD或者SSD的自我修复功能,极大地降低了重建需求。甚至有更多非RAID替代品的创新,例如:多副本镜像取消了奇偶校验,降低了副本,增加了可用存储,而且支持从多个位置和HDD提取数据。最新的免RAID创新去掉了基于代码的存储,这样就整体上淘汰了数据重建的概念。擦除代码把数据分成若干快,并且是按线性方程存储这些块数据,而不是按块存储。这样就降低了数据副本的数量,增加了可用存储量,降低了成本并且极大地增加了数据的恢复能力。

针对恶意软件、损坏、意外删除和人为错误的保护通常由复制写(COW)快照或者重定向写(ROW)快照提供。这两种方式几乎都是即时的,实际上它们只拷贝元数据或者数据的指针。COW有两倍的写性能损失,限制了每天的快照数量,但是通过复制数据到较低成本的执行层可以节约成本。ROW没有双写损失,它可以执行几乎无限的快照,但是也要复制数据给同样昂贵的存储层作为原始数据。

针对系统或者站点灾难的保护可以通过系统对系统的镜像或者复制来实现,或者通过迁移过时数据来实现,或者被分发的数据,备份数据或者特大数据量可以交给云存储。

技术更新

中端存储系统历来就是单一的或双活动控制器的(集群方式)。它们有一整套技术使用寿命,由于存储容量的消耗,更新版本的HDD和SSD不支持等原因,每三到五年就需要技术更新。这种技术更新通常需要密集的手工任务做数据镜像,应用程序破坏和消耗时间的流程。在时间和金钱方面的代价也十分昂贵。

较新的中端存储技术已经消除或者减轻了技术更新的大部分痛苦。横向扩容中端存储系统,存储虚拟化(针对文件或者块),尤其是基于对象的中端存储系统使得技术更新相当容易。给系统增加新节点,就会被自动发现,然后进行数据复制,然后删除过时的节点。所有这些都可以在线执行,而无需用户现场干预或者应用程序中断。

总拥有成本

TCO(总拥有成本)如何度量有很多种方法,这与供应商有关。关键是要确保每种中端系统都考虑的相同的度量方式。中端存储传统上需要提前采购最大容量或者接近最大容量,然后与供应商谈判最好的价格。这就构成了系统整个前期价格的很大一块,不过它最终也只是TCO的一小部分。TCO由中端存储系统、软件和支持的基础设施的资本支出成本组成,还要加上业务扩充成本,包括楼层空间、机架空间、管理员、硬件维护、软件维护、认购费用、专业服务,还有最重要的能源提供或者制冷需求成本。大部分分析师估算中端存储的业务运营开支(OPEX)大约是资本支出(CAPEX)成本的400%到600%。这是一个很好的经验法则。当然也可以实际计算业务扩充成本。

TCO通常会分成“原始容量”与“可用容量”。要公平合理真实地对比,最好是比较“可用容量”。这就意味着要计算数据保护功能的消耗(供应商可以在此提供帮助),还要估计数据减缩功能(比如重复数据删除和压缩)的积极影响。重复数据删除和(或者)压缩增加了有效的可用空间,具体增加的程度与数据类型有关(数据有结构化的,非结构化的,已经压缩的,或者已经加密的)。一般凭经验估计的话,可以认为是可用容量的两到三倍。

传统观点认为基于闪存的SSD太昂贵了,不能为高容量存储替换HDD。这种常规认识有可能是错误的。中端存储供应商已经有了新的收获,它们在关注MLC或者EMLC NAND闪存,期望它可以提供更具成本效益只有闪存的中端存储系统。有家供应商目前提供中端存储系统可以扩展到250TB,而价格点与基于HDD的系统基本相同,同时提供相同甚至更好的软件,而且能巨大地提升性能。还有更多的供应商今年秘密行动,要把基于纯闪存的中端存储系统扩展到PB级。如果性能和价格都可行的话,它们可能成为可选的替代品。

改变中端存储总拥有成本的另一个因素就是云存储,因为云服务供应商可能只按月消耗量计费。公共云存储使得这成为了一种纯粹的按使用量收费的模型。私有云存储按软件可用存储的每GB,加上支持其运营的前期的和未来的物理基础设施成本来收费。这种可变的存储成本模式极大地降低了中端存储的总体拥有成本,它是通过消除或者降低前期成本的同时消除或者转移不用的存储来实现的。

相关推荐