Tp说事儿:剖析BackBlaze可靠性品牌排行疑云
- +1 你赞过了
机箱
Backblaze还把自己的创造力延伸到了服务器机架领域。他们设计了专门的storage pod enclosures,并在网络上共享其原理图。这种值得称赞的信息共享做法也有助于解读他们的“故障率”数据。
上述storage pod目前已升级到3.0版本,前两个版本进行升级都是为了解决大量的设计问题,其中最显著的问题就是震动。
震动是硬盘的大敌,会导致各种组件出现严重的磨损,震动甚至会影响性能。一般的台式机硬盘在稳定的环境中基本不存在震动,因此在设计的时候抗震性也稍差。企业级硬盘设计的主要差别之一就是抗震技术。抗震技术使得硬盘能够抵抗服务器机箱和机架的磨损,并良好地运行。
一个机箱中安装太多的硬盘会增大震动量。Backblaze在每个机箱中安装了45块硬盘,以便将存储密度最大化。硬盘最初都是遭受服务器内部邻近硬盘震动的影响,而一旦放置于机架中,硬盘还会遭受其它服务器震动的影响。这样就会产生震动的“完美风暴”,使用消费级硬盘就会导致可怕的故障率,Backblaze的数据便是最好的证明。
BackBlaze故障硬盘型号
难怪Backblaze不断地改善其机箱,以便更好地抗震:早期型号仅采用尼龙垫片减震。进一步分析其数据,我们可以发现,最早投入使用的硬盘,其故障率最高。原因很简单:这些硬盘安装在1.0版本的存储机箱里,震动问题非常严重。
不幸的是,这些硬盘绝大部分来自于希捷的产品线。由于机箱问题导致这些硬盘的年故障率高达25.4%,如果真是这样,那么希捷就不用做生意了。
Backblaze披露的故障率数据没有考虑大量的信息,将所有硬盘按照不同的机箱版本进行分组,才是负责任的传递信息方法。我们确信,较早的硬盘没有安装在最好的机箱中,3.0版本的机箱直到2013年2月份才推出。
环境
影响硬盘寿命的另外一个因素是温度。温度和湿度的变化可对硬盘寿命造成影响。通读Backblaze博客,有一条关于服务器机架温度的评论吸引了我的注意;
……过去三年,我们观察到:1)机架顶部pod中的硬盘温度相比较低层硬盘平均高出三度;2)Pod中心的硬盘温度相比边界硬盘高出五度;3)各pod无需所有六部风扇——只用两部风扇,硬盘便可维持建议的运行温度;4)热量与硬盘故障无关(至少在storage pod中是这样)。
Backblaze声称硬盘温度不影响硬盘寿命,这与硬盘制造商等许多其他人的观察相悖。硬盘运行需保持在一定的温度范围内是有原因的,尽管Backblaze硬盘可能在这些范围之内,但若温度不同则无法直接进行比较,不在温度范围之内的硬盘就更不用说了。再次重申,缺乏有针对性的信息就不可能做出真实的结论,测试环境的参差不齐毁掉了Backblaze的数据。
工作负载
每块硬盘均经过精心设计,以便在目标使用环境中提供严格规定的服务水平。这种指导原则不仅决定着硬盘的设计,而且还决定着采用的组件类型。最经济有效的硬盘设计目的是在目标环境中提供适当的性能和寿命,仅此而已。采用超出硬盘工作负载需求的强大组件是一种浪费,并且会增加不必要的成本。这种设计效率还意味着硬盘在非目标环境下更加容易发生故障。
Backblaze始终在市场上采购最便宜的硬盘,而不管其额定的工作负载,然后将它们应用于最严酷的环境之中,这样势必会破坏硬盘,导致故障率比自然状态下更高。这只能说明这些硬盘的工程设计精准地满足既定目的,仅此而已。
另外一个问题就是:即使工作负载不同,也强行在硬盘之间进行直接的比较。实际上,若没有实施同样的工作负载,则无法将同型号的硬盘进行比较,而比较不同的型号和制造商更是荒谬绝伦。没有办法计算硬盘旋转了多少次,也没有办法计算硬盘处理了多少次不同类型的数据请求。
随机数据需要硬盘磁头更多的运动,因此会给精密的硬盘磁头造成更多的磨损。旋转加速减速,进入以及从各种休眠状态恢复,时间长了也会给硬盘造成不同程度的磨损。工作负载的分配没有真正的逻辑性,更不用说环境了,所以直接比较硬盘是行不通的。
只有一件事是确定的,那就是:硬盘处理的工作负载远远超过了它们的设计极限。
思考
Backblaze的数据不应该影响任何消费者的购买决策,无论他们购买什么类型的硬盘。无数的变量,以及缺少证明文件,导致其结果不可靠。即使对于获胜者来说,测试结果也是不利的,故障率远远超出了实际的观察情况。大家应该置疑,若在实际的情形中质保返修率如此高,那么这些公司怎么能够生存下来?
我们论及了Backblaze比较方法的一些最显而易见的漏洞,但实际上还有更多的漏洞存在,比如样本数量。每种型号的硬盘数量各不相同,而部分坏的批次可能进入了样本池,进一步扭曲了评测数据。
最好的例子来自于他们自己的博客帖子“企业级硬盘:事实还是虚构?”。这篇博客帖子显示,Backblaze将可能是同一批次采购的368块企业级硬盘与14,719块消费级硬盘进行了比较。除了坏的批次可能扭曲了测试数据之外,Backblaze还承认他们将硬盘用于不同的机箱、温度和工作负载。这样导致他们的数据基本上是毫无价值的比较,不过配上一个引人注目的标题之后,这些数据确实达到了哗众取宠的目的。
我十分欣赏Backblaze的发展历程。他们决心为客户提供卓越的价值,并为此目标而竭尽全力。他们的博客帖子详细说明了他们采取的各种极端措施,读起来真是引人入胜,我相信他们享受挑战。他们的storage pod设计新颖,经过了广泛的现场测试和改善,能够提供有吸引力的每GB价格。
但是,他们用简单的图表进行虚假的展示,这样发布的数据刺激到了坚守原则的我。硬盘制造商在研发方面花费了数十亿美元,他们的实验室就是为了打造和测量其存储解决方案的可靠性和耐用性。
Backblaze的环境则刚好相反。我做梦都想不到能够在这样差的条件下开展硬盘的可靠性研究和比较。很难相信他们开展策划、召集会议、制定流程,通过各种可笑的途径采购最便宜的硬盘,把它们安装在各种不同(有时还存在缺陷)的机箱里,堆垛起来,让它们来应付完全不同的工作负载和环境条件……而做这些都是为了测试硬盘的可靠性。
这当然不是目的,但有些人会这样解读这些数据。在我看来,媒体宣传的魅力战胜了常识,Backblaze发布了这些数据,用花哨的标题吸引了众多眼球。
(以上内容译自国外科技博客)
Tp想说
这篇内容在行业内传播甚广,而对于消费者而言如何购买到一块安心得硬盘才是最真实得想法,从BlackBlaze得数据来看忽略了各种不确定得变数、无法追述得测试因素都使得整个测试结果没有意义,更不应该从一款硬盘产品得结果直接定性整个品牌素质得排名。Tp记得在刚进入媒体圈得时候,内容客观是每一个编辑在撰写内容方面被反复提及得基本要点,每个人阅读同一篇文章都会有不同得理解,而作者需要做得就是通过完全客观、公正得态度去阐明立场及表达事实,BackBlaze此次得数据以及花销得标题也仅仅是为了博取更多眼球罢了,不必太当真。
撇开这个笑话的同时,雷竞技须安全稳定 存储频道也祝各位读者新年快乐,马上有钱!
严弢
最新资讯
热门视频
新品评测