- 易迪拓培训,专注于微波、射频、天线设计工程师的培养
固态硬盘大评比
在2010年底,百佳泰(Allion Test Labs, Inc)针对当时已上市的固态硬盘(Solid State Drive,SSD)发表了”SSD品质真相大公开–市售SSD专业测试评鉴报告”这篇文章,并获得网友与其它读者们的热烈回响,为了更进一步让消费者了解近期的SSD产品,以作为选购参考,并提供相关厂商产品开发时品质把关的注意事项,我们于2011年上半年再度针对市面上能取得到的相近容量与价位水准的SSD产品,进行专业的测试验证分析,并将测试结果报告公开提供给所有读者参考。
为求本测试评鉴的公开与公平性,我们特别在此列出拣选受测SSD的条件,以及在我们可公开范围下的测试环境与评估指针如下,百佳泰希冀以最为中立客观的方式,将本次测试结果忠实呈现:
受测SSD条件
1. 于2011年初在市面上可购得之产品。
2. 储存容量标示为250GB或256GB之产品。
3. 在相同购买管道上,价格水位落在美金500~650元区间的不同品牌产品。
4. 产品本身宣称读取速度最高可达200MB/s~300MB/s之间。
根据以上的样本选择条件,我们挑选出来的八颗SSD可参考附表一所示。
测试环境
1. 相同受测平台:采用完全相同的计算机系统与受测SSD相接进行测试。
2. 相同测试工具:媒体读写效能测试工具及读写效能评估仿真测试工具。
3. 相同测试情境:包括整体读写效能、64K持续读取效能、64K持续写入效能、16K随机读取效能、16K随机写入效能、4K随机读取效能与4K随机写入效能。
4. 相同测试档案:采用相同的多种格式档案与受测SSD进行读写测试。
5. 相同受测时间:执行连续7天长达168小时不间断的测试。
评估指针
1. 可靠度(Reliability)
2. 效能评估(Performance Evaluation)
3. 效能稳定度(Performance Stability)
4. 效能退化(Performance Degradation)
在前述的测试环境与评估指针下,这八颗受测SSD在经过七天连续测试后的结果评估可以简单整理如附表二,其中有四颗SSD在较多评估项目中都拥有良好的表现,至于如何得到这样的结果呢?详细的内容请见文中的测试评估分析:
评估指针一:可靠度(Reliability)
这个评估指针的目的在于观察SSD在读取与写入资料的过程中,是否会出现资料存取错误的情形,包括读取/写入不完整、写入后资料遗失、资料产生坏文件等等的都属于资料存取错误的状况。正如我们在前一次的评鉴报告中所提过的,SSD作为以储存为用途的媒介,最重要的便是能否达到正确储存并保存资料内容的使命,任何的档案毁损漏失,对产品本身都是致命的伤害,也很可能对使用者造成难以弥补的错误。因此,可靠度这一项评估指针可以说是SSD必须通过的基本关卡。
在实际的测试中,我们会先检视SSD的外观规格是否接能符合规范、并被计算机主机端正确读取,接着,并会透过实际的读写以及比对测试,来确认受测SSD在功能上能否读写资料、以及读写的内容是否正确,在这个测试情境中,我们运用的是百佳泰研发的”Allion SSD Stress Pro Tool”这套工具来作自动化的测试执行与结果观察比对。而最后的结果是,所有受测SSD在这一关都能顺利通过测试。
评估指针二:效能评估(Performance Evaluation)
诚如我们所知,高速传输始终是SSD 标榜的一大特色,因此在这个阶段我们便试图仿真出实际的使用情境,来观察这些受测SSD在处理不同大小型态的档案时,会产生怎样的效能表现,同时,更将这样的结果与这些SSD各自宣称的效能加以比较,来确认他们的实际效能是否能真实符合所宣称的数据。
(一)单纯效能测试结果比较
效能评估指针透过前面提到的媒体读写效能测试工具及读写效能评估仿真测试工具,来进行前述所提到七个测试情境。在经过七天连续的测试之下,每一颗受测SSD的平均效能表现如表三所示:
由于每颗SSD测得的效能表现各不相同,因此在同样进行完整七天测试的条件下,所测得的读写次数会因该SSD读写效能的快慢而有差异,读写效能越佳越快的SSD会记录到较多的读写次数;反之则会记录到较少的读写次数。因此上面所有测试结果均是依照这七天中每颗SSD的全部测试结果除以所有读写次数来作计算,以示公允。
以上是这八颗受测SSD在七个测试情境的平均数据表现结果,若以图像化的方式来比较,则可以得到如附图A这样的画面:
从这样的柱形图便可以清楚看出,不同SSD在各个测试情境的表现各不相同。平均来说,各颗SSD在处理较大档案时(64K档案读写)都比处理较小档案时(16K与4K档案读写)来的快。其中特别值得观察的是,尽管一般来说通常各个储存媒介在读取资料的速率通常会比写入资料时的速率来的快,不过Samsung的这颗SSD却在不论执行64K、16K、与4K大小的档案时,读取或写入的效能速率都有非常相近的表现,并且在八颗之中平均而言是效能表现最好的。而其中最需要注意与加强的则是Patriot的SSD,虽然在64K档案读取与写入时都还有160~170MB/s左右,但处理16K与4K时则大幅降到22MB/s甚至趋近于3MB/s左右的速度。
整体而言,就单纯比较八颗SSD的测试效能结果来看,以ADATA、Intel与Samsung的三颗受测SSD表现最为出色。
(二)宣称效能达成度比较
除了将这八颗SSD作齐头式的效能比较外,为了解该产品的实际表现是否能符合其所宣称的效能,我们也将这八颗SSD的测试结果与产品外包装所标示的”最高读取/写入速度”进行比较。我们在这里选择的是这七个测试情境中平均效能表现最快的”64K持续读取”与”64K持续写入”,并且采用的是七天测试过程中各颗受测SSD的最佳读写效能,来看看在这168小时中,受测SSD是否能够达到他们所宣称的效能。(由于我们在此使用的是”64K持续读取与写入”的最佳与平均测试结果,并未囊括所有可能的使用情境,因此仅代表各颗SSD在这些测试情境上反应宣称效能的程度)
表四即为实际的最佳效能测试结果与宣称效能的数据整理,透过图表可以发现到,八颗受测SSD中仅有OCZ的产品在64K的持续读取与写入时两种测试情境都达到所宣称的效能,而OCZ也是唯一一颗在实际测试中能达到所宣称”读取”效能的SSD。整体而言,在读取效能部分,虽仅有OCZ达到宣称效能,其余七颗SSD也至少能达到83%至97%的宣称效能;至于在写入效能部分,则有六颗SSD能达到各自所宣称的写入效能,其余两颗也能达到90%至96%的宣称效能部分。
那么假设不只看最佳效能,而是以平均效能来与宣称效能作比较呢?表五即是平均效能测试结果与宣称效能的数据整理,可以看到在读取效能部分,没有一颗SSD能达到宣称的水准;而在写入效能部分,则是有其中四颗SSD能达到宣称效能,另外半数则不能达到。
根据受测结果与各自宣称效能的达成度比较来看,在本次测试中以OCZ的SSD表现最为出色。
评估指针三:效能稳定度(Performance Stability)
第三个评估指针主要在评量SSD的效能表现是否稳定,意即SSD在执行多次的读写动作时,是否皆能维持相近的表现水准,尤其是当经过长时间持续、动态使用与完整使用所有储存区块的状况下,更容易发生效能稳定度产生变化的情形。在这个评估指针中,我们分别运用统计学的三种衡量面向来进行分析,并设定评估标准如下:
· 效能常态分布情形(Performance Normal Distribution):
95%以上的测试结果(效能表现)落点都需落在平均效能的正负10%之内,低于95%即为不合乎标准。
· 极端值之落差(High/ Low Gap Over Mean):
领先群(前10%最佳效能表现的平均值)与落后群(后10%最差效能表现的平均值)的差距必须小于所有平均效能的20%,超过20%则为不合乎标准。
· 标准变异数离散程度(Standard Deviation Over Mean):
效能表现的离散程度σ/μ(标准变异数σ除以效能平均数μ)必须小于10%,超过10%则为不合乎标准。
(一)效能常态分布情形(Performance Normal Distribution)
和我们前一篇测试报告相同,所谓的效能常态分布指的就是所有测试结果中效能表现落点情形。若是所有测试结果的落点距离平均数(μ)越接近与集中,代表效能越稳定;反之若是所有测试结果的落点距离平均数越远越发散,则代表每次效能表现的落差较大而相对的不稳定。此次我们设定以95%以上测试结果都需落在平均值的正负10%内才是达到要求的标准。
表六是以整体读写效能测试(Read/ Write Performance)为例所得出的结果,共有四颗SSD符合我们所设定的标准:其95%的测试结果均落在平均效能的正负10%之中,而其中又以OCZ的表现为最佳,七天中得出的测试效能结果均落在正负10%的落差之内。
若实际观察落点的分布图(附图B、C),也可以看出同样的结果,以图B来看,所有的测试结果(蓝点所示)均落在正负10%(绿色线段范围)区间内;至于图C的落点分布图便可明显看出有许多测试结果均偏离绿色线段的范围,甚至落到40MB/s以下的表现。
(二)极端值落差(High/ Low Gap over mean)
极端值落差是指一颗SSD最佳与最差效能表现的差距,同样也是评估效能稳定度的重要指针之一,当两者差距越小时,代表每次SSD执行任务时都能有相近的表现;反之当差距越大时,便代表着SSD的稳定性越不足。此次我们设定SSD所有测试结果中,前10%效能表现与后10%效能表现的差距必须小于所有平均效能的20%才是符合标准。
同样以整体读写效能测试(Read/ Write Performance)为例,共有四颗SSD能符合标准,其中又以OCZ与Corsair的表现为最佳,极端值落差仅占平均效能的5%左右。未达标准的四颗SSD则有两颗出现了大于60%的结果。由于此次采用的比较方法为为相对落差比较而非绝对落差比较,因此虽然ADATA与Patriot的极端值落差相近(7.63与8.22),但各自的平均效能不同(72.71与37.98),因此也就出现了极为不同的评量结果(10.49%与21.64%)。
(三)标准变异数离散程度(Standard Deviation Over Mean)
第三个效能稳定度的衡量面向则为标准变异数离散程度,也就是观察SSD所有测试结果距离所有平均效能的分布情形。此次我们设定SSD所有测试结果的离散程度必须小于10%才是符合标准。
为求前后一致,这里我们再次以整体读写效能测试(Read/ Write Performance)为例,总共有五颗SSD能符合标准,同样以OCZ的表现最佳,其标准变异数(σ)为1.04、效能平均数(μ)为78.03MB/s,因此所得的离散程度(σ/μ)仅有1.34%,这也代表着OCZ受测SSD的多数测试结果均落在平均效能的正负1.04MB/s范围中,且该范围仅占效能平均数的1.34%,足见其效能的高度稳定性。反之则有三颗SSD未能达到此项所要求的标准。
上述三个衡量面向均是以整体读写效能测试作为实例来说明,若将实际的七个测试情境
结果一并列出,则仅有Corsair与OCZ两台受测SSD能符合全部的要求标准。
评估指针四:效能退化(Performance Degradation)
最后一个也是不可忽略的一个评估指针,便是效能退化。效能退化代表着SSD在经过使用与耗损后,随着使用时间与次数的增加、或是剩余储存空间的减少等因素,而导致效能逐渐下滑。在我们前次的测试报告也提到,这主要是与SSD控制芯片的TRIM功能、垃圾搜集(Garbage Collection)设计或备用空间(Space Provisioning)不足有关。在这项指针中,若七天中最初使用回合(First Cycle)的平均效能与最终使用回合(Last Cycle)的平均效能差距(将资料完整写入SSD所有储存区块视为一回合),大于所有平均效能的10%,则视为有明显效能退化之情形。
综观而论,在七个不同的测试情境中,有三款SSD都观察到效能退化的情形,至于Corsair、Crucial、Intel、OCZ与SAMSUNG则没有明显的效能退化迹象。图D与图E便是一个说明效能退化的案例,以我们所观察到的其中一颗受测SSD在整体读写效能测试中的表现为例,图D呈现的是七天测试中所有测能效能结果的落点情形,可以显著地看出这颗SSD在最初几回合的能达到约80~90MB/s的效能,随后便降到70MB/s左右的水准;图E则是呈现最初回合(桃红线段)与最终回合(深蓝线段)的平均效能,透过这个图表可以观察到最初回合与最终回合的平均效能有约11MB/s的差距。
层层把关 创造SSD最高品质
以上是我们简略的测试内容分析,透过上述内容可以发现到,尽管我们这次采用相近价位且相同容量的SSD产品,但在各个不同测试情境与项目的表现上仍有迥异的表现,足见在现阶段,各个厂商对SSD产品设计验证的熟悉度与专业度还有所不同、也仍有许多在产品设计与整合上必须加强与改进的部分。而正因为整体环境对于SSD的前端开发未臻成熟,目前对SSD产品进行全面性的验证动作更是至关重要。
百佳泰作为领先业界的专业测试验证机构,也针对SSD产品本身的特性与架构,归纳整理出完整的关键验证要点,透过图F可以见得,对SSD而言最重要的组件包括控制芯片(Controller)、闪存(NAND Flash)以及连接接口(I/O Interface),除此之外SSD的软件面(Application)也是一项必须关注的课题。至于在实际的验证重点上,从硬件规格、兼容性、效能表现、可靠度、耐受性到近期备受重视的TRIM指令支持功能,都是必须经过反复测试验证、确保品质的重要环节。
作为一项仍属新颖的储存产品,SSD尚有长足的开发进步空间,而技术的提升则有赖于厂商的持续投入以及市场的接纳与推动。本篇测试评鉴报告仅以百佳泰的测试能力,提供部分的评估指针,以供所有读者作为参考,我们也希冀不久的将来,能看到更多品质更高、技术更成熟的产品,让所有消费者得以更无后顾之忧的拥抱SSD产品。
备注:本测试评鉴报告并未涵盖所有SSD可执行之全部测试项目,如欲得知更多测试结果讯息、以及其它可执行之测试项目,请径与百佳泰联系。
上一篇:什么是离子注入技术
下一篇:网络系统方案的可靠性测试