
参测的固态硬盘
- 海盗船Neutron GTX 240GB
- Intel SSD 335 240GB
- 金士顿HyperX 3K 240GB(两块,分别写入可压缩、不可压缩数据)
- 三星840 250GB
- 三星840 Pro 256GB
搞死了三个:金士顿HyperX 3K(不可压缩)坚持了728TB,Intel SSD 335 750TB、三星840 900+TB
迄今为止,已经有三块最终倒下了,占总量的一半,而且死去的方式各不相同。

【第一个牺牲品:金士顿HyperX 3K】
这一款其实有两块,分别测试可压缩、不可压缩数据。你应该能想到,失败的是不可压缩那块。
它最后的写入量是728TB,而可压缩那块只写入了501TB。
第一次出现警告信息是700TB的时候,忽视它继续,725TB时再次报错,而这次来自系统:“Windows检测到一个硬盘错误。立即备份你的数据,以免信息丢失。”
不管它接着继续,又出现了几次警告,只过了3TB就不行了,Anvil开始报错。硬盘还能访问,但是在导出最后一批SMART数据之后就变砖了。

事实上,真正指示寿命的并非闪存颗粒完整性,而是损耗指数(MWI),大部分第一方和第三方工具都以它为基准,指示固态硬盘的剩余寿命。
该指数在出厂时为100,一经使用就开始逐渐降低,最终为0的时候耗尽寿命(理论上仍然可以继续使用一段时间),而它和重新分配的扇区数量是完全无关的。
查看可知,700TB的时候降到了10,728TB时变为零。
再来看看错误趋势:

其实过了上一次的门槛600TB,各种错误就开始迅速增加了,到最后有986个重分配扇区(600TB时仅有10个)、111个编程错误、381个擦除错误。这意味着,失效的扇区里有一半是因为ECC错误校验失败。
HyperX 3K设定了一定比例的冗余容量,但用途是内部管理功能和RAISE(SandForce的冗余技术),能用来重新分配的很少,因此很快就会耗尽。
金士顿表示,寿命到期后硬盘就会拒绝加载,自然就检测不到了。
【第二个牺牲品:Intel SSD 335】
写入量同样达到700TB的时候,SMART信息就发出了失败警告,但是使用起来仍然一切正常,闪存单元也几乎都是完整的,只有一个重分配扇区,还是写入300TB时候出现的。
于是继续写入,但仅仅又过了50TB,也就是到达750TB,最终就崩溃了。负责持续写入的Anvil Storage Utilities工具里出现了写入错误,程序本身也失去了响应。幸运的是,再次启动软件成功了,至少能提取出日志(稍后分析),但不能再继续写入了。

SSD 335写入了700TB之后,WMI指数就已经归零,标志着闪存不再可靠,不能继续使用了。
奇怪的是,写入报错后,SMART也不再返回任何信息,任何工具都无法访问,证明SMART技术已经挂掉。
重启系统,Intel SSD Toolbox里又出现了这块硬盘,仍然检测为存储设备,但容量是0GB,无法访问。
Intel表示,这种结果完全符合预期,写入错误意味着硬盘进入了只读模式,并触发一种自毁模式,让硬盘不再响应。永别了……

【第三个牺牲品:三星840】
TLC闪存的它并不是率先倒下的,仅此一点就可以让大家放心了。它坚持超过了900TB。
其实,刚过200TB她就出现了重分配扇区,之后不断增加,最后有接近3500个,但因为可用的冗余空间较多,所以坚持得比较久一些。
写入量达到900TB的时候,840仍然看起来很正常,三星自己的SSD Magician工具也报告还有不少剩余寿命,但是突然之间,它就挂了,Anvil崩溃,系统和工具都检测不到,只有Intel存储驱动报告了一个未知的三星SATA设备,也只能看看而已。
由于没有任何事先警告,死的又很彻底,最后一段时间的SMART数据就丢失了,无法得知最后确切写入了多少,状态分析也只能截止到900TB。

损耗指数在300TB的时候就变成了零,但是三星自己的工具仍然报告状态健康,继续使用也没问题。
再看可使用的保留空间,一直在稳定减少,但是最后死亡的时候仍有大约40%,理论上还能坚持。由于SMART日志丢失,无法得知死亡的确切原因,可能是突然就坚持不住了。

再看另一个重要参数:不可修复错误。它是在写入300TB时候出现的,有176个,当时用来校验数据完整性的200GB文件确实Hash失败了好几次,不得不重新拷贝,但此后不可修复错误一直没有增加。
在800-900TB之间的某个时刻,不可修复错误数量突然增加了119个,总量达到295个。虽然这时候Anvil没有报错,但这应该就是死亡元凶。
三星表示,840用户最终是应该能看到错误提示的,比如说兼容性错误、蓝屏死机等。至于这里为何突然死亡,还在进一步调查。

