图拉丁吧 关注:7,596,450贴子:128,367,298

固态硬盘扫描【坏道】的检测意义以及非硬性故障的修复方法

只看楼主收藏回复

去年我在图吧是发过一个类似的帖子,试图直接通过说明原理的方式,来解释固态硬盘扫描【坏道】的意义。但是没想到图吧一群固执己见的人实在太多,跟我辩论几百楼,还不断人生攻击,冷嘲热讽,甚至把我的帖子断章取义,转到固态吧来嘲讽我。
后来,我又去【固态硬盘】吧发了一个带有自己例子的帖子,来解释固态硬盘如何利用坏道扫描工具,做基本的检查,并且如何修复非硬性的故障。那个帖子里已经没有几个喷子了,固态吧现在对于固态硬盘扫描坏道这件事,也不像以前那样上来就喷。
但是感觉现在图拉丁吧,还是跟以前一样,对于固态硬盘扫描坏道这件事的认知,是不够客观的,只要有小白扫了,下面仍旧一群人,冷嘲热讽:什么【典中典】、【固态没有道,怎么扫?】、【男人去看妇科检查】一类的无知言论,让人瞬间高血压。
这两天,我手里正好又有一个自己的案例,刚做完修复,并且全程拍照记录了,可以拿到图吧来讲一讲。
发这个帖子的目的,不是来吵架和喷人的。
是希望我们图吧作为一个硬件技术贴吧,应该做到实事求是的精神原则,对于技术性问题更应该刨根究底,而不是人云亦云,张嘴就喷。


IP属地:安徽1楼2023-07-15 20:32回复
    去年在图吧发的帖子链接:
    https://tieba.baidu.com/p/7849076687
    后来在固态硬盘吧发的帖子链接:
    https://tieba.baidu.com/p/8147326984


    IP属地:安徽2楼2023-07-15 20:35
    收起回复
      固态能扫坏道啊,有的固态扫出来黄橙块直接退就行了,绝对不正常


      IP属地:山东来自Android客户端3楼2023-07-15 20:39
      收起回复
        因为最近玩游戏的时候,又感觉到了游戏有掉帧卡顿的现象,所以开始怀疑是不是盘子出现了掉速。
        目前使用了3块固态硬盘:
        RD20 1T *2
        RC20 2T *1
        游戏是存放在RC20 2T这块盘子里的,RD20 1T的两块盘子,就标记为A和B,A是系统分区+软件分区+VMware Data分区,B是只用来作VMware Data使用。
        然后我进PE做了DG扫盘检查,结果发现,RC20 2T和B盘都是没问题的,A盘扫出了很多黄橙块:


        IP属地:安徽4楼2023-07-15 20:44
        回复
          按照图吧现在的主流观点,一般是认为这种黄橙块的盘子没有任何问题,因为DG扫描固态硬盘坏道的方法,是无效操作,扫描的结果不具有任何参考性。
          按照我的观点,这种盘子的状态,就是非常明显的降速盘,该盘已经使用1年多,所存储的数据,也已经大于一半,只不过,我也没想到RD20会掉速掉得这么厉害。
          下面是HDTune的全盘读取扫描曲线,可以佐证这就是一块掉速盘:

          所以,DG的扫描结果并不是毫无意义的。


          IP属地:安徽5楼2023-07-15 20:50
          收起回复
            关于DG的全盘扫描和HDtune的全盘读取,两者有共通之处,但也有区别,这个后面我再讲。现在首先要把扫盘的一些概念说清楚。
            1、DG的扫描标准,并不是像很多人说的那样,每次都是随机一个标准,我知道他们看的是下面那个【修复时包括读写速度慢于此毫秒数的好磁道(不破坏数据)】,但实际上DG的扫描标准和这个毫秒数没有半毛钱关系,那个数据是可以自己填的,你填几个问号都不影响扫描。真正的扫描标准应该是DG内置的,扫描结束后,把鼠标放在相应的块上面,可以看到那个块的响应时间,点开【详细信息】,里面还能看到每个块的响应时间:


            IP属地:安徽6楼2023-07-15 20:57
            回复
              2、所谓的【坏道】扫描,只不过是一个名称而已,很多人跟【坏道】这两个字较真,这其实是非常幼稚的行为。
              虽然固态硬盘的内部结构和机械硬盘完全不同,但是它要想在计算机上正常工作,也要有扇区之类的东西,然后主控通过内部的映射表,再映射到具体的存储块。但是这些东西都是非常底层的逻辑了,对于应用层(也就是面向用户)来说,是不用去管这些的,不论是主控还是存储颗粒,哪一样有问题,用户都会感觉到卡,用DG扫描,扫出那些黄橙块,就是对应到具体每一个读写区块响应时间变慢的证据。


              IP属地:安徽7楼2023-07-15 21:03
              回复
                3、扫出那些黄橙块,大概率是一些逻辑性的故障。
                啥叫逻辑性的故障呢,简单来说,这不是硬盘真的坏掉了,是可以修复的,最常见的就是主控的trim策略有问题,导致一些脏盘的读写能力下降,也就是吧友们常说的冷数据一类的东西。
                当然,这也不是绝对的,要是您用的是一些杂牌固态,谁也不能保证黄橙块里没有混一些真正的硬性故障,比如用了白片甚至黑片的固态,那你掉速可太正常了。
                这里顺便说一下,我非常不推荐大家购买杂牌固态,这不是3年或者5年保修能解决的问题。因为杂牌固态质量良莠不齐, 厂家为了节约成本,必然会使用一些垃圾的组件,而固态硬盘不是突然就损坏的,在好与坏之间,还有很长的时间处于掉速、掉盘的状态,这会折磨你很久,给你带来很不好的使用体验。当然,你可以找售后更换,但谁也无法保证,你更换的固态就不会再出问题,而且很多情况下,如果仅仅只是掉速卡顿,那你还达不到损坏的标准,售后未必会给你安排。


                IP属地:安徽8楼2023-07-15 21:10
                回复
                  4、如果扫出红块,也就是不响应的区块,那你这块固态大概率是要GG的。
                  红块是掉速掉到极致的体现,直接不响应了,速度为0。所以这种极端情况,大概率就是这个区块彻底G了。
                  当然,也有例外,比如我见过有的小白直接扫出来全盘红的,这就要考虑测试环境的问题了。
                  任何检测,都要保证测试环境是OK的,比如硬盘应该是正常连接在主板的接口,你要保证主板OK,并且进入PE环境来做检测, 这样可以排除windows系统环境的干扰。
                  有些人拿外接硬盘盒来做检测,结果硬盘盒一过热,掉盘了,测出来一堆红块,再回头喷DG的扫描有问题,这是没有道理的。


                  IP属地:安徽9楼2023-07-15 21:15
                  收起回复
                    这里把另外两块正常盘子的检测结果也发出来,作为一个横向对比,更有说服力:


                    可以看到,这两块硬盘是没有测出任何黄橙块的。当然,我都没有全部测完,因为没有必要,太浪费时间。
                    下面我会给出HDtune的全盘读取扫描,来证明它们确实不是掉速盘。


                    IP属地:安徽10楼2023-07-15 21:27
                    回复


                      可以看到,这两块固态的全盘读取曲线图,相对来说是比较平稳的,其中RC20有微小波动,但是问题不大,作为游戏盘,RC20存储了超过一半容量的数据,有这种波动也很正常。


                      IP属地:安徽11楼2023-07-15 21:38
                      回复
                        也就是说,三块盘子,其中只有我们标记为A盘的固态,存在较为明显的掉速问题,其余两块的测速表现都比较正常。下面是三块盘子的smart截图:



                        可以看到,无论是正常固态,还是掉速固态,smart表都显示为良好,通过这个是看不出任何问题来的。


                        IP属地:安徽12楼2023-07-15 21:45
                        收起回复
                          当然,smart表并不是一无是处,对于一些硬性故障,在主控工作正常的情况下,它是可以检测出来,但也仅限于此。
                          但是问题就在于谁也无法保证主控的工作机制正常。你都出硬性故障了,主控难道不会也故障?如果主控不往这个smart表里更新数据呢?那你是不是就看不出任何问题?
                          实际上,在之前的帖子里,也有吧友反馈,就是明明DG扫盘可以扫出红块,但是smart表里依然显示良好。
                          有时候DG扫盘扫出来一些问题,再回头去看smart表,发现它更新数据了。
                          我的总结就是,smart表的总体靠谱程度,远不如DG扫盘和HDT的全盘读写测试。
                          可以说,smart能看出来的故障,后者都能检测出来,而smart看不出来的问题,后者同样能检测出来。
                          所以,检测性能的方法,才是最靠谱的。


                          IP属地:安徽13楼2023-07-15 21:50
                          收起回复
                            下面,我说说这种掉速盘子的问题,如何解决。
                            当然,我也不是万能的,前面说过,不是所有的盘子都能修好。
                            我不能保证尤其是那些杂牌固态,不知道用了什么白片黑片的,你本来就有硬件问题,那用软件层面的修复方法,是不可能解决的,但是依然有可能恢复一些速度。
                            首先,最常用的方法,就是手动trim。
                            下面讲一些固态trim的原理,老鸟不用看:
                            固态硬盘在清除数据的时候,并没有及时删除,而是在主控空闲的时候,再去删除。由于固态硬盘的写入机制和机械硬盘不同,它真正删除掉数据之后,才能写入新的东西。而操作系统层面的删除,只是逻辑上的删除,并没有真正删除。所以固态需要在空闲时间,再去自动删除这些数据,来保证固态有足够的剩余空间去写入新的数据,这个删除的动作就是trim。
                            机械硬盘是用户写入数据的时候,执行覆盖写入的动作,所以机械硬盘不需要trim,这也是为什么,机械硬盘误删除之后,数据其实可以恢复,除非做了数据填充,而固态硬盘在删除数据之后,一般是很难找回数据的,除非这个主控的trim机制不正常。


                            IP属地:安徽14楼2023-07-15 22:00
                            收起回复
                              不懂


                              IP属地:上海来自Android客户端15楼2023-07-15 22:05
                              回复