p106吧 关注:27,467贴子:255,851

是硬件阉割但是又不全赖硬件

只看楼主收藏回复

我们团队已经搞清楚了到底是怎么回事,cmp hx系列矿卡的浮点性能跟驱动中fma指令集的调用有关,具体来说是跟fma的全速或是半速或者1/2n次幂速运行有关,可是驱动怎么给fma调速呢?它怎么知道该按1/2n次幂运行,n为几呢?这个n就烧在片内,efuse烧写,也就是常说的熔丝,其实就是个地址位,这就是所谓的硬件阉割!核心规模还是那么大,也没有所谓的激光切一刀!聪明的你其实已经看出来了,起决定作用的依然是驱动,驱动里藏着熔丝地址位对应fma倍率的规则,是不是很眼熟?跟当年发现驱动里藏着一份矿卡ID的黑名单不是一样一样的吗?!此为召唤神龙第二贴,大神来吧,来我们团队干翻皮衣刀客


IP属地:四川来自iPhone客户端1楼2023-12-12 09:08回复


    IP属地:河北来自Android客户端2楼2023-12-12 10:47
    收起回复
      设备加载后,驱动就会读到片内efuse的fma地址位,读到这个,驱动在内置的规则表内查询其对应的倍率进行fma倍率调速


      IP属地:四川来自iPhone客户端3楼2023-12-12 11:00
      回复
        我们需要的就是改写驱动里边这个规则表,把所有efuse地址位对应的fma倍率通通改为full speed!


        IP属地:四川来自iPhone客户端4楼2023-12-12 11:02
        收起回复
          目前已知这个规则藏在几个dll文件里,特别是cuda,opencl相关的dll文件


          IP属地:四川来自iPhone客户端5楼2023-12-12 11:03
          回复
            大写点赞


            IP属地:江苏6楼2023-12-12 11:14
            回复
              所以还是老登黄写的驱动软阉割了对吧


              IP属地:福建来自Android客户端7楼2023-12-12 11:28
              收起回复
                pcie3.0搞得出来吗,真弄出来104和102就神了,102的核心规格看着要比40hx强很多


                IP属地:河南10楼2023-12-12 23:04
                收起回复
                  因为fma指令会被opencl benchmark之类的跑分软件调用,所以在驱动调试模式下我们就能找到opencl32.dll文件里起限制fma作用的字段,只要找到了,其他dll也照此修改就能解封fma了,那么170hx fp32大概能跑上12+Tflops@仅仅一个人无悔 @heaven三火 其实就等无悔了,联机调试最在行的就是无悔


                  IP属地:四川来自iPhone客户端11楼2023-12-13 15:50
                  收起回复
                    对P106会有多大影响?


                    IP属地:北京12楼2023-12-13 16:05
                    收起回复
                      留名,不明觉厉,大佬太牛了。40hx的半精度性能会有提升吗?


                      IP属地:河北13楼2023-12-13 17:07
                      回复
                        完全看不懂啊,路过


                        IP属地:上海14楼2023-12-19 21:08
                        回复
                          太牛了


                          IP属地:重庆来自Android客户端15楼2023-12-19 22:04
                          回复
                            太牛了


                            来自Android客户端16楼2024-01-16 16:09
                            回复
                              完全看不懂啊


                              IP属地:重庆17楼2024-01-16 16:36
                              回复