虽然3B6000M有一些不足之处,但是感觉每个不足背后都有点道理:
1.虽然LA364E三发射架构面积更小而且成功做到了以三打四(发射),但是因此失去了对256位SIMD指令的支持,其实强制支持这个也行,不过要把它拆成两个128位执行,效率不足,失去了256位SIMD的意义(目前为止本人还没见过低于4发射但是可以单次完整执行256位SIMD指令的处理器),而且不支持256位也能让ROB(重排序缓冲区)没那么吃紧,有利于减少ROB宽度缩小面积;
2.PCIE通道只给了8条,基本上把应用范围限制在没有独显的笔电和迷你主机(m.2 SSD和m.2无线网卡各4条,总计8条吃完),要插显卡就得把硬盘赶去SATA通道,网卡也走集成南桥,这个设计更像是龙芯推动核显代替亮机独显,降低整机成本,而LG200核显的官方参数也在印证这一点,多种视频格式支持硬解并且能到4K60fps水平,图形API支持到OpenGL3.x,感觉进步很大,想看这个核显能不能流畅运行dde窗口特效;
3.为了控制3B6000M的核心面积,其缓存也是最大限度妥协了,8核共享的二级缓存只有6MB大小(不过还好吧,我四核八线程的i5-10210U也是6MB缓存),但是龙芯花两年功夫能做到八核共享缓存真的进步很大,此前B站极客湾提到过3A6000四个核心的三缓是分开的,对多核浮点运算造成了瓶颈导致多核浮点分数不对劲,龙芯在此之后一次迭代就进步到8核共享,3B6000M实际表现好的话那含金量是极高的,毕竟隔壁ZX第一回做四核共享缓存可是直接延迟长到姥姥家
1.虽然LA364E三发射架构面积更小而且成功做到了以三打四(发射),但是因此失去了对256位SIMD指令的支持,其实强制支持这个也行,不过要把它拆成两个128位执行,效率不足,失去了256位SIMD的意义(目前为止本人还没见过低于4发射但是可以单次完整执行256位SIMD指令的处理器),而且不支持256位也能让ROB(重排序缓冲区)没那么吃紧,有利于减少ROB宽度缩小面积;
2.PCIE通道只给了8条,基本上把应用范围限制在没有独显的笔电和迷你主机(m.2 SSD和m.2无线网卡各4条,总计8条吃完),要插显卡就得把硬盘赶去SATA通道,网卡也走集成南桥,这个设计更像是龙芯推动核显代替亮机独显,降低整机成本,而LG200核显的官方参数也在印证这一点,多种视频格式支持硬解并且能到4K60fps水平,图形API支持到OpenGL3.x,感觉进步很大,想看这个核显能不能流畅运行dde窗口特效;
3.为了控制3B6000M的核心面积,其缓存也是最大限度妥协了,8核共享的二级缓存只有6MB大小(不过还好吧,我四核八线程的i5-10210U也是6MB缓存),但是龙芯花两年功夫能做到八核共享缓存真的进步很大,此前B站极客湾提到过3A6000四个核心的三缓是分开的,对多核浮点运算造成了瓶颈导致多核浮点分数不对劲,龙芯在此之后一次迭代就进步到8核共享,3B6000M实际表现好的话那含金量是极高的,毕竟隔壁ZX第一回做四核共享缓存可是直接延迟长到姥姥家