https://chipsandcheese.com/2023/11/20/chinas-newish-sw26010-pro-supercomputer-at-sc23/
老外对这个处理器的评价是计算能力很强,但是内存系统很糟糕。
一个是缓存太小,一个是内存太慢。这么小的缓存不够,从主内存里面存储数据太慢
而且主内存本身带宽就很低。
这个批评是有道理的,但是属于站着说话不腰疼。
12nm的落后工艺,要在可能的散热设计内(我估计这个处理器要350W)塞进去足够多的核心,提供计算能力。
就不可能再塞进去很大的二级缓存、三级缓存,如果塞了缓存,晶体管数就不一定够塞这么多核心了。
主内存的批评类似。
主内存带宽要加,也不是无代价的,需要更多的内存控制器,而内存控制器也是占用晶体管数量。
上八通道内存控制器,也会影响塞核心的数量。
神威这么做的代价是软件必须足够优化读写内存,尽量节省带宽,又能发挥算力,这个工作不好做。需要很多额外的劳动来优化计算的代码。
如果有3nm工艺用,可以塞更多的晶体管,神威可以加缓存,加内存控制器,实现更好的性能与可使用性。
现在不好用,编程优化很麻烦,让程序员多干点优化的活就是了。
老外对这个处理器的评价是计算能力很强,但是内存系统很糟糕。
一个是缓存太小,一个是内存太慢。这么小的缓存不够,从主内存里面存储数据太慢
而且主内存本身带宽就很低。
这个批评是有道理的,但是属于站着说话不腰疼。
12nm的落后工艺,要在可能的散热设计内(我估计这个处理器要350W)塞进去足够多的核心,提供计算能力。
就不可能再塞进去很大的二级缓存、三级缓存,如果塞了缓存,晶体管数就不一定够塞这么多核心了。
主内存的批评类似。
主内存带宽要加,也不是无代价的,需要更多的内存控制器,而内存控制器也是占用晶体管数量。
上八通道内存控制器,也会影响塞核心的数量。
神威这么做的代价是软件必须足够优化读写内存,尽量节省带宽,又能发挥算力,这个工作不好做。需要很多额外的劳动来优化计算的代码。
如果有3nm工艺用,可以塞更多的晶体管,神威可以加缓存,加内存控制器,实现更好的性能与可使用性。
现在不好用,编程优化很麻烦,让程序员多干点优化的活就是了。