装机吧 关注:1,116,852贴子:7,779,260
  • 8回复贴,共1

【水贴】国产超级计算机再次登顶世界TOP500:这次CPU也是国产

只看楼主收藏回复

图文摘自网络:
继天河2号之后,国产超级计算机“神威太湖一号(Sunway TaihuLight)”再次登顶世界TOP500,成为世界上运算速度最快的计算机。需要特别指出的是,这次神威太湖一号所使用的CPU也完全是国产的。
相比天河2号的理论性能54.9PFLOPS(1PFLOPS=每秒1千万亿次),神威太湖一号的理论浮点性能达到了125.4PFLOPS,虽然TOP500没提,不过太湖一号应该是全球首个理论性能超过每秒10亿亿次的超级计算机了.
更为重要的是,神威太湖一号可不仅仅是性能强大。在美帝对我国高性能计算CPU实施封锁禁售策略之后,国内获得高性能计算芯片的来源基本被截断了(此前天河 2号使用的是英特尔的Xeon系列处理器),由此神威太湖一号使用的全部是国产的CPU进行运算。据官方表示,中国是继美国、日本之后全球第三个采用自主 CPU建成千万亿级别超级计算机的国家。
此外,TOP500排名第二的是此前已经连续6年蝉联冠军的天河2号,第三位的是美国的“泰坦”, 第四到第十位分别是美国IBM公司的Sequoia红杉、日本K京、Mira、Trinity、Piz Daint、Hazel Hen及Shaheen II,他们都是老面孔了,只不过因为半路杀出的太湖一号而使得排名顺次下滑了一位。


IP属地:广东1楼2016-06-24 22:17回复


    IP属地:广东2楼2016-06-24 22:18
    回复
      惨案


      IP属地:广东来自Android客户端3楼2016-06-24 22:20
      收起回复
        河二号在全球超级计算机排行榜上垄断冠军宝座长达3年之后,同样来自中国的神威太湖之光(Sunway TaihuLight MPP)凭借每秒12.54亿亿次的峰值计算性能,强势登顶。这是全球第一台性能突破10亿亿次的超算,同时达到了天河二号的2.3倍!
        比夺冠更令人惊喜的是,在最核心的CPU处理器技术上,我们也终于不再依赖国外技术。天河二号使用的是Intel Xeon、Xeon Phi处理器,神威太湖之光则是我国自主研发的“SW26010”。

        根据目前已知的资料,SW26010采用的是64位RISC(精简指令集)架构,但据称又有些类似Intel Xeon Phi,是专为高性能计算研发的。
        每一颗这样的处理器都集成多达260个核心(每四个核心一组),主频1.45GHz,理论浮点性能3TFlops,搭配32GB内存。
        整套系统使用了40960颗处理器,总计拥有10649600颗核心、1.31PB内存,理论峰值性能125435.9TFlops,实际最大性能93014.6TFlops,效率达74%,相比之下天河二号的效率只有62%。
        SW26010处理器的工艺不详,但整套超算的能效很高,总功耗只有15371千瓦,比天河二号还低了2437W,因此在关注能效的Green500排行榜上同样名列前茅。高举第三位。



        IP属地:广东4楼2016-06-24 22:21
        回复
          在这里简略的说明神威超算的cpu,由于数据不足,不清楚会加注明。
          SW26010采用的是64位RISC(精简指令集)架构,每一颗这样的处理器都集成多达260个核心,主频1.45GHz,理论浮点性能3TFlops
          由此可推测,此处理器类似Intel Xeon Phi,算一种众核CPU,但是单线程性能孱弱,只有多线程并行浮点运算能力强。
          我们简单对比Intel Xeon Phi 的 Knight Landing ,14nm工艺、72个核心288个线程、36MB二级缓存、单/双精度浮点性能超过6/3TFlops。可见两者理论浮点性能相差无几,但是Intel Xeon Phi的每一个核心都是基于Silvermont(没错就是Atom上那一套)的改进定制版,单线程性能虽然比不过Xeon处理器,远胜过SW26010是毋庸置疑的。
          由于相关指令集有什么,暂无相关报道和文档,但是如果没有类似intel的AVX指令集或者不支持SIMT向量化并行方法(注:前者是intel的cpu向量并行指令集,可以明显加速向量浮点运算;后者是用于AMD和NVIDIA显卡的向量化方法,简单的说众核CPU可以不完全等价地理解为拥有很多个流处理的显卡,这便是显卡进行通用计算浮点性能强大的原因),那么相应的编程难度将会很大尤其是复杂模拟,难以充分发挥近1000万个核心的性能。所以,非常期待该款CPU能使用上述技术或者类似的技术,这样又是国产CPU的一大进步!!!
          此楼主要对比同为众核架构的Intel Xeon Phi,初步分析其与国际一流处理器的差距。以后将会对比常规CPU超算,以及GPGPU超算。


          IP属地:广东8楼2016-06-24 22:22
          回复
            SW26010处理器,架构体系还是Alpha 64位RSIC,乱序执行,频率1.45GHz,260个核心,整个处理器包括4个MPE(Management Processing Element)管理单元、4个CPE(Computing Processing Element)计算单元及4个MC内存控制器单元组成,其中CPE单元又由8x8阵列的64核心组成,所以总计是260个核心(4x64+4=260)。
            简言之,单核心浮点能力11.7Tflop/s,但是不能这么直接比较,因为是alpha架构。这只是单纯的计算单元,实际其他非计算指令的处理能力仅相当于简单的1.45Ghz的4核心2流水线CPU,在不讨论功耗和指令集架构的前提下,IPC能力估计注意是估计不如同频率奔腾4(说的好像国产U的综合IPC性能打得过奔腾4一样)。
            所以这款CPU更多的加速计算CPU,由4个2流水线的管理单元和4*64=256个计算单元共同完成指令计算,所以能够进行通用计算(包括指令处理、内存调用、整数浮点计算)CPU核心相当于注意是相当于只有4个(每个包涵1MPE+1MC+64CPE)。所以,有人问能不能带动CF,可以,综合指令处理尤其是民用软件这些有大量非计算指令的,性能估计注意是估计比你手机的soc还低,滑稽。
            总结,浮点运算能力极强,单线程孱弱,260核心包括了256个计算单元而非真正意义的260个通用处理核心,适合超算这种计算密集型计算机使用。民用的话,可能赛扬都比它要好得多。
            完成thaks~
            图文全部摘自网络如有侵权,请联系本人删除,此贴并非百度装机吧吧务组官方出品,仅属个人喜好,


            IP属地:广东本楼含有高级字体11楼2016-06-24 22:27
            回复


              来自Android客户端13楼2016-06-24 22:29
              回复
                然并卵


                IP属地:浙江来自iPhone客户端14楼2016-06-24 22:30
                回复