【图片】【水贴】国产超级计算机再次登顶世界TOP500：这次CPU也是国产【装机吧】

装机吧关注：1,116,852贴子：7,779,260

8回复贴，共1页

【水贴】国产超级计算机再次登顶世界TOP500：这次CPU也是国产

图文摘自网络:
继天河2号之后，国产超级计算机“神威太湖一号（Sunway TaihuLight）”再次登顶世界TOP500，成为世界上运算速度最快的计算机。需要特别指出的是，这次神威太湖一号所使用的CPU也完全是国产的。
相比天河2号的理论性能54.9PFLOPS（1PFLOPS=每秒1千万亿次），神威太湖一号的理论浮点性能达到了125.4PFLOPS，虽然TOP500没提，不过太湖一号应该是全球首个理论性能超过每秒10亿亿次的超级计算机了.
更为重要的是，神威太湖一号可不仅仅是性能强大。在美帝对我国高性能计算CPU实施封锁禁售策略之后，国内获得高性能计算芯片的来源基本被截断了（此前天河 2号使用的是英特尔的Xeon系列处理器），由此神威太湖一号使用的全部是国产的CPU进行运算。据官方表示，中国是继美国、日本之后全球第三个采用自主 CPU建成千万亿级别超级计算机的国家。
此外，TOP500排名第二的是此前已经连续6年蝉联冠军的天河2号，第三位的是美国的“泰坦”，第四到第十位分别是美国IBM公司的Sequoia红杉、日本K京、Mira、Trinity、Piz Daint、Hazel Hen及Shaheen II，他们都是老面孔了，只不过因为半路杀出的太湖一号而使得排名顺次下滑了一位。

送TA礼物

IP属地:广东

1楼2016-06-24 22:17回复

IP属地:广东

2楼2016-06-24 22:18

常州本莱网络科技

内心的痛苦，有什么作用与功效黑芝麻的功效与作用怎么知道自己是，开始测试

2024-12-26 03:36广告

立即查看

惨案

IP属地:广东

来自Android客户端3楼2016-06-24 22:20

收起回复

河二号在全球超级计算机排行榜上垄断冠军宝座长达3年之后，同样来自中国的神威太湖之光(Sunway TaihuLight MPP)凭借每秒12.54亿亿次的峰值计算性能，强势登顶。这是全球第一台性能突破10亿亿次的超算，同时达到了天河二号的2.3倍！
比夺冠更令人惊喜的是，在最核心的CPU处理器技术上，我们也终于不再依赖国外技术。天河二号使用的是Intel Xeon、Xeon Phi处理器，神威太湖之光则是我国自主研发的“SW26010”。

根据目前已知的资料，SW26010采用的是64位RISC(精简指令集)架构，但据称又有些类似Intel Xeon Phi，是专为高性能计算研发的。
每一颗这样的处理器都集成多达260个核心(每四个核心一组)，主频1.45GHz，理论浮点性能3TFlops，搭配32GB内存。
整套系统使用了40960颗处理器，总计拥有10649600颗核心、1.31PB内存，理论峰值性能125435.9TFlops，实际最大性能93014.6TFlops，效率达74％，相比之下天河二号的效率只有62％。
SW26010处理器的工艺不详，但整套超算的能效很高，总功耗只有15371千瓦，比天河二号还低了2437W，因此在关注能效的Green500排行榜上同样名列前茅。高举第三位。

IP属地:广东

4楼2016-06-24 22:21

在这里简略的说明神威超算的cpu，由于数据不足，不清楚会加注明。
SW26010采用的是64位RISC(精简指令集)架构，每一颗这样的处理器都集成多达260个核心，主频1.45GHz，理论浮点性能3TFlops
由此可推测，此处理器类似Intel Xeon Phi，算一种众核CPU，但是单线程性能孱弱，只有多线程并行浮点运算能力强。
我们简单对比Intel Xeon Phi 的 Knight Landing ，14nm工艺、72个核心288个线程、36MB二级缓存、单/双精度浮点性能超过6/3TFlops。可见两者理论浮点性能相差无几，但是Intel Xeon Phi的每一个核心都是基于Silvermont(没错就是Atom上那一套)的改进定制版，单线程性能虽然比不过Xeon处理器，远胜过SW26010是毋庸置疑的。
由于相关指令集有什么，暂无相关报道和文档，但是如果没有类似intel的AVX指令集或者不支持SIMT向量化并行方法（注：前者是intel的cpu向量并行指令集，可以明显加速向量浮点运算；后者是用于AMD和NVIDIA显卡的向量化方法，简单的说众核CPU可以不完全等价地理解为拥有很多个流处理的显卡，这便是显卡进行通用计算浮点性能强大的原因），那么相应的编程难度将会很大尤其是复杂模拟，难以充分发挥近1000万个核心的性能。所以，非常期待该款CPU能使用上述技术或者类似的技术，这样又是国产CPU的一大进步！！！
此楼主要对比同为众核架构的Intel Xeon Phi，初步分析其与国际一流处理器的差距。以后将会对比常规CPU超算，以及GPGPU超算。

IP属地:广东

8楼2016-06-24 22:22

SW26010处理器，架构体系还是Alpha 64位RSIC，乱序执行，频率1.45GHz，260个核心，整个处理器包括4个MPE（Management Processing Element）管理单元、4个CPE（Computing Processing Element）计算单元及4个MC内存控制器单元组成，其中CPE单元又由8x8阵列的64核心组成，所以总计是260个核心（4x64+4=260）。
简言之，单核心浮点能力11.7Tflop/s，但是不能这么直接比较，因为是alpha架构。这只是单纯的计算单元，实际其他非计算指令的处理能力仅相当于简单的1.45Ghz的4核心2流水线CPU，在不讨论功耗和指令集架构的前提下，IPC能力估计注意是估计不如同频率奔腾4(说的好像国产U的综合IPC性能打得过奔腾4一样)。
所以这款CPU更多的加速计算CPU，由4个2流水线的管理单元和4*64=256个计算单元共同完成指令计算，所以能够进行通用计算（包括指令处理、内存调用、整数浮点计算）CPU核心相当于注意是相当于只有4个（每个包涵1MPE+1MC+64CPE）。所以，有人问能不能带动CF，可以，综合指令处理尤其是民用软件这些有大量非计算指令的，性能估计注意是估计比你手机的soc还低，滑稽。
总结，浮点运算能力极强，单线程孱弱，260核心包括了256个计算单元而非真正意义的260个通用处理核心，适合超算这种计算密集型计算机使用。民用的话，可能赛扬都比它要好得多。
完成thaks~
图文全部摘自网络如有侵权,请联系本人删除,此贴并非百度装机吧吧务组官方出品,仅属个人喜好,

IP属地:广东

本楼含有高级字体11楼2016-06-24 22:27

哦

来自Android客户端13楼2016-06-24 22:29

然并卵

IP属地:浙江

来自iPhone客户端14楼2016-06-24 22:30

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频！

贴吧热议榜

8回复贴，共1页

<返回装机吧

发表回复

发贴请遵守贴吧协议及“七条底线”贴吧投诉

内容:

使用签名档查看全部

发表

保存至快速回贴

日	一	二	三	四	五	六

【水贴】国产超级计算机再次登顶世界TOP500：这次CPU也是国产

登录百度账号

扫二维码下载贴吧客户端