查看原文
其他

【前沿评论】中国"神威太湖之光"凭何登上全球超算500强榜首

2016-06-20 战略前沿技术



C新智元原创 (AI_era)授权转载 

  作者:闻菲


【新智元导读】最新一期全球超级计算机TOP500榜单今日公布,中国自主研发制造的神威太湖之光取代天河2号名列第一,这个消息立即刷爆朋友圈。中科院计算所研究员、中国计算机学会青年计算机科技论坛(CCF YOCSEF)主席韩银和第一时间给出点评:


“太湖之光为啥这么牛?它拥有一颗巨强的“芯”-申威26010,上海高性能IC设计中心设计的国产高性能处理器。该处理器包含有260个处理核,单片峰值性能为3.06Tflops/s。天河-2单节点采用2个Intel Ivy Bridge处理器+3个Intel Xeon Phi类GPU加速器芯片,这5个处理器芯片峰值性能相加约为3.431Tflops/s,也就是说一颗申威芯片性能大致相当于天河-2中Intel 5个芯片的峰值性能之和!”


韩银和还总结了太湖之光的3个亮点:(1)总性能93P,比天河-2又快了3倍,比第3名美国橡树岭实验室的机器快了5倍,是第一台性能接近100P的机器;(2)采用了全国产众核处理器;(3)能效比达到6GFlops/W, 和Green500第一的日本机器能效比也就差不到10%,但太湖之光比日本机器规模大多了,这么大个头能效比控制的这么好,需要有独到的技术。


6月20日,第 23 届高性能计算(HPC)国际顶尖会议 ISC2016 在德国法兰克福举行,会上提前公布第 47 次 HPC TOP500 榜单,中国的神威太湖之光系统(Sunway TaihuLight System)排名第一。

 


神威太湖之光系统


在国家超级计算无锡中心1000平米的主机房内,整齐排布着两组共40个运算机仓,每个机仓容纳1024个芯片,共计40960个芯片。据介绍,其单芯片的计算能力相当于3台2000年全球排名第一的超级计算机,当前性能指标达到国际领先水平。


3 大突破


神威太湖之光由国家并行计算机工程技术中心研发,在无锡国家超算中心安装完成,2015年12月21日完成整机系统性能测试,目前由清华大学负责运营。


神威太湖之光运算峰值为 125.4 Pflop/s,持续性能 93 Pflop/s,比天河 2 号快了将近 3 倍,比排名第 3 的美国橡树岭实验室的机器快了 5 倍,也是国际第一台性能接近 100P 的机器。



美国Titan、天河二号、太湖之光参数对比


神威太湖之光每瓦特浮点运算次数达到了 6 亿次(世界排名第 2 到第 6 的超级计算机,这个数值都在 2 亿次左右),也即能耗比达到 6 Gflops/W,与 Green500 第一的日本机器相差不到10%,但太湖之光规模明显更大,因此实现的技术独到。目前,世界排名前 10 的其他超级计算机能耗比都在 2 Gflops/W 左右。


国家超级计算无锡中心主任杨广文教授在接受《人民日报》采访时表示,神威太湖之光一分钟的计算能力相当于全球72亿人同时用计算器不间断计算32年。


杨广文说:“从低功耗、高集成度的处理器设计,到高速高密度的工程实现技术;从世界领先的高效水冷技术,到软硬件协同、智能化的功耗控制方法,‘神威太湖之光’实现了层次化、全方位的绿色节能,功耗比达到每瓦特60.51亿次运算。”



世界TOP6超级计算机参数


中国“芯”,No Intel Inside


ISC TOP500 榜单每年公布两次,根据超级计算机基准程序 LINPACK 测试值,评选全球最强超级计算机。


虽然我国处理器设计制造起步较晚、基础薄弱,但通过近十年政府支持和大力投入,目前我国在超算领域已经处于世界领先水平,也是继美国、日本之后,第 3 个研发出超级计算机的国家。


位于广州国家超级计算中心、由国防科技大学建造的天河 2 号,2013 年 6 月以 33.86 Pflop/s 的 LINPACK 测试值夺得TOP500 第一,并在接下来的 6 次榜单中蝉联冠军。


过去几年,中国工业和研究部门注册提交的系统数量剧增,中国现在入榜的超级计算机数量达到167台,超过美国的165台


这也是TOP500榜单美国入围的超级计算机总数量首次跌下第一位。



1993年至今中国TOP500超级计算机数量



1993年至今美国TOP500超级计算机数量


但由于天河 2 号采用了英特尔处理器,2015年4月,美国宣布对中国禁售高性能处理器。


这次,神威太湖之光使用我国自主研发和制造的 CPU 处理器——申威 26010(SW 26010),采用众核+CPU架构,含有将近 1065 万个内核,主内存 1.31 PB。



申威260140芯片


搭载了两个核心组的电路板


SW 26010的芯片由上海高性能集成电路设计中心研发,含有 4 个核心组,每组含有 65 个内核,由64个计算核心(CPE)、一个管理核心(MPE)和一个内存控制器构成。



 神威太湖之光核心组示意图


64个计算核心排列为8x8的矩阵。4个内存控制器总共提供了136.5GB/s的带宽。


每组内部有自己的专属内存空间,组间通过片上网络(NoC)进行通讯。片上网络还连接着系统接口(SI),供芯片同外部设备通讯。



神威太湖之光架构示意图


神威太湖之光专为提升运算速度设计,简单的架构正是它运算速度胜过其他高能耗 HPC 系统的原因。

不过,申威芯片采用定制64位指令集,频率处于中等水平(1.45GHz),而且每个核心只能执行一个线程(不支持超线程),软件支持也没有Intel那么丰富。


但尽管如此,中国凭借一个完全基于中国设计、制造的处理器打造的新系统,在国际TOP500组织第47期榜单上保持第一,TOP500声明中这样写道。


实现零的突破


除了TOP500,戈登贝尔奖(Gordon Bell Prize)也是世界关注的重点。


戈登贝尔奖被喻为 HPC 应用领域的诺贝尔奖,每年颁发一次,授予 HPC 领域杰出表现应用,旨在记录变形计算发展趋势,尤其是奖励高性能计算创新应用。获奖应用多为性能峰值最高,或在可扩展性方面取得特殊成就,或缩短及重大科学或工程问题时间。


2016年的6项提名中,神威太湖之光占了一半,分别涉及大气、海洋、材料三个领域的应用:一个完全隐藏的非静力动态解算机,用于云分解大气层模拟;一个高效的全球表面波,用超高的分辨率进行数值模拟;大规模的相场模拟,用于基于Cahn-Hillard方程的粗化动力,加上减少的移动性。



过去24年至今,世界排名第一的超级计算机


加速人工智能


航空航天、石油勘探、车船设计、军事应用、新药研发、生物信息、气候模拟……超级计算广泛应用在从实体经济到战略领域的诸多方面。因此,超级计算不仅仅是学术研究,也涉及国家政治问题。


HPC 是世界各国竞相角逐的科技制高点。


神威太湖之光采用中国自主设计和研发的芯片,在超算领域树立了新的标杆,在美国 X86 之外建立了新的生态,可以说中国有了自己的产业链,未来还可能向其他国家输出。


不仅如此,HPC 也是人工智能技术尤其是机器学习发展的关键之一,众所周知,训练神经网络除了数据,还需要巨大的计算能力。


神威太湖之光在 HPC 领域的成功,定能极大推动我国智能产业发展。


接下来,中国制造的神威太湖之光,将为全球提供超级计算服务。


图片来源:www.netlib.org/


前沿君微信:tech9999

投稿邮箱:13355524@qq.com


一网打尽系列文章,请回复以下关键词查看:【习近平】【创新中国】【中国武器】【双创】【预见2016】【电磁炮】【生物】【脑科学】【虚拟/VR】【物联网】【马斯克】【采办】【抵消】【水下战】【轰炸机】【能源】【电池】【凯文】【战争】【云计算】【排名】【博士】【导师】【王喜文】【黄志澄】【贺飞】【李萍】【纳米】【基金】【机器人】【俄罗斯】【互联网加】【量子】【数据】【无人】【新科技革命】【转化】【谷歌】【工业4.0】【DARPA】【颠覆】【3D/4D】【硅谷】【石墨烯】【北斗】【通信】【智造】【智能】【军民融合】【激光】【智库】其他主题系列陆续整理中,敬请期待……

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存