“神威太湖之光”登顶全球超算,国产自主CPU芯片“大考”过关
6月20日,新一期全球超级计算机500强榜单公布,使用中国自主芯片制造的“神威太湖之光”取代“天河二号”登上榜首,成为全球最快的超级计算机,三项在“神威·太湖之光”超级计算机上开展的应用课题荣获“戈登贝尔奖”提名,中国超算上榜总数量为167台套首次超过美国名列第一。
这期榜单透露了哪些重要信息?“天河二号”让位“神威太湖之光”是否有意为中国自主芯片“验明正身”?未来HPC有哪些趋势?
自主芯片 “大考”过关?
中国计算机学会高性能计算专委会秘书长张云泉在接受《中国电子报》记者采访时表示,这次HPC榜单公布中国军团无论是在数量上还是性能上都实现了全面超越。中国军团囊括冠亚军,榜单前十名除了“神威太湖之光”与“天河二号”外,其他分别是美国的“泰坦”与“红杉”、日本的“京”、美国的“米拉”和“三一”、瑞士的“代恩特峰”、德国的“花尾榛鸡”和沙特阿拉伯的“沙欣II”。一个国家囊括冠亚军过去只有美国做到。
从数量上看,这次中国除了拿到了冠亚军,整个上榜数量为167台超过了美国的165台,而联想因为上榜92套名列第二,这些成绩都打破了过去的纪录。中国开始从超算大国向超算强国转变。
从性能与自主知识产权的技术创新上看,据国际TOP500组织发布的榜单,“神威太湖之光”峰值计算速度达每秒12.54亿亿次,持续计算速度每秒9.3亿亿次,性能功耗比为每瓦60.51亿次,三项关键指标均排名世界第一。“神威太湖之光”的浮点运算速度比第二名“天河二号”快出近两倍,效率提高3倍,功耗也比“天河二号”低。更重要的是,与“天河二号”使用英特尔芯片不一样,“神威太湖之光”使用的是中国自主知识产权的“申威”处理器。“神威太湖之光”实现了从CPU、操作系统、互联网络等核心部件的完全自主研发。
据张云泉透露,“神威太湖之光”夺冠并非无迹可寻,之前采用同样自主处理器的“中国神威·蓝光”超级计算机,在2012年参与国际超级计算机大会时就引起了关注,当时它的运算速度为1000万亿次,采用的是16核的“申威”芯片,这次“神威太湖之光”采用是260核的“申威”处理器,实现了百倍速度的提升。采用国产众核芯片,性能完全追平了Intel最好的超算芯片。
曙光公司高性能计算产品事业部总经理曹振南在接受《中国电子报》记者采访时表示,中国一直希望发展自主芯片,采用自主芯片的“神威太湖之光”夺冠,成为全球最快的计算机,无疑给中国芯片产业带来很大的激励。但与此同时,我们也需要注意到在发展自主芯片的道路上,我们依然面临很多的问题,比如芯片的生态环境,比如与软件应用兼容性等。
在软件应用兼容与生态问题上,张云泉表达了与曹振南相似的观点,“神威太湖之光”采用的是非X86的体系架构,因为是自己的体系架构,所以从软件和应用上后续有大量的工作要做。
未来,中国IT产业的很多关键技术是否也都可以采取“神威太湖之光”的路线,先抢占至高点实现某个维度的突破,再完善后续生态全面跟进?张云泉表示,HPC是战略市场,不是类似PC那样的“广义”市场,是可以采用这样的方式进行突破的。有三项在“神威·太湖之光”超级计算机上开展的应用课题荣获“戈登贝尔奖”提名,这也表明目前“神威太湖之光”的应用“弹药”还是足够的。
“天河二号”让位是“阴谋论”?
有人说,曾经六连冠的“天河二号”这次是有意让位于“神威·太湖之光”,是为了让“全自主HPC系统”验明正身,体现中国芯片与英特尔芯片之能力相当,是“自己人有意交换位置”。
对于这一观点,张云泉笑着表示,这个是“阴谋论”,应该不是有意为之,“天河二号”同样希望继续冲刺冠军,只是去年美国对“天河二号”实行处理器禁运后,延误了“天河二号”的升级计划,“天河二号”更换其他处理器必然需要时间进行系统的调整,升级的时间将延迟到2016年年底至2017年上半年。
去年美国对中国高性能计算机实施芯片禁运时。《中国电子报》记者也曾采访过张云泉,他当时就表示,禁运会影响“天河二号”的升级时间,但对中国的自主芯片发展一定是个利好,且中国HPC的发展不会因为禁运而滞缓。
果然言中了,仅仅几个月就兑现了张云泉的预言。
这次中国军团如此多的利好带来的又一个疑问是,美国HPC真的不行吗?
“天河二号”连续几次夺冠后,似乎让超级计算大国美国“面子”有些挂不住。去年,美国总统奥巴马签署了超算加速计划的总统令,将加速美国的HPC发展。按照惯例,总统令签署之后,会很快出台相关的实施计划,但公众随后并没有如期看到相关计划公布,或许是保密或许是其他原因。张云泉表示,从公开信息来开,按计划美国超过100P的超级计算要到2017年或2018年才出来,如果美国不提前实施加速计划,那么中国HPC的TOP500上就有可能蝉联十连冠。
“但美国一直是超算强国,即便今天中国全自主的系统夺得了冠军,也不能否认美国超算强国地位。目前除了’神威太湖之光’采用中国的自主芯片,这次上榜的中国其他超级计算级大部分还是采用国外的芯片。”曹振南表示。
HPC走向更大的市场?
HPC发展有一定的周期和节奏,这几年全球HPC的发展进入了相对缓慢期,”天河二号”之后,全球HPC更新进入低谷。张云泉表示,从现在看,全球HPC更新的速度开始恢复、止跌回升了。
另外一个趋势是HPC正在进入越来越多的“非科学计算领域”。一直以来HPC主要是在科学计算等领域,这次上榜的超级计算机很多来自互联网应用。也正因为如此,对于中国军团这次取得这样的业绩也有一些声音认为,中国之所以如此大规模突围是中国有大量的HPC应用在互联网,这让中国军团入围台套大幅增加。而事实上,HPC正在应用在越来越多的非科学领域。
曹振南表示, HPC针对独特的应用场景而进行专门的优化和定制也将是未来的方向之一,比如地球模拟装置。
事实上,我们推动HPC的发展不仅仅是为“更快、更高、更强”,在计算的竞技场上争个高下,更是为了有更大的应用空间,解决更多的问题,比如“神威太湖之光”与“天河二号”下一个阶段的挑战就是如何用好用足,尽快充分释放这些计算能力。
全球超算最新排名!ARM架构处理器雄踞第一,国产太湖之光排第四
近日,在德国法兰克福举行的国际超级计算大会上,2021第57版世界TOP500超级计算机排名正式公布,在Top10排名中,日本理化学研究所和富士通共同推进开发的超级计算机富岳(Fugaku)再次夺冠,第二和第三名均为美国的超级计算机,中国的神威·太湖之光超级计算机位列第4位,天河2A位列第6位。
与2020年11月份发布的第56版相比,Top10排名变化很小,只有一个新入围者,那就是来自美国新能源部劳伦斯伯克利国家实验室的Perlmutter系统。该超级计算机基于HPE Cray“Shasta”平台和由GPU加速器和CPU节点组成的异构系统,实现了64.6 Pflop/s,它在新排名中位列第5。
尽管前十名榜单变化不大,但是从整体排名来看,还是能发现一些重要的趋势。
首先就是采用AMD处理器的超级计算机显著增加,比如刚入选TOP10榜单的Perlmutter就是在用的AMD EPYC 7763处理器,排在第6的Selene也采用了AMD EPYC 7742。
另一个是,近些年来,异构计算在超级计算机中使用越来越多,且大多数采用了NVIDIA的GPU或英特尔基于X86的Xeon Phi作为协处理器。在今年的TOP500中,共有145个系统采用了加速器/协同处理器技术,与第56版的147个相比,有所下降。其中有96个系统使用了NVIDIA Volta芯片,26个使用了NVIDIA Ampere芯片,9个使用了NVIDIA Pascal系统。
英特尔处理器在超级计算机中的份额仍然最高,为86.2%,但低于第56版的91.8%。此外,名单中有49个系统使用了AMD的处理器,高于之前的4.2%。
TOP500排名是针对全球已知最强大的电脑系统做出的排名,该计划始于1993年,并且一年出版两次最新的超级计算机排名表。每年的第一次排名公布于6月份的国际超级计算机会议上,而第二次排名公布则是在11月份的超级计算机会议上。
TOP500的排名表是由德国曼海姆大学的Hans Meuer、美国田纳西大学诺克斯维尔分校的Jack Dongarra以及美国劳伦斯伯克利国家实验室的Erich Strohmaier与Horst Simon等人共同汇编的。
下面我们来看看这些超级计算机:
富岳
富岳(Fugaku)是由日本理化学研究所和富士通共同开发的超级计算机,是“京”的后继机型。它在2014年就开始研发,2021年正式激活。富岳部署在兵库县神户市中央区港湾人工岛上的理化学研究所计算科学研究中心内,其运算能力为京的100至120倍,耗电为30兆瓦至40兆瓦,京的耗电为12.7兆瓦。其实,“富岳”是富士山的别称。
富岳是全球首度夺冠的ARM架构超级电脑,采用富士通48核心A64FX SoC,与过往超级计算机大多采用的Intel或AMD的x86、x64主流平台不同。富岳拥有 7,630,848 个内核,在HPL标准下算力为442Pflop/s,这样的性能表现超过了排名第二的美国Summit超级计算机的3倍。
恐怖的是其峰值性能可达到1 exaFLOPS(1,000 petaFLOPS)。而且它除了在Linpack中拿到好成绩,也在新的HPL-AI基准测试中获得了2 exaFLOPS的好成绩。
2020年6月23日,富岳正式获认证,以415 PFLOPS计算速度成为TOP500排名第一的超级计算机。之后同年11月17日发表的TOP 500排行榜成功蝉联第一。如今又再次夺冠。
Summit超级计算机
Summit超级计算机(中文有翻译顶点,或者高峰),实验室代号“OLCF-4”,是IBM为美国能源部旗下橡树岭国家实验室开发建造的超级计算机。机组于2018年6月8日落成,理论运算能达200 PFLOPS(浮点运算速度每秒20亿亿次),超过峰值运算性能125 PFLOPS的神威·太湖之光,2018年6月25日正式获TOP500认证为全球最快的超级计算机。随后被富岳超越。但仍然是美国最快的超计算机。
Summit在 HPL 基准测试中的性能为 148.8 Pflop/s,在全球排名第二。Summit 有 4,356 个节点,每个节点使用的是与泰坦类似的CPU+GPU异构计算架构,包含两颗Power9 CPU(每颗CPU有 22个内核),以及6块NVIDIA Tesla V100 GPU组成。这些节点通过 Mellanox 双轨 EDR InfiniBand 网络链接在一起。
Sierra超级计算机
Sierra,代号ATS-2,是IBM为美国能源部下属的劳伦斯利佛摩国家实验室建造的超级计算机,由美国国家核安全局管理,也是该局的第二套“先进技术系统”(Advanced Technology System,ATS),本机组与橡树岭国家实验室的高峰使用几乎相同的架构。
Sierra的运算节点采用IBM的Witherspoon S922LC OpenPOWER主机,每台主机中配备IBM POWER9 CPU配以NVIDIA Tesla V100运算加速卡,CPU和加速卡之间使用NVLink连接,每颗CPU配以两块运算加速卡,不过原始计划里是每颗CPU配以三块运算加速卡。节点之间的连接采用EDR InfiniBand。
神威·太湖之光超级计算机
神威·太湖之光超级计算机(Sunway TaihuLight)是由国家并行计算机工程技术研究中心研制、安装在国家超级计算无锡中心的超级计算机,搭载了40960个中国自主研发的“申威26010”众核处理器,该众核处理器采用64位自主申威指令系统,峰值性能为12.54京次/秒,持续性能为9.3京次/秒。(1亿为1亿亿)
神威·太湖之光超级计算机由40个运算机柜和8个网络机柜组成。每个运算机柜比家用的双门冰箱略大,打开柜门,4块由32块运算插件组成的超节点分布其中。每个插件由4个运算节点板组成,一个运算节点板又含2块“申威26010”高性能处理器。一台机柜就有1024块处理器,整台“神威·太湖之光”共有40960块处理器。每个单个处理器有260个核心,主板为双节点设计,每个CPU固化的板载内存为32GB DDR3-2133。
2020年7月,中国科大在“神威·太湖之光”上首次实现千万核心并行第一性原理计算模拟。
天河二号超级计算机
天河二号(简称:TH-2),是一组由国防科技大学研制的异构超级计算机,为天河一号超级计算机的后继机型。天河二号的组装和测试由国防科技大学和浪潮集团来负责,于2013年底入驻位于广东省广州市的中山大学广州校区东校园内的国家超级计算广州中心并进行验收,2013年底交付使用后对外开放接受运算项目任务,用于实验、科研、教育、工业等领域。
天河二号造价达一亿美元,整个系统占地面积达720平方米。它于2013年6月起至2016年6月之前,为世界上最快的超级计算机。目前,天河二号由国防科技大学和中山大学共同使用和维护。
天河二号的处理器是英特尔的Xeon E5-2692v2 12核心处理器,基于英特尔Ivy Bridge微架构(Ivy Bridge-EX核心),采用22纳米制程,峰值性能0.2112TFLOPS。
运算加速使用基于英特尔集成众核架构的Xeon Phi 31S1P协处理器,运行时钟频率为1.1GHz,拥有57个x86核心(实际上拥有61个核心,因激活全部核心时会存在运算周期协调冲突之问题,因此先遮蔽4个x86核心),每个x86核心借由特殊的超线程技术能运作4个线程,产生峰值性能为1.003TFLOPS。
不过基于美国商务部限制中国超级计算机采购美国器件,我国在2017年开始使用自主研发的Matrix-2000代替Xeon Phi作为协处理器的升级计划。
在TOP500榜单中,尽管其中中国超级计算机的绝对数量还是遥遥领先,但是由上一次的212变为现在186台,相应的,美国则由上一次的113台增至如今的123台。尚不清楚是否是由于芯片供应问题导致的负面效应。
但在综合性能指标上,来自美国的超级计算机仍然处于领先,目前总算力达到了856.8Pflop/s,而中国则为445.3Pflop/s。
相关问答
中国神威芯片与国外最好芯片有差距吗-ZOL问答
神威·太湖之光是世界上最快的超级计算机之一,其独特的构架使其在高性能计算领域具有优势。然而,相较于其他顶级芯片,神威·太湖之光在应用支持方面仍存在一定...
“神威太湖之光”超级计算机一共有多少个CPU?是什么型号的CP...
[回答]神威·太湖之光超级计算机由40个运算机柜和8个网络机柜组成。一台机柜就有1024块处理器,所以整台“神威·太湖之光”共有40960块处理器,即共有40960...
神威太湖之光命名的由来?
由于出台的地方是無錫,故而命名為“神威太湖之光”。据说之前位列第一的中國超級計算機系統使用了英特爾公司研發的芯片,去年出台的一項美國出口禁令使該系統...
天河一号与神威太湖之光哪个更快?
第一名:神威太湖之光是由国家并行计算机工程技术研究中心研制、安装在国家超级计算无锡中心的超级计算机,是中国一台峰值速度超过10亿亿次/秒的超级计算机。...
中国百亿亿次超算原型机诞生,核心芯片实现真正全国产,期待吗?
其实,超级计算机的作用是无限的,其不仅仅可以用于计算,而且还能帮助芯片、操作系统的领域实现新发展。上世纪,超级计算机领域被美日两国掌控,我国没能掌握...上...
如何看待全球超算500强:中国位居第三、四名,均用国产芯片?
谢谢您的问题。超算能力我国发展领先,但国产芯片是现在才用。排名怎么算。第一,标准是计算速度,就是每秒浮点运算的次数,包括实测最高速度Rmax、理论最高速...
为什么中国在芯片技术/工艺等落后的情况下,却可以让超算在世界范围内名列前茅甚至一度超过美国?
前几年,美国用于超算的芯片并不是超算专用芯片,而是CPU芯片,这种芯片内存很大,能处理的任务种类很多,但也导致其浪费不少晶体管。简单说就是样样都会却没有...简...
中国的国产芯片有哪些?
中国芯通用芯片有:魂芯系列、龙芯系列、威盛系列、神威系列、飞腾系列、申威系列;嵌入式芯片有:星光系列、北大众志系列、湖南中芯系列、万通系列、方舟系列、...
米乐app官方地址(官方)下载网站
平衡模式的特点是声音分离度特别高,虽然HM-700采用的是指标不高的3770芯片,但实际表现非常不俗,特别是声音的干净度相当好,声场开阔,声音稳定,层...
新一期全球超级计算机500强榜单公布,使用中国自主芯片制...
[最佳回答]据新华社华盛顿2016年6月20日电新一期全球超级计算机500强榜单20日公布,使用中国自主芯片制造的“神威太湖之光”取代“天河二号”登上榜首,中国超...