北京时间6月20日,TOP500组织在法兰克福世界超算大会(ISC)上发布了第47届世界超级计算机500强。国家超级计算无锡中心运营的“神威·太湖之光”超级计算机系统登顶榜单之首,成为世界上首台运算速度超过十亿亿次的超级计算机。此前,由我国国防科学技术大学研制的“天河二号”已创下“六连冠”的辉煌战绩,这也标志着我国超级计算机研制能力已位居世界先进水平。
本届世界超算大会(ISC)上,“神威·太湖之光”勇夺TOP 500冠军头衔成为世界上最快的计算机,天河二号力挫强敌守住第二名,中国超算上榜数量首次超越美国,可谓是拿奖拿到手软。
那么,站在世界之巅的“神威·太湖之光”究竟“神”在哪里?此次问鼎TOP500榜首对于我国超算领域发展又有怎样的意义?参与了本次世界超算大会(ISC)中科院计算所张云泉研究员做了重要解答。
图1 “神威·太湖之光”问鼎TOP500榜首
关于TOP500的冷知识
本次中国超级计算机“神威·太湖之光”问鼎TOP500榜首,让无数中国人热血沸腾,相信很多人在激动的同时都会产生一个相同的问题,TOP500究竟是什么鬼?难道是超级计算机届的奥运会?
其实,国际TOP500组织是一个具有较长历史的用于发布全球已安装超级计算机系统排名的权威机构,以超级计算机基准程序Linpack测试值为序进行排名,每年发布两次,其目的是促进国际超级计算机领域的交流和合作,促进超级计算机的推广应用。张云泉介绍说,TOP500世界超级计算机排行榜最早可由德国慕尼黑大学的汉斯教授在1993年发起,每年发布两次,至今已有23年的历史,刚刚落幕的法兰克福世界超算大会(ISC)上已经是第47届。
此外,TOP500排行榜的发布场合也是国际权威。TOP500组织每年发布两次超级计算机排名情况,分别是在德国举办的世界超算大会(ISC)和在美国举办的世界超算大会(SC),代表着超级计算机的国际水平,同时也是各国超级计算机领域发展水平的标杆。
除了历史悠久、发布场合权威,TOP500排行榜采取的评审标准也是业界公认的权威标准,也就是根据超级计算机基准程序Linpack测试值进行排序。张云泉解释说,Linpack现已经成为国际上最为流行的用于测试高性能计算机系统浮点性能的benchmark(基准点)。通过超级计算机求解N元一次稠密线性代数方程组的测试,从而评价高性能计算机的浮点性能。这也是一个公开客观的评审标准,其评审结果是得到业界广泛认可的。
如果说奥运会是人类挑战生理极限的平台,那么世界超算大会(ISC)则是人类借助计算机挑战运算极限的阵地。所以,“神威·太湖之光”问鼎TOP500榜首也是对于中国超级计算机领域发展成果的肯定,让中国制造再次登上了国际舞台。
图2 TOP500组织标志
三招“必杀技”:中国超算显神威
超级计算机新科世界冠军——“神威·太湖之光”位于江苏省国家超级计算无锡中心,它是一套非常宏大的计算机系统,由四十余个高度集成的机柜组成,是名副其实的“最强大脑”。那么,作为世界上最快的超级计算机,“神威·太湖之光”一举拿下TOP500冠军的过人之处有哪些?张云泉为我们进行了解读,“必杀技能”有三招。
第一招——速度较量,唯快不破。张云泉表示,“神威·太湖之光”的峰值运算速度已经达到了每秒12.54亿亿次,其一分钟的计算能力相当于全球72亿人口同时用计算器连续不间断计算32年,这是全球第一台运行速度超过10亿亿次/秒的超级计算机。同时,其持续计算速度达到了每秒9.3亿亿次,是此前的世界冠军“天河二号”的3倍,是目前世界上持续计算能力最强的超级计算机。在超级计算机基准程序Linpack测试中,“神威·太湖之光”仅用4小时就完成了“天河二号”20多个小时才能完成的运算任务。也就是说,“神威·太湖之光”的运算速度和计算能力都“完胜”此前的 “天河二号”,这个世界冠军实至名归。
图3 “神威·太湖之光”性能参数
第二招——最强大脑,中国芯。“神威·太湖之光”之所以拥有世界最快运行速度,当然还要归功于其强大的硬件支持。张云泉介绍说,超级计算机主要是依靠提高并行度和设备的规模来提升计算速度,“神威·太湖之光”拥有超过1000万个处理器核,远远超过天河二号的300多万个,从而极大地提升了其运算规模和并行度。更加令人振奋的是,“神威·太湖之光”是首次完全用“中国芯”制造的中国最强大的超级计算机,此前“天河二号”使用的是英特尔至强处理器和Xeon Phi协处理器。作为“最强大脑”的“中国芯”,“申威26010”众核处理器这个只有5厘米见方的小小薄块,它集成了260个运算核心,数十亿晶体管,达到了每秒3万多亿次计算能力,单芯片计算能力相当于3台2000年全球排名第一的超级计算机。40960个“中国芯”同时工作,让“神威·太湖之光”登上了世界计算巅峰。
图4 申威26010众核处理器
第三招——绿色节能,又快又省。“神威·太湖之光”的功耗比达到了每瓦60.51亿次,在运行速度和持续计算能力均大幅提升的同时,其功耗不升反降,成为世界上计算能力最强但是最绿色环保的超级计算机。张云泉表示,以前TOP500的超级计算机,其功耗都比较大,而“神威·太湖之光”的持续性能和功耗比两项均属世界排名第一,并且远远地大幅领先其他超级计算机,这也体现出我国在超级计算机研制领域,不单单追求以“快”取胜,并且在自主可控、持续性能和绿色指标等综合性能方面都取得了突破性的进展,并且达到了新的高度。
超算用途广:比名次更重要的是造福人类
人类在体育竞技中,挑战生理极限的同时,更多的是获得精神上的激励与鼓舞,而作为超级计算机领域的“奥运会”,登顶TOP500榜首不是最终目的,造福人类才是“神威·太湖之光”的终极使命。
超级计算机在能源、航天、生物制药等领域已经有了丰富而卓有成效的应用,截至目前,国家超级计算无锡中心已经承接了国内30多个重大应用项目。其中,清华大学地球系统科学研究中心在“神威太湖之光”计算机系统上首次实现了百万核规模、高分辨率的地球系统数值模拟。
张云泉还介绍说,2016年度戈登贝尔奖来自全球的6个提名中,“神威太湖之光”就占了3个,分别涉及大气、海洋、材料三个领域的应用。而戈登贝尔奖作为计算机高性能应用领域的最高荣誉,一直有超算领域的诺贝尔奖之称,“神威·太湖之光”的出现有望实现我国在这个奖项上零的突破。
图5 中科院计算所张云泉研究员
超级计算机,被称为“国之重器”,超级计算属于战略高技术领域,是世界各国竞相角逐的科技制高点,也是一个国家科技实力的重要标志之一。自我国863计划实施以来,国家高度重视并且支持超级计算系统的研发,但由于基础薄弱起步较晚,在国际舞台中一直受制于人,美国更是在2015年宣布对我国禁售高性能处理器。而“中国芯”“申威26010”的问世,也成为我国自主研发打破30年技术封锁的一柄利器。“神威·太湖之光”勇夺榜首,可以说为我国超级计算机领域的发展打了一剂强心针。
揭秘申威:一家低调的自主处理器制造商
沿着“神威•太湖之光”的处理器“申威26010”,我们根据公开信息,找到了生产处理器的无锡江南计算机研究所。相对于从诞生之初就处于舆论风口浪尖的龙芯,国内另一款走全自主道路的芯片——申威,相比之下就低调得多。
无论是传统纸媒还是网络媒体,申威的曝光率比起龙芯、海思、展讯等国产芯片都要低得多,而且相比于嘲讽天赋技能被点满的龙芯,申威极少成为网媒和充满虐气的网民的攻击对象。申威的军方背景更是给它带一缕神秘的色彩。下面,让我们一起走进申威,解密申威的“芯”路历程。
1、申威的诞生
上世纪60-70年代末,中国在高性能计算机领域也曾有过自己的辉煌——哈军工曾经制造出具有分时操作系统和汇编语言、FORTRAN语言及标准程序库的441B系列计算机。北京大学、北京有线电厂等单位联合研制150计算机。清华大学、北京无线电三厂研制生产了130、131、132、135、140、152、153系列计算机近千台。国防科大成功研制出151计算机,华东计算技术研究所成功研制1001中型集成电路计算机和HDS-9计算机,其中HDS-9计算机每秒运算达500万次,更为难能可贵的是,这些计算机的软件和硬件是中国人自己编译和制造的。
但在80年代因迷信“造不如买、买不如租”、“市场换技术”等理论,放弃了自主芯片的研发转而大量外购国外芯片。从80年代的银河1超算开始,到90年代的银河2、银河3,曙光系列超级计算机都没有中国“芯”,在技术上始终受制于人。即使是在几年前的天河2号上,也只有4096片飞腾1500作为计算节点前端处理器,而飞腾1500是在SUN的UltraSPARC T2基础上做的改进版本。
为解决在超算和国防、信息安全无“芯”可用的困境。总参谋部第五十六研究所(无锡江南计算技术研究所)于2003年开始着手设计中国人自己的高性能芯片。申威从此踏上了征途。
2、申威的娘家
申威由总参谋部第五十六研究所(无锡江南计算技术研究所)设计,上海高性能集成电路设计中心是56所的马甲。
该研究所创建于1951年6月,坐落于无锡。主要研究方向有计算机系统结构、并行/分布处理与智能计算机系统、计算机软件、人工智能与智能控制、计算机与通信、计算机信息处理与应用。八十年代以来,在计算机、通信及机电一体化等领域共荣获国家、军队科学技术成果奖300多项,其中国家科学技术进步特等奖3项,军队科学技术进步一等奖35项。1987、2000年,中央军委两次为56所荣记集体一等功。1993年中央军委授予56所“勇攀科技高峰先进研究所”荣誉称号。
3、申威的指令集和技术渊源
申威属于Alpha阵营,指令集也是基于Alpha进行扩展。申威的技术来源是于DEC的Alpha 21164。DEC的技术实力很强,Alpha性能更是惊艳,AMD就曾经购买了Alpha 21264的技术资料,挖走了部分DEC的技术人员后,开发出自己的K7微结构。
DEC是技术实力比人强,但商业模式不如人而失败的典型例子,Alpha也被几经转手,先被康柏收购,后被惠普雪藏。目前Alpha已经被束之高阁,指令集和微结构都已经不再更新,技术专利大多已过期或快过期了。申威是目前Alpha阵营中仅存的硕果,拥有自主扩展指令和发展路线的自主权。
4、自主可控体系构建
申威和龙芯作为国内硕果仅存的两个走自主可控路线的IC设计单位,和龙芯一样在积极构建自己的软硬件体系以保障从软件和硬件两个方面实现安全可控。申威开发了自己的神威睿智编译器,研发了基于Linux的神威睿思操作系统。加上超算领域不像PC领域那样存在软件生态的掣肘,申威构建自主技术体系的道路可谓一片坦途——于2012年9月投入使用的神威蓝光超算使用了8704片申威1600,搭载神威睿思操作系统,实现了软件和硬件全部国产化。
5、申威历程
56所(江南所)以Alpha指令集为基础,扩展出自己的指令集,并在2006年设计出具有自主微结构的申威1,申威1是一款130nm制程工艺的单核心CPU,主频900MHz,集成5700万晶体管。2008年完成的申威2,是一款130nm制程工艺的双核CPU,主频1.4GHz。
如果说申威1和申威2更像是56所磨砺技艺的作品,是对Alpha21164技术的消化吸收,那么2010年研发的申威1600则是56将国外技术融会贯通后,推陈出新的产品。申威1600是一款65nm制程工艺的16核CPU,主频1.1G,双精浮点140G。申威1600被用于神威蓝光超算。
也许是因Alpha当年强悍的性能,本人对源自Alpha的申威抱有很高的期望。但根据国家高性能集成电路设计中心公布的论文显示,申威1600的SPEC2000测试分数只能说是差强人意,唯有性能功耗比和LINPACK测试聊以自慰。平心而论,虽然申威1600处理器的单核性能有限,但16核的可扩展性很好,实现了比较理想的多核性能加速比。
2012年,56所研制出申威1610和申威410,申威1610为40nm制程的16核CPU,集成10亿晶体管,主频1.6G,最大功耗50W,双精浮点运算200G。申威410为40nm制程的4核CPU,集成2.7亿晶体管,主频1.6G。前者用于服务器,后者用于PC,支持中标麒麟操作系统。这两款产品同样遭遇了龙芯在PC市场遇到的软件生态贫乏和产业联盟弱小导致产品缺乏市场竞争力的困境,加上申威410单核性能太弱,搭载申威410的安全可信PC基本不具备在民用PC市场的竞争力。
2014年底,申威5成功流片。根据一篇由坐落于无锡的数字工程与先进技术国家重点实验室和坐落于北京的国家并行计算机工程技术研究中心联合发布的论文,申威5很有可能是一款集成了4个管理核心和256个运算核心的高性能众核CPU,双精浮点运算超过1T,核内 linpack效率93%,并有很高的性能功耗比。
6、神威蓝光超算
神威蓝光超算总投资6亿元,于2012年9月投入使用。神威蓝光超级计算机使用了8704片申威1600,搭载神威睿思操作系统,实现了软件和硬件全部国产化。神威蓝光超算峰值计算性能1PFlops(一千万亿次每秒),持续性能为0.796PFlops,性能功耗比超过741MFlops/W(百万次浮点运算/秒•瓦),LINPACK效率为74%。
神威蓝光超算有以下特点:
一是全部使用申威1600芯片,搭载神威睿思操作系统,实现软件和硬件全部国产化;
二是稳定性较好,测试Linpack 全过程9个多小时无故障;
三是液冷系统高效可靠,冷却剂在冷板内部的封闭水循环带走主板热量,环保且无噪音;
四是高密度封装,一个机仓可装入1024个CPU;
五是整机功耗低,性能功耗比高。神威蓝光超算性能功耗比超过741MFlops/W,整机功耗1W;天河1号超算性能功耗比431.7 MFlops/ W,整机功耗4W。
六是整机效率高。神威蓝光超算LINPACK在不同规模下的效率:单处理器核80.28%,单CPU 75.20%,单机舱75.07%,整机74.37%。神威蓝光超算整机效率与曾经是美国最快的计算机美洲虎超级计算机效率相当。
据统计,“国家超级计算济南中心”有注册用户超过100个,移植优化60多道重点应用课题,其中能够达到上万核并行规模的应用课题达16个,有应用成果的课题超过15个,系统利用率已超过60%。目前主要面向气象气候、海洋环境、生物医药、信息安全、航空航天、材料物理、金融分析、工业设计、石油物探等应用领域。
新一代神威超算
无锡市人民政府于2013年就成立了以市长为组长,副市长为副组长的国家超级计算无锡中心建设领导小组,积极筹备新一代神威超算建设。2015年4月,官方成立了无锡恒鼎超级计算中心有限公司作为国家超级计算(无锡)中心的建设和运营主体,56所成立了项目指挥组及总师组负责解决超算建设过程中的技术问题。
目前,新一代神威超算主机系统软件正在调试中,整机系统设计计划于2015年年底公布。新超算总投资18亿元,计划在 2017-2018年建成,运算能力将达到100PFlops,计算性能有望冲击世界第一。
神威MPP机
神威MPP机是国家并行计算机工程技术研究中心研制的面向千万亿级以上规模的高性能计算机,能通过虚拟化技术、网格计算技术和云存储技术在服务层虚拟出多种计算和存储服务形态。
神威MPP机硬件系统由高速运算系统、互连网络系统、海量存储系统、维护监控系统、电源系统、冷却系统和结构组装设计等部分组成。软件系统主要包括“神威睿思”操作系统、“神威睿智”编译器、基础库等。
系统投入使用以来,已经成功移植了包括气候气象、海洋科学、新药研制、生物信息、航空航天、工业设计、金融分析等重点应用领域的近二十道万核以上并行规模的实际应用课题,取得若干重大应用成果。
6神威Cluster是在汇集神威MPP机的技术优点基础上,专门为科学和工程计算领域设计开发的高性能计算平台。在气候气象、海洋环境、数值风洞、碰撞仿真、蛋白质折叠、基因研究、新药研发、分子动力学模拟、量子化学计算、材料科学、芯片设计、动漫设计、工业设计等方面用途广泛。神威Cluster系统的通用结构如下图:
7、安全可信PC
神威安全可信PC是搭载申威410,针对有较高安全需求的党政军单位,元器件实现100%国产化。内嵌的国产外围套片,集成了符合国家标准的可信密码模块,实现系统内嵌式可信引导和软件系统的可信度量,保证系统的安全可信。
因申威410单核性能太弱,软件生态极度贫乏,仅限于满足特殊部门使用。如果说龙芯还是在从安全市场往民用市场方向发展的话,申威从头到尾压根就没考虑过民用市场,完全是自己关起门来自己玩。
实事求是的说,搭载申威410的安全可信PC不仅价格贵,整机性能弱,而且软件生态贫乏,基本不具备在民用PC市场的竞争力。在申威5走众核路线后,从2012年至今,申威没有新的桌面芯片产品,很有可能已经放弃桌面芯片开发。安全架构如图所示:
8、神威云
神威云是国家并行计算机工程技术研究中心研发的云产品,能够提供丰富的云产品套件、开放的API接口、全面的资源管理平台和运维监视平台,具有强大的虚拟资源池管理能力。神威云平台采用商用服务器、高速网络、高性能存储设备,结合神威云平台系列软件搭建。具有功能强大、性能稳定、安全可靠、简单好用的特点。
9、小结
虽然申威和龙芯一样是走独立自主路线,但申威的道路要比龙芯平坦得多:首先,国家对龙芯的投入非常有限,而且龙芯自2010年市场化运营后完全自主经营,自负盈亏。申威是军方项目,不仅不用面对IC设计公司最头痛的技术人才流失问题,还能在人力物力财力可以得到军方充足保障。
其次,申威专注于超算领域,不存在龙芯在PC市场遇到的软件生态贫乏和产业联盟弱小导致产品缺乏市场竞争力的困境。申威有自己的指令集、微结构、CPU、编译器、操作系统就足以在超算领域立足。而龙芯则被软件生态贫乏和产业联盟弱小掣肘。但申威专注于超算领域也带来一个缺憾,就是在和人民群众最息息相关的民用PC市场,我们可能永远看不到申威的产品了。
最后,申威是军方项目,而神威超算更是国家级工程,申威的软件和硬件产品完全可以在体制内完成内部循环。而龙芯的很多产品必须到商业市场上去拼杀。
申威自2003年诞生以来,基于Alpha自主扩展了指令集,共设计了申威1、申威2、申威1600、申威1610、申威5五款芯片,自主研发了神威睿智编译器和神威睿思操作系统,推出了搭载申威芯片的PC、服务器、高性能计算机、超算、防火墙、机架式存储服务器、大规模集群存储系统、瘦客户端、QDR HCA卡、神威云等产品,为国家信息安全和超算建设竭尽所能,圆满完成了国家交付的任务。
1、本文只代表作者个人观点,不代表本站观点,仅供大家学习参考;
2、本站属于非营利性网站,如涉及版权和名誉问题,请及时与本站联系,我们将及时做相应处理;
3、欢迎各位网友光临阅览,文明上网,依法守规,IP可查。
作者 相关信息
内容 相关信息
• 昆仑专题 •
• 十九大报告深度谈 •
• 新征程 新任务 新前景 •
• 习近平治国理政 理论与实践 •
• 我为中国梦献一策 •
• 国资国企改革 •
• 雄安新区建设 •
• 党要管党 从严治党 •
图片新闻