随着日本8月底宣布下一代超算将在2021年问世,中国、美国、日本和欧洲在超算领域的竞争日趋白热化,各方角逐的新战场转移到运算速度达每秒百亿亿次的E级超算。为争夺“超算界的下一顶皇冠”,中国的E级超算研制计划已全面展开。近日,《环球时报》记者独家探访部署有“神威”E级超算原型机的国家超算济南中心,亲眼目睹下一代“国之重器”。
噪音与低温,这是《环球时报》记者走进国家超算济南中心机房的第一感受。这里部署着中国首台全部采用国产处理器和系统软件构建的千万亿次计算机——“神威·蓝光”。一个月前,“神威·蓝光”迎来一个新邻居——“神威”E级超算原型机。
虽然E级超算被誉为“超算领域的下一顶皇冠”,但其原型机却“貌不惊人”。“神威”E级超算原型机目前只是一台一人多高的纯黑色机柜,上面印有金色的“神威 E级原型系统”字样。打开原型机的机柜门,里面整齐分布着32个运算超节点,每个超节点又由8个申威众核处理器构成。
作为原型机,虽然它的体积不大,但相比由9个机柜组成的“老前辈”“神威·蓝光”,“神威”E级超算原型机的浮点运算速度达每秒3000万亿次,是“神威·蓝光”的3倍,相当于我国最强超算“神威·太湖之光”运行速度的1/30。
据国家超算济南中心主任张云泉介绍,“神威”E级超算原型机实现了完全自主可控——处理器、网络交换芯片、消息处理芯片等核心器件全部实现国产化。运算系统全部采用具有完全自主知识产权的申威众核处理器;高速互连网络系统全部采用完全自主知识产权的申威网络芯片构建;存储和管理系统采用申威多核处理器构建,实现了对该领域产品的国产化替代。
早在2016年前后,中国已经启动E级超算的研发计划,同时开始3种技术路径的探索:国家超算天津中心同国防科技大学联合研制的“天河三号”E级超算原型机已于7月22日在天津完成部署,国家并行计算机工程技术研究中心联合国家超算济南中心研发的“神威”E级超算原型机于8月5日在济南正式启用。此外,中科曙光也在进行E级超算的研制,但暂时还未披露该项目的进展。
国家超算济南中心副主任潘景山向《环球时报》记者介绍称,2016年至2018年是中国E级超算规划中的第一步,即进行原型机的研发。这一阶段完成后,三家的E级超算将进行PK,通过“赛马机制”确定其中两家并制造出两台真正的E级超算。“根据计划,拥有每秒百亿亿次运算速度的‘神威’E级超算将在2020年正式发布。”
虽然都是走众核路线,但张云泉告诉《环球时报》记者,三家的研发路径却不尽相同。根据此前披露的消息,中科曙光的E级超算原型机采用了自主X86架构处理器和加速器的异构众核体系架构。有分析认为,虽然X86处理器的技术相对成熟,但要将其完美移植到中国的E级超算上,达到较高的性能,依然存在不小的难度。
相比中科曙光,“天河三号”E级超算的原型机采用了“多模融合加速架构”,即同时使用国产飞腾FT2000+处理器和迈创Matrix 2000+加速器。据张云泉介绍,“天河三号”的架构中既有专门的飞腾芯片分区,也有迈众芯片分区,二者既可以单独运行,也可以合力运行。
与“天河三号”原型机处理器+加速器的松散耦合架构相反,“神威”E级超算的原型机采用了紧耦合的“同构众核”架构,在国产的申威26010+处理器中采用四个主核带256个从核的架构。张云泉对《环球时报》记者表示,“神威”的集成度更高,功耗更低,但挑战在于并行编程的难度会提升。“不过根据国际业界预测,未来最合适E级超算的架构应该就是‘胖核’+‘瘦核’。”
在美国超算“顶点”于今年6月超过“神威·太湖之光”、重夺全球超算第一后,中美之间的超算之争更加趋于白热化,对于下一代E级超算,两国都展示出“势在必得”的姿态。
据美国媒体披露,美国第一台E级超算代号为“A21”,未来计划部署在美国阿贡国家实验室,于2021年投入使用。不久前,美国又宣布2个新的E级超算计划,其中一台将采用与A21不同的架构,部署在橡树岭国家实验室;计划部署于劳伦斯·利弗莫尔国家实验室的E级超算则可能采用一种全新架构。