清华领衔团队斩获世界高性能计算最高奖“戈登·贝尔”奖,创新战略+学科交叉打造一流超算平台

11月17日,在美国丹佛举行的全球超级计算大会(SC2017)上,由清华大学地球系统科学系付昊桓副教授等共同领导的团队所完成的“非线性地震模拟”荣获“戈登·贝尔”奖(ACM Gordon Bell Prize),实现了中国在此奖项上自2016年首次获奖后的蝉联夺冠。

设立于1987年的“戈登·贝尔”奖是世界高性能计算应用的最高奖。它由美国计算机协会(Association for Computing Machinery, ACM)每年11月在召开的超算领域顶级会议上颁发,奖励时代前沿的并行计算研究成果,特别是高性能计算创新应用的杰出成就。

付昊桓领衔的另一项工作“全球气候模式的高性能模拟”,也成功入围今年“戈登·贝尔”奖的最终决选。这两项工作,与去年11月25日中国首获“戈登·贝尔”奖的获奖项目“千万核可扩展大气动力学全隐式模拟”一样,都是以“神威·太湖之光”作为重要依托平台,“神威·太湖之光”也由此成为世界高性能计算最高奖的孵化平台。

 

 “四连冠”,彰显硬件绝对实力

位于国家超级计算无锡中心的“神威·太湖之光”由清华大学负责运营。它的峰值计算能力为每秒12.5亿亿次,持续计算能力为每秒9.3亿亿次。

在2017年11月13日发布的最新一期全球超级计算机500强的榜单中,“神威·太湖之光”连续第四次夺冠;中国的超算上榜总数又一次超过美国,夺得第一。这既表明了“神威·太湖之光”的绝对实力,也再一次彰显了中国在超算硬件领域的世界领先地位。

 

多学科交叉,打造神威国产软件生态

2015年夏天,当清华大学的团队进驻到还未完全建成的国家超级计算无锡中心时,冲击世界顶尖的“戈登·贝尔”奖似乎还是个遥远的梦想。

“神威·太湖之光”全国产的机器设计,以全新的片上融合异构的众核芯片,带来了性能与能耗效率的大幅提升。但是,与众不同的硬件架构,也意味着所有主流的科学计算和工程计算软件都无法在这台新的超级计算机上直接运行,软件生态相对匮乏。

相对落后的软件生态,对于致力于神威平台的应用软件团队,既是挑战,更是机遇。2015年的七月中,无锡最热的时节,来自清华大学、北京师范大学以及国家海洋局第一海洋研究所的三十多位老师和同学,面对模式上百万行的计算程序,悄然展开了国产应用软件研发的第一次征程。

三个月的集中研发,使团队中计算机专业的同学们逐渐成为了大气、海洋模拟的专家,而地学专业的同学们也逐渐成为国产神威平台的专业“码农”,最终造就了三个月完成百万行代码移植、十万多行代码重构及重新设计的奇迹。事后看来,这一批计算机与地学交叉型人才的培养和形成,成了日后清华团队在神威平台上应用成果开花结果的关键。

经过了一年多的集中开发,在国内几十所大学及研究机构的通力合作下,到2017年,良好的神威国产软件生态终于形成,拥有超过十几种可扩展至全机的科学及工程应用软件。

清华团队中的一部分老师同学继续与北京师范大学和山东大学组成联合研究团队,致力于大气模式在神威平台上的重构设计与大规模优化计算;而另一些老师同学则与山东大学、南方科技大学和中国科学技术大学等单位形成了一支新的交叉队伍,短短几个月的时间,就完成了基于“神威·太湖之光”的地震模拟全过程软件平台。

 

方法创新,多应用世界领先

荣获今年“戈登·贝尔”奖的《基于“神威·太湖之光”的18.9-Pflops非线性地震模拟:实现对18Hz和8m情景的描述》,由清华大学地球系统科学系、计算机系与山东大学、南方科技大学、中国科学技术大学、国家并行计算机工程技术研究中心和国家超级计算无锡中心等单位共同完成。团队中共有5人来自清华大学。

地震模拟工具可以实现对地震发生过程的重现与模拟,是科学家理解地质构造与地震发生与传播原理的重要工具,对于降低与预防地震灾害所带来的巨大损失具有重要作用。地震模拟工具还可以与其它技术相结合,用于对地震高发区的基础设施进行合理规划与设计,以提升城市规划的安全性,防患于未然。

基于“神威·太湖之光”强大的计算能力,研究团队成功地设计实现了高可扩展性的非线性大地震模拟工具。此工具实现了高达18.9PFlops的非线性地震模拟,是国际上首次实现如此大规模、高分辨率、高频率的非线性可塑性地震模拟;还首次实现了对唐山大地震(M7.8, 1976)发生过程的高分辨率精确模拟,可以更好地理解唐山大地震所造成的影响,对未来的地震预防预测研究具有重要的借鉴意义。

此外,以付昊桓为第一作者的另一入围研究“全球气候模式的高性能模拟”,则采用了从进程到线程的一整套优化方案,对具有海量代码任务的经典大气模式CAM进行了重构设计,将其成功地移植到国产平台上,并利用数百万核规模对25公里分辨率实现了每天计算3.4年的模拟。对模式的动力框架部分,更是实现了千万核规模下750米的分辨率,及3.3PFlops的计算性能。基于该成果,团队实现了对卡特里娜飓风整个生命周期的准确模拟。该工作的成功完成,对未来面向E级(百亿亿次)计算系统的应用开发具有重要借鉴意义,并在程序设计、优化方法等方面提供了宝贵经验。

 

创新驱动发展,助力新时代中国特色社会主义伟大建设

在去年11月25日与“戈登·贝尔”奖获奖项目“千万核可扩展大气动力学全隐式模拟”团队中清华大学成员的座谈中,邱勇校长指出,“神威·太湖之光”及其应用研究,是清华大学服务国家创新驱动发展战略的重要体现,是学校交叉学科发展的优秀成果。

未来,清华大学的科研团队将继续依托“神威·太湖之光”,在地球系统模拟、生物医药、机器学习、航空航天、工业制造、新材料和新能源等多学科领域深入开展高性能计算应用研究,在建设世界一流大学、实施十九大报告提出的创新驱动发展战略、加快建设创新型国家等方面发挥更加积极的作用。

 

    供稿

    地学系

     

    创意

    映像设计组

     

    图片

    任左莉

     

    编审

    卢小兵、程曦

    张歌明、张莉

     

    栏目统筹

    程曦

     

    编辑

    程曦