国产超级计算机“全隐式求解器算法”获应用

  偏微分方程的隐式求解器在大规模科学与工程计算中具有广泛用途,是提高不少具体应用问题实际计算效率的关键。近年来,随着高性能计算机计算能力的突飞猛进,硬件体系结构日趋复杂,传统并行隐式求解算法已经难以适应新型体系结构的发展趋势,隐式求解器的设计和应用遇到了前所未有的挑战。

  近日,我国首个以数学学科为主导的国家自然科学基金重大研究计划“高性能科学计算的基础算法与可计算建模”结束评估。在该重大研究计划的资助下,北京大学数学科学学院杨超与合作者提出一类具有数百上千万处理器核可扩展能力的全隐式求解器算法,在国产大型异构众核超级计算机上取得了显著应用效果。

  研究团队提出一类新型异构区域分裂算法,在经典区域分裂算法基础上设计了异构区域剖分策略,充分发挥了异构计算单元各自不同的计算能力,并有效减少了子区域之间的数据移动开销。此后研究团队进一步基于瀑布型多层区域分裂框架,设计了高效多层粗网格矫正算法,提升了隐式求解器的收敛性。在此基础上,研究团队提出一套新型流水线并行不完全矩阵分解算法用于子区域问题求解,该算法巧妙利用了原始问题的几何信息,避免了非规则数据索引,增强了并行度和数据局部性。

  异构区域分裂算法被应用于HPCG基准测试,在“天河2号”超级计算机整机312万核上实现了623 Tflops性能,帮助“天河2号”取得2014年11月HPCG排名榜第一名。“天河”研制单位国防科技大学评价该工作“超越美国Intel公司提供的优化版软件,达到世界领先水平”。

  随后,在国产“神威·太湖之光”超级计算机上,研究人员将该算法应用于非静力大气动力学模拟中,扩展至整机1049万核,完成了7700多亿未知数问题的模拟。最终,“千万核可扩展非静力大气动力学全隐式模拟”研究成果获2016度美国计算机学会“戈登贝尔”奖,一举实现了我国在这一国际高性能计算应用最高奖项上零的突破,并入选了由两院院士评选的2016中国十大科技进展新闻。

   

  异构区域分裂算法在大气动力学领域的应用。(研究团队供图) 

  “千万核可扩展非静力大气动力学全隐式模拟”研究成果得到了来自国内外多方面的积极评价,被评价为同领域“为数不多”“高度有效”的相关成果。“神威·太湖之光”研制单位国家并行计算机工程技术研究中心评价该成果是“我国高性能计算领域跨单位、跨学科合作的结晶,对我国高性能计算应用与发展具有引领和示范意义,并对我国下一代高性能计算机的研制有重要启示”。

本文由程序自动从互联网上获取,其版权均归原作者所有,文章内容系原作者个人观点,不代表本站对观点赞同或支持。如有侵权,请联系删除。