近日,北京大学数学科学学院教授、大数据分析与应用技术国家工程实验室副主任杨超团队的论文《Enabling and Scaling the HPCG Benchmark on the Newest Generation Sunway Supercomputer with 42 Million Heterogeneous Cores》被国际超级计算大会(SC21)接收,并同时入选了大会最佳论文和最佳学生论文提名。
国际超级计算大会是高性能计算领域中最受欢迎的顶级国际学术会议,每年由ACM和IEEE两个学术组织共同举办,会议从1988年至今已经成功举办33届,每届会议发表论文一般不超过100篇。据悉,这是大陆学者第三次在该会议上获得最佳论文提名,也是第二次获得最佳学生论文提名。
超级计算在气象、材料、能源、制造、国防安全等领域有广泛的应用需求,其发展水平已成为衡量一国科技创新实力的重要标志,是世界各国科技发展水平和综合国力的重要体现。近年来,随着处理器晶体管尺寸逐渐逼近物理极限,电子计算机的发展已经进入了“后摩尔定律”时代。为维持超级计算机计算性能不断提升,大型计算系统的硬件设计正在发生深刻变化,基于异构、众核的系统架构已成为大型超级计算机的重要设计方案。例如,国产新一代神威超级计算机的异构核心数量多达数千万,是目前TOP500世界排名第一的“富岳”的五倍以上。伴随E级计算脚步的临近,设计高效并行算法从而充分挖掘超级计算机强大的计算能力变得愈加重要。
高性能共轭梯度(High Performance Conjugate Gradients,HPCG)基准测试主要考察超级计算机求解大型稀疏线性方程组的实测性能,在科学与工程计算等领域具有较高的代表性。杨超教授团队长期从事HPCG等基准测试在国产超级计算机上的性能优化工作,曾为天河二号超级计算机揽获2014年11月HPCG基准测试排行榜第一名。在本次工作中,研究团队针对国产新一代神威超级计算机上的硬件特征,提出了快速收敛的两层分块算法、局存感知的细粒度融合策略和低延迟的片上通信协作机制等一系列并行算法和性能优化技术。经测试,优化版程序可高效扩展至4200多万计算核心,实测性能、带宽利用率和并行效率均达到了世界领先水平。在此基础上,研究团队分析了在不受HPCG基准测试规则限制的情况下,沿用同一算法框架求解同一目标问题可以采用的其他关键策略,提出了依赖保持的并行算法和向量化技术,进一步大幅提升了实测性能。上述研究工作对大型超级计算机上科学工程计算应用研发具有指导意义,也为国产超级计算机的软硬件设计提供了有价值的参考和反馈。
图 适应于国产新一代神威超级计算机上的快速收敛双层分块算法
论文的通信作者为杨超教授,第一作者是北京大学前沿交叉学科研究院大数据科学研究中心硕士研究生朱钱超,其他作者包括北京大学数学科学学院本科生罗昊,北京大学信息科学技术学院本科生丁明朔,以及国家并行计算机工程技术研究中心高级工程师尹万旺、袁欣辉。论文工作得到了国家重点研发计划(资助号: 2016YFB0200603)、北京市自然科学基金委杰出青年科学基金(资助号: JQ1801)以及北京智源人工智能研究院资助。
转载本网文章请注明出处