AI for Science融合计算正在为科学带来新的增长点 | 张平文院士谈《机理与数据的融合计算》

由北京科学智能研究院(AISI)主办的AI for Science系列学术讲座,于北京时间2022年5月25日(周三)13:30-15:00顺利举行。本次讲座主题为“机理与数据的融合计算”,由中国科学院数理学部院士、发展中国家科学院院士、北京大学数学科学学院教授、大数据分析与应用技术国家工程实验室主任张平文主讲,反响热烈。

 

本场讲座中,张院士从应用数学的发展历程说起,阐述应用数学发展经历了以机理为中心的计算,以数据为中心的计算,并最终进入机理与数据融合计算的历程。接下来以近年来融合计算最有影响力的3个成功案例,和融合计算在天气预报中的应用为例,向大家介绍了融合计算的模式和广阔前景。在此基础上张院士围绕AI for Social Science的概念,从人文社科的科研范式,算法的伦理和科技智库的建立三个角度,介绍融合计算将对人文社科产生极其深远的影响。最后,张院士探讨了融合计算将给应用数学领域带来哪些全新的增长点以及应用数学在国内落地的机制体制问题。

 

主讲嘉宾介绍
张平文,中国科学院数理学部院士,发展中国家科学院院士,北京大学数学科学学院教授。现任北京大学党委常委、副校长,大数据分析与应用技术国家工程实验室主任。张平文院士主要从事复杂流体的数学理论和计算方法,大数据分析与应用等方面的研究,他与合作者为液晶领域的Doi-Onsager模型奠定了数学基础并建立了Doi-Onsager模型与宏观的Ericksen-Leslie模型之间的联系;研究了一系列不同层次、不同尺度的模型之间的关系并发展了能够描述复杂相和动力学行为的统一模型;针对嵌段聚合物自洽场理论模型,发展了挖掘复杂结构的高效数值方法,设计了有序相变成核算法,这些方法和算法已经成为该领域模拟研究常用的工具。另外,他还在基于调和映射的移动网格方法、多尺度算法与分析等方面做出了创新性贡献。张平文现担任国家自然科学基金委“复杂流体和复杂流动的计算方法与数学理论”创新研究群体学术带头人,学术期刊《CSIAM Transactions on Applied Mathematics》主编,AMM等十余种国内外杂志的编委,累计在JAMS,SINUM,PRL等杂志发表论文100余篇,并在2018年应邀在国际数学家大会作45分钟邀请报告。

 

讲座视频回放

你可以直接点击下面的视频观看

以下视频来源于深度势能

也可以去B站观看,视频链接:https://www.bilibili.com/video/BV1yt4y1s7hL?spm_id_from=333.999.0.0

 

讲座精彩回顾

应用数学的演进

张院士首先回顾了应用数学演进历程。应用数学的研究具有两大特点:方向碎片化,发展并行化。在所有的方向中,研究主要聚焦于计算和统计。当代应用数学发展的第一个阶段是以机理为中心,重点在于建立有效的模型和高效的算法,而不需要大量的数据。当代应用数学发展的第二个阶段是以数据为中心,强调从数据中提取特征,其重点在于足够多的数据和有效特征,避免传统模型中的计算问题。


当代应用数学发展的第三个阶段是机理与数据的融合计算。以机理为中心的优势在于时效性长,劣势是部分问题过于复杂,难以处理;以数据为中心的优势在于其适用范围广,劣势在于可解释性差,时效性短。因此机理与数据的融合就可以做到优势互补,为大量工程问题的最后一公里提供了实现途径。


 

在这个基础上,张院士进一步强调计算这一范式的范畴不仅包括传统科学计算,还应该包括以数据为基础的计算和机理与数据的融合计算。他以“计算金字塔”概括了计算的4大要素:数据、算力、算法和场景。这几年,计算金字塔的四大要素都发生了极大的变化,比如深度学习算法、人工智能芯片、大量的落地场景以及海量、多来源、高质量的数据的涌现。这些要素的改进(尤其是数据要素的改进)共同促进计算成为所有科研和创新的重要范式,并将发挥越来越重大的作用。

 

 

 

融合计算的模式

融合计算的3个成功案例关于融合计算到底有哪些模式,张院士举了近年来最有影响力的3个案例。第一个是人工智能领域的AlphaGoAlpha Zero,它们分别使用记录数据和模拟数据来进行计算取得了良好的效果。其带来两个重要的问题:一个是临界点问题,即算法达到什么样的状态,模拟数据才真正有用;另一个是极限问题,即算法通过不断迭代,最终的极限在哪里。
 

 

第二个是解决蛋白质折叠问题的AlphaFold2也是采用基于实验数据的计算方式,解决了蛋白质结构预测的问题。
 


前两个例子是纯粹基于数据的计算模型,而第三个例子是典型的融合计算:深度势能分子动力学它利用第一性原理得到模拟数据、利用机器学习来学习分子的相互作用力,使其模型精度和效率得到极大的提升。

 


融合计算在天气预报中的使用

张院士以“天气预报”为例进一步向大家阐释了融合计算的含义。天气预报是融合计算的典型场景,“资料同化”算法就是一个融合计算的成功案例。天气预报的数据来源广泛,数据时空分布很不均匀,而资料同化算法就能够将这些不同精度、不同频次、不同类型的数据转换成一个好的数值模式初值。
 


如果想对观测数据与模式数据做更深一步的融合,就需要了解两种数据各自的特点。观测数据是真实的数据,同时包含高频和低频信息;但是观测数据很难包含全部信息,仅利用观测数据预测的时效性较短。模式数据则恰恰相反,它更多是大尺度数据,能够有效进行长期预测,但是在对一些极端天气预测、高精度预测上难以满足要求。
 


张院士团队开发的天气预报机器学习MOML算法,就通过将大尺度、低频、可预测的模式数据和小尺度、高/低频,不可预测的观测数据融合进一套算法,成功做到了对于气温、湿度、风速等的精细预报。算法本身应用在北京气象台的天气预测,并发展成为冬奥会的一个天气预测产品,取得了比较好的效果。
 


融合计算的广阔前景

融合计算未来的发展前景是广阔的,以国家基金委发布的重大研究计划为例,其重要目标就是发展数据驱动和知识驱动融合的人工智能。机理与数据的深度融合无疑是下一代人工智能的重点,存在巨大的挑战与机遇。
 

 

AI for Social Science

张院士接下来围绕 AI for Social Science 的概念,强调融合计算的不断发展势必会对人文社科(Social Science),尤其是社会科学产生深远的影响。这种影响主要集中在三个方面,即人文社科的科研范式,新的算法伦理和文理科结合的科技智库。

 


 


人文社科的科研范式

人文社科的科研范式分成4个方面。首先是统计软件的使用,并作为工具解决社会科学中的问题。第二就是结构模型的建立,比如经济学中尺度介于微观经济学和宏观经济学之间的结构经济学就非常具有研究价值。第三是基于数据的计算方法,比如颠覆图书情报学的搜索算法和颠覆新闻传播学的推荐算法,都是基于数据的经典算法。最后,也是未来可能影响最大的是机理与数据的融合计算。比如在人类语言的进化研究中,既要考虑一些机理方面的内容,如口腔的构造、发声的原理等,也要使用大量的数据,如语音的数据、考古的数据等。这类问题只有基于机理与数据的融合计算,才能彻底把问题研究清楚。

 

 

 


算法(人工智能)的伦理

算法的伦理问题既要求算法做到“以人为本”,又在“以人为本”的同时要兼顾算法的能力。这是近年来科学家遇到的一个新问题,也是不得不考虑和解决的问题。
 


 

科技智库

数字化具有极强的穿透性,随着数字化的不断发展,数据在各行各业发挥越来越强大的作用。在这个背景下,由理工科和人文社科相结合的科技智库将能够更好的激发数据要素的活力,对政策建议发挥更大作用。以国际数字生态研究为例,由于研究的复杂性和重要性,张院士的团队会在研究过程中使用大量的数据,并借助一些融合计算的手段,才能切实提出正确且有意义的政策建议。
 

 

应用数学新的增长点

融合计算为应用数学带来了哪些全新的增长点呢?张老师从理论、学科交叉和落地三个方面进行了分析。
 


首先在理论方面,想要去理解机器学习,一个实际的数学挑战就是高维空间中的数值分析。同时融合计算存在多个不同的模式,这也将从理论层面给应用数学带来一些新的领域。




其次融合计算将极大扩充应用数学的应用场景。例如人文社科领域将出现大量由理工科与人文社科共同建设的实验室,一些过去无法解决的复杂系统,如地球系统很可能将由融合计算提供解决方案等。



最后也是最大的增长点是在落地方面,融合计算将极大扩充应用数学的落地方式。将由原先单一的基础软件,变成包括基础软件、工业软件、数据产品在内的多种形式,并将真正推动产业的发展。
 

 

应用数学落地的体制机制

最后张院士从体制机制的角度讨论了应用数学在我国的落地问题。


应用数学本质上是由国家需求驱动的,其驱动力主要来自于国防建设和企业创新两方面。成果想要落地就需要提供好的产品,但是企业和高校由于驱动方式、工作模式等存在较大差异,两者之间的连接就是一个巨大的挑战。要解决这个问题,就需要建立完善的体制机制。
 


基于这个问题张院士在北大做了“学术创新链”的探索,提出从基础研究到“四个面向”的高效连接和有机闭环。由院系、平台、新型研发机构和企业发挥各自特点和优势承担不同阶段的任务,既能保证科学研究能最终转换成有价值应用,又能让企业遇到的实际问题及时有效反馈给科研机构进行解决

 



体制机制在应用数学落地中的重要性是不言而喻的。它主要解决四个问题:需求,团队,评价和经费。需求即“清晰提出需要解决的问题及其应用的场景”,是落地的重要环节。团队即开展有组织科研的必要人才构成,包括科学家、技术人员、工程师、项目经理、行政、营销等,只有保证这些人才有组织地运作起来,才能保证科研的效果。评价即听取不同专业领域人的建议,通过满足不同评价标准下的要求解决落地中的各类潜在问题。经费关系到科研机构的可持续发展,由中央政府支持基础研究,地方政府支持产业相关的创新,社会资本支持针对产品的投资;社会捐赠则与情怀挂钩,不能保障;要获取充足的经费,需要每个机构对自己有清晰的定位,这样才能正确判断支持机会的来源。

文章来源于深度势能 ,作者AISI Colloquium