周沛劼,2023年8月入职北京大学国际机器学习研究中心、任助理教授,大数据分析与应用技术国家工程实验室联聘助理教授。他分别于2014年和2019年在北京大学数学科学学院获得计算数学学士和博士学位,2020-2023年任美国加州大学尔湾分校数学系访问助理教授。研究领域为计算系统生物学,当前主要关注组学数据驱动的复杂生物系统建模与计算方法。
Q:请简要介绍一下您当前的研究方向和研究工作。
A:我的研究方向主要是AI for life science,具体的切入角度是计算系统生物学,希望运用机器学习方法,把海量的生物组学大数据,如单细胞转录组、空间组学数据等,与动力学模型相结合,来系统地分析和理解生、老、病、死等生命过程中,分子、细胞、组织器官乃至生物体等不同尺度的动态过程,以及各个组成部分的相互调控关系,从而为实现药物筛选、个性化诊疗等目标提供参考。
目前做的研究,主要可以归纳为两个方向:
第一,如何推断“静态”的组学数据背后的动力学过程?这需要我们合理运用机器学习方法,来有效地提取数据背后的隐藏特征,嵌入到合理的状态空间,并克服高维模型计算中的“维数灾难”。
第二,如何把动力学的思想和技术运用到数据分析算法的设计和分析当中,从而提高算法的稳健性和可解释性?例如,统计物理当中“熵”的概念可以刻画细胞的分化潜能性;动力系统中“吸引子”和“稳定性”概念可以用于定量刻画生命的“状态”;而控制论的思想可以指导疾病状态到正常状态的精准导航,等等。这需要我们针对生物问题的内在结构,通过类比、迁移的方式,设计新的机器学习方法。当然,这两个方向也是彼此交织、密不可分的。
Q:您在求学工作期间有什么印象深刻的经历吗?这些经历对您从事机器学习研究及后期的选择产生了哪些影响?
A:在我求学和工作期间,众多师长都给我很多指教和启示,让我慢慢发觉做研究时“选择”和“努力”都很重要。一方面要“抬头看路”,较为广泛地涉猎不同方向,特别要对研究前沿的变化发展有充分的敏锐度;另一方面也要“低头拉车”,看清大趋势后,全力做自己认定的最重要的问题,有所为有所不为。
我在北大数院读本科的时候,正值鄂维南院士创建拔尖人才计划,特别强调“应用数学作为一个整体”的概念,为我们在计算数学和概率统计方面都打牢基础,我也是从鄂老师那里第一次了解到数据科学和机器学习的重要性。那时候张平文院士也为低年级本科生开设专门课程,介绍科研的全过程,并鼓励我们尽早开始体验。后来和张磊老师、葛颢老师、席瑞斌老师和邓明华老师的学习交流,我发现了数学与生命科学交叉的魅力和前景。这是一个不断开阔视野的过程。
博士期间,我在数学学院李铁军老师和定量生物中心李方廷老师的指导下,接触到具体的生物学问题和真实的数据,尝试利用数学建模和随机过程等工具分析解决,正式进入系统生物学这一研究方向。后来我在李老师的推荐下,到UC Irvine聂青老师那里做研究。此时的计算系统生物学,正在发生从模型驱动范式到数据驱动范式的转变,聂老师正是这里面的先驱者。在聂老师和李老师的引导下,我们以“动力学”为抓手进入组学数据分析领域,并逐渐意识到机器学习在其中不可替代的作用。
回头来看,这些对我产生重要影响的师长们 ,比如鄂院士、张院士、李老师和聂老师,都是根据学科的发展、时代的需求和兴趣的变化,不断进行着研究方向的转变调整,在找到合适的切入点后,能迅速进入到新领域的研究前沿,做出有特色的工作。这一点让我深受触动,也为我树立了榜样。
Q:对您而言,机器学习最独特的魅力是什么?
A:如果说纯数学的终极追求是“简洁”与“美”,那么在我看来,机器学习的独特魅力在于它的复杂性和有效性。例如深度学习模型,通过各种巧妙设计的结构,提供了高维空间函数的有效逼近,可以抽取复杂的特征表示,这对于分析以组学为代表的生物大数据可以说是一大利器,能够揭示生命过程中人体、组织器官、细胞和基因等多个尺度的隐藏规律。当然,算法的“黑箱”特性也让机器学习在生命科学和临床医学的应用中面临着独特的挑战,需要我们借鉴生物学的先验知识和数理模型思想,设计更加可靠、具有可解释性算法。
Q:您对未来在中心的研究和教学工作有哪些规划或期待?
A:在研究方面,我近期关心的是空间组学和蛋白组学的数据分析,希望把机器学习和动力学模型结合起来,挖掘数据背后的时间和空间信息。借助中心的平台优势,我也希望和科学智能研究院等机构合作,在组学大模型的开发方面做一些探索。此外,我想充分利用北大的多学科优势,发挥机器学习的效用,解决一些真实、重要的跨学科问题,并在这一过程中为交叉学科的人才培养做一点贡献。这方面我们已经初步开展了一些工作,比如和北医三院的老师合作,在辅助生殖中利用机器学习算法对植入前胚胎进行基因筛查,以及和环科的老师合作,建立碳排放路径的生成模型等,期待今后有更多这样的机会,也欢迎更多的同学加入我们的团队,一起探索AI for Science的无限可能。
面向国家重大需求开展科学研究也是我们作为北大教师的使命;我会积极参加有组织科研项目,为大科学计划等研究做出贡献,鄂院士和中心在这方面给我了非常大的鼓励和支持。
在教学方面,我计划开设1-2门数据驱动的计算系统生物学研究生课程,和同学们分享我做交叉学科研究的经历,培养更多的AI for Science人才。
Q:对青年学生做好科研您有哪些建议?
A:我在北大的工作刚刚起步,确实没有什么资格给出建议,也希望同学们能够比较自由地探索自己做研究的节奏和风格。我觉得最重要的还是做研究的心态,因为科研是个长期的事情。特别是机器学习领域,发展可以说是日新月异,很容易让人随波逐流,在“赶时髦”和“追热点”中陷入内卷和焦虑。我的博士导师李铁军老师曾在办公室墙上贴了一段话,让我印象特别深刻,也想分享给大家:“人生就是一次没有终点的长跑,每个人尽他最大的力量和意志到达最远,有人擅长短跑,但是不一定能坚持到最后;有人会暂时领先,但是并不意味着后来者就应放弃竞争,在这场无休止的长跑中,每个人最大的竞争对手乃是他自身的消极,气馁和惰性,因为惟有战胜自身才是最大的成功!”
正如李老师所说,真正做好科研、享受科研,最终要靠内在驱动,并没有什么所谓的捷径可言,也不必和其他人比较。所以不妨先打开眼界,多去尝试和了解不同的研究方向,然后根据兴趣和特长选择属于自己的道路,建立个人独特的“学术标签”,方能久久为功。在这方面,中心的rotation制度提供了一个很好的平台,大家可以充分地利用好机会进行探索。
Q:生活中的你有什么兴趣爱好吗?通常通过什么方式来为自己减压?
A:作为“I人”,我平时喜欢看看历史或科幻方面的书籍或者电影。有时候读一些宏大的故事,会有那么一瞬间,感觉眼前的烦恼忧虑都不是事儿~
文章来源:北京大学国际机器学习研究中心
转载本网文章请注明出处