学科建设和人才培养之我见
作者:张志华
人工智能和学科交叉是当今最为时髦的两个词汇。这对学科建设和人才培养提出了新要求、带来了新机遇,但是我们要抱有严谨和清醒的态度。我就人工智能或机器学习对统计学和应用数学的发展带来影响做了深入调研和认真思考。
首先,我简要向大家分享一下我所了解的几所美国头部高校的状况。斯坦福统计系一直在引领统计学的发展,其特点是以统计学为中心,充分吸纳应用数学和计算机科学的力量,带动了其应用数学的发展。David Donoho, Emmanuel Candès,Andrea Montanari等既是统计学家,也是应用数学学家或理论计算机学家。统计学家Jerome Friedman,Robert Tibshirani,Trevor Hastie等建立并引领了统计学习领域,而年轻一代又在理论计算机和统计学的相结合领域开创数据科学新局面。伯克利统计系在本世纪初随着老一代统计学家相继老去,其影响力有所下降,但是借助机器学习的崛起,引进Michael Jordan,Peter Bartlett等而迅速复兴。特别是Simon研究所这个平台使得统计学、应用数学和理论计算机充分融为一体。伯克利最近又刚成立了计算、数据科学和社会学院(College of Computing, Data Science, and Society),整合相关学科资源和力量。耶鲁大学率先更名统计系为统计与数据科学系,聘任著名理论计算机科学家Daniel Spielman为系主任,并相继引进了几位才华横溢的年轻学者,因而其发展势头迅猛,在理论方向特色鲜明、居于领先。MIT的应用数学在美国排名第一,这是与好几位院友交流中听说的。MIT目前还没有建统计系,但前年成立了一个数据科学研究中心,承担统计学科的建设,同时连接数学和理论计算机科学。我感觉MIT应用数学的主要方向是组合、概率、理论计算机和运筹,从这个角度来看,其排名第一也是实至名归。纽约大学库朗所的应用数学近几年在随机分析、应用概率、理论机器学习等新兴方向引进了一批学者,研究方向有了一个较大力度的迭代更新。
归纳这几所大学的学科建设状况,特点有:
1)统计学、应用数学、理论计算机深度融合、协同发展。侧重算法设计和基础理论,而且使用的数学理论和工具越来越先进,和基础数学边界也越来越模糊。不搞具体的应用落地,当然计算机科学系从事某些应用研究,有些学校建有专门的生物统计系从事某些应用研究。
2)学科机构之间既有独立性,又彼此协作,不存在谁领导谁,以学科发展的内在需要和研究工作的影响力为准绳,人才引进体现多用性、前瞻性、先进性。
3)研究方向积极应对机器学习和人工智能带来的机遇和挑战。应用是问题的源泉,数学是研究的根本。
4)越是头部学校、头部学科越重视课程建设和教材编写。洞察学科的前沿,知晓社会的需求,并由此调整培养体系和课程内容,推陈出新。以此保持学科优势地位和人才培养先进性。
下面我谈谈对学科建设和人才培养的一些具体看法或感想。
1.本科生专业宜宽不宜细。目前阶段开设人工智能本科专业条件不成熟,但可以依托统计学或应用数学专业开展人工智能方向的博士生项目。人工智能其实就是计算机科学应用,其数学基础重点从离散、组合偏移到概率、统计。本科阶段在数学、统计学、计算机科学、物理学中某一个专业有系统的训练对人工智能顶级人才的博士生培养是有必要。为了适应人工智能的发展需要,应该迭代更新或开设一些数学基础课程,比如,统计学基础、概率计算等。101计划发起人John Hopcroft教授曾经和我交流过开设一门面向人工智能的应用数学基础的课程设想。此外,在大三或大四可以开设一些现代专业课程,比如现代机器学习、深度学习实践或高级些的CUDA并行编程等。课程一定要名副其实,不能徒有其名。这样一部分学生毕业可以去从事人工智能的开发或继续读博士从事学术研究。
2. 目前阶段过度强调交叉研究不一定合适。交叉固然可以有利于发表论文,甚至在顶级杂志,也可能有利于争取资源或项目。但是如果对所牵涉领域学科没有深刻的理解,是不太可能解决本质问题的。交叉是自然而然、润物细无声的过程。现在社会普遍将我国人工智能的发展现状归结于对数学基础的重视或数学家参与程度不够,所以许多数学专业学者纷纷下场。但我认为一定要了解人工智能和计算机领域真正关心的问题,只有真正理解其核心所在,才能有的放矢,才能对人工智能乃至本学科起到实质性的促进作用。
如果我们能从数学和统计学视角正确看待人工智能和机器学习,有所为有所不为,不但能促进我们本学科发展,而且对我们高考和博士招生都会有巨大的帮助。未来3到5年是我们发展的关键机遇期,我们现在有一部分非常优秀的学生留下读博士,但是如果我们不能把他们带到他们期望的高度,解决好他们的出路,今后大家还是会优先选择出国。博士生培养的成色才真正体现头部高校的价值和担当,是衡量世界顶级一流大学的最重要标准。
附注:本文根据北京大学数学科学学院学科建设研讨会发言整理而成。
作者简介
张志华
北京大学数学科学学院统计学教授,大数据分析与应用技术国家工程实验室机器学习中心成员。主要从事机器学习、应用统计和数值计算的交叉学科的研究。研究范围涉及理论、模型、算法和应用等多个层面,研究方向主要包括机器学习与模式识别、统计建模与计算、数值代数与优化、分布式计算构架等。
转载本网文章请注明出处