“北大问学”平台登录页面
自2023年5月起,北京大学北京国际数学研究中心长聘教授、北京大学国际机器学习研究中心副主任、北京大学国家生物医学成像科学中心研究员、大数据分析与应用技术国家工程实验室机器学习中心主任、北京大学长沙计算与数字经济研究院副院长董彬教授带领团队探索“AI+教育”的研究和应用落地,在2023年9月构建了国内首个面向高等教育的基于生成式语言模型的AI助教Brainiac Buddy,并在《图像处理中的数学方法》等课程上应用。2024年初开始,团队与北京大学教师教学发展中心合作,进一步开发了功能更为完善的人工智能辅助教学平台“北大问学”,于今年10月正式上线北京大学校内门户,向全校师生开放使用。
深度学习的冲击:科研方向的调整
董彬团队在PDE-Net (2018) 中探索机理与数据融合的方法论
董彬的研究历程从小波、偏微分方程(PDE)等传统数学方法的深入探索开始,这些工具曾为他的计算成像和医学影像分析研究奠定了重要理论和算法基础。2016年,他敏锐地察觉到深度学习技术在这些问题上可能带来的颠覆性变革,于是转向深度学习研究。在原有的理论研究思想指引下,他积极探索深层神经网络与ODE(常微分方程)、PDE之间的联系(Y. Lu et al. ICML 2018; Z. Long et al. ICML 2018),逐步建立起机理与数据融合的全新方法论。通过这一方法论,董彬设计出了许多兼具性能与解释性的新模型和算法,特别是在图像重建和医疗数据分析领域取得了突破性成果。这些工作不仅丰富了深度学习的数学理解,也为复杂高维映射问题提供了创新的解决途径。
AI技术革命带来的反思:科研方向的再定位
2022年,生成式AI技术取得突破性进展,随后在2023年3月发布的GPT-4模型让董彬深感AI对未来科研和教育的巨大影响。董彬认为,AI是提升教育效率和公平性的重要手段,将AI应用于教育场景可以打破传统教育资源分配的局限,使更多学生获得高效、个性化的学习体验。同时,AI还可能在数学教育中发挥独特作用,通过AI的逻辑推理和计算能力,让数学教育中的抽象概念变得更为易懂,使学生能够在AI辅助下更深入地理解和应用数学知识。
在此背景下,董彬带领团队集中力量探索AI基础模型的理论与应用。在理论与算法层面,探索AI基础模型推理与计算的能力边界(代表工作包括辅助数学形式化的工具LeanSearch和偏微分方程基础模型PDEformer);而在应用层面,通过智能体(agent)的思路,构建两个垂直应用领域的AI辅助工具:教育和医疗。
教育智能体的构建:技术创新与核心问题
在“AI for Edu”教育智能体的项目中,核心问题是提升模型的推理能力与提示词工程的优化。AI模型的推理能力在数学场景下至关重要,尤其是如何让AI智能体在数学场景中实现高效精确推理,是项目的核心技术难点。由董彬牵头,会同肖梁、文再文和刘若川等北大教师联合发起的“AI for Math”项目,正在努力通过自然语言推理和形式化推理同步并举,尝试提高AI模型的推理能力。
从最优控制角度数学建模提示词工程
提示词工程是通过对大语言模型提问的系统设计,从而提高大语言模型回答规范性与有效性的重要技术,也是提高AI教育智能体响应精准度的技术基础。董彬与西湖大学周珍楠老师团队合作研究了提示词工程的数学理论框架,基于最优控制理论对提示词工程进行了深度分析。他们提出了一个多回合互动的最优控制框架,将提示词设计视作一个动态最优控制问题,从而使AI在不同情境中能够逐步优化输出质量。这一研究(Yifan Luo, Yiming Tang, Chengfeng Shen, Zhennan Zhou, Bin Dong, Prompt engineering through the lens of optimal control, Journal of Machine Learning, 2, 241-258, 2023.)首次为提示词工程的研究提供了数学理论框架,并进一步强调在与AI互动过程中“多轮对话”的重要性。
理论与实践结合:“北大问学”平台的诞生
在提示词工程和智能体框架的指导下,董彬团队联合北京大学教师教学发展中心共同开发了“北大问学”平台。该平台以Brainiac Buddy(BB)系统为核心,结合检索增强生成(RAG)技术,有针对性地实现了对教学材料的AI赋能。北大问学平台的核心功能包括AI知识库、伴学助教、AI教学工具箱、Math Copilot数学工具等。在实际应用中,平台不仅能辅助学生阅读文献、提供实时的答疑支持,还能帮教师生成定制练习题和大纲,有效提高了师生的教学效率。
Math Copilot交互页面
问学平台已于2024年10月在北大校内门户正式上线。初步测试与反馈结果显示,问学平台的数学与编程辅助工具需求量较大,在处理复杂的数学问题方面,Math Copilot工具的解答准确率相较于其他同类解题产品有较大优势。
产学研结合:走向实际应用
未来,董彬团队计划将问学平台扩展到更多学科以及职业教育领域,并通过进一步优化AI问答系统、嵌入更多AI辅助教学工具,使平台能为更复杂的教学环境提供辅助功能。通过问学平台的不断完善和推广,董彬也期待北大问学平台能引导学生形成使用AI工具解决问题的能力和思维,为智能化社会培养具有复合技能的高端人才。
在医疗领域,董彬团队也在大语言模型应用消化道肿瘤诊疗领域取得了突破性进展。首先,团队利用大语言模型GPT-4,通过新颖的提示词策略和临床量化评估指标,模拟高年资专科医生的诊疗逻辑,为消化道肿瘤患者制定个性化诊疗方案,逼近了三甲医院高年资医生的水平(J. Yuan et al., The Innovation Medicine,1(2),100019,2023)。此外,团队还系统回顾了医疗领域大型语言模型的最新进展,并提出AI智能体在医疗领域的应用潜力(M. Yuan et al., Medicine Plus, 1(2), 100030, 2024)。这些成果促进了跨学科、跨领域的合作,摸索出了一条AI技术如何有效地在垂直领域应用落地的技术路径。未来董彬团队也将继续探索产学研一体的实践应用道路。
文章来源:北京国际数学研究中心BICMR
转载本网文章请注明出处