近日,北京大学大数据分析与应用技术国家工程实验室(以下简称“实验室”)研究团队的成果论文《专家知识数据化与文科智能》在《中国社会科学》2025年第7期发表。论文由北京大学博雅讲席教授、北京大学中国社会与发展研究中心主任、北京大学数字治理研究中心主任、社会学系教授、实验室核心成员邱泽奇教授和武汉大学校长、党委副书记,北京大学博雅讲席教授,实验室主任张平文院士合作共同完成,其他合作者包括对外经贸大学法学院助理教授李昊林和北京大学社会学系助理教授乔天宇。
《中国社会科学》创刊于1980年,中国社会科学院主管主办、中国社会科学杂志社编辑出版的综合性哲学社会科学杂志,主要发表哲学社会科学前沿研究成果,涵括马克思主义理论、哲学、经济学、政治学、法学、社会学、历史学、文学、语言学等学科以及跨学科研究的论文等,被学术界誉为中国最高水平的综合类人文社会科学期刊。
摘 要
与科学智能相对的文科智能目前已引起国内外学者的广泛关注和讨论,这深刻反映了数智技术所触发的人类知识生产范式的变革。研究团队通过追溯科学智能及文科智能的发展历程并结合团队研究实际,指出为文科智能提供高质量的数据是文科智能向下一阶段发展的关键,而提供高质量数据的一条重要路径便是将人文社会学科中已经积累的专家知识数据化。
研究团队以在文科知识中具有典型性的法学知识为例展开分析,发现法学知识生产中已经出现将法学与数智技术相结合的实践,但尚未能在“专家知识数据化”这一核心节点上实现突破。对此,研究团队开创性地提出“三步走”专家知识数据化路径,即框定专家知识的范围、重构专家知识的结构、设计转化的技术路径。

图1 专家知识数据化的实现路径
在框定专家知识的范围环节,研究团队强调要在这一过程中筛选出既有技术还无法自动实现数据化的专家知识,并充分外显这部分专家知识。在重构专家知识的结构环节,研究团队强调要在充分考虑技术实现可能性的基础上,构建尽可能反映专家知识原貌、减少专家知识损耗的形式化结构。在设计转化的技术路径环节,研究团队依据“专家知识含量”和“专家知识正则表达难易度”两个尺度,设计出了专家知识数据化的四类技术方法:专家介入的正则处理、简单正则处理、专家知识个别化导入、建立阻扰机制。

图2 设计转化技术方法的依据及技术方法类型
在完成上述理论分析与建构后,研究团队以数据化法律规范文本及其上附着的专家知识为例,阐述了专家知识数据化“三步走”路径的一种具体实践方案。在框定专家知识的范围环节,研究团队梳理并外显化了法律规范文本上所附着的阐释学知识。在重构专家知识的结构环节,研究团队参考阐释学知识特征及其与数据科学知识图谱的契合特性,将阐释学知识重构为依据“场景—主体—行动”的结构逻辑而打造的专家知识,并运用“情景条件—法律后果”“主体—行为”“规则—规则”这三重关系,将此类专家知识进行形式化呈现。在设计转化的技术路径环节,研究团队在选取知识图谱这一数据化载体的基础上,将专家知识数据化转化的四类技术方法具体化为专家词典法、固定句式匹配、提示与专家介入、剩余处理,由此设计出了借助法律规范文本标注实现法学专家知识数据化的现实方案。

图3法律规范文本标注中实现专家知识转化的四种方法
在成果论文中,研究团队还进一步讨论了专家知识数据化“三步走”路径在其他人文社会科学专家知识数据化过程中的可推广性,以及在文科智能发展过程中人文社会科学学者所应承担的责任。研究团队希望借助上述研究能够进一步推动我国文科智能及人文社会科学研究的发展。
作者简介

邱泽奇
北京大学中国社会与发展研究中心主任,社会学系教授、博士生导师,北京大学数字治理研究中心主任,教育部“长江学者奖励计划”特聘教授,北京大学博雅讲席教授,大数据分析与应用技术国家工程实验室核心成员。曾先后担任北京大学中国社会科学调查中心创办主任(2006-2011)、重庆大学公共管理学院首任院长(2012-2016)。主要研究领域为数字社会发展与治理、技术应用与社会变迁、组织社会学、社会调查与研究方法等。主持和参与国家社会科学基金、国家自然科学基金、教育部人文社会科学重点研究基地课题等国家级项目十余项,出版专著译著三十余部,在国内外期刊发表学术论文百余篇。

张平文
中国科学院院士、发展中国家科学院院士。历任北京大学校长助理,副校长,党委常委、副校长等职务,现任武汉大学校长、党委副书记;北京大学博雅讲席教授,大数据分析与应用技术国家工程实验室主任;中国工业与应用数学学会理事长;国家自然科学基金委“科学计算与机器学习”基础科学中心项目负责人。主要从事复杂流体的数学理论和计算方法,大数据分析与应用等方面研究,发表论文百余篇。曾获国家自然科学奖二等奖、教育部高等学校自然科学奖一等奖、何梁何利基金科学与技术进步奖、冯康科学计算奖等奖项。2011年受邀在第七届国际工业与应用数学大会上作一小时报告,2014年受邀在美国工业与应用数学年会上作大会报告,2018年受邀在国际数学家大会作45分钟邀请报告。

李昊林
对外经济贸易大学法学院助理教授,北京大学法学博士,美国乔治城大学法律中心访问学者。曾任《北大法律评论》第23卷主编。从事宪法学与行政法学基础理论研究及法学交叉学科研究。以独作作者和第一作者身份,在核心期刊发表多篇论文。

乔天宇
社会学博士,北京大学社会学系助理教授、研究员。研究方向为数字社会发展与治理、组织社会学、计算社会学。曾在《中国社会科学》《社会学研究》等国内外著名期刊发表过论文十余篇,主持并参与多项国家社科基金、国家自然科学基金、科技部重大项目课题,内容涉及数字社会发展、数字治理、新型数字平台组织等。
文章来源:中国社会科学2025年第7期
转载本网文章请注明出处