7月3日,北京大学大数据分析与应用技术国家工程实验室(以下简称“实验室”)产品工程部副部长、算法专家黄晶,算法工程师李楠在《情报杂志》上发表研究成果《国际组织人才画像库:从大数据视角定量研究国际组织人才特征》。李楠为第一作者,黄晶为通讯作者。
该研究依托国际组织数据库实验室开展,由中国科学院院士,武汉大学校长、党委副书记,北京大学博雅讲席教授,实验室主任张平文院士领衔,北京大学国际关系学院副院长、北京大学国际组织研究中心主任张海滨教授主持具体研究工作。该项目属于北京大学人文社科数智化研究基地的核心项目之一,于2022年正式启动,旨在基于大数据分析与应用相关技术,建成具有中国特色、世界一流的国际组织数据库。目前,该项目已申请核心技术专利,并上线网站。长期以来,中国籍人才在国际组织中面临着诸多问题:国际组织人才数量较少,尤其是高层次、高层级岗位的人才比例较低;国际组织人才代表性不足,且分布不均匀;国际组织人才储备不足。这些问题使得中国在国际组织中的话语权受限,并在一定程度上阻碍了中国在重大全球治理议题和国际事务中发挥引领作用。在教育强国战略引导下,如何培养国际组织人才不仅成为中国在积极引领全球治理体系改革中提升国际话语权和软实力的迫切课题,也成为中国不断完善外交总体布局、全面构筑全球伙伴关系网络、进一步扩大“朋友圈”的战略问题。
本文基于自然语言处理等技术,从海量简历文本中自动获取国际组织人才的基本资料、教育背景、工作经历等信息,通过数据加工和处理,以多维度、结构化标签来刻画国际组织人才,构建了国际上首个大型国际组织人才画像库。基于该画像库,本文通过统计分析、聚类分析、社交网络分析等方法挖掘国际组织人才的多维特征,包括基本特征、教育背景、职业体系和关系图谱等。
国际组织人才画像库总体架构图

国际组织人才画像库以多维度、结构化标签来刻画国际组织人才,是一个以国际组织人才为对象的专题数据库,能够为学者们重新认知国际组织人才提供新的工具。构建国际组织人才画像库具有极其重要的现实意义。首先,基于该画像库可以帮助学者更好地从大数据角度开展国际组织人才量化研究,避免了其获取并处理海量多源数据的困难。其次,基于该画像库数据不仅能够支持跨国际组织的横向人才研究,也能够支持国际组织各层次人才的纵向研究。最后,通过挖掘国际组织人才特征,可以为政府有关部门在涉国际组织人才推送等问题上的重大决策提供数据支持,也可以为高校在国际组织人才培养、学科建设方面提供数据支撑,从而有效应对国际组织“中国人才荒”问题。

黄晶
北京大学大数据分析与应用技术国家工程实验室产品工程部副部长、算法专家,北京大学重庆大数据研究院智能创新与赋能中心副主任。在人工智能应用领域具有十多年的实践经验,在新零售、供应链、金融和互联网等行业成功落地实施多个人工智能解决方案和案例。曾在相关领域申请多项专利,著有“大数据建模方法”等专著。

李楠
北京大学大数据分析与应用技术国家工程实验室算法工程师,管理学硕士。研究方向为自然语言处理、文本挖掘,主要从事自然语言处理、大语言模型在海量文本处理及挖掘方面的技术研发和应用研究。曾在《图书情报工作》、《情报杂志》核心期刊发表文章。
转载本网文章请注明出处