在知识获取方面研发了大规模开放域中文结构化知识库。PKUBase通过一系列自然语言处理手段及机器学习方法,从半结构化和非结构化可信文本,例如维基百科、百度百科、Freebase等资源中构建的海量中文结构化知识资源,其中包含标准中文类别体系框架、近千万级中文实体、超过6000万中文知识条目。PKUBase是以RDF(资源描述框架)三元组标准数据形式进行组织和管理的,支持常见的标准图数据管理引擎。用户可以通过编写满足W3C的SPARQL 1.0标准的结构化查询语句对PKUBase进行知识检索。
版权所有©北京大学大数据分析与应用技术国家工程实验室 京ICP备05065075号-1 京公网安备 110402430047 号