数据处理及统计分析中心

您目前的位置: 首页> 实验室架构> 共性技术平台> 数据处理及统计分析中心

数据处理及统计分析中心

  数据处理与统计分析中心由北京大学周晓华教授团队负责,承担大数据预处理与质量控制技术的研发应用,办公地址位于北京大学北京国际数学研究中心。

 

         

 

  针对大数据预处理与质量控制的问题,中心将研究对多源异构数据进行合理且有效的整合的方法、数据中的可信度建模、数据的质量检测和评估方法等。大数据环境下的数据来源多样、结构各不相同。同时,由于数据来源的多样性也决定了不同的数据源所提供的数据的可信度是不同的。数据的错误可能来自于数据生成和融合的各个阶段,包括实体和关系抽取、融合等。因此如何对数据进行合理且有效的预处理与质量控制是非常重要的问题。

  该中心的主要任务包括:

  1、发展大数据预处理与质量控制技术,包括但不限于:数据中的可信度建模,数据的质量检测和评估,大数据抽样等。

  2、研究大数据分析支撑的统计学理论与方法,包括大数据特征选择、大数据统计预测、分类大数据的统计预测、大数据精准决策以及大数据因果推断、大数据关联分析。

  3、发表一批高水平学术论文和研究专著。

  4、进一步加强与相关实验室、中心的合作。大数据的预处理为后续的分析打下了良好的基础。