当前位置: 首页 > 科学研究 > 实验室核心科研团队 > 科研成果 > 正文

科学研究

科研成果

SCIENTIFIC RESEARCH ACHIEVEMENTS

基于参数服务器的机器学习系统Angel

  • 分享

字段1 字段2
字段3 字段4
职称 负责人 崔斌

随着数据规模爆发式增长,数据特征的维度往往能够达到十亿甚至百亿的规模。而在训练高维机器学习模型的过程中,各个计算节点需要互相通信以完成分布式的训练。这个过程往往意味着巨大的存储和通信开销,远远超过了单个机器的能力。

通过分布式训练系统架构,机器学习算法并行方案设计,梯度通信以及一致性同步协议优化,探索更高效的分布式拓展方案。

广泛应用于工业界互联网公司的广告精准推荐、用户兴趣挖掘等场景,在开源网站GitHub上获得来自国内外开发者的上千颗Star;相关工作得到国家重点研发计划支持。

通过结合参数服务器和机器学习算法二者的特点,开发了很多高效、易用的机器学习算法 ,并与大数据处理引擎Spark、深度学习系统PyTorch构建良好的生态,广泛适用于不同场景的机器学习应用。

版权所有©北京大学大数据分析与应用技术国家工程实验室 京ICP备05065075号-1 京公网安备 110402430047 号