工作重点
奇虎360自研跨模态图文模型,并积累中文基准图文数据集ZERO。视觉语言预训练框架R2D2用于大规模跨模态学习,基于所提出的Zero-Corpus数据集进行预训练,并在多个下游任务上进行测试,R2D2取得了多项超越SOTA的结果,实现了中文数据集上图文跨模态算法效果的突破,可为多种下游任务如图文搜索、多模态推荐、图像生成等任务提供新的方法及框架。
版权所有©北京大学大数据分析与应用技术国家工程实验室 京ICP备05065075号-1 京公网安备 110402430047 号