• 中国计算机学会会刊
  • 中国科技核心期刊
  • 中文核心期刊

计算机工程与科学

• 计算机网络与信息安全 • 上一篇    下一篇

基于迁移学习的多源数据隐私保护方法研究

付玉香1,秦永彬1,2,申国伟1,2   

  1. (1.贵州大学计算机科学与技术学院,贵州 贵阳 550025;
    2.贵州大学贵州省公共大数据重点实验室,贵州 贵阳 550025)
  • 收稿日期:2018-11-13 修回日期:2019-01-10 出版日期:2019-04-25 发布日期:2019-04-25
  • 基金资助:

    国家自然科学基金重大研究计划(91746116);贵州省重大应用基础研究项目(黔科合JZ字[2014]2001);贵州省科技重大专项计划(黔科合重大专项字[2017]3002)

Multi-source data privacy protection
 based on transfer learning

FU Yuxiang1,QIN Yongbin1,2,SHEN Guowei1,2   

  1. (1.College of Computer Science and Technology,Guizhou University,Guiyang 550025;
    2.Guizhou Provincial Key Laboratory of Public Big Data,Guizhou University,Guiyang 550025,China)

     
  • Received:2018-11-13 Revised:2019-01-10 Online:2019-04-25 Published:2019-04-25

摘要:

隐私保护的多源数据分析是大数据分析的研究热点,在多方隐私数据中学习分类器具有重要应用。提出两阶段的隐私保护分析器模型,首先在本地使用具有隐私保护性的PATET模型对隐私数据训练分类器;然后集合多方分类器,使用迁移学习将集合知识迁移到全局分类器,建立一个准确的、具有差分隐私的全局分类器。该全局分类器无需访问任何一方隐私数据。实验结果表明,全局分类器不仅能够很好地诠释各个本地分类器,而且还可以保护各方隐私训练数据的细节。
 

关键词: 隐私保护, 多源数据, 差分隐私, 迁移学习, 全局分类器, 本地分类器

Abstract:

Multisource data analysis with privacy protection is a research hotspot in big data analysis. Learning classifiers from multiparty privacy data has important applications. We propose a twostage privacy protection analyzer model. Firstly, we use the PATET model with privacy protection to train the classifier for private data. Then we gather the multi-party classifier, and use transfer learning to transfer the set knowledge to the global classifier to establish an accurate global classifier with differential privacy. The global classifier does not need to access any party’s private data. Experimental results show that the global classifier can not only interpret each local classifier well, but also protect the details of the privacy training data of all parties.

 

 

 

 
 

Key words: privacy protection, multisource data, differential privacy, transfer learning, global classifier, local classifier