基于联邦集成算法对多源数据安全性的研究

计算机工程与科学 ›› 2021, Vol. 43 ›› Issue (08): 1387-1397.

• 计算机网络与信息安全 • 上一篇下一篇

基于联邦集成算法对多源数据安全性的研究

罗长银1,2,3，陈学斌1,2,3，刘洋1,2,3，张淑芬1,2,3

（1.华北理工大学理学院,河北唐山 063210；2.河北省数据科学与应用重点实验室,河北唐山063210；

3.唐山市数据科学重点实验室,河北唐山 063210）

收稿日期:2020-06-15 修回日期:2020-09-09 接受日期:2021-08-25 出版日期:2021-08-25 发布日期:2021-08-24
基金资助:
国家自然科学基金（61572170,61170254）;唐山市科技项目(18120203A)

A federated ensemble algorithm for multi-source data security

LUO Chang-yin1,2,3,CHEN Xue-bin1,2,3,LIU Yang1,2,3,ZHANG Shu-fen1,2,3#br#

#br#

(1.College of Science,North China University of Science and Technology,Tangshan 063210;

2.Hebei Key Laboratory of Data Science and Application,Tangshan 063210;

3.Tangshan Key Laboratory of Data Science,Tangshan 063210,China)

Received:2020-06-15 Revised:2020-09-09 Accepted:2021-08-25 Online:2021-08-25 Published:2021-08-24

摘要/Abstract

摘要： 联邦学习是隐私保护领域关注的热点内容，存在难以集中本地模型参数与因梯度更新造成数据泄露的问题。提出了一种联邦集成算法，使用256 B的密钥将不同类型的初始化模型传输至各数据源并训练，使用不同的集成算法来整合本地模型参数，使数据与模型的安全性得到很大提升。仿真结果表明，对于中小数据集而言，使用Adaboost集成算法得到的模型准确率达到92.505%，标准差约为8.6×10-8，对于大数据集而言，采用stacking集成算法得到的模型的准确率达到92.495%，标准差约为8.85×10-8，与传统整合多方数据集中训练模型的方法相比，在保证准确率的同时兼顾了数据与模型的安全性。

关键词: 联邦学习, 集成算法, 隐私保护, 联邦集成算法

Abstract: Federated learning is a hot topic in the field of privacy protection, and it has a problem that it is difficult to concentrate local model parameters and data leakage due to gradient updates. This paper proposes a federated ensemble algorithm. The proposal uses a 256-byte key to transfer different types of initialization models to various data sources and do the training, and uses different ensemble algorithms to integrate local model parameters to ensure the security of the data and the model, thus greatly improving the security of data and model. Simulation results show that, for small and medium data sets, the accuracy of the model obtained by the adaboost integration algorithm reaches 92.505%, and the variance is about 8.6×10-8. For large data sets, the accuracy of the model obtained by the stacking ensemble algorithm reaches 92.495%, and the variance is about 8.85×10-8. Compared with the traditional method of training the model with integrated data, the proposal ensures the accuracy while taking into account the data and the model safety.

Key words: federated learning, ensemble algorithm, privacy protection, federated ensemble algorithm

罗长银, 陈学斌, 刘洋, 张淑芬, . 基于联邦集成算法对多源数据安全性的研究[J]. 计算机工程与科学, 2021, 43(08): 1387-1397.

编辑推荐

Metrics

阅读次数

全文

324

HTML			PDF

最新录用	在线预览	正式出版	最新录用	在线预览	正式出版
0	0	0	0	0	324

来源	本网站	其他网站

次数	285	39
比例	88%	12%

摘要

194

最新录用	在线预览	正式出版

0	0	194

	来源	本网站

	次数	194
	比例	100%

[1]	杨旭东, 李秋燕, 高岭, 刘鑫, 邓雅妮. 一种基于多区块链协作的分布式位置匿名方法[J]. 计算机工程与科学, 2024, 46(12): 2171-2185.
[2]	王天阳, 李晓会, 陈洪洋. 参与式感知设备多维数据的个性化差分隐私保护方案[J]. 计算机工程与科学, 2024, 46(11): 1997-2006.
[3]	肖迪, 余柱阳, 李敏, 王莲. 基于差分隐私与模型聚类的安全联邦学习方案[J]. 计算机工程与科学, 2024, 46(09): 1606-1615.
[4]	王永军, 刘瀚阳, 王辉, 申自浩, 刘琨, 刘沛骞. 区域敏感的群智感知隐私保护任务分配机制[J]. 计算机工程与科学, 2024, 46(08): 1414-1424.
[5]	郭昌昊, 唐湘云, 翁彧. 基于异步分层联邦学习的数据异质性处理方法研究[J]. 计算机工程与科学, 2024, 46(07): 1237-1244.
[6]	赵文韬, 官礼和, 何建国, 唐昊. 区块链环境中的隐私保护推荐算法研究[J]. 计算机工程与科学, 2024, 46(06): 1032-1040.
[7]	吴瑕, 郑洪英, 肖迪. 一种基于认证文件的双方验证模型水印方案[J]. 计算机工程与科学, 2024, 46(04): 647-656.
[8]	叶茜, 张玉书, 赵若宇, 肖祥立, 温文媖. 可用性增强的缩略图保持加密[J]. 计算机工程与科学, 2023, 45(09): 1563-1571.
[9]	程小刚, 郭韧, 周长利, . 基于理性密码学的分布式隐私保护数据挖掘框架[J]. 计算机工程与科学, 2022, 44(10): 1781-1787.
[10]	李帅, 常锦才, 李吕牧之, 蔡昆杰, . 基于差分隐私保护的Stacking集成聚类算法研究[J]. 计算机工程与科学, 2022, 44(08): 1402-1408.
[11]	寇邦艳, 曹素珍, 吕佳. 基于雾计算面向停车服务的隐私保护方案[J]. 计算机工程与科学, 2022, 44(07): 1232-1238.
[12]	牛淑芬, 方丽芝, 宋蜜, 王彩芬, 杜小妮. 智慧城市中隐私保护性广播加密算法[J]. 计算机工程与科学, 2022, 44(06): 1003-1012.
[13]	胡雨谷, 葛丽娜, . 一种改进的差分隐私参数设置及数据优化算法[J]. 计算机工程与科学, 2021, 43(10): 1758-1765.
[14]	谢小杰, 梁英, 王梓森, 董祥祥, . 社交网络用户隐私泄露量化评估方法[J]. 计算机工程与科学, 2021, 43(08): 1376-1386.
[15]	刘祥震1，张玉磊1，郎晓丽1，骆广萍1，王彩芬2. 可证安全的隐私保护多接收者异构聚合签密方案[J]. 计算机工程与科学, 2020, 42(03): 441-448.

基于联邦集成算法对多源数据安全性的研究

A federated ensemble algorithm for multi-source data security

PDF

可视化

摘要/Abstract

引用本文

使用本文

相关文章 15

编辑推荐

Metrics

本文评价