文档名:基于隐私保护的改进Kmeans算法
摘要:针对传统K-means聚类算法聚类过程以及聚类结果公示时可能出现隐私泄露的问题,提出具有差分隐私保护的改进K-means算法.在原有K-means基础上引入密度度量,提高簇类的类内相似性,保证选取的中心处于相对密集区域;引入距离度量,降低簇类的类间相似性,保证不同类聚中心排斥性较高;引入类间平均最大相似度,动态规划最佳聚类个数K和最佳初始类内中心;引入了隐私保护拉普拉斯噪声,保护信息的安全性.实验结果表明,该算法比传统算法具有更高的聚类可用性和数据可靠性.
Abstract:AimingattheproblemofprivacydisclosureintheclusteringprocessoftraditionalK-meansclusteringalgorithmandthepublicityofclusteringresults,animprovedK-meansalgorithmwithdifferentialprivacyprotectionwasproposed.OnthebasisoftheoriginalK-means,densitymeasurementisintroducedtoimprovethein-classsimilarityofclustersandensurethattheselectedcentersareinrelativelydenseareas.Thedistancemeasureisintroducedtoreducethesimilaritybetweenclustersandensurethehighrepulsionofdifferentclustercenters.Theaveragemaximumsimilaritybetweenclassesisintroduced,andtheoptimalnumberofclustersKandtheoptimalinitialintra-classcenteraredynamicallyprogrammed.PrivacyprotectionLaplaciannoiseisintroducedtoprotectinformationsecurity.Experimentalresultsshowthatthisalgorithmhashigherclusteravailabilityanddatareliabilitythantraditionalalgorithms.
作者:王彩鑫 王丽丽 杨洪勇Author:WangCaixin WangLili YangHongyong
作者单位:鲁东大学信息与电气工程学院,山东烟台264025
刊名:兵工自动化 ISTIC
Journal:OrdnanceIndustryAutomation
年,卷(期):2023, 42(12)
分类号:TP393
关键词:差分隐私 K-means聚类 动态规划
Keywords:differentialprivacy K-meansclustering dynamicprogramming
机标分类号:
在线出版日期:2024年1月3日
基金项目:国家自然科学基金,山东省重大基础研究项目基于隐私保护的改进K-means算法[
期刊论文] 兵工自动化--2023, 42(12)王彩鑫 王丽丽 杨洪勇针对传统K-means聚类算法聚类过程以及聚类结果公示时可能出现隐私泄露的问题,提出具有差分隐私保护的改进K-means算法.在原有K-means基础上引入密度度量,提高簇类的类内相似性,保证选取的中心处于相对密集区域;引入距离...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
基于隐私保护的改进K-means算法 Improved K-means Algorithm Based on Privacy Protection
基于隐私保护的改进K-means算法.pdf
- 文件大小:
- 1.56 MB
- 下载次数:
- 60
-
高速下载
|