文档摘要:针对大数据聚类处理存在不同类型数据聚类效果差、聚类耗时长的问题,提出了基于改进PSO-Means(ParticleSwarmOptimizationMeans)算法的大数据聚类处理方法.该方法采用粒子群算法确定一次聚类过程中单位粒子的飞行时间和飞行方向,预先设定初始聚类中心的选择范围,并适当调整单位粒子的惯性权重,以消除粒子振荡造成的聚类缺陷,成功获取基于大规模数据的聚类中心.结合生成树算法,通过从样本偏差和质心偏度两个方面对PSO算法进行优化,并将优化后的聚类中心输入到k-means聚类算法中,实现大数据聚类处理.实验结果表明,改进的PSO-Means方法可以有效地聚类不同类型的数据,并且聚类耗时仅为0.3s,验证了该方法具备较好的聚类性能和聚类效率.
Abstract:Bigdataclusteringprocessinghastheproblemofpoorclusteringeffectandlongclusteringtimefordifferenttypesofdata.Therefore,abigdataclusteringprocessingmethodbasedontheimprovedPSO-Means(ParticleSwarmOptimizationMeans)clusteringalgorithmisproposed.Theparticleswarmoptimizationalgorithmisusedtodeterminetheflighttimeanddirectionofunitparticlesduringacluster,presettheselectionrangeoftheinitialclustercenter,andappropriatelyadjusttheinertiaweightofunitparticles.Iteliminatestheclusteringdefectscausedbyparticleoscillationandsuccessfullyobtainstheclusteringcenterbasedonlarge-scaledata.Combinedwiththespanningtreealgorithm,thePSOalgorithmisoptimizedfromtwoaspects:sampleskewnessandcentroidskewness.Theoptimizedclusteringcenteristheninputintothek-meansclusteringalgorithmtorealizetheclusteringprocessingofbigdata.Theexperimentalresultsshowthattheproposedmethodcaneffectivelyclusterdifferenttypesofdata,andtheclusteringtimeisonly0.3s,whichverifiesthatthemethodhasgoodclusteringperformanceandclusteringefficiency.
作者:蒋大锐 徐胜超Author:JIANGDarui XUShengchao
作者单位:广州华商学院数据科学学院,广州511300
刊名:吉林大学学报(信息科学版) ISTIC
Journal:JournalofJilinUniversity(InformationScienceEdition)
年,卷(期):2024, 42(3)
分类号:TP393.4
关键词:大规模数据 粒子群算法 寻优 k-means聚类算法 数据聚类
Keywords:largescaledata particleswarmoptimization optimization k-meansclusteringalgorithm clustering
机标分类号:TP391TS2TH137
在线出版日期:2024年7月19日
基金项目:国家自然科学基金,广州华商学院校内导师制科研基金资助项目,广州华商学院创新创业教育专项研究课题基金资助项目基于改进PSO-Means算法的大数据聚类处理方法[
期刊论文] 吉林大学学报(信息科学版)--2024, 42(3)蒋大锐 徐胜超针对大数据聚类处理存在不同类型数据聚类效果差、聚类耗时长的问题,提出了基于改进PSO-Means(ParticleSwarmOptimizationMeans)算法的大数据聚类处理方法.该方法采用粒子群算法确定一次聚类过程中单位粒子的飞行时间...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
关键词:大规模数据,粒子群算法,寻优,k-means聚类算法,数据聚类,
- 文件大小:
- 13.59 MB
- 下载次数:
- 60
-
高速下载
|
|