基于改进PSO-Means算法的大数据聚类处理方法

215 0
2024-10-4 00:39 | 查看全部 阅读模式
文档摘要:针对大数据聚类处理存在不同类型数据聚类效果差、聚类耗时长的问题,提出了基于改进PSO-Means(ParticleSwarmOptimizationMeans)算法的大数据聚类处理方法.该方法采用粒子群算法确定一次聚类过程中单位粒子的飞行时间和飞行方向,预先设定初始聚类中心的选择范围,并适当调整单位粒子的惯性权重,以消除粒子振荡造成的聚类缺陷,成功获取基于大规模数据的聚类中心.结合生成树算法,通过从样本偏差和质心偏度两个方面对PSO算法进行优化,并将优化后的聚类中心输入到k-means聚类算法中,实现大数据聚类处理.实验结果表明,改进的PSO-Means方法可以有效地聚类不同类型的数据,并且聚类耗时仅为0.3s,验证了该方法具备较好的聚类性能和聚类效率.

Abstract:Bigdataclusteringprocessinghastheproblemofpoorclusteringeffectandlongclusteringtimefordifferenttypesofdata.Therefore,abigdataclusteringprocessingmethodbasedontheimprovedPSO-Means(ParticleSwarmOptimizationMeans)clusteringalgorithmisproposed.Theparticleswarmoptimizationalgorithmisusedtodeterminetheflighttimeanddirectionofunitparticlesduringacluster,presettheselectionrangeoftheinitialclustercenter,andappropriatelyadjusttheinertiaweightofunitparticles.Iteliminatestheclusteringdefectscausedbyparticleoscillationandsuccessfullyobtainstheclusteringcenterbasedonlarge-scaledata.Combinedwiththespanningtreealgorithm,thePSOalgorithmisoptimizedfromtwoaspects:sampleskewnessandcentroidskewness.Theoptimizedclusteringcenteristheninputintothek-meansclusteringalgorithmtorealizetheclusteringprocessingofbigdata.Theexperimentalresultsshowthattheproposedmethodcaneffectivelyclusterdifferenttypesofdata,andtheclusteringtimeisonly0.3s,whichverifiesthatthemethodhasgoodclusteringperformanceandclusteringefficiency.

作者:蒋大锐  徐胜超Author:JIANGDarui  XUShengchao
作者单位:广州华商学院数据科学学院,广州511300
刊名:吉林大学学报(信息科学版) ISTIC
Journal:JournalofJilinUniversity(InformationScienceEdition)
年,卷(期):2024, 42(3)
分类号:TP393.4
关键词:大规模数据  粒子群算法  寻优  k-means聚类算法  数据聚类  
Keywords:largescaledata  particleswarmoptimization  optimization  k-meansclusteringalgorithm  clustering  
机标分类号:TP391TS2TH137
在线出版日期:2024年7月19日
基金项目:国家自然科学基金,广州华商学院校内导师制科研基金资助项目,广州华商学院创新创业教育专项研究课题基金资助项目基于改进PSO-Means算法的大数据聚类处理方法[
期刊论文]  吉林大学学报(信息科学版)--2024, 42(3)蒋大锐  徐胜超针对大数据聚类处理存在不同类型数据聚类效果差、聚类耗时长的问题,提出了基于改进PSO-Means(ParticleSwarmOptimizationMeans)算法的大数据聚类处理方法.该方法采用粒子群算法确定一次聚类过程中单位粒子的飞行时间...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文

关键词:大规模数据,粒子群算法,寻优,k-means聚类算法,数据聚类,

2024-10-4 00:39 上传
文件大小:
13.59 MB
下载次数:
60
高速下载
【温馨提示】 您好!以下是下载说明,请您仔细阅读:
1、推荐使用360安全浏览器访问本站,选择您所需的PDF文档,点击页面下方“下载”按钮。
2、耐心等待两秒钟,系统将自动开始下载,本站文件均为高速下载。
3、下载完成后,请查看您浏览器的下载文件夹,找到对应的PDF文件。
4、使用PDF阅读器打开文档,开始阅读学习。
5、使用过程中遇到问题,请联系QQ客服

本站提供的所有PDF文档、软件、资料等均为网友上传或网络收集,仅供学习和研究使用,不得用于任何商业用途。
本站尊重知识产权,若本站内容侵犯了您的权益,请及时通知我们,我们将尽快予以删除。
2026 资料下载 z3060.com 联系邮件:1991591830#qq.com 浙ICP备2024084428号-1
快速回复 返回顶部 返回列表