返回列表 发布新帖

启发式k-means聚类算法的改进研究

18 0
1 黄金阳光 发表于 2024-10-4 01:33 | 查看全部 阅读模式
文档摘要:启发式k-means聚类算法通过在k-means第一次迭代后查看附近的集群来预测每个数据点可能会被划分到的集群子集,有效地加快了算法的运行速度.但由于启发式算法存在随机选择初始聚类中心以及无法有效识别数据集中离群点的缺陷,导致聚类结果的误差平方和较大并且轮廓系数偏小.针对这一问题,提出了CHk-means算法,该算法引入仔细播种方法,克服了启发式k-means算法随机选择初始聚类中心带来的局部最优解问题;该算法引入局部异常因子LOF算法对离群点进行检测,降低了离群点数据对聚类结果的影响.在多个数据集上对3种算法进行对比试验,结果表明CHk-means算法可有效降低聚类结果的误差平方和,增强聚类的轮廓系数,使聚类质量得到明显改善.

Abstract:Theheuristick-meansalgorithmpredictsthesubsetofclusterstoeachdatapointwhichislikelytobeclassifiedbylookingatnearbyclustersafterthefirstiterationofk-means,effectivelyspeedinguptheoper-ationofthealgorithm.However,duetotheshortcomingsoftheheuristicalgorithminrandomlyselectingtheinitialclusteringcenterandbeingunabletoeffectivelyidentifyoutliersinthedataset,thesumofsquarederrorsintheclusteringresultsislarge,andthesilhouettecoefficientissmall.Toaddressthisproblem,theCHk-meansalgorithmisproposed.Thisalgorithmintroducesacarefulseedingmethodtoovercomethelocaloptimalsolutionproblemcausedbytheheuristick-meansalgorithmrandomselectionoftheinitialclustercenter.Thisalgo-rithmintroducesthelocaloutlierfactorLOFalgorithmtodetectoutliers,reducingtheimpactofoutlierdataonclusteringresults.Comparativeexperimentswereconductedonthreealgorithmsonmultipledatasets.There-sultsshowthattheCHk-meansalgorithmcaneffectivelyreducethesumofsquareerrorsofclusteringresults,enhancethesilhouettecoefficientofclustering,andsignificantlyimprovetheclusteringquality.

作者:殷丽凤  栗庆杰Author:YINLifeng  LIQingjie
作者单位:大连交通大学软件学院,辽宁大连116028
刊名:大连交通大学学报 ISTIC
Journal:JournalofDalianJiaotongUniversity
年,卷(期):2024, 45(2)
分类号:
关键词:聚类算法  k-means  启发式算法  仔细播种  局部异常因子  离群点  
Keywords:clusteringalgorithm  k-means  heuristicalgorithm  carefulseeding  localoutlierfactor  outliers  
机标分类号:TP391TP181U491
在线出版日期:2024年6月11日
基金项目:国家自然科学基金启发式k-means聚类算法的改进研究[
期刊论文]  大连交通大学学报--2024, 45(2)殷丽凤  栗庆杰启发式k-means聚类算法通过在k-means第一次迭代后查看附近的集群来预测每个数据点可能会被划分到的集群子集,有效地加快了算法的运行速度.但由于启发式算法存在随机选择初始聚类中心以及无法有效识别数据集中离群点的缺...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文

关键词:聚类算法,k-means,启发式算法,仔细播种,局部异常因子,离群点,

2024-10-4 01:33 上传
文件大小:
481.48 KB
下载次数:
60
高速下载
【温馨提示】 您好!以下是下载说明,请您仔细阅读:
1、推荐使用360安全浏览器访问本站,选择您所需的PDF文档,点击页面下方“本地下载”按钮。
2、耐心等待两秒钟,系统将自动开始下载,本站文件均为高速下载。
3、下载完成后,请查看您浏览器的下载文件夹,找到对应的PDF文件。
4、使用PDF阅读器打开文档,开始阅读学习。
5、使用过程中遇到问题,请联系QQ客服。

本站提供的所有PDF文档、软件、资料等均为网友上传或网络收集,仅供学习和研究使用,不得用于任何商业用途。
本站尊重知识产权,若本站内容侵犯了您的权益,请及时通知我们,我们将尽快予以删除。
  • 手机访问
    微信扫一扫
  • 联系QQ客服
    QQ扫一扫
2022-2025 新资汇 - 参考资料免费下载网站 最近更新浙ICP备2024084428号
关灯 返回顶部
快速回复 返回顶部 返回列表