admin 发表于 2024-12-14 13:37

改进二进制麻雀搜索的特征选择及文本聚类


文档名:改进二进制麻雀搜索的特征选择及文本聚类
摘要:针对文本中存在冗余特征影响聚类精度等问题,提出一种结合蜣螂优化算法改进二进制麻雀搜索算法的特征选择及文本聚类算法.利用基于特征词权重的适应度函数完成文本特征评估,构建矢量空间模型;引入蜣螂优化算法中的圆周方向搜索机制,改进传统麻雀搜索算法中麻雀发现者位置更新策略,并融入滚动方向机制的随机游走策略提升全局搜索能力,结合转移函数对连续型麻雀位置进行更新,得到优化的二进制麻雀搜索算法,筛选出优质特征子集;选用k-means++算法完成文本聚类.通过多种基准函数及公共数据集进行验证,结果表明:所提方法能够有效降低文本特征维度,提高聚类效果.

作者:高新成   邵国铭   张海洋   周中雨 Author:GAOXincheng   SHAOGuoming   ZHANGHaiyang   ZHOUZhongyu
作者单位:东北石油大学现代教育技术中心,黑龙江大庆163318;东北石油大学计算机与信息技术学院,黑龙江大庆163318东北石油大学计算机与信息技术学院,黑龙江大庆163318
刊名:重庆理工大学学报 PKU
Journal:JournalofChongqingInstituteofTechnology
年,卷(期):2023, 37(15)
分类号:TP391
关键词:特征选择蜣螂优化算法二进制麻雀搜索算法k-means++文本聚类特征词权重
Keywords:featureselectiondungbeetleoptimizationalgorithmbinarysparrowsearchalgorithmk-means++textclusteringfeaturewordweight
机标分类号:TP391TP18TN929.533
在线出版日期:2023年9月26日
基金项目:国家自然科学基金,中国高校产学研创新基金,黑龙江省教育科学规划重点课题改进二进制麻雀搜索的特征选择及文本聚类[
期刊论文]重庆理工大学学报--2023, 37(15)高新成邵国铭张海洋周中雨针对文本中存在冗余特征影响聚类精度等问题,提出一种结合蜣螂优化算法改进二进制麻雀搜索算法的特征选择及文本聚类算法.利用基于特征词权重的适应度函数完成文本特征评估,构建矢量空间模型;引入蜣螂优化算法中的圆周方...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文

        改进二进制麻雀搜索的特征选择及文本聚类Improved binary sparrow search algorithm for feature selection and text clustering

改进二进制麻雀搜索的特征选择及文本聚类.pdf
页: [1]
查看完整版本: 改进二进制麻雀搜索的特征选择及文本聚类