文档名:基于包络学习和分级结构一致性机制的不平衡集成算法
摘要:集成方法是不平衡学习方法的重要分支,然而,现有不平衡集成方法均作用于原样本而没考虑样本的结构信息,因此其效能仍然有限.样本的结构信息包括局部和全局结构信息.为了解决上述问题,本文提出了一种基于深度样本包络网络(DeepInstanceEnvelopeNetwork,DIEN)和分级结构一致性机制(HierarchicalStructureConsisten-cyMechanism,HSCM)的不平衡集成学习算法.该算法在考虑局部流形和全局结构信息的情况下,通过多层样本聚类,生成高质量的多层包络样本,从而实现类平衡化.首先,算法基于样本近邻拼接和模糊C均值聚类算法,设计DIEN来挖掘样本的结构信息,得到深度包络样本.然后,设计局部流形结构度量和全局结构分布度量来构建HSCM用于增强层间样本的分布一致性.接着,将DIEN和HSCM结合起来,构建出优化后的深度样本包络网络——DH(DIENwithHSCM).之后,将基分类器应用于包络样本.最后,设计bagging集成学习机制来融合基分类器的预测结果.文末组织了多组实验,采用了十多个公共数据集和有代表性的相关算法进行验证比较.实验结果表明,本文算法在AUC(AreaUnderCurve),F-measure等四个性能指标上显著最优.
Abstract:Ensemblemethodshavebecomeanimportantbranchofimbalancedlearning.However,theexistingimbal-ancedensemblemethodsallrelyontheoriginalinstanceswithoutconsideringthestructureinformationoftheinstances,sotheireffectivenessisstilllimited.Theresearchshowsthatthestructureinformationofinstancesincludeslocalandglobalstructureinformation.Inordertosolvetheaboveproblem,thispaperproposesanimbalancedensemblealgorithmbasedondeepinstanceenvelopenetwork(DIEN)andhierarchicalstructureconsistencymechanism(HSCM).Consideringthelocalmanifoldandglobalstructureinformation,thealgorithmgenerateshigh-qualitydeepenvelopeinstancestoachieveclassbal-ance.Firstly,basedontheinstanceneighborhoodconcatenationandfuzzyc-meansclusteringalgorithm,theDIENisde-signedtominethestructureinformationofinstances,obtainingthedeepenvelopeinstances.Then,thelocalmanifoldstruc-turemeasureandglobalstructuredistributionmeasurearedesignedtoconstructtheHSCMtoenhancethedistributioncon-sistencyofinterlayerinstances.Next,DIENandHSCMarecombinedtoconstructtheoptimizeddeepinstanceenvelopenet-work—DH(DIENwithHSCM).Then,thebaseclassifierisappliedtothedeepenvelopeinstances.Finally,thebaggingen-semblelearningmechanismisdesignedtofusethepredictionresultsofthebaseclassifiertoobtainthefinalresults.Attheendofthispaper,severalgroupsofexperimentsareorganized.Morethan10publicdatasetsandrepresentativerelatedalgo-rithmsareusedforverification.Experimentalresultsshowthattheproposedalgorithmissignificantlybetterinfourperfor-mancemetrics,suchasAUC(AreaUnderCurve)andF-measure.
作者:李帆 张小恒 李勇明 王品 Author:LIFan ZHANGXiao-heng LIYong-ming WANGPin
作者单位:重庆大学微电子与通信工程学院,重庆400030重庆大学微电子与通信工程学院,重庆400030;重庆广播电视大学,重庆400052
刊名:电子学报 ISTICEIPKU
Journal:ActaElectronicaSinica
年,卷(期):2024, 52(3)
分类号:TP391.4
关键词:不平衡学习 包络学习 分级结构一致性机制 局部流形结构度量 全局结构分布度量
Keywords:imbalancedlearning envelopelearning hierarchicalstructureconsistencymechanism localmanifoldstructuremeasure globalstructuredistributionmeasure
机标分类号:TP311.13TP181TP273
在线出版日期:2024年5月16日
基金项目:基于包络学习和分级结构一致性机制的不平衡集成算法[
期刊论文] 电子学报--2024, 52(3)李帆 张小恒 李勇明 王品集成方法是不平衡学习方法的重要分支,然而,现有不平衡集成方法均作用于原样本而没考虑样本的结构信息,因此其效能仍然有限.样本的结构信息包括局部和全局结构信息.为了解决上述问题,本文提出了一种基于深度样本包络网络...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
基于包络学习和分级结构一致性机制的不平衡集成算法 Imbalanced Ensemble Algorithm Based on Envelope Learning and Hierarchical Structure Consistency Mechanism
基于包络学习和分级结构一致性机制的不平衡集成算法.pdf
- 文件大小:
- 2.82 MB
- 下载次数:
- 60
-
高速下载
|