返回列表 发布新帖

基于随机森林模型的不平衡大数据分类算法

21 0
admin 发表于 2024-12-14 11:51 | 查看全部 阅读模式

文档名:基于随机森林模型的不平衡大数据分类算法
摘要:针对目前不平衡大数据分类算法分类效果较差的问题,提出基于随机森林模型的不平衡大数据分类算法.首先采用SVM(SupportVectorMachine)支持向量机算法对不平衡大数据进行信息过滤,然后利用反k近邻法检测并消除离群点,通过增量主成分分析法去掉不平衡大数据中协方差矩阵存在的奇异性,并依据熵值法对其展开权重解析,进而提取不平衡大数据特征信息.将CART(ClassificationandRegressionTrees)决策树当作不平衡大数据的基分类器,进而构建随机森林决策树分类器,最后将提取的不平衡大数据特征信息输入分类器中,实现不平衡大数据分类.实验结果表明,该算法对不平衡大数据的采样效果较好,并且分类精准度、稳定性和性能都较高.

Abstract:Inresponsetotheproblemofpoorclassificationperformancefacedbycurrentimbalancedbigdataclassificationalgorithms,arandomforestmodelbasedimbalancedbigdataclassificationalgorithmisproposed.Firstly,theSVM(SupportVectorMachine)algorithmisusedtofilterinformationonimbalancedbigdata,andthentheantik-nearestneighbormethodisusedtodetectandeliminateoutliers.Thesingularityofthecovariancematrixinimbalancedbigdataisremovedthroughincrementalprincipalcomponentanalysis.Andbasedontheentropymethod,weightanalysisiscarriedouttoextractimbalancedbigdatafeatureinformation.TheCART(ClassificationandRegressionTrees)decisiontreeisusedasthebaseclassifierforimbalancedbigdata,andarandomforestdecisiontreeclassifierisconstructed.Theextractedimbalancedbigdatafeatureinformationisinputintotheclassifiertoachieveimbalancedbigdataclassification.Theexperimentalresultsshowthattheproposedalgorithmhasgoodsamplingperformance,highclassificationaccuracy,highstability,andhighperformanceforimbalancedbigdata.

作者:魏亚明   孟媛 Author:WEIYaming   MENGYuan
作者单位:徐州市中心医院信息处,江苏徐州221000江苏师范大学研究生院,江苏徐州221000
刊名:吉林大学学报(信息科学版) ISTIC
Journal:JournalofJilinUniversity(InformationScienceEdition)
年,卷(期):2023, 41(6)
分类号:TP391
关键词:随机森林模型  不平衡大数据分类  SVM支持向量机  反A近邻法  CART决策树  
Keywords:stochasticforestmodel  unbalancedbigdataclassification  supportvectormachine(SVM)  Antik-nearestneighbormethod  classificationandregressiontrees(CART)decisiontree  
机标分类号:TP391TN911.1-34U495
在线出版日期:2024年1月24日
基金项目:江苏省自然科学基金资助项目基于随机森林模型的不平衡大数据分类算法[
期刊论文]  吉林大学学报(信息科学版)--2023, 41(6)魏亚明  孟媛针对目前不平衡大数据分类算法分类效果较差的问题,提出基于随机森林模型的不平衡大数据分类算法.首先采用SVM(SupportVectorMachine)支持向量机算法对不平衡大数据进行信息过滤,然后利用反k近邻法检测并消除离群点,通...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文

        基于随机森林模型的不平衡大数据分类算法  Unbalanced Big Data Classification Algorithm Based on Random Forest Model

基于随机森林模型的不平衡大数据分类算法.pdf
2024-12-14 11:51 上传
文件大小:
5.44 MB
下载次数:
60
高速下载
【温馨提示】 您好!以下是下载说明,请您仔细阅读:
1、推荐使用360安全浏览器访问本站,选择您所需的PDF文档,点击页面下方“本地下载”按钮。
2、耐心等待两秒钟,系统将自动开始下载,本站文件均为高速下载。
3、下载完成后,请查看您浏览器的下载文件夹,找到对应的PDF文件。
4、使用PDF阅读器打开文档,开始阅读学习。
5、使用过程中遇到问题,请联系QQ客服。

本站提供的所有PDF文档、软件、资料等均为网友上传或网络收集,仅供学习和研究使用,不得用于任何商业用途。
本站尊重知识产权,若本站内容侵犯了您的权益,请及时通知我们,我们将尽快予以删除。
  • 手机访问
    微信扫一扫
  • 联系QQ客服
    QQ扫一扫
2022-2025 新资汇 - 参考资料免费下载网站 最近更新浙ICP备2024084428号-1
关灯 返回顶部
快速回复 返回顶部 返回列表