基于数据分布的标签噪声过滤方法

171 0
2024-12-10 15:41 | 查看全部 阅读模式

文档名:基于数据分布的标签噪声过滤方法
在监督学习中,标签噪声对模型建立有较大的影响.目前对于标签噪声的处理方法主要有基于模型预测的过滤方法和鲁棒性建模方法,然而这些方法要么过滤效果不好,要么过滤效率不高.针对该问题,本文提出一种基于数据分布的标签噪声过滤方法.首先对于数据集中的每一个样本,根据其近邻内样本的分布,将其及邻域样本形成的区域划分为高密度区域和低密度区域,然后针对不同的区域采用不同的噪声过滤规则进行过滤.与已有方法相比,本文从数据分布角度出发,使得噪声过滤更具有针对性从而提高过滤效果;另外本文使用过滤规则对噪声数据进行处理而非建立噪声预测模型,因而可以提高过滤效率.在15个UCI标准多分类数据集上的实验结果表明,本文提出的方法在噪声低于30%时,噪声检测效率和分类精度均有很好的表现.
作者:陈庆强 王文剑 姜高霞
作者单位:山西大学计算机与信息技术学院计算机与信息技术学院太原030006山西大学计算智能与中文信息处理教育部重点实验室计算智能与中文信息处理教育部重点实验室太原030006
母体文献:第六届中国计算机学会大数据学术会议论文集
会议名称:第六届中国计算机学会大数据学术会议  
会议时间:2018年10月11日
会议地点:西安
主办单位:中国计算机学会
语种:chi
分类号:
关键词:数据处理  标签噪声  过滤规则  分类精度
在线出版日期:2020年11月30日
基金项目:
相似文献
相关博文
2024-12-10 15:41 上传
文件大小:
1.04 MB
下载次数:
60
高速下载
【温馨提示】 您好!以下是下载说明,请您仔细阅读:
1、推荐使用360安全浏览器访问本站,选择您所需的PDF文档,点击页面下方“下载”按钮。
2、耐心等待两秒钟,系统将自动开始下载,本站文件均为高速下载。
3、下载完成后,请查看您浏览器的下载文件夹,找到对应的PDF文件。
4、使用PDF阅读器打开文档,开始阅读学习。
5、使用过程中遇到问题,请联系QQ客服

本站提供的所有PDF文档、软件、资料等均为网友上传或网络收集,仅供学习和研究使用,不得用于任何商业用途。
本站尊重知识产权,若本站内容侵犯了您的权益,请及时通知我们,我们将尽快予以删除。
2026 资料下载 z3060.com 联系邮件:1991591830#qq.com 浙ICP备2024084428号-1
快速回复 返回顶部 返回列表