返回列表 发布新帖

一种半监督的微博话题噪声过滤方法

14 0
admin 发表于 2024-12-11 20:54 | 查看全部 阅读模式

文档名:一种半监督的微博话题噪声过滤方法
社交网络中存在大量营销、招聘等垃圾信息以及无实质内容的短文,为话题建模工作带来很多干扰,更严重影响社交网络方面的学术研究及商业应用.因此,本文提出一种基于SVM-kNN模型的半监督话题噪声过滤方法.该方法融合了支持向量机(SupportVectorMachines,SVM)和k近邻(k-NearestNeighbor,k-NN)算法,在SVM计算得到超平面的基础上使用kNN算法在局部范围内迭代寻找分类超平面的最优解;同时为减少误分类发生,分别在SVM和kNN阶段引入惩罚代价和比例权重,以提高噪声过滤的效果.通过选取新浪微博中不同大小的数据集进行实验,结果与其它方法相比表明,本文提出的方法只利用了少量的标注样本进行训练,在准确率、召回率和F值方面均优于其他的对比方法.
作者:屠守中 杨婧 赵林 朱小燕
作者单位:清华大学计算机科学与技术系,北京100084中国科学院计算技术研究所网络数据科学与技术重点实验室,北京100190中国科学院信息工程研究所信息安全国家重点实验室,北京100093
母体文献:第六届中国计算机学会大数据学术会议论文集
会议名称:第六届中国计算机学会大数据学术会议  
会议时间:2018年10月11日
会议地点:西安
主办单位:中国计算机学会
语种:chi
分类号:
关键词:微博话题  噪声过滤  支持向量机  k近邻算法
在线出版日期:2020年11月30日
基金项目:
相似文献
相关博文
2024-12-11 20:54 上传
文件大小:
726.92 KB
下载次数:
60
高速下载
【温馨提示】 您好!以下是下载说明,请您仔细阅读:
1、推荐使用360安全浏览器访问本站,选择您所需的PDF文档,点击页面下方“本地下载”按钮。
2、耐心等待两秒钟,系统将自动开始下载,本站文件均为高速下载。
3、下载完成后,请查看您浏览器的下载文件夹,找到对应的PDF文件。
4、使用PDF阅读器打开文档,开始阅读学习。
5、使用过程中遇到问题,请联系QQ客服。

本站提供的所有PDF文档、软件、资料等均为网友上传或网络收集,仅供学习和研究使用,不得用于任何商业用途。
本站尊重知识产权,若本站内容侵犯了您的权益,请及时通知我们,我们将尽快予以删除。
  • 手机访问
    微信扫一扫
  • 联系QQ客服
    QQ扫一扫
2022-2025 新资汇 - 参考资料免费下载网站 最近更新浙ICP备2024084428号-1
关灯 返回顶部
快速回复 返回顶部 返回列表