返回列表 发布新帖

微博文本挖掘关键技术研究与实现

25 0
admin 发表于 2024-12-11 17:34 | 查看全部 阅读模式

文档名:微博文本挖掘关键技术研究与实现
数据挖掘技术是人们分析数据和处理数据的有效手段.针对微博数据的分析和挖掘需求,本文研究微博文本挖掘关键技术,提出对微博文本进行挖掘的技术方案.在该方案中,首先利用Python语言的爬虫技术,从微博账户相关网站和微博网站采集数据;然后对采集到的数据人工判断,把积极语句逐条复制到指定文件;接着去掉不需要的字符,并利用TF-IDF词频向量化对采集到的的数据进行预处理;然后对数据进行降维,对降维后的数据集进行默认交叉验证划分和五层折叠交叉验证;最后通过逻辑回归(LogisticRegression)、朴素贝叶斯(NaiveBayes)、支持向量机(SVM)、K最近邻(K-NearestNeighbor,KNN)等常用的分类器,对预处理后的微博文本数据集进行分类.
作者:李陶深于斐钥
作者单位:广西大学计算机与电子信息学院,南宁,530004
母体文献:2021中国高校计算机教育大会论文集
会议名称:2021中国高校计算机教育大会  
会议时间:2021年10月1日
会议地点:南宁
主办单位:全国高等学校计算机教育研究会,教育部
语种:chi
分类号:TP3TP1
关键词:微博文本  数据挖掘  爬虫技术  分类器
在线出版日期:2022年4月27日
基金项目:
相似文献
相关博文
2024-12-11 17:34 上传
文件大小:
8.95 MB
下载次数:
60
高速下载
【温馨提示】 您好!以下是下载说明,请您仔细阅读:
1、推荐使用360安全浏览器访问本站,选择您所需的PDF文档,点击页面下方“本地下载”按钮。
2、耐心等待两秒钟,系统将自动开始下载,本站文件均为高速下载。
3、下载完成后,请查看您浏览器的下载文件夹,找到对应的PDF文件。
4、使用PDF阅读器打开文档,开始阅读学习。
5、使用过程中遇到问题,请联系QQ客服。

本站提供的所有PDF文档、软件、资料等均为网友上传或网络收集,仅供学习和研究使用,不得用于任何商业用途。
本站尊重知识产权,若本站内容侵犯了您的权益,请及时通知我们,我们将尽快予以删除。
  • 手机访问
    微信扫一扫
  • 联系QQ客服
    QQ扫一扫
2022-2025 新资汇 - 参考资料免费下载网站 最近更新浙ICP备2024084428号-1
关灯 返回顶部
快速回复 返回顶部 返回列表