文档名:融合内容特征与传播特征的微博文本情感分类
摘要:基于Word2vec的文本向量化表示方法未充分考虑微博文本的内容特征与传播特征,导致文本向量化表示欠佳,且采用单个机器学习算法进行情感分类的精度不高.提出一种融合文本中表情符号,词的语义、词性与情感等内容特征,评论、转发与点赞数等传播特征,共同构建蕴含丰富语义与情感信息的文本特征向量.根据各基分类器在训练数据集上的性能表现设置不同权重,并与类概率向量相乘,保留最大、最小与平均加权概率值,同时结合原始文本特征向量作为元分类器的输入数据以改进原Stacking算法,进行微博文本情感分类.在微博数据集上的实验结果表明:本文方法能更好地表示文本向量,以加权方式改进的Stacking集成学习分类器优于单个分类器;相较于其他情感分类方法,本文方法的准确率提升1.75%~4.90%.
作者:陈红阳 黄正洪 何盈盈 周也力 Author:CHENHongyang HUANGZhenghong HEYingying ZHOUYeli
作者单位:重庆人文科技学院计算机工程学院,重庆401524成都理工大学信息科学与技术学院,成都610059
刊名:重庆理工大学学报 PKU
Journal:JournalofChongqingInstituteofTechnology
年,卷(期):2023, 37(13)
分类号:TP391.1
关键词:微博文本 情感特征 词性特征 传播特征 情感分类
Keywords:micro-blogtext emotionfeature partofspeechfeature spreadfeature emotionclassi-fication
机标分类号:
在线出版日期:2023年8月22日
基金项目:重庆市教委科学技术研究项目,重庆市教委科学技术研究项目,重庆市教委科学技术研究项目,重庆市教委科学技术研究重点项目,重庆人文科技学院校级技术创新专项项目融合内容特征与传播特征的微博文本情感分类[
期刊论文] 重庆理工大学学报--2023, 37(13)陈红阳 黄正洪 何盈盈 周也力基于Word2vec的文本向量化表示方法未充分考虑微博文本的内容特征与传播特征,导致文本向量化表示欠佳,且采用单个机器学习算法进行情感分类的精度不高.提出一种融合文本中表情符号,词的语义、词性与情感等内容特征,评论、...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
融合内容特征与传播特征的微博文本情感分类 Micro-blog text emotion classification based on the fusion of content features and spread features
融合内容特征与传播特征的微博文本情感分类.pdf
- 文件大小:
- 1.24 MB
- 下载次数:
- 60
-
高速下载
|