文档名:一种基于特征簇的微博短文本情感分类方法
针对由微博短文本特征规模大、自身特征较少等特点导致的数据稀疏性,提出一种基于特征簇的微博情感分类方法.提出的分类方法以大规模语料库为基础,利用word2vec模型学习词语之间潜在的语义关联,将单个词语表示成多维向量的形式;结合情感词典,提取出微博文本的情感特征集,在基于词向量计算词语相似度方法的基础上,将情感特征合并为特征簇,以此构造低维的文本向量;最后利用机器学习算法,构建情感分类器,实现微博短文本的情感分类.实验结果表明,本文提出的方法对情感特征的降维是可行和有效的,并且取得很好的情感分类效果.
作者:周咏梅 王伟 阳爱民 林江豪 方泽锋
作者单位:广东外语外贸大学思科信息学院,广东广州510006;广东外语外贸大学语言工程与计算实验室,广东广州510006广东外语外贸大学思科信息学院,广东广州510006广东外语外贸大学财务处,广东广州510420
母体文献:中国中文信息学会2015学术年会(CIPS2015)暨第十四届全国计算语言学学术会议(CCL2015)、第三届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD2015)论文集
会议名称:中国中文信息学会2015学术年会(CIPS2015)暨第十四届全国计算语言学学术会议(CCL2015)、第三届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD2015)
会议时间:2015年11月13日
会议地点:广州
主办单位:中国中文信息学会
语种:chi
分类号:
关键词:文本处理 情感分类 机器学习 情感词典
在线出版日期:2018年3月21日
基金项目:
相似文献
相关博文
- 文件大小:
- 629.82 KB
- 下载次数:
- 60
-
高速下载
|
|