文档名:基于改进TextRank的藏文抽取式摘要生成
目前,藏文抽取式文本摘要方法主要是提取文本自身的特征,对句子进行打分,不能挖掘句子中深层的语义信息.本文提出了一种改进的藏文抽取式摘要生成方法.此方法将外部语料库的信息以词向量的形式融入到TextRank算法,通过TextRank与词向量的结合,把句子中每个词语映射到高维词库形成句向量,进行迭代为句子打分,并选取分值最高的句子重新排序作为文本的摘要.实验结果表明该方法能有效提升摘要质量.本文还在传统Rouge评测方法的基础上,提出了一种采用句子语义相似度计算的方式进行摘要评测的方法.
作者:李维闫晓东解晓庆
作者单位:中央民族大学信息工程学院,北京100081;中央民族大学国家语言资源监测与研究中心少数民族语言分中心,北京100081
母体文献:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会论文集
会议名称:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会
会议时间:2019年10月18日
会议地点:昆明
主办单位:中国中文信息学会
语种:chi
分类号:
关键词:藏文摘要 抽取式生成 TextRank算法 词向量 句子相似度
在线出版日期:2021年8月24日
基金项目:
相似文献
相关博文
- 文件大小:
- 1.03 MB
- 下载次数:
- 60
-
高速下载
|
|