文档名:一种话题敏感的抽取式多文档摘要方法
抽取式摘要的核心问题在于合理地建模句子,正确地判断句子重要性.本文提出一种计算句子话题重要性的方法,通过分析句子与话题的语义关系,判断句子是否描述话题的重要信息.针对自动摘要任务缺乏参考摘要作为训练数据的问题,本文提出一种基于排序学习的半监督训练框架,利用大规模未标注新闻语料训练模型.在DUC2004多文档摘要任务上的实验结果表明,本文提出的话题重要性特征能够作为传统启发式特征的有效补充,改进摘要质量.
作者:应文豪李素建穗志方
作者单位:北京大学计算语言学教育部重点实验室,北京市100871
母体文献:第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会论文集
会议名称:第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会
会议时间:2017年10月13日
会议地点:南京
主办单位:中国中文信息学会
语种:chi
分类号:
关键词:文本自动摘要 卷积神经网络 排序学习
在线出版日期:2020年7月21日
基金项目:
相似文献
相关博文
- 文件大小:
- 386.95 KB
- 下载次数:
- 60
-
高速下载
|