文档名:实体驱动的双向LSTM篇章连贯性建模
篇章连贯性建模是自然语言处理研究领域的一个基础问题.主流的篇章连贯性模型分为两大类,分别是基于实体网格的连贯性模型和基于神经网络的篇章连贯性模型.其中,基于实体网格的篇章连贯性模型需要进行特征提取,而基于深度学习的模型没有充分考虑到篇章中句子间的实体链接对连贯性建模的重要作用.基于此,本文首先抽取出篇章中相邻句子的实体信息,将其进行分布式表示,然后将此信息通过多种简单且有效的向量操作融合至句子级的双向LSTM深度学习模型之中.在汉语和英语篇章语料上的句子排序和中英文机器翻译连贯性检测两种任务上的实验表明本文提出的模型性能和现有模型相比有所提升,尤其在中文上有显著提升.
作者:杜舒静徐凡王明文
作者单位:江西师范大学计算机信息工程学院,江西,南昌,33002
母体文献:第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会论文集
会议名称:第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会
会议时间:2017年10月13日
会议地点:南京
主办单位:中国中文信息学会
语种:chi
分类号:
关键词:实体 篇章连贯性 双向长短期记忆人工神经网络 分布式表示
在线出版日期:2020年7月21日
基金项目:
相似文献
相关博文
- 文件大小:
- 847.32 KB
- 下载次数:
- 60
-
高速下载
|
|