返回列表 发布新帖

中文矛盾语块数据集构建和边界识别研究

14 0
admin 发表于 2024-12-11 23:38 | 查看全部 阅读模式

文档名:中文矛盾语块数据集构建和边界识别研究
正确理解文本矛盾是自然语言理解的一项基础性问题.目前的研究大多针对矛盾识别任务,深入文本内部探究矛盾产生原因的工作较少,且缺乏专门的中文矛盾数据集.该文在前人矛盾研究基础上,提出矛盾语块的概念,将其划分为7种类型,并根据标注规范构建了包含16,224条数据的中文矛盾语块(CCB)数据集.基于此数据集,利用序列标注及抽取式阅读理解类模型开展矛盾语块边界识别实验,以检验模型对矛盾内部语义信息的理解能力,结果显示阅读理解类模型在该任务上的性能优于序列标注模型.该文通过三个角度对影响语块边界识别的因素进行分析,为文本矛盾后续研究工作提供可靠的数据集和基线模型.
作者:李博涵姜姗刘畅于东
作者单位:北京语言大学信息科学学院,北京100083
母体文献:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会论文集
会议名称:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会  
会议时间:2019年10月18日
会议地点:昆明
主办单位:中国中文信息学会
语种:chi
分类号:
关键词:中文解析  矛盾语块  数据集  边界识别
在线出版日期:2021年8月24日
基金项目:
相似文献
相关博文
2024-12-11 23:38 上传
文件大小:
679.79 KB
下载次数:
60
高速下载
【温馨提示】 您好!以下是下载说明,请您仔细阅读:
1、推荐使用360安全浏览器访问本站,选择您所需的PDF文档,点击页面下方“本地下载”按钮。
2、耐心等待两秒钟,系统将自动开始下载,本站文件均为高速下载。
3、下载完成后,请查看您浏览器的下载文件夹,找到对应的PDF文件。
4、使用PDF阅读器打开文档,开始阅读学习。
5、使用过程中遇到问题,请联系QQ客服。

本站提供的所有PDF文档、软件、资料等均为网友上传或网络收集,仅供学习和研究使用,不得用于任何商业用途。
本站尊重知识产权,若本站内容侵犯了您的权益,请及时通知我们,我们将尽快予以删除。
  • 手机访问
    微信扫一扫
  • 联系QQ客服
    QQ扫一扫
2022-2025 新资汇 - 参考资料免费下载网站 最近更新浙ICP备2024084428号-1
关灯 返回顶部
快速回复 返回顶部 返回列表