文档名:FCGNNER一种融合字形信息的中文嵌套命名实体识别方法
摘要:基于跨度的模型是嵌套命名实体识别的主要方法,其核心是将实体识别问题转化为跨度分类问题.而在中文数据集中,由于中文单词不具有明显的分割符号,导致语义和边界信息不明确,进而造成中文嵌套命名实体识别效果不佳.为了解决这一问题,提出了融合字形信息的基于跨度的中文嵌套命名实体识别算法——FCG-NNER,首先通过卷积神经网络获取汉字的字形信息,其次通过交叉Biaffine双仿射解码层实现原文信息与字形信息融合,然后通过对角融合CNN层获取不同跨度之间的局部相互作用,最后将交叉Biaffine双仿射解码层的输出与对角融合CNN层的输出相加后输入到全连接层中,得到最终的预测结果.采用2个具有代表性的中文嵌套NER数据集(CMeEE和CLUENER2020)用于实验验证.结果显示,FCG-NNER在CMeEE数据集中的精度为65.02%,召回率为67.93%,F1值达到0.6644;在CLUEN-ER2020数据集中的精度为79.45%,召回率为82.33%,F1值达到0.8086,证明FCG-NNER算法的性能明显超过2个数据集的基线.
作者:陈鹏 马洪彬 周佳伦 李琳宇 余肖生Author:CHENPeng MAHongbin ZHOUJialun LILinyu YUXiaosheng
作者单位:三峡大学湖北省水电工程智能视觉监测重点实验室,湖北宜昌443002;三峡大学计算机与信息学院,湖北宜昌443000
刊名:重庆理工大学学报 PKU
Journal:JournalofChongqingInstituteofTechnology
年,卷(期):2023, 37(23)
分类号:TP391.1
关键词:中文嵌套命名实体识别 字形特征 跨度分类 特征融合
Keywords:Chinesenestednamedentityrecognition character-levelfeatures spanclassification featurefusion
机标分类号:TP391.41TP181TN912.34
在线出版日期:2024年3月1日
基金项目:国家重点研究发展计划资助项目FCG-NNER:一种融合字形信息的中文嵌套命名实体识别方法[
期刊论文] 重庆理工大学学报--2023, 37(23)陈鹏 马洪彬 周佳伦 李琳宇 余肖生基于跨度的模型是嵌套命名实体识别的主要方法,其核心是将实体识别问题转化为跨度分类问题.而在中文数据集中,由于中文单词不具有明显的分割符号,导致语义和边界信息不明确,进而造成中文嵌套命名实体识别效果不佳.为了解...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
FCG-NNER:一种融合字形信息的中文嵌套命名实体识别方法 FCG-NNER: A Chinese nested named entity recognition method fused with glyph information
FCG-NNER:一种融合字形信息的中文嵌套命名实体识别方法.pdf
- 文件大小:
- 2.95 MB
- 下载次数:
- 60
-
高速下载
|