admin 发表于 2024-12-14 14:10

FCGNNER一种融合字形信息的中文嵌套命名实体识别方法


文档名:FCGNNER一种融合字形信息的中文嵌套命名实体识别方法
摘要:基于跨度的模型是嵌套命名实体识别的主要方法,其核心是将实体识别问题转化为跨度分类问题.而在中文数据集中,由于中文单词不具有明显的分割符号,导致语义和边界信息不明确,进而造成中文嵌套命名实体识别效果不佳.为了解决这一问题,提出了融合字形信息的基于跨度的中文嵌套命名实体识别算法——FCG-NNER,首先通过卷积神经网络获取汉字的字形信息,其次通过交叉Biaffine双仿射解码层实现原文信息与字形信息融合,然后通过对角融合CNN层获取不同跨度之间的局部相互作用,最后将交叉Biaffine双仿射解码层的输出与对角融合CNN层的输出相加后输入到全连接层中,得到最终的预测结果.采用2个具有代表性的中文嵌套NER数据集(CMeEE和CLUENER2020)用于实验验证.结果显示,FCG-NNER在CMeEE数据集中的精度为65.02%,召回率为67.93%,F1值达到0.6644;在CLUEN-ER2020数据集中的精度为79.45%,召回率为82.33%,F1值达到0.8086,证明FCG-NNER算法的性能明显超过2个数据集的基线.

作者:陈鹏马洪彬周佳伦李琳宇余肖生Author:CHENPengMAHongbinZHOUJialunLILinyuYUXiaosheng
作者单位:三峡大学湖北省水电工程智能视觉监测重点实验室,湖北宜昌443002;三峡大学计算机与信息学院,湖北宜昌443000
刊名:重庆理工大学学报 PKU
Journal:JournalofChongqingInstituteofTechnology
年,卷(期):2023, 37(23)
分类号:TP391.1
关键词:中文嵌套命名实体识别字形特征跨度分类特征融合
Keywords:Chinesenestednamedentityrecognitioncharacter-levelfeaturesspanclassificationfeaturefusion
机标分类号:TP391.41TP181TN912.34
在线出版日期:2024年3月1日
基金项目:国家重点研究发展计划资助项目FCG-NNER:一种融合字形信息的中文嵌套命名实体识别方法[
期刊论文]重庆理工大学学报--2023, 37(23)陈鹏马洪彬周佳伦李琳宇余肖生基于跨度的模型是嵌套命名实体识别的主要方法,其核心是将实体识别问题转化为跨度分类问题.而在中文数据集中,由于中文单词不具有明显的分割符号,导致语义和边界信息不明确,进而造成中文嵌套命名实体识别效果不佳.为了解...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文

        FCG-NNER:一种融合字形信息的中文嵌套命名实体识别方法FCG-NNER: A Chinese nested named entity recognition method fused with glyph information

FCG-NNER:一种融合字形信息的中文嵌套命名实体识别方法.pdf
页: [1]
查看完整版本: FCGNNER一种融合字形信息的中文嵌套命名实体识别方法