文档名:基于双路分段注意力神经张量网络的临床文本关系抽取
摘要:目前,生物医学领域的关系提取工作已经取得了长足的发展,但是在面对句式复杂的临床医学文本时,由于存在大量长句以及句中实体对的高密度分布,限制了当前关系抽取模型性能的进一步提升.本文提出了一种基于张量权重矩阵的双向门控循环单元网络(Tensor-basedBidirectionalGatedRecurrentUnit,Tensor-BiGRU)和分段注意力机制的关系抽取模型,基于张量权重矩阵改进BiGRU网络的编码方式,提升神经网络捕获底层特征的能力,而后提出了两种分段注意力机制,以提高模型捕获长句特征的性能.此外,当句子中有多个实体对时,引入实体对的语义信息特征来克服模型的性能下降.本文进一步提出一种权重自适应的交叉熵损失函数,用于提升模型面对数据集中不同关系类别的样本分布不平衡问题的泛化性.实验结果表明,在不依赖任何特征工程和高性能运算环境的情况下,本文模型在2010i2b2/VA临床关系抽取数据集上实现了先进的性能.
作者:隗昊 唐焕玲 周爱 张益嘉 陈飞 鲁明羽 Author:WEIHao TANGHuan-ling ZHOUAi ZHANGYi-jia CHENFei LUMing-yu
作者单位:大连外国语大学软件学院,辽宁大连116044;大连海事大学信息科学技术学院,辽宁大连116026山东工商学院计算机科学与技术学院,山东烟台264005大连海事大学信息科学技术学院,辽宁大连116026
刊名:电子学报 ISTICEIPKU
Journal:ActaElectronicaSinica
年,卷(期):2023, 51(3)
分类号:TP391
关键词:关系抽取 临床文本 神经张量网络 分段注意力机制 样本不平衡
机标分类号:TP391O413R-056
在线出版日期:2023年5月6日
基金项目:国家自然科学基金,国家自然科学基金基于双路分段注意力神经张量网络的临床文本关系抽取[
期刊论文] 电子学报--2023, 51(3)隗昊 唐焕玲 周爱 张益嘉 陈飞 鲁明羽目前,生物医学领域的关系提取工作已经取得了长足的发展,但是在面对句式复杂的临床医学文本时,由于存在大量长句以及句中实体对的高密度分布,限制了当前关系抽取模型性能的进一步提升.本文提出了一种基于张量权重矩阵的...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
基于双路分段注意力神经张量网络的临床文本关系抽取 Clinical Relation Extraction via Dual Piecewise Attention Neural Tensor Network
基于双路分段注意力神经张量网络的临床文本关系抽取.pdf
- 文件大小:
- 2.18 MB
- 下载次数:
- 60
-
高速下载
|