文档名:面向高中化学试题的命名实体识别
摘要:中文化学命名实体结构没有严格的构词规律可循,识别实体中包含字母、数字、特殊符号等多种形式,传统字向量模型无法有效区分化学术语中存在的嵌套实体和歧义实体.为此,将高中化学试题资源的命名实体划分为物质、性质、量值、实验四大类,并构建化学学科实体词汇表辅助人工标注.通过ALBERT预训练模型提取文本特征并生成动态字向量,结合BILSTM-CRF(BidirectionalLongShort-TermMemorywithConditionalRandomField)模型对高中化学试题文本进行命名实体识别.实验结果表明,该模型的精确率、召回率和F1值分别达到了95.24%、95.26%、95.25%.
作者:张璐 马子睿 王岳 马翠玲 Author:ZHANGLu MAZirui WANGYue MACuiling
作者单位:北方民族大学计算机科学与工程学院,银川750021宁夏大学信息工程学院,银川750021吉林大学计算机科学与技术学院,长春130012石嘴山市第三中学,宁夏石嘴山753000
刊名:吉林大学学报(信息科学版) ISTIC
Journal:JournalofJilinUniversity(InformationScienceEdition)
年,卷(期):2023, 41(4)
分类号:TP391.1
关键词:命名实体识别 ALBERT预训练模型 双向长短期记忆网络 条件随机场 化学资源文本
Keywords:namedentityrecognition alitebert(ALBERT)pre-trainingmodel bidirectionallongshort-termmemorynetwork crf chemicalresourcestext
机标分类号:TP391TN913R-056
在线出版日期:2023年9月26日
基金项目:全国教育信息技术研究课题基金资助项目面向高中化学试题的命名实体识别[
期刊论文] 吉林大学学报(信息科学版)--2023, 41(4)张璐 马子睿 王岳 马翠玲中文化学命名实体结构没有严格的构词规律可循,识别实体中包含字母、数字、特殊符号等多种形式,传统字向量模型无法有效区分化学术语中存在的嵌套实体和歧义实体.为此,将高中化学试题资源的命名实体划分为物质、性质、量值、...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
面向高中化学试题的命名实体识别 Named Entity Recognition for High School Chemistry Exam Papers
面向高中化学试题的命名实体识别.pdf
- 文件大小:
- 5.4 MB
- 下载次数:
- 60
-
高速下载
|