文档名:面向医疗文本的实体及关系标注平台的构建及应用
医疗文本数据是推行智慧医疗的重要数据基础,而医疗文本为半结构或非结构化数据,难以对其直接进行应用.对医疗文本中所包含的实体及实体关系进行标注是文本结构化的重要手段,也是命名实体识别、关系自动抽取研究的基础.传统的人工标注方法费力费时,已难以适应大数据发展的需求.该文以构建中文医学知识图谱的任务为驱动,构建了半自动化实体及关系标注平台,该平台融合多种算法,能够实现文本预标注、进度控制、质量把控和数据分析等多种功能.利用该平台,进行了医学知识图谱中实体和关系标注,结果表明该平台能够在文本资源建设中控制标注过程,保证标注质量,提高标注效率.同时该平台也应用于其他文本标注任务,表明该平台具有较好的任务移植性.
作者:张坤丽赵旭关同峰尚柏羽李羽蒙昝红英
作者单位:郑州大学信息工程学院,河南郑州450001;鹏城实验室,广东深圳518055
母体文献:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会论文集
会议名称:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会
会议时间:2019年10月18日
会议地点:昆明
主办单位:中国中文信息学会
语种:chi
分类号:TP3TP1
关键词:医疗文本 实体标注平台 关系标注平台
在线出版日期:2021年8月24日
基金项目:
相似文献
相关博文
- 文件大小:
- 779.25 KB
- 下载次数:
- 60
-
高速下载
|
|