文档名:中文基本复合名词短语语义关系体系及知识库构建
名词短语一直是中外语言学领域的重要研究对象,近年来在自然语言处理领域也受到了研究者的持续关注.英文方面,已建立了一定规模的名词短语语义关系知识库.但迄今为止,尚未建立相应或更大规模的描述名词短语语义关系的中文资源.本文借鉴国内外诸多学者对名词短语语义分类的研究成果,对大规模真实语料中的基本复合名词实例进行试标注与分析,建立了中文基本复合名词短语语义关系体系及相应句法语义知识库,该库能够为中文基本复合名词短语句法语义的研究提供基础数据资源.目前该库共含有18218条高频基本复合名词短语,每条短语均标注了语义关系、短语结构及是否指称实体等信息,每条短语包含的两个名词还分别标注了语义类信息.语义类信息基于北京大学《现代汉语语义词典》.基于该知识库,本文还做了基本复合名词短语句法语义的初步统计与分析.
作者:刘鹏远刘玉洁
作者单位:北京语言大学信息科学学院,北京100083
母体文献:第十七届全国计算语言学学术会议暨第六届基于自然标注大数据的自然语言处理国际学术研讨会(CCL2018)论文集
会议名称:第十七届全国计算语言学学术会议暨第六届基于自然标注大数据的自然语言处理国际学术研讨会(CCL2018)
会议时间:2018年10月19日
会议地点:长沙
主办单位:中国中文信息学会
语种:chi
分类号:
关键词:中文 基本复合名词短语 语义关系体系 知识库
在线出版日期:2021年9月13日
基金项目:
相似文献
相关博文
- 文件大小:
- 439.93 KB
- 下载次数:
- 60
-
高速下载
|