文档名:基于大规模语料库的现代汉语动宾搭配知识库构建
汉语缺乏词形变化,语法信息需通过词语搭配关系获得,且在语言生活中词语通常在搭配中发挥交际作用.因此无论是在语言学本体,还是在自然语言处理的各项任务中,词语搭配知识都尤为重要.各种搭配中,动宾搭配能够反映句子轮廓,并在数量和多样性方面具有优势地位.故本文聚焦于构建现代汉语动宾搭配知识库,以期为自然语言处理提供基础知识,同时也为语言本体研究、语言教学等提供大量实例.本文首先从语言本体的角度出发,总结了动宾搭配的知识体系,并根据该体系制定相应形式化检索式140个,从BCC语料库中抽取动宾搭配知识,并对抽取结果进行了初步消歧,最终获得动宾搭配300万对,形成动宾搭配知识库.
作者:王贵荣 饶高琦 荀恩东
作者单位:北京语言大学对外汉语研究中心,北京,10083;北京语言大学语言信息处理研究所,北京,10083北京语言大学对外汉语研究中心,北京,10083北京语言大学语言信息处理研究所,北京,10083
母体文献:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会论文集
会议名称:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会
会议时间:2019年10月18日
会议地点:昆明
主办单位:中国中文信息学会
语种:chi
分类号:H08TP3
关键词:现代汉语 动宾搭配 知识库 知识抽取
在线出版日期:2021年8月24日
基金项目:
相似文献
相关博文
- 文件大小:
- 532.55 KB
- 下载次数:
- 60
-
高速下载
|
|