文档名:基于历时语料库的在线词典编纂系统设计
语料库语言学是借助大规模语料库对语言现象进行发现、挖掘的研究学科,目前已经存在很多在线语料库辅助语言学家的研究.该文提供了一个按时间分片进行管理的语料库,并基于它提出了一个由社区维护的在线词典编纂系统,该系统将语料库查询结果动态结合在了被编辑的词条中.该文还介绍了一个多义词词义发现和层次化聚类算法,用以自动生成一个默认的词条框架.该文将概述词典编纂系统的总体情况,重点介绍了系统的设计和使用方法.
作者:吴先胡俊峰
作者单位:北京大学信息科学技术学院,北京100871;北京大学计算语言学教育部重点实验室,北京10087
母体文献:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会论文集
会议名称:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会
会议时间:2019年10月18日
会议地点:昆明
主办单位:中国中文信息学会
语种:chi
分类号:
关键词:词典编纂 历时语料库 时间分片 社区维护
在线出版日期:2021年8月24日
基金项目:
相似文献
相关博文
- 文件大小:
- 805.29 KB
- 下载次数:
- 60
-
高速下载
|
|