返回列表 发布新帖

向量模型和多源词汇分类体系相结合的词语相似性计算

17 0
admin 发表于 2024-12-11 19:32 | 查看全部 阅读模式

文档名:向量模型和多源词汇分类体系相结合的词语相似性计算
现有的词语语义相似性计算主要包括基于向量模型以及基于词汇分类体系两类方法,但这两类方法都存在自身的缺点.向量模型所依赖的文本共现中的上下文信息不等同于真正意义上的语义,而词汇分类体系方法则存在构建代价大,并且在一定程度上还不够完善的问题.本文提出一种向量模型与多源词汇分类体系相结合的词语相似性计算方法,采用多源词汇分类体系的近义词关系以及向量模型得到的词向量,计算得到词语的向量表达,并探索了不同类型词汇分类体系提供的知识的选用和融合问题,弥补了单一词向量和单一词汇分类体系在词语相似性计算中的缺点.本文采用了NLPCC-ICCPOL2016词语相似度评测比赛中的PKU500数据集进行评测.在该数据集上,本文的方法取得了0.618的斯皮尔曼等级相关系数,比NLPCC-ICCPOL2016词语相似度评测比赛第一名的方法的结果提高了19.3%.
作者:梁泳诗黄沛杰岑洪杰唐杰聪王俊东
作者单位:华南农业大学数学与信息学院,广东广州510642
母体文献:第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会论文集
会议名称:第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会  
会议时间:2017年10月13日
会议地点:南京
主办单位:中国中文信息学会
语种:chi
分类号:
关键词:词语相似性  向量模型  词汇分类体系  组合方法  多源融合
在线出版日期:2020年7月21日
基金项目:
相似文献
相关博文
2024-12-11 19:32 上传
文件大小:
509.3 KB
下载次数:
60
高速下载
【温馨提示】 您好!以下是下载说明,请您仔细阅读:
1、推荐使用360安全浏览器访问本站,选择您所需的PDF文档,点击页面下方“本地下载”按钮。
2、耐心等待两秒钟,系统将自动开始下载,本站文件均为高速下载。
3、下载完成后,请查看您浏览器的下载文件夹,找到对应的PDF文件。
4、使用PDF阅读器打开文档,开始阅读学习。
5、使用过程中遇到问题,请联系QQ客服。

本站提供的所有PDF文档、软件、资料等均为网友上传或网络收集,仅供学习和研究使用,不得用于任何商业用途。
本站尊重知识产权,若本站内容侵犯了您的权益,请及时通知我们,我们将尽快予以删除。
  • 手机访问
    微信扫一扫
  • 联系QQ客服
    QQ扫一扫
2022-2025 新资汇 - 参考资料免费下载网站 最近更新浙ICP备2024084428号-1
关灯 返回顶部
快速回复 返回顶部 返回列表