文档名:基于局部概念化词嵌入的微博检索查询扩展研究
由于微博文本篇幅较短、用语随意,传统信息检索技术在应用于微博检索任务的时候会面临严峻的“词表不匹配”问题,因而很难产生令人满意的结果.为了克服这个挑战,本研究探索利用局部概念化词嵌入来增强微博检索性能:在伪相关反馈框架下,提出一个基于k-近邻的查询扩展算法,利用局部概念化词嵌入生成扩展词语来扩展原始查询.在TREC微博检索任务官方数据集上的相关实验证明本研究所提出的算法性能优于其他基线算法.
作者:王亚珅黄河燕
作者单位:北京理工大学计算机学院北京市海量语言信息处理与云计算应用工程技术研究中心北京市海淀区100081
母体文献:智能时代的创新、融合与发展——2018全国博士后学术交流会论文集
会议名称:智能时代的创新、融合与发展——2018全国博士后学术交流会
会议时间:2018年9月15日
会议地点:北京
主办单位:中国博士后科学基金会,全国博士后管理委员会办公室
语种:chi
分类号:TP3G35
关键词:信息检索 局部概念化词嵌入 查询扩展算法 k-近邻算法
在线出版日期:2021年12月15日
基金项目:
相似文献
相关博文
- 文件大小:
- 262.86 KB
- 下载次数:
- 60
-
高速下载
|
|