文档名:引入外部词向量的文本信息网络表示学习
网络表示学习目的是学习网络节点的低维空间向量表示,以降低大规模或复杂网络存储、计算成本.文本信息网络,即节点包含丰富文本信息的网络,是日常生活中常见的网络形式.文本信息网络现有研究多基于网络自身信息建模.分布式词向量在自然语言处理任务中日渐普及,词向量作为语义特征空间的低维表示,能够在一定程度上衡量两个词之间的语义近似.将由外部任务无关语料预训练得到的词向量引入目标网络建模过程,可以利用外部语料语义约束丰富目标网络文本语义,因此本文提出基于外部词向量的网络表示模型NE-EWV(NetworkEmbeddingbasedonExternalWordVectors),从语义特征空间以及结构特征空间两个角度学习特征融合的网络表示.通过实验,在现实网络数据集中对模型有效性进行了验证.结果表明,在链接预测任务中的AUC指标,相比只考虑结构特征的模型提升7%到19%,相比考虑结构与文本特征的模型在大部分情况下有1%到12%提升;在节点分类任务中,与基线方法中性能最好的CANE性能相当.证明引入外部词向量作为外部知识能够有效提升网络表示能力.
作者:张潇鲲刘琰陈静
作者单位:数学工程与先进计算国家重点实验室郑州450000
母体文献:第六届中国计算机学会大数据学术会议论文集
会议名称:第六届中国计算机学会大数据学术会议
会议时间:2018年10月11日
会议地点:西安
主办单位:中国计算机学会
语种:chi
分类号:TP3TH1
关键词:文本信息 网络表示学习 自编码器 外部词向量
在线出版日期:2020年11月30日
基金项目:
相似文献
相关博文
- 文件大小:
- 358.59 KB
- 下载次数:
- 60
-
高速下载
|