文档名:大数据技术在Web日志挖掘中的应用研究
本文基于Hadoop平台,结合Web日志挖掘的特点,给出了一种基于大数据技术的Web日志挖掘系统的设计方案,同时结合网站拓扑结构图,修正了基于频度的用户偏爱路径衡量算法,剔除了Web页面放置和链接等因素对挖掘的影响.本文的最后进行了仿真实验,结果表明,改进后的算法更能反映用户的浏览意图,准确率高且趋于稳定,不会随着偏爱路径的增多以及网页数目的增多而导致准确率降低.
作者:马超
作者单位:中国移动辽宁公司信息技术中心110179
母体文献:辽宁省通信学会2017年通信网络与信息技术年会论文集
会议名称:辽宁省通信学会2017年通信网络与信息技术年会
会议时间:2017年8月1日
会议地点:沈阳
主办单位:辽宁省通信学会
语种:chi
分类号:TP3V21
关键词:互联网日志 数据挖掘 Hadoop平台 浏览偏爱路径
在线出版日期:2018年7月24日
基金项目:
相似文献
相关博文
- 文件大小:
- 1.68 MB
- 下载次数:
- 60
-
高速下载
|
|