会议论文《面向主题爬取的多粒度URLs优先级计算方法》提出了一种用于主题爬取的URL优先级评估模型。该方法通过结合多个粒度特征,如页面内容相关性、链接结构和访问频率,提升爬虫对目标主题的聚焦能力。研究在第四届全国信息检索与内容安全学术会议上发表,为高效获取特定主题信息提供了新的技术思路。
文档为pdf格式,0.48MB,总共10页。
举报