本文提出一种改进的基于树路径匹配的网页结构相似度算法。该算法通过分析网页DOM树的路径信息,提升结构相似度计算的准确性。针对传统方法在处理复杂网页时的不足,作者引入优化的路径匹配策略,增强对不同结构页面的适应能力。实验结果表明,该方法在多个数据集上表现优于现有方法,具有较高的实用价值。
举报