基于记录相似度估计的高效重复记录检测算法 - 2009中国计算机大会.pdf

9 0
2026-1-11 16:02 | 查看全部 阅读模式

会议论文《基于记录相似度估计的高效重复记录检测算法 - 2009中国计算机大会》提出了一种高效的重复记录检测方法。该算法通过计算记录之间的相似度,快速识别重复数据,提高了数据清洗的效率。研究针对大规模数据环境下的重复记录问题,优化了传统方法的性能瓶颈,具有较强的实用性与推广价值。

文档为pdf格式,0.61MB,总共14页。

基于记录相似度估计的高效重复记录检测算法 - 2009中国计算机大会
文件大小:
624.64 KB
高速下载
2026 资料下载 联系邮件:1991591830#qq.com 浙ICP备2024084428号-1