文档名:基于最小哈希的网络单信道重复数据剔除算法
摘要:剔除重复数据是保证网络高效运行不可缺少的步骤,但该过程易受信号强度、网络装置、路由器性能等问题的干扰.为此,提出基于最小哈希的网络单信道重复数据剔除算法.首先利用哈希算法中的散列函数对网络单信道数据实行聚类处理,然后采用带有监督判别的投影算法对聚类后的数据进行降维处理,最后采用代数签名预估数据,保证数据之间的计算开销最小,再构造最小哈希树生成校验值,在更新去重标签的同时,通过双层剔除机制完全剔除单信道中的重复数据.实验结果表明,该算法的执行时间短,且计算和存储开销较小.
作者:邬剑飞 周路明 刘小强 Author:WUJianfei ZHOULuming LIUXiaoqiang
作者单位:华中科技大学同济医学院附属肿瘤医院,武汉430079河南科技大学应用工程学院,河南三门峡472000
刊名:吉林大学学报(信息科学版) ISTIC
Journal:JournalofJilinUniversity(InformationScienceEdition)
年,卷(期):2023, 41(2)
分类号:TP391
关键词:散列函数 原始聚类中心 近邻局部图 约束目标函数 代数签名 哈希树 网络信道
机标分类号:TP393TN915.05O224
在线出版日期:2023年6月19日
基金项目:河南省教育厅重点科研基金资助项目基于最小哈希的网络单信道重复数据剔除算法[
期刊论文] 吉林大学学报(信息科学版)--2023, 41(2)邬剑飞 周路明 刘小强剔除重复数据是保证网络高效运行不可缺少的步骤,但该过程易受信号强度、网络装置、路由器性能等问题的干扰.为此,提出基于最小哈希的网络单信道重复数据剔除算法.首先利用哈希算法中的散列函数对网络单信道数据实行聚类处...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
基于最小哈希的网络单信道重复数据剔除算法 Duplicate Data Elimination of Network Single-Channel Based on Minimum Hash
基于最小哈希的网络单信道重复数据剔除算法.pdf
- 文件大小:
- 2.6 MB
- 下载次数:
- 60
-
高速下载
|