文档名:硬盘故障预测模型在大型数据中心环境下的验证
随着互联网的发展、存储规模的骤增,大型数据中心硬盘频繁损坏导致的数据丢失给企业带来的损失已成为不可忽视的重大问题.以往基于硬盘SMART(self-monitoring,analysisandreportingtechnology)属性建立的包括应用统计学和机器学习等方法在内的各种硬盘故障预测模型,虽然取得了较好的效果,但其数据采集及处理等方面均存在不足之处.基于某真实的互联网大型数据中心环境,提取SMART属性数据,并提出了一种基于神经网络权值矩阵的方法,结合RankSum秩和检验、RAT反向安排测试、Z-Score评分3种无参统计学方法,对属性进行选择,应用CART决策树及BP神经网络2种机器学习方法,建立硬盘故障预测模型.实验表明描述的2种硬盘故障预测模型均具有很好的性能,这是机器学习算法在实际应用场景下很好的实践.此外,通过实验以及对实验的分析和解释,得出一些有益的结论,这为下一步的研究工作奠定了基础.
作者:贾宇晗 李静 贾润莹 李忠伟 王刚 刘晓光 肖康[5]
作者单位:南开大学计算机与控制工程学院天津300071;北京奇虎科技有限公司北京100016南开大学计算机与控制工程学院天津300071南开大学软件学院天津300071;北京奇虎科技有限公司北京100016南开大学软件学院天津300071北京奇虎科技有限公司北京100016
母体文献:NCIS2015第21届全国信息存储技术学术会议论文集
会议名称:NCIS2015第21届全国信息存储技术学术会议
会议时间:2015年9月17日
会议地点:长沙
主办单位:中国计算机学会
语种:chi
分类号:
关键词:数据中心 硬盘故障预测 神经网络权值矩阵 机器学习
在线出版日期:2017年10月24日
基金项目:
相似文献
相关博文
- 文件大小:
- 518.62 KB
- 下载次数:
- 60
-
高速下载
|
|