文档名:类不平衡对软件缺陷预测模型稳定性和预测性能的影响分析方法
摘要:本文提出一种类不平衡对软件缺陷预测模型稳定性和预测性能的影响分析方法.首先,使用欠采样方法将原数据集构造成一组不平衡率小于原数据集本身不平衡率的新数据集.其中,在构造数据集时使用固定种子,保证同一个数据集构造的同一个不平衡率的数据集中的数据相同,以减少每次运行结果的随机性.其次,以MCC值作为预测模型的性能评价指标,将每次产生的新数据集放入模型中的分类算法进行训练预测评价,获得当前数据集不同不平衡率下的MCC值,并提出稳定性评价指标.实验结果表明:与AUC相比,MCC更适合作为类不平衡情况下软件缺陷预测模型稳定性的评价指标;对于软件缺陷预测性能稳定性,代价敏感模型表现优于集成模型.
作者:张艳梅 植胜林 姜淑娟 袁冠 Author:ZHANGYan-mei ZHISheng-lin JIANGShu-juan YUANGuan
作者单位:中国矿业大学矿山数字化工程研究中心,江苏徐州221116;中国矿业大学计算机科学与技术学院,江苏徐州221116科华数据股份有限公司,广东深圳518055
刊名:电子学报 ISTICEIPKU
Journal:ActaElectronicaSinica
年,卷(期):2023, 51(8)
分类号:TP311
关键词:类不平衡 缺陷预测 稳定性 预测性能 评价指标
Keywords:classimbalance defectprediction stability predictionperformance evaluationindicator
机标分类号:TP391TU435TP181
在线出版日期:2023年11月23日
基金项目:类不平衡对软件缺陷预测模型稳定性和预测性能的影响分析方法[
期刊论文] 电子学报--2023, 51(8)张艳梅 植胜林 姜淑娟 袁冠本文提出一种类不平衡对软件缺陷预测模型稳定性和预测性能的影响分析方法.首先,使用欠采样方法将原数据集构造成一组不平衡率小于原数据集本身不平衡率的新数据集.其中,在构造数据集时使用固定种子,保证同一个数据集构...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
类不平衡对软件缺陷预测模型稳定性和预测性能的影响分析方法 Influence Analysis Method of Class Imbalance on Software Defect Prediction Model Stability and Prediction Performance
类不平衡对软件缺陷预测模型稳定性和预测性能的影响分析方法.pdf
- 文件大小:
- 1.96 MB
- 下载次数:
- 60
-
高速下载
|
|