该论文发表于2008年中国计算机学会体系结构专委会学术年会(ACA08),主要研究大规模资源管理系统中作业自动容错管理技术。文章提出了一种高效的容错机制,能够在系统出现故障时自动恢复作业执行,提高系统的可靠性和资源利用率。通过实验验证,该方法在降低任务失败率和提升系统稳定性方面表现出色,为大规模计算环境下的作业管理提供了重要参考。
文档为pdf格式,0.42MB,总共5页。
举报