会议论文《利用冗余进程实现MPI程序错误检测》探讨了在并行计算中如何通过引入冗余进程来提高MPI程序的容错能力。该文提出了一种基于冗余执行的错误检测方法,能够在不显著增加系统开销的情况下,有效识别和定位并行程序中的错误。研究对提高分布式系统的可靠性具有重要意义,适用于需要高稳定性的科学计算和大规模并行应用。
文档为pdf格式,0.26MB,总共4页。
举报