本文介绍了在流处理器上对典型矩阵程序Jacobi和GEMM进行长流分段技术的研究。通过将计算任务划分为多个长流,有效提高了并行效率和资源利用率。该技术针对流处理器的特性,优化了数据访问和指令调度,为高性能计算提供了新的思路。
文档为pdf格式,0.66MB,总共5页。
举报