文档名:基于FPGA的卷积神经网络反向加速设计与实现
摘要:卷积神经网络(CNN)计算量大,网络训练时间长,借助现场可编程门阵列(FPGA)良好的并行性,可加速其反向网络的参数训练过程,从而加快训练速度.首先,所设计的CNN反向加速网络具有良好的加速性能;然后,设计了CNN的FPGA硬件加速系统和一个加速计算模块,且用Kroneck乘积计算来减少CNN参数和时间复杂度;最后,进行Zedboard纯PS训练和使用反向网络PL加速器训练CNN的对比实验.实验结果表明:基于FPGACNN的反向加速性能是仅在纯CPU上进行神经网络加速的111.15倍.
作者:孙传猛 邓慧芳 王燕平 许瑞嘉 Author:SUNChuanmeng DENGHuifang WANGYanping XURuijia
作者单位:省部共建动态测试技术国家重点实验室,山西太原030051;中北大学电气与控制工程学院,山西太原030051省部共建动态测试技术国家重点实验室,山西太原030051;中山大学物理与天文学院,广东珠海510275
刊名:传感器与微系统 ISTICPKU
Journal:TransducerandMicrosystemTechnologies
年,卷(期):2023, 42(8)
分类号:TP331
关键词:反向加速 卷积神经网络 现场可编程门阵列 硬件加速 Kroneck乘积
Keywords:reverseacceleration convolutionalneuralnetwork(CNN) fieldprogrammablegatearray(FPGA) hardwareacceleration Kroneckproduct
机标分类号:TP311TN99TP273
在线出版日期:2023年8月25日
基金项目:山西省基础研究计划面上资助项目,山西省基础研究计划面上资助项目,山西省研究生创新项目基于FPGA的卷积神经网络反向加速设计与实现[
期刊论文] 传感器与微系统--2023, 42(8)孙传猛 邓慧芳 王燕平 许瑞嘉卷积神经网络(CNN)计算量大,网络训练时间长,借助现场可编程门阵列(FPGA)良好的并行性,可加速其反向网络的参数训练过程,从而加快训练速度.首先,所设计的CNN反向加速网络具有良好的加速性能;然后,设计了CNN的FPGA硬件加...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
基于FPGA的卷积神经网络反向加速设计与实现 Design and realization of FPGA-based reverse acceleration of CNN
基于FPGA的卷积神经网络反向加速设计与实现.pdf
- 文件大小:
- 10.32 MB
- 下载次数:
- 60
-
高速下载
|
|