返回列表 发布新帖

基于FPGA的Skynet网络结构优化及高时效实现

16 0
admin 发表于 2024-12-14 12:47 | 查看全部 阅读模式

文档名:基于FPGA的Skynet网络结构优化及高时效实现
摘要:基于卷积神经网络(ConvolutionalNeuralNetwork,CNN)的目标检测算法有着鲁棒性强、准确度高等优点,被广泛用于计算机视觉任务领域.然而,CNN参数量大、计算量大的特性使得其难以在边缘计算平台实时实现,为此,本文针对目标检测网络Skynet进行结构优化,并基于高效的层内并行流水的加速架构,在现场可编程门阵列(FieldProgrammableGateArray,FPGA)上对其进行实时实现.该方法对Skynet进行剪枝,合并其卷积层与归一化层,利用(Kullback-Leibler,KL)相对熵及极大值量化方法对权重及特征图进行8bit定点量化,同时将偏置参数及缩放系数定点化,并合并激活操作与饱和截断操作,在减少存储量和计算量的同时,加快前向推理速度.此外,以滑窗操作为基础,采用通道及像素并行计算,设计深度可分离卷积的流水策略,将串行的前向推理结构优化为并行流水的结构,极大减少了前向推理的时间.实验表明,在UA-DETRAC数据集上,本文实现的系统识别精度为0.752,在160×160的图像分辨率上,速度达到115FPS,与CPU相比,提速11倍,达到了GPU的75%,功耗分别为CPU的10.6%,GPU的7.43%,而且,与同类基于FPGA的CNN加速工作相比,本文方法在速度和能效比上均表现最优.

作者:唐维伟  钟胜  卢金仪  颜露新  谭富中  邹旭  徐文辉Author:TANGWei-wei  ZHONGSheng  LUJin-yi  YANLu-xin  TANFu-zhong  ZHOUXu  XUWen-hui
作者单位:华中科技大学人工智能与自动化学院,湖北武汉430074;华中科技大学多谱信息处理技术国家级重点实验室,湖北武汉430074
刊名:电子学报 ISTICEIPKU
Journal:ActaElectronicaSinica
年,卷(期):2023, 51(2)
分类号:TN47
关键词:目标检测网络  定点量化  现场可编程门阵列  流水计算  skynet  
机标分类号:TP391.41TN915.02TP183
在线出版日期:2023年5月8日
基金项目:国家自然科学基金,国防基础科研计划基于FPGA的Skynet网络结构优化及高时效实现[
期刊论文]  电子学报--2023, 51(2)唐维伟  钟胜  卢金仪  颜露新  谭富中  邹旭  徐文辉基于卷积神经网络(ConvolutionalNeuralNetwork,CNN)的目标检测算法有着鲁棒性强、准确度高等优点,被广泛用于计算机视觉任务领域.然而,CNN参数量大、计算量大的特性使得其难以在边缘计算平台实时实现,为此,本文针对目标...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文

        基于FPGA的Skynet网络结构优化及高时效实现  Network Structure Optimization and High-Efficiency Implementation of Skynet Based on FPGA

基于FPGA的Skynet网络结构优化及高时效实现.pdf
2024-12-14 12:47 上传
文件大小:
3.12 MB
下载次数:
60
高速下载
【温馨提示】 您好!以下是下载说明,请您仔细阅读:
1、推荐使用360安全浏览器访问本站,选择您所需的PDF文档,点击页面下方“本地下载”按钮。
2、耐心等待两秒钟,系统将自动开始下载,本站文件均为高速下载。
3、下载完成后,请查看您浏览器的下载文件夹,找到对应的PDF文件。
4、使用PDF阅读器打开文档,开始阅读学习。
5、使用过程中遇到问题,请联系QQ客服。

本站提供的所有PDF文档、软件、资料等均为网友上传或网络收集,仅供学习和研究使用,不得用于任何商业用途。
本站尊重知识产权,若本站内容侵犯了您的权益,请及时通知我们,我们将尽快予以删除。
  • 手机访问
    微信扫一扫
  • 联系QQ客服
    QQ扫一扫
2022-2025 新资汇 - 参考资料免费下载网站 最近更新浙ICP备2024084428号-1
关灯 返回顶部
快速回复 返回顶部 返回列表