返回列表 发布新帖

一种基于数据标准差的卷积神经网络量化方法

16 0
admin 发表于 2024-12-14 02:48 | 查看全部 阅读模式

文档名:一种基于数据标准差的卷积神经网络量化方法
摘要:当前卷积神经网络模型存在规模过大且运算复杂的问题,难以应用部署在资源受限的计算平台.针对此问题,本文基于数据标准差提出了一种适合部署在现场可编程门阵列(FieldProgrammableGateArray,FPGA)上的对数量化方法.首先,依据FPGA的特性提出对数量化方法,将32bit浮点乘法运算转换为整数乘法及移位运算,提高了运算效率.然后通过研究数据分布特点,提出基于数据标准差的输入量化及权值混合bit量化方法,能够有效减少量化损失.通过对RepVGG、EfficientNet等网络进行效率与精度对比实验,8bit量化使得大型神经网络精度仅下降1%左右;输入量化为8bit,权重量化为10bit场景下,模型精度损失小于0.2%,达到浮点模型几乎相同的准确率.实验表明,所提量化方法能够使得模型大小减少75%左右,在基本保持原有模型准确率的同时有效地降低功耗损失、提高运算效率.

作者:黄赟   张帆   郭威   陈立   羊光 Author:HUANGYun   ZHANGFan   GUOWei   CHENLi   YANGGuang
作者单位:信息工程大学,河南郑州450001国家数字交换系统工程技术研究中心,河南郑州450002河南省广播电视监测中心,河南郑州450002
刊名:电子学报 ISTICEIPKU
Journal:ActaElectronicaSinica
年,卷(期):2023, 51(3)
分类号:TP391
关键词:卷积神经网络  现场可编程门阵列  对数量化  数据标准差  混合bit  
机标分类号:TP391.41TP183U463.85
在线出版日期:2023年5月6日
基金项目:国家自然科学基金一种基于数据标准差的卷积神经网络量化方法[
期刊论文]  电子学报--2023, 51(3)黄赟  张帆  郭威  陈立  羊光当前卷积神经网络模型存在规模过大且运算复杂的问题,难以应用部署在资源受限的计算平台.针对此问题,本文基于数据标准差提出了一种适合部署在现场可编程门阵列(FieldProgrammableGateArray,FPGA)上的对数量化方法.首...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文

        一种基于数据标准差的卷积神经网络量化方法  A Quantification Method of Convolutional Neural Network Based on Data Standard Deviation

一种基于数据标准差的卷积神经网络量化方法.pdf
2024-12-14 02:48 上传
文件大小:
1.67 MB
下载次数:
60
高速下载
【温馨提示】 您好!以下是下载说明,请您仔细阅读:
1、推荐使用360安全浏览器访问本站,选择您所需的PDF文档,点击页面下方“本地下载”按钮。
2、耐心等待两秒钟,系统将自动开始下载,本站文件均为高速下载。
3、下载完成后,请查看您浏览器的下载文件夹,找到对应的PDF文件。
4、使用PDF阅读器打开文档,开始阅读学习。
5、使用过程中遇到问题,请联系QQ客服。

本站提供的所有PDF文档、软件、资料等均为网友上传或网络收集,仅供学习和研究使用,不得用于任何商业用途。
本站尊重知识产权,若本站内容侵犯了您的权益,请及时通知我们,我们将尽快予以删除。
  • 手机访问
    微信扫一扫
  • 联系QQ客服
    QQ扫一扫
2022-2025 新资汇 - 参考资料免费下载网站 最近更新浙ICP备2024084428号-1
关灯 返回顶部
快速回复 返回顶部 返回列表