返回列表 发布新帖

基于三值向二值演化的BNN剪枝方法

18 0
admin 发表于 2024-12-14 12:04 | 查看全部 阅读模式

文档名:基于三值向二值演化的BNN剪枝方法
摘要:针对目前BNN(BinarizedNeuralNetwork)剪枝方法存在剪枝比例低、识别准确率显著下降以及依赖训练后微调的问题,提出了一种基于三值向二值演化的滤波器级的BNN剪枝方法,命名为ETB(EvolutionfromTernarytoBinary).ETB是基于学习的,通过在BNN的量化函数中引入可训练的量化阈值,使权重和激活值逐渐从三值演化到二值或零,旨在使网络在训练期间自动识别不重要的结构.此外,一个剪枝率调节算法也被设计用于调控网络的剪枝率.训练后,全零滤波器和对应的输出通道可被直接裁剪而获得精简的BNN,无需微调.为证明提出方法的可行性和其提升BNN推理效率而不牺牲准确率的潜力,在CIFAR-10上进行实验:在CIFAR-10数据集上,ETB对VGG-Small模型进行了46.3%的剪枝,模型大小压缩至0.34MByte,准确率为89.97%,并在ResNet-18模型上进行了30.01%的剪枝,模型大小压缩至1.33MByte,准确率为90.79%.在准确率和参数量方面,对比一些现有的BNN剪枝方法,ETB具有一定的优势.

Abstract:BNNs(BinarizedNeuralNetworks)arepopularduetotheirextremelylowmemoryrequirements.WhileBNNscanbefurthercompressedthroughpruningtechniques,existingBNNpruningmethodssufferfromlowpruningratios,significantaccuracydegradation,andreliancedependingonfine-tuningaftertraining.Toovercometheselimitations,afilter-levelBNNpruningmethodisproposedbasedonevolutionfromternarytobinary,namedETB(EvolutionfromTerrytoBinary).ETBislearning-based,andbyintroducingtrainablequantizationthresholdsintothequantizationfunctionofBNNs,itmakestheweightsandactivationvaluesgraduallyevolvefromternarytobinaryorzero,aimingtoenablethenetworktoautomaticallyidentifyunimportantstructuresduringtraining.Andapruningratioadjustmentalgorithmisalsodesignedtoregulatethepruningrateofthenetwork.Aftertraining,allzerofiltersandcorrespondingoutputchannelscanbedirectlyprunedtoobtainasimplifiedBNNwithoutfine-tuning.TodemonstratethefeasibilityoftheproposedmethodandthepotentialforimprovingBNNinferenceefficiencywithoutsacrificingaccuracy,experimentsareconductedonCIFAR-10.ETBisprunedtheVGG-Smallmodelby46.3%,compressingthemodelsizeto0.34MB,withanaccuracyof89.97%.TheResNet-18modelisalsoprunedby30.01%,compressingthemodelsizeto1.33MB,withanaccuracyof90.79%.ComparedwithsomeexistingBNNpruningmethodsintermsofaccuracyandparameterquantity,ETBhascertainadvantages.

作者:徐图  张博  李镇  陈怡凝  申人升  熊波涛  常玉春Author:XUTu  ZHANGBo  LIZhen  CHENYining  SHENRensheng  XIONGBotao  CHANGYuchun
作者单位:大连理工大学微电子学院,辽宁大连116000
刊名:吉林大学学报(信息科学版) ISTIC
Journal:JournalofJilinUniversity(InformationScienceEdition)
年,卷(期):2024, 42(2)
分类号:TP399
关键词:二值神经网络  剪枝  可训练门限  演化  
Keywords:binarizedneuralnetwork  pruning  trainablethreshold  evolution  
机标分类号:TP391TN713F27
在线出版日期:2024年5月27日
基金项目:大连市科学技术局基金资助项目,产业基础再造,制造业高质量发展专项基金资助项目,电子元器件实验室可靠性物理与应用技术科学技术基金资助项目基于三值向二值演化的BNN剪枝方法[
期刊论文]  吉林大学学报(信息科学版)--2024, 42(2)徐图  张博  李镇  陈怡凝  申人升  熊波涛  常玉春针对目前BNN(BinarizedNeuralNetwork)剪枝方法存在剪枝比例低、识别准确率显著下降以及依赖训练后微调的问题,提出了一种基于三值向二值演化的滤波器级的BNN剪枝方法,命名为ETB(EvolutionfromTernarytoBinary).ET...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文

        基于三值向二值演化的BNN剪枝方法  BNN Pruning Method Based on Evolution from Ternary to Binary

基于三值向二值演化的BNN剪枝方法.pdf
2024-12-14 12:04 上传
文件大小:
2.49 MB
下载次数:
60
高速下载
【温馨提示】 您好!以下是下载说明,请您仔细阅读:
1、推荐使用360安全浏览器访问本站,选择您所需的PDF文档,点击页面下方“本地下载”按钮。
2、耐心等待两秒钟,系统将自动开始下载,本站文件均为高速下载。
3、下载完成后,请查看您浏览器的下载文件夹,找到对应的PDF文件。
4、使用PDF阅读器打开文档,开始阅读学习。
5、使用过程中遇到问题,请联系QQ客服。

本站提供的所有PDF文档、软件、资料等均为网友上传或网络收集,仅供学习和研究使用,不得用于任何商业用途。
本站尊重知识产权,若本站内容侵犯了您的权益,请及时通知我们,我们将尽快予以删除。
  • 手机访问
    微信扫一扫
  • 联系QQ客服
    QQ扫一扫
2022-2025 新资汇 - 参考资料免费下载网站 最近更新浙ICP备2024084428号-1
关灯 返回顶部
快速回复 返回顶部 返回列表