文档名:基于主动学习的图像分类技术现状与未来
摘要:图像分类作为计算机视觉领域中的重要研究方向之一,应用领域非常广泛.基于深度学习的图像分类技术取得的成功,依赖大量的已标注数据,然而数据的标注成本往往是昂贵的.主动学习作为一种机器学习方法,旨在以尽可能少的高质量标注数据达到期望的模型性能,缓解监督学习任务中存在的标注成本高、标注信息难以大量获取的问题.主动学习图像分类算法根据样本选择策略,从未标记样本数据集合中选择出信息量丰富,对分类模型训练贡献更高的样本进行标注,以更新已标注训练数据池,如此循环直至满足给定的停止条件或模型标注预算耗尽.本文对近年来提出的主动学习图像分类算法进行了详细综述,并根据所用样本数据处理及模型优化方案,将现有算法分为三类:基于数据增强的算法,包括利用图像增广来扩充训练数据,或者根据图像特征插值后的差异性来选择高质量的训练数据;基于数据分布信息的算法,根据数据分布的特点来优化样本选择策略;优化模型预测的算法,包括优化获取和利用深度模型预测信息的方法、基于生成对抗网络和强化学习来优化预测模型的结构,以及基于Transformer结构提升模型预测性能,以确保模型预测结果的可靠性.此外,本文还对各类主动学习图像分类算法下的重要学术工作进行了实验对比,并对各算法在不同规模数据集上的性能和适应性进行了分析.另外,本文探讨了主动学习图像分类技术所面临的挑战,并指出了未来研究的方向.
Abstract:Asoneoftheimportantresearchdirectionsinthefieldofcomputervision,imageclassificationhasawiderangeofapplications.Thesuccessofdeeplearning-basedimageclassificationtechniquesdependsonalargeamountofan-notateddata.However,thecostofdataannotationisoftenexpensive.Activelearningisamachinelearningmethodthataimstoachievetheexpectedmodelperformancewithasfewhigh-qualityannotateddataaspossible,anditcanalleviatetheproblemofhighannotationcostsanddifficultyinobtainingalargeamountofannotationinformationinsupervisedlearningtasks.Basedonasampleselectionstrategy,activelearningforimageclassificationselectssamplesfromtheunlabeleddata-setwhichareinformativeandthuscontributemoretothetrainingoftheclassificationmodel,inordertoupdatetheannotat-edtrainingdatapool.Thisprocessisrepeateduntilagivenstoppingconditionismetorthemodelannotationbudgetisex-hausted.Thispaperprovidesacomprehensivesurveyoftheactivelearningimageclassificationalgorithmspublishedinre-centyears.Accordingthestrategiesappliedinsampledataprocessingandmodelstructureoptimization,existingalgo-rithmsareclassifiedintothreecategories:algorithmsbasedondataaugmentation,includingthoseusingimageaugmenta-tiontoexpandthescaleoftrainingdataorusingthedifferencesinimagefeatureinterpolationtoselecthigh-qualitytrainingdata;algorithmsbasedondatadistributioninformation,whichoptimizesampleselectionstrategiesbasedonthecharacteris-ticsofdatadistribution;algorithmsforoptimizingmodelpredictions,includingmethodsforoptimizingtheacquisitionandutilizationofdeepmodelpredictioninformation,improvingthepredictivemodelstructurethroughtheuseofgenerativead-versarialnetworksandreinforcementlearning,aswellasenhancingmodelpredictionperformancebasedontheTransform-erarchitecturetoensurethereliabilityofmodelpredictions.Inaddition,thispaperalsoconductsexperimentalcomparisonsonimportantacademicworkundervarioustypesofactivelearningimageclassificationalgorithms,andanalyzestheperfor-manceandadaptabilityofeachalgorithmondatasetsofdifferentscales.Furthermore,thispaperdiscussesthechallengesfacedbyactivelearningimageclassificationtechnologyandpointsoutfutureresearchdirections.
作者:刘颖 庞羽良 张伟东 李大湘 许志杰 Author:LIUYing PANGYu-liang ZHANGWei-dong LIDa-xiang XUZhi-jie
作者单位:西安邮电大学图像与信息处理研究所,陕西西安710121;无线通信与信息处理技术国际联合研究中心,陕西西安710121西安邮电大学图像与信息处理研究所,陕西西安710121无线通信与信息处理技术国际联合研究中心,陕西西安710121;英国哈德斯菲尔德大学,西约克郡HD13DH
刊名:电子学报 ISTICEIPKU
Journal:ActaElectronicaSinica
年,卷(期):2023, 51(10)
分类号:TP751TP391
关键词:图像分类 主动学习 数据增强 数据分布 模型预测信息 模型结构优化
Keywords:imageclassification activelearning dataaugmentation datadistribution modelpredictioninformation modelstructureoptimization
机标分类号:
在线出版日期:2024年1月17日
基金项目:基于主动学习的图像分类技术:现状与未来[
期刊论文] 电子学报--2023, 51(10)刘颖 庞羽良 张伟东 李大湘 许志杰图像分类作为计算机视觉领域中的重要研究方向之一,应用领域非常广泛.基于深度学习的图像分类技术取得的成功,依赖大量的已标注数据,然而数据的标注成本往往是昂贵的.主动学习作为一种机器学习方法,旨在以尽可能少的高质...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
基于主动学习的图像分类技术:现状与未来 Active Learning-Based Image Classification Technology:Status and Future
基于主动学习的图像分类技术:现状与未来.pdf
- 文件大小:
- 34.25 MB
- 下载次数:
- 60
-
高速下载
|
|