文档名:基于改进YOLO6D的单目位姿估计算法研究
摘要:针对当前基于单目RGB图像的杂乱场景中低纹理物体6D位姿估计算法精度不高、实时性不强、模型复杂等问题,提出了一种基于改进YOLO6D的物体位姿估计算法.用纯卷积神经网络ConvNeXt替换原算法的主干网络DarkNet-19,将网络输出经过空间金字塔池化(SPP)处理后上采样,与低层特征图拼接实现特征融合,以提高网络的特征提取能力和多尺度能力.基于FocalLoss改进损失函数以提升网络的学习能力.根据物体的先验尺寸信息和几何特征,推导出更多的2D-3D点对以提高透视投影变换PnP算法的解算精度.在LINEMOD数据集上进行了实验,实验结果表明:以2D重投影5像素阈值为指标,本文算法在12个实验对象上的平均精度达到了95.60%,相较原算法提升了8.14个百分点,耗时约为60ms,性能显著提升.
Abstract:Aimingattheproblemsoflowprecision,weakreal-timeperformanceandcomplexmodelsof6DposeestimationalgorithmoflowtextureobjectsinclutteredscenesbasedonmonocularRGBimages,aposeestimationalgorithmbasedonimprovedYOLO6Disproposed.ThebackbonenetworksofDarkNet-19algorithmisreplacedbyConvNeXt,apureconvolutionalneuralnetwork(CNN).Theoutputofthenetworkisup-sampledafterspatialpyramidpooling(SPP)processing.Then,theresultsarejointedwiththelow-levelfeaturemapstoachievefeaturefusiontoimprove,thefeatureextractioncapabilityandmulti-scalecapabilityofthenetwork.LossfunctionisimprovedbasedonFocalLosstoimprovelearningabilityofnetwork.Accordingtothepriorsizeinformationandgeometricfeaturesoftheobject,more2D-3DpointpairsarederivedtoimprovethecalculationprecisionoftheperspectiveprojectiontransformationPnP(perspective-n-point)algorithm.ExperimentsarecarriedoutontheLINEMODdataset,andtheexperimentalresultsshowthat,takingthe5-pixelthresholdof2Dreprojectionastheindex,theaverageprecisionoftheproposedalgorithmon12experimentalobjectsreaches95.60%,whichis8.14percentagepointshigherthanthatoftheoriginalalgorithm.Thetimeconsumingisabout60msandtheperformanceissignificantlyimproved.
作者:潘江 任德均 史雨杭 王淋楠Author:PANJiang RENDejun SHIYuhang WANGLinnan
作者单位:四川大学机械工程学院,四川成都610065
刊名:传感器与微系统
Journal:TransducerandMicrosystemTechnologies
年,卷(期):2024, 43(1)
分类号:TP391.4
关键词:6D位姿估计 单目视觉 ConvNeXt PnP算法
Keywords:6Dposeestimation monocularvision ConvNeXt perspective-n-point(PnP)algorithm
机标分类号:
在线出版日期:2024年1月17日
基金项目:基于改进YOLO6D的单目位姿估计算法研究[
期刊论文] 传感器与微系统--2024, 43(1)潘江 任德均 史雨杭 王淋楠针对当前基于单目RGB图像的杂乱场景中低纹理物体6D位姿估计算法精度不高、实时性不强、模型复杂等问题,提出了一种基于改进YOLO6D的物体位姿估计算法.用纯卷积神经网络ConvNeXt替换原算法的主干网络DarkNet-19,将网络输出...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
基于改进YOLO6D的单目位姿估计算法研究 Research on monocular pose estimation algorithm based on improved YOLO6D
基于改进YOLO6D的单目位姿估计算法研究.pdf
- 文件大小:
- 12.73 MB
- 下载次数:
- 60
-
高速下载
|
|