基于改进YOLO6D的单目位姿估计算法研究

查看全部 · 2024-12-14 11:49

文档名：基于改进YOLO6D的单目位姿估计算法研究
摘要：针对当前基于单目RGB图像的杂乱场景中低纹理物体6D位姿估计算法精度不高、实时性不强、模型复杂等问题,提出了一种基于改进YOLO6D的物体位姿估计算法.用纯卷积神经网络ConvNeXt替换原算法的主干网络DarkNet-19,将网络输出经过空间金字塔池化(SPP)处理后上采样,与低层特征图拼接实现特征融合,以提高网络的特征提取能力和多尺度能力.基于FocalLoss改进损失函数以提升网络的学习能力.根据物体的先验尺寸信息和几何特征,推导出更多的2D-3D点对以提高透视投影变换PnP算法的解算精度.在LINEMOD数据集上进行了实验,实验结果表明:以2D重投影5像素阈值为指标,本文算法在12个实验对象上的平均精度达到了95.60％,相较原算法提升了8.14个百分点,耗时约为60ms,性能显著提升.

Abstract：Aimingattheproblemsoflowprecision,weakreal-timeperformanceandcomplexmodelsof6DposeestimationalgorithmoflowtextureobjectsinclutteredscenesbasedonmonocularRGBimages,aposeestimationalgorithmbasedonimprovedYOLO6Disproposed.ThebackbonenetworksofDarkNet-19algorithmisreplacedbyConvNeXt,apureconvolutionalneuralnetwork(CNN).Theoutputofthenetworkisup-sampledafterspatialpyramidpooling(SPP)processing.Then,theresultsarejointedwiththelow-levelfeaturemapstoachievefeaturefusiontoimprove,thefeatureextractioncapabilityandmulti-scalecapabilityofthenetwork.LossfunctionisimprovedbasedonFocalLosstoimprovelearningabilityofnetwork.Accordingtothepriorsizeinformationandgeometricfeaturesoftheobject,more2D-3DpointpairsarederivedtoimprovethecalculationprecisionoftheperspectiveprojectiontransformationPnP(perspective-n-point)algorithm.ExperimentsarecarriedoutontheLINEMODdataset,andtheexperimentalresultsshowthat,takingthe5-pixelthresholdof2Dreprojectionastheindex,theaverageprecisionoftheproposedalgorithmon12experimentalobjectsreaches95.60％,whichis8.14percentagepointshigherthanthatoftheoriginalalgorithm.Thetimeconsumingisabout60msandtheperformanceissignificantlyimproved.

作者：潘江  任德均  史雨杭  王淋楠Author：PANJiang  RENDejun  SHIYuhang  WANGLinnan
作者单位：四川大学机械工程学院,四川成都610065
刊名：传感器与微系统
Journal：TransducerandMicrosystemTechnologies
年，卷(期)：2024, 43(1)
分类号：TP391.4
关键词：6D位姿估计  单目视觉  ConvNeXt  PnP算法
Keywords：6Dposeestimation  monocularvision  ConvNeXt  perspective-n-point(PnP)algorithm
机标分类号：
在线出版日期：2024年1月17日
基金项目：基于改进YOLO6D的单目位姿估计算法研究[
期刊论文]  传感器与微系统--2024, 43(1)潘江  任德均  史雨杭  王淋楠针对当前基于单目RGB图像的杂乱场景中低纹理物体6D位姿估计算法精度不高、实时性不强、模型复杂等问题,提出了一种基于改进YOLO6D的物体位姿估计算法.用纯卷积神经网络ConvNeXt替换原算法的主干网络DarkNet-19,将网络输出...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文

基于改进YOLO6D的单目位姿估计算法研究  Research on monocular pose estimation algorithm based on improved YOLO6D

基于改进YOLO6D的单目位姿估计算法研究.pdf

2024-12-14 11:49 上传

基于改进YOLO6D的单目位姿估计算法研究.pdf

文件大小:: 12.73 MB

下载次数:: 60

高速下载

基于改进YOLO6D的单目位姿估计算法研究

相关文档

能源电力

化工

建筑工程

机械

电子信息

医药

科学