文档名:基于自增强注意力机制的室内单图像分段平面三维重建
摘要:基于卷积神经网络(CNN)的分段平面三维重建已然成为室内场景建模研究的焦点之一.针对室内场景中,平面和非平面元素常常交织在一起,导致网络提取的平面特征中掺杂了非平面信息,从而影响了最终分割的精度;且室内场景中的平面存在尺度差异巨大的情况,带来了明显的类别不平衡,小尺度平面实例往往会失真的问题.提出了一种自增强注意力的多尺度特征融合三维分段平面重建网络,该网络能够自动学习场景中的平面特征,并有效地将不同尺度的特征信息融合,从而提升了平面实例分割的精度.同时,通过为平面实例中的每个像素分配不同的权重,特别是增加了对小尺度平面边缘像素的权重值,进一步增强了小尺度平面分割对象的通道表达.最终,采用平衡交叉熵损失和骰子损失构建了一种新的损失函数来训练模型,进一步提升了平面分割的精度.实验证明,该算法在平面召回率和分割准确度方面均取得了显著地提升,能够产生更为准确的室内三维分段平面重建模型.
Abstract:Thepiece-wise3Dreconstructionofindoorscenesusingconvolutionalneuralnetworks(CNN)hasbecomeoneofthehottopicsintheresearchofindoorscenemodeling.However,theintertwiningofplanarandnon-planarelementsoftenleadstothenetwork'sextractionofnon-planarinformationmixedwithplanarfeatures,therebyaffectingthefinalsegmentationaccuracy.Moreover,therearesignificantscaledifferencesintheplanespresentinindoorscenes,leadingtopronouncedclassimbalances,wheresmall-scaleplaneinstancesarepronetodistortion.Toaddressthesechallenges,thispaperproposedaself-enhancedattention-basedmulti-scalefeaturefusionnetworkfor3Dplanesegmentationreconstruction.Thisnetworkcanautomaticallylearnplanarfeaturesinthesceneandeffectivelyfusefeatureinformationfromdifferentscales,therebyenhancingtheaccuracyofplaneinstancesegmentation.Atthesametime,byassigningdifferentweightstoeachpixelintheplaneinstance,particularlyincreasingtheweightvaluesforsmall-scaleplaneedgepixels,thechannelrepresentationofsmall-scaleplanesegmentationobjectswasfurtherenhanced.Finally,anewlossfunctionwasconstructedusingbalancedcross-entropylossanddicelosstotrainthemodel,furtherimprovingtheaccuracyofplanesegmentation.Extensiveexperimentsdemonstratedthatthealgorithmproposedachievessignificantimprovementsinplanerecallrateandsegmentationaccuracy,resultinginmoreaccurateindoor3Dsegmentedplanereconstructionmodels.
作者:朱光辉 缪君 胡宏利 申基 杜荣华Author:ZHUGuanghui MIAOJun HUHongli SHENJi DURonghua
作者单位:南昌航空大学航空制造工程学院,江西南昌330063
刊名:图学学报 ISTICPKU
Journal:JournalofGraphics
年,卷(期):2024, 45(3)
分类号:TP183
关键词:深度学习 分段平面重建 多尺度融合 增强注意力 自注意力
Keywords:deeplearning segmentedplanereconstruction multi-scalefusion enhanceattention self-attention
机标分类号:TP391.41TP183TN912.34
在线出版日期:2024年6月19日
基金项目:基于自增强注意力机制的室内单图像分段平面三维重建[
期刊论文] 图学学报--2024, 45(3)朱光辉 缪君 胡宏利 申基 杜荣华基于卷积神经网络(CNN)的分段平面三维重建已然成为室内场景建模研究的焦点之一.针对室内场景中,平面和非平面元素常常交织在一起,导致网络提取的平面特征中掺杂了非平面信息,从而影响了最终分割的精度;且室内场景中的平...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
基于自增强注意力机制的室内单图像分段平面三维重建 3D piece-wise planar reconstruction from a single indoor image based on self-augmented-attention mechanism
基于自增强注意力机制的室内单图像分段平面三维重建.pdf
- 文件大小:
- 1.95 MB
- 下载次数:
- 60
-
高速下载
|