文档名:嵌入拓扑特征的自然场景文本检测方法
摘要:传统的基于锚点框(anchorbox)实现的自然场景文本检测方法中,锚点框容易受到其他文本实例的干扰产生误判或精度降低,且文本实例包含强烈的拓扑特征但并未得到重视,导致在弯曲环形文本检测任务中表现不佳.针对这个问题提出了一种新颖的神经网络结构,引入图卷积神经网络的概念,充分考虑邻近锚点框之间的联系,并融入锚点框的拓扑特征辅助图神经网络的学习,提高整体网络的有效性.在两个公开的自然场景文本检测数据集上进行了消融实验,在公开数据集CTW1500中,本文提出的方法使模型在召回率、精确率、F分数这3个指标上分别提高了3.0%、1.9%以及2.5%,在公开数据集Totel-Text中这3个指标分别是2.2%、1.8%以及2.0%.此外,本文方法还与近年提出的其他文本检测算法进行了比较,实验结果证明本文提出的方法在复杂自然场景下文本检测效果优秀,所提出的模块有利于文本检测性能的提高.
Abstract:Intraditionalanchorbox-basedtextdetectionmethodsfornaturalscenes,anchorboxesarepronetointerferencefromothertextinstances,resultinginerroneousjudgmentsoraffectingaccuracy.Moreover,textinstancescontainstrongtopologicalfeatures,whichareusuallybeignored,resultinginpoorperformanceincurvedcirculartextdetectiontasks.Tosolvethisproblem,anovelneuralnetworkstructureisproposed,whichintroducestheconceptofgraphconvolutionalnetworksbyfullyconsideringtherelationshipbetweenadjacentanchorframes,andincorporatingthetopologicalcharacteristicsofanchorframestoassistthelearningofgraphneuralnetworks,improvingtheeffectivenessoftheoverallnetwork.Theablationexperimentswereconductedontwopubliclyavailablenaturalscenetextdetectiondatasets.IntheCTW1500dataset,theproposedmethodimprovedthemodelbyapproximately3.0%,1.9%,and2.5%intermsofrecall,accuracy,andF-score,respectively,andintheTotel-Textdataset,thethreevalueswereimprovedbyapproximately2.2%,1.8%,and2.0%,respectively.Inaddition,theproposedmethodhasalsobeencomparedwithothertextdetectionalgorithmsproposedinrecentyears.Experimentalresultsshowthattheproposedmethodperformswellfortextdetectionincomplexnaturalscenes,demonstratingthepromisingeffectivenessoftheproposedmoduleforimprovingtheperformanceoftextdetection.
作者:郑侠聪 程良伦 黄国恒 王敬超Author:ZhengXia-cong ChengLiang-lun HuangGuo-heng WangJing-chao
作者单位:广东工业大学计算机学院,广东广州510006
刊名:广东工业大学学报
Journal:JournalofGuangdongUniversityofTechnology
年,卷(期):2024, 41(3)
分类号:TP391
关键词:文本检测 自然场景 图神经网络 拓扑特征
Keywords:textdetection naturalscene graphconvolutionalnetworks(GCN) topologicalfeature
机标分类号:TP391.41TN911-34TP183
在线出版日期:2024年6月19日
基金项目:国家自然科学基金,国家自然科学基金,国家自然科学基金,国家自然科学基金,广东省信息物理融合系统重点实验室项目,佛山市重点领域科技攻关项目嵌入拓扑特征的自然场景文本检测方法[
期刊论文] 广东工业大学学报--2024, 41(3)郑侠聪 程良伦 黄国恒 王敬超传统的基于锚点框(anchorbox)实现的自然场景文本检测方法中,锚点框容易受到其他文本实例的干扰产生误判或精度降低,且文本实例包含强烈的拓扑特征但并未得到重视,导致在弯曲环形文本检测任务中表现不佳.针对这个问题提...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
嵌入拓扑特征的自然场景文本检测方法 Text Detection in Natural Scenes Embedded Topological Feature
嵌入拓扑特征的自然场景文本检测方法.pdf
- 文件大小:
- 1.49 MB
- 下载次数:
- 60
-
高速下载
|