文档名:深度信号引导学习混合变换器的高性能无监督视频目标分割
摘要:现存的无监督视频目标分割方法通常使用光流作为运动线索来提升模型性能.然而,光流的估计常存在误差,这将导致双流网络易对噪声过拟合.为此,本文提出一种基于混合变换器的无监督视频目标分割算法,通过引入深度信号引导变换器高效融合不同模态数据,以学习更加鲁棒的特征表达,从而减轻模型对噪声的过拟合.首先,设计一个新颖的混合注意力模块来获得全局感受野并对不同模态的特征进行充分交互,以增强特征的全局语义信息来提升模型的抗干扰能力.接着,为了进一步感知精细化的目标边缘,设计了一个局部-非局部语义增强模块,将局部语义的归纳偏置引入补充学习非局部语义特征,在提升模型抗干扰力的同时突出更精细化的目标区域.最后,增强后的特征输入变换器的解码器,预测得到高质量的分割结果.与最先进的方法相比,本文所提算法在四个标准数据集上都获得了领先的性能,充分表明了本文所提方法的有效性.
作者:苏天康 宋慧慧 樊佳庆 张开华 Author:SUTian-kang SONGHui-hui FANJia-qing ZHANGKai-hua
作者单位:南京信息工程大学江苏省大数据分析技术重点实验室,江苏南京210044;南京信息工程大学大气环境与装备技术协同创新中心,江苏南京210044南京航天航空大学计算机与科学技术学院,江苏南京211106
刊名:电子学报 ISTICEIPKU
Journal:ActaElectronicaSinica
年,卷(期):2023, 51(5)
分类号:TP391.41
关键词:无监督视频目标分割 混合变换器 混合注意力 多模态 深度估计 鲁棒特征
Keywords:unsupervisedvideoobjectsegmentationmixedtransformer mixedattention multimodality depthesti-mation robustfeatures
机标分类号:TP391.41G642.4TM85
在线出版日期:2023年7月27日
基金项目:深度信号引导学习混合变换器的高性能无监督视频目标分割[
期刊论文] 电子学报--2023, 51(5)苏天康 宋慧慧 樊佳庆 张开华现存的无监督视频目标分割方法通常使用光流作为运动线索来提升模型性能.然而,光流的估计常存在误差,这将导致双流网络易对噪声过拟合.为此,本文提出一种基于混合变换器的无监督视频目标分割算法,通过引入深度信号引导变...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
深度信号引导学习混合变换器的高性能无监督视频目标分割 Learning Depth Signal Guided Mixed Transformer for High-Performance Unsupervised Video Object Segmentation
深度信号引导学习混合变换器的高性能无监督视频目标分割.pdf
- 文件大小:
- 2.44 MB
- 下载次数:
- 60
-
高速下载
|
|