返回列表 发布新帖

深度嵌套注意力下的SlowFast信息融合动作识别网络

17 0
admin 发表于 2024-12-14 03:09 | 查看全部 阅读模式

文档名:深度嵌套注意力下的SlowFast信息融合动作识别网络
摘要:视频动作识别在视频监控、自动驾驶等多个领域都有着广泛的应用.SlowFast网络是视频动作识别领域经常使用的网络.目前SlowFast相关网络中使用注意力进行相关信息增强,注意力机制与网络的结合方式是将注意力机制嵌套到网络的各个卷积块之间,如果将注意力机制深层嵌套到卷积块的具体卷积层中,SlowFast网络的信息提取能力将更进一步.首先提出了一种深度嵌套注意力机制,该深度嵌套机制内部包含一种可以提取时空与通道信息的注意力SCTM,使SlowFast网络的3种信息提取能力得到了进一步加强.此外,目前多流网络融合的信息并没有充分的交互与处理.提出了一种基于交叉注意力与ConvLSTM的多流时空信息融合网络,使多流网络中每个流的信息充分交互.改进后的SlowFast网络在UCF101数据集上的Top-1准确率已达到98.5%,在HMDB51数据集中的准确率达到了80.1%.均优于目前已有的模型,比原始SlowFast网络提高了2.64%,且鉴于上述数据,深度嵌套注意力的SlowFast时空信息融合网络在信息提取与融合方面具有优越性能.

Abstract:Videoactionrecognitionhasbeenwidelyusedinmanyfieldssuchasvideosurveillanceandautomaticdriving.SlowFastnetworkisoftenusedinthefieldofvideoactionrecognition.Atpresent,attentionisusedtoenhancerelevantinformationinSlowFastcorrelationnetwork.Thecombinationofattentionmechanismandnetworkistoembedtheattentionmechanismamongvariousconvolutionalblocksofthenetwork.Iftheattentionmechanismisdeeplyembeddedintothespecificconvolutionallayeroftheconvolutionalblock,theinformationextractioncapabilityoftheSlowFastnetworkwillbefurtherenhanced.Firstly,adeepnestedattentionmechanismisproposed,whichcontainsanattentionSCTMthatcanextractspace-timeandchannelinformation,andfurtherstrengthensthethreeinformationextractioncapabilitiesofSlowFastnetwork.Inaddition,thecurrentmulti-streamnetworkfusioninformationisnotfullyinteractiveandprocessed.Amulti-streamspatio-temporalinformationfusionnetworkbasedoncross-attentionandConvLSTMisproposedtomaketheinformationofeachstreaminthemulti-streamnetworkfullyinteract.TheimprovedSlowFastnetworkhasachieved98.5%Top-1accuracyonUCF101and80.1%accuracyonHMDB51.ComparedwiththeoriginalSlowFastnetwork,theSlowFastspatiotemporalinformationfusionnetworkwithdeeplynestedattentionhassuperiorperformanceininformationextractionandfusion.

作者:张起尧  桑海峰Author:ZhangQiyao  SangHaifeng
作者单位:沈阳工业大学信息科学与工程学院沈阳110870
刊名:电子测量与仪器学报 ISTICPKU
Journal:JournalofElectronicMeasurementandInstrumentation
年,卷(期):2024, 38(3)
分类号:TP391TN98
关键词:视频动作识别  SlowFast  注意力深层嵌套  信息融合网络  时空通道注意力  
Keywords:videoactionrecognition  SlowFast  deepnestingofattention  informationfusionnetwork  spatialchanneltemporalattention  
机标分类号:TP391TN957.51+3F224.9
在线出版日期:2024年7月8日
基金项目:国家自然科学基金,辽宁省自然科学基金深度嵌套注意力下的SlowFast信息融合动作识别网络[
期刊论文]  电子测量与仪器学报--2024, 38(3)张起尧  桑海峰视频动作识别在视频监控、自动驾驶等多个领域都有着广泛的应用.SlowFast网络是视频动作识别领域经常使用的网络.目前SlowFast相关网络中使用注意力进行相关信息增强,注意力机制与网络的结合方式是将注意力机制嵌套到网络...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文

        深度嵌套注意力下的SlowFast信息融合动作识别网络  SlowFast information fusion action recognition network based on deeply nested attention mechanism

深度嵌套注意力下的SlowFast信息融合动作识别网络.pdf
2024-12-14 03:09 上传
文件大小:
3.6 MB
下载次数:
60
高速下载
【温馨提示】 您好!以下是下载说明,请您仔细阅读:
1、推荐使用360安全浏览器访问本站,选择您所需的PDF文档,点击页面下方“本地下载”按钮。
2、耐心等待两秒钟,系统将自动开始下载,本站文件均为高速下载。
3、下载完成后,请查看您浏览器的下载文件夹,找到对应的PDF文件。
4、使用PDF阅读器打开文档,开始阅读学习。
5、使用过程中遇到问题,请联系QQ客服。

本站提供的所有PDF文档、软件、资料等均为网友上传或网络收集,仅供学习和研究使用,不得用于任何商业用途。
本站尊重知识产权,若本站内容侵犯了您的权益,请及时通知我们,我们将尽快予以删除。
  • 手机访问
    微信扫一扫
  • 联系QQ客服
    QQ扫一扫
2022-2025 新资汇 - 参考资料免费下载网站 最近更新浙ICP备2024084428号-1
关灯 返回顶部
快速回复 返回顶部 返回列表