| 
 
| 文档摘要:本文设计一种用于三维(3D)人体姿态(pose)估计的改进Transformer的多级特征编码网络.采用空间池化(pooling)算子结构来替换注意力(Attention)模块,缩减了模型参数量和运行复杂度,串联该结构得到初始特征表示,然后使用交叉注意力(CA)机制进行特征信息交互学习,并应用跨步卷积降低时间维度并合并相近的Pose到Pose序列的单个表示.在Human3.6M数据集上进行验证实验.结果表明:该方法针对3D人体Pose估计,混合使用Pooling结构和Attention机制能达到有效的估计效果,与原始Trans-former的方法进行对比,模型参数量降低了30%,位置精度提升了8.6%. 
 Abstract:AnimprovedTransformermulti-levelfeatureencodingnetworkfor3Dhumanposeestimationisdesigned.ThespatialpoolingoperatorstructureisusedtoreplacetheAttentionmodule,whichreducestheamountofmodelparametersandoperationcomplexity.Thestructureisconnectedinseriestoobtaintheinitialfeaturerepresentation.Then,thecross-attention(CA)mechanismisusedforinteractivelearningoffeatureinformation,andstridedconvolutionisusedtoreducethetimedimension,andsimilarPosesarecombinedintoasinglerepresentationofPosesequences.ResultsofverificationexperimentonHuman3.6Mdatasetsshowthatthismethodcanachieveeffectiveestimationeffectfor3DhumanPoseestimationbyusingPoolingstructureandattentionmechanism.ComparedwiththeoriginalTransformermethod,theamountofmodelparametersisreducedby30%andthepositionalprecisionisimprovedby8.6%.
 
 作者:陈从平  郁春明  闫焕章  江高勇  张屹  戴国洪Author:CHENCongping  YUChunming  YANHuanzhang  JIANGGaoyong  ZHANGYi  DAIGuohong
 作者单位:常州大学机械与轨道交通学院,江苏常州213164
 刊名:传感器与微系统 ISTICPKU
 Journal:TransducerandMicrosystemTechnologies
 年,卷(期):2024, 43(6)
 分类号:TP391.41
 关键词:姿态估计  Transformer模型  空间池化算子  交叉注意力机制  跨步卷积
 Keywords:poseestimation  Transformermodel  spatialpoolingoperator  cross-attentionmechanism  stridedconvolution
 机标分类号:TP391.41TH89TP181
 在线出版日期:2024年7月12日
 基金项目:国家自然科学基金,国家重点研发计划基于改进Transformer的三维人体姿态估计[
 期刊论文]  传感器与微系统--2024, 43(6)陈从平  郁春明  闫焕章  江高勇  张屹  戴国洪本文设计一种用于三维(3D)人体姿态(pose)估计的改进Transformer的多级特征编码网络.采用空间池化(pooling)算子结构来替换注意力(Attention)模块,缩减了模型参数量和运行复杂度,串联该结构得到初始特征表示,然后使用交...参考文献和引证文献
 参考文献
 引证文献
 本文读者也读过
 相似文献
 相关博文
 
 关键词:姿态估计,Transformer模型,空间池化算子,交叉注意力机制,跨步卷积,
 
 
 
文件大小:791.07 KB 
下载次数:60 
 
		
高速下载
 | 
 |