admin 发表于 2024-12-14 11:39

基于小波散射变换和MFCC的双特征语音情感识别融合算法


文档名:基于小波散射变换和MFCC的双特征语音情感识别融合算法
摘要:为了充分挖掘语音信号频谱包含的情感信息以提高语音情感识别的准确性,提出了一种基于小波散射变换和梅尔频率倒谱系数(Mel-frequencycepstralcoefficient,MFCC)的排列熵加权和偏差调整规则的语音情感识别融合算法(PEW-BAR).算法首先获取语音信号的小波散射特征和梅尔频率倒谱系数的相关特征;然后按尺度维度扩展小波散射特征,利用支持向量机得到情感识别的后验概率并获得排列熵,并使用排列熵对后验概率进行加权;最后采用一种偏差调整规则进一步融合MFCC的相关特征的识别结果.实验结果表明,在EMODB、RAVDESS和eNTERFACE05数据集上,与传统的基于小波散射系数的语音情感识别方法相比,该算法将ACC分别提高了2.82%、2.85%和5.92%,将UAR分别提升了3.40%、2.87%和5.80%,IEMOCAP上提高了6.89%.

Abstract:Afusionalgorithmnamedpermutationentropyweightedandbiasadjustmentrulefusion(PEW-BAR)wasproposedtoenhancetheaccuracyofspeechemotionrecognitionbyexploitingtheemotionalinformationinthespec-tralcharacteristicsofspeechsignals.ThealgorithmwasbasedontheintegrationofwaveletscatteringtransformandMel-frequencycepstralcoefficients(MFCC).Firstly,waveletscatteringfeaturesandMFCC-relatedfeaturesfromspeechsignalswereextracted.Then,thewaveletscatteringfeatureswereexpandedinthescaledimensionandappliedsupportvectormachinestoobtainposteriorprobabilitiesforemotionrecognition.Andpermutationentropywascalcu-latedandaweightedfusionbasedonthisentropywassubsequentlyapplied.Finally,abiasadjustmentrulewasuti-lizedtorefinetheintegrationresultsobtainedfromtheMFCC-relatedfeatures.Experimentalresultsonvariousdatas-ets,includingEMODB,RAVDESS,andeNTERFACE05,demonstratenotableimprovements.Theproposedalgo-rithmoutperformstraditionalwaveletscatteringcoefficient-basedmethods,achievingaccuracyimprovementsof2.82%,2.85%,and5.92%,respectively.Additionally,itshowsenhancementsof3.40%,2.87%,and5.80%intermsofunweightedaveragerecall(UAR),anda6.89%improvementontheIEMOCAPdataset.

作者:应娜吴顺朋杨萌邹雨鉴Author:YINGNaWUShunpengYANGMengZOUYujian
作者单位:杭州电子科技大学通信工程学院,浙江杭州310018
刊名:电信科学 ISTICPKU
Journal:TelecommunicationsScience
年,卷(期):2024, 40(5)
分类号:TP18
关键词:语音情感识别小波散射变换排列熵MFCC模型融合
Keywords:speechemotionrecognitionwaveletscatteringtransformpermutationentropyMFCCmodelfusion
机标分类号:TN912.34TP391TP18
在线出版日期:2024年7月1日
基金项目:基于小波散射变换和MFCC的双特征语音情感识别融合算法[
期刊论文]电信科学--2024, 40(5)应娜吴顺朋杨萌邹雨鉴为了充分挖掘语音信号频谱包含的情感信息以提高语音情感识别的准确性,提出了一种基于小波散射变换和梅尔频率倒谱系数(Mel-frequencycepstralcoefficient,MFCC)的排列熵加权和偏差调整规则的语音情感识别融合算法(PE...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文

        基于小波散射变换和MFCC的双特征语音情感识别融合算法Dual-feature speech emotion recognition fusion algorithm based on wavelet scattering transform and MFCC

基于小波散射变换和MFCC的双特征语音情感识别融合算法.pdf
页: [1]
查看完整版本: 基于小波散射变换和MFCC的双特征语音情感识别融合算法