文档名:基于小波散射变换和MFCC的双特征语音情感识别融合算法
摘要:为了充分挖掘语音信号频谱包含的情感信息以提高语音情感识别的准确性,提出了一种基于小波散射变换和梅尔频率倒谱系数(Mel-frequencycepstralcoefficient,MFCC)的排列熵加权和偏差调整规则的语音情感识别融合算法(PEW-BAR).算法首先获取语音信号的小波散射特征和梅尔频率倒谱系数的相关特征;然后按尺度维度扩展小波散射特征,利用支持向量机得到情感识别的后验概率并获得排列熵,并使用排列熵对后验概率进行加权;最后采用一种偏差调整规则进一步融合MFCC的相关特征的识别结果.实验结果表明,在EMODB、RAVDESS和eNTERFACE05数据集上,与传统的基于小波散射系数的语音情感识别方法相比,该算法将ACC分别提高了2.82%、2.85%和5.92%,将UAR分别提升了3.40%、2.87%和5.80%,IEMOCAP上提高了6.89%.
Abstract:Afusionalgorithmnamedpermutationentropyweightedandbiasadjustmentrulefusion(PEW-BAR)wasproposedtoenhancetheaccuracyofspeechemotionrecognitionbyexploitingtheemotionalinformationinthespec-tralcharacteristicsofspeechsignals.ThealgorithmwasbasedontheintegrationofwaveletscatteringtransformandMel-frequencycepstralcoefficients(MFCC).Firstly,waveletscatteringfeaturesandMFCC-relatedfeaturesfromspeechsignalswereextracted.Then,thewaveletscatteringfeatureswereexpandedinthescaledimensionandappliedsupportvectormachinestoobtainposteriorprobabilitiesforemotionrecognition.Andpermutationentropywascalcu-latedandaweightedfusionbasedonthisentropywassubsequentlyapplied.Finally,abiasadjustmentrulewasuti-lizedtorefinetheintegrationresultsobtainedfromtheMFCC-relatedfeatures.Experimentalresultsonvariousdatas-ets,includingEMODB,RAVDESS,andeNTERFACE05,demonstratenotableimprovements.Theproposedalgo-rithmoutperformstraditionalwaveletscatteringcoefficient-basedmethods,achievingaccuracyimprovementsof2.82%,2.85%,and5.92%,respectively.Additionally,itshowsenhancementsof3.40%,2.87%,and5.80%intermsofunweightedaveragerecall(UAR),anda6.89%improvementontheIEMOCAPdataset.
作者:应娜 吴顺朋 杨萌 邹雨鉴Author:YINGNa WUShunpeng YANGMeng ZOUYujian
作者单位:杭州电子科技大学通信工程学院,浙江杭州310018
刊名:电信科学 ISTICPKU
Journal:TelecommunicationsScience
年,卷(期):2024, 40(5)
分类号:TP18
关键词:语音情感识别 小波散射变换 排列熵 MFCC 模型融合
Keywords:speechemotionrecognition waveletscatteringtransform permutationentropy MFCC modelfusion
机标分类号:TN912.34TP391TP18
在线出版日期:2024年7月1日
基金项目:基于小波散射变换和MFCC的双特征语音情感识别融合算法[
期刊论文] 电信科学--2024, 40(5)应娜 吴顺朋 杨萌 邹雨鉴为了充分挖掘语音信号频谱包含的情感信息以提高语音情感识别的准确性,提出了一种基于小波散射变换和梅尔频率倒谱系数(Mel-frequencycepstralcoefficient,MFCC)的排列熵加权和偏差调整规则的语音情感识别融合算法(PE...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
基于小波散射变换和MFCC的双特征语音情感识别融合算法 Dual-feature speech emotion recognition fusion algorithm based on wavelet scattering transform and MFCC
基于小波散射变换和MFCC的双特征语音情感识别融合算法.pdf
- 文件大小:
- 2.82 MB
- 下载次数:
- 60
-
高速下载
|