文档名:一种基于预训练模型的语音深度伪造算法识别方法
摘要:为提高语音深度伪造算法识别模型的准确性和对未知伪造算法识别的泛化性,文章提出一种基于预训练模型的识别方法.基于真伪语音数据集,微调训练HuBERT预训练模型,并基于模型输出的深层嵌入特征构建流形空间,通过度量不同伪造算法下语音数据流形空间的测地线距离进行伪造算法的判定.实验表明,所提方法可以较为有效地实现对已知和未知伪造算法的识别.
Abstract:Toimprovetheaccuracyoftherecognitionmodelofspeechdeepfakealgorithmsandthegeneralizationoftherecognitionofunknowndeepfakealgorithms,arecognitionmethodbasedonthepre-trainedmodelisproposed.Basedontherealandfakespeechdataset,theHuBERTpre-trainedmodelisfine-tunedandthemanifoldspaceisconstructedbasedonthedeepembeddedfeaturesoutputfromthemodel,andthedeterminationofdeepfakealgorithmsiscarriedoutbymeasuringthegeodesicdistancesbetweenthemanifoldspacesofdifferentdeepfakealgorithms.Experimentsshowthattheproposedmethodcanrealizetherecognitionofknownandunknowndeepfakealgorithmsmoreeffectively.
作者:田野 罗曦 许斌 葛珊 张向阳Author:TIANYe LUOXi XUBin GEShan ZHANGXiangyang
作者单位:中国电子科技集团公司第三研究所,北京100015
刊名:电声技术
Journal:AudioEngineering
年,卷(期):2024, 48(2)
分类号:TB54
关键词:深度伪造算法识别 预训练模型 流形测度
Keywords:deepfakealgorithmrecognition pre-trainedmodels manifoldmeasurement
机标分类号:TP391.41TN911.73TP181
在线出版日期:2024年4月12日
基金项目:一种基于预训练模型的语音深度伪造算法识别方法[
期刊论文] 电声技术--2024, 48(2)田野 罗曦 许斌 葛珊 张向阳为提高语音深度伪造算法识别模型的准确性和对未知伪造算法识别的泛化性,文章提出一种基于预训练模型的识别方法.基于真伪语音数据集,微调训练HuBERT预训练模型,并基于模型输出的深层嵌入特征构建流形空间,通过度量不同...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
一种基于预训练模型的语音深度伪造算法识别方法 A Pre-trained Model Based Recognition Method for Speech Deepfake Algorithms
一种基于预训练模型的语音深度伪造算法识别方法.pdf
- 文件大小:
- 602.52 KB
- 下载次数:
- 60
-
高速下载
|